使用Python的Supervisor進(jìn)行進(jìn)程監(jiān)控以及自動(dòng)啟動(dòng)
做服務(wù)器端開(kāi)發(fā)的同學(xué)應(yīng)該都對(duì)進(jìn)程監(jiān)控不會(huì)陌生,最近恰好要更換 uwsgi 為 gunicorn,而gunicorn又恰好有這么一章講進(jìn)程監(jiān)控,所以多研究了下。
結(jié)合之前在騰訊工作的經(jīng)驗(yàn),也會(huì)講講騰訊的服務(wù)器監(jiān)控是怎么做的。同時(shí)也會(huì)講下小團(tuán)隊(duì)又該怎么敏捷的解決。
下面按照監(jiān)控的方法依次介紹。
一、按照進(jìn)程名監(jiān)控
在騰訊內(nèi)部所有server都是要打包發(fā)布的,而在打包過(guò)程中是需要填寫(xiě)要監(jiān)控的進(jìn)程名,然后在crontab中定時(shí)通過(guò)ps查詢進(jìn)程是否存在。
這種方法是比較簡(jiǎn)單的方法,但是考慮到很多進(jìn)程會(huì)在啟動(dòng)之后改名,以及進(jìn)程名存在各種特殊字符,多個(gè)進(jìn)程同時(shí)存在的問(wèn)題,實(shí)際操作起來(lái)并不是很舒服。
舉個(gè)簡(jiǎn)單的例子,gunicorn啟動(dòng)之后的進(jìn)程名類似這樣 master: [wsgi:app],其中的方括號(hào)在grep時(shí)要記得轉(zhuǎn)義,否則就會(huì)出問(wèn)題。
不過(guò)不管怎么說(shuō),這種方法在很多其他方式用不了的時(shí)候反而是最簡(jiǎn)單的方法。
下面是用python的實(shí)現(xiàn):
def monitor_process(key_word, cmd):
p1 = subprocess.Popen(['ps', '-ef'], stdout=subprocess.PIPE)
p2 = subprocess.Popen(['grep', key_word], stdin=p1.stdout, stdout=subprocess.PIPE)
p3 = subprocess.Popen(['grep', '-v', 'grep'], stdin=p2.stdout, stdout=subprocess.PIPE)
lines = p3.stdout.readlines()
if len(lines) > 0:
return
sys.stderr.write('process[%s] is lost, run [%s]\n' % (key_word, cmd))
subprocess.call(cmd, shell=True)
二、按照端口監(jiān)控
這種方式之前在騰訊打包的時(shí)候也有用,但是可能是進(jìn)程名更直觀的原因吧,貌似一直沒(méi)怎么用起來(lái)。
不過(guò)現(xiàn)在自己在做包部署的時(shí)候,反而覺(jué)得端口監(jiān)控是個(gè)最靠譜的事情了。這個(gè)也沒(méi)什么好多說(shuō)的,直接上剛寫(xiě)完的python代碼:
def monitor_port(protocol, port, cmd):
address = ('127.0.0.1', port)
socket_type = socket.SOCK_STREAM if protocol == 'tcp' else socket.SOCK_DGRAM
client = socket.socket(socket.AF_INET, socket_type)
try:
client.bind(address)
except Exception, e:
pass
else:
sys.stderr.write('port[%s-%s] is lost, run [%s]\n' % (protocol, port, cmd))
subprocess.call(cmd, shell=True)
finally:
client.close()
有的朋友可能說(shuō)對(duì)于tcp端口檢查,其實(shí)以client的方式來(lái)connect()看是否成功會(huì)不會(huì)更好?其實(shí)我覺(jué)得這種方式也挺好的,并且對(duì)于不同的協(xié)議可以再深入處理一下,比如對(duì)http協(xié)議可以用urllib2.urlopen確保返回正確的包才算正常。不過(guò)如果這么做的話,就有點(diǎn)偏黑盒監(jiān)控 了,比如監(jiān)控寶、阿里云監(jiān)控之類的服務(wù)了。
三、通過(guò)監(jiān)控server啟動(dòng)進(jìn)程,并以監(jiān)控子進(jìn)程的方式監(jiān)控
這個(gè)也是在gunicorn頁(yè)面上看到的,說(shuō)起來(lái)gunicorn很不厚道的把gaffer放到第一個(gè),讓我還以為是個(gè)很成熟的產(chǎn)品,結(jié)果發(fā)現(xiàn)連啟動(dòng)都是個(gè)問(wèn)題。
相反排在后面的supervisor反而相當(dāng)?shù)暮糜?,下面是截圖:
supervisor可以很方便的管理進(jìn)程,包括重啟,停止等等,而且提供了web界面和用戶驗(yàn)證,可以很方便的在線管理。
但是有好處就有壞處,用了supervisor之后,就不能自己隨便的去自己重啟服務(wù)了,否則會(huì)影響supervisor的監(jiān)控,這對(duì)我這種喜歡自己執(zhí)行 xx.sh restart 的人實(shí)在有點(diǎn)太痛苦了。當(dāng)然,其實(shí)要是習(xí)慣了去supervisorctl 里面start/stop/reload 之后也就還好了。
用supervisor配置gunicorn的配置項(xiàng)如下:
[program:yuanzhaopin]
environment=PYTHON_EGG_CACHE=/tmp/.python-eggs/,PYTHONPATH=/data/release/yuanzhaopin
command=/usr/local/bin/gunicorn --debug --log-level debug --log-file /tmp/g.log wsgi:app
user=zny2008
autorestart=true
redirect_stderr=true
ok,目前自己常用的就是這幾種模式了,大家如果有其他選擇歡迎留言討論。
完整代碼如下:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
#*/1 * * * * python /xxx/monitor.py >> /xxx/logs/monitor.log 2>&1 &
import sys
import subprocess
import os.path as op
import socket
def this_abs_path(script_name):
return op.abspath(op.join(op.dirname(__file__), script_name))
def monitor_process(key_word, cmd):
p1 = subprocess.Popen(['ps', '-ef'], stdout=subprocess.PIPE)
p2 = subprocess.Popen(['grep', key_word], stdin=p1.stdout, stdout=subprocess.PIPE)
p3 = subprocess.Popen(['grep', '-v', 'grep'], stdin=p2.stdout, stdout=subprocess.PIPE)
lines = p3.stdout.readlines()
if len(lines) > 0:
return
sys.stderr.write('process[%s] is lost, run [%s]\n' % (key_word, cmd))
subprocess.call(cmd, shell=True)
def monitor_port(protocol, port, cmd):
address = ('127.0.0.1', port)
socket_type = socket.SOCK_STREAM if protocol == 'tcp' else socket.SOCK_DGRAM
client = socket.socket(socket.AF_INET, socket_type)
try:
client.bind(address)
except Exception, e:
pass
else:
sys.stderr.write('port[%s-%s] is lost, run [%s]\n' % (protocol, port, cmd))
subprocess.call(cmd, shell=True)
finally:
client.close()
#=============================================================================
def yuanzhaopin():
cmd = '%s start' % this_abs_path('gun.sh')
#monitor_process('\[yuanzhaopin\]', cmd)
monitor_port('tcp', 8635, cmd)
def main():
yuanzhaopin()
if __name__ == '__main__':
main()
- python測(cè)試開(kāi)發(fā)django之使用supervisord?后臺(tái)啟動(dòng)celery?服務(wù)(worker/beat)
- 在python3中使用Supervisor的詳細(xì)教程
- 使用 Supervisor 監(jiān)控 Python3 進(jìn)程方式
- Python supervisor強(qiáng)大的進(jìn)程管理工具的使用
- python進(jìn)程管理工具supervisor的安裝與使用教程
- 基于Python 的進(jìn)程管理工具supervisor使用指南
- Python使用Supervisor來(lái)管理進(jìn)程的方法
- python進(jìn)程管理工具supervisor使用實(shí)例
- python進(jìn)程管理工具supervisor安裝使用
相關(guān)文章
Python實(shí)戰(zhàn)基礎(chǔ)之繪制餅狀圖分析商品庫(kù)存
餅狀圖(pie chart)一般用于描述分類型數(shù)據(jù)的相對(duì)頻數(shù)或百分?jǐn)?shù)頻數(shù)分布,呈現(xiàn)部分與總體的關(guān)系,下面這篇文章主要給大家介紹了關(guān)于Python實(shí)戰(zhàn)基礎(chǔ)之繪制餅狀圖分析商品庫(kù)存的相關(guān)資料,需要的朋友可以參考下2022-07-07解決pyshp UnicodeDecodeError的問(wèn)題
今天小編就為大家分享一篇解決pyshp UnicodeDecodeError的問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-12-12Python實(shí)現(xiàn)解析命令行參數(shù)的常見(jiàn)方法總結(jié)
除ide的執(zhí)行方式外,命令行的方式執(zhí)行Python腳本是參數(shù)化程序執(zhí)行的一種常見(jiàn)且簡(jiǎn)單的方法。本文總結(jié)了三個(gè)常見(jiàn)的獲取和解析命令行參數(shù)的方法,需要的可以參考一下2022-10-10使用Python的Dataframe取兩列時(shí)間值相差一年的所有行方法
今天小編就為大家分享一篇使用Python的Dataframe取兩列時(shí)間值相差一年的所有行方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-07-07Python一行代碼識(shí)別發(fā)票并保存Excel示例詳解
這篇文章主要為大家介紹了Python一行代碼識(shí)別發(fā)票并保存Excel示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-03-03python中使用百度音樂(lè)搜索的api下載指定歌曲的lrc歌詞
這篇文章主要介紹了python中使用百度音樂(lè)搜索的api下載指定歌曲的lrc歌詞,同時(shí)也分析出了歌曲的下載地址,需要的朋友可以參考下2014-07-07使用python 打開(kāi)文件并做匹配處理的實(shí)例
今天小編就為大家分享一篇使用python 打開(kāi)文件并做匹配處理的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-01-01