欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

詳解python分布式進程

 更新時間:2018年10月08日 11:25:46   投稿:laozhang  
在本專題里,小編給大家講述了關于python分布式進程的相關知識點內容,需要的朋友們參考下。

在Thread和Process中,應當優(yōu)選Process,因為Process更穩(wěn)定,而且,Process可以分布到多臺機器上,而Thread最多只能分布到同一臺機器的多個CPU上。

Python的multiprocessing模塊不但支持多進程,其中managers子模塊還支持把多進程分布到多臺機器上。一個服務進程可以作為調度者,將任務分布到其他多個進程中,依靠網絡通信。由于managers模塊封裝很好,不必了解網絡通信的細節(jié),就可以很容易地編寫分布式多進程程序。

舉個例子:如果我們已經有一個通過Queue通信的多進程程序在同一臺機器上運行,現在,由于處理任務的進程任務繁重,希望把發(fā)送任務的進程和處理任務的進程分布到兩臺機器上。怎么用分布式進程實現?

原有的Queue可以繼續(xù)使用,但是,通過managers模塊把Queue通過網絡暴露出去,就可以讓其他機器的進程訪問Queue了。

我們先看服務進程,服務進程負責啟動Queue,把Queue注冊到網絡上,然后往Queue里面寫入任務:

# task_master.py
 
import random, time, queue
from multiprocessing.managers import BaseManager
# 發(fā)送任務的隊列:
task_queue = queue.Queue()
# 接收結果的隊列:
result_queue = queue.Queue()
# 從BaseManager繼承的QueueManager:
class QueueManager(BaseManager):
  pass
# 把兩個Queue都注冊到網絡上, callable參數關聯了Queue對象:
QueueManager.register('get_task_queue', callable=lambda: task_queue)
QueueManager.register('get_result_queue', callable=lambda: result_queue)
# 綁定端口5000, 設置驗證碼'abc':
manager = QueueManager(address=('', 5000), authkey=b'abc')
# 啟動Queue:
manager.start()
# 獲得通過網絡訪問的Queue對象:
task = manager.get_task_queue()
result = manager.get_result_queue()
# 放幾個任務進去:
for i in range(10):
  n = random.randint(0, 10000)
  print('Put task %d...' % n)
  task.put(n)
# 從result隊列讀取結果:
print('Try get results...')
for i in range(10):
  r = result.get(timeout=10)
  print('Result: %s' % r)
# 關閉:
manager.shutdown()

請注意,當我們在一臺機器上寫多進程程序時,創(chuàng)建的Queue可以直接拿來用,但是,在分布式多進程環(huán)境下,添加任務到Queue不可以直接對原始的task_queue進行操作,那樣就繞過了QueueManager的封裝,必須通過manager.get_task_queue()獲得的Queue接口添加。

然后,在另一臺機器上啟動任務進程(本機上啟動也可以):

# task_master.py
import random, time, queue
from multiprocessing.managers import BaseManager
# 發(fā)送任務的隊列:
task_queue = queue.Queue()
# 接收結果的隊列:
result_queue = queue.Queue()
# 從BaseManager繼承的QueueManager:
class QueueManager(BaseManager):
  pass
# 把兩個Queue都注冊到網絡上, callable參數關聯了Queue對象:
QueueManager.register('get_task_queue', callable=lambda: task_queue)
QueueManager.register('get_result_queue', callable=lambda: result_queue)
# 綁定端口5000, 設置驗證碼'abc':
manager = QueueManager(address=('', 5000), authkey=b'abc')
# 啟動Queue:
manager.start()
# 獲得通過網絡訪問的Queue對象:
task = manager.get_task_queue()
result = manager.get_result_queue()
# 放幾個任務進去:
for i in range(10):
  n = random.randint(0, 10000)
  print('Put task %d...' % n)
  task.put(n)
# 從result隊列讀取結果:
print('Try get results...')
for i in range(10):
  r = result.get(timeout=10)
  print('Result: %s' % r)
# 關閉:
manager.shutdown()

任務進程要通過網絡連接到服務進程,所以要指定服務進程的IP。

現在,可以試試分布式進程的工作效果了。先啟動task_master.py服務進程:

$ python3 task_master.py 
Put task 3411...
Put task 1605...
Put task 1398...
Put task 4729...
Put task 5300...
Put task 7471...
Put task 68...
Put task 4219...
Put task 339...
Put task 7866...
Try get results...

task_master.py進程發(fā)送完任務后,開始等待result隊列的結果?,F在啟動task_worker.py進程:

$ python3 task_worker.pyConnect to server 127.0.0.1...
run task 3411 * 3411...
run task 1605 * 1605...
run task 1398 * 1398...
run task 4729 * 4729...
run task 5300 * 5300...
run task 7471 * 7471...
run task 68 * 68...
run task 4219 * 4219...
run task 339 * 339...
run task 7866 * 7866...
worker exit.

task_worker.py進程結束,在task_master.py進程中會繼續(xù)打印出結果:

Result: 3411 * 3411 = 11634921
Result: 1605 * 1605 = 2576025
Result: 1398 * 1398 = 1954404
Result: 4729 * 4729 = 22363441
Result: 5300 * 5300 = 28090000
Result: 7471 * 7471 = 55815841
Result: 68 * 68 = 4624
Result: 4219 * 4219 = 17799961
Result: 339 * 339 = 114921
Result: 7866 * 7866 = 61873956

這個簡單的Master/Worker模型有什么用?其實這就是一個簡單但真正的分布式計算,把代碼稍加改造,啟動多個worker,就可以把任務分布到幾臺甚至幾十臺機器上,比如把計算n*n的代碼換成發(fā)送郵件,就實現了郵件隊列的異步發(fā)送。

而Queue之所以能通過網絡訪問,就是通過QueueManager實現的。由于QueueManager管理的不止一個Queue,所以,要給每個Queue的網絡調用接口起個名字,比如get_task_queue。

authkey有什么用?這是為了保證兩臺機器正常通信,不被其他機器惡意干擾。如果task_worker.py的authkey和task_master.py的authkey不一致,肯定連接不上。

Python的分布式進程接口簡單,封裝良好,適合需要把繁重任務分布到多臺機器的環(huán)境下。

注意Queue的作用是用來傳遞任務和接收結果,每個任務的描述數據量要盡量小。比如發(fā)送一個處理日志文件的任務,就不要發(fā)送幾百兆的日志文件本身,而是發(fā)送日志文件存放的完整路徑,由Worker進程再去共享的磁盤上讀取文件。

以上就是本篇文章所講述的所有內容,這篇文章主要介紹了python分布式進程的相關知識,希望你能借助資料從而理解上述所說的內容。希望我在這片文章所講述的內容能夠對你有所幫助,讓你學習python更加輕松。

相關文章

  • python多線程超詳細詳解

    python多線程超詳細詳解

    這篇文章主要介紹了python多線程超詳細詳解,多線程這個知識點非常重要,想了解的同學可以參考下
    2021-04-04
  • python使用tornado實現簡單爬蟲

    python使用tornado實現簡單爬蟲

    這篇文章主要為大家詳細介紹了python使用tornado實現簡單爬蟲,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2018-07-07
  • python計算無向圖節(jié)點度的實例代碼

    python計算無向圖節(jié)點度的實例代碼

    今天小編就為大家分享一篇python計算無向圖節(jié)點度的實例代碼,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-11-11
  • python中進程間通信及設置狀態(tài)量控制另一個進程

    python中進程間通信及設置狀態(tài)量控制另一個進程

    這篇文章主要介紹了python中進程間通信及設置狀態(tài)量控制另一個進程,文章圍繞主題展開詳細的內容介紹,具有一定的參考價值,需要的小伙伴可以參考一下
    2022-05-05
  • linux下python使用sendmail發(fā)送郵件

    linux下python使用sendmail發(fā)送郵件

    這篇文章主要為大家詳細介紹了linux下python使用sendmail發(fā)送郵件,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2018-05-05
  • 使用python實現個性化詞云的方法

    使用python實現個性化詞云的方法

    最近看到可視化的詞云,看到網上也很多這樣的工具,但是都不怎么完美,有些不支持中文,有的中文詞頻統計得莫名其妙、有的不支持自定義形狀、所有的都不能自定義顏色,于是網上找了一下,決定用python繪制詞云
    2017-06-06
  • 使用Python內置的模塊與函數進行不同進制的數的轉換

    使用Python內置的模塊與函數進行不同進制的數的轉換

    這篇文章主要介紹了使用Python內置的模塊與函數進行不同進制的數的轉換的方法,Python也使得讀取純二進制文件內容非常方便,需要的朋友可以參考下
    2016-03-03
  • 淺談Django前端后端值傳遞問題

    淺談Django前端后端值傳遞問題

    這篇文章主要介紹了淺談Django前端后端值傳遞問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-07-07
  • python pandas 對時間序列文件處理的實例

    python pandas 對時間序列文件處理的實例

    今天小編就為大家分享一篇python pandas 對時間序列文件處理的實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-06-06
  • Python3 pandas 操作列表實例詳解

    Python3 pandas 操作列表實例詳解

    這篇文章主要介紹了Python3 pandas 操作列表實例詳解,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2019-09-09

最新評論