深入理解Python 多線程
Python里的多線程是假的多線程,不管有多少核,同一時間只能在一個核中進(jìn)行操作!利用Python的多線程,只是利用CPU上下文切換的優(yōu)勢,看上去像是并發(fā),其實(shí)只是個單線程,所以說他是假的單線程。
那么什么時候用多線程呢?
首先要知道:
- io操作不占用CPU
- 計算操作占CPU,像2+5=5
Python的多線程不適合CPU密集操作型的任務(wù),適合io密集操作型的任務(wù),例如:SocketServer
如果現(xiàn)在再有CPU密集操作型的任務(wù),那該怎么辦呢?
首先說,多進(jìn)程的進(jìn)程之間是獨(dú)立的,然后注意了,python的線程用的是系統(tǒng)的原生線程,python的進(jìn)程也是用系統(tǒng)的原生進(jìn)程,那原生進(jìn)程是由操作系統(tǒng)維護(hù)的,說白了python只是利用C原生代碼庫的接口咵嚓起了個進(jìn)程,真正的進(jìn)程管理還是由操作系統(tǒng)來完成的,那么操作系統(tǒng)本身有GIL全局解釋器鎖嗎?答案是沒有的,且兩個進(jìn)程之間的數(shù)據(jù)是完全獨(dú)立的,不能互相訪問,所以不需要鎖的概念,所以不存在GIL概念,所以在這種情況下,每個進(jìn)程至少會有一個線程,如果現(xiàn)在我的操作系統(tǒng)是八核的,我起八個進(jìn)程,然后每個進(jìn)程里面都有一個線程,那么就相當(dāng)于八線程了,八個線程跑在八核上,那么就相當(dāng)于利用多核了,那么問題就解決了!
唯一的壞處是八個線程之間的數(shù)據(jù)是不能共享的,獨(dú)立的!利用這種方法可以折中的解決多核運(yùn)算的問題!
先看一段簡單的多進(jìn)程的程序:
import multiprocessing import time def run(name): time.sleep(2) print('hello', name) if __name__ == '__main__': for i in range(10): p = multiprocessing.Process(target=run, args=('bob%s'%i,)) p.start()
程序的執(zhí)行結(jié)果為:
hello bob0
hello bob1
hello bob3
hello bob2
hello bob5
hello bob9
hello bob7
hello bob8
hello bob4
hello bob6
那么,如果我想取我的進(jìn)程號,那該怎么取呢?
from multiprocessing import Process import os def info(title): print(title) print('module name:', __name__) print('parent process:', os.getppid()) # 父進(jìn)程ID print('process id:', os.getpid()) # 自己進(jìn)程的ID print("\n\n") def f(name): info('\033[31;1mfunction f\033[0m') print('hello', name) if __name__ == '__main__': info('\033[32;1mmain process line\033[0m') p = Process(target=f, args=('bob',)) p.start() p.join()
程序執(zhí)行的結(jié)果為:
main process line
module name: __main__
parent process: 5252
process id: 6576function f
module name: __mp_main__
parent process: 6576
process id: 2232hello bob
其實(shí)這幅圖片的意思是,每一個子進(jìn)程都是由他父進(jìn)程啟動的。
進(jìn)程間通訊
我們說兩個進(jìn)程之間的內(nèi)存之間是相互獨(dú)立的,那么這兩個進(jìn)程能夠進(jìn)行通信嗎?說A進(jìn)程向訪問B進(jìn)程的數(shù)據(jù),能訪問嗎?肯定是不可以訪問的!但是,我就是想訪問,也就是兩個獨(dú)立的內(nèi)存想互相訪問,那該怎么辦呢?
有那么幾種方式,但是呢!萬變不離其宗,也即是說你必須找到一個中間件,有那么幾種中間件,那么先來看看是哪幾種
第一種Queues
使用方法跟threading里的queue差不多
from multiprocessing import Process, Queue def f(q): q.put([42, None, 'hello']) if __name__ == '__main__': q = Queue() p = Process(target=f, args=(q,)) p.start() print(q.get()) # prints "[42, None, 'hello']" p.join()
我們看這兩個進(jìn)程,父進(jìn)程的q是怎么傳給子進(jìn)程的?我們來討論一下
現(xiàn)在我們是不是認(rèn)為數(shù)據(jù)共享了,兩個進(jìn)程共享了一個q,其實(shí)不是的,其實(shí)是相當(dāng)于克隆了一個q,然后在父進(jìn)程里創(chuàng)建個子進(jìn)程,也就是父進(jìn)程把自己的q克隆了一份交給了子進(jìn)程,子進(jìn)程這個時候往這個q里面放了一份數(shù)據(jù),父進(jìn)程能夠獲取到 。那么這么說就不對了,那克隆了一個q,也就是兩個q了,B往q里放了一個數(shù)據(jù),那么與另一個q,也就是A的q也就沒關(guān)系了,噯,按說是這個樣子的,但是實(shí)際上呢,它是不是想實(shí)現(xiàn)個數(shù)據(jù)的共享啊,就相當(dāng)于把A這個q里的數(shù)據(jù)序列化了,序列化到了一個中間的位置,而中間位置有一個翻譯,他把這個數(shù)據(jù)反序列化給A,放在了A的q里,那么也就是實(shí)現(xiàn)了所謂的數(shù)據(jù)共享了。
程序執(zhí)行的結(jié)果為:
[42, None, 'hello']
第二種Pipes
Pipe()函數(shù)返回一個由管道連接的連接對象,默認(rèn)情況下是雙工(雙向)。 例如:
from multiprocessing import Process, Pipe def f(conn): conn.send("父親,安好?") # 兒子發(fā) print("son receive:",conn.recv()) conn.close() if __name__ == '__main__': parent_conn, child_conn = Pipe() p = Process(target=f, args=(child_conn,)) p.start() print("father receive:",parent_conn.recv()) # 父親收 parent_conn.send("兒子,安好?") p.join()
程序執(zhí)行后的結(jié)果為:
father receive: 父親,安好?
son receive: 兒子,安好?
Pipe()返回的兩個連接對象代表管道的兩端。 每個連接對象都有send()和recv()方法(以及其他方法)。 請注意,如果兩個進(jìn)程(或線程)同時嘗試讀取或?qū)懭牍艿赖耐欢耍瑒t管道中的數(shù)據(jù)可能會損壞。 當(dāng)然,同時使用管道的不同端部的過程不存在損壞的風(fēng)險。
第三種Managers
Manager()返回的管理器對象控制一個服務(wù)器進(jìn)程,該進(jìn)程保存Python對象并允許其他進(jìn)程使用代理操作它們。
Manager()返回的管理器將支持類型列表,dict,Namespace,Lock,RLock,Semaphore,BoundedSemaphore,Condition,Event,Barrier,Queue,Value和Array。 例如,
from multiprocessing import Process, Manager import os def f(d, l): d[1] = '1' d['2'] = 2 d[0.25] = None l.append(os.getpid()) print(l) if __name__ == '__main__': with Manager() as manager: d = manager.dict() # 用專門的語法生成一個可在多個進(jìn)程之間進(jìn)行傳遞和共享的一個字典 l = manager.list(range(5)) # # 用專門的語法生成一個可在多個進(jìn)程之間進(jìn)行傳遞和共享的一個列表,默認(rèn)里有5個數(shù)據(jù) p_list = [] for i in range(10): p = Process(target=f, args=(d, l)) p.start() p_list.append(p) for res in p_list: res.join() print(d) print(l)
程序執(zhí)行的結(jié)果為:
[0, 1, 2, 3, 4, 2100]
[0, 1, 2, 3, 4, 2100, 7632]
[0, 1, 2, 3, 4, 2100, 7632, 5788]
[0, 1, 2, 3, 4, 2100, 7632, 5788, 6340]
[0, 1, 2, 3, 4, 2100, 7632, 5788, 6340, 5760]
[0, 1, 2, 3, 4, 2100, 7632, 5788, 6340, 5760, 7072]
[0, 1, 2, 3, 4, 2100, 7632, 5788, 6340, 5760, 7072, 7540]
[0, 1, 2, 3, 4, 2100, 7632, 5788, 6340, 5760, 7072, 7540, 3904]
[0, 1, 2, 3, 4, 2100, 7632, 5788, 6340, 5760, 7072, 7540, 3904, 7888]
[0, 1, 2, 3, 4, 2100, 7632, 5788, 6340, 5760, 7072, 7540, 3904, 7888, 7612]
{1: '1', '2': 2, 0.25: None}
[0, 1, 2, 3, 4, 2100, 7632, 5788, 6340, 5760, 7072, 7540, 3904, 7888, 7612]
進(jìn)程鎖與進(jìn)程池
進(jìn)程鎖
進(jìn)程也有一個鎖,what?進(jìn)程不都獨(dú)立了嗎?不涉及同時修改同一個數(shù)據(jù),怎么還會有鎖呢?
閑了來看看它的表現(xiàn)形式,幾乎和線程是一模一樣的
from multiprocessing import Process, Lock def f(l, i): l.acquire() try: print('hello world', i) finally: l.release() if __name__ == '__main__': lock = Lock() for num in range(10): Process(target=f, args=(lock, num)).start()
程序執(zhí)行的結(jié)果為:
hello world 3
hello world 1
hello world 2
hello world 5
hello world 7
hello world 4
hello world 0
hello world 6
hello world 8
hello world 9
那這種鎖有什么作用呢?
作用其實(shí)就是防止打印在屏幕上的信息發(fā)生錯亂現(xiàn)象!
進(jìn)程池
在上面的程序中,啟動100個進(jìn)程會發(fā)現(xiàn)變慢了,因?yàn)槠鹨粋€進(jìn)程就相當(dāng)克隆了一份父進(jìn)程的內(nèi)存數(shù)據(jù),如果父進(jìn)程占一個G的內(nèi)存空間,那我起100個進(jìn)程,就相當(dāng)于101G了,在這種情況下,開銷是非常大的,就像起一個進(jìn)程咵嚓又克隆了一個屋子,一會就把哈爾濱占滿了,所以開銷特別大,為了避免咵嚓起那么多的進(jìn)程,把系統(tǒng)打趴下,所以這里有個進(jìn)程池的限制。
進(jìn)程池就是同一時間有多少進(jìn)程在CPU運(yùn)行。
進(jìn)程池中有兩個方法:
- apply(同步執(zhí)行,串行)
- apply_async(異步執(zhí)行、并行)
from multiprocessing import Process,Pool,freeze_support import time import os def Foo(i): time.sleep(2) print("in process",os.getpid()) return i+100 def Bar(arg): print('-->exec done:',arg) if __name__ == '__main__': freeze_support() pool = Pool(5) # 允許進(jìn)程池里同時放入5個進(jìn)程 for i in range(10): # pool.apply_async(func=Foo, args=(i,),callback=Bar) # callback 回調(diào) pool.apply(func=Foo, args=(i,)) # 串行 # pool.apply_async(func=Foo, args=(i,)) # 并行 print('end') pool.close() pool.join() # 進(jìn)程池中進(jìn)程執(zhí)行完畢后再關(guān)閉,如果注釋,那么程序直接關(guān)閉。
程序的執(zhí)行結(jié)果為:
in process 7824
in process 6540
in process 7724
in process 8924
in process 9108
in process 7824
in process 6540
知識點(diǎn)擴(kuò)充:
__name__ == '__main__'的作用是:
手動執(zhí)行關(guān)于這段代碼的程序,那么他下面的程序就會執(zhí)行,如果是調(diào)用這段代碼的程序時,那么它下面的程序就不會執(zhí)行
以上就是深入理解Python 多線程的詳細(xì)內(nèi)容,更多關(guān)于Python 多線程的資料請關(guān)注腳本之家其它相關(guān)文章!
- python GUI庫圖形界面開發(fā)之PyQt5時間控件QTimer詳細(xì)使用方法與實(shí)例
- python之當(dāng)你發(fā)現(xiàn)QTimer不能用時的解決方法
- 詳解Python多線程下的list
- python 使用多線程創(chuàng)建一個Buffer緩存器的實(shí)現(xiàn)思路
- Python多線程threading創(chuàng)建及使用方法解析
- Python3 socket即時通訊腳本實(shí)現(xiàn)代碼實(shí)例(threading多線程)
- 解決python多線程報錯:AttributeError: Can''t pickle local object問題
- Python QTimer實(shí)現(xiàn)多線程及QSS應(yīng)用過程解析
相關(guān)文章
Python實(shí)現(xiàn)日志實(shí)時監(jiān)測的示例詳解
觀察者模式:是一種行為型設(shè)計模式。主要關(guān)注的是對象的責(zé)任,允許你定義一種訂閱機(jī)制,可在對象事件發(fā)生時通知多個"觀察"該對象的其他對象。本文將利用觀察者模式實(shí)現(xiàn)日志實(shí)時監(jiān)測,需要的可以參考一下2022-04-04關(guān)于Python字典的底層實(shí)現(xiàn)原理
這篇文章主要介紹了關(guān)于Python字典的底層實(shí)現(xiàn)原理,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2023-02-02python爬蟲入門教程--正則表達(dá)式完全指南(五)
要想做爬蟲,不可避免的要用到正則表達(dá)式,如果是簡單的字符串處理,類似于split,substring等等就足夠了,可是涉及到比較復(fù)雜的匹配,當(dāng)然是正則的天下,下面這篇文章主要給大家介紹了python爬蟲之正則表達(dá)式的相關(guān)資料,需要的朋友可以參考下。2017-05-05使用Django開發(fā)簡單接口實(shí)現(xiàn)文章增刪改查
這篇文章主要介紹了使用Django開發(fā)簡單接口實(shí)現(xiàn)文章增刪改查,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-05-05解決pycharm最左側(cè)Tool Buttons顯示不全的問題
今天小編就為大家分享一篇解決pycharm最左側(cè)Tool Buttons顯示不全的問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-12-12