詳解Python并發(fā)編程之從性能角度來初探并發(fā)編程
. 前言
作為進(jìn)階系列的一個分支「并發(fā)編程」,我覺得這是每個程序員都應(yīng)該會的。
并發(fā)編程 這個系列,我準(zhǔn)備了將近一個星期,從知識點(diǎn)梳理,到思考要舉哪些例子才能更加讓人容易吃透這些知識點(diǎn)。希望呈現(xiàn)出來的效果真能如想象中的那樣,對小白也一樣的友好。
昨天大致整理了下,這個系列我大概會講如下內(nèi)容(后期可能調(diào)整):

對于并發(fā)編程,Python的實(shí)現(xiàn),總結(jié)了一下,大致有如下三種方法:
- 多線程
- 多進(jìn)程
- 協(xié)程(生成器)
在之后的章節(jié)里,將陸陸續(xù)續(xù)地給大家介紹到這三個知識點(diǎn)。
. 并發(fā)編程的基本概念
在開始講解理論知識之前,先過一下幾個基本概念。雖然咱是進(jìn)階教程,但我也希望寫得更小白,更通俗易懂。
- 串行:一個人在同一時間段只能干一件事,譬如吃完飯才能看電視;
- 并行:一個人在同一時間段可以干多件事,譬如可以邊吃飯邊看電視;
在Python中,多線程 和 協(xié)程 雖然是嚴(yán)格上來說是串行,但卻比一般的串行程序執(zhí)行效率高得很。一般的串行程序,在程序阻塞的時候,只能干等著,不能去做其他事。就好像,電視上播完正劇,進(jìn)入廣告時間,我們卻不能去趁廣告時間是吃個飯。對于程序來說,這樣做顯然是效率極低的,是不合理的。
當(dāng)然,學(xué)完這個課程后,我們就懂得,利用廣告時間去做其他事,靈活安排時間。這也是我們多線程和協(xié)程 要幫我們要完成的事情,內(nèi)部合理調(diào)度任務(wù),使得程序效率最大化。
雖然 多線程 和 協(xié)程 已經(jīng)相當(dāng)智能了。但還是不夠高效,最高效的應(yīng)該是一心多用,邊看電視邊吃飯邊聊天。這就是我們的 多進(jìn)程 才能做的事了。
為了更幫助大家更加直觀的理解,在網(wǎng)上找到兩張圖,來生動形象的解釋了多線程和多進(jìn)程的區(qū)別。(侵刪)
多線程,交替執(zhí)行,另一種意義上的串行。

多進(jìn)程,并行執(zhí)行,真正意義上的并發(fā)。

. 單線程VS多線程VS多進(jìn)程
文字總是蒼白無力的,千言萬語不如幾行代碼來得孔武有力。
首先,我的實(shí)驗(yàn)環(huán)境配置如下
| 操作系統(tǒng) | CPU核數(shù) | 內(nèi)存(G) | 硬盤 |
|---|---|---|---|
| CentOS 7.2 | 24核 | 32 | 機(jī)械硬盤 |
注意以下代碼,若要理解,對小白有如下知識點(diǎn)要求:
- 裝飾器的運(yùn)用
- 多線程的基本使用
- 多進(jìn)程的基本使用
當(dāng)然,看不懂也沒關(guān)系,主要最后的結(jié)論,能讓大家對單線程、多線程、多進(jìn)程在實(shí)現(xiàn)效果上有個大體清晰的認(rèn)識,達(dá)到這個效果,本文的使命也就完成了,等到最后,學(xué)完整個系列,不妨再回頭來理解也許會有更深刻的理解。
下面我們來看看,單線程,多線程和多進(jìn)程,在運(yùn)行中究竟孰強(qiáng)孰弱。
開始對比之前,首先定義四種類型的場景
- CPU計(jì)算密集型
- 磁盤IO密集型
- 網(wǎng)絡(luò)IO密集型
- 【模擬】IO密集型
為什么是這幾種場景,這和多線程 多進(jìn)程的適用場景有關(guān)。結(jié)論里,我再說明。
# CPU計(jì)算密集型
def count(x=1, y=1):
# 使程序完成150萬計(jì)算
c = 0
while c < 500000:
c += 1
x += x
y += y
# 磁盤讀寫IO密集型
def io_disk():
with open("file.txt", "w") as f:
for x in range(5000000):
f.write("python-learning\n")
# 網(wǎng)絡(luò)IO密集型
header = {
'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36'}
url = "https://www.tieba.com/"
def io_request():
try:
webPage = requests.get(url, headers=header)
html = webPage.text
return
except Exception as e:
return {"error": e}
# 【模擬】IO密集型
def io_simulation():
time.sleep(2)
比拼的指標(biāo),我們用時間來考量。時間耗費(fèi)得越少,說明效率越高。
為了方便,使得代碼看起來,更加簡潔,我這里先定義是一個簡單的 時間計(jì)時器 的裝飾器。如果你對裝飾器還不是很了解,也沒關(guān)系,你只要知道它是用于 計(jì)算函數(shù)運(yùn)行時間的東西就可以了。
def timer(mode):
def wrapper(func):
def deco(*args, **kw):
type = kw.setdefault('type', None)
t1=time.time()
func(*args, **kw)
t2=time.time()
cost_time = t2-t1
print("{}-{}花費(fèi)時間:{}秒".format(mode, type,cost_time))
return deco
return wrapper
第一步,先來看看單線程的
@timer("【單線程】")
def single_thread(func, type=""):
for i in range(10):
func()
# 單線程
single_thread(count, type="CPU計(jì)算密集型")
single_thread(io_disk, type="磁盤IO密集型")
single_thread(io_request,type="網(wǎng)絡(luò)IO密集型")
single_thread(io_simulation,type="模擬IO密集型")
看看結(jié)果
【單線程】-CPU計(jì)算密集型花費(fèi)時間:83.42633867263794秒
【單線程】-磁盤IO密集型花費(fèi)時間:15.641993284225464秒
【單線程】-網(wǎng)絡(luò)IO密集型花費(fèi)時間:1.1397218704223633秒
【單線程】-模擬IO密集型花費(fèi)時間:20.020972728729248秒
第二步,再來看看多線程的
@timer("【多線程】")
def multi_thread(func, type=""):
thread_list = []
for i in range(10):
t=Thread(target=func, args=())
thread_list.append(t)
t.start()
e = len(thread_list)
while True:
for th in thread_list:
if not th.is_alive():
e -= 1
if e <= 0:
break
# 多線程
multi_thread(count, type="CPU計(jì)算密集型")
multi_thread(io_disk, type="磁盤IO密集型")
multi_thread(io_request, type="網(wǎng)絡(luò)IO密集型")
multi_thread(io_simulation, type="模擬IO密集型")
看看結(jié)果
【多線程】-CPU計(jì)算密集型花費(fèi)時間:93.82986998558044秒
【多線程】-磁盤IO密集型花費(fèi)時間:13.270896911621094秒
【多線程】-網(wǎng)絡(luò)IO密集型花費(fèi)時間:0.1828296184539795秒
【多線程】-模擬IO密集型花費(fèi)時間:2.0288875102996826秒
第三步,最后來看看多進(jìn)程
@timer("【多進(jìn)程】")
def multi_process(func, type=""):
process_list = []
for x in range(10):
p = Process(target=func, args=())
process_list.append(p)
p.start()
e = process_list.__len__()
while True:
for pr in process_list:
if not pr.is_alive():
e -= 1
if e <= 0:
break
# 多進(jìn)程
multi_process(count, type="CPU計(jì)算密集型")
multi_process(io_disk, type="磁盤IO密集型")
multi_process(io_request, type="網(wǎng)絡(luò)IO密集型")
multi_process(io_simulation, type="模擬IO密集型")
看看結(jié)果
【多進(jìn)程】-CPU計(jì)算密集型花費(fèi)時間:9.082211017608643秒
【多進(jìn)程】-磁盤IO密集型花費(fèi)時間:1.287339448928833秒
【多進(jìn)程】-網(wǎng)絡(luò)IO密集型花費(fèi)時間:0.13074755668640137秒
【多進(jìn)程】-模擬IO密集型花費(fèi)時間:2.0076842308044434秒
. 性能對比成果總結(jié)
將結(jié)果匯總一下,制成表格。
| 種類 | CPU 計(jì)算密集型 |
磁盤 IO密集型 |
網(wǎng)絡(luò) IO密集型 |
模擬 IO密集型 |
|---|---|---|---|---|
| 單線程 | 83.42 | 15.64 | 1.13 | 20.02 |
| 多線程 | 93.82 | 13.27 | 0.18 | 2.02 |
| 多進(jìn)程 | 9.08 | 1.28 | 0.13 | 2.01 |
我們來分析下這個表格。
首先是CPU密集型,多線程以對比單線程,不僅沒有優(yōu)勢,顯然還由于要不斷的加鎖釋放GIL全局鎖,切換線程而耗費(fèi)大量時間,效率低下,而多進(jìn)程,由于是多個CPU同時進(jìn)行計(jì)算工作,相當(dāng)于十個人做一個人的作業(yè),顯然效率是成倍增長的。
然后是IO密集型,IO密集型可以是磁盤IO,網(wǎng)絡(luò)IO,數(shù)據(jù)庫IO等,都屬于同一類,計(jì)算量很小,主要是IO等待時間的浪費(fèi)。通過觀察,可以發(fā)現(xiàn),我們磁盤IO,網(wǎng)絡(luò)IO的數(shù)據(jù),多線程對比單線程也沒體現(xiàn)出很大的優(yōu)勢來。這是由于我們程序的的IO任務(wù)不夠繁重,所以優(yōu)勢不夠明顯。
所以我還加了一個「模擬IO密集型」,用sleep來模擬IO等待時間,就是為了體現(xiàn)出多線程的優(yōu)勢,也能讓大家更加直觀的理解多線程的工作過程。單線程需要每個線程都要sleep(2),10個線程就是20s,而多線程,在sleep(2)的時候,會切換到其他線程,使得10個線程同時sleep(2),最終10個線程也就只有2s.
可以得出以下幾點(diǎn)結(jié)論
- 單線程總是最慢的,多進(jìn)程總是最快的。
- 多線程適合在IO密集場景下使用,譬如爬蟲,網(wǎng)站開發(fā)等
- 多進(jìn)程適合在對CPU計(jì)算運(yùn)算要求較高的場景下使用,譬如大數(shù)據(jù)分析,機(jī)器學(xué)習(xí)等
- 多進(jìn)程雖然總是最快的,但是不一定是最優(yōu)的選擇,因?yàn)樗枰狢PU資源支持下才能體現(xiàn)優(yōu)勢
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
- python并發(fā)編程之多進(jìn)程、多線程、異步和協(xié)程詳解
- Python多進(jìn)程并發(fā)與多線程并發(fā)編程實(shí)例總結(jié)
- 簡單介紹Python中利用生成器實(shí)現(xiàn)的并發(fā)編程
- 理論講解python多進(jìn)程并發(fā)編程
- python并發(fā)編程之線程實(shí)例解析
- 一文了解Python并發(fā)編程的工程實(shí)現(xiàn)方法
- python并發(fā)編程多進(jìn)程 模擬搶票實(shí)現(xiàn)過程
- python并發(fā)編程多進(jìn)程 互斥鎖原理解析
- python 并發(fā)編程 多路復(fù)用IO模型詳解
- python并發(fā)編程多進(jìn)程之守護(hù)進(jìn)程原理解析
- python 并發(fā)編程 非阻塞IO模型原理解析
- python 并發(fā)編程 阻塞IO模型原理解析
相關(guān)文章
Python中schedule模塊關(guān)于定時任務(wù)使用方法
這篇文章主要介紹了Python中schedule模塊關(guān)于定時任務(wù)使用方法,文章圍繞主題展開詳細(xì)的內(nèi)容介紹,具有一定的參考價(jià)值,需要的小伙伴可以參考一下2022-05-05
Python Django view 兩種return的實(shí)現(xiàn)方式
這篇文章主要介紹了Python Django view 兩種return的實(shí)現(xiàn)方式,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-03-03
淺析Python中將單詞首字母大寫的capitalize()方法
這篇文章主要介紹了淺析Python中將單詞首字母大寫的capitalize()方法,是Python入門中的基礎(chǔ)知識,需要的朋友可以參考下2015-05-05
Python subprocess模塊功能與常見用法實(shí)例詳解
這篇文章主要介紹了Python subprocess模塊功能與常見用法,結(jié)合實(shí)例形式詳細(xì)分析了subprocess模塊功能、常用函數(shù)相關(guān)使用技巧,需要的朋友可以參考下2018-06-06
關(guān)于Python連接Cassandra容器進(jìn)行查詢的問題
這篇文章主要介紹了Python連接Cassandra容器進(jìn)行查詢的問題,問題的關(guān)鍵在于尋找到Cassandra的9042端口,從而獲取數(shù)據(jù),具有內(nèi)容詳情跟隨小編一起看看吧2021-11-11
Python入門教程(四十三)Python的NumPy數(shù)據(jù)類型
這篇文章主要介紹了Python入門教程(四十二)Python的NumPy數(shù)組裁切,NumPy有一些額外的數(shù)據(jù)類型,并通過一個字符引用數(shù)據(jù)類型,例如 i 代表整數(shù),u 代表無符號整數(shù)等,需要的朋友可以參考下2023-05-05

