python 并發(fā)編程 多路復用IO模型詳解
多路復用IO(IO multiplexing)
這種IO方式為事件驅動IO(event driven IO)。
我們都知道,select/epoll的好處就在于單個進程process就可以同時處理多個網絡連接的IO。它的基本原理就是select/epoll這個function會不斷的輪詢所負責的所有socket,當某個socket有數(shù)據到達了,就通知用戶進程。它的流程如圖:

select是多路復用的一種
當用戶進程調用了select,那么整個進程會被block,而同時,kernel會“監(jiān)視”所有select負責的socket,
當任何一個socket中的數(shù)據準備好了,select就會返回。這個時候用戶進程再調用read操作,將數(shù)據從kernel拷貝到用戶進程。
這個圖和blocking IO的圖其實并沒有太大的不同,事實上還更差一些。因為這里需要使用兩個系統(tǒng)調用\(select和recvfrom\),
而blocking IO只調用了一個系統(tǒng)調用\(recvfrom\)。但是,用select的優(yōu)勢在于它可以同時處理多個connection。
多路復用IO比較阻塞IO模型:
1.阻塞IO經歷兩個階段 wait data,copy data
2.多路復用3個階段 wait data,ready copy data, copy data
單連接套接字通信 阻塞IO效率高
多路復用IO select可以代理多個套接字連接,多個套接字通信,多路復用IO效率高
強調:
1. 如果處理的連接數(shù)不是很高的話,使用select/epoll的web server不一定比使用multi-threading + blocking IO的web server性能更好,可能延遲還更大。select/epoll的優(yōu)勢并不是對于單個連接能處理得更快,而是在于能處理更多的連接。
2. 在多路復用模型中,對于每一個socket,一般都設置成為non-blocking,但是,如上圖所示,整個用戶的process其實是一直被block的。只不過process是被select這個函數(shù)block,而不是被socket IO給block。
結論: select的優(yōu)勢在于可以處理多個連接,性能高,同時可以檢測多個套接字IO行為,不適用于單個連接
select網絡IO模型示例
select 檢測多個套接字IO行為 accept,recv
IO行為兩種:
1.別人給我傳數(shù)據
2.給別人發(fā)送數(shù)據
timeout是超時時間
每隔0.5秒去問操作系統(tǒng)準備好數(shù)據沒有
def select(rlist, wlist, xlist, timeout=None): pass # [] 傳的空列表是出異常的列表 # 返回值3個列表 收列表,發(fā)列表,異常列表 rl,wl,xl = select.select(rlist, wlist, [], 0.5)
客戶端:
from socket import *
client = socket(AF_INET,SOCK_STREAM)
client.connect(('127.0.0.1',8000))
while True:
msg = input(">>>:").strip()
if not msg:continue
client.send(msg.encode("utf-8"))
data = client.recv(1024)
print(data.decode("utf-8"))
client.close()
服務端代碼:
from socket import *
import select
server = socket(AF_INET,SOCK_STREAM)
server.bind(('127.0.0.1',8000))
server.listen(5)
# 設置socket接口為 非阻塞IO接口
# 默認是True 為阻塞
server.setblocking(False)
# 專門存著收消息套接字
rlist = [server,]
# 存放發(fā)送消息套接字
wlist = []
# 存放發(fā)送的數(shù)據
wdata = {}
while True:
# 返回值3個列表 收列表,發(fā)列表,異常列表
rl,wl,xl = select.select(rlist, wlist, [], 0.5)
print("rl",rl)
print("wl",wl)
for sock in rl:
if sock == server:
conn,addr = sock.accept()
rlist.append(conn)
else:
try:
data = sock.recv(1024)
if not data:
sock.close()
rlist.remove(sock)
continue
# 收的套接字加到列表
wlist.append(sock)
# 把數(shù)據加到字典 做一個 套接字對應數(shù)據
wdata[sock] = data.upper()
except Exception:
sock.close()
rlist.remove(sock)
# 發(fā)送數(shù)據
for sock in wl:
sock.send(wdata[sock])
wlist.remove(sock)
wdata.pop(sock)
server.close()
基于select模塊 檢測套接字IO行為,實現(xiàn)并發(fā)效果
select監(jiān)聽fd變化的過程分析:
用戶進程創(chuàng)建socket對象,拷貝監(jiān)聽的fd到內核空間,每一個fd會對應一張系統(tǒng)文件表,內核空間的fd響應到數(shù)據后,
就會發(fā)送信號給用戶進程數(shù)據已到;
用戶進程再發(fā)送系統(tǒng)調用,比如(accept)將內核空間的數(shù)據copy到用戶空間,同時作為接受數(shù)據端內核空間的數(shù)據清除,
這樣重新監(jiān)聽時fd再有新的數(shù)據又可以響應到了(發(fā)送端因為基于TCP協(xié)議所以需要收到應答后才會清除)。
該模型的優(yōu)點:
可以同時檢測多個套接字,效率比阻塞IO,非阻塞IO高了
相比其他模型,使用select() 的事件驅動模型只用單線程(進程)執(zhí)行,占用資源少,不消耗太多 CPU,同時能夠為多客戶端提供服務。
如果試圖建立一個簡單的事件驅動的服務器程序,這個模型有一定的參考價值。
該模型的缺點:
代理的套接字 列表里的多個套接字,需要循環(huán)列表 一個個檢測,
在代理套接字比較少的情況下,循環(huán)比較快。但select代理的套接字非常多的情況下,select隨著列表增大,效率就越來越慢
首先select()接口并不是實現(xiàn)“事件驅動”的最好選擇。因為當需要探測的句柄值較大時,select()接口本身需要消耗大量時間去輪詢各個句柄。
很多操作系統(tǒng)提供了更為高效的接口,如linux提供了epoll,BSD提供了kqueue,Solaris提供了/dev/poll,…。
如果需要實現(xiàn)更高效的服務器程序,類似epoll這樣的接口更被推薦。遺憾的是不同的操作系統(tǒng)特供的epoll接口有很大差異,
所以使用類似于epoll的接口實現(xiàn)具有較好跨平臺能力的服務器會比較困難。
其次,該模型將事件探測和事件響應夾雜在一起,一旦事件響應的執(zhí)行體龐大,則對整個模型是災難性的。
epoll是異步方式實現(xiàn),提交套接字時候,每個套接字身上都綁定一個回調函數(shù),哪個套接字準備好了,就觸發(fā)回調函數(shù),把自己索引放在單獨列表里,對于select來說,只需要去準備好的列表里 根據索引拿到套接字,這樣不需要在列表里每個遍歷。
epoll不支持windows系統(tǒng)
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。
相關文章
Python3.7+tkinter實現(xiàn)查詢界面功能
這篇文章主要介紹了Python3.7+tkinter實現(xiàn)查詢界面功能,本文通過實例代碼給大家介紹的非常詳細,具有一定的參考借鑒價值,需要的朋友可以參考下2019-12-12
python使用urllib2提交http post請求的方法
這篇文章主要介紹了python使用urllib2提交http post請求的方法,涉及Python使用urllib2模塊的相關技巧,需要的朋友可以參考下2015-05-05
pytorch中F.avg_pool1d()和F.avg_pool2d()的使用操作
這篇文章主要介紹了pytorch中F.avg_pool1d()和F.avg_pool2d()的使用操作,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2021-05-05
使用python框架Scrapy爬取數(shù)據的操作步驟
Scrapy是一個基于Python的強大的開源網絡爬蟲框架,用于從網站上抓取信息,它提供了廣泛的功能,使得爬取和分析數(shù)據變得相對容易,本文小編將給給大家介紹一下如何使用python框架Scrapy爬取數(shù)據,需要的朋友可以參考下2023-10-10
Python并發(fā)請求下限制QPS(每秒查詢率)的實現(xiàn)代碼
這篇文章主要介紹了Python并發(fā)請求下限制QPS(每秒查詢率)實現(xiàn)方法,本文通過實例代碼給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-06-06

