詳解python異步編程之a(chǎn)syncio(百萬并發(fā))
前言:python由于GIL(全局鎖)的存在,不能發(fā)揮多核的優(yōu)勢,其性能一直飽受詬病。然而在IO密集型的網(wǎng)絡(luò)編程里,異步處理比同步處理能提升成百上千倍的效率,彌補(bǔ)了python性能方面的短板,如最新的微服務(wù)框架japronto,resquests per second可達(dá)百萬級。
python還有一個優(yōu)勢是庫(第三方庫)極為豐富,運(yùn)用十分方便。asyncio是python3.4版本引入到標(biāo)準(zhǔn)庫,python2x沒有加這個庫,畢竟python3x才是未來啊,哈哈!python3.5又加入了async/await特性。
在學(xué)習(xí)asyncio之前,我們先來理清楚同步/異步的概念:
同步是指完成事務(wù)的邏輯,先執(zhí)行第一個事務(wù),如果阻塞了,會一直等待,直到這個事務(wù)完成,再執(zhí)行第二個事務(wù),順序執(zhí)行。。。
異步是和同步相對的,異步是指在處理調(diào)用這個事務(wù)的之后,不會等待這個事務(wù)的處理結(jié)果,直接處理第二個事務(wù)去了,通過狀態(tài)、通知、回調(diào)來通知調(diào)用者處理結(jié)果。
一、asyncio
下面通過舉例來對比同步代碼和異步代碼編寫方面的差異,其次看下兩者性能上的差距,我們使用sleep(1)模擬耗時1秒的io操作。
同步代碼:
import time def hello(): time.sleep(1) def run(): for i in range(5): hello() print('Hello World:%s' % time.time()) # 任何偉大的代碼都是從Hello World 開始的! if __name__ == '__main__': run()
輸出:(間隔差不多是1s)
Hello World:1527595175.4728756
Hello World:1527595176.473001
Hello World:1527595177.473494
Hello World:1527595178.4739306
Hello World:1527595179.474482
異步代碼:
import time import asyncio # 定義異步函數(shù) async def hello(): asyncio.sleep(1) print('Hello World:%s' % time.time()) def run(): for i in range(5): loop.run_until_complete(hello()) loop = asyncio.get_event_loop() if __name__ =='__main__': run()
輸出:
Hello World:1527595104.8338501
Hello World:1527595104.8338501
Hello World:1527595104.8338501
Hello World:1527595104.8338501
Hello World:1527595104.8338501
async def 用來定義異步函數(shù),其內(nèi)部有異步操作。每個線程有一個事件循環(huán),主線程調(diào)用asyncio.get_event_loop()時會創(chuàng)建事件循環(huán),你需要把異步的任務(wù)丟給這個循環(huán)的run_until_complete()方法,事件循環(huán)會安排協(xié)同程序的執(zhí)行。
二、aiohttp
如果需要并發(fā)http請求怎么辦呢,通常是用requests,但requests是同步的庫,如果想異步的話需要引入aiohttp。這里引入一個類,from aiohttp import ClientSession,首先要建立一個session對象,然后用session對象去打開網(wǎng)頁。session可以進(jìn)行多項(xiàng)操作,比如post, get, put, head等。
基本用法:
async with ClientSession() as session: async with session.get(url) as response:
aiohttp異步實(shí)現(xiàn)的例子:
import asyncio from aiohttp import ClientSession tasks = [] url = "https://www.baidu.com/{}" async def hello(url): async with ClientSession() as session: async with session.get(url) as response: response = await response.read() print(response) if __name__ == '__main__': loop = asyncio.get_event_loop() loop.run_until_complete(hello(url))
首先async def 關(guān)鍵字定義了這是個異步函數(shù),await 關(guān)鍵字加在需要等待的操作前面,response.read()等待request響應(yīng),是個耗IO操作。然后使用ClientSession類發(fā)起http請求。
多鏈接異步訪問
如果我們需要請求多個URL該怎么辦呢,同步的做法訪問多個URL只需要加個for循環(huán)就可以了。但異步的實(shí)現(xiàn)方式并沒那么容易,在之前的基礎(chǔ)上需要將hello()包裝在asyncio的Future對象中,然后將Future對象列表作為任務(wù)傳遞給事件循環(huán)。
import time import asyncio from aiohttp import ClientSession tasks = [] url = "https://www.baidu.com/{}" async def hello(url): async with ClientSession() as session: async with session.get(url) as response: response = await response.read() # print(response) print('Hello World:%s' % time.time()) def run(): for i in range(5): task = asyncio.ensure_future(hello(url.format(i))) tasks.append(task) if __name__ == '__main__': loop = asyncio.get_event_loop() run() loop.run_until_complete(asyncio.wait(tasks))
輸出:
Hello World:1527754874.8915546
Hello World:1527754874.899039
Hello World:1527754874.90004
Hello World:1527754874.9095392
Hello World:1527754874.9190395
收集http響應(yīng)
好了,上面介紹了訪問不同鏈接的異步實(shí)現(xiàn)方式,但是我們只是發(fā)出了請求,如果要把響應(yīng)一一收集到一個列表中,最后保存到本地或者打印出來要怎么實(shí)現(xiàn)呢,可通過asyncio.gather(*tasks)將響應(yīng)全部收集起來,具體通過下面實(shí)例來演示。
import time import asyncio from aiohttp import ClientSession tasks = [] url = "https://www.baidu.com/{}" async def hello(url): async with ClientSession() as session: async with session.get(url) as response: # print(response) print('Hello World:%s' % time.time()) return await response.read() def run(): for i in range(5): task = asyncio.ensure_future(hello(url.format(i))) tasks.append(task) result = loop.run_until_complete(asyncio.gather(*tasks)) print(result) if __name__ == '__main__': loop = asyncio.get_event_loop() run()
輸出:
Hello World:1527765369.0785167
Hello World:1527765369.0845182
Hello World:1527765369.0910277
Hello World:1527765369.0920424
Hello World:1527765369.097017
[b'<!DOCTYPE html>\r\n<!--STATUS OK-->\r\n<html>\r\n<head>\r\n......
異常解決
假如你的并發(fā)達(dá)到1000個,程序會報錯:ValueError: too many file descriptors in select()。這個報錯的原因是因?yàn)?Python 調(diào)取的 select 對打開的文件字符有最大長度限制。這里我們有兩種方法解決這個問題:1.我們可以需要限制并發(fā)數(shù)量。一次不要塞那么多任務(wù),或者限制最大并發(fā)數(shù)量。2.我們可以使用回調(diào)的方式。這里個人推薦限制并發(fā)數(shù)的方法,設(shè)置并發(fā)數(shù)為500或者600,處理速度更快。
#coding:utf-8 import time,asyncio,aiohttp url = 'https://www.baidu.com/' async def hello(url,semaphore): async with semaphore: async with aiohttp.ClientSession() as session: async with session.get(url) as response: return await response.read() async def run(): semaphore = asyncio.Semaphore(500) # 限制并發(fā)量為500 to_get = [hello(url.format(),semaphore) for _ in range(1000)] #總共1000任務(wù) await asyncio.wait(to_get) if __name__ == '__main__': # now=lambda :time.time() loop = asyncio.get_event_loop() loop.run_until_complete(run()) loop.close()
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
Django配置Bootstrap, js實(shí)現(xiàn)過程詳解
這篇文章主要介紹了Django配置Bootstrap, js實(shí)現(xiàn)過程詳解,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2020-10-10VSCode搭建Django開發(fā)環(huán)境的圖文步驟
本篇介紹在vscode環(huán)境下搭建Django開發(fā)環(huán)境的詳細(xì)步驟,包括Python、Django、VSCode等,以及它們的安裝和配置方法,具有一定的參考價值,感興趣的可以了解一下2023-09-09Python Sympy計算梯度、散度和旋度的實(shí)例
今天小編就為大家分享一篇Python Sympy計算梯度、散度和旋度的實(shí)例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-12-12Python pycharm 同時加載多個項(xiàng)目的方法
今天小編就為大家分享一篇Python pycharm 同時加載多個項(xiàng)目的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-01-01python命令行參數(shù)解析OptionParser類用法實(shí)例
這篇文章主要介紹了python命令行參數(shù)解析OptionParser類用法實(shí)例,需要的朋友可以參考下2014-10-10