python 下載文件的幾種方式分享
1 、一般同步下載
示例代碼:
import requests import os def downlaod(url, file_path): headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64; rv:68.0) Gecko/20100101 Firefox/68.0" } r = requests.get(url=url, headers=headers) with open(file_path, "wb") as f: f.write(r.content) f.flush()
2、 使用流式請求,requests.get方法的stream
默認情況下是stream的值為false,它會立即開始下載文件并存放到內(nèi)存當中,倘若文件過大就會導致內(nèi)存不足的情況,程序就會報錯。
當把get函數(shù)的stream參數(shù)設置成True時,它不會立即開始下載,當你使用iter_content或iter_lines遍歷內(nèi)容或訪問內(nèi)容屬性時才開始下載,需要注意一點:文件沒有下載之前,它也需要保持連接。
iter_content:一塊一塊的遍歷要下載的內(nèi)容 iter_lines:一行一行的遍歷要下載的內(nèi)容
使用上面兩個函數(shù)下載大文件可以防止占用過多的內(nèi)存,因為每次只下載小部分數(shù)據(jù)。
示例代碼:
3 、異步下載文件
由于request的請求是阻塞式的,所以要用aiohttp模塊來發(fā)起請求。
示例代碼:
import aiohttp import asyncio import os async def handler(url, file_path): headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64; rv:68.0) Gecko/20100101 Firefox/68.0" } async with aiohttp.ClientSession() as session: r = await session.get(url=url, headers=headers) with open(file_path, "wb") as f: f.write(await r.read()) f.flush() os.fsync(f.fileno()) loop = asyncio.get_event_loop() loop.run_until_complete(handler(url, file_path))
4、 異步拆分下載文件
上面用的是一個協(xié)程下載一個文件,下面的方法是將文件分成幾部分,每個部分用一個協(xié)程下載,最后再寫入文件。
下面這個例子用的是流式寫入,即把內(nèi)容寫入到磁盤里面。
import aiohttp import asyncio import time import os async def consumer(queue): option = await queue.get() start = option["start"] end = option["end"] url = option["url"] filename = option["filename"] i = option["i"] print(f"第{i}個任務開始運行") async with aiohttp.ClientSession() as session: headers = {"Range": f"bytes={start}-{end}"} r = await session.get(url=url, headers=headers) with open(filename, "rb+") as f: f.seek(start) while True: chunk = await r.content.read(end - start) if not chunk: break f.write(chunk) f.flush() os.fsync(f.fileno()) print(f"第{i}個任務正在寫入中ing") queue.task_done() print(f"第{i}個任務寫入成功") async def producer(url, headers, filename, queue, coro_num): async with aiohttp.ClientSession() as session: resp = await session.head(url=url, headers=headers) file_size = int(resp.headers["content-length"]) # 創(chuàng)建一個文件 with open(filename, "wb") as f: pass part = file_size // coro_num for i in range(coro_num): start = part * i if i == coro_num - 1: end = file_size else: end = start + part info = { "start": start, "end": end, "url": url, "filename": filename, "i": i, } queue.put_nowait(info) async def main(): # 需要填的有url,filename,coro_num url = "" filename = "" coro_num = 0 headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64; rv:68.0) Gecko/20100101 Firefox/68.0" } queue = asyncio.Queue(coro_num) await producer(url, headers, filename, queue, coro_num) task_list = [] for i in range(coro_num): task = asyncio.create_task(consumer(queue)) task_list.append(task) await queue.join() for i in task_list: i.cancel() await asyncio.gather(*task_list) startt = time.time() loop = asyncio.get_event_loop() loop.run_until_complete(main()) end = time.time() - startt print(f"用了{end}秒")
5、注意
以上的示例都是介紹思路,程序并不健壯,健壯的程序需要加入錯誤捕獲和錯誤處理。
以上就是python 下載文件的幾種方式分享的詳細內(nèi)容,更多關于python 下載文件的資料請關注腳本之家其它相關文章!
- 用Python自動下載網(wǎng)站所有文件
- python基于paramiko庫遠程執(zhí)行 SSH 命令,實現(xiàn) sftp 下載文件
- Python解析m3u8拼接下載mp4視頻文件的示例代碼
- python爬蟲智能翻頁批量下載文件的實例詳解
- python 下載文件的幾種方法匯總
- python 基于selectors庫實現(xiàn)文件上傳與下載
- Python實現(xiàn)FTP文件定時自動下載的步驟
- Python 使用SFTP和FTP實現(xiàn)對服務器的文件下載功能
- python從ftp獲取文件并下載到本地
- Python根據(jù)URL地址下載文件并保存至對應目錄的實現(xiàn)
相關文章
Python控制windows系統(tǒng)音量實現(xiàn)實例
這篇文章主要介紹了Python控制windows系統(tǒng)音量實現(xiàn)實例,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習吧2023-01-01一文帶你詳解Python中sys.executable函數(shù)的作用
sys.executable函數(shù)是用來獲取當前Python解釋器的完整路徑的,本文主要介紹了一文帶你詳解Python中sys.executable函數(shù)的作用,具有一定的參考價值,感興趣的可以了解一下2024-03-03Python?pandas中read_csv參數(shù)示例詳解
使用pandas做數(shù)據(jù)處理的第一步就是讀取數(shù)據(jù),數(shù)據(jù)源可以來自于各種地方,csv文件便是其中之一,下面這篇文章主要給大家介紹了關于Python?pandas中read_csv參數(shù)詳解的相關資料,需要的朋友可以參考下2023-01-01淺析python3中的os.path.dirname(__file__)的使用
這篇文章主要介紹了python3中的os.path.dirname(__file__)的使用,非常不錯,具有一定的參考借鑒價值,需要的朋友可以參考下2018-08-08Python使用py2neo操作圖數(shù)據(jù)庫neo4j的方法詳解
這篇文章主要介紹了Python使用py2neo操作圖數(shù)據(jù)庫neo4j的方法,結合實例形式詳細分析了Python使用py2neo操作圖數(shù)據(jù)庫neo4j的具體步驟、原理、相關使用技巧與操作注意事項,需要的朋友可以參考下2020-01-01