python 下載文件的幾種方式分享
1 、一般同步下載
示例代碼:
import requests
import os
def downlaod(url, file_path):
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64; rv:68.0) Gecko/20100101 Firefox/68.0"
}
r = requests.get(url=url, headers=headers)
with open(file_path, "wb") as f:
f.write(r.content)
f.flush()
2、 使用流式請(qǐng)求,requests.get方法的stream
默認(rèn)情況下是stream的值為false,它會(huì)立即開(kāi)始下載文件并存放到內(nèi)存當(dāng)中,倘若文件過(guò)大就會(huì)導(dǎo)致內(nèi)存不足的情況,程序就會(huì)報(bào)錯(cuò)。
當(dāng)把get函數(shù)的stream參數(shù)設(shè)置成True時(shí),它不會(huì)立即開(kāi)始下載,當(dāng)你使用iter_content或iter_lines遍歷內(nèi)容或訪問(wèn)內(nèi)容屬性時(shí)才開(kāi)始下載,需要注意一點(diǎn):文件沒(méi)有下載之前,它也需要保持連接。
iter_content:一塊一塊的遍歷要下載的內(nèi)容 iter_lines:一行一行的遍歷要下載的內(nèi)容
使用上面兩個(gè)函數(shù)下載大文件可以防止占用過(guò)多的內(nèi)存,因?yàn)槊看沃幌螺d小部分?jǐn)?shù)據(jù)。
示例代碼:
3 、異步下載文件
由于request的請(qǐng)求是阻塞式的,所以要用aiohttp模塊來(lái)發(fā)起請(qǐng)求。
示例代碼:
import aiohttp
import asyncio
import os
async def handler(url, file_path):
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64; rv:68.0) Gecko/20100101 Firefox/68.0"
}
async with aiohttp.ClientSession() as session:
r = await session.get(url=url, headers=headers)
with open(file_path, "wb") as f:
f.write(await r.read())
f.flush()
os.fsync(f.fileno())
loop = asyncio.get_event_loop()
loop.run_until_complete(handler(url, file_path))
4、 異步拆分下載文件
上面用的是一個(gè)協(xié)程下載一個(gè)文件,下面的方法是將文件分成幾部分,每個(gè)部分用一個(gè)協(xié)程下載,最后再寫入文件。
下面這個(gè)例子用的是流式寫入,即把內(nèi)容寫入到磁盤里面。
import aiohttp
import asyncio
import time
import os
async def consumer(queue):
option = await queue.get()
start = option["start"]
end = option["end"]
url = option["url"]
filename = option["filename"]
i = option["i"]
print(f"第{i}個(gè)任務(wù)開(kāi)始運(yùn)行")
async with aiohttp.ClientSession() as session:
headers = {"Range": f"bytes={start}-{end}"}
r = await session.get(url=url, headers=headers)
with open(filename, "rb+") as f:
f.seek(start)
while True:
chunk = await r.content.read(end - start)
if not chunk:
break
f.write(chunk)
f.flush()
os.fsync(f.fileno())
print(f"第{i}個(gè)任務(wù)正在寫入中ing")
queue.task_done()
print(f"第{i}個(gè)任務(wù)寫入成功")
async def producer(url, headers, filename, queue, coro_num):
async with aiohttp.ClientSession() as session:
resp = await session.head(url=url, headers=headers)
file_size = int(resp.headers["content-length"])
# 創(chuàng)建一個(gè)文件
with open(filename, "wb") as f:
pass
part = file_size // coro_num
for i in range(coro_num):
start = part * i
if i == coro_num - 1:
end = file_size
else:
end = start + part
info = {
"start": start,
"end": end,
"url": url,
"filename": filename,
"i": i,
}
queue.put_nowait(info)
async def main():
# 需要填的有url,filename,coro_num
url = ""
filename = ""
coro_num = 0
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64; rv:68.0) Gecko/20100101 Firefox/68.0"
}
queue = asyncio.Queue(coro_num)
await producer(url, headers, filename, queue, coro_num)
task_list = []
for i in range(coro_num):
task = asyncio.create_task(consumer(queue))
task_list.append(task)
await queue.join()
for i in task_list:
i.cancel()
await asyncio.gather(*task_list)
startt = time.time()
loop = asyncio.get_event_loop()
loop.run_until_complete(main())
end = time.time() - startt
print(f"用了{(lán)end}秒")
5、注意
以上的示例都是介紹思路,程序并不健壯,健壯的程序需要加入錯(cuò)誤捕獲和錯(cuò)誤處理。
以上就是python 下載文件的幾種方式分享的詳細(xì)內(nèi)容,更多關(guān)于python 下載文件的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
- 用Python自動(dòng)下載網(wǎng)站所有文件
- python基于paramiko庫(kù)遠(yuǎn)程執(zhí)行 SSH 命令,實(shí)現(xiàn) sftp 下載文件
- Python解析m3u8拼接下載mp4視頻文件的示例代碼
- python爬蟲智能翻頁(yè)批量下載文件的實(shí)例詳解
- python 下載文件的幾種方法匯總
- python 基于selectors庫(kù)實(shí)現(xiàn)文件上傳與下載
- Python實(shí)現(xiàn)FTP文件定時(shí)自動(dòng)下載的步驟
- Python 使用SFTP和FTP實(shí)現(xiàn)對(duì)服務(wù)器的文件下載功能
- python從ftp獲取文件并下載到本地
- Python根據(jù)URL地址下載文件并保存至對(duì)應(yīng)目錄的實(shí)現(xiàn)
相關(guān)文章
OpenCV視頻流Python多線程處理方法詳細(xì)分析
為OpenCV是搞計(jì)算機(jī)視覺(jué)必須要掌握的基礎(chǔ),這篇文章主要給大家介紹了關(guān)于OpenCV視頻流多線程處理的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),需要的朋友可以參考下2022-11-11
Python控制windows系統(tǒng)音量實(shí)現(xiàn)實(shí)例
這篇文章主要介紹了Python控制windows系統(tǒng)音量實(shí)現(xiàn)實(shí)例,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)吧2023-01-01
基于Python實(shí)現(xiàn)開(kāi)發(fā)釘釘通知機(jī)器人
在項(xiàng)目協(xié)同工作或自動(dòng)化流程完成時(shí),我們需要用一定的手段通知自己或他人。Telegram 非常好用,幾個(gè)步驟就能創(chuàng)建一個(gè)機(jī)器人,可惜在國(guó)內(nèi)無(wú)法使用。所以本文就來(lái)開(kāi)發(fā)一個(gè)釘釘通知機(jī)器人吧2023-02-02
Python學(xué)習(xí)筆記之列表推導(dǎo)式實(shí)例分析
這篇文章主要介紹了Python學(xué)習(xí)筆記之列表推導(dǎo)式,結(jié)合實(shí)例形式分析Python列表推導(dǎo)式的原理、寫法與相關(guān)使用技巧,需要的朋友可以參考下2019-08-08
一文帶你詳解Python中sys.executable函數(shù)的作用
sys.executable函數(shù)是用來(lái)獲取當(dāng)前Python解釋器的完整路徑的,本文主要介紹了一文帶你詳解Python中sys.executable函數(shù)的作用,具有一定的參考價(jià)值,感興趣的可以了解一下2024-03-03
Python?pandas中read_csv參數(shù)示例詳解
使用pandas做數(shù)據(jù)處理的第一步就是讀取數(shù)據(jù),數(shù)據(jù)源可以來(lái)自于各種地方,csv文件便是其中之一,下面這篇文章主要給大家介紹了關(guān)于Python?pandas中read_csv參數(shù)詳解的相關(guān)資料,需要的朋友可以參考下2023-01-01
淺析python3中的os.path.dirname(__file__)的使用
這篇文章主要介紹了python3中的os.path.dirname(__file__)的使用,非常不錯(cuò),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2018-08-08
Python使用py2neo操作圖數(shù)據(jù)庫(kù)neo4j的方法詳解
這篇文章主要介紹了Python使用py2neo操作圖數(shù)據(jù)庫(kù)neo4j的方法,結(jié)合實(shí)例形式詳細(xì)分析了Python使用py2neo操作圖數(shù)據(jù)庫(kù)neo4j的具體步驟、原理、相關(guān)使用技巧與操作注意事項(xiàng),需要的朋友可以參考下2020-01-01

