python 實現(xiàn)多線程下載視頻的代碼
代碼:
def thread(url): r = requests.get(url, headers=None, stream=True, timeout=30) # print(r.status_code, r.headers) headers = {} all_thread = 1 # 獲取視頻大小 file_size = int(r.headers['content-length']) # 如果獲取到文件大小,創(chuàng)建一個和需要下載文件一樣大小的文件 if file_size: fp = open('2.mp4', 'wb') fp.truncate(file_size) print('視頻大?。? + str(int(file_size / 1024 / 1024)) + "MB") fp.close() # 每個線程每次下載大小為5M size = 5242880 # 當前文件大小需大于5M if file_size > size: # 獲取總線程數(shù) all_thread = int(file_size / size) # 設最大線程數(shù)為10,如總線程數(shù)大于10 # 線程數(shù)為10 if all_thread > 10: all_thread = 10 part = file_size // all_thread threads = [] starttime = datetime.datetime.now().replace(microsecond=0) for i in range(all_thread): # 獲取每個線程開始時的文件位置 start = part * i # 獲取每個文件結(jié)束位置 if i == all_thread - 1: end = file_size else: end = start + part if i > 0: start += 1 headers = headers.copy() headers['Range'] = "bytes=%s-%s" % (start, end) t = threading.Thread(target=Handler, name='th-' + str(i), kwargs={'start': start, 'end': end, 'url': url, 'filename': '2.mp4', 'headers': headers}) t.setDaemon(True) threads.append(t) # 線程開始 for t in threads: time.sleep(0.2) t.start() # 等待所有線程結(jié)束 for t in threads: t.join() endtime = datetime.datetime.now().replace(microsecond=0) print('用時:%s' % (endtime - starttime)) def Handler(start, end, url, filename, headers={}): tt_name = threading.current_thread().getName() print(tt_name + ' is begin') r = requests.get(url, headers=headers, stream=True) total_size = end - start downsize = 0 startTime = time.time() with open(filename, 'r+b') as fp: fp.seek(start) var = fp.tell() for chunk in r.iter_content(204800): if chunk: fp.write(chunk) downsize += len(chunk) line = tt_name + '-downloading %d KB/s - %.2f MB, 共 %.2f MB' line = line % ( downsize / 1024 / (time.time() - startTime), downsize / 1024 / 1024, total_size / 1024 / 1024) print(line, end='\r') if __name__ == '__main__': url = input('輸入視頻鏈接(請輸入視頻原鏈):') thread(url)
效果:
可以看見,38MB,一秒下完。
唯一的缺點就是,要有視頻原鏈,而一般這個視頻原鏈都是不會輕易被找到的,這就叫反爬。
找視頻原鏈,就找爬蟲,視頻爬蟲只是爬蟲的一種。
可以根據(jù)視頻大小,改變線程數(shù)。
總結(jié)
以上所述是小編給大家介紹的python 實現(xiàn)多線程下載視頻的代碼,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!
如果你覺得本文對你有幫助,歡迎轉(zhuǎn)載,煩請注明出處,謝謝!
相關(guān)文章
Python如何使用神經(jīng)網(wǎng)絡進行簡單文本分類
這篇文章主要介紹了Python如何使用神經(jīng)網(wǎng)絡進行簡單文本分類,幫助大家更好的理解和學習使用python,感興趣的朋友可以了解下2021-02-02Python&Matlab實現(xiàn)灰狼優(yōu)化算法的示例代碼
灰狼優(yōu)化算法是一種群智能優(yōu)化算法,它的獨特之處在于一小部分擁有絕對話語權(quán)的灰狼帶領一群灰狼向獵物前進。本文具體介紹了灰狼優(yōu)化算法的兩種實現(xiàn)示例代碼,需要的可以參考一下2022-03-03對Python 多線程統(tǒng)計所有csv文件的行數(shù)方法詳解
今天小編就為大家分享一篇對Python 多線程統(tǒng)計所有csv文件的行數(shù)方法詳解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-02-02Python?pandera數(shù)據(jù)驗證和清洗的庫
為了確保數(shù)據(jù)的質(zhì)量,Python Pandera 庫應運而生。本文將深入介紹 Python Pandera,這是一個用于數(shù)據(jù)驗證和清洗的庫,并提供豐富的示例代碼,幫助大家充分利用它來提高數(shù)據(jù)質(zhì)量2024-01-01利用Python第三方庫xlrd讀取Excel中數(shù)據(jù)實例代碼
python操作excel主要用到xlrd和xlwt這兩個庫,即xlrd是讀excel,xlwt是寫excel的庫,下面這篇文章主要給大家介紹了關(guān)于利用Python第三方庫xlrd讀取Excel中數(shù)據(jù)的相關(guān)資料,文中通過實例代碼介紹的非常詳細,需要的朋友可以參考下2022-07-07分享python數(shù)據(jù)統(tǒng)計的一些小技巧
今天這些小技巧在處理python的一些數(shù)據(jù)方面還是很有幫助的,希望能幫到在這方面有需要的童鞋~2016-07-07