Python視頻爬蟲實現(xiàn)下載頭條視頻功能示例
本文實例講述了Python視頻爬蟲實現(xiàn)下載頭條視頻功能。分享給大家供大家參考,具體如下:
一、需求分析
抓取頭條短視頻
思路:
分析網(wǎng)頁源碼,查找解析出視頻資源url(查看源代碼,搜mp4)
對該url發(fā)起請求,返回二進(jìn)制數(shù)據(jù)
將二進(jìn)制數(shù)據(jù)保存為視頻格式
視頻鏈接:
http://video.eastday.com/a/170612170956054127565.html
二、代碼實現(xiàn)
# encoding: utf-8
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
import requests
import re
import time
time1=time.time()
main_url = 'http://video.eastday.com/a/170612170956054127565.html'
resp = requests.get(main_url)
#沒有這行,打印的結(jié)果中文是亂碼
resp.encoding = 'utf-8'
html = resp.text
link = re.findall(r'var mp4 = "(.*?)";', html)[0]
link = 'http:'+link
dest_resp = requests.get(link)
#視頻是二進(jìn)制數(shù)據(jù)流,content就是為了獲取二進(jìn)制數(shù)據(jù)的方法
data = dest_resp.content
#保存數(shù)據(jù)的路徑及文件名
path = u'C:/趙麗穎.mp4'
f = open(path, 'wb')
f.write(data)
f.close()
time2 = time.time()
print u'ok,下載完成!'
print u'總共耗時:' + str(time2 - time1) + 's
"D:\Program Files\Python27\python.exe" D:/PycharmProjects/learn2017/testwechat.py
ok,下載完成!
總共耗時:3.20499992371s
Process finished with exit code 0
成功下載可以播放~

更多關(guān)于Python相關(guān)內(nèi)容可查看本站專題:《Python Socket編程技巧總結(jié)》、《Python正則表達(dá)式用法總結(jié)》、《Python數(shù)據(jù)結(jié)構(gòu)與算法教程》、《Python函數(shù)使用技巧總結(jié)》、《Python字符串操作技巧匯總》、《Python入門與進(jìn)階經(jīng)典教程》及《Python文件與目錄操作技巧匯總》
希望本文所述對大家Python程序設(shè)計有所幫助。
相關(guān)文章
Python保存數(shù)據(jù)到文件的實現(xiàn)方式
這篇文章主要介紹了Python保存數(shù)據(jù)到文件的實現(xiàn)方式,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2023-11-11
Python爬取網(wǎng)站圖片并保存的實現(xiàn)示例
這篇文章主要介紹了Python爬取網(wǎng)站圖片并保存的實現(xiàn)示例,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2021-02-02
python使用OpenCV實現(xiàn)多目標(biāo)跟蹤
這篇文章主要介紹了python使用OpenCV實現(xiàn)多目標(biāo)跟蹤,如何在OpenCV中使用MultiTracker類實現(xiàn)多目標(biāo)跟蹤API。在深入了解詳細(xì)信息之前,請查看下面列出的關(guān)于目標(biāo)跟蹤的帖子,以了解在OpenCV中實現(xiàn)的單個目標(biāo)跟蹤器的基礎(chǔ)知識,需要的朋友可以參考一下2022-04-04
一文詳細(xì)介紹PyQt5 QPushButton() 的作用
通過本文的介紹,相信你已經(jīng)對PyQt5中的QPushButton控件有了深入的了解,從基礎(chǔ)介紹到常用屬性和方法,再到應(yīng)用場景和樣式定制,本文為你提供了全面的指南,感興趣的朋友跟隨小編一起看看吧2024-08-08

