Python爬蟲之App爬蟲視頻下載的實(shí)現(xiàn)
前言
隨著手app的發(fā)展逐漸強(qiáng)大,我們手機(jī)應(yīng)用每天的生活也是非常的多。那我們怎么知道他的數(shù)據(jù)是怎么形成的,通過電腦端如何爬取。相信大家也有這樣的問題。下面我將講解這些操作流程。
一、操作流程
首先我們要有
- fidder4
- 夜神模擬器
- pycharm
- python3.0或以上版本
二、fidder4抓包
1.fidder配置
首先我們先下載fidder,
打開Fiddler,點(diǎn)擊Tools => Options 打開配置選項(xiàng),切換到第二個標(biāo)簽頁HTTPS,先在這里打勾
然后就是點(diǎn)下面如圖所示的單選框,點(diǎn)擊Actions,運(yùn)行第一個Trust Root Certificate。后面會有一個框,記得點(diǎn)擊確定。
打開Fiddler,點(diǎn)擊Tools => Options… 打開配置選項(xiàng),切換到第三個標(biāo)簽頁Connections,修改如圖所示的地方,端口號可任意修改,這里使用我自定的9999,請記住自己設(shè)置的端口號,后面有需要使用的地方。
2.模擬器配置
我們?yōu)槭裁词褂媚M器,因?yàn)橛捎贔idder抓包,要在局域網(wǎng)環(huán)境下,我們大部分電腦都是以寬帶連接,所以我這里就以模擬器講解抓包,后續(xù)我會更新一期fidder手機(jī)抓包。
這里們先打模擬器,設(shè)置模擬器的代理。我們先查看自己的本機(jī)IP,通過cmd命令輸入ipconfig即可查看本機(jī)的ip,我的本機(jī)IP是192.168.1.2
這里打開模擬器的設(shè)置,找到我們WLAN用點(diǎn)擊,我們看到我們的wifi,用鼠標(biāo)點(diǎn)擊時間長一點(diǎn),它會出現(xiàn)設(shè)置的,下面我用視頻給大家看一下
我們本機(jī)ip進(jìn)行代理哦
3.模擬器證書安裝
我們用模擬器打開瀏覽器,輸入我們本機(jī)ip加端口,就是 192.168.1.2:9999
點(diǎn)擊這個下載證書,下載完成后安裝證書,命名隨便命名。密碼自己要記入。
上述如果都做成功了,應(yīng)該就沒什么問題了。
三、fidder4解析視頻網(wǎng)站
這是我們模擬器里的app,app名字我會在下面評論發(fā)出。
這里的所和上面的正好相對應(yīng),這里相信我們大家都找到了,
我們可以把fidder抓包到的數(shù)據(jù)在這里,這個是我們的數(shù)據(jù)網(wǎng)址
https://v.6.cn/coop/mobile/index.php?act=recommend&padapi=minivideo-getlist.php&page=1
我們通過模擬器視頻往下滑,可以知道它是分頁的,那樣會有好多小姐姐視頻哦,
https://v.6.cn/coop/mobile/index.php?act=recommend&padapi=minivideo-getlist.php&page=2
這里就是第二頁的數(shù)據(jù),這個時候就可以通過pycharm進(jìn)行解析了。
pycharm編寫app代碼
import requests import json def Demo(page): url='https://v.6.cn/coop/mobile/index.php?act=recommend&padapi=minivideo-getlist.php&page={}'.format(page) header={ 'User-Agent':'XY0xDgIxDAS)wgtOthPHTn5AQUVFdXLOCRwSdEhX5PGQFmlHo6n22D)bw973lz13W2)XlZe8pKEpEEdBTgmU4ricT3kQENEI04ATJcbg2VsnEcvoVttmTXpq7r)sVToAdNLqmaxF1B6HFigkhXgO(f)rCw@@' } response = requests.get(url,headers=header,verify=False).json() data=response['content']['list'] #由于網(wǎng)站是json數(shù)據(jù)我們可以通過json解析,然后在進(jìn)行數(shù)據(jù)的爬取 for i in data: title =i['title'] #這里爬取的是視頻標(biāo)題 playurl=i['playurl'] #這里是爬取是的視頻的url Video(title,playurl) def Video(title,playurl): header = { 'User-Agent': 'XY0xDgIxDAS)wgtOthPHTn5AQUVFdXLOCRwSdEhX5PGQFmlHo6n22D)bw973lz13W2)XlZe8pKEpEEdBTgmU4ricT3kQENEI04ATJcbg2VsnEcvoVttmTXpq7r)sVToAdNLqmaxF1B6HFigkhXgO(f)rCw@@' } response = requests.get(playurl,headers=header,verify=False) # 文件寫入異常機(jī)制 try: #由于寫入可以會有點(diǎn)出錯,我們要加一個異常處理機(jī)制,這樣可以提高我們的程序性能。 with open('VIdeo/{}.mp4'.format(title),'ab') as f: f.write(response.content) except Exception as e: print(e) for i in range(1,11): Demo(i)
總結(jié)
以上就是今天要講的內(nèi)容,本文簡單的對fidder配置與模擬器的證書安裝,通過fidder監(jiān)視app傳輸?shù)臄?shù)據(jù)進(jìn)行解析,我們知道此網(wǎng)址有分頁功能 ,最后我們通過pycharm編寫程序,這些操作看似繁鎖,其實(shí)看懂了,就很簡單。
到此這篇關(guān)于Python爬蟲之App爬蟲視頻下載的實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)Python App爬蟲視頻下載內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- 基于python對B站收藏夾按照視頻發(fā)布時間進(jìn)行排序的問題
- 教你如何使用Python下載B站視頻的詳細(xì)教程
- 利用python+ffmpeg合并B站視頻及格式轉(zhuǎn)換的實(shí)例代碼
- ffmpeg+Python實(shí)現(xiàn)B站MP4格式音頻與視頻的合并示例代碼
- python 爬取B站原視頻的實(shí)例代碼
- Python如何爬取b站熱門視頻并導(dǎo)入Excel
- Python如何實(shí)現(xiàn)爬取B站視頻
- python3寫爬取B站視頻彈幕功能
- python基于tkinter制作m3u8視頻下載工具
- python 視頻下載神器(you-get)的具體使用
- python 使用tkinter+you-get實(shí)現(xiàn)視頻下載器
- python b站視頻下載的五種版本
相關(guān)文章
Python隨機(jī)生成一個6位的驗(yàn)證碼代碼分享
這篇文章主要介紹了Python隨機(jī)生成一個6位的驗(yàn)證碼代碼分享,本文直接給出代碼實(shí)例,需要的朋友可以參考下2015-03-03Django中使用haystack+whoosh實(shí)現(xiàn)搜索功能
這篇文章主要介紹了Django之使用haystack+whoosh實(shí)現(xiàn)搜索功能,本文通過實(shí)例代碼給大家介紹的非常詳細(xì),具有一定的參考借鑒價值,需要的朋友可以參考下2019-10-10

Scrapy框架實(shí)現(xiàn)的登錄網(wǎng)站操作示例

簡單了解Django ORM常用字段類型及參數(shù)配置

Python入門教程(二十)Python的Lambda表達(dá)式