Python反爬實戰(zhàn)掌握酷狗音樂排行榜加密規(guī)則
效果展示
爬取目標(biāo)
網(wǎng)址:酷我音樂
工具使用
開發(fā)工具:pycharm
開發(fā)環(huán)境:python3.7, Windows10
使用工具包:requests,re
項目思路解析
找到需要解析的榜單數(shù)據(jù)
隨意點擊一個歌曲獲取到音樂的詳情數(shù)據(jù) 通過抓包的方式獲取到音樂播放數(shù)據(jù)
找到MP3的數(shù)據(jù)提交地址 mp3數(shù)據(jù)來自于這個url地址
提交數(shù)據(jù)的網(wǎng)址:
https://wwwapi.kugou.com/yy/index.php?r=play/getdata&callback=jQuery19102816534571347611_1626783818555&hash=A38449E76C74D45825F565C1FDB825C0&dfid=3dKstH1sJdRa44o6Vj0ZIryF&mid=4458f6d567640b39de367a394d69879e&platid=4&album_id=40437970&_=1626783818556
將多個網(wǎng)址數(shù)據(jù)進行對比看看哪些參數(shù)是需要自行修改的
變化的url數(shù)據(jù)有3個
- hash
- album_id
- _
_ 可以明顯看出來是時間戳 需要獲取到對應(yīng)的hash以及album_id的值 來到主頁找尋對應(yīng)的歌曲id數(shù)據(jù) 發(fā)現(xiàn)數(shù)據(jù)來自網(wǎng)頁源代碼
歌曲的數(shù)據(jù)都是來自網(wǎng)頁源代碼
梳理整體思路:
- 從首頁源碼里提取出對應(yīng)的hash、album_id值
- 組合成新的url地址
- 獲取到j(luò)son數(shù)據(jù)總的歌曲播放地址
簡易源碼分享
本章內(nèi)容只限學(xué)習(xí),切勿用作其他用途!?。。?!
import requests import re import time def Tools(url): headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36 Edg/91.0.864.70' } response = requests.get(url, headers=headers) return response def Save(name, url): mp3 = Tools(url).content # 請求mp3地址鏈接 返回格式是16進制 f = open('./kugou/{}.mp3'.format(name), 'wb') # w 文件存在就寫入 不存在就會創(chuàng)建 b進制讀寫 f.write(mp3) f.close() print('{}下載完成....'.format(name)) url = 'https://www.kugou.com/yy/html/rank.html' response = Tools(url).text album_id = re.findall(r'"album_id":(\d*?),', response) # id Hash = re.findall(r'"Hash":"(.*?)",', response) # hash for a, h in zip(album_id, Hash): # 生成時間戳 time1 = int(time.time() * 1000) # 包含歌曲下載地址的url urls = 'https://wwwapi.kugou.com/yy/index.php?r=play/getdata&hash={}&dfid=0zlWqK0UWNFa0weUnX0hjlFa&mid=f79511e2e86914b99e351c42ba1f8bc7&platid=4&album_id={}&_={}'.format(h, a, time1) response1 = Tools(urls).json() audio_name = response1['data']['audio_name'].split('-')[1] play_url = response1['data']['play_url'] Save(audio_name, play_url)
以上就是Python實戰(zhàn)酷狗音樂反爬排行榜加密規(guī)則的詳細(xì)內(nèi)容,更多關(guān)于Python反爬酷狗音樂排行榜加密規(guī)則的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
pytorch中nn.Flatten()函數(shù)詳解及示例
nn.Flatten是一個類,而torch.flatten()則是一個函數(shù),下面這篇文章主要給大家介紹了關(guān)于pytorch中nn.Flatten()函數(shù)詳解及示例的相關(guān)資料,需要的朋友可以參考下2023-01-01回歸預(yù)測分析python數(shù)據(jù)化運營線性回歸總結(jié)
本文主要介紹了python數(shù)據(jù)化運營中的線性回歸一般應(yīng)用場景,常用方法,回歸實現(xiàn),回歸評估指標(biāo),效果可視化等,并采用了回歸預(yù)測分析的數(shù)據(jù)預(yù)測方法2021-08-082020最新pycharm漢化安裝(python工程獅親測有效)
這篇文章主要介紹了2020最新pycharm漢化安裝(python工程獅親測有效),文中通過圖文介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-04-04python運用pygame庫實現(xiàn)雙人彈球小游戲
這篇文章主要為大家詳細(xì)介紹了python運用pygame庫實現(xiàn)雙人彈球小游戲,文中示例代碼介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們可以參考一下2019-11-11python安裝oracle擴展及數(shù)據(jù)庫連接方法
這篇文章主要介紹了python安裝oracle擴展及數(shù)據(jù)庫連接方法,較為詳細(xì)的分析了Python下載oracle擴展及Windows、Linux環(huán)境下的安裝步驟、操作技巧及注意事項,需要的朋友可以參考下2017-02-02