如何基于Python批量下載音樂
這篇文章主要介紹了如何基于Python批量下載音樂,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
音樂是生活的調(diào)劑品,目前很多的音樂只能播放不能下載。生為技術(shù)員的我們,怎么甘心呢?
知識點:
- requests
- 正則表達式
開發(fā)環(huán)境:
- 版 本:anaconda5.2.0(python3.6.5)
- 編輯器:pycharm
第三方庫:
- requests
- parsel
網(wǎng)頁分析
目標站點:http://music.taihe.com/search?key=%E9%99%88%E7%B2%92
分析音樂的真實地址
選擇一首歌 以陳粒的走馬為例
打開開發(fā)者工具,選擇network -> media -> 刷新網(wǎng)頁就能獲取到音樂的真實地址
但是得到的地址在查看源碼中是讀取不到的,肯定是百度音樂對其進行了隱藏。這種時候一般會有兩種情況。第一種是使用了 JavaScript 對請求連接進行了拼接或加密,第二種是數(shù)據(jù)被隱藏了。由于我們不清楚是出現(xiàn)了那種情況。所以我們只能慢慢的去分析請求的數(shù)據(jù)。
經(jīng)過分析我們可以看到真實的音樂地址是存在于這個API里面http://musicapi.taihe.com/v1/restserver/ting?method=baidu.ting.song.playAAC&format=jsonp&callback=jQuery17206453751179783578_1544942124991&songid=243093242&from=web&_=1544942128336
并且我們請求這個 API 返回的是一個 json 數(shù)據(jù)(也就是python的字典數(shù)據(jù)類型)。只要我們使用字典的規(guī)則就能將我們的所有數(shù)據(jù)給提取到。
url拼接 獲取所有數(shù)據(jù)
前面我們得到了音樂的真實地址,接下來我們就是分析真實地址的 url ,以期待得到下載所有音樂的訣竅。
仔細分析一下 url 就可以發(fā)現(xiàn),?后面的from參數(shù)與_即使不存在也不影響數(shù)據(jù)的請求。
并且后面的參數(shù)中的songid其實就是歌曲的唯一id,from參數(shù)其實就是表明從哪個平臺過來的
所以等一下我們下載音樂時,只要批量獲取到歌曲的songid就能將所有的歌曲給全部下載下來了。
批量獲取singid
使用開發(fā)者工具,查看網(wǎng)頁源碼就能查看到songid的位置,如果我們分析一個歌手頁面的url你會發(fā)現(xiàn)同樣可以構(gòu)造。
到此,整個網(wǎng)頁分析就結(jié)束了。
實現(xiàn)效果
完整代碼
import re import requests def get_songid(): """獲取音樂的songid""" url = 'http://music.taihe.com/artist/2517' response = requests.get(url=url) html = response.text sids = re.findall(r'href="/song/(\d+)" rel="external nofollow" ', html) return sids def get_music_url(songid): """獲取下載鏈接""" api_url = f'http://musicapi.taihe.com/v1/restserver/ting?method=baidu.ting.song.playAAC&format=jsonp&songid={songid}&from=web' response = requests.get(api_url.format(songid=songid)) data = response.json() print(data) try: music_name = data['songinfo']['title'] music_url = data['bitrate']['file_link'] return music_name, music_url except Exception as e: print(e) def download_music(music_name, music_url): """下載音樂""" response = requests.get(music_url) content = response.content save_file(music_name+'.mp3', content) def save_file(filename, content): """保存音樂""" with open(file=filename, mode="wb") as f: f.write(content) if __name__ == "__main__": for song_id in get_songid(): music_name, music_url = get_music_url(song_id) download_music(music_name, music_url)
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
Python關(guān)于excel和shp的使用在matplotlib
今天小編就為大家分享一篇關(guān)于Python關(guān)于excel和shp的使用在matplotlib,小編覺得內(nèi)容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧2019-01-01python中使用Celery容聯(lián)云異步發(fā)送驗證碼功能
Celery 是一個 基于python開發(fā)的分布式異步消息任務(wù)隊列,通過它可以輕松的實現(xiàn)任務(wù)的異步處理,本文重點給大家介紹使用Celery容聯(lián)云異步發(fā)送驗證碼功能,感興趣的朋友一起看看吧2021-09-09Ubuntu下使用python讀取doc和docx文檔的內(nèi)容方法
今天小編就為大家分享一篇Ubuntu下使用python讀取doc和docx文檔的內(nèi)容方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-05-05python檢測lvs real server狀態(tài)
這篇文章主要介紹了用python檢測lvs real server狀態(tài)的示例,大家參考使用吧2014-01-01