欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

15行Python代碼實現(xiàn)網(wǎng)易云熱門歌單實例教程

 更新時間:2019年03月10日 10:20:51   作者:上海小胖  
這篇文章主要給大家介紹了關于利用15行Python代碼實現(xiàn)網(wǎng)易云熱門歌單的相關資料,文中通過示例代碼介紹的非常詳細,對大家的學習或者使用python具有一定的參考學習價值,需要的朋友們下面來一起學習學習吧

0. 引言

馬上314情人節(jié)就要來了,是否需要一首歌來撫慰你,受傷或躁動的心靈。來吧,今天教你用15行代碼搞定熱門歌單。學起來并聽起來吧。

本文使用的是Selenium模塊,它是一個自動化測試工具,利用它我們可以驅(qū)動瀏覽器執(zhí)行特定的動作,如點擊、下拉等等操作,對于一些 JavaScript 渲染的頁面來說,此種抓取方式非常有效。另外采用了Chrome瀏覽器配合Selenium工作。

下面話不多說了,來一起看看詳細的介紹吧

1. 環(huán)境

操作系統(tǒng):Windows

Python版本:3.7.2

2. 準備工作

a. 若你的環(huán)境中沒有selenium模塊,直接使用pip安裝即可。

pip install selenium

b. 打開谷歌瀏覽器,檢查Chrome的版本:在瀏覽器地址中輸入 chrome://settings/help 回車即可看到。

c. 打開ChromeDriver 的官方網(wǎng)站:
https://sites.google.com/a/ch...
尋找與你當前瀏覽器版本相對應的ChromeDriver下載。

d. 選擇你自己的操作系統(tǒng)類型進行下載即可。

e. 以Windows為例,下載結(jié)束后,將ChromeDriver 放置在python安裝目錄下的Scripts文件夾即可。

準備工作完成,代碼寫起來吧~

3. 迷你爬蟲的實現(xiàn)

我們這次的目標是爬取熱門歌單,比如網(wǎng)易云音樂中播放量大于1000萬的歌單信息(歌單名稱、鏈接)。

a. 我們先來打開網(wǎng)易云的歌單第一頁:
https://music.163.com/#/disco...

b. 使用Chrome的開發(fā)者工具<F12>進行分析。

我們想要拿的信息全在這里:

  • msk,封面[mask]:有歌單的名稱及鏈接
  • nb,播放數(shù)[number broadcast]:135萬

c. 我們還需要遍歷所有的頁,使用工具繼續(xù)分析,找到“下一頁”的URL。

d. 切換至最后一頁,拿到最后一頁的URL。

e. 等我們爬取完所有符合的歌單信息后,將其保存在本地。

f. 全部工作結(jié)束,最后再通過下面的偽代碼回顧下整體思路。

g. 爬取的效果如下:

4. 總結(jié)

本文旨在安撫你因情人節(jié)受傷的小心靈,同時帶你入個爬蟲的門,感受下python的強大。

好了,以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對腳本之家的支持。

相關文章

最新評論