python爬取酷狗音樂排行榜
本文為大家分享了python爬取酷狗音樂排行榜的具體代碼,供大家參考,具體內(nèi)容如下
#coding=utf-8 from pymongo import MongoClient import time import requests from lxml import etree client = MongoClient() #連接mongo hello = client.hello #連接數(shù)據(jù)庫 user = hello.song #連接表 headers = { 'User-Agent': 'Mozilla/5.0 (Android 6.0; Nexus 5 Build/MRA58N)\ AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Mobile Safari/537.36'} def get_info(url): ''' get源碼,encode,解析,xpath,保存 ''' response = requests.get(url, headers=headers) response = response.text.encode('utf-8') selector = etree.HTML(response) soup = selector.xpath('//*[@class="pc_temp_songlist "]/ul//li/a/text()') #保存到本地 # with open('aa.txt','a') as f: # for i in soup: # f.write(i.encode('utf-8') + '\n') #存入數(shù)據(jù)庫 for i in soup: user.insert({'song': i}) if __name__ == '__main__': urls = ['http://www.kugou.com/yy/rank/home/{}-8888.html?from=rank'.format(str(i)) for i in range(1, 24)] for url in urls: print(url) get_info(url)
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
Pytorch反向傳播中的細(xì)節(jié)-計算梯度時的默認(rèn)累加操作
這篇文章主要介紹了Pytorch反向傳播中的細(xì)節(jié)-計算梯度時的默認(rèn)累加操作,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2021-06-06python MultipartEncoder傳輸zip文件實例
這篇文章主要介紹了python MultipartEncoder傳輸zip文件實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-04-04Python常見數(shù)據(jù)類型轉(zhuǎn)換操作示例
這篇文章主要介紹了Python常見數(shù)據(jù)類型轉(zhuǎn)換操作,結(jié)合實例形式分析了Python針對列表、集合、元組、字典等數(shù)據(jù)類型轉(zhuǎn)換的相關(guān)操作技巧,需要的朋友可以參考下2019-05-05Python趣味挑戰(zhàn)之教你用pygame畫進(jìn)度條
pygame四種方法教會你畫進(jìn)度條,其實也不難,文中有非常詳細(xì)的代碼示例,對正在學(xué)習(xí)python的小伙伴們很有幫助,需要的朋友可以參考下2021-05-05對Python中的條件判斷、循環(huán)以及循環(huán)的終止方法詳解
今天小編就為大家分享一篇對Python中的條件判斷、循環(huán)以及循環(huán)的終止方法詳解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-02-02Pycharm創(chuàng)建python文件自動添加日期作者等信息(步驟詳解)
這篇文章主要介紹了Pycharm創(chuàng)建python文件自動添加日期作者等信息(步驟詳解),本文分步驟給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-02-02python?flask項目打包成docker鏡像發(fā)布的過程
這篇文章主要介紹了python?flask項目打包成docker鏡像發(fā)布,本文通過實例代碼給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2023-03-03