Python獲取百度熱搜的完整代碼
更新時(shí)間:2021年04月07日 14:34:00 作者:國家一級(jí)保護(hù)咸魚
這篇文章主要介紹了Python獲取百度熱搜的完整代碼,代碼簡單易懂,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
好久沒寫了,就把上課做的一個(gè)小東西拿出來分享一下吧。
百度網(wǎng)頁截圖如下 ↓↓↓
程序運(yùn)行輸出結(jié)果截圖 ↓↓↓
上代碼 ↓↓↓
from lxml import etree from lxml import html import requests headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.63 Safari/537.36'} page = requests.get("https://www.baidu.com",headers=headers) html = page.text #print(source1) # 從字符串解析 element = etree.HTML(html) # 元素列表,獲取的方式列出了如下兩種 # ps = element.xpath('//*[@id="hotsearch-content-wrapper"]/li/a/span[2]') ps = element.xpath('//*[@class="title-content-title"]') #熱搜文本內(nèi)容 text = [] if len(ps) > 0: for p in ps: #輸出節(jié)點(diǎn)的文本 text1 = p.text text.append(text1) else: print("空") x = element.xpath('//*[@class="s-hotsearch-content"]/li') #熱搜文本對應(yīng)的排名 index = [] for x1 in x: #獲取節(jié)點(diǎn)的屬性 index1 = x1.get("data-index") index.append(index1) print(text) print(index) #定義一個(gè)對文本和排名進(jìn)行匹配的函數(shù),返回一個(gè)字典型數(shù)據(jù) def PP(index_array,text_array): x = {} i = 0 for index_a in index_array: #index_a = int(index_a) x[index_a] = text_array[i] i = i + 1 return x re_text = PP(index,text) #對字典性數(shù)據(jù)按key進(jìn)行排序,即key=lambda re:re[0],排序完成后再轉(zhuǎn)換為字典型數(shù)據(jù) last_text = dict(sorted(re_text.items(),key=lambda re:re[0]))
到此這篇關(guān)于Python獲取百度熱搜的完整代碼的文章就介紹到這了,更多相關(guān)Python 百度熱搜內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
您可能感興趣的文章:
相關(guān)文章
Python3.4學(xué)習(xí)筆記之列表、數(shù)組操作示例
這篇文章主要介紹了Python3.4列表、數(shù)組操作,結(jié)合實(shí)例形式分析了Python3.4列表的創(chuàng)建、元素追加、刪除、排序等相關(guān)操作技巧,需要的朋友可以參考下2019-03-03Python 經(jīng)典貪心算法之Prim算法案例詳解
這篇文章主要介紹了Python 經(jīng)典貪心算法之Prim算法案例詳解,本篇文章通過簡要的案例,講解了該項(xiàng)技術(shù)的了解與使用,以下就是詳細(xì)內(nèi)容,需要的朋友可以參考下2021-09-09python 中值濾波,椒鹽去噪,圖片增強(qiáng)實(shí)例
今天小編就為大家分享一篇python 中值濾波,椒鹽去噪,圖片增強(qiáng)實(shí)例,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-12-12Python多線程編程(二):啟動(dòng)線程的兩種方法
這篇文章主要介紹了Python多線程編程(一):啟動(dòng)線程的兩種方法,本文講解了將函數(shù)傳遞進(jìn)Thread對象、繼承自threading.Thread類兩種方法,需要的朋友可以參考下2015-04-04