python爬蟲(chóng)爬取bilibili網(wǎng)頁(yè)基本內(nèi)容
用爬蟲(chóng)爬取bilibili網(wǎng)站排行榜游戲類(lèi)的所有名稱(chēng)及鏈接:

導(dǎo)入requests、BeautifulSoup
import requests from bs4 import BeautifulSoup
然后我們需要插入網(wǎng)站鏈接并且要解析網(wǎng)站并打印出來(lái):
e = requests.get('https://www.bilibili.com/v/popular/rank/game') ? #當(dāng)前網(wǎng)站鏈接
html = e.content
soup = BeautifulSoup(html,'html.parser') ? ?#解析html
print(soup)我們可以看到密密麻麻的代碼函數(shù),但不太簡(jiǎn)潔明了,我們?nèi)?yōu)化一下

繼續(xù)插入如下代碼這個(gè)代碼是可以爬取我們想要的類(lèi),可以更簡(jiǎn)介的簡(jiǎn)化代碼
div_people_list = soup.find('ul', attrs={'class': 'rank-list'}) ?#爬取ul類(lèi)class為rank-list下的數(shù)據(jù)
可以看到還是不夠簡(jiǎn)介:

繼續(xù)插入如下代碼:
ca_s = div_people_list.find_all('a', attrs={'class': 'title'}) ? #爬取a類(lèi)class為title下的數(shù)據(jù)
可以看到鏈接及主題都提取出來(lái)了,但還是有瑕疵:

我們加入這行代碼挨個(gè)打印并提取標(biāo)題及鏈接,由于鏈接提取出來(lái)的是//www.bilibili.com/video/BV1yZ4y1D7ef
前面沒(méi)有http:點(diǎn)擊進(jìn)去會(huì)出現(xiàn)錯(cuò)誤,所有我們需要在前面加入http:進(jìn)行連接在一起打印
for t in ca_s:
? ? url = t['href']
? ? name = t.get_text()
? ? print(name+'\t點(diǎn)擊鏈接直接觀(guān)看鏈接:'+f'http:{url}')可以看到我們的標(biāo)題及連接都爬取出來(lái)了

完整代碼:
import requests
from bs4 import BeautifulSoup
?
e = requests.get('https://www.bilibili.com/v/popular/rank/game') ? #當(dāng)前網(wǎng)站鏈接
html = e.content
soup = BeautifulSoup(html,'html.parser') ? ?#解析html
div_people_list = soup.find('ul', attrs={'class': 'rank-list'}) ?#爬取ul類(lèi)class為rank-list下的數(shù)據(jù)
ca_s = div_people_list.find_all('a', attrs={'class': 'title'}) ? #爬取a類(lèi)class為title下的數(shù)據(jù)
?
#挨個(gè)傳輸?shù)絫,然后打印數(shù)據(jù)
for t in ca_s:
? ? url = t['href']
? ? name = t.get_text()
? ? print(name+'\t點(diǎn)擊鏈接直接觀(guān)看鏈接:'+f'http:{url}')到此這篇關(guān)于python爬蟲(chóng)爬取bilibili網(wǎng)頁(yè)基本內(nèi)容的文章就介紹到這了,更多相關(guān)python爬取bilibili網(wǎng)頁(yè)內(nèi)容內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- python爬蟲(chóng)爬取指定內(nèi)容的解決方法
- Python爬蟲(chóng)爬取百度搜索內(nèi)容代碼實(shí)例
- python爬蟲(chóng)開(kāi)發(fā)之使用python爬蟲(chóng)庫(kù)requests,urllib與今日頭條搜索功能爬取搜索內(nèi)容實(shí)例
- python爬取內(nèi)容存入Excel實(shí)例
- Python爬蟲(chóng)爬取新浪微博內(nèi)容示例【基于代理IP】
- python爬取網(wǎng)頁(yè)內(nèi)容轉(zhuǎn)換為PDF文件
- Python下使用Scrapy爬取網(wǎng)頁(yè)內(nèi)容的實(shí)例
- 基于Python實(shí)現(xiàn)web網(wǎng)頁(yè)內(nèi)容爬取的方法
相關(guān)文章
Python實(shí)現(xiàn)打磚塊小游戲代碼實(shí)例
這篇文章主要介紹了Python打磚塊小游戲,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-05-05
Python中實(shí)現(xiàn)常量(Const)功能
這篇文章主要介紹了Python中實(shí)現(xiàn)常量(Const)功能,python語(yǔ)言本身沒(méi)有提供const,本文使用一個(gè)類(lèi)來(lái)實(shí)現(xiàn)常量定義功能,并介紹了使用方法,需要的朋友可以參考下2015-01-01
python進(jìn)階從青銅到王者一定會(huì)用上的Python技巧
這篇文章主要介紹了python進(jìn)階從青銅到王者一定會(huì)用上的Python技巧,本文通過(guò)幾個(gè)Python的小案例,讓大家體會(huì)其中蘊(yùn)含的技巧一起來(lái)圍觀(guān)吧2021-09-09
Python利用prettytable庫(kù)輸出好看的表格
prettytable庫(kù)就是這么一個(gè)工具,prettytable可以打印出美觀(guān)的表格,并且對(duì)中文支持相當(dāng)好。本文將介紹如何通過(guò)prettytable輸出好看的表格,需要的可以參考一下2022-01-01
Python深度學(xué)習(xí)之FastText實(shí)現(xiàn)文本分類(lèi)詳解
FastText是一種典型的深度學(xué)習(xí)詞向量的表示方法,它非常簡(jiǎn)單通過(guò)Embedding層將單詞映射到稠密空間,然后將句子中所有的單詞在Embedding空間中進(jìn)行平均,進(jìn)而完成分類(lèi)操作2022-09-09
python自動(dòng)化腳本安裝指定版本python環(huán)境詳解
這篇文章主要為大家詳細(xì)介紹了python自動(dòng)化腳本安裝指定版本python環(huán)境的相關(guān)方法,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2017-09-09
Windows+Anaconda3+PyTorch+PyCharm的安裝教程圖文詳解
這篇文章主要介紹了Windows+Anaconda3+PyTorch+PyCharm的安裝教程,本文通過(guò)圖文并茂的形式給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-04-04

