腳本之家服務器常用軟件

快捷導航

淺談Python中的bs4基礎

更新時間：2018年10月21日 11:23:04 作者：回憶不說話

今天小編就為大家分享一篇關于Python中的bs4基礎，小編覺得內容挺不錯的，現(xiàn)在分享給大家，具有很好的參考價值，需要的朋友一起跟隨小編來看看吧

安裝

在命令提示符框中直接輸入pip install beautifulsoup4

介紹

beautifulsoup是python的一個第三方庫，和xpath一樣，都是用來解析html數據的。

引入

from bs4 import BeautifulSoup

使用

將一段文檔傳入BeautifulSoup的構造方法，就能得到一個文檔的對象。

bs = BeautifulSoup(open('index.html',encoding='utf-8'),'lxml')
print(bs)

注意：這樣上傳文檔的話，BeautifulSoup里面需要兩個參數。一個為open方法，一個是固定寫法，也就是解析器。

open方法里面也同樣需要兩個參數，一個是想要解析的數據，另一個為設置編碼的格式。

（1）獲取網頁中的title標簽

print(bs.title)

（2）獲取head標簽及標簽內部的所有其他標簽

print(bs.head)

（3）獲取當中的第一個a標簽

print(bs.a)

注意：獲取文檔當中所有的xx當中第一個xx或者第一個xx里面的內容。都可以用bs.xx來獲取

（4）獲取指定標簽的所有屬性

print(bs.a.attrs)

（5）獲取標簽的屬性

print(bs.a['href'])

（6）獲取標簽的文本內容。

print(bs.a.string)

注意：string獲取的文本指的是本標簽的文本，不包含子標簽的文本

（7）contents能夠獲取指定標簽下面的所有內容。

print(bs.body.contents)

（8）獲取所有內容當中指定索引的內容

print(bs.div.contents[3])

（9）通過id和類名來找標簽

print(bs.find(id='kw')) print(bs.find(class_='shopping'))

注意：id是唯一的，通過id來找，只能找到一個，所以用find，而class不是唯一的，通過class來找，就有可能找到多個。

（10）select選擇指定的標簽

print(bs.select('title')) print(bs.select('a'))

在bs4中，小數點“.”表示類名，#表示id

print(bs.select('.first')) print(bs.select('#kw')) print(bs.select('div.now'))

總結

以上就是這篇文章的全部內容了，希望本文的內容對大家的學習或者工作具有一定的參考學習價值，謝謝大家對腳本之家的支持。如果你想了解更多相關內容請查看下面相關鏈接

您可能感興趣的文章:

python
bs4

vscode+PyQt5安裝詳解步驟
這篇文章主要介紹了vscode+PyQt5安裝詳解步驟,文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2020-08-08
Python面向對象程序設計示例小結
這篇文章主要介紹了Python面向對象程序設計,結合實例形式總結分析了Python面向對象程序設計中比較常見的類定義、實例化、繼承、私有變量等相關使用技巧與操作注意事項,需要的朋友可以參考下
2019-01-01
用xpath獲取指定標簽下的所有text的實例
今天小編就為大家分享一篇用xpath獲取指定標簽下的所有text的實例，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2019-01-01
Python檢測字符串中是否包含某字符集合中的字符
這篇文章主要介紹了Python檢測字符串中是否包含某字符集合中的字符,需要的朋友可以參考下
2015-05-05
深入理解NumPy簡明教程---數組1
這篇文章主要介紹了深入理解NumPy簡明教程（二、數組1）,NumPy數組是一個多維數組對象,具有一定的參考價值，感興趣的小伙伴們可以參考一下。
2016-12-12
Python永久配置國內鏡像源安裝再也不用擔心卡頓
這篇文章主要為大家介紹了Python如何永久配置國內鏡像源，從此安裝再也不用擔心卡頓，有需要的朋友可以借鑒參考下，希望能夠有所幫助
2021-10-10
PyTorch使用cpu加載模型運算方式
今天小編就為大家分享一篇PyTorch使用cpu加載模型運算方式，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-01-01
聊聊python中的循環(huán)遍歷
這篇文章主要介紹了python中的循環(huán)遍歷的相關資料，幫助大家更好的理解和學習python，感興趣的朋友可以了解下
2020-09-09
Python的爬蟲包Beautiful Soup中用正則表達式來搜索
這篇文章主要介紹了Python的爬蟲包Beautiful Soup中用正則表達式來搜索的技巧,包括使用正則表達式去搜索多種可能的關鍵字以及查找屬性值未知的標簽等,需要的朋友可以參考下
2016-01-01
機器學習10大經典算法詳解
這篇文章主要為大家詳細介紹了機器學習10大經典算法，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2017-12-12

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

淺談Python中的bs4基礎

相關文章

最新評論

大家感興趣的內容

最近更新的內容

常用在線小工具