python中第三方庫lxml庫的最新詳細(xì)安裝步驟
方法一:
win+r打開cmd,直接輸入pip install lxml。
(最簡(jiǎn)單的辦法,但是有一大堆因素導(dǎo)致無法安裝成功,博主就是,嗚嗚嗚)
方法二:
1.win+r打開cmd,輸入pip install wheel
,先安裝wheel庫了才能安裝.whl文件。
2.確定電腦安裝的python版本,在lxml官方網(wǎng)站https://pypi.org/project/lxml/#files里尋找對(duì)應(yīng)的版本進(jìn)行下載
以本人為例,我電腦的python版本是3.11,64位
所以選擇lxml-4.9.3-cp311-cp311-win_amd64.whl下載
3.在電腦的python文件夾內(nèi)創(chuàng)建一個(gè)lxml文件夾,將下載好的whl放在該目錄下,在cmd中cd跳轉(zhuǎn)至該目錄,運(yùn)行pip install lxml-4.9.3-cp311-cp311-win_amd64.whl,即可安裝成功
lxml使用流程
lxml 庫提供了一個(gè) etree 模塊,該模塊專門用來解析 HTML/XML 文檔,下面我們簡(jiǎn)單介紹一下 lxml 庫的使用流程,如下所示:
1) 導(dǎo)入模塊
from lxml import etree
2) 創(chuàng)建解析對(duì)象
調(diào)用 etree 模塊的 HTML() 方法來創(chuàng)建 HTML 解析對(duì)象。如下所示:
parse_html = etree.HTML(html)
HTML() 方法能夠?qū)?HTML 標(biāo)簽字符串解析為 HTML 文件,該方法可以自動(dòng)修正 HTML 文本。示例如下:
from lxml import etree html_str = ''' <div> <ul> <li class="item1"><a href="link1.html">Python</a></li> <li class="item2"><a href="link2.html">Java</a></li> <li class="site1"><a href="c.biancheng.net">C語言中文網(wǎng)</a> <li class="site2"><a href="www.baidu.com">百度</a></li> <li class="site3"><a href="www.jd.com">京東</a></li> </ul> </div> ''' html = etree.HTML(html_str) # tostring()將標(biāo)簽元素轉(zhuǎn)換為字符串輸出,注意:result為字節(jié)類型 result = etree.tostring(html) print(result.decode('utf-8'))
輸出結(jié)果如下:
<html><body><div> <ul> <li class="item1"><a href="link1.html">Python</a></li> <li class="item2"><a href="link2.html">Java</a></li> <li class="site1"><a href="c.biancheng.net">C语言中文网</a></li> <li class="site2"><a href="www.baidu.com">百度</a></li> <li class="site3"><a href="www.jd.com">京东</a> </li></ul> </div> </body></html>
上述 HTML 字符串存在缺少標(biāo)簽的情況,比如“C語言中文網(wǎng)”缺少一個(gè) 閉合標(biāo)簽,當(dāng)使用了 HTML() 方法后,會(huì)將其自動(dòng)轉(zhuǎn)換為符合規(guī)范的 HTML 文檔格式。
3) 調(diào)用xpath表達(dá)式
最后使用第二步創(chuàng)建的解析對(duì)象調(diào)用 xpath() 方法,完成數(shù)據(jù)的提取,如下所示:
r_list = parse_html.xpath('xpath表達(dá)式')
總結(jié)
到此這篇關(guān)于python中第三方庫lxml庫的最新詳細(xì)安裝步驟的文章就介紹到這了,更多相關(guān)python第三方庫lxml庫安裝內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python開發(fā)中range()函數(shù)用法實(shí)例分析
這篇文章主要介紹了python開發(fā)中range()函數(shù)用法,以實(shí)例形式較為詳細(xì)的分析了Python中range()函數(shù)遍歷列表的相關(guān)技巧,需要的朋友可以參考下2015-11-11Python入門之實(shí)例方法、類方法和靜態(tài)方法的區(qū)別講解
這篇文章主要介紹了Python入門之實(shí)例方法、類方法和靜態(tài)方法的區(qū)別講解,實(shí)例方法是在創(chuàng)建了類的實(shí)例之后才能被調(diào)用的方法,類方法是在不需要?jiǎng)?chuàng)建類的實(shí)例的情況下就可以調(diào)用的方法,最后,靜態(tài)方法是與類和類的實(shí)例都沒有綁定關(guān)系的方法,需要的朋友可以參考下2023-10-10學(xué)生如何免費(fèi)使用Pycharm專業(yè)版學(xué)生認(rèn)證教程
這篇文章主要介紹了學(xué)生如何免費(fèi)使用Pycharm專業(yè)版,學(xué)生認(rèn)證教程,有了這個(gè)教程在校期間就可以免費(fèi)使用Pycharm,簡(jiǎn)直是學(xué)生黨的福音,快來一起看看吧2023-03-03如何解決Python中ModuleNotFoundError錯(cuò)誤
使用模塊時(shí),了解它們的工作方式以及如何將它們導(dǎo)入我們的代碼非常重要,?如果沒有這種理解或錯(cuò)誤,我們可能會(huì)遇到不同的錯(cuò)誤,本文我們就來討論一下在Python中解決?ModuleNotFoundError?的方法,希望對(duì)大家有所幫助2023-12-12基于Python制作一個(gè)端午節(jié)相關(guān)的小游戲
端午節(jié)快樂,今天我將為大家?guī)硪黄嘘P(guān)端午節(jié)的編程文章,希望能夠?yàn)榇蠹耀I(xiàn)上一份小小的驚喜,我們將會(huì)使用Python來實(shí)現(xiàn)一個(gè)與端午粽子相關(guān)的小應(yīng)用程序,在本文中,我將會(huì)介紹如何用Python代碼制做一個(gè)“粽子拆解器”,感興趣的小伙伴歡迎閱讀2023-06-06Python機(jī)器學(xué)習(xí)庫scikit-learn入門開發(fā)示例
scikit-learn是一個(gè)開源Python語言機(jī)器學(xué)習(xí)工具包,它涵蓋了幾乎所有主流機(jī)器學(xué)習(xí)算法的實(shí)現(xiàn),并且提供了一致的調(diào)用接口。它基于Numpy和scipy等Python數(shù)值計(jì)算庫,提供了高效的算法實(shí)現(xiàn)2022-07-07深入理解Python內(nèi)置函數(shù)map filter reduce及與列表推導(dǎo)式對(duì)比
這篇文章主要為大家介紹了Python內(nèi)置函數(shù)map filter reduce及與列表推導(dǎo)式對(duì)比方法詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-06-06一個(gè)基于flask的web應(yīng)用誕生 用戶注冊(cè)功能開發(fā)(5)
一個(gè)基于flask的web應(yīng)用誕生第五篇,這篇文章主要介紹了用戶注冊(cè)功能開發(fā),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2017-04-04