欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python lxml庫的簡單介紹及基本使用講解

 更新時間:2020年12月22日 14:59:21   作者:pinuscembra  
lxml是XML和HTML的解析器,其主要功能是解析和提取XML和HTML中的數(shù)據(jù),本文重點給大家介紹Python lxml庫的簡單介紹及基本使用講解,感興趣的朋友跟隨小編一起看看吧

1.lxml庫介紹

lxml是XML和HTML的解析器,其主要功能是解析和提取XML和HTML中的數(shù)據(jù);lxml和正則一樣,也是用C語言實現(xiàn)的,是一款高性能的python HTML、XML解析器,也可以利用XPath語法,來定位特定的元素及節(jié)點信息

HTML是超文本標記語言,主要用于顯示數(shù)據(jù),他的焦點是數(shù)據(jù)的外觀
XML是可擴展標記語言,主要用于傳輸和存儲數(shù)據(jù),他的焦點是數(shù)據(jù)的內(nèi)容

2.安裝lxml方法

方法1:
在cmd運行窗口中輸入:pip install lxml

在這里插入圖片描述

方法2:
在Pycharm中下載
File–Setting–Project–Project Interpreter–點擊右上角的“+”—
第1步

在這里插入圖片描述

第2步

在這里插入圖片描述

第3步

在這里插入圖片描述

方法3:
進入這個網(wǎng)站進行下載:https://lxml.de/index.html

在這里插入圖片描述

3.基本使用

我們可以利用他解析HTML代碼,并且在解析HTML代碼的時候,如果HTML代碼不規(guī)范或者不完整,lxml解析器會自動修復或補全代碼,從而提高效率

實例1:
解析HTML代碼塊

#提取html中的數(shù)據(jù)
from lxml import etree

text = '''
<html>
    <div class="clearfix">
    <div class="nav_com">
     <ul>
       <li class="active"><a href="/" rel="external nofollow" >推薦</a></li>
       <li class=""><a href="/nav/python" rel="external nofollow" >Python</a></li>
       <li class=""><a href="/nav/java" rel="external nofollow" >Java</a></li>
       <li class=""><a href="/nav/web" rel="external nofollow" >前端</a></li>
       <li class=""><a href="/nav/arch" rel="external nofollow" >架構(gòu)</a></li>
       <li class=""><a href="/nav/db" rel="external nofollow" >數(shù)據(jù)庫</a></li>
       <li class=""><a href="/nav/5g" rel="external nofollow" >5G</a></li>
       <li class=""><a href="/nav/game" rel="external nofollow" >游戲開發(fā)</a></li>
       <li class=""><a href="/nav/mobile" rel="external nofollow" >移動開發(fā)</a></li>
       <li class=""><a href="/nav/ops" rel="external nofollow" >運維</a></li>
     </ul>
    </div>
    </div>
</html>>
</html>>

'''
#將字符串解析為html文檔
html = etree.HTML(text)
#print(html)
#將字符串序列化為html
result = etree.tostring(html).decode('utf-8')
print(result)

實例2:
讀取并解析html文件

#將html文件進行解析
from lxml import etree
#將html文件進行讀取
html = etree.parse('data.html')
#將html內(nèi)容序列化
result = etree.tostring(html).decode('utf-8')
print(result)

到此這篇關(guān)于Python lxml庫的簡單介紹及基本使用講解的文章就介紹到這了,更多相關(guān)Python lxml庫使用內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • python使用wxpython開發(fā)簡單記事本的方法

    python使用wxpython開發(fā)簡單記事本的方法

    這篇文章主要介紹了python使用wxpython開發(fā)簡單記事本的方法,涉及Python使用wxPython實現(xiàn)桌面圖形應用程序的技巧,需要的朋友可以參考下
    2015-05-05
  • Python中的多行注釋文檔編寫風格匯總

    Python中的多行注釋文檔編寫風格匯總

    在Python中利用多行注釋編寫小型的程序文檔說明非常方便,而約定俗成的格式也多種多樣,這里我們就進行一下最常見的Python中的多行注釋文檔編寫風格匯總:
    2016-06-06
  • OpenCV半小時掌握基本操作之圖像梯度

    OpenCV半小時掌握基本操作之圖像梯度

    這篇文章主要介紹了OpenCV基本操作之圖像梯度,本文給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2021-09-09
  • tensorflow 中對數(shù)組元素的操作方法

    tensorflow 中對數(shù)組元素的操作方法

    今天小編就為大家分享一篇tensorflow 中對數(shù)組元素的操作方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-07-07
  • Python可視化繪制圖表的教程詳解

    Python可視化繪制圖表的教程詳解

    python?有許多可視化工具,但本文主要為大家介紹一下Matplotlib。Matplotlib是一種2D的繪圖庫,它可以支持硬拷貝和跨系統(tǒng)的交互,感興趣的可以了解一下
    2022-10-10
  • pandas如何統(tǒng)計某一列或某一行的缺失值數(shù)目

    pandas如何統(tǒng)計某一列或某一行的缺失值數(shù)目

    這篇文章主要介紹了pandas如何統(tǒng)計某一列或某一行的缺失值數(shù)目,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2022-05-05
  • 利用Python讀取文件的四種不同方法比對

    利用Python讀取文件的四種不同方法比對

    Python的文本處理是經(jīng)常碰到的一個問題,下面這篇文章主要給大家介紹了關(guān)于Python讀取文件的幾種不同方法比對的相關(guān)資料,文中給出了詳細的示例代碼供大家理解和學習,需要的朋友們下面來一起看看吧。
    2017-05-05
  • Python+OpenCV實現(xiàn)實時眼動追蹤的示例代碼

    Python+OpenCV實現(xiàn)實時眼動追蹤的示例代碼

    這篇文章主要介紹了Python+OpenCV實現(xiàn)實時眼動追蹤的示例代碼,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2019-11-11
  • python xml解析實例詳解

    python xml解析實例詳解

    這篇文章主要介紹了python xml解析實例詳解的相關(guān)資料,這里舉例說明如何實現(xiàn),需要的朋友可以參考下
    2016-11-11
  • Python CleverCSV輕松處理CSV文件指南

    Python CleverCSV輕松處理CSV文件指南

    這篇文章主要為大家介紹了Python CleverCSV輕松處理CSV文件全面指南,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2024-01-01

最新評論