欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python處理html轉(zhuǎn)義字符的方法詳解

 更新時間:2016年07月01日 11:05:54   作者:holybin  
這篇文章主要介紹了python處理html轉(zhuǎn)義字符的方法,結(jié)合實(shí)例形式較為詳細(xì)的分析了Python針對常見HTML轉(zhuǎn)義字符處理技巧,具有一定參考借鑒價值,需要的朋友可以參考下

本文實(shí)例講述了python處理html轉(zhuǎn)義字符的方法。分享給大家供大家參考,具體如下:

最近在用Python處理網(wǎng)頁數(shù)據(jù)時,經(jīng)常遇到一些html轉(zhuǎn)義字符(也叫html字符實(shí)體),例如<> 等。字符實(shí)體一般是為了表示網(wǎng)頁中的預(yù)留字符,比如>用>表示,防止被瀏覽器認(rèn)為是標(biāo)簽,具體參考w3school的HTML 字符實(shí)體。雖然很有用,但是它們會極度影響對于網(wǎng)頁數(shù)據(jù)的解析。為了處理這些轉(zhuǎn)義字符,有如下解決方案:

1、使用HTMLParser處理

import HTMLParser
html_cont = " asdfg>123<"
html_parser = HTMLParser.HTMLParser()
new_cont = html_parser.unescape(html_cont)
print new_cont #new_cont = " asdfg>123<"

轉(zhuǎn)換回去(只是空格轉(zhuǎn)不回去了):

import cgi
new_cont = cgi.escape(new_cont)
print new_cont #new_cont = " asdfg&gt;123&lt;"

2、直接挨個替換

html_cont = "&nbsp;asdfg&gt;123&lt;"
new_cont = new_cont.replace('&nbsp;', ' ')
print new_cont #new_cont = " asdfg&gt;123&lt;"
new_cont = new_cont.replace('&gt;', '>')
print new_cont #new_cont = " asdfg>123&lt;"
new_cont = new_cont.replace('&lt;', '<')
print new_cont #new_cont = " asdfg>123<"

不知道還有沒有更好的辦法。

另外stackoverflow上給出了在xml中處理轉(zhuǎn)義字符的解答:python - What's the best way to handle &nbsp;-like entities in XML documents with lxml? - Stack Overflow。

更多關(guān)于Python相關(guān)內(nèi)容感興趣的讀者可查看本站專題:《Python編碼操作技巧總結(jié)》、《Python圖片操作技巧總結(jié)》、《Python數(shù)據(jù)結(jié)構(gòu)與算法教程》、《Python Socket編程技巧總結(jié)》、《Python函數(shù)使用技巧總結(jié)》、《Python字符串操作技巧匯總》、《Python入門與進(jìn)階經(jīng)典教程》及《Python文件與目錄操作技巧匯總

希望本文所述對大家Python程序設(shè)計(jì)有所幫助。

相關(guān)文章

  • Python Requests訪問網(wǎng)絡(luò)更方便

    Python Requests訪問網(wǎng)絡(luò)更方便

    這篇文章主要介紹了使用Python Requests訪問網(wǎng)絡(luò),Python Requests 是一個非常強(qiáng)大的 HTTP 客戶端庫,用于發(fā)送 HTTP 請求,獲取響應(yīng)等操作,通過這個庫,你可以輕松地與 Web 服務(wù)進(jìn)行交互,實(shí)現(xiàn)各種網(wǎng)絡(luò)請求
    2024-01-01
  • 如何使用Python?繪制瀑布圖

    如何使用Python?繪制瀑布圖

    這篇文章主要介紹了如何使用Python?繪制瀑布圖,我們一起了解瀑布圖的重要性,以及如何使用不同的繪圖庫繪制瀑布圖。瀑布圖是一種二維圖表,專門用于了解隨著時間或多個步驟或變量的增量正負(fù)變化的影響,下文更多詳細(xì)內(nèi)容需要的小伙伴可以參考一下
    2022-05-05
  • 深入學(xué)習(xí)Python+Opencv常用四種圖像處理操作

    深入學(xué)習(xí)Python+Opencv常用四種圖像處理操作

    本文主要介紹了深入學(xué)習(xí)Pytho+OpenCV實(shí)現(xiàn)的基本圖像處理操作,例如:改變圖像大小,圖片色彩轉(zhuǎn)換,圖片模糊等,代碼具有一定的學(xué)習(xí)價值,感興趣的小伙伴可以關(guān)注一下
    2021-11-11
  • Python小工具之消耗系統(tǒng)指定大小內(nèi)存的方法

    Python小工具之消耗系統(tǒng)指定大小內(nèi)存的方法

    今天小編就為大家分享一篇Python小工具之消耗系統(tǒng)指定大小內(nèi)存的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-12-12
  • Django-xadmin后臺導(dǎo)入json數(shù)據(jù)及后臺顯示信息圖標(biāo)和主題更改方式

    Django-xadmin后臺導(dǎo)入json數(shù)據(jù)及后臺顯示信息圖標(biāo)和主題更改方式

    這篇文章主要介紹了Django-xadmin后臺導(dǎo)入json數(shù)據(jù)及后臺顯示信息圖標(biāo)和主題更改方式,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-03-03
  • python中selenium操作下拉滾動條的幾種方法匯總

    python中selenium操作下拉滾動條的幾種方法匯總

    這篇文章主要介紹了python中selenium操作下拉滾動條的幾種方法匯總,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-07-07
  • Python opencv相機(jī)標(biāo)定實(shí)現(xiàn)原理及步驟詳解

    Python opencv相機(jī)標(biāo)定實(shí)現(xiàn)原理及步驟詳解

    這篇文章主要介紹了Python opencv相機(jī)標(biāo)定實(shí)現(xiàn)原理及步驟詳解,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
    2020-04-04
  • Python光學(xué)仿真數(shù)值分析求解波動方程繪制波包變化圖

    Python光學(xué)仿真數(shù)值分析求解波動方程繪制波包變化圖

    這篇文章主要為大家介紹了Python光學(xué)仿真通過數(shù)值分析求解波動方程并繪制波包變化圖的示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助
    2021-10-10
  • Python Scrapy圖片爬取原理及代碼實(shí)例

    Python Scrapy圖片爬取原理及代碼實(shí)例

    這篇文章主要介紹了Python Scrapy圖片爬取原理及代碼實(shí)例,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
    2020-06-06
  • Django進(jìn)階之CSRF的解決

    Django進(jìn)階之CSRF的解決

    這篇文章主要介紹了Django進(jìn)階之CSRF的解決,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2018-08-08

最新評論