欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python處理“&#”開頭加數(shù)字的html字符方法

 更新時間:2019年06月10日 16:47:10   投稿:laozhang  
在本篇文章里小編給大家整理了關(guān)于python如何處理“&#”開頭加數(shù)字的html字符的相關(guān)知識點總結(jié),有興趣的朋友們學(xué)習(xí)下。

python如何處理“&#”開頭加數(shù)字的html字符,比如:风水這類數(shù)據(jù)。

用python抓取數(shù)據(jù)時,有時會遇到想要數(shù)據(jù)是以“&#”開頭加數(shù)字的字符,比如圖中所示的這些:

风水大术士

這些字符需要再次轉(zhuǎn)換才能變回中文內(nèi)容。這些字符需要再次轉(zhuǎn)換才能變回中文內(nèi)容。

Python2.7版本

在python2.7版本中,使用import HTMLParser

定義變量,再定義轉(zhuǎn)換代碼。

代碼中最重要的是“data_parser = HTMLParser.HTMLParser()”,通過此才能用“.unescape()”方法。 

測試運行,這串字符串正常輸出了中文。

Python3.7+版本

在最新python版本中,不能用上面的導(dǎo)入方法??梢杂?import html"或者“from html import unescape”。這里使用"import html"做測試。

導(dǎo)入html后,直接用".unescape()"來處理字符串。

運行后,正常轉(zhuǎn)換成了中文字符。

感謝大家的閱讀和對腳本之家的支持。

相關(guān)文章

最新評論