python處理“”開頭加數(shù)字的html字符方法
python如何處理“&#”開頭加數(shù)字的html字符,比如:风水這類數(shù)據(jù)。
用python抓取數(shù)據(jù)時,有時會遇到想要數(shù)據(jù)是以“&#”開頭加數(shù)字的字符,比如圖中所示的這些:
风水大术士
這些字符需要再次轉(zhuǎn)換才能變回中文內(nèi)容。這些字符需要再次轉(zhuǎn)換才能變回中文內(nèi)容。
Python2.7版本
在python2.7版本中,使用import HTMLParser
定義變量,再定義轉(zhuǎn)換代碼。
代碼中最重要的是“data_parser = HTMLParser.HTMLParser()”,通過此才能用“.unescape()”方法。
測試運行,這串字符串正常輸出了中文。
Python3.7+版本
在最新python版本中,不能用上面的導(dǎo)入方法??梢杂?import html"或者“from html import unescape”。這里使用"import html"做測試。
導(dǎo)入html后,直接用".unescape()"來處理字符串。
運行后,正常轉(zhuǎn)換成了中文字符。
感謝大家的閱讀和對腳本之家的支持。
相關(guān)文章
python xlwt如何設(shè)置單元格的自定義背景顏色
這篇文章主要介紹了python xlwt如何設(shè)置單元格的自定義背景顏色,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2019-09-09使用pycharm連接讀取orcl數(shù)據(jù)庫的表的操作方法
這篇文章主要介紹了使用pycharm連接讀取orcl數(shù)據(jù)庫的表的操作方法,本文給大家介紹的非常詳細,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友參考下吧2024-01-01Python??reduce()函數(shù)的用法示例代碼
reduce函數(shù)原本在python2中也是個內(nèi)置函數(shù),不過在python3中被移到functools模塊中,這篇文章主要介紹了Python reduce()函數(shù)的用法,需要的朋友可以參考下2023-05-05表格梳理python內(nèi)置數(shù)學(xué)模塊math分析詳解
這篇文章主要為大家介紹了python內(nèi)置數(shù)學(xué)模塊math的分析詳解,文中通過表格梳理的方式以便讓大家在學(xué)習(xí)過程中一目望去清晰明了,有需要的朋友可以借鑒參考下2021-10-10Python機器學(xué)習(xí)實戰(zhàn)之k-近鄰算法的實現(xiàn)
k-近鄰算法采用測量不同特征值之間的距離方法進行分類。這篇文章主要為大家介紹了如何通過python實現(xiàn)K近鄰算法,有需要的朋友可以借鑒參考下,希望能夠有所幫助2021-11-11使用Python搭建服務(wù)器公網(wǎng)展示本地電腦文件的操作過程
這篇文章主要介紹了使用Python搭建服務(wù)器公網(wǎng)展示本地電腦文件,今天我們就嘗試用python,建立一個簡單的http服務(wù)器,用來展示本地電腦上指定的目錄和文件,需要的朋友可以參考下2023-08-08