python字符串編碼識(shí)別模塊chardet簡(jiǎn)單應(yīng)用
python的字符串編碼識(shí)別模塊(第三方庫(kù)):
官方地址: http://pypi.python.org/pypi/chardet
import chardet import urllib # 可根據(jù)需要,選擇不同的數(shù)據(jù) TestData = urllib.urlopen('http://www.baidu.com/').read() print chardet.detect(TestData) # 運(yùn)行結(jié)果: # {'confidence': 0.99, 'encoding': 'GB2312'} 運(yùn)行結(jié)果表示有99%的概率認(rèn)為這段代碼是GB2312編碼方式。 import urllib from chardet.universaldetector import UniversalDetector usock = urllib.urlopen('http://www.baidu.com/') # 創(chuàng)建一個(gè)檢測(cè)對(duì)象 detector = UniversalDetector() for line in usock.readlines(): # 分塊進(jìn)行測(cè)試,直到達(dá)到閾值 detector.feed(line) if detector.done: break # 關(guān)閉檢測(cè)對(duì)象 detector.close() usock.close() # 輸出檢測(cè)結(jié)果 print detector.result # 運(yùn)行結(jié)果: # {'confidence': 0.99, 'encoding': 'GB2312'}
應(yīng)用背景,如果要對(duì)一個(gè)大文件進(jìn)行編碼識(shí)別,使用這種高級(jí)的方法,可以只讀一部,去判別編碼方式從而提高檢測(cè)速度。如果希望使用一個(gè)檢測(cè)對(duì)象檢測(cè)多個(gè)數(shù)據(jù),在每次檢測(cè)完,一定要運(yùn)行一下detector.reset()。清除之前的數(shù)據(jù)。
以上所述就是本文的全部?jī)?nèi)容了,希望大家能夠喜歡。
- Python處理文件的方法(mimetypes和chardet)
- Python chardet庫(kù)識(shí)別編碼原理解析
- Python3 chardet模塊查看編碼格式的例子
- python中判斷文件編碼的chardet(實(shí)例講解)
- Python中動(dòng)態(tài)檢測(cè)編碼chardet的使用教程
- Python簡(jiǎn)單檢測(cè)文本類型的2種方法【基于文件頭及cchardet庫(kù)】
- python判斷字符串編碼的簡(jiǎn)單實(shí)現(xiàn)方法(使用chardet)
- Python使用chardet判斷字符編碼
- python使用chardet判斷字符串編碼的方法
- 使用python的chardet庫(kù)獲得文件編碼并修改編碼
- Python爬蟲之必備chardet庫(kù)
相關(guān)文章
一小時(shí)學(xué)會(huì)TensorFlow2之基本操作2實(shí)例代碼
這篇文章主要介紹了TensorFlow2的基本操作和實(shí)例代碼,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-09-09Python調(diào)用百度根據(jù)經(jīng)緯度查詢地址的示例代碼
今天小編就為大家分享一篇Python調(diào)用百度根據(jù)經(jīng)緯度查詢地址的示例代碼,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-07-07Python實(shí)現(xiàn)數(shù)據(jù)透視表詳解
今天小編就為大家分享一篇用Python實(shí)現(xiàn)數(shù)據(jù)的透視表的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-10-10Python?NumPy科學(xué)計(jì)算庫(kù)的高級(jí)應(yīng)用
這篇文章主要為大家介紹了Python?NumPy科學(xué)計(jì)算庫(kù)的高級(jí)應(yīng)用深入詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-07-07python實(shí)現(xiàn)郵件自動(dòng)發(fā)送
這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)郵件自動(dòng)發(fā)送,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-08-08Python打包exe時(shí)各種異常處理方案總結(jié)
今天教大家用Python打包exe時(shí)各種異常處理的方案總結(jié),下文中有非常詳細(xì)的介紹,對(duì)正在學(xué)習(xí)python的小伙伴們很有幫助喲,需要的朋友可以參考下2021-05-05在python3環(huán)境下的Django中使用MySQL數(shù)據(jù)庫(kù)的實(shí)例
下面小編就為大家?guī)?lái)一篇在python3環(huán)境下的Django中使用MySQL數(shù)據(jù)庫(kù)的實(shí)例。小編覺(jué)得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2017-08-08Python調(diào)用C語(yǔ)言的實(shí)現(xiàn)
這篇文章主要介紹了Python調(diào)用C語(yǔ)言的實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-07-07