Python使用chardet判斷字符編碼
本文實例講述了Python使用chardet判斷字符編碼的方法。分享給大家供大家參考。具體分析如下:
Python中chardet 用來實現(xiàn)字符串/文件編碼檢測模板
1、chardet下載與安裝
下載地址:http://pypi.python.org/pypi/chardet
下載chardet后,解壓chardet壓縮包,直接將chardet文件夾放在應(yīng)用程序目錄下,就可以使用import chardet開始使用chardet了,也可以將chardet拷貝到Python系統(tǒng)目錄下,這樣你所有的python程序只要用import chardet就可以了。
python setup.py install
2、實例
使用中,chardet.detect()返回字典,其中confidence是檢測精確度,encoding是編碼形式
(1)網(wǎng)頁編碼判斷:
>>> import urllib >>> rawdata = urllib.urlopen('http://www.google.cn/').read() >>> import chardet >>> chardet.detect(rawdata) {'confidence': 0.98999999999999999, 'encoding': 'GB2312'}
(2)文件編碼判斷
import chardet tt=open('c:\\111.txt','rb') ff=tt.readline() #這里試著換成read(5)也可以,但是換成readlines()后報錯 enc=chardet.detect(ff) print enc['encoding'] tt.close()
希望本文所述對大家的Python程序設(shè)計有所幫助。
相關(guān)文章
python 實現(xiàn)提取log文件中的關(guān)鍵句子,并進(jìn)行統(tǒng)計分析
今天小編就為大家分享一篇python 實現(xiàn)提取log文件中的關(guān)鍵句子,并進(jìn)行統(tǒng)計分析,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-12-12python使用xslt提取網(wǎng)頁數(shù)據(jù)的方法
這篇文章主要為大家詳細(xì)介紹了Python使用xslt提取網(wǎng)頁數(shù)據(jù)的方法,具有一定的參考價值,感興趣的小伙伴們可以參考一下2018-02-02pycharm中導(dǎo)入模塊錯誤時提示Try to run this command from the system ter
這篇文章主要介紹了pycharm中導(dǎo)入模塊錯誤時提示Try to run this command from the system terminal問題,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-03-03深度學(xué)習(xí)之GPU,CUDA和cuDNN的理解
Cuda和cudnn是支持NVIDIA支持GPU的兩個庫,分別用于高性能計算和深度神經(jīng)網(wǎng)絡(luò)計算的支持,下面這篇文章主要給大家介紹了關(guān)于深度學(xué)習(xí)之GPU,CUDA和cuDNN的理解,需要的朋友可以參考下2023-02-02Python學(xué)習(xí)之字典的創(chuàng)建和使用
這篇文章主要為大家介紹了Python中的字典的創(chuàng)建與使用,包括使用字典(添加、刪除、修改等操作),感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下2022-06-06使用Scrapy框架爬取網(wǎng)頁并保存到Mysql的實現(xiàn)
本文主要介紹了使用Scrapy框架爬取網(wǎng)頁并保存到Mysql的實現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2022-07-07