Python簡單檢測文本類型的2種方法【基于文件頭及cchardet庫】
本文實例講述了Python簡單檢測文本類型的方法。分享給大家供大家參考,具體如下:
1、根據(jù)文件頭。
#是否為帶BOM頭的UTF8文件 def IsUtf8BomFile(pathfile): if b'\xef\xbb\xbf' == open(pathfile, mode='rb').read(3)): return True return False
2、用cchardet庫。
>>> import cchardet >>> cchardet.detect(open(pathfile, 'rb').read()) {'encoding': 'UTF-8', 'confidence': 0.9900000095367432}
更多關(guān)于Python相關(guān)內(nèi)容感興趣的讀者可查看本站專題:《Python文件與目錄操作技巧匯總》、《Python文本文件操作技巧匯總》、《Python URL操作技巧總結(jié)》、《Python圖片操作技巧總結(jié)》、《Python數(shù)據(jù)結(jié)構(gòu)與算法教程》、《Python Socket編程技巧總結(jié)》、《Python函數(shù)使用技巧總結(jié)》、《Python字符串操作技巧匯總》及《Python入門與進階經(jīng)典教程》
希望本文所述對大家Python程序設(shè)計有所幫助。
- Python處理文件的方法(mimetypes和chardet)
- Python chardet庫識別編碼原理解析
- Python3 chardet模塊查看編碼格式的例子
- python中判斷文件編碼的chardet(實例講解)
- Python中動態(tài)檢測編碼chardet的使用教程
- python判斷字符串編碼的簡單實現(xiàn)方法(使用chardet)
- python字符串編碼識別模塊chardet簡單應(yīng)用
- Python使用chardet判斷字符編碼
- python使用chardet判斷字符串編碼的方法
- 使用python的chardet庫獲得文件編碼并修改編碼
- Python爬蟲之必備chardet庫
相關(guān)文章
Python的網(wǎng)絡(luò)編程庫Gevent的安裝及使用技巧
Gevent庫的奧義在于并發(fā)式的高性能網(wǎng)絡(luò)程序設(shè)計支持,這里我們將來講解Python的網(wǎng)絡(luò)編程庫Gevent的安裝及使用技巧,來看一下Gevent支持的多進程程序編寫:2016-06-06