Python簡單檢測文本類型的2種方法【基于文件頭及cchardet庫】
本文實例講述了Python簡單檢測文本類型的方法。分享給大家供大家參考,具體如下:
1、根據(jù)文件頭。
#是否為帶BOM頭的UTF8文件 def IsUtf8BomFile(pathfile): if b'\xef\xbb\xbf' == open(pathfile, mode='rb').read(3)): return True return False
2、用cchardet庫。
>>> import cchardet >>> cchardet.detect(open(pathfile, 'rb').read()) {'encoding': 'UTF-8', 'confidence': 0.9900000095367432}
更多關(guān)于Python相關(guān)內(nèi)容感興趣的讀者可查看本站專題:《Python文件與目錄操作技巧匯總》、《Python文本文件操作技巧匯總》、《Python URL操作技巧總結(jié)》、《Python圖片操作技巧總結(jié)》、《Python數(shù)據(jù)結(jié)構(gòu)與算法教程》、《Python Socket編程技巧總結(jié)》、《Python函數(shù)使用技巧總結(jié)》、《Python字符串操作技巧匯總》及《Python入門與進階經(jīng)典教程》
希望本文所述對大家Python程序設(shè)計有所幫助。
相關(guān)文章
Python的網(wǎng)絡編程庫Gevent的安裝及使用技巧
Gevent庫的奧義在于并發(fā)式的高性能網(wǎng)絡程序設(shè)計支持,這里我們將來講解Python的網(wǎng)絡編程庫Gevent的安裝及使用技巧,來看一下Gevent支持的多進程程序編寫:2016-06-06