快捷導(dǎo)航

使用python的chardet庫獲得文件編碼并修改編碼

更新時間：2014年01月22日 11:25:01 作者：

windows和linux采用了不同的編碼，這讓很多人傷透了腦經(jīng)，這里我采用了Python的chardet庫獲得代碼的編碼，然后修改編碼

首先需要安裝chardet庫，有很多方式，我才用的是比較笨的方式：sudo pip install chardet

#!/usr/bin/env python
# coding: UTF-8
import sys
import os
import chardet

 
def print_usage():
　　print '''usage:
　　change_charset [file|directory] [charset] [output file]\n
　　for example:
　　  change 1.txt utf-8 n1.txt
　　  change 1.txt utf-8
　　  change . utf-8
　　  change 1.txt
'''
def get_charset(s):
　　return chardet.detect(s)['encoding']

 
def remove(file_name):
　　os.remove(file_name)

 
def change_file_charset(file_name, output_file_name, charset):
　　f = open(file_name)
　　s = f.read()
　　f.close()

　　if file_name == output_file_name or output_file_name == "":
　　　　remove(file_name)

　　old_charset = get_charset(s)
　　u = s.decode(old_charset)

　　if output_file_name == "":
　　　　output_file_name = file_name
　　f = open(output_file_name, 'w')
　　s = u.encode(charset)
　　f.write(s)
　　f.close()

 
def do(file_name, output_file_name, charset):
　　if os.path.isdir(file_name):
　　　　for item in os.listdir(file_name):
　　　　　　try:
　　　　　　　　if os.path.isdir(file_name+"/"+item):
　　　　　　　　　　do(file_name+"/"+item, "", charset)
　　　　　　　　else:
　　　　　　　　　　change_file_charset(file_name+"/"+item, "", charset)
　　　　　　except OSError, e:
　　　　　　　　print e
　　else:
　　　　change_file_charset(file_name, output_file_name, charset)

 
if __name__ == '__main__':
　　length = len(sys.argv)

　　if length == 1:
　　　　print_usage()
　　elif length == 2:
　　　　do(sys.argv[1], "", "utf-8")
　　elif length == 3:
　　　　do(sys.argv[1], "", sys.argv[2])
　　elif length == 4:
　　　　do(sys.argv[1], sys.argv[3], sys.argv[2])
　　else:
　　　　print_usage()

您可能感興趣的文章:

相關(guān)文章

Python中的struct.unpack示例詳解
在Python中,struct.unpack是一個函數(shù),用于將字節(jié)串轉(zhuǎn)換為元組,這個函數(shù)在處理二進制數(shù)據(jù)時非常有用,這篇文章主要介紹了Python中的struct.unpack示例詳解,需要的朋友可以參考下
2023-12-12
python 元組和列表的區(qū)別
這篇文章主要介紹了python 元組和列表的區(qū)別，幫助大家更好的理解和學(xué)習(xí)python 數(shù)據(jù)類型的相關(guān)知識，感興趣的朋友可以了解下
2020-11-11
Python實現(xiàn)自動運行代碼的方法詳解
在軟件開發(fā)和數(shù)據(jù)科學(xué)領(lǐng)域,自動運行代碼是提高效率和確保一致性的關(guān)鍵,本文將深入探討如何使用Python實現(xiàn)自動運行代碼的各種方法,希望對大家有所幫助
2023-12-12
python使用openCV遍歷文件夾里所有視頻文件并保存成圖片
這篇文章主要介紹了python使用openCV遍歷文件夾里所有視頻文件并保存成圖片，本文通過實例代碼給大家介紹的非常詳細，具有一定的參考借鑒價值，需要的朋友參考下吧
2020-01-01
Python應(yīng)用實現(xiàn)處理excel數(shù)據(jù)過程解析
這篇文章主要介紹了Python應(yīng)用實現(xiàn)處理excel數(shù)據(jù)過程解析,文中通過示例代碼介紹的非常詳細，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
2020-06-06
Python中相見恨晚的技巧(記得收藏)
這篇文章主要介紹了一些Python中相見恨晚的使用技巧，幫助大家更好的理解和學(xué)習(xí)使用python，感興趣的朋友可以了解下
2021-04-04
Python 爬蟲模擬登陸知乎
這篇文章主要介紹了Python 爬蟲模擬登陸知乎的相關(guān)資料,非常不錯，具有參考借鑒價值，需要的朋友可以參考下
2016-09-09
詳解用Python為直方圖繪制擬合曲線的兩種方法
這篇文章主要介紹了詳解用Python為直方圖繪制擬合曲線的兩種方法，文中通過示例代碼介紹的非常詳細，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
2019-08-08
簡單的Python抓taobao圖片爬蟲
這篇文章主要介紹了簡單的Python抓taobao圖片爬蟲,需要的朋友可以參考下
2014-10-10
在Python程序和Flask框架中使用SQLAlchemy的教程
SQLAlchemy為Python程序與SQL語句之間建立了映射,是Python操作數(shù)據(jù)庫的利器,這里我們將來看在Python程序和Flask框架中使用SQLAlchemy的教程,需要的朋友可以參考下
2016-06-06