Python如何實現(xiàn)讀取csv文件時忽略文件的編碼格式
1、背景介紹
我們再日常讀取csv文件的時候經(jīng)常會發(fā)現(xiàn)csv文件的格式有多種,常見的有【UTF-8】\【GBK】\ 【ANSI】格式,我們再讀取的時候會加上encoding="xx"參數(shù),為了,方便我們可以使用 chardet.detect()檢測文件編碼。
- 編碼檢測:通過chardet自動檢測文件編碼,確保正確讀取文件內(nèi)容。
- 異常處理:對可能出現(xiàn)的編碼錯誤進行處理,提供備用的UTF-8編碼讀取方案。
- CSV處理:使用標準庫csv模塊讀取并打印CSV文件內(nèi)容,包括表頭和數(shù)據(jù)行。
2、庫的安裝
庫 | 用途 | 安裝 |
---|---|---|
csv | csv文件的讀寫 | 內(nèi)置庫無需安裝 |
3、核心代碼
①:到的編碼格式
def detect_encoding(file_path): with open(file_path, 'rb') as f: raw_data = f.read() result = chardet.detect(raw_data) return result['encoding']
②:調(diào)用detect_encoding函數(shù)獲取文件的編碼格式
def main(): file_path = '新建XLSX 工作表.csv' encoding = detect_encoding(file_path) try: read_csv(file_path, encoding) except UnicodeDecodeError: # 如果檢測到的編碼格式讀取失敗,嘗試使用 UTF-8 編碼讀取 try: read_csv(file_path, 'utf-8') except Exception as e: print(f"讀取文件時發(fā)生錯誤: {e}") except Exception as e: print(f"讀取文件時發(fā)生錯誤: {e}")
4、完整代碼
# -*- coding: UTF-8 -*- ''' @Project :測試 @File :test2_read_csv.py @IDE :PyCharm @Author :一晌小貪歡(278865463@qq.com) @Date :2025/3/1 21:40 ''' import csv import chardet def detect_encoding(file_path): with open(file_path, 'rb') as f: raw_data = f.read() result = chardet.detect(raw_data) return result['encoding'] def read_csv(file_path, encoding): with open(file_path, 'r', encoding=encoding) as f: reader = csv.reader(f) head = next(reader) print("表頭", head) for row in reader: print(row) def main(): file_path = '新建XLSX 工作表.csv' encoding = detect_encoding(file_path) try: read_csv(file_path, encoding) except UnicodeDecodeError: # 如果檢測到的編碼格式讀取失敗,嘗試使用 UTF-8 編碼讀取 try: read_csv(file_path, 'utf-8') except Exception as e: print(f"讀取文件時發(fā)生錯誤: {e}") except Exception as e: print(f"讀取文件時發(fā)生錯誤: {e}") if __name__ == "__main__": main()
到此這篇關(guān)于Python如何實現(xiàn)讀取csv文件時忽略文件的編碼格式的文章就介紹到這了,更多相關(guān)Python讀取csv內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Pandas刪除數(shù)據(jù)的幾種情況(小結(jié))
這篇文章主要介紹了Pandas刪除數(shù)據(jù)的幾種情況(小結(jié)),詳細的介紹了4種方式,具有一定的參考價值,感興趣的小伙伴們可以參考一下2019-06-06pymongo如何通過oplog獲取數(shù)據(jù)(mongodb)
使用MongoDB的oplog(操作日志)進行數(shù)據(jù)同步是高級的用法,主要用于復(fù)制和故障恢復(fù),這篇文章主要介紹了pymongo通過oplog獲取數(shù)據(jù)(mongodb),需要的朋友可以參考下2023-09-09