pandas如何讀取含有中文的excel
pandas讀取含有中文的excel
在讀取含有中文的 Excel 文件時,需要使用 encoding 參數(shù)設(shè)置編碼方式。
常用的編碼方式有 'gbk' 和 'utf-8'。
示例代碼:
import pandasas pd # 讀取含有中文的 Excel 文件 df = pd.read_excel('filename.xlsx', encoding='gbk')
如果讀取過程中出現(xiàn)亂碼,可以嘗試更換編碼方式。
pandas讀取excel時遇到的編碼問題 unknown_codepage_21010
最近在使用pandas讀取不規(guī)則excel表時遇到了一種編碼問題,自己找了好久資料也是終于綜合了一下解決了這種編碼異常的問題。
首先呢,報錯會提示 下面這種錯誤:
unknown encoding: unknown_codepage_21010
自己在找資料的時候看到一篇很早在git上發(fā)布的一篇文章,意思就是讓直接明確將編碼設(shè)置好,具體可以看一下git鏈接
https://github.com/okfn/messytables/issues/47
最后呢,自己改了一個源文件里的東西,其實也不知道是不是正確的,但是這個問題卻解決了,所以分享出來,也算是為自己記錄一下,以防以后再次遇到這個問題,又得找半天。
找到xlrd的__init__.py文件,在 open_workbook 模塊中將encoding_override的值明確為"cp1252",其實具體這樣做的原因就是將編碼明確,使得可以識別這種異常編碼。
def open_workbook(filename=None, logfile=sys.stdout, verbosity=0, use_mmap=USE_MMAP, file_contents=None, encoding_override="cp1252", formatting_info=False, on_demand=False, ragged_rows=False):
這樣問題就成功解決了~
總結(jié)
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
一文教你Python如何創(chuàng)建屬于自己的IP池
這篇文章主要為大家詳細(xì)介紹了python如何創(chuàng)建屬于自己的IP池,文中的示例代碼講解詳細(xì),對我們學(xué)習(xí)或工作有一定參考價值,需要的可以參考一下2022-04-04Python實現(xiàn)四舍五入的兩個方法總結(jié)
這篇文章主要介紹了python中實現(xiàn)四舍五入的兩種方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2022-09-09Pandas中Series和DataFrame的索引實現(xiàn)
這篇文章主要介紹了Pandas中Series和DataFrame的索引實現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-06-06解決python3.x安裝numpy成功但import出錯的問題
這篇文章主要介紹了解決python3.x安裝numpy成功但import出錯的問題,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-11-11PyTorch詳解經(jīng)典網(wǎng)絡(luò)種含并行連結(jié)的網(wǎng)絡(luò)GoogLeNet實現(xiàn)流程
今天小編就為大家分享一篇Pytorch實現(xiàn)GoogLeNet的方法,GoogLeNet提出了一個名為“Inception”的深度卷積神經(jīng)網(wǎng)結(jié)構(gòu),其目標(biāo)是將分類、識別ILSVRC14數(shù)據(jù)集的技術(shù)水平提高一個層次。這一結(jié)構(gòu)的主要特征是對網(wǎng)絡(luò)內(nèi)部計算資源的利用進(jìn)行了優(yōu)化2022-05-05