jupyter讀取錯(cuò)誤格式文件的解決方案
使用pandas讀取xml文件報(bào)錯(cuò)
“ Unsupported format, or corrupt file: Expected BOF record; found b'<?xml ve' ”
解決辦法:
轉(zhuǎn)換文件格式,使用excel打開xml文件 選擇:文件—>另存為---->彈框
保存以后,再次用pandas讀取對(duì)應(yīng)格式的文件讀取即可
補(bǔ)充:
在jupyter中讀取CSV文件時(shí)出現(xiàn)‘utf-8' codec can't decode byte 0xd5 in position 0: invalid continuation byte解決方法
導(dǎo)入 import pandas as pd
使用pd.read_csv()讀csv文件時(shí),出現(xiàn)如下錯(cuò)誤:
UnicodeDecodeError: ‘utf-8' codec can't decode byte 0xd5 in position 0: invalid continuation byte
出現(xiàn)原因:
CSV文件不是UTF-8進(jìn)行編碼,而是用gbk進(jìn)行編碼的。jupyter-notebook使用的Python解釋器的系統(tǒng)編碼默認(rèn)使用UTF-8.
解決方式有兩種
第一種:
1.找到使用的csv文件--->鼠標(biāo)右鍵--->打開方式---->選擇記事本
2.打開文件選擇“文件”----->"另存為“,我們可以看到默認(rèn)編碼是:ANSI,選擇UTF-8重新保存一份,再使用pd.read_csv()打開就不會(huì)保存了
第二種:
使用pd.read()讀取CSV文件時(shí),進(jìn)行編碼
pd.read(filename,encoding='gbk')
比如:
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章
Python快速生成隨機(jī)密碼超簡(jiǎn)單實(shí)現(xiàn)
這篇文章主要介紹了Python快速生成隨機(jī)密碼,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2022-08-08Python實(shí)現(xiàn)簡(jiǎn)單遺傳算法(SGA)
這篇文章主要為大家詳細(xì)介紹了Python實(shí)現(xiàn)簡(jiǎn)單遺傳算法SGA,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2018-01-01Python實(shí)現(xiàn)二叉樹結(jié)構(gòu)與進(jìn)行二叉樹遍歷的方法詳解
二叉樹是最基本的數(shù)據(jù)結(jié)構(gòu),這里我們?cè)赑ython中使用類的形式來(lái)實(shí)現(xiàn)二叉樹并且用內(nèi)置的方法來(lái)遍歷二叉樹,下面就讓我們一起來(lái)看一下Python實(shí)現(xiàn)二叉樹結(jié)構(gòu)與進(jìn)行二叉樹遍歷的方法詳解2016-05-05Python將Office文檔(Word、Excel、PDF、PPT)轉(zhuǎn)為OFD格式的實(shí)現(xiàn)方法
OFD(Open Fixed-layout Document )是我國(guó)自主制定的一種開放版式文件格式標(biāo)準(zhǔn),如果想要通過(guò)Python將Office文檔(如Word、Excel或PowerPoint)及PDF文檔轉(zhuǎn)換為OFD格式,可以參考本文中提供的實(shí)現(xiàn)方法,需要的朋友可以參考下2024-06-06python中把元組轉(zhuǎn)換為namedtuple方法
在本篇文章里小編給大家整理的是一篇關(guān)于python中把元組轉(zhuǎn)換為namedtuple方法,有興趣的朋友們可以參考下。2020-12-12python中如何使用正則表達(dá)式提取數(shù)據(jù)
這篇文章主要介紹了python中如何使用正則表達(dá)式提取數(shù)據(jù)問(wèn)題。具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-02-02