欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

pandas讀取csv格式數(shù)據(jù)時(shí)header參數(shù)設(shè)置方法

 更新時(shí)間:2022年02月08日 10:32:45   作者:喵小媛  
本文主要介紹了pandas讀取csv格式數(shù)據(jù)時(shí)header參數(shù)設(shè)置方法,文中通過示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下

寫在前面

使用pandas中read_csv讀取csv數(shù)據(jù)時(shí),對(duì)于有表頭的數(shù)據(jù),將header設(shè)置為空(None),會(huì)報(bào)錯(cuò):pandas_libs\parsers.pyx in pandas._libs.parsers.raise_parser_error() ParserError: Error tokenizing data. C error: Expected 4 fields in line 2, saw 5

查看pandas官方文檔發(fā)現(xiàn),read_csv讀取時(shí)會(huì)自動(dòng)識(shí)別表頭,數(shù)據(jù)有表頭時(shí)不能設(shè)置header為空(默認(rèn)讀取第一行,即header=0);數(shù)據(jù)無表頭時(shí),若不設(shè)置header,第一行數(shù)據(jù)會(huì)被視為表頭,應(yīng)傳入names參數(shù)設(shè)置表頭名稱或設(shè)置header=None。

參考文檔

這是pandas的read_csv的官方文檔: python - pandas.read_csv

read_csv的header參數(shù)

使用pandas的read_csv讀取數(shù)據(jù)時(shí),header參數(shù)表頭名稱設(shè)置(即各列數(shù)據(jù)對(duì)應(yīng)名稱),下面是文檔中對(duì)header參數(shù)的說明:

header參數(shù)說明


其中指出,表頭可根據(jù)數(shù)據(jù)格式推斷各列名稱:默認(rèn)情況下,

  • 若未傳入names參數(shù),則根據(jù)輸入文件的第一行推斷是否有表頭;
  • 若傳入names參數(shù),則names傳入的參數(shù)作為表頭(原數(shù)據(jù)有表頭則會(huì)替換原有表頭)。

下面是對(duì)read_csv的header參數(shù)測(cè)試

header參數(shù)測(cè)試

測(cè)試數(shù)據(jù) 兩個(gè)csv(用逗號(hào)隔開)格式的文件,這里是用Excel打開,分別是帶有表頭和不帶表頭的數(shù)據(jù):

帶有表頭數(shù)據(jù)

不帶表頭數(shù)據(jù)

默認(rèn)header 下面是header默認(rèn)情況下,對(duì)有表頭的數(shù)據(jù)識(shí)別第一行作為header(即header=0)[ 數(shù)據(jù)沒有給出index名稱,這里設(shè)置 index_col=False,不設(shè)置默認(rèn)第一列為index(而表頭仍是4列,最后一列數(shù)據(jù)為NaN), index_col參數(shù)與 header類似可自動(dòng)識(shí)別。

在這里插入圖片描述

設(shè)置header=None 對(duì)有表頭的數(shù)據(jù)設(shè)置 header=None則會(huì)報(bào)錯(cuò):

在這里插入圖片描述

 

在這里插入圖片描述

對(duì)無表頭的數(shù)據(jù),則需設(shè)置 header=None,否則第一行數(shù)據(jù)被作為表頭:

在這里插入圖片描述

思考

pandas是如何識(shí)別或區(qū)分?jǐn)?shù)據(jù)和表頭名稱的 ?

  • 對(duì)于index_col來說,若數(shù)據(jù)都是相同類型,比如數(shù)值型,則表示無index,輸出默認(rèn)index為0,1,2,…;若數(shù)據(jù)第一列為字符,其他列為數(shù)值,則會(huì)將第一列視為index;若設(shè)置index_col=False, 則表示無index(默認(rèn)將0, 1, 2,…作為數(shù)據(jù)的index)
  • 對(duì)header,當(dāng)?shù)谝恍袨樽址瑒t第一行默認(rèn)為表頭;當(dāng)?shù)谝恍信c其他數(shù)據(jù)類型相同時(shí),也會(huì)把第一行當(dāng)作表頭,所以無表頭時(shí)應(yīng)設(shè)置header=None

header傳入list參數(shù)(元素代表取對(duì)應(yīng)行號(hào))怎么用?

read_csv的參數(shù)skip_blank_lines=True會(huì)忽略注釋行和空行,其中注釋行是用什么符號(hào)注釋的?(試了一下,行首用’#'注釋的不對(duì))

到此這篇關(guān)于pandas讀取csv格式數(shù)據(jù)時(shí)header參數(shù)設(shè)置方法的文章就介紹到這了,更多相關(guān)pandas header參數(shù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

最新評(píng)論