欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python中pandas.read_csv()函數(shù)的深入講解

 更新時(shí)間:2021年03月28日 10:01:59   作者:lienGu  
這篇文章主要給大家介紹了關(guān)于python中pandas.read_csv()函數(shù)的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

這里將更新最新的最全面的read_csv()函數(shù)功能以及參數(shù)介紹,參考資料來源于官網(wǎng)。

pandas庫簡介

官方網(wǎng)站里詳細(xì)說明了pandas庫的安裝以及使用方法,在這里獲取最新的pandas庫信息,不過官網(wǎng)僅支持英文。

pandas是一個(gè)Python包,并且它提供快速,靈活和富有表現(xiàn)力的數(shù)據(jù)結(jié)構(gòu)。這樣當(dāng)我們處理"關(guān)系"或"標(biāo)記"的數(shù)據(jù)(一維和二維數(shù)據(jù)結(jié)構(gòu))時(shí)既容易又直觀。

pandas是我們運(yùn)用Python進(jìn)行實(shí)際、真實(shí)數(shù)據(jù)分析的基礎(chǔ),同時(shí)它是建立在NumPy之上的。

csv文件格式簡介

函數(shù)介紹

pandas.csv() 函數(shù)將逗號(hào)分離的值 (csv) 文件讀入數(shù)據(jù)框架。還支持可選地將文件讀入塊或?qū)⑵浞纸狻?/p>

函數(shù)原型

源文件

pandas.read_csv(filepath_or_buffer, sep=, delimiter=None, header=‘infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, skipfooter=0, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, cache_dates=True, iterator=False, chunksize=None, compression=‘infer', thousands=None, decimal='.', lineterminator=None, quotechar='"', quoting=0, doublequote=True, escapechar=None, comment=None, encoding=None, dialect=None, error_bad_lines=True, warn_bad_lines=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None, storage_options=None

函數(shù)參數(shù)以及含義

輸入

參數(shù)名 功能以及含義
filepath_or_buffer 字符串。任何有效的字符串路徑都可以,網(wǎng)址也行。
sep 字符串,表示分隔符,默認(rèn)為',' .。一個(gè)字符及以上都可以,注意如果是轉(zhuǎn)義字符要加''
delimiter 字符串,sep的別名,默認(rèn)None
header int或者int列表,默認(rèn)由推斷出來。這是用于規(guī)定列名的行號(hào)。
names 類似于數(shù)組結(jié)構(gòu),選擇性使用。這是要使用的列名稱列表,與header共同使用。
index_col 整數(shù)或者字符串或者整數(shù)/字符串列表。指定用作的行標(biāo)簽的列。
usecols 列表,可用可不用。功能是返回列的子集。
squeeze 布爾值,默認(rèn)為False。如果解析的數(shù)據(jù)僅包含一列,則返回一個(gè)Series
prefix 字符串,選擇性使用。沒有標(biāo)題時(shí)要添加到列號(hào)的前綴
mangle_dupe_cols 布爾值,默認(rèn)為True。重復(fù)的列將被指定為“ X”,“ X.1”,……“ X.N”,而不是“ X”……“ X”。如果列中的名稱重復(fù),則False將導(dǎo)致數(shù)據(jù)被覆蓋。
dtype 類型名稱或者類型列的字典,選擇性使用。數(shù)據(jù)或列的數(shù)據(jù)類型。
engine {‘c', ‘python'},選擇性使用。要使用的解析器引擎。C引擎速度更快,而python引擎當(dāng)前功能更完善。
converters 字典,選擇性使用。轉(zhuǎn)換器,用于轉(zhuǎn)換某些列中的值的函數(shù)的字典。鍵可以是整數(shù)或列標(biāo)簽。
true_value 列表,選擇性使用。視為True的值
false_values 列表,選擇性使用。視為False的值
skipinitialspace 布爾值,默認(rèn)為False。在定界符后跳過空格。
skiprows 列表或者整數(shù),選擇性使用。在文件開始處要跳過的行號(hào)(索引為0)或要跳過的行數(shù)(整數(shù))。
skipfooter 整數(shù),默認(rèn)為0。要跳過的文件底部的行數(shù)(不支持engine =‘c')。
nrows 整數(shù),選擇性使用。要讀取的文件行數(shù)。對于讀取大文件很有用。
na_values 標(biāo)量,字符串,類似列表的字典,選擇性使用。識(shí)別為NA / NaN的其他字符串。如果dict通過,則為特定的每列NA值。默認(rèn)情況下,以下值解釋為NaN:'','#N / A','#N / AN / A','#NA','-1.#IND','-1.#QNAN', ‘-NaN','-nan',‘1.#IND',‘1.#QNAN','',‘N / A',‘NA',‘NULL',‘NaN',‘n / a',‘nan',‘null'。
keep_default_na 布爾值,默認(rèn)為True。解析數(shù)據(jù)時(shí)是否包括默認(rèn)的NaN值。
na_filter 布爾值,默認(rèn)為True。檢測缺失值標(biāo)記(空字符串和na_values的值)。請注意,如果將na_filter傳遞為False,則將忽略keep_default_na和 na_values參數(shù)。
verbose 布爾值,默認(rèn)為False。指示放置在非數(shù)字列中的NA值的數(shù)量。
skip_blank_lines 布爾值,默認(rèn)為True。如果為True,跳過空白行,并且不解釋為NaN值。
parse_dates 布爾值,整數(shù)列表,名稱列表,列表或字典的列表。默認(rèn)為False。功能是解析為時(shí)間。
infer_datetimes_format 布爾值,默認(rèn)為False。如果啟用True和parse_dates,則pandas將嘗試推斷列中日期時(shí)間字符串的格式,并且如果可以推斷出日期格式,就會(huì)切換到更快的解析它們的方法。
keep_date_col 布爾值,默認(rèn)為False。如果True和parse_dates指定合并多個(gè)列,則保留原始列。
date_parser 函數(shù),選擇性使用。用于將字符串列序列轉(zhuǎn)換為日期時(shí)間實(shí)例數(shù)組的函數(shù)。
dayfirst 布爾值,默認(rèn)為False。DD / MM格式的日期,國際和歐洲格式。
cache_dates 布爾值,默認(rèn)為True。如果為True,則使用唯一的轉(zhuǎn)換日期緩存來應(yīng)用datetime轉(zhuǎn)換。
iterator 布爾值,默認(rèn)為False。返回TextFileReader對象以進(jìn)行迭代或使用獲取塊 get_chunk()。
chunksize 整數(shù),選擇性使用。返回TextFileReader對象以進(jìn)行迭代。
compression {‘infer', ‘gzip', ‘bz2', ‘zip', ‘xz', None},默認(rèn)為'infer'。用于對磁盤數(shù)據(jù)進(jìn)行即時(shí)解壓縮。設(shè)置為“無”將不進(jìn)行解壓縮。
thousands 字符串,選擇性使用。千位分隔符。
decimal 字符串,默認(rèn)為'.'。識(shí)別為小數(shù)點(diǎn)的字符(例如,對于歐洲數(shù)據(jù),請使用“,”)。
lineterminator 長度為1的字符串,選擇性使用。用于將文件分成幾行的字符。僅對C解析器有效。
quotechar 長度為1的字符串,選擇性使用。用于表示引用項(xiàng)目的開始和結(jié)束的字符。
quoting 整數(shù)或者csv.QUOTE_* 實(shí)例,默認(rèn)為0。每個(gè)csv.QUOTE_*常量的控制字段引用行為。使用QUOTE_MINIMAL(0),QUOTE_ALL(1),QUOTE_NONNUMERIC(2)或QUOTE_NONE(3)中的一種。
doublequote 布爾值,默認(rèn)為True。如果指定quotechar而未使用引號(hào)QUOTE_NONE,則指示是否將一個(gè)字段內(nèi)的兩個(gè)連續(xù)的quotechar元素解釋為單個(gè)quotechar元素。
escapechar 長度為1的字符串,選擇性使用。 一字符字符串,用于轉(zhuǎn)義其他字符。
comment 字符串,選擇性使用。指示不應(yīng)分析行的其余部分。如果在一行的開頭找到該行,則將完全忽略該行。此參數(shù)必須是單個(gè)字符。
encoding 字符串,選擇性使用。讀/寫時(shí)用于UTF的編碼(例如'utf-8')。
dialect 字符串或者csv.Dialect,選擇性使用。如果提供的話,該參數(shù)將覆蓋為以下參數(shù)的值(默認(rèn)或不):delimiter, doublequote, escapechar, skipinitialspace, quotechar, and quoting。
error_bad_lines 布爾值,默認(rèn)為True。 默認(rèn)情況下,具有太多字段的行(例如,帶有太多逗號(hào)的csv行)將引發(fā)異常,并且不會(huì)返回任何DataFrame。如果為False,則這些“壞行”將從返回的DataFrame中刪除。
warn_bad_lines 布爾值,默認(rèn)為True。如果error_bad_lines為False,而warn_bad_lines為True,則將為每個(gè)“壞行”輸出警告。
delim_whiterspace 布爾值,默認(rèn)為False。指定是否將空格(例如或)用作分隔符。
low_memory 布爾值,默認(rèn)為True。在內(nèi)部對文件進(jìn)行分塊處理,從而在解析時(shí)減少了內(nèi)存使用。
memory_map 布爾值,默認(rèn)為False。如果為filepath_or_buffer提供了文件路徑,則將文件對象直接映射到內(nèi)存中,然后直接從那里訪問數(shù)據(jù)。使用此選項(xiàng)可以提高性能,因?yàn)椴辉儆腥魏蜪 / O開銷。
float_precision 字符串,選擇性使用。指定C引擎應(yīng)將哪個(gè)轉(zhuǎn)換器用于浮點(diǎn)值。
storage_option 字典,選擇性使用。解析特殊的URL。如果為該參數(shù)提供非fsspec URL,則會(huì)引發(fā)錯(cuò)誤。

返回

DataFrame:將逗號(hào)分隔值(csv)文件讀取到DataFrame中。

函數(shù)使用實(shí)例

終端使用范例:

>>>import pandas as pd
>>>pd.read_csv('data.csv')

代碼行使用范例

#導(dǎo)入pandas庫,并取別名為pd
import pandas as pd
#books.csv與項(xiàng)目不在同一文件夾下使用絕對路徑,分隔符為';',出錯(cuò)的行直接跳過,編碼方式使用"latin-1",變量books是DataFrame數(shù)據(jù)結(jié)構(gòu)
books = pd.read_csv('D:\coder\python_program\Books.csv', sep=';', error_bad_lines = False, encoding="latin-1")
#查看books的行和列
print(books.shape)
#查看
print(list(books.columns))
print(books.head())

總結(jié)

到此這篇關(guān)于python中pandas.read_csv()函數(shù)的文章就介紹到這了,更多相關(guān)python pandas.read_csv()函數(shù)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • 用python繪制櫻花樹

    用python繪制櫻花樹

    這篇文章主要介紹了如何用python繪制櫻花樹,幫助大家更好的使用python處理圖片,感興趣的朋友可以了解下
    2020-09-09
  • Python中常用信號(hào)signal類型實(shí)例

    Python中常用信號(hào)signal類型實(shí)例

    這篇文章主要介紹了Python中常用信號(hào)signal類型實(shí)例,分享了相關(guān)代碼示例,小編覺得還是挺不錯(cuò)的,具有一定借鑒價(jià)值,需要的朋友可以參考下
    2018-01-01
  • Python Tkinter實(shí)例——模擬擲骰子

    Python Tkinter實(shí)例——模擬擲骰子

    這篇文章主要介紹了Python利用tkinter模塊模擬擲骰子的實(shí)例,幫助大家更好的理解和使用python,感興趣的朋友可以了解下
    2020-10-10
  • pip安裝tensorflow的坑的解決

    pip安裝tensorflow的坑的解決

    這篇文章主要介紹了pip安裝tensorflow的坑的解決,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-04-04
  • python刪除文件夾下相同文件和無法打開的圖片

    python刪除文件夾下相同文件和無法打開的圖片

    這篇文章主要為大家詳細(xì)介紹了python刪除文件夾下相同文件和無法打開的圖片,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2019-07-07
  • python 五子棋如何獲得鼠標(biāo)點(diǎn)擊坐標(biāo)

    python 五子棋如何獲得鼠標(biāo)點(diǎn)擊坐標(biāo)

    這篇文章主要介紹了python 五子棋如何獲得鼠標(biāo)點(diǎn)擊坐標(biāo),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2019-11-11
  • Python Numpy 數(shù)組的初始化和基本操作

    Python Numpy 數(shù)組的初始化和基本操作

    Python 是一種高級(jí)的,動(dòng)態(tài)的,多泛型的編程語言。接下來通過本文給大家介紹Python Numpy 數(shù)組的初始化和基本操作,感興趣的朋友一起看看吧
    2018-03-03
  • python中使用Celery容聯(lián)云異步發(fā)送驗(yàn)證碼功能

    python中使用Celery容聯(lián)云異步發(fā)送驗(yàn)證碼功能

    Celery 是一個(gè) 基于python開發(fā)的分布式異步消息任務(wù)隊(duì)列,通過它可以輕松的實(shí)現(xiàn)任務(wù)的異步處理,本文重點(diǎn)給大家介紹使用Celery容聯(lián)云異步發(fā)送驗(yàn)證碼功能,感興趣的朋友一起看看吧
    2021-09-09
  • Python繪制浪漫星空的示例代碼

    Python繪制浪漫星空的示例代碼

    Python的turtle是一個(gè)基于tkinter的Python圖形庫,可以幫助初學(xué)者輕松地理解和繪制圖形,本文就來通過turtle繪制一個(gè)浪漫的星空動(dòng)畫吧
    2023-09-09
  • 卷積神經(jīng)網(wǎng)絡(luò)如何實(shí)現(xiàn)提取特征

    卷積神經(jīng)網(wǎng)絡(luò)如何實(shí)現(xiàn)提取特征

    這篇文章主要介紹了卷積神經(jīng)網(wǎng)絡(luò)如何實(shí)現(xiàn)提取特征問題,具有很好的參考價(jià)值,希望對大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2023-04-04

最新評論