腳本之家服務器常用軟件

快捷導航

軟件下載

android MAC 驅(qū)動下載字體下載 DLL

源碼下載

PHP ASP.NET ASP JSP

軟件編程

C# JAVA C 語言 Delphi Android

網(wǎng)絡編程

PHP ASP.NET ASP JavaScript

在線工具

CSS格式化 JS格式化 Html轉(zhuǎn)化為Js

數(shù)據(jù)庫

MYSQL MSSQL oracle DB2 MARIADB

CMS

PHPCMS DEDECMS 帝國CMS WordPress

常用工具

PHP開發(fā)工具 python Photoshop 必備軟件

pandas 讀取excel文件的操作代碼

更新時間：2021年10月31日 14:40:56 作者：littleRpl

pandas 讀取excel文件使用的是 read_excel方法。本文將詳細解析read_excel方法的常用參數(shù)，以及實際的使用示例，感興趣的朋友跟隨小編一起看看吧

一 read_excel() 的基本用法

import pandas as pd

file_name = 'xxx.xlsx'
pd.read_excel(file_name)

二 read_excel() 的常用的參數(shù):

io: excel路徑可以是文件路徑，類文件對象，文件路徑對象等。

sheet_name=0: 訪問指定excel某張工作表。sheet_name可以是str, int, list 或 None類型，默認值是0。

str類型是直接指定工作表的名稱

int類型是指定從0開始的工作表的索引，所以sheelt_name默認值是0，即第一個工作表。

list類型是多個索引或工作表名構(gòu)成的list，指定多個工作表。

None類型，訪問所有的工作表

sheet_name=0: 得到的是第1個sheet的DataFrame類型的數(shù)據(jù)

sheet_name=2: 得到的是第3個sheet的DataFrame類型的數(shù)據(jù)

sheet_name=‘Test1': 得到的是名為'Test1'的sheet的DataFrame類型的數(shù)據(jù)

sheet_name=[0, 3, ‘Test5']: 得到的是第1個，第4個和名為Test5 的工作表作為DataFrame類型的數(shù)據(jù)的字典。

header=0：header是標題行，通過指定具體的行索引，將該行作為數(shù)據(jù)的標題行，也就是整個數(shù)據(jù)的列名。默認首行數(shù)據(jù)（0-index）作為標題行，如果傳入的是一個整數(shù)列表，那這些行將組合成一個多級列索引。沒有標題行使用header=None。

name=None：傳入一列類數(shù)組類型的數(shù)據(jù)，用來作為數(shù)據(jù)的列名。如果文件數(shù)據(jù)不包含標題行，要顯式的指出header=None。

skiprows：int類型，類列表類型或可調(diào)函數(shù)。要跳過的行號(0索引)或文件開頭要跳過的行數(shù)(int)。如果可調(diào)用，可調(diào)用函數(shù)將根據(jù)行索引進行計算，如果應該跳過行則返回True，否則返回False。一個有效的可調(diào)用參數(shù)的例子是lambda x: x in [0, 1, 2]。

skipfooter=0: int類型，默認0。自下而上，從尾部指定跳過行數(shù)的數(shù)據(jù)。

usecols=None: 指定要使用的列，如果沒有默認解析所有的列。

index_col=None: int或元素都是int的列表，將某列的數(shù)據(jù)作為DataFrame的行標簽，如果傳遞了一個列表，這些列將被組合成一個多索引，如果使用usecols選擇的子集，index_col將基于該子集。

squeeze=False, 布爾值，默認False。如果解析的數(shù)據(jù)只有一列，返回一個Series。

dtype=None: 指定某列的數(shù)據(jù)類型，可以使類型名或一個對應列名與類型的字典，例 {‘A': np.int64, ‘B': str}

nrows=None: int類型，默認None。只解析指定行數(shù)的數(shù)據(jù)。

三示例

如圖是演示使用的excel文件，它包含5張工作表。

在這里插入圖片描述

1. IO：路徑

舉一個IO為文件對象的例子，有些時候file文件路徑的包含較復雜的中文字符串時，pandas 可能會解析文件路徑失敗，可以使用文件對象來解決。

file = 'xxxx.xlsx'
f = open(file, 'rb')
df = pd.read_excel(f, sheet_name='Sheet1')

f.close()  # 沒有使用with的話，記得要手動釋放。


# ------------- with模式 -------------------
with open(file, 'rb') as f:
    df = pd.read_excel(f, sheet_name='Sheet1')

2. sheet_name：指定工作表名

sheet_name=‘Sheet'，指定解析名為"Sheet1"的工作表。返回一個DataFrame類型的數(shù)據(jù)。

df = pd.read_excel(file, sheet_name='Sheet1')

在這里插入圖片描述

sheet_name=[0, 1, ‘Sheet1'], 對應的是解析文件的第1， 2張工作表和名為"Sheet1"的工作表。它返回的是一個有序字典。結(jié)構(gòu)為{name：DataFrame}這種類型。

df_dict = pd.read_excel(file, sheet_name=[0,1,'Sheet1'])

在這里插入圖片描述

sheet_name=None 會解析該文件中所有的工作表，返回一個同上的字典類型的數(shù)據(jù)。

df_dict = pd.read_excel(file, sheet_name=None)

在這里插入圖片描述

3. header ：指定標題行

header是用來指定數(shù)據(jù)的標題行，也就是數(shù)據(jù)的列名的。本文使用的示例文件具有中英文兩行列名，默認header=0是使用第一行數(shù)據(jù)作為數(shù)據(jù)的列名。

df_dict = pd.read_excel(file, sheet_name='Sheet1')

在這里插入圖片描述

header=1，使用指定使用第二行的英文列名。

df_dict = pd.read_excel(file, sheet_name='Sheet1', header=1)

在這里插入圖片描述

需要注意的是，如果不行指定任何行作為列名，或數(shù)據(jù)源是無標題行的數(shù)據(jù)，可以顯示的指定header=None來表明不使用列名。

df_dict = pd.read_excel(file, sheet_name='Sheet1', header=None)

4. names：指定列名

指定數(shù)據(jù)的列名，如果數(shù)據(jù)已經(jīng)有列名了，會替換掉原有的列名。

df = pd.read_excel(file, sheet_name='Sheet1', names=list('123456789ABCDE'))

在這里插入圖片描述

上圖是header=0默認第一行中文名是標題行，最后被names給替換了列名，如果只想使用names，而又對源數(shù)據(jù)不做任何修改，我們可以指定header=None

df = pd.read_excel(file, sheet_name='Sheet1', names=list('123456789ABCDE'), header=None)

在這里插入圖片描述

5. index_col: 指定列索引

df = pd.read_excel(file, sheet_name='Sheet1', header=1, index_col=0)

在這里插入圖片描述

6. skiprows：跳過指定行數(shù)的數(shù)據(jù)

df = pd.read_excel(file, sheet_name='Sheet1', skiprows=0)

在這里插入圖片描述

df = pd.read_excel(file, sheet_name='Sheet1', skiprows=[1,3,5,7,9,])

在這里插入圖片描述

header與skiprows在有些時候效果相同，例skiprows=5和header=5。因為跳過5行后就是以第六行，也就是索引為5的行默認為標題行了。需要注意的是skiprows=5的5是行數(shù)，header=5的5是索引為5的行。

df = pd.read_excel(file, sheet_name='Sheet1', header=5)

在這里插入圖片描述

df = pd.read_excel(file, sheet_name='Sheet1', skiprows=5)

在這里插入圖片描述

7. skipfooter：省略從尾部的行數(shù)據(jù)

原始的數(shù)據(jù)有47行，如下圖所示：

在這里插入圖片描述

從尾部跳過5行：

df = pd.read_excel(file, sheet_name='Sheet1', skipfooter=5)

在這里插入圖片描述

8.dtype 指定某些列的數(shù)據(jù)類型

示例數(shù)據(jù)中，測試編碼數(shù)據(jù)是文本，而pandas在解析的時候自動轉(zhuǎn)換成了int64類型，這樣codes列的首位0就會消失，造成數(shù)據(jù)錯誤，如下圖所示

在這里插入圖片描述

指定codes列的數(shù)據(jù)類型：

df = pd.read_excel(file, sheet_name='Sheet1', header=1, dtype={'codes': str})

在這里插入圖片描述

到此這篇關(guān)于pandas 讀取excel文件的文章就介紹到這了,更多相關(guān)pandas 讀取excel文件內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

軟件下載

源碼下載

軟件編程

網(wǎng)絡編程

在線工具

數(shù)據(jù)庫

CMS

常用工具

pandas 讀取excel文件的操作代碼

目錄

一 read_excel() 的基本用法

二 read_excel() 的常用的參數(shù):

三示例

1. IO：路徑

2. sheet_name：指定工作表名

3. header ：指定標題行

4. names：指定列名

5. index_col: 指定列索引

6. skiprows：跳過指定行數(shù)的數(shù)據(jù)

7. skipfooter：省略從尾部的行數(shù)據(jù)

8.dtype 指定某些列的數(shù)據(jù)類型

相關(guān)文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具

pandas 讀取excel文件的操作代碼

目錄

一 read_excel() 的基本用法

二 read_excel() 的常用的參數(shù):

三 示例

1. IO：路徑

2. sheet_name：指定工作表名

3. header ：指定標題行

4. names： 指定列名

5. index_col: 指定列索引

6. skiprows：跳過指定行數(shù)的數(shù)據(jù)

7. skipfooter：省略從尾部的行數(shù)據(jù)

8.dtype 指定某些列的數(shù)據(jù)類型

相關(guān)文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具

三示例

4. names：指定列名