欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

使用python的pandas讀取excel文件中的數(shù)據(jù)詳情

 更新時(shí)間:2022年09月19日 15:53:16   作者:npm_run_dev__  
這篇文章主要介紹了使用python的pandas讀取excel文件中的數(shù)據(jù)詳情,文章圍繞主題展開詳細(xì)的內(nèi)容介紹,具有一定的參考價(jià)值,需要的小伙伴可以參考一下

一、讀取Excel文件

使用pandas的read_excel()方法,可通過文件路徑直接讀取。注意到,在一個(gè)excel文件中有多個(gè)sheet,因此,對(duì)excel文件的讀取實(shí)際上是讀取指定文件、并同時(shí)指定sheet下的數(shù)據(jù)。可以一次讀取一個(gè)sheet,也可以一次讀取多個(gè)sheet,同時(shí)讀取多個(gè)sheet時(shí)后續(xù)操作可能不夠方便,因此建議一次性只讀取一個(gè)sheet。

當(dāng)只讀取一個(gè)sheet時(shí),返回的是DataFrame類型,這是一種表格數(shù)據(jù)類型,它清晰地展示出了數(shù)據(jù)的表格型結(jié)構(gòu)。

具體寫法為:

(1)不指定sheet參數(shù),默認(rèn)讀取第一個(gè)sheet,
 df=pd.read_excel("data_test.xlsx")
(2)指定sheet名稱讀取,
 df=pd.read_excel("data_test.xlsx",sheet_name="test1")
(3)指定sheet索引號(hào)讀取,
 df=pd.read_excel("data_test.xlsx",sheet_name=0) #sheet索引號(hào)從0開始

*同時(shí)讀取多個(gè)sheet,以字典形式返回。(不推薦)
(1)指定多個(gè)sheet名稱讀取, df=pd.read_excel("data_test.xlsx",sheet_name=["test1","test2"])
(2)指定多個(gè)sheet索引號(hào)讀取,
df=pd.read_excel("data_test.xlsx",sheet_name=[0,1])
(3)混合指定sheet名稱和sheet索引號(hào)讀取,
df=pd.read_excel("data_test.xlsx",sheet_name=[0,"test2"])

二、DataFrame對(duì)象的結(jié)構(gòu)

對(duì)內(nèi)容的讀取分有表頭和無表頭兩種方式,默認(rèn)情形下是有表頭的方式,即將第一行元素自動(dòng)置為表頭標(biāo)簽,其余內(nèi)容為數(shù)據(jù);當(dāng)在read_excel()方法中加上header=None參數(shù)時(shí)是不加表頭的方式,即從第一行起,全部?jī)?nèi)容為數(shù)據(jù)。讀取到的Excel數(shù)據(jù)均構(gòu)造成并返回DataFrame表格類型(以下以df表示)。

對(duì)有表頭的方式,讀取時(shí)將自動(dòng)地將第一行元素置為表頭向量,同時(shí)為除表頭外的各行內(nèi)容加入行索引(從0開始)、各列內(nèi)容加入列索引(從0開始)。

如圖所示:

對(duì)無表頭的方式,讀取時(shí)將自動(dòng)地為各行內(nèi)容加入行索引(從0開始)、為各列內(nèi)容加入列索引(從0開始),行索引從第一行開始。

如圖所示:

三、用values方式獲取數(shù)據(jù)

1.基本方法

df.values,獲取全部數(shù)據(jù),返回類型為ndarray(二維);
df.index.values,獲取行索引向量,返回類型為ndarray(一維);
df.columns.values,獲取列索引向量(對(duì)有表頭的方式,是表頭標(biāo)簽向量),返回類型為ndarray(一維)。

根據(jù)具體需要,通過ndarray的使用規(guī)則獲取指定數(shù)據(jù)。數(shù)據(jù)獲取的結(jié)構(gòu)示意圖如下所示。

有表頭

無表頭

2.獲取指定數(shù)據(jù)的寫法

(1)獲取全部數(shù)據(jù):
df.values,獲取全部數(shù)據(jù),返回類型為ndarray(二維)。

(2)獲取某個(gè)值:
df.values[i , j],第i行第j列的值,返回類型依內(nèi)容而定。

(3)獲取某一行:
df.values[i],第i行數(shù)據(jù),返回類型為ndarray(一維)。

(4)獲取多行:
df.values[[i1 , i2 , i3]],第i1、i2、i3行數(shù)據(jù),返回類型為ndarray(二維)。

(5)獲取某一列:
df.values[: , j],第j列數(shù)據(jù),返回類型為ndarray(一維)。

(6)獲取多列:
df.values[:,[j1,j2,j3]],第j1、j2、j3列數(shù)據(jù),返回類型為ndarray(二維)。

(7)獲取切片:
df.values[i1:i2 , j1:j2],返回行號(hào)[i1,i2)、列號(hào)[j1,j2)左閉右開區(qū)間內(nèi)的數(shù)據(jù),返回類型為ndarray(二維)。

3.示例

帶表頭,excel內(nèi)容為

Python腳本為:

import pandas as pd

df = pd.read_excel("data_test.xlsx")

print("\n(1)全部數(shù)據(jù):")
print(df.values)

print("\n(2)第2行第3列的值:")
print(df.values[1,2])

print("\n(3)第3行數(shù)據(jù):")
print(df.values[2])

print("\n(4)獲取第2、3行數(shù)據(jù):")
print(df.values[[1,2]])

print("\n(5)第2列數(shù)據(jù):")
print(df.values[:,1])

print("\n(6)第2、3列數(shù)據(jù):")
print(df.values[:,[1,2]])

print("\n(7)第2至4行、第3至5列數(shù)據(jù):")
print(df.values[1:4,2:5])

執(zhí)行結(jié)果:

四、用loc和iloc方式獲取數(shù)據(jù)

1.基本寫法

loc和iloc方法是通過索引定位的方式獲取數(shù)據(jù)的,寫法為loc[A, B]和iloc[A, B]。其中A表示對(duì)行的索引,B表示對(duì)列的索引,B可缺省。A、B可為列表或i1:i2(切片)的形式,表示多行或多列。

這兩個(gè)方法的區(qū)別是,loc將參數(shù)當(dāng)作標(biāo)簽處理,iloc將參數(shù)當(dāng)作索引號(hào)處理。也就是說,在有表頭的方式中,當(dāng)列索引使用str標(biāo)簽時(shí),只可用loc,當(dāng)列索引使用索引號(hào)時(shí),只可用iloc;在無表頭的方式中,索引向量也是標(biāo)簽向量,loc和iloc均可使用;在切片中,loc是閉區(qū)間,iloc是半開區(qū)間。

獲取指定數(shù)據(jù)的寫法:

(1)獲取全部數(shù)據(jù):
df.loc[: , :].values

df.iloc[: , :].values,返回類型為ndarray(二維)。

(2)獲取某個(gè)值:
無表頭
df.loc[i, j]

df.iloc[i, j],第i行第j列的值,返回類型依內(nèi)容而定。

有表頭
df.loc[i, "序號(hào)"],第i行‘序號(hào)’列的值。

df.iloc[i, j],第i行第j列的值。

(3)獲取某一行:
df.loc[i].values

df.iloc[i].values,第i行數(shù)據(jù),返回類型為ndarray(一維)。

(4)獲取多行:
df.loc[[i1, i2, i3]].values,

df.iloc[[i1, i2, i3]].values,第i1、i2、i3行數(shù)據(jù),返回類型為ndarray(二維)。

(5)獲取某一列:
無表頭
df.loc[:, j].values

df.iloc[:, j].values,第j列數(shù)據(jù),返回類型為ndarray(一維)。

有表頭
df.loc[:,"姓名"].values,‘姓名’列數(shù)據(jù),返回類型為ndarray(一維)。

df.iloc[:, j].values,第j列數(shù)據(jù),返回類型為ndarray(一維)。

(6)獲取多列:
無表頭
df.loc[:, [j1 , j2]].values

df.iloc[:, [j1 , j2]].values,第j1、j2列數(shù)據(jù),返回類型為ndarray(二維)。

有表頭
df.loc[:, ["姓名","性別"]].values,‘姓名’、‘性別’列數(shù)據(jù),返回類型為ndarray(二維);
df.iloc[:, [j1 , j2]].values,第j1、j2列數(shù)據(jù),返回類型為ndarray(二維)。

(7)獲取切片:
無表頭
df.loc[i1:i2, j1:j2].values,返回行號(hào)[i1,i2]、列號(hào)[j1,j2]閉區(qū)間內(nèi)的數(shù)據(jù),返回類型為ndarray(二維);
df.iloc[i1:i2, j1:j2].values,返回行號(hào)[i1,i2)、列號(hào)[j1,j2)左閉右開區(qū)間內(nèi)的數(shù)據(jù),返回類型為ndarray(二維)。

有表頭
df.loc[i1:i2, "序號(hào)":"姓名"].values,返回行號(hào)[i1,i2]、列號(hào)["序號(hào)","姓名"]閉區(qū)間的數(shù)據(jù),返回類型為ndarray(二維);
df.iloc[i1:i2, j1:j2].values,返回行號(hào)[i1,i2)、列號(hào)[j1,j2)左閉右開區(qū)間內(nèi)的數(shù)據(jù),返回類型為ndarray(二維)。

2.示例

帶表頭,excel內(nèi)容為

Python腳本為:

import pandas as pd

df = pd.read_excel("data_test.xlsx")

print("\n(1)全部數(shù)據(jù):")
print(df.iloc[:,:].values)

print("\n(2)第2行第3列的值:")
print(df.iloc[1,2])

print("\n(3)第3行數(shù)據(jù):")
print(df.iloc[2].values)

print("\n(4)第2列數(shù)據(jù):")
print(df.iloc[:,1].values)

print("\n(5)第6行的姓名:")
print(df.loc[5,"姓名"])

print("\n(6)第2至3行、第3至4列數(shù)據(jù):")
print(df.iloc[1:3,2:4].values)

執(zhí)行結(jié)果:

到此這篇關(guān)于使用python的pandas讀取excel文件中的數(shù)據(jù)詳情的文章就介紹到這了,更多相關(guān)python 讀取excel文件 內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!希望大家以后多多支持腳本之家!

相關(guān)文章

  • 詳解Python?Requests庫(kù)中的重試策略

    詳解Python?Requests庫(kù)中的重試策略

    在Python中,requests庫(kù)是處理HTTP請(qǐng)求的標(biāo)準(zhǔn)工具之一,這篇文章主要為大家介紹了如何在requests中實(shí)現(xiàn)請(qǐng)求的自動(dòng)重試,感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下
    2023-11-11
  • python同步兩個(gè)文件夾下的內(nèi)容

    python同步兩個(gè)文件夾下的內(nèi)容

    這篇文章主要為大家詳細(xì)介紹了python同步兩個(gè)文件夾下的內(nèi)容,包括子文件夾,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2019-08-08
  • Python遍歷指定文件夾下的所有文件名的方法小結(jié)

    Python遍歷指定文件夾下的所有文件名的方法小結(jié)

    當(dāng)需要遍歷指定文件夾下的所有文件名時(shí),Python提供了多種方法來實(shí)現(xiàn)這個(gè)任務(wù),本文將介紹如何使用Python來完成這一任務(wù),有需要的小伙伴可以參考下
    2024-01-01
  • python中使用zip函數(shù)出現(xiàn)<zip object at 0x02A9E418>錯(cuò)誤的原因

    python中使用zip函數(shù)出現(xiàn)<zip object at 0x02A9E418>錯(cuò)誤的原因

    這篇文章主要介紹了python中使用zip函數(shù)出現(xiàn)<zip object at 0x02A9E418>錯(cuò)誤的原因分析及解決方法,需要的朋友可以參考下
    2018-09-09
  • python刪除列表元素del,pop(),remove()及clear()

    python刪除列表元素del,pop(),remove()及clear()

    這篇文章主要介紹了python刪除列表元素del,pop(),remove()及clear(),列表元素能增加就可以刪除,這里要給大家介紹的是刪除列表元素,具有一定的參考價(jià)值,需要的小伙伴可以參考一下
    2022-03-03
  • Matplotlib繪圖基礎(chǔ)之圖例詳解

    Matplotlib繪圖基礎(chǔ)之圖例詳解

    Matplotlib?中的圖例是幫助觀察者理解圖像數(shù)據(jù)的重要工具,通常包含在圖像中,用于解釋不同的顏色、形狀、標(biāo)簽和其他元素,下面我們就來看看在繪圖時(shí)如何靈活運(yùn)用圖例吧
    2023-08-08
  • python游戲地圖最短路徑求解

    python游戲地圖最短路徑求解

    這篇文章主要為大家詳細(xì)介紹了python游戲地圖最短路徑的求解,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2019-01-01
  • Python函數(shù)中4種參數(shù)的使用教程

    Python函數(shù)中4種參數(shù)的使用教程

    這篇文章主要介紹了Python函數(shù)中4種參數(shù)的使用包括必需的參數(shù),關(guān)鍵字參數(shù),缺省參數(shù),不定長(zhǎng)參數(shù)的相關(guān)介紹,本文通過實(shí)例代碼給大家介紹的非常詳細(xì),需要的朋友可以參考下
    2021-11-11
  • pytorch 運(yùn)行一段時(shí)間后出現(xiàn)GPU OOM的問題

    pytorch 運(yùn)行一段時(shí)間后出現(xiàn)GPU OOM的問題

    這篇文章主要介紹了pytorch 運(yùn)行一段時(shí)間后出現(xiàn)GPU OOM的問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2021-06-06
  • Python實(shí)現(xiàn)的數(shù)據(jù)結(jié)構(gòu)與算法之隊(duì)列詳解

    Python實(shí)現(xiàn)的數(shù)據(jù)結(jié)構(gòu)與算法之隊(duì)列詳解

    這篇文章主要介紹了Python實(shí)現(xiàn)的數(shù)據(jù)結(jié)構(gòu)與算法之隊(duì)列,詳細(xì)分析了隊(duì)列的定義、功能與Python實(shí)現(xiàn)隊(duì)列的相關(guān)技巧,以及具體的用法,需要的朋友可以參考下
    2015-04-04

最新評(píng)論