python?Pandas之DataFrame索引及選取數(shù)據(jù)
1.索引是什么
1.1 認識索引
先創(chuàng)建一個簡單的DataFrame。
myList = [['a', 10, 1.1], ['b', 20, 2.2], ['c', 30, 3.3], ['d', 40, 4.4]] df1 = pd.DataFrame(data = myList) print(df1) -------------------------------- [out]: 0 1 2 0 a 10 1.1 1 b 20 2.2 2 c 30 3.3 3 d 40 4.4
DataFrame中有兩種索引:
- 行索引(index):對應最左邊那一豎列
- 列索引(columns):對應最上面那一橫行
兩種索引默認均為從0開始的自增整數(shù)。
# 輸出行索引 print(df1.index) [out]: RangeIndex(start=0, stop=4, step=1) --------------------------------------- # 輸出列索引 print(df1.columns) [out]: RangeIndex(start=0, stop=3, step=1) --------------------------------------- # 輸出所有的值 print(df1.values) [out]: array([['a', 10, 1.1], ['b', 20, 2.2], ['c', 30, 3.3], ['d', 40, 4.4]], dtype=object)
1.2 自定義索引
可以使用 index 這個參數(shù)指定行索引,columns 這個參數(shù)指定列索引。
df2 = pd.DataFrame(myList, index = ['one', 'two', 'three', 'four'], columns = ['char', 'int', 'float']) print(df2) ----------------------------------------------------------- [out]: char int float one a 10 1.1 two b 20 2.2 three c 30 3.3 four d 40 4.4
輸出此時的行索引和列索引:
# 輸出行索引
print(df2.index)
[out]:
Index(['one', 'two', 'three', 'four'], dtype='object')
--------------------------------------------------------
# 輸出列索引
print(df2.columns)
[out]:
Index(['char', 'int', 'float'], dtype='object')
2. 索引的簡單使用
2.1 列索引
選擇一列:
print(df2['char']) print(df2.char) # 兩種方式輸出一樣 [out]: one a two b three c four d Name: char, dtype: object
注意此時方括號里面只傳入一個字符串’char’,這樣選出來的一列,結果的類型為Series
print(df2['char']) print(df2.char) # 兩種方式輸出一樣 [out]: one a two b three c four d Name: char, dtype: object
選擇多列:
print(df2[['char', 'int']]) [out]: char int one a 10 two b 20 three c 30 four d 40
注意此時方括號里面?zhèn)魅胍粋€列表 [‘char’, ‘int’],選出的結果類型為 DataFrame。
如果只想選出來一列,卻想返回 DataFrame 類型怎么辦?
print(df2[['char']]) [out]: char one a two b three c four d --------------------------------------- type(df2[['char']]) [out]:pandas.core.frame.DataFrame
注意直接使用df2[0]取某一列會報錯,除非columns是由下標索引組成的,比如df1那個樣子,df1[0]就不會報錯。
print(df1[0]) [out]: 0 a 1 b 2 c 3 d Name: 0, dtype: object ----------------------- print(df2[0]) [out]: KeyError: 0
2.2 行索引
2.2.1 使用[ ]
區(qū)別于選取列,此種方式[ ]中不再單獨的傳入一個字符串,而是需要使用冒號切片。
選取行標簽從 ’two’ 到 ’three’ 的多行數(shù)據(jù)
print(df2['two': 'three']) [out]: char int float two b 20 2.2 three c 30 3.3
選取行標簽為’two’這一行數(shù)據(jù)
# 此時返回的類型為DataFrame print(df2['two': 'two']) [out]: char int float two b 20 2.2
在[ ]中不僅可以傳入行標簽,還可以傳入行的編號。
選取從第1行到第3行的數(shù)據(jù)(編號從0開始)
print(df2[1:4]) [out]: char int float two b 20 2.2 three c 30 3.3 four d 40 4.4
可以看到選取的數(shù)據(jù)是不包含方括號最右側的編號所對應的數(shù)據(jù)的。
選取第1行的數(shù)據(jù)
print(df2[1:2]) [out]: char int float two b 20 2.2
2.2.2 使用.loc()和.iloc()
區(qū)別就是.loc()是根據(jù)行索引和列索引的值來選取數(shù)據(jù),而.iloc()是根據(jù)從0開始的下標位置來進行索引的。
選取行:
使用.loc()
print(df2.loc['one']) [out]: char a int 10 float 1.1 Name: one, dtype: object ------------------------------------------- print(df2.loc[['one', 'three']]) [out]: char int float one a 10 1.1 three c 30 3.3
使用.iloc()
print(df2.iloc[0]) [out]: char a int 10 float 1.1 Name: one, dtype: object ------------------------------------------- print(df2.iloc[[0, 2]]) [out]: char int float one a 10 1.1 three c 30 3.3
到此這篇關于python Pandas之DataFrame索引及選取數(shù)據(jù)的文章就介紹到這了,更多相關python DataFrame索引 內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
Alpine安裝Python3依賴出現(xiàn)的問題及解決方法
這篇文章主要介紹了Alpine安裝Python3依賴出現(xiàn)的問題及解決方法,本文給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-12-12Python threading模塊中l(wèi)ock與Rlock的使用詳細講解
python的thread模塊是比較底層的模塊,python的threading模塊是對thread做了一些包裝的,可以更加方便的被使用。這篇文章主要介紹了Python threading模塊中l(wèi)ock與Rlock的使用2022-10-10Python基于文件內(nèi)容實現(xiàn)查找文件功能
無論是Linux系統(tǒng)還是Windows系統(tǒng)都有基于文件名實現(xiàn)過濾、查找的功能。但是如果想要查找一些關于某些文件指定內(nèi)容的文件,好像它們明面上沒有這樣的功能了。這個時候就可以通過 Python 來實現(xiàn)這樣的功能,快跟隨小編一起學習一下吧2022-05-05