Python中pandas庫的常用操作實例
pandas庫常用操作
series
使用列表創(chuàng)建
import pandas as pd data = pd.Series([i for i in range(4)],index=['a','b','c','d']) data
使用字典創(chuàng)建
import pandas as pd
dict1 = {"a":0,"b":1,"c":2,"d":3}
data = pd.Series(dict1)
dataDataFrame
使用數(shù)組創(chuàng)建
import pandas as pd import numpy as np arr = np.array([i for i in range(12)]).reshape(3,4) data = pd.DataFrame(arr) data
指定列索引
import pandas as pd import numpy as np arr = np.array([i for i in range(12)]).reshape(3,4) data = pd.DataFrame(arr,columns=['a','b','c','d']) data
index
查詢索引
#series import pandas as pd data = pd.Series([i for i in range(3)],index=['a','b','c']) data.index #DataFrame import pandas as pd import numpy as np arr = np.array([i for i in range(9)]).reshape(3,3) data = pd.DataFrame(arr,columns=['a','b','c']) data.columns
查詢索引
#series import pandas as pd data = pd.Series([i for i in range(3)],index=['a','b','c']) data[2] #2 data['c'] #2 data[0:2] #0,1 data['a':'c'] #0,1 data[[0,2]] #0,2 data[['a','c']] #0,2 #dataframe import pandas as pd import numpy as np arr = np.array([i for i in range(9)]).reshape(3,3) data = pd.DataFrame(arr,columns=['a','b','c']) data['a'] """" 0 0 1 3 2 6 """" data[['a','c']] """" a c 0 0 2 1 3 5 2 6 8 """" data[:2] """ a b c 0 0 1 2 1 3 4 5 """ ##loc是index,iloc是行號 data.loc[:,["a","c"]] data.iloc[:,[0,2]]
sort
sort in index
#series import pandas as pd data = pd.Series([1,3,0],index=['a','b','c']) data.sort_index(axis=0) data.sort_index(axis=0,ascending=False) #DataFrame import pandas as pd import numpy as np data = pd.DataFrame(np.arange(9).reshape(3,3),columns=['a','b','c']) data.sort_index()
sort in values
#series import pandas as pd data = pd.Series([1,3,0],index=['a','b','c']) data.sort_values(axis=0) data.sort_values(axis=0,ascending=False) #DataFrame import pandas as pd import numpy as np data = pd.DataFrame(np.arange(9).reshape(3,3),columns=['a','b','c']) data.sort_values() data.sort_values(by='a')
multidnex
read , write file
import pandas as pd data = pd.DataFrame(np.arange(9).reshape(3,3),columns=['a','b','c']) data.to_csv(r'./data.csv',index=False) data = pd.read_csv(r'./data.csv') data import pandas as pd data = pd.DataFrame(np.arange(9).reshape(3,3),columns=['a','b','c']) data.to_excel(r'./data.xlsx',index=False) data = pd.read_excel(r'./data.xlsx') data
空值和缺失值處理
import pandas as pd import numpy as np from numpy import NaN data = pd.Series([1,NaN,3]) data.isnull() #delete data.dropna() #fill data.fillna(6)
#重復(fù)值處理
import pandas as pd
data = pd.DataFrame({'id': [1, 2, 3, 4, 4, 5],
'name': ['小銘', '小月月', '彭巖', '劉華', '劉華', '周華'],
'age': [18, 18, 29, 58, 58, 36],
'height': [180, 180, 185, 175, 175, 178],
'gender': ['女', '女', '男', '男', '男', '男']})
data.duplicated()
data.duplicateds()更改數(shù)據(jù)類型
import pandas as pd
dict1 = {'A':['5', '6', '7'], 'B':['3', '2', '1']}
data = pd.DataFrame(dict1)
data.dtypes
data = pd.DataFrame(dict1,dtype='int')
data.dtypes
data.astype(dtype='float')數(shù)據(jù)合并
import pandas as pd
data1 = pd.DataFrame({'A': ['A0', 'A0', 'A1'],
'B': ['B0', 'B0', 'B1']})
data2 = pd.DataFrame({'C': ['C0', 'C0', 'C1', 'C3'],
'D': ['D0', 'D2', 'D2', 'D3']})
# 橫向堆疊合并df1和df2,采用外連接的方式
pd.concat([data1,data2], join='outer',axis=1)數(shù)據(jù)聚合和組內(nèi)運算
import pandas as pd
import numpy as np
dict1 = {"Key":['C','B','C','A','B','B','A','C','A'],"Data":[2,4,6,8,10,1,14,16,18]}
data = pd.DataFrame(dict1)
data
for i in pd.groupby(by='Key'):
print(i)到此這篇關(guān)于Python中pandas庫的常用操作實例的文章就介紹到這了,更多相關(guān)pandas庫的常用操作內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
matplotlib基礎(chǔ)繪圖命令之errorbar的使用
這篇文章主要介紹了matplotlib基礎(chǔ)繪圖命令之errorbar的使用,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-08-08
用python對excel進(jìn)行操作(讀,寫,修改)
這篇文章主要介紹了用python對excel進(jìn)行操作(讀,寫,修改),幫助大家更好的利用python處理表格,感興趣的朋友可以了解下2020-12-12
Python如何基于Tesseract實現(xiàn)識別文字功能
這篇文章主要介紹了Python如何基于Tesseract實現(xiàn)識別文字功能,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2020-06-06
Python容器使用的5個技巧和2個誤區(qū)總結(jié)
在本篇文章里小編給大家整理的是關(guān)于Python容器使用的5個技巧和2個誤區(qū)的相關(guān)知識點內(nèi)容,需要的朋友們學(xué)習(xí)下。2019-09-09
VSCode設(shè)置類似Pycharm控制臺運行Python顯示中間變量的步驟
這篇文章主要介紹了如何在VSCode中設(shè)置調(diào)試功能,以實現(xiàn)類似于Pycharm在控制臺輸出中間變量的功能,文中通過圖文介紹的非常詳細(xì),需要的朋友可以參考下2025-03-03

