Python中pandas庫的常用操作實例
更新時間:2023年07月29日 09:29:35 作者:菜菜01
這篇文章主要介紹了Python中pandas庫的常用操作實例,Pandas 庫是一個免費、開源的第三方 Python 庫,是 Python 數(shù)據(jù)分析必不可少的工具之一,它為 Python 數(shù)據(jù)分析提供了高性能,且易于使用的數(shù)據(jù)結(jié)構(gòu),即 Series 和 DataFrame,需要的朋友可以參考下
pandas庫常用操作
series
使用列表創(chuàng)建
import pandas as pd data = pd.Series([i for i in range(4)],index=['a','b','c','d']) data
使用字典創(chuàng)建
import pandas as pd dict1 = {"a":0,"b":1,"c":2,"d":3} data = pd.Series(dict1) data
DataFrame
使用數(shù)組創(chuàng)建
import pandas as pd import numpy as np arr = np.array([i for i in range(12)]).reshape(3,4) data = pd.DataFrame(arr) data
指定列索引
import pandas as pd import numpy as np arr = np.array([i for i in range(12)]).reshape(3,4) data = pd.DataFrame(arr,columns=['a','b','c','d']) data
index
查詢索引
#series import pandas as pd data = pd.Series([i for i in range(3)],index=['a','b','c']) data.index #DataFrame import pandas as pd import numpy as np arr = np.array([i for i in range(9)]).reshape(3,3) data = pd.DataFrame(arr,columns=['a','b','c']) data.columns
查詢索引
#series import pandas as pd data = pd.Series([i for i in range(3)],index=['a','b','c']) data[2] #2 data['c'] #2 data[0:2] #0,1 data['a':'c'] #0,1 data[[0,2]] #0,2 data[['a','c']] #0,2 #dataframe import pandas as pd import numpy as np arr = np.array([i for i in range(9)]).reshape(3,3) data = pd.DataFrame(arr,columns=['a','b','c']) data['a'] """" 0 0 1 3 2 6 """" data[['a','c']] """" a c 0 0 2 1 3 5 2 6 8 """" data[:2] """ a b c 0 0 1 2 1 3 4 5 """ ##loc是index,iloc是行號 data.loc[:,["a","c"]] data.iloc[:,[0,2]]
sort
sort in index
#series import pandas as pd data = pd.Series([1,3,0],index=['a','b','c']) data.sort_index(axis=0) data.sort_index(axis=0,ascending=False) #DataFrame import pandas as pd import numpy as np data = pd.DataFrame(np.arange(9).reshape(3,3),columns=['a','b','c']) data.sort_index()
sort in values
#series import pandas as pd data = pd.Series([1,3,0],index=['a','b','c']) data.sort_values(axis=0) data.sort_values(axis=0,ascending=False) #DataFrame import pandas as pd import numpy as np data = pd.DataFrame(np.arange(9).reshape(3,3),columns=['a','b','c']) data.sort_values() data.sort_values(by='a')
multidnex
read , write file
import pandas as pd data = pd.DataFrame(np.arange(9).reshape(3,3),columns=['a','b','c']) data.to_csv(r'./data.csv',index=False) data = pd.read_csv(r'./data.csv') data import pandas as pd data = pd.DataFrame(np.arange(9).reshape(3,3),columns=['a','b','c']) data.to_excel(r'./data.xlsx',index=False) data = pd.read_excel(r'./data.xlsx') data
空值和缺失值處理
import pandas as pd import numpy as np from numpy import NaN data = pd.Series([1,NaN,3]) data.isnull() #delete data.dropna() #fill data.fillna(6)
#重復值處理 import pandas as pd data = pd.DataFrame({'id': [1, 2, 3, 4, 4, 5], 'name': ['小銘', '小月月', '彭巖', '劉華', '劉華', '周華'], 'age': [18, 18, 29, 58, 58, 36], 'height': [180, 180, 185, 175, 175, 178], 'gender': ['女', '女', '男', '男', '男', '男']}) data.duplicated() data.duplicateds()
更改數(shù)據(jù)類型
import pandas as pd dict1 = {'A':['5', '6', '7'], 'B':['3', '2', '1']} data = pd.DataFrame(dict1) data.dtypes data = pd.DataFrame(dict1,dtype='int') data.dtypes data.astype(dtype='float')
數(shù)據(jù)合并
import pandas as pd data1 = pd.DataFrame({'A': ['A0', 'A0', 'A1'], 'B': ['B0', 'B0', 'B1']}) data2 = pd.DataFrame({'C': ['C0', 'C0', 'C1', 'C3'], 'D': ['D0', 'D2', 'D2', 'D3']}) # 橫向堆疊合并df1和df2,采用外連接的方式 pd.concat([data1,data2], join='outer',axis=1)
數(shù)據(jù)聚合和組內(nèi)運算
import pandas as pd import numpy as np dict1 = {"Key":['C','B','C','A','B','B','A','C','A'],"Data":[2,4,6,8,10,1,14,16,18]} data = pd.DataFrame(dict1) data for i in pd.groupby(by='Key'): print(i)
到此這篇關(guān)于Python中pandas庫的常用操作實例的文章就介紹到這了,更多相關(guān)pandas庫的常用操作內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
matplotlib基礎(chǔ)繪圖命令之errorbar的使用
這篇文章主要介紹了matplotlib基礎(chǔ)繪圖命令之errorbar的使用,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2020-08-08Python如何基于Tesseract實現(xiàn)識別文字功能
這篇文章主要介紹了Python如何基于Tesseract實現(xiàn)識別文字功能,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下2020-06-06Python容器使用的5個技巧和2個誤區(qū)總結(jié)
在本篇文章里小編給大家整理的是關(guān)于Python容器使用的5個技巧和2個誤區(qū)的相關(guān)知識點內(nèi)容,需要的朋友們學習下。2019-09-09VSCode設(shè)置類似Pycharm控制臺運行Python顯示中間變量的步驟
這篇文章主要介紹了如何在VSCode中設(shè)置調(diào)試功能,以實現(xiàn)類似于Pycharm在控制臺輸出中間變量的功能,文中通過圖文介紹的非常詳細,需要的朋友可以參考下2025-03-03