快捷導(dǎo)航

Python中的pandas庫簡介及其使用教程

更新時間：2022年11月08日 11:02:13 作者：搞點學(xué)術(shù)的研究生

pandas是用于數(shù)據(jù)挖掘的Python庫，Pandas中常見的數(shù)據(jù)結(jié)構(gòu)有Series和DateFrame兩種方式，今天通過本文給大家講解Python中的pandas庫簡介及其使用，感興趣你跟隨小編一起學(xué)習(xí)吧

pandas模塊

pandas是一個強大的分析結(jié)構(gòu)化數(shù)據(jù)的工具集；它的使用基礎(chǔ)是Numpy（提供高性能的矩陣運算）；用于數(shù)據(jù)挖掘和數(shù)據(jù)分析，同時也提供數(shù)據(jù)清洗功能。

Pandas中常見的數(shù)據(jù)結(jié)構(gòu)有兩種：

Series	DateFrame
類似一維數(shù)組的對象，	類似多維數(shù)組/表格數(shù)組；每列數(shù)據(jù)可以是不同的類型；索引包括列索引和行索引。

Count	非NA值得數(shù)量
describe	針對Series或各DataFrame列計算匯總統(tǒng)計
min\max	計算最小值和最大值
argmin\argmax	計算能夠獲取到最大值或最小值的索引位置
idxmin\idxmax	計算能夠獲取到最小值和最大值的索引值
quantile	計算樣本的分位數(shù)（0-1）
sum	值得總和
mean	值得平均值
median	值的算術(shù)中位數(shù)（50%分位數(shù)）
mad	根據(jù)平均值計算平均絕對離差
var	樣本值得方差
std	樣本值得標(biāo)準(zhǔn)差
skew	樣本值的偏度（三階距）
kurt	樣本值的峰度（四階距）
cumsum	樣本值的累計和
cummin\cummax	樣本值的累計最大值和累計最小值
cumprod	樣本值的累計積
diff	計算一階差分（對時間序列很有用）
pct_change	計算百分?jǐn)?shù)變化

Df[filter_condition]依據(jù)filter_condition(條件)對Df(數(shù)據(jù))進行過濾。

Plot(kind,x,y,title,figsize)
Kind(繪制什么形式的圖),x（x軸內(nèi)容）,y（y軸內(nèi)容）,title（圖標(biāo)題）,figsize（圖大?。?/pre>

保存圖片：plt.savefig()

（"The fool doth think he is wise, but the wise man knows himself to be a fool." --威廉·莎士比亞）

到此這篇關(guān)于Python中的pandas庫簡介及其使用的文章就介紹到這了,更多相關(guān)Python pandas庫內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: