Python中的pandas庫(kù)簡(jiǎn)介及其使用教程
pandas模塊
pandas是一個(gè)強(qiáng)大的分析結(jié)構(gòu)化數(shù)據(jù)的工具集;它的使用基礎(chǔ)是Numpy(提供高性能的矩陣運(yùn)算);用于數(shù)據(jù)挖掘和數(shù)據(jù)分析,同時(shí)也提供數(shù)據(jù)清洗功能。
- 便捷的數(shù)據(jù)處理能力
- 獨(dú)特的數(shù)據(jù)結(jié)構(gòu)
- 讀取文件方便
- 封裝了matplotlib的畫圖和numpy的計(jì)算
Pandas中常見(jiàn)的數(shù)據(jù)結(jié)構(gòu)有兩種:
Series | DateFrame |
---|---|
類似一維數(shù)組的對(duì)象, | 類似多維數(shù)組/表格數(shù)組;每列數(shù)據(jù)可以是不同的類型;索引包括列索引和行索引。 |
Series
- 構(gòu)建Series:
ser_obj = pd.Series(range(10))
- 由索引和數(shù)據(jù)組成(索引在左<自動(dòng)創(chuàng)建的>,數(shù)據(jù)在右)。
- 獲取數(shù)據(jù)和索引:
ser_obj.index; ser_obj.values
- 預(yù)覽數(shù)據(jù):
ser_obj.head(n);ser_obj.tail(n)
DateFrame
- 獲取列數(shù)據(jù):
df_obj[col_idx]或df_obj.col_idx
- 增加列數(shù)據(jù):
df_obj[new_col_idx] = data
- 刪除列:
del df_obj[col_idx]
- 按值排序:
sort_values(by = “label_name”)
常用方法
Count | 非NA值得數(shù)量 |
---|---|
describe | 針對(duì)Series或各DataFrame列計(jì)算匯總統(tǒng)計(jì) |
min\max | 計(jì)算最小值和最大值 |
argmin\argmax | 計(jì)算能夠獲取到最大值或最小值的索引位置 |
idxmin\idxmax | 計(jì)算能夠獲取到最小值和最大值的索引值 |
quantile | 計(jì)算樣本的分位數(shù)(0-1) |
sum | 值得總和 |
mean | 值得平均值 |
median | 值的算術(shù)中位數(shù)(50%分位數(shù)) |
mad | 根據(jù)平均值計(jì)算平均絕對(duì)離差 |
var | 樣本值得方差 |
std | 樣本值得標(biāo)準(zhǔn)差 |
skew | 樣本值的偏度(三階距) |
kurt | 樣本值的峰度(四階距) |
cumsum | 樣本值的累計(jì)和 |
cummin\cummax | 樣本值的累計(jì)最大值和累計(jì)最小值 |
cumprod | 樣本值的累計(jì)積 |
diff | 計(jì)算一階差分(對(duì)時(shí)間序列很有用) |
pct_change | 計(jì)算百分?jǐn)?shù)變化 |
處理缺失數(shù)據(jù)
- Dropna()丟棄缺失數(shù)據(jù)
- Fillna()填充缺失數(shù)據(jù)
數(shù)據(jù)過(guò)濾
Df[filter_condition]依據(jù)filter_condition(條件)對(duì)Df(數(shù)據(jù))進(jìn)行過(guò)濾。
繪圖功能
Plot(kind,x,y,title,figsize) Kind(繪制什么形式的圖),x(x軸內(nèi)容),y(y軸內(nèi)容),title(圖標(biāo)題),figsize(圖大?。?/pre>
保存圖片:plt.savefig()
("The fool doth think he is wise, but the wise man knows himself to be a fool." --威廉·莎士比亞
)
到此這篇關(guān)于Python中的pandas庫(kù)簡(jiǎn)介及其使用的文章就介紹到這了,更多相關(guān)Python pandas庫(kù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python兩個(gè)內(nèi)置函數(shù) locals 和globals(學(xué)習(xí)筆記)
這篇文章主要介紹了Python兩個(gè)內(nèi)置函數(shù) locals 和globals(學(xué)習(xí)筆記),需要的朋友可以參考下2016-08-08基于Python實(shí)現(xiàn)下載網(wǎng)易音樂(lè)代碼實(shí)例
這篇文章主要介紹了基于Python實(shí)現(xiàn)下載網(wǎng)易音樂(lè)代碼實(shí)例,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-08-08Django ORM框架的定時(shí)任務(wù)如何使用詳解
這篇文章主要給大家介紹了關(guān)于Django ORM框架的定時(shí)任務(wù)如何使用的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家學(xué)習(xí)或者使用django具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧。2017-10-10詳解python實(shí)現(xiàn)數(shù)據(jù)歸一化處理的方式:(0,1)標(biāo)準(zhǔn)化
這篇文章主要介紹了詳解python實(shí)現(xiàn)數(shù)據(jù)歸一化處理的方式:(0,1)標(biāo)準(zhǔn)化,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-07-07python實(shí)現(xiàn)QQ郵箱群發(fā)郵件實(shí)例
大家好,本篇文章主要講的是python實(shí)現(xiàn)QQ郵箱群發(fā)郵件實(shí)例,感興趣的同學(xué)趕快來(lái)看一看吧,對(duì)你有幫助的話記得收藏一下2022-01-01詳細(xì)分析Python可變對(duì)象和不可變對(duì)象
這篇文章主要介紹了Python可變對(duì)象和不可變對(duì)象的相關(guān)資料,文中講解非常細(xì)致,代碼幫助大家更好的理解和學(xué)習(xí),感興趣的朋友可以了解下2020-07-07Python讀取網(wǎng)頁(yè)內(nèi)容的方法
這篇文章主要介紹了Python讀取網(wǎng)頁(yè)內(nèi)容的方法,實(shí)例分析了Python基于URL讀取網(wǎng)頁(yè)內(nèi)容的相關(guān)技巧,具有一定參考借鑒價(jià)值,需要的朋友可以參考下2015-07-07