pandas應(yīng)用實(shí)例之pivot函數(shù)詳解
1、pivot函數(shù)的定義
pivot(index=None,columns=None,values=None) -> DataFrame
2、pivot函數(shù)的說(shuō)明
通過(guò)給定的索引(index)和列(column)的值重新生一個(gè)DataFrame對(duì)象。
根據(jù)列值對(duì)數(shù)據(jù)進(jìn)行整形(生成一個(gè)“透視”表)。從指定的索引/列中使用唯一的值來(lái)形成結(jié)果數(shù)據(jù)幀的軸。此函數(shù)不支持?jǐn)?shù)據(jù)聚合,多個(gè)值將導(dǎo)致列中的多索引。
3、pivo函數(shù)的參數(shù)
index:指定一列做為生成DataFrame對(duì)象的索引,如果為空則默認(rèn)為原來(lái)的索引。
columns:指定一列的值作為列名,必須傳值。
values:指定一列作為生成DataFrame對(duì)象的值??梢詾榭铡?/p>
4、pivot函數(shù)實(shí)例
df = pd.DataFrame({'foo': ['one', 'one', 'one', 'two', 'two', 'two'], 'bar': ['A', 'B', 'C', 'A', 'B', 'C'], 'baz': [1, 2, 3, 4, 5, 6], 'zoo': ['x', 'y', 'z', 'q', 'w', 't']})
# 指定foo的值為新dataframe的index,bar的值為columns,dataframe中對(duì)應(yīng)的值為baz df.pivot(index='foo', columns='bar', values='baz')
# 沒有指定value,列名最外層保留原來(lái)的列,如下結(jié)果baz和zoo為原dataframe中的列名,新指定的列名bar在里層(暫時(shí)這么理解)。 df.pivot(index='foo', columns='bar')
# 可以通過(guò)索引的方式取指定的列數(shù)據(jù) df.pivot(index='foo', columns='bar')['baz']
# 可以指定多個(gè)values df.pivot(index='foo', columns='bar', values=['baz', 'zoo'])
# 指定多個(gè)columns df.pivot(index='foo', columns=['bar','baz'], values=['zoo'])
# 指定多個(gè)index df.pivot(index=['foo','bar'], columns='baz', values='zoo')
# 指定多個(gè)index可以通過(guò)index名取當(dāng)個(gè)index的數(shù)據(jù) df.pivot(index=['foo','bar'], columns='baz', values='zoo').loc["one",:]
# 這兩行代碼運(yùn)行將會(huì)報(bào)錯(cuò)。 # 報(bào)錯(cuò)提示:ValueError: Index contains duplicate entries, cannot reshape # 意思是指定的索引one有兩個(gè)列bar=A沖突了。 df = pd.DataFrame({"foo": ['one', 'one', 'two', 'two'], "bar": ['A', 'A', 'B', 'C'], "baz": [1, 2, 3, 4]}) df.pivot(index='foo', columns='bar', values='baz')
5、pivot函數(shù)在實(shí)際工作中解決的案例
現(xiàn)在要上圖中的不同code之間從2020-11-16到2020-11-18三天內(nèi)num序列數(shù)的相關(guān)性。
首先,dataframe對(duì)象可以直接調(diào)用函數(shù)corr()計(jì)算不同列之間的相關(guān)性,所以現(xiàn)在需要將原始的dataframe對(duì)象轉(zhuǎn)換成以code為列,date為索引,num為值的dataframe。
第一種比較笨的方法就是循環(huán),此方法不但代碼量較多而且在數(shù)據(jù)量很大時(shí)會(huì)比較耗時(shí)。不建議使用。
grouped = df.groupby(by=["code"]) df_num = pd.DataFrame() for name,group in grouped: d = pd.Series(data=group["num"].values,name=name) df_num = pd.concat([df_num,d],axis=1) df_close
第二種方法就是使用pivot函數(shù),一行代碼解決,運(yùn)行快速。
df_num = df.pivot(index='date',columns='code',values='num')
想要的形式的dataframe生成了就可以直接調(diào)用corr()函數(shù)直接求出code之間的相關(guān)性了
# 計(jì)算列之間的相關(guān)性 df_num.corr()
總結(jié)
到此這篇關(guān)于pandas應(yīng)用實(shí)例之pivot函數(shù)的文章就介紹到這了,更多相關(guān)pandas pivot函數(shù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python之生產(chǎn)者消費(fèi)者模型實(shí)現(xiàn)詳解
這篇文章主要介紹了python之生產(chǎn)者消費(fèi)者模型實(shí)現(xiàn)詳解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-07-07python for循環(huán)如何實(shí)現(xiàn)控制步長(zhǎng)
這篇文章主要介紹了python for循環(huán)如何實(shí)現(xiàn)控制步長(zhǎng),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-05-05Python3實(shí)現(xiàn)統(tǒng)計(jì)單詞表中每個(gè)字母出現(xiàn)頻率的方法示例
這篇文章主要介紹了Python3實(shí)現(xiàn)統(tǒng)計(jì)單詞表中每個(gè)字母出現(xiàn)頻率的方法,涉及Python針對(duì)文件的讀取、遍歷、統(tǒng)計(jì)等相關(guān)操作技巧,需要的朋友可以參考下2019-01-01python動(dòng)態(tài)加載技術(shù)解析
這篇文章主要介紹了python動(dòng)態(tài)加載技術(shù)解析,說(shuō)簡(jiǎn)單點(diǎn)就是,如果開發(fā)者發(fā)現(xiàn)自己的代碼有bug,那么他可以在不關(guān)閉原來(lái)代碼的基礎(chǔ)之上,動(dòng)態(tài)替換模塊替換方法一般用reload來(lái)完成,需要的朋友可以參考下2023-07-07可視化工具PyVista多線程顯示多窗口的實(shí)例代碼
這篇文章主要介紹了可視化工具PyVista多線程顯示多窗口,本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-04-04在python中對(duì)變量判斷是否為None的三種方法總結(jié)
今天小編就為大家分享一篇在python中對(duì)變量判斷是否為None的三種方法總結(jié),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-01-01pytorch保存和加載模型的方法及如何load部分參數(shù)
本文總結(jié)了pytorch中保存和加載模型的方法,以及在保存的模型文件與新定義的模型的參數(shù)不一一對(duì)應(yīng)時(shí),我們?cè)撊绾渭虞d模型參數(shù),對(duì)pytorch保存和加載模型相關(guān)知識(shí)感興趣的朋友一起看看吧2024-03-03