pandas應用實例之pivot函數(shù)詳解
1、pivot函數(shù)的定義
pivot(index=None,columns=None,values=None) -> DataFrame
2、pivot函數(shù)的說明
通過給定的索引(index)和列(column)的值重新生一個DataFrame對象。
根據(jù)列值對數(shù)據(jù)進行整形(生成一個“透視”表)。從指定的索引/列中使用唯一的值來形成結果數(shù)據(jù)幀的軸。此函數(shù)不支持數(shù)據(jù)聚合,多個值將導致列中的多索引。
3、pivo函數(shù)的參數(shù)
index:指定一列做為生成DataFrame對象的索引,如果為空則默認為原來的索引。
columns:指定一列的值作為列名,必須傳值。
values:指定一列作為生成DataFrame對象的值。可以為空。
4、pivot函數(shù)實例
df = pd.DataFrame({'foo': ['one', 'one', 'one', 'two', 'two', 'two'], 'bar': ['A', 'B', 'C', 'A', 'B', 'C'], 'baz': [1, 2, 3, 4, 5, 6], 'zoo': ['x', 'y', 'z', 'q', 'w', 't']})
# 指定foo的值為新dataframe的index,bar的值為columns,dataframe中對應的值為baz df.pivot(index='foo', columns='bar', values='baz')
# 沒有指定value,列名最外層保留原來的列,如下結果baz和zoo為原dataframe中的列名,新指定的列名bar在里層(暫時這么理解)。 df.pivot(index='foo', columns='bar')
# 可以通過索引的方式取指定的列數(shù)據(jù) df.pivot(index='foo', columns='bar')['baz']
# 可以指定多個values df.pivot(index='foo', columns='bar', values=['baz', 'zoo'])
# 指定多個columns df.pivot(index='foo', columns=['bar','baz'], values=['zoo'])
# 指定多個index df.pivot(index=['foo','bar'], columns='baz', values='zoo')
# 指定多個index可以通過index名取當個index的數(shù)據(jù) df.pivot(index=['foo','bar'], columns='baz', values='zoo').loc["one",:]
# 這兩行代碼運行將會報錯。 # 報錯提示:ValueError: Index contains duplicate entries, cannot reshape # 意思是指定的索引one有兩個列bar=A沖突了。 df = pd.DataFrame({"foo": ['one', 'one', 'two', 'two'], "bar": ['A', 'A', 'B', 'C'], "baz": [1, 2, 3, 4]}) df.pivot(index='foo', columns='bar', values='baz')
5、pivot函數(shù)在實際工作中解決的案例
現(xiàn)在要上圖中的不同code之間從2020-11-16到2020-11-18三天內(nèi)num序列數(shù)的相關性。
首先,dataframe對象可以直接調(diào)用函數(shù)corr()計算不同列之間的相關性,所以現(xiàn)在需要將原始的dataframe對象轉換成以code為列,date為索引,num為值的dataframe。
第一種比較笨的方法就是循環(huán),此方法不但代碼量較多而且在數(shù)據(jù)量很大時會比較耗時。不建議使用。
grouped = df.groupby(by=["code"]) df_num = pd.DataFrame() for name,group in grouped: d = pd.Series(data=group["num"].values,name=name) df_num = pd.concat([df_num,d],axis=1) df_close
第二種方法就是使用pivot函數(shù),一行代碼解決,運行快速。
df_num = df.pivot(index='date',columns='code',values='num')
想要的形式的dataframe生成了就可以直接調(diào)用corr()函數(shù)直接求出code之間的相關性了
# 計算列之間的相關性 df_num.corr()
總結
到此這篇關于pandas應用實例之pivot函數(shù)的文章就介紹到這了,更多相關pandas pivot函數(shù)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
python之生產(chǎn)者消費者模型實現(xiàn)詳解
這篇文章主要介紹了python之生產(chǎn)者消費者模型實現(xiàn)詳解,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下2019-07-07python for循環(huán)如何實現(xiàn)控制步長
這篇文章主要介紹了python for循環(huán)如何實現(xiàn)控制步長,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-05-05Python3實現(xiàn)統(tǒng)計單詞表中每個字母出現(xiàn)頻率的方法示例
這篇文章主要介紹了Python3實現(xiàn)統(tǒng)計單詞表中每個字母出現(xiàn)頻率的方法,涉及Python針對文件的讀取、遍歷、統(tǒng)計等相關操作技巧,需要的朋友可以參考下2019-01-01pytorch保存和加載模型的方法及如何load部分參數(shù)
本文總結了pytorch中保存和加載模型的方法,以及在保存的模型文件與新定義的模型的參數(shù)不一一對應時,我們該如何加載模型參數(shù),對pytorch保存和加載模型相關知識感興趣的朋友一起看看吧2024-03-03