欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

pandas應(yīng)用實(shí)例之pivot函數(shù)詳解

 更新時(shí)間:2022年07月04日 15:38:16   作者:superY25  
最近在做基于python的數(shù)據(jù)分析工作,引用第三方數(shù)據(jù)分析庫(kù)pandas,所以下面這篇文章主要給大家介紹了關(guān)于pandas應(yīng)用實(shí)例之pivot函數(shù)的相關(guān)資料,文中通過(guò)圖文介紹的非常詳細(xì),需要的朋友可以參考下

1、pivot函數(shù)的定義

pivot(index=None,columns=None,values=None) -> DataFrame

2、pivot函數(shù)的說(shuō)明

通過(guò)給定的索引(index)和列(column)的值重新生一個(gè)DataFrame對(duì)象。

根據(jù)列值對(duì)數(shù)據(jù)進(jìn)行整形(生成一個(gè)“透視”表)。從指定的索引/列中使用唯一的值來(lái)形成結(jié)果數(shù)據(jù)幀的軸。此函數(shù)不支持?jǐn)?shù)據(jù)聚合,多個(gè)值將導(dǎo)致列中的多索引。

3、pivo函數(shù)的參數(shù)

index:指定一列做為生成DataFrame對(duì)象的索引,如果為空則默認(rèn)為原來(lái)的索引。

columns:指定一列的值作為列名,必須傳值。

values:指定一列作為生成DataFrame對(duì)象的值??梢詾榭铡?/p>

4、pivot函數(shù)實(shí)例

df = pd.DataFrame({'foo': ['one', 'one', 'one', 'two', 'two', 'two'],
                    'bar': ['A', 'B', 'C', 'A', 'B', 'C'],
                    'baz': [1, 2, 3, 4, 5, 6],
                    'zoo': ['x', 'y', 'z', 'q', 'w', 't']})

# 指定foo的值為新dataframe的index,bar的值為columns,dataframe中對(duì)應(yīng)的值為baz
df.pivot(index='foo', columns='bar', values='baz')

# 沒有指定value,列名最外層保留原來(lái)的列,如下結(jié)果baz和zoo為原dataframe中的列名,新指定的列名bar在里層(暫時(shí)這么理解)。
df.pivot(index='foo', columns='bar')

# 可以通過(guò)索引的方式取指定的列數(shù)據(jù)
df.pivot(index='foo', columns='bar')['baz']

# 可以指定多個(gè)values
df.pivot(index='foo', columns='bar', values=['baz', 'zoo'])

# 指定多個(gè)columns
df.pivot(index='foo', columns=['bar','baz'], values=['zoo'])

# 指定多個(gè)index
df.pivot(index=['foo','bar'], columns='baz', values='zoo')

# 指定多個(gè)index可以通過(guò)index名取當(dāng)個(gè)index的數(shù)據(jù)
df.pivot(index=['foo','bar'], columns='baz', values='zoo').loc["one",:]

# 這兩行代碼運(yùn)行將會(huì)報(bào)錯(cuò)。
# 報(bào)錯(cuò)提示:ValueError: Index contains duplicate entries, cannot reshape
# 意思是指定的索引one有兩個(gè)列bar=A沖突了。
df = pd.DataFrame({"foo": ['one', 'one', 'two', 'two'],
                   "bar": ['A', 'A', 'B', 'C'],
                   "baz": [1, 2, 3, 4]})
df.pivot(index='foo', columns='bar', values='baz')

5、pivot函數(shù)在實(shí)際工作中解決的案例

現(xiàn)在要上圖中的不同code之間從2020-11-16到2020-11-18三天內(nèi)num序列數(shù)的相關(guān)性。

首先,dataframe對(duì)象可以直接調(diào)用函數(shù)corr()計(jì)算不同列之間的相關(guān)性,所以現(xiàn)在需要將原始的dataframe對(duì)象轉(zhuǎn)換成以code為列,date為索引,num為值的dataframe。
第一種比較笨的方法就是循環(huán),此方法不但代碼量較多而且在數(shù)據(jù)量很大時(shí)會(huì)比較耗時(shí)。不建議使用。

grouped = df.groupby(by=["code"])
df_num = pd.DataFrame()
for name,group in grouped:
    d = pd.Series(data=group["num"].values,name=name)
    df_num = pd.concat([df_num,d],axis=1)

df_close

第二種方法就是使用pivot函數(shù),一行代碼解決,運(yùn)行快速。

df_num = df.pivot(index='date',columns='code',values='num')

想要的形式的dataframe生成了就可以直接調(diào)用corr()函數(shù)直接求出code之間的相關(guān)性了

# 計(jì)算列之間的相關(guān)性
df_num.corr()

總結(jié)

到此這篇關(guān)于pandas應(yīng)用實(shí)例之pivot函數(shù)的文章就介紹到這了,更多相關(guān)pandas pivot函數(shù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • python之生產(chǎn)者消費(fèi)者模型實(shí)現(xiàn)詳解

    python之生產(chǎn)者消費(fèi)者模型實(shí)現(xiàn)詳解

    這篇文章主要介紹了python之生產(chǎn)者消費(fèi)者模型實(shí)現(xiàn)詳解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2019-07-07
  • Python3.x和Python2.x的區(qū)別介紹

    Python3.x和Python2.x的區(qū)別介紹

    python3.x與python2.x區(qū)別很大,這里搜索了一些相關(guān)內(nèi)容,記錄在此,供自己學(xué)習(xí)參考,有需要的朋友不妨看看
    2013-02-02
  • python for循環(huán)如何實(shí)現(xiàn)控制步長(zhǎng)

    python for循環(huán)如何實(shí)現(xiàn)控制步長(zhǎng)

    這篇文章主要介紹了python for循環(huán)如何實(shí)現(xiàn)控制步長(zhǎng),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2022-05-05
  • Python3實(shí)現(xiàn)統(tǒng)計(jì)單詞表中每個(gè)字母出現(xiàn)頻率的方法示例

    Python3實(shí)現(xiàn)統(tǒng)計(jì)單詞表中每個(gè)字母出現(xiàn)頻率的方法示例

    這篇文章主要介紹了Python3實(shí)現(xiàn)統(tǒng)計(jì)單詞表中每個(gè)字母出現(xiàn)頻率的方法,涉及Python針對(duì)文件的讀取、遍歷、統(tǒng)計(jì)等相關(guān)操作技巧,需要的朋友可以參考下
    2019-01-01
  • python動(dòng)態(tài)加載技術(shù)解析

    python動(dòng)態(tài)加載技術(shù)解析

    這篇文章主要介紹了python動(dòng)態(tài)加載技術(shù)解析,說(shuō)簡(jiǎn)單點(diǎn)就是,如果開發(fā)者發(fā)現(xiàn)自己的代碼有bug,那么他可以在不關(guān)閉原來(lái)代碼的基礎(chǔ)之上,動(dòng)態(tài)替換模塊替換方法一般用reload來(lái)完成,需要的朋友可以參考下
    2023-07-07
  • django輕松使用富文本編輯器CKEditor的方法

    django輕松使用富文本編輯器CKEditor的方法

    最近由于需要在django admin中使用到富文本編輯器,由于我比較喜歡CKEditor富文本編輯器,于是就有了這篇文章,下面這篇文章主要給大家介紹了在django中輕松使用富文本編輯器CKEditor的方法,需要的朋友可以參考下。
    2017-03-03
  • 可視化工具PyVista多線程顯示多窗口的實(shí)例代碼

    可視化工具PyVista多線程顯示多窗口的實(shí)例代碼

    這篇文章主要介紹了可視化工具PyVista多線程顯示多窗口,本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2021-04-04
  • 分享Python字符串關(guān)鍵點(diǎn)

    分享Python字符串關(guān)鍵點(diǎn)

    字符串是 Python 中最常用的數(shù)據(jù)類型。我們可以使用引號(hào)來(lái)創(chuàng)建字符串,通過(guò)本篇文章給大家分享python字符串關(guān)鍵點(diǎn)相關(guān)資料,感興趣的朋友一起學(xué)習(xí)吧
    2015-12-12
  • 在python中對(duì)變量判斷是否為None的三種方法總結(jié)

    在python中對(duì)變量判斷是否為None的三種方法總結(jié)

    今天小編就為大家分享一篇在python中對(duì)變量判斷是否為None的三種方法總結(jié),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2019-01-01
  • pytorch保存和加載模型的方法及如何load部分參數(shù)

    pytorch保存和加載模型的方法及如何load部分參數(shù)

    本文總結(jié)了pytorch中保存和加載模型的方法,以及在保存的模型文件與新定義的模型的參數(shù)不一一對(duì)應(yīng)時(shí),我們?cè)撊绾渭虞d模型參數(shù),對(duì)pytorch保存和加載模型相關(guān)知識(shí)感興趣的朋友一起看看吧
    2024-03-03

最新評(píng)論