欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

一文搞懂Pandas數(shù)據(jù)透視的4個(gè)函數(shù)的使用

 更新時(shí)間:2022年06月16日 16:08:32   作者:Python丁小杰  
今天主要和大家分享Pandas中四種有關(guān)數(shù)據(jù)透視的通用函數(shù),在數(shù)據(jù)處理中遇到這類需求時(shí),能夠很好地應(yīng)對(duì),快跟隨小編一起學(xué)習(xí)一下吧

大家好,我是丁小杰!

今天和大家分享Pandas中四種有關(guān)數(shù)據(jù)透視的通用函數(shù),在數(shù)據(jù)處理中遇到這類需求時(shí),能夠很好地應(yīng)對(duì)。

pandas.melt()

melt函數(shù)的主要作用是將DataFrame從寬格式轉(zhuǎn)換成長(zhǎng)格式。

pandas.melt(frame,id_vars=None, value_vars=None, var_name=None, value_name='value', col_level=None, ignore_index=True)

參數(shù)含義

  • id_vars:tuple, list, or ndarray,可選,作為標(biāo)識(shí)符變量的列
  • value_vars:tuple, list, or ndarray, 可選,透視列,如果未指定,則使用未設(shè)置為id_vars的所有列。
  • var_name:scalar,默認(rèn)為None,使用variable作為列名
  • value_name:標(biāo)量, default ‘value’,value列的名稱
  • col_level:int or str, 可選,如果列是多層索引,melt將應(yīng)用于指定級(jí)別
  • ignore_index:bool, 默認(rèn)為True,相當(dāng)于從0開始重新排序。如果為False,則保留原來(lái)的索引,索引標(biāo)簽將出現(xiàn)重復(fù)。

看個(gè)例子先:

import?pandas?as?pd

df?=?pd.DataFrame(
????{'地區(qū)':?['A',?'B',?'C'],
?????'2020':?[80,?60,?40],
?????'2021':?[800,?600,?400],?
?????'2022':?[8000,?6000,?4000]})

pd.melt(df,
????????id_vars=['地區(qū)'],
????????value_vars=['2020',?'2021',?'2022'])

設(shè)置var_namevalue_name

df?=?pd.melt(df,
?????????????id_vars=['地區(qū)'],
?????????????value_vars=['2020',?'2021',?'2022'],
?????????????var_name='年份',
?????????????value_name='銷售額')

pandas.pivot()

pivot函數(shù)主要用于通過索引及列值對(duì)DataFrame重構(gòu)。

pandas.pivot(data, index=None, columns=None, values=None)

參數(shù)含義

  • data:DataFrame對(duì)象
  • index:可選,用于新DataFrame的索引
  • columns:用于創(chuàng)建新DataFrame的列
  • values:可選,用于填充新DataFrame的值

用上面的結(jié)果舉個(gè)例子:

df.pivot(index='年份',
?????????columns='地區(qū)',
?????????values='銷售額')

也可以寫成以下格式。

df.pivot(index='年份',?columns='地區(qū)')['銷售額']

添加一個(gè)銷量列,同時(shí)統(tǒng)計(jì)兩個(gè)values,這樣會(huì)使columns變成多層索引。

df['銷量']?=?df['銷售額']/10
df.pivot(index='年份',
?????????columns='地區(qū)',
?????????values=['銷售額',?'銷量'])

添加一個(gè)月份列,指定兩個(gè)index

df['月份']?=?[f'{m}月'?for?m?in?range(1,?4)]*3
df.pivot(index=['年份',?'月份'],
?????????columns='地區(qū)',
?????????values='銷售額')

使用pivot時(shí)需要注意,當(dāng)index,columns出現(xiàn)重復(fù)時(shí),會(huì)導(dǎo)致ValueError。

df?=?pd.DataFrame(
????????{'地區(qū)':?['A',?'A',?'B',?'C'],
?????????'年份':?['2020',?'2020',?'2021',?'2022'],
?????????'銷售額':?[800,?600,?400,?200]})

df.pivot(index='地區(qū)',
?????????columns='年份',
?????????values='銷售額')
#?ValueError

pandas.pivot_table()

這個(gè)函數(shù)之前已經(jīng)單獨(dú)講過了,詳見Pandas玩轉(zhuǎn)數(shù)據(jù)透視表,相比于pivotpivot_table的靈活性更強(qiáng)。

pandas.crosstab()

crosstab函數(shù)計(jì)算兩個(gè)(或多個(gè))數(shù)組的簡(jiǎn)單交叉表。默認(rèn)情況下計(jì)算元素的頻率表。

pandas.crosstab(index, columns, values=None, rownames=None, colnames=None, aggfunc=None, margins=False, margins_name='All', dropna=True, normalize=False)

看下例子:

這里默認(rèn)計(jì)算頻率。

import?numpy?as?np
array_A?=?np.array(["one",?"two",?"two",?"three",?"three",?"three"],?dtype=object)
array_B?=?np.array(["Python",?"Python",?"Python",?"C",?"C",?"C"],?dtype=object)
array_C?=?np.array(["Y",?"Y",?"Y",?"N",?"N",?"N"])
pd.crosstab(array_A,
???????????[array_B,?array_C],
???????????rownames=['array_A'],
???????????colnames=['array_B',?'array_C'])

新建一個(gè)values列,計(jì)算總和。

array_D?=?np.array([1,?4,?9,?16,?25,?36])
pd.crosstab(index=array_A,
????????????columns=[array_B,?array_C],
????????????rownames=['array_A'],
????????????colnames=['array_B',?'array_C'],
????????????values=array_D,
????????????aggfunc='sum')

到此這篇關(guān)于一文搞懂Pandas數(shù)據(jù)透視的4個(gè)函數(shù)的使用的文章就介紹到這了,更多相關(guān)Pandas數(shù)據(jù)透視內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • 基于Python3中運(yùn)算符 **和*的區(qū)別說明

    基于Python3中運(yùn)算符 **和*的區(qū)別說明

    這篇文章主要介紹了Python3中運(yùn)算符 **和*的具體區(qū)別,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2021-05-05
  • 詳解python requests中的post請(qǐng)求的參數(shù)問題

    詳解python requests中的post請(qǐng)求的參數(shù)問題

    這篇文章主要介紹了詳解python requests中的post請(qǐng)求的參數(shù)問題,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2021-03-03
  • Python使用技巧之實(shí)現(xiàn)Excel轉(zhuǎn)為PDF

    Python使用技巧之實(shí)現(xiàn)Excel轉(zhuǎn)為PDF

    這篇文章主要為大家詳細(xì)介紹了使用第三方Python庫(kù)Spire.XLS?for?Python?實(shí)現(xiàn)Excel轉(zhuǎn)PDF的簡(jiǎn)單方法,文中的示例代碼講解詳細(xì),需要的可以參考下
    2023-11-11
  • Python讀取stdin方法實(shí)例

    Python讀取stdin方法實(shí)例

    在本篇文章中小編給大家分享了關(guān)于Python里如何讀取stdin的知識(shí)點(diǎn)以及相關(guān)實(shí)例內(nèi)容,需要的朋友們學(xué)習(xí)參考下。
    2019-05-05
  • 利用Python將多張圖片合成視頻的實(shí)現(xiàn)

    利用Python將多張圖片合成視頻的實(shí)現(xiàn)

    這篇文章主要介紹了利用Python將多張圖片合成視頻的實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2020-11-11
  • 如何利用python給微信公眾號(hào)發(fā)消息實(shí)例代碼

    如何利用python給微信公眾號(hào)發(fā)消息實(shí)例代碼

    使用過微信公眾號(hào)的小伙伴應(yīng)該知道微信公眾號(hào)有時(shí)候會(huì)給你推一些文章,當(dāng)你選擇它的某個(gè)功能時(shí),它還會(huì)返回一些信息,下面這篇文章主要給大家介紹了關(guān)于如何利用python給微信公眾號(hào)發(fā)消息的相關(guān)資料,需要的朋友可以參考下
    2022-03-03
  • python 隨機(jī)森林算法及其優(yōu)化詳解

    python 隨機(jī)森林算法及其優(yōu)化詳解

    這篇文章主要介紹了ptyhon 隨機(jī)森林算法及其優(yōu)化詳解,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2019-07-07
  • Python urllib3軟件包的使用說明

    Python urllib3軟件包的使用說明

    這篇文章主要介紹了Python urllib3軟件包的使用說明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來(lái)看看吧
    2020-11-11
  • Python用requests庫(kù)爬取返回為空的解決辦法

    Python用requests庫(kù)爬取返回為空的解決辦法

    這篇文章主要介紹了Python用requests庫(kù)爬取返回為空的解決辦法,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2021-02-02
  • 如何查看python中安裝庫(kù)的文件位置

    如何查看python中安裝庫(kù)的文件位置

    這篇文章主要介紹了查看python中安裝庫(kù)的文件位置的方法,python自帶標(biāo)準(zhǔn)庫(kù)位置在安裝環(huán)境的lib文件夾下的.py文件都是,在環(huán)境的lib文件夾中,本文給大家詳細(xì)講解需要的朋友可以參考下
    2022-11-11

最新評(píng)論