一文搞懂Pandas數(shù)據(jù)透視的4個(gè)函數(shù)的使用
大家好,我是丁小杰!
今天和大家分享Pandas
中四種有關(guān)數(shù)據(jù)透視的通用函數(shù),在數(shù)據(jù)處理中遇到這類需求時(shí),能夠很好地應(yīng)對(duì)。
pandas.melt()
melt
函數(shù)的主要作用是將DataFrame
從寬格式轉(zhuǎn)換成長(zhǎng)格式。
“pandas.melt(frame,id_vars=None, value_vars=None, var_name=None, value_name='value', col_level=None, ignore_index=True)
”
參數(shù)含義
id_vars
:tuple, list, or ndarray,可選,作為標(biāo)識(shí)符變量的列value_vars
:tuple, list, or ndarray, 可選,透視列,如果未指定,則使用未設(shè)置為id_vars的所有列。var_name
:scalar,默認(rèn)為None,使用variable作為列名value_name
:標(biāo)量, default ‘value’,value列的名稱col_level
:int or str, 可選,如果列是多層索引,melt將應(yīng)用于指定級(jí)別ignore_index
:bool, 默認(rèn)為True,相當(dāng)于從0開始重新排序。如果為False,則保留原來(lái)的索引,索引標(biāo)簽將出現(xiàn)重復(fù)。
看個(gè)例子先:
import?pandas?as?pd df?=?pd.DataFrame( ????{'地區(qū)':?['A',?'B',?'C'], ?????'2020':?[80,?60,?40], ?????'2021':?[800,?600,?400],? ?????'2022':?[8000,?6000,?4000]})
pd.melt(df, ????????id_vars=['地區(qū)'], ????????value_vars=['2020',?'2021',?'2022'])
設(shè)置var_name
與value_name
。
df?=?pd.melt(df, ?????????????id_vars=['地區(qū)'], ?????????????value_vars=['2020',?'2021',?'2022'], ?????????????var_name='年份', ?????????????value_name='銷售額')
pandas.pivot()
pivot
函數(shù)主要用于通過索引及列值對(duì)DataFrame
重構(gòu)。
“pandas.pivot(data, index=None, columns=None, values=None)
”
參數(shù)含義
data
:DataFrame對(duì)象index
:可選,用于新DataFrame的索引columns
:用于創(chuàng)建新DataFrame的列values
:可選,用于填充新DataFrame的值
用上面的結(jié)果舉個(gè)例子:
df.pivot(index='年份', ?????????columns='地區(qū)', ?????????values='銷售額')
也可以寫成以下格式。
df.pivot(index='年份',?columns='地區(qū)')['銷售額']
添加一個(gè)銷量列,同時(shí)統(tǒng)計(jì)兩個(gè)values
,這樣會(huì)使columns
變成多層索引。
df['銷量']?=?df['銷售額']/10 df.pivot(index='年份', ?????????columns='地區(qū)', ?????????values=['銷售額',?'銷量'])
添加一個(gè)月份列,指定兩個(gè)index
。
df['月份']?=?[f'{m}月'?for?m?in?range(1,?4)]*3 df.pivot(index=['年份',?'月份'], ?????????columns='地區(qū)', ?????????values='銷售額')
使用pivot
時(shí)需要注意,當(dāng)index
,columns
出現(xiàn)重復(fù)時(shí),會(huì)導(dǎo)致ValueError
。
df?=?pd.DataFrame( ????????{'地區(qū)':?['A',?'A',?'B',?'C'], ?????????'年份':?['2020',?'2020',?'2021',?'2022'], ?????????'銷售額':?[800,?600,?400,?200]})
df.pivot(index='地區(qū)', ?????????columns='年份', ?????????values='銷售額') #?ValueError
pandas.pivot_table()
這個(gè)函數(shù)之前已經(jīng)單獨(dú)講過了,詳見Pandas玩轉(zhuǎn)數(shù)據(jù)透視表,相比于pivot
,pivot_table
的靈活性更強(qiáng)。
pandas.crosstab()
crosstab
函數(shù)計(jì)算兩個(gè)(或多個(gè))數(shù)組的簡(jiǎn)單交叉表。默認(rèn)情況下計(jì)算元素的頻率表。
“pandas.crosstab(index, columns, values=None, rownames=None, colnames=None, aggfunc=None, margins=False, margins_name='All', dropna=True, normalize=False)
”
看下例子:
這里默認(rèn)計(jì)算頻率。
import?numpy?as?np array_A?=?np.array(["one",?"two",?"two",?"three",?"three",?"three"],?dtype=object) array_B?=?np.array(["Python",?"Python",?"Python",?"C",?"C",?"C"],?dtype=object) array_C?=?np.array(["Y",?"Y",?"Y",?"N",?"N",?"N"]) pd.crosstab(array_A, ???????????[array_B,?array_C], ???????????rownames=['array_A'], ???????????colnames=['array_B',?'array_C'])
新建一個(gè)values
列,計(jì)算總和。
array_D?=?np.array([1,?4,?9,?16,?25,?36]) pd.crosstab(index=array_A, ????????????columns=[array_B,?array_C], ????????????rownames=['array_A'], ????????????colnames=['array_B',?'array_C'], ????????????values=array_D, ????????????aggfunc='sum')
到此這篇關(guān)于一文搞懂Pandas數(shù)據(jù)透視的4個(gè)函數(shù)的使用的文章就介紹到這了,更多相關(guān)Pandas數(shù)據(jù)透視內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
基于Python3中運(yùn)算符 **和*的區(qū)別說明
這篇文章主要介紹了Python3中運(yùn)算符 **和*的具體區(qū)別,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-05-05詳解python requests中的post請(qǐng)求的參數(shù)問題
這篇文章主要介紹了詳解python requests中的post請(qǐng)求的參數(shù)問題,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-03-03Python使用技巧之實(shí)現(xiàn)Excel轉(zhuǎn)為PDF
這篇文章主要為大家詳細(xì)介紹了使用第三方Python庫(kù)Spire.XLS?for?Python?實(shí)現(xiàn)Excel轉(zhuǎn)PDF的簡(jiǎn)單方法,文中的示例代碼講解詳細(xì),需要的可以參考下2023-11-11利用Python將多張圖片合成視頻的實(shí)現(xiàn)
這篇文章主要介紹了利用Python將多張圖片合成視頻的實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-11-11如何利用python給微信公眾號(hào)發(fā)消息實(shí)例代碼
使用過微信公眾號(hào)的小伙伴應(yīng)該知道微信公眾號(hào)有時(shí)候會(huì)給你推一些文章,當(dāng)你選擇它的某個(gè)功能時(shí),它還會(huì)返回一些信息,下面這篇文章主要給大家介紹了關(guān)于如何利用python給微信公眾號(hào)發(fā)消息的相關(guān)資料,需要的朋友可以參考下2022-03-03Python用requests庫(kù)爬取返回為空的解決辦法
這篇文章主要介紹了Python用requests庫(kù)爬取返回為空的解決辦法,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-02-02