快捷導航

Python中的數(shù)據(jù)分組統(tǒng)計、分組運算及透視方式

更新時間：2024年07月19日 10:53:55 作者：云曉-

這篇文章主要介紹了Python中的數(shù)據(jù)分組統(tǒng)計、分組運算及透視方式,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教

1 數(shù)據(jù)分組統(tǒng)計 groupby

分割 split: 按照鍵值（key）或者分組變量將數(shù)據(jù)分組
應(yīng)用 apply: 對每個組應(yīng)用函數(shù), 通常是累計,轉(zhuǎn)換或過濾函數(shù)
組合 combine: 將每一組的結(jié)果合并成一個輸出組

常用功能

1. len(gp1) #組數(shù)
2. gp1.size() #每組的記錄個數(shù)
3. df3.groupby(["小組","評級"])  #得到的結(jié)果是一個groupby對象
4. gp1.mean()  #每組組內(nèi)的平均值，還有sum、max、min、count
5. apply #自定義統(tǒng)計函數(shù)（自己定義一個函數(shù),作為參數(shù)，會自動將函數(shù)應(yīng)用到每一組數(shù)據(jù)當中去）

1.1 按照單列進行分組統(tǒng)計df.groupby(‘列名’).count()

# 創(chuàng)建示例DataFrame
data = {'班級': ['一班', '一班','一班','二班', '二班','二班','三班','三班','三班'],
        '科目': ['物理', '化學', '生物','物理', '化學', '生物','物理', '化學', '生物'],
        '數(shù)量': [17, 29, 18,37,48,32,17, 29, 18],
        '分數(shù)': [87, 89, 88,77,98,82,97, 89, 78]}
df = pd.DataFrame(data)

# 創(chuàng)建示例DataFrame
data = {'班級': ['一班', '一班','一班','二班', '二班','二班','三班','三班','三班'],
        '科目': ['物理','生物','生物','物理', '物理', '生物','化學', '化學', '生物'],
        '姓名': ['張三', '章中', '賀天','紫瞳','西德','魏斯','明峰', '希方', '塞法'],
        '分數(shù)': [87, 89, 88,77,98,82,97, 89, 78]}
df = pd.DataFrame(data)
#實現(xiàn)組內(nèi)排序，排序的時候，科目作為第一排序依據(jù)，用來排序的數(shù)值字段（分數(shù)）作為第二排序依據(jù)
df.sort_values(['科目','分數(shù)'],ascending=[False,True]).groupby('科目').head(3)

1.2 按照多列進行分組統(tǒng)計 df.groupby([‘列名1’,‘列名2’]).count()

# 創(chuàng)建示例DataFrame
data = {'班級': ['一班', '一班','一班','二班', '二班','二班','三班','三班','三班'],
        '科目': ['物理','生物','生物','物理', '物理', '生物','化學', '化學', '生物'],
        '姓名': ['張三', '章中', '賀天','紫瞳','西德','魏斯','明峰', '希方', '塞法'],
        '分數(shù)': [87, 89, 88,77,98,82,97, 89, 78]}
df = pd.DataFrame(data)
#按照科目、班級進行分組求平均
df[['科目','班級','分數(shù)']].groupby(['科目','班級']).mean()

1.3 分組填充缺失值 df.groupby(‘需填充列名’).apply(lambda x:x.fillna(x.mean()))

# 創(chuàng)建示例DataFrame
data = {'年級': ['1', '1','1','2', '2','3','3','3','3'],
        '姓名': ['張三', '章中', '賀天','紫瞳','西德','魏斯','明峰', '希方', '塞法'],
        '年齡': [17, 19, np.NaN,18,np.NaN,15,18, 18,np.NaN ]}
df = pd.DataFrame(data)
df

#按照年級分組填充缺失的年齡
df.groupby('年級').apply(lambda x:x.fillna(x.mean()))

新增加一列年齡ew 將填充后的年齡補充上去

2 分組運算 agg

數(shù)據(jù)聚合（agg）：一般指的是能夠從數(shù)組產(chǎn)生的標量值的數(shù)據(jù)轉(zhuǎn)換過程，常見的聚合運算都有相關(guān)的統(tǒng)計函數(shù)快速實現(xiàn)，也可以自定義聚合運算。

2.1 傳入標準函數(shù) df.groupby(‘班級’).agg(np.sum)

data = {'班級': ['一班', '一班','一班','二班', '二班','二班','三班','三班','三班'],
        '科目': ['物理', '化學', '生物','物理', '化學', '生物','物理', '化學', '生物'],
        '數(shù)量': [17, 29, 18,37,48,32,17, 29, 18],
        '分數(shù)': [87, 89, 88,77,98,82,97, 89, 78]}
df = pd.DataFrame(data)
#數(shù)值列按照分組標準快速聚合
df.groupby('班級').agg(np.sum)

2.2 不同的列不同的聚合函數(shù) df.groupby(‘班級’).agg({‘數(shù)量’:np.sum,‘分數(shù)’:np.mean})

#不同的列傳入不同的函數(shù)
mappping = {'數(shù)量':np.sum,'分數(shù)':np.mean}
df.groupby('班級').agg(mappping)

2.3 自定義函數(shù)

#求針對各科目最高分數(shù)與最低分數(shù)之間的差值
def cha(x):
    return x.max() - x.min()
df[['科目','分數(shù)']].groupby('科目').agg([cha])

2.4 調(diào)用多個聚合函數(shù)

df[['班級','分數(shù)']].groupby('班級').agg([np.max,np.min,np.mean])

3 數(shù)據(jù)透視表

3.1 透視表 pivot_table

透視表(pivot table)： 透視表指根據(jù)一個或多個鍵值對數(shù)據(jù)進行聚合，根據(jù)行或列的分組鍵將數(shù)據(jù)劃分到各個區(qū)域中

#pivot_table 其實就是將groupby封裝起來了
df[['班級','分數(shù)']].pivot_table(index = ['班級']) #先按照班級分組，再求mean

data = {'班級': ['一班', '一班','一班','二班', '二班','二班','三班','三班','三班'],
        '科目': ['物理', '化學', '生物','物理', '化學', '生物','物理', '化學', '生物'],
        '數(shù)量': [17, 29, 18,37,48,32,17, 29, 18],
        '分數(shù)': [87, 89, 88,77,98,82,97, 89, 78]}
df = pd.DataFrame(data)
df.pivot_table(index = ['班級','科目']) #先按照班級然后按照科目分許，默認求均值

df.pivot_table(index = ['班級'],aggfunc = np.sum)#求和

pd.pivot_table(df3,values="總分",index="評級",columns=["班級","小組"])

3.2 交叉表 crosstab

交叉表(crosstab)： 交叉表用于統(tǒng)計分組頻率的特殊透視表

#groupby實現(xiàn)pd.crosstab(df['班級'],df['科目']) 
df[['班級','科目','姓名']].groupby(['班級','科目']).count().unstack().fillna(0)

總結(jié)

以上為個人經(jīng)驗，希望能給大家一個參考，也希望大家多多支持腳本之家。

您可能感興趣的文章:

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python中的數(shù)據(jù)分組統(tǒng)計、分組運算及透視方式

目錄

1 數(shù)據(jù)分組統(tǒng)計 groupby

2 分組運算 agg

3 數(shù)據(jù)透視表

總結(jié)

相關(guān)文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python中的數(shù)據(jù)分組統(tǒng)計、分組運算及透視方式

目錄

1 數(shù)據(jù)分組統(tǒng)計 groupby

2 分組運算 agg

3 數(shù)據(jù)透視表

總結(jié)

相關(guān)文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具

Python中的數(shù)據(jù)分組統(tǒng)計、分組運算及透視方式