快捷導(dǎo)航

pandas實(shí)現(xiàn)按照Series分組示例

更新時(shí)間：2021年08月08日 14:25:38 作者：不思量自難忘

本文主要介紹了pandas按照Series分組示例，文中通過(guò)示例代碼介紹的非常詳細(xì)，具有一定的參考價(jià)值，感興趣的小伙伴們可以參考一下

result:
      分類編號(hào)    名稱
0 水果 0    蘋果
1 水果 1    橙子
2 生活用品 2    牙刷
3 生活用品 3    冰箱
4 生活用品 4 電視機(jī)
5 食物 0    蘋果
6 食物 1    橙子
7 家電 3    冰箱
8 家電 4 電視機(jī)
9 大件 3    冰箱
10    大件 4 電視機(jī)
11    大件 5    茶幾
12 生活用品 7 暖手寶寶
13 小說(shuō) 8 紅樓夢(mèng)

將DataFrame的其中一列取出來(lái)就是一個(gè)Series，比如life_df["分類"]就是一個(gè)Series

1 按照一個(gè)Series進(jìn)行分組

life_df = pd.read_excel(r'C:\Users\admin\Desktop\生活用品表.xlsx')
print(life_df.groupby(life_df["分類"]))

result:

<pandas.core.groupby.generic.DataFrameGroupBy object at 0x000001506806C6C8>

從上面的結(jié)果可以看出，如果只是傳入Series，分組后的結(jié)果是一個(gè)DataFrameGroupBy對(duì)象。這個(gè)對(duì)象包含著分組以后的若干組數(shù)據(jù)，但是沒(méi)有直接顯示出來(lái)，需要對(duì)這些分組數(shù)據(jù)進(jìn)行匯總計(jì)算以后才會(huì)顯示出來(lái)

life_df = pd.read_excel(r'C:\Users\admin\Desktop\生活用品表.xlsx')
print(life_df.groupby(life_df["分類"]).count())

result:
編號(hào) 名稱

分類
大件 3 3
家電 2 2
小說(shuō) 1 1
水果 2 2
生活用品 4 4
食物 2 2

上面的代碼是根據(jù)物品分類對(duì)所有數(shù)據(jù)進(jìn)行了分組，然后對(duì)分組以后的數(shù)據(jù)分別進(jìn)行計(jì)數(shù)運(yùn)算，最后進(jìn)行合并。

由于對(duì)分組后的數(shù)據(jù)進(jìn)行了計(jì)數(shù)運(yùn)算，因此每一列都會(huì)有一個(gè)結(jié)果。但是如果對(duì)分組后的結(jié)果做一些數(shù)值運(yùn)算，這個(gè)時(shí)候只有數(shù)據(jù)類型是數(shù)值(int、float)的列才會(huì)參與運(yùn)算

import pandas as pd
life_df = pd.read_excel(r'C:\Users\admin\Desktop\生活用品表.xlsx')
print(life_df.groupby(life_df["分類"]).sum())

result:
編號(hào)

分類
大件 12
家電 7
小說(shuō) 8
水果 1
生活用品 16
食物 1

我們把這種對(duì)分組后的數(shù)據(jù)進(jìn)行匯總運(yùn)算的操作稱為聚合，使用的函數(shù)稱為聚合函數(shù)。比如前面系列文章提高的非空值計(jì)數(shù)、sum求和、最大值最小值、均值、中位數(shù)、眾數(shù)、方差、標(biāo)準(zhǔn)差和分位數(shù)這些。都屬于聚合函數(shù)。

2 按照多個(gè)Series進(jìn)行分組

多Series分組和單Series分組差不多，只要將多個(gè)Series以列表的形式傳遞給groupby()即可。

life_df = pd.read_excel(r'C:\Users\admin\Desktop\生活用品表.xlsx')
print(life_df.groupby([life_df["分類"], life_df["名稱"]]).count())

result:
   編號(hào)

分類名稱
大件冰箱 1
   電視機(jī)    1
   茶幾 1
家電冰箱 1
   電視機(jī)    1
小說(shuō) 紅樓夢(mèng)    1
水果橙子 1
   蘋果 1
生活用品冰箱 1
     暖手寶寶 1
   牙刷 1
   電視機(jī)    1
食物橙子 1
   蘋果 1

life_df = pd.read_excel(r'C:\Users\admin\Desktop\生活用品表.xlsx')
print(life_df.groupby([life_df["分類"], life_df["名稱"]]).sum())

result:
   編號(hào)

分類名稱
大件冰箱 3
   電視機(jī)    4
   茶幾 5
家電冰箱 3
   電視機(jī)    4
小說(shuō) 紅樓夢(mèng)    8
水果橙子 1
   蘋果 0
生活用品冰箱 3
   暖手寶寶 7
   牙刷 2
   電視機(jī)    4
食物橙子 1
   蘋果 0

3 分組和聚合采用不同的列或Series進(jìn)行

這里和按列分組的用法一致

life_df = pd.read_excel(r'C:\Users\admin\Desktop\生活用品表.xlsx')
print(life_df.groupby(life_df["分類"])["名稱"].count())

result:
分類
大件    3
家電    2
小說(shuō)      1
水果    2
生活用品    4
食物    2
Name: 名稱, dtype: int64

這里就是按照物品分類進(jìn)行分組，再按照物品名稱進(jìn)行匯總統(tǒng)計(jì)

到此這篇關(guān)于pandas實(shí)現(xiàn)按照Series分組示例的文章就介紹到這了,更多相關(guān)pandas Series分組內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

pandas實(shí)現(xiàn)按照Series分組示例

目錄

1 按照一個(gè)Series進(jìn)行分組

2 按照多個(gè)Series進(jìn)行分組

3 分組和聚合采用不同的列或Series進(jìn)行

相關(guān)文章

最新評(píng)論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具