欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python中pandas對(duì)多列進(jìn)行分組統(tǒng)計(jì)的實(shí)現(xiàn)

 更新時(shí)間:2021年06月18日 16:02:01   作者:光于前裕于后  
分組統(tǒng)計(jì)在很多時(shí)候都需要用到,可以實(shí)現(xiàn)很多數(shù)據(jù)庫(kù)函數(shù)的功能。本文主要介紹了python中pandas對(duì)多列進(jìn)行分組統(tǒng)計(jì)的實(shí)現(xiàn),感興趣的可以了解一下

使用groupby([ ]).size()統(tǒng)計(jì)的結(jié)果,值相同的字段值會(huì)不顯示

在這里插入圖片描述

如上圖所示,第一個(gè)空著的行是982499 7 3388 1,因?yàn)榇诵信c前面一行的這兩個(gè)字段值是一樣的,所以不顯示。第二個(gè)空著的行是390192 22 4278 1,因?yàn)榇诵信c前面一行的第一個(gè)字段值是一樣的,所以不顯示。這樣的展示方式更直觀,但對(duì)于剛用的人,可能會(huì)讓其以為是缺失值。

如果還不明白可以看下面的全部數(shù)據(jù)及操作。

import pandas as pd
res6 = pd.read_csv('test.csv')
res6.shape
(12, 3)
res6.columns
Index(['user_id', 'cate', 'shop_id'], dtype='object')
res6.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 12 entries, 0 to 11
Data columns (total 3 columns):
user_id    12 non-null int64
cate       12 non-null int64
shop_id    12 non-null int64
dtypes: int64(3)
memory usage: 368.0 bytes
res6.describe()

user_id cate shop_id
count 1.200000e+01 12.000000 12.000000
mean 6.468688e+05 10.666667 3594.000000
std 3.988181e+05 6.665151 373.271775
min 2.421410e+05 7.000000 3388.000000
25% 3.901920e+05 7.000000 3388.000000
50% 4.938730e+05 7.000000 3388.000000
75% 9.824990e+05 10.250000 3586.250000
max 1.558165e+06 23.000000 4278.000000

res6

user_id cate shop_id
0 390192 20 4178
1 390192 23 4179
2 390192 22 4278
3 1021819 7 3388
4 242141 7 3388
5 283284 7 3388
6 1558165 7 3388
7 533696 7 3388
8 982499 7 3388
9 493873 7 3388
10 493873 7 3388
11 982499 7 3389

res6['user_id'].value_counts()

390192     3
982499     2
493873     2
242141     1
1021819    1
533696     1
1558165    1
283284     1
Name: user_id, dtype: int64
res6.groupby(['user_id']).size().sort_values(ascending=False)

user_id
390192     3
982499     2
493873     2
1558165    1
1021819    1
533696     1
283284     1
242141     1
dtype: int64

res6.groupby(['user_id', 'cate']).size().sort_values(ascending=False)

user_id  cate
982499   7       2
493873   7       2
1558165  7       1
1021819  7       1
533696   7       1
390192   23      1
         22      1
         20      1
283284   7       1
242141   7       1
dtype: int64
res6_test = res6.groupby(['user_id', 'cate', 'shop_id']).size().sort_values(ascending=False)
res6_test
user_id  cate  shop_id
493873   7     3388       2
1558165  7     3388       1
1021819  7     3388       1
982499   7     3389       1
               3388       1
533696   7     3388       1
390192   23    4179       1
         22    4278       1
         20    4178       1
283284   7     3388       1
242141   7     3388       1
dtype: int64

到此這篇關(guān)于python中pandas對(duì)多列進(jìn)行分組統(tǒng)計(jì)的實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)pandas多列分組統(tǒng)計(jì)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Python利用matplotlib生成圖片背景及圖例透明的效果

    Python利用matplotlib生成圖片背景及圖例透明的效果

    這篇文章主要給大家介紹了Python利用matplotlib生成圖片背景及圖例透明效果的相關(guān)資料,文中給出了詳細(xì)的示例代碼,相信對(duì)大家具有一定的參考家價(jià)值,需要的朋友們下面來(lái)一起學(xué)習(xí)學(xué)習(xí)吧。
    2017-04-04
  • 聊聊.py和.ipynb的一些小知識(shí)

    聊聊.py和.ipynb的一些小知識(shí)

    這篇文章主要介紹了聊聊.py和.ipynb的一些小知識(shí),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2021-03-03
  • Python PIL圖片如何按比例裁剪

    Python PIL圖片如何按比例裁剪

    這篇文章主要介紹了Python PIL圖片如何按比例裁剪,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2022-05-05
  • python編輯用戶登入界面的實(shí)現(xiàn)代碼

    python編輯用戶登入界面的實(shí)現(xiàn)代碼

    這篇文章主要介紹了python編輯用戶登入界面的實(shí)現(xiàn)代碼,非常不錯(cuò),代碼簡(jiǎn)單易懂,具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2018-07-07
  • Python3中簡(jiǎn)單的文件操作及兩個(gè)簡(jiǎn)單小實(shí)例分享

    Python3中簡(jiǎn)單的文件操作及兩個(gè)簡(jiǎn)單小實(shí)例分享

    文件操作是我們?nèi)粘T谑褂胮ython的時(shí)候經(jīng)常會(huì)用到的,下面這篇文章主要給大家介紹了關(guān)于Python3中簡(jiǎn)單的文件操作及兩個(gè)簡(jiǎn)單小實(shí)例的相關(guān)資料,文中介紹的非常詳細(xì),需要的朋友可以參考借鑒,下面來(lái)一起看看吧。
    2017-06-06
  • Python實(shí)現(xiàn)獲取前100組勾股數(shù)的方法示例

    Python實(shí)現(xiàn)獲取前100組勾股數(shù)的方法示例

    這篇文章主要介紹了Python實(shí)現(xiàn)獲取前100組勾股數(shù)的方法,涉及Python數(shù)值計(jì)算與判斷相關(guān)操作技巧,需要的朋友可以參考下
    2018-05-05
  • 公認(rèn)8個(gè)效率最高的爬蟲框架

    公認(rèn)8個(gè)效率最高的爬蟲框架

    在本篇文章里小編給大家整理的是關(guān)于2020年8個(gè)效率最高的爬蟲框架知識(shí)點(diǎn),需要的朋友們可以學(xué)習(xí)下。
    2020-07-07
  • python 設(shè)置輸出圖像的像素大小方法

    python 設(shè)置輸出圖像的像素大小方法

    今天小編就為大家分享一篇python 設(shè)置輸出圖像的像素大小方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2019-07-07
  • 詳解Django-channels 實(shí)現(xiàn)WebSocket實(shí)例

    詳解Django-channels 實(shí)現(xiàn)WebSocket實(shí)例

    這篇文章主要介紹了詳解Django-channels實(shí)現(xiàn)WebSocket實(shí)例,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2019-08-08
  • Python如何實(shí)現(xiàn)SSH遠(yuǎn)程連接與文件傳輸

    Python如何實(shí)現(xiàn)SSH遠(yuǎn)程連接與文件傳輸

    這篇文章主要介紹了Python如何實(shí)現(xiàn)SSH遠(yuǎn)程連接與文件傳輸問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2023-05-05

最新評(píng)論