python中pandas對(duì)多列進(jìn)行分組統(tǒng)計(jì)的實(shí)現(xiàn)
使用groupby([ ]).size()統(tǒng)計(jì)的結(jié)果,值相同的字段值會(huì)不顯示
如上圖所示,第一個(gè)空著的行是982499 7 3388 1,因?yàn)榇诵信c前面一行的這兩個(gè)字段值是一樣的,所以不顯示。第二個(gè)空著的行是390192 22 4278 1,因?yàn)榇诵信c前面一行的第一個(gè)字段值是一樣的,所以不顯示。這樣的展示方式更直觀,但對(duì)于剛用的人,可能會(huì)讓其以為是缺失值。
如果還不明白可以看下面的全部數(shù)據(jù)及操作。
import pandas as pd res6 = pd.read_csv('test.csv') res6.shape
(12, 3)
res6.columns
Index(['user_id', 'cate', 'shop_id'], dtype='object')
res6.info()
<class 'pandas.core.frame.DataFrame'> RangeIndex: 12 entries, 0 to 11 Data columns (total 3 columns): user_id 12 non-null int64 cate 12 non-null int64 shop_id 12 non-null int64 dtypes: int64(3) memory usage: 368.0 bytes
res6.describe()
user_id | cate | shop_id | |
---|---|---|---|
count | 1.200000e+01 | 12.000000 | 12.000000 |
mean | 6.468688e+05 | 10.666667 | 3594.000000 |
std | 3.988181e+05 | 6.665151 | 373.271775 |
min | 2.421410e+05 | 7.000000 | 3388.000000 |
25% | 3.901920e+05 | 7.000000 | 3388.000000 |
50% | 4.938730e+05 | 7.000000 | 3388.000000 |
75% | 9.824990e+05 | 10.250000 | 3586.250000 |
max | 1.558165e+06 | 23.000000 | 4278.000000 |
res6
user_id | cate | shop_id | |
---|---|---|---|
0 | 390192 | 20 | 4178 |
1 | 390192 | 23 | 4179 |
2 | 390192 | 22 | 4278 |
3 | 1021819 | 7 | 3388 |
4 | 242141 | 7 | 3388 |
5 | 283284 | 7 | 3388 |
6 | 1558165 | 7 | 3388 |
7 | 533696 | 7 | 3388 |
8 | 982499 | 7 | 3388 |
9 | 493873 | 7 | 3388 |
10 | 493873 | 7 | 3388 |
11 | 982499 | 7 | 3389 |
res6['user_id'].value_counts()
390192 3 982499 2 493873 2 242141 1 1021819 1 533696 1 1558165 1 283284 1 Name: user_id, dtype: int64
res6.groupby(['user_id']).size().sort_values(ascending=False)
user_id 390192 3 982499 2 493873 2 1558165 1 1021819 1 533696 1 283284 1 242141 1 dtype: int64
res6.groupby(['user_id', 'cate']).size().sort_values(ascending=False)
user_id cate 982499 7 2 493873 7 2 1558165 7 1 1021819 7 1 533696 7 1 390192 23 1 22 1 20 1 283284 7 1 242141 7 1 dtype: int64
res6_test = res6.groupby(['user_id', 'cate', 'shop_id']).size().sort_values(ascending=False) res6_test
user_id cate shop_id 493873 7 3388 2 1558165 7 3388 1 1021819 7 3388 1 982499 7 3389 1 3388 1 533696 7 3388 1 390192 23 4179 1 22 4278 1 20 4178 1 283284 7 3388 1 242141 7 3388 1 dtype: int64
到此這篇關(guān)于python中pandas對(duì)多列進(jìn)行分組統(tǒng)計(jì)的實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)pandas多列分組統(tǒng)計(jì)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python利用matplotlib生成圖片背景及圖例透明的效果
這篇文章主要給大家介紹了Python利用matplotlib生成圖片背景及圖例透明效果的相關(guān)資料,文中給出了詳細(xì)的示例代碼,相信對(duì)大家具有一定的參考家價(jià)值,需要的朋友們下面來(lái)一起學(xué)習(xí)學(xué)習(xí)吧。2017-04-04python編輯用戶登入界面的實(shí)現(xiàn)代碼
這篇文章主要介紹了python編輯用戶登入界面的實(shí)現(xiàn)代碼,非常不錯(cuò),代碼簡(jiǎn)單易懂,具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2018-07-07Python3中簡(jiǎn)單的文件操作及兩個(gè)簡(jiǎn)單小實(shí)例分享
文件操作是我們?nèi)粘T谑褂胮ython的時(shí)候經(jīng)常會(huì)用到的,下面這篇文章主要給大家介紹了關(guān)于Python3中簡(jiǎn)單的文件操作及兩個(gè)簡(jiǎn)單小實(shí)例的相關(guān)資料,文中介紹的非常詳細(xì),需要的朋友可以參考借鑒,下面來(lái)一起看看吧。2017-06-06Python實(shí)現(xiàn)獲取前100組勾股數(shù)的方法示例
這篇文章主要介紹了Python實(shí)現(xiàn)獲取前100組勾股數(shù)的方法,涉及Python數(shù)值計(jì)算與判斷相關(guān)操作技巧,需要的朋友可以參考下2018-05-05詳解Django-channels 實(shí)現(xiàn)WebSocket實(shí)例
這篇文章主要介紹了詳解Django-channels實(shí)現(xiàn)WebSocket實(shí)例,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-08-08Python如何實(shí)現(xiàn)SSH遠(yuǎn)程連接與文件傳輸
這篇文章主要介紹了Python如何實(shí)現(xiàn)SSH遠(yuǎn)程連接與文件傳輸問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-05-05