pandas獲取groupby分組里最大值所在的行方法
pandas獲取groupby分組里最大值所在的行方法
如下面這個(gè)DataFrame,按照Mt分組,取出Count最大的那行
import pandas as pd df = pd.DataFrame({'Sp':['a','b','c','d','e','f'], 'Mt':['s1', 's1', 's2','s2','s2','s3'], 'Value':[1,2,3,4,5,6], 'Count':[3,2,5,10,10,6]}) df
Count | Mt | Sp | Value | |
---|---|---|---|---|
0 | 3 | s1 | a | 1 |
1 | 2 | s1 | b | 2 |
2 | 5 | s2 | c | 3 |
3 | 10 | s2 | d | 4 |
4 | 10 | s2 | e | 5 |
5 | 6 | s3 | f | 6 |
方法1:在分組中過(guò)濾出Count最大的行
df.groupby('Mt').apply(lambda t: t[t.Count==t.Count.max()])
Count | Mt | Sp | Value | ||
---|---|---|---|---|---|
Mt | |||||
s1 | 0 | 3 | s1 | a | 1 |
s2 | 3 | 10 | s2 | d | 4 |
4 | 10 | s2 | e | 5 | |
s3 | 5 | 6 | s3 | f | 6 |
方法2:用transform獲取原dataframe的index,然后過(guò)濾出需要的行
print df.groupby(['Mt'])['Count'].agg(max) idx=df.groupby(['Mt'])['Count'].transform(max) print idx idx1 = idx == df['Count'] print idx1 df[idx1]
Mt s1 3 s2 10 s3 6 Name: Count, dtype: int64 0 3 1 3 2 10 3 10 4 10 5 6 dtype: int64 0 True 1 False 2 False 3 True 4 True 5 True dtype: bool
Count | Mt | Sp | Value | |
---|---|---|---|---|
0 | 3 | s1 | a | 1 |
3 | 10 | s2 | d | 4 |
4 | 10 | s2 | e | 5 |
5 | 6 | s3 | f | 6 |
上面的方法都有個(gè)問(wèn)題是3、4行的值都是最大值,這樣返回了多行,如果只要返回一行呢?
方法3:idmax(舊版本pandas是argmax)
idx = df.groupby('Mt')['Count'].idxmax() print idx
df.iloc[idx] Mt s1 0 s2 3 s3 5 Name: Count, dtype: int64
Count | Mt | Sp | Value | |
---|---|---|---|---|
0 | 3 | s1 | a | 1 |
3 | 10 | s2 | d | 4 |
5 | 6 | s3 | f | 6 |
df.iloc[df.groupby(['Mt']).apply(lambda x: x['Count'].idxmax())]
Count | Mt | Sp | Value | |
---|---|---|---|---|
0 | 3 | s1 | a | 1 |
3 | 10 | s2 | d | 4 |
5 | 6 | s3 | f | 6 |
def using_apply(df): return (df.groupby('Mt').apply(lambda subf: subf['Value'][subf['Count'].idxmax()])) def using_idxmax_loc(df): idx = df.groupby('Mt')['Count'].idxmax() return df.loc[idx, ['Mt', 'Value']] print using_apply(df) using_idxmax_loc(df)
Mt s1 1 s2 4 s3 6 dtype: int64
Mt | Value | |
---|---|---|
0 | s1 | 1 |
3 | s2 | 4 |
5 | s3 | 6 |
方法4:先排好序,然后每組取第一個(gè)
df.sort('Count', ascending=False).groupby('Mt', as_index=False).first()
Mt | Count | Sp | Value | |
---|---|---|---|---|
0 | s1 | 3 | a | 1 |
1 | s2 | 10 | d | 4 |
2 | s3 | 6 | f | 6 |
那問(wèn)題又來(lái)了,如果不是要取出最大值所在的行,比如要中間值所在的那行呢?
思路還是類似,可能具體寫(xiě)法上要做一些修改,比如方法1和2要修改max算法,方法3要自己實(shí)現(xiàn)一個(gè)返回index的方法。 不管怎樣,groupby之后,每個(gè)分組都是一個(gè)dataframe。
以上這篇pandas獲取groupby分組里最大值所在的行方法就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python之tkinter列表框Listbox與滾動(dòng)條Scrollbar解讀
這篇文章主要介紹了Python之tkinter列表框Listbox與滾動(dòng)條Scrollbar解讀,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-05-05講解Python3中NumPy數(shù)組尋找特定元素下標(biāo)的兩種方法
這篇文章主要介紹了講解Python3中NumPy數(shù)組尋找特定元素下標(biāo)的兩種方法,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-08-08Python Tkinter Canvas畫(huà)布控件詳解
Canvas 控件具有兩個(gè)功能,首先它可以用來(lái)繪制各種圖形,比如弧形、線條、橢圓形、多邊形和矩形等,其次 Canvas 控件還可以用來(lái)展示圖片。本文將具體介紹一直Tkinter中的畫(huà)布控件,需要的可以參考一下2022-01-01opencv python截取圓形區(qū)域的實(shí)現(xiàn)
本文主要介紹了opencv python截取圓形區(qū)域的實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2022-08-08TensorFlow實(shí)現(xiàn)模型斷點(diǎn)訓(xùn)練,checkpoint模型載入方式
這篇文章主要介紹了TensorFlow實(shí)現(xiàn)模型斷點(diǎn)訓(xùn)練,checkpoint模型載入方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-05-05使用Python的開(kāi)發(fā)框架Brownie部署以太坊智能合約
在本文中,我們將使用Python部署智能合約。這篇文章可能是您走向智能合約和區(qū)塊鏈開(kāi)發(fā)的橋梁!2021-05-05Python利用雪花算法實(shí)現(xiàn)生成唯一ID
雪花算法是在一個(gè)項(xiàng)目體系中生成全局唯一ID標(biāo)識(shí)的一種方式,偶然間看到了Python使用雪花算法不盡感嘆真的是太便捷了。本文就來(lái)聊聊這具體的實(shí)現(xiàn)方法,感興趣的可以了解一下2022-11-11