快捷導(dǎo)航

pandas獲取groupby分組里最大值所在的行方法

更新時(shí)間：2018年04月20日 11:46:53 作者：Tobin''s Blog

下面小編就為大家分享一篇pandas獲取groupby分組里最大值所在的行方法，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧

pandas獲取groupby分組里最大值所在的行方法

如下面這個(gè)DataFrame,按照Mt分組，取出Count最大的那行

import pandas as pd
df = pd.DataFrame({'Sp':['a','b','c','d','e','f'], 'Mt':['s1', 's1', 's2','s2','s2','s3'], 'Value':[1,2,3,4,5,6], 'Count':[3,2,5,10,10,6]})

df

	Count	Mt	Sp	Value
0	3	s1	a	1
1	2	s1	b	2
2	5	s2	c	3
3	10	s2	d	4
4	10	s2	e	5
5	6	s3	f	6

方法1：在分組中過(guò)濾出Count最大的行

df.groupby('Mt').apply(lambda t: t[t.Count==t.Count.max()])

		Count	Mt	Sp	Value
Mt
s1	0	3	s1	a	1
s2	3	10	s2	d	4
s2	4	10	s2	e	5
s3	5	6	s3	f	6

方法2：用transform獲取原dataframe的index，然后過(guò)濾出需要的行

print df.groupby(['Mt'])['Count'].agg(max)

idx=df.groupby(['Mt'])['Count'].transform(max)
print idx
idx1 = idx == df['Count']
print idx1

df[idx1]

Mt
s1 3
s2 10
s3 6
Name: Count, dtype: int64
0 3
1 3
2 10
3 10
4 10
5 6
dtype: int64
0 True
1 False
2 False
3 True
4 True
5 True
dtype: bool

	Count	Mt	Sp	Value
0	3	s1	a	1
3	10	s2	d	4
4	10	s2	e	5
5	6	s3	f	6

上面的方法都有個(gè)問(wèn)題是3、4行的值都是最大值，這樣返回了多行，如果只要返回一行呢？

方法3：idmax（舊版本pandas是argmax）

idx = df.groupby('Mt')['Count'].idxmax()
print idx

df.iloc[idx]
Mt
s1 0
s2 3
s3 5
Name: Count, dtype: int64

	Count	Mt	Sp	Value
0	3	s1	a	1
3	10	s2	d	4
5	6	s3	f	6

df.iloc[df.groupby(['Mt']).apply(lambda x: x['Count'].idxmax())]

	Count	Mt	Sp	Value
0	3	s1	a	1
3	10	s2	d	4
5	6	s3	f	6

def using_apply(df):
 return (df.groupby('Mt').apply(lambda subf: subf['Value'][subf['Count'].idxmax()]))

def using_idxmax_loc(df):
 idx = df.groupby('Mt')['Count'].idxmax()
 return df.loc[idx, ['Mt', 'Value']]

print using_apply(df)

using_idxmax_loc(df)

Mt
s1 1
s2 4
s3 6
dtype: int64

	Mt	Value
0	s1	1
3	s2	4
5	s3	6

方法4:先排好序，然后每組取第一個(gè)

df.sort('Count', ascending=False).groupby('Mt', as_index=False).first()

	Mt	Count	Sp	Value
0	s1	3	a	1
1	s2	10	d	4
2	s3	6	f	6

那問(wèn)題又來(lái)了，如果不是要取出最大值所在的行，比如要中間值所在的那行呢？

思路還是類似，可能具體寫(xiě)法上要做一些修改，比如方法1和2要修改max算法，方法3要自己實(shí)現(xiàn)一個(gè)返回index的方法。不管怎樣，groupby之后，每個(gè)分組都是一個(gè)dataframe。

以上這篇pandas獲取groupby分組里最大值所在的行方法就是小編分享給大家的全部?jī)?nèi)容了，希望能給大家一個(gè)參考，也希望大家多多支持腳本之家。

您可能感興趣的文章:

相關(guān)文章

Sanic框架安裝與簡(jiǎn)單入門(mén)示例
這篇文章主要介紹了Sanic框架安裝與簡(jiǎn)單用法,結(jié)合實(shí)例形式簡(jiǎn)單分析了Sanic框架的概念、原理、pip命令安裝以及使用方法,需要的朋友可以參考下
2018-07-07
Python之tkinter列表框Listbox與滾動(dòng)條Scrollbar解讀
這篇文章主要介紹了Python之tkinter列表框Listbox與滾動(dòng)條Scrollbar解讀，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方，望不吝賜教
2023-05-05
講解Python3中NumPy數(shù)組尋找特定元素下標(biāo)的兩種方法
這篇文章主要介紹了講解Python3中NumPy數(shù)組尋找特定元素下標(biāo)的兩種方法，文中通過(guò)示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值，需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
2019-08-08
Python Tkinter Canvas畫(huà)布控件詳解
Canvas 控件具有兩個(gè)功能，首先它可以用來(lái)繪制各種圖形，比如弧形、線條、橢圓形、多邊形和矩形等，其次 Canvas 控件還可以用來(lái)展示圖片。本文將具體介紹一直Tkinter中的畫(huà)布控件，需要的可以參考一下
2022-01-01
opencv python截取圓形區(qū)域的實(shí)現(xiàn)
本文主要介紹了opencv python截取圓形區(qū)域的實(shí)現(xiàn)，文中通過(guò)示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值，需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
2022-08-08
TensorFlow實(shí)現(xiàn)模型斷點(diǎn)訓(xùn)練,checkpoint模型載入方式
這篇文章主要介紹了TensorFlow實(shí)現(xiàn)模型斷點(diǎn)訓(xùn)練,checkpoint模型載入方式，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
2020-05-05
Python存儲(chǔ)讀取HDF5文件代碼解析
這篇文章主要介紹了Python存儲(chǔ)讀取HDF5文件代碼解析,文中通過(guò)示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
2020-11-11
使用Python的開(kāi)發(fā)框架Brownie部署以太坊智能合約
在本文中，我們將使用Python部署智能合約。這篇文章可能是您走向智能合約和區(qū)塊鏈開(kāi)發(fā)的橋梁！
2021-05-05
Python利用雪花算法實(shí)現(xiàn)生成唯一ID
雪花算法是在一個(gè)項(xiàng)目體系中生成全局唯一ID標(biāo)識(shí)的一種方式，偶然間看到了Python使用雪花算法不盡感嘆真的是太便捷了。本文就來(lái)聊聊這具體的實(shí)現(xiàn)方法，感興趣的可以了解一下
2022-11-11
淺談Python里面小數(shù)點(diǎn)精度的控制
今天小編就為大家分享一篇淺談Python里面小數(shù)點(diǎn)精度的控制，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
2018-07-07