Pandas分組聚合之使用自定義函數(shù)方法transform()、apply()
創(chuàng)建一個dataframe結構
import pandas as pd df = pd.DataFrame( data={ 'name': ['z_s', 'l_s', 'w_w', 'z_l', 'y_s', 'j_j', 'l_b', 'z_f', 'hs_q', 'lbl_k', 'qy_n', 'mg_n'], 'score': [100, 97, 98, 89, 67, 59, 29, 87, 78, 89, 88, 80], 'group': [1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2], 'cls': ['A', 'A', 'A', 'B', 'B', 'B', 'A', 'A', 'A', 'B', 'B', 'B'], 'height': [178.0, 180.0, 176.0, 182.0, 189.0, 190.0, 172.5, 175.0, 165.0, 160.0, 158.5, 159.0] }, index=['stu_' + str(i) for i in np.arange(1, 13, 1)] ) print('df:\n', df) def func_add_one(x): return x + 1
transform方法
# 調(diào)用自定義函數(shù) ret = df.loc[:, 'score'].transform(func_add_one) print('ret1:\n',ret) # 調(diào)用numpy指標 求均值 ret = df.groupby(by=['cls'])['score'].transform(np.mean) print('ret2:\n', ret) # 求 多列的均值 ret = df.groupby(by=['cls'])[['score','height']].transform(np.mean) print('ret3:\n', ret)
由結果可以發(fā)現(xiàn),transform調(diào)用統(tǒng)計指標會將統(tǒng)計結果交給第一項,這樣可以保證統(tǒng)計結果的行數(shù)與原數(shù)組相同,使得之后方便將其拼接到原數(shù)組中。
如果想將結果進行聚合,可以調(diào)用apply方法:
apply方法
# 調(diào)用自定義函數(shù) ret = df.loc[:, 'score'].apply(func_add_one) print('ret1:\n',ret) # 調(diào)用numpy指標 ret = df.groupby(by=['cls'])[['score','height']].apply(np.mean) print('ret2:\n', ret)
補充
transporm
方法是將DataFrame
或Series
中的值同時放入指定的函數(shù)中執(zhí)行,再將結果返回。
獲取 name的第0個元素
def func_get_firstnameword(x): return x[0] ret = df['name'].transform(func_get_firstnameword) print('ret:\n', ret)
自定義方法擁有很大的可操作性,通過自定義方法可以對數(shù)據(jù)進行一系列操作,最終得到想要的結果。
str
除此之外,還可以使用str方法,這是一種類似于 dt 的方法(dt的使用)
ret = df['name'].str.split('_', expand=True)[0] print('ret:\n', ret)
str 的作用是將整個 Series
當作str對象,對Series
中的所有元素同時執(zhí)行.split('_', expand=True)[0]
方法,其中expand=True
的作用是指定split()
方法是對整個Series
進行操作的,而不是只對第一個元素進行操作:
ret = df['name'].str.split('_')[0] print('ret:\n', ret)
總結
到此這篇關于Pandas分組聚合之使用自定義函數(shù)方法transform()、apply()的文章就介紹到這了,更多相關Pandas使用自定義函數(shù)方法內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
Flask框架學習筆記(一)安裝篇(windows安裝與centos安裝)
Flask是一個輕量級的Web應用框架, 使用Python編寫。Flask也被稱為 “microframework” ,因為它使用簡單的核心,用 extension 增加其他功能。2014-06-06pybaobabdt庫基于python的決策樹隨機森林可視化工具使用
這篇文章主要為大家介紹了pybaobabdt庫基于python的決策樹隨機森林可視化工具使用探索,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2024-02-02自定義實現(xiàn) PyQt5 下拉復選框 ComboCheckBox的完整代碼
這篇文章主要介紹了自定義實現(xiàn) PyQt5 下拉復選框 ComboCheckBox的完整代碼,本文通過實例代碼講解的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-03-03python 自動化將markdown文件轉(zhuǎn)成html文件的方法
這篇文章主要介紹了python 自動化將markdown文件轉(zhuǎn)成html文件的方法的相關資料,本文介紹的非常詳細,具有參考借鑒價值,需要的朋友可以參考下2016-09-09