Python數(shù)據(jù)分析處理(三)--運(yùn)動(dòng)員信息的分組與聚合
3.1 數(shù)據(jù)的爬取
代碼:
import pandas as pd f = open('運(yùn)動(dòng)員信息表.csv') data=pd.read_csv(f,skiprows=0,header=0) print(data)
運(yùn)行結(jié)果:
首先使用pd.read_csv(f,skiprows=0,header=0)
進(jìn)行數(shù)據(jù)的讀取,并且將數(shù)據(jù)轉(zhuǎn)換成為dataframe的格式給對(duì)象,做初始化,方便后面進(jìn)行數(shù)據(jù)的分析。
3.2統(tǒng)計(jì)男籃、女籃運(yùn)動(dòng)員的平均年齡、身高、體重
代碼:
sex=data[["年齡(歲)","身高(cm)","體重(kg)"]].groupby(data["性別"]) print(sex.mean())
運(yùn)行結(jié)果:
首先我們先把數(shù)據(jù)提取出來(lái)做個(gè)分組,先把"年齡(歲)",“身高(cm)”,"體重(kg)"這三行數(shù)據(jù)提取出來(lái)再根據(jù)性別進(jìn)行分組。
sex=data[["年齡(歲)","身高(cm)","體重(kg)"]].groupby(data["性別"])
然后再調(diào)用mean()
求平均值,求出男籃、女籃運(yùn)動(dòng)員的平均年齡、身高、體重。
3.3統(tǒng)計(jì)男籃運(yùn)動(dòng)員年齡、身高、體重的極差值
代碼:
sex=data[["年齡(歲)","身高(cm)","體重(kg)"]].groupby(data["性別"]) basketball_male=dict([x for x in sex])['男'] basketball_male #求極差 def range_data_group(arr): return arr.max()-arr.min() #進(jìn)行每列不同的聚合 basketball_male.agg({ "年齡(歲)":range_data_group,"身高(cm)":range_data_group,"體重(kg)":range_data_group })
運(yùn)行結(jié)果:
首先提取數(shù)據(jù):
單行循環(huán)提取數(shù)據(jù),dict([x for x in sex])
在循環(huán)體內(nèi)的語(yǔ)句只有一行的情況的下,可以簡(jiǎn)化for循環(huán)的書(shū)寫。定義一個(gè)函數(shù)def range_data_group(arr):
求極差;
極差的求法:使用最大值減去最小值。就得到極差。
agg()函數(shù):DataFrame.agg(*func*,*axis = 0*,* args*,*** kwargs* )*
func
: 函數(shù),函數(shù)名稱,函數(shù)列表,字典{‘行名/列名’,‘函數(shù)名’}
使用指定軸上的一個(gè)或多個(gè)操作進(jìn)行聚合。
需要注意聚合函數(shù)操作始終是在軸(默認(rèn)是列軸,也可設(shè)置行軸)上執(zhí)行,不同于 numpy聚合函數(shù)
最后我們可以得到三列數(shù)據(jù):分別對(duì)應(yīng)"年齡(歲)",“身高(cm)”,“體重(kg)”。
3.4 統(tǒng)計(jì)男籃運(yùn)動(dòng)員的體質(zhì)指數(shù)
3.4.1添加體重指數(shù)
代碼:
data["體質(zhì)指數(shù)"]=0 data
運(yùn)行結(jié)果:
添加一行體重指數(shù):data[“體質(zhì)指數(shù)”]=0
3.4.2計(jì)算bmi值并添加數(shù)據(jù)
代碼:
# 計(jì)算bmi數(shù)值 def outer(num): def bminum(sumbim): weight=data["身高(cm)"] height=data["體重(kg)"] sumbim=weight/(height/100)**2 return num+sumbim return bminum
將該行數(shù)據(jù)添加上去:
代碼:
# 調(diào)用函數(shù) bimdata=data["體質(zhì)指數(shù)"] data["體質(zhì)指數(shù)"]=data[["體質(zhì)指數(shù)"]].apply(outer(bimdata)) data
運(yùn)行結(jié)果:
編寫函數(shù)計(jì)算bmi
數(shù)值 outer(num);
然后再使用apply的方法將自定義的函數(shù)應(yīng)用到"體質(zhì)指數(shù)"這一列。然后計(jì)算出該列的值之后進(jìn)行賦值。
data[“體質(zhì)指數(shù)”]=data[[“體質(zhì)指數(shù)”]].apply(outer(bimdata))
97622)]
編寫函數(shù)計(jì)算bmi
數(shù)值 outer(num)
;然后再使用apply
的方法將自定義的函數(shù)應(yīng)用到"體質(zhì)指數(shù)"這一列。然后計(jì)算出該列的值之后進(jìn)行賦值。
data[“體質(zhì)指數(shù)”]=data[[“體質(zhì)指數(shù)”]].apply(outer(bimdata))
到此這篇關(guān)于Python數(shù)據(jù)分析處理 運(yùn)動(dòng)員信息的分組與聚合的文章就介紹到這了,更多相關(guān)Python數(shù)據(jù)分析處理 內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- python pandas分組聚合詳細(xì)
- Python Pandas分組聚合的實(shí)現(xiàn)方法
- Python DataFrame.groupby()聚合函數(shù),分組級(jí)運(yùn)算
- 一文詳解Python如何優(yōu)雅地對(duì)數(shù)據(jù)進(jìn)行分組
- python?DataFrame數(shù)據(jù)分組統(tǒng)計(jì)groupby()函數(shù)的使用
- Python Pandas實(shí)現(xiàn)數(shù)據(jù)分組求平均值并填充nan的示例
- Pandas?Groupby之在Python中匯總、聚合和分組數(shù)據(jù)的示例詳解
相關(guān)文章
獲取django框架orm query執(zhí)行的sql語(yǔ)句實(shí)現(xiàn)方法分析
這篇文章主要介紹了獲取django框架orm query執(zhí)行的sql語(yǔ)句實(shí)現(xiàn)方法,結(jié)合實(shí)例形式分析了Django框架中orm query執(zhí)行的sql語(yǔ)句獲取方法相關(guān)實(shí)現(xiàn)技巧,需要的朋友可以參考下2019-06-06Python中struct模塊對(duì)字節(jié)流/二進(jìn)制流的操作教程
最近在學(xué)習(xí)python網(wǎng)絡(luò)編程這一塊,在寫簡(jiǎn)單的socket通信代碼時(shí),遇到了struct這個(gè)模塊的使用,當(dāng)時(shí)不太清楚這到底有和作用,后來(lái)查閱了相關(guān)資料大概了解了,這篇文章就主要介紹了Python中struct模塊對(duì)字節(jié)流/二進(jìn)制流的操作,需要的朋友可以參考借鑒。2017-01-01Pycharm在創(chuàng)建py文件時(shí),自動(dòng)添加文件頭注釋的實(shí)例
今天小編就為大家分享一篇Pycharm在創(chuàng)建py文件時(shí),自動(dòng)添加文件頭注釋的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-05-05Tensorflow加載預(yù)訓(xùn)練模型和保存模型的實(shí)例
今天小編就為大家分享一篇Tensorflow加載預(yù)訓(xùn)練模型和保存模型的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-07-07python實(shí)現(xiàn)猜數(shù)字游戲(無(wú)重復(fù)數(shù)字)示例分享
這篇文章主要介紹了python實(shí)現(xiàn)猜數(shù)字游戲(無(wú)重復(fù)數(shù)字)示例,需要的朋友可以參考下2014-03-03Python圖形用戶界面與游戲開(kāi)發(fā)實(shí)例詳解
GUI是圖形用戶界面的縮寫,圖形化的用戶界面對(duì)使用過(guò)計(jì)算機(jī)的人來(lái)說(shuō)應(yīng)該都不陌生,下面這篇文章主要給大家介紹了關(guān)于Python圖形用戶界面與游戲開(kāi)發(fā)的相關(guān)資料,文中通過(guò)實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下2022-09-09