Python pandas入門系列之眾數(shù)和分位數(shù)
準備
本文用到的表格內(nèi)容如下:
先來看一下原始情形:
import pandas as pd df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx') print(df)
result:
數(shù)學(xué)成績 語文成績 英語成績
0 89 78 98
1 35 34 34
2 43 56 25
3 35 78 83
4 67 46 65
5 89 89 83
6 96 45 83
7 35 67 45
8 35 78 83
1.求眾數(shù)
1.1對全表進行操作
1.1.1求取每列的眾數(shù)
df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx') print(df.var())
result:
數(shù)學(xué)成績 語文成績 英語成績
0 35 78 83
1.1.2 求取每行的眾數(shù)
df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx') print(df.mode(axis=1))
result:
0 1 2
0 78.0 89.0 98.0
1 34.0 NaN NaN
2 25.0 43.0 56.0
3 35.0 78.0 83.0
4 46.0 65.0 67.0
5 89.0 NaN NaN
6 45.0 83.0 96.0
7 35.0 45.0 67.0
8 35.0 78.0 83.0
1.2 對單獨的一行或者一列進行操作
1.2.1 求取單獨某一列的眾數(shù)
df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx') print(df.mode(axis=1))
result:
0 35
dtype: int64
1.2.2 求取單獨某一行的眾數(shù)
df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx') print(df.iloc[[0]].mode())
result:
數(shù)學(xué)成績 語文成績 英語成績
0 89 78 98
1.3 對多行或者多列進行操作
1.3.1 求取多列的眾數(shù)
df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx') print(df[['數(shù)學(xué)成績', "語文成績"]].mode())
result:
數(shù)學(xué)成績 語文成績
0 35 78
1.3.2 求取多行的眾數(shù)
df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx') print(df.iloc[[0, 1]].mode())
result:
數(shù)學(xué)成績 語文成績 英語成績
0 35 34 34
1 89 78 98
2 求分位數(shù)
分位數(shù)是比中位數(shù)更加詳細的基于位置的指標,分位數(shù)主要有四分之一分位數(shù),二分之一分位數(shù)(就是中位數(shù))、四分之三分位數(shù)
2.1 求取不同分位的分位數(shù)
2.1.1 四分之一分位數(shù)
import pandas as pd df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx') print(df.quantile(0.25))
result:
數(shù)學(xué)成績 35.0
語文成績 46.0
英語成績 45.0
Name: 0.25, dtype: float64
2.1.2 四分之三分位數(shù)
df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx') print(df.quantile(0.75))
result:
數(shù)學(xué)成績 89.0
語文成績 78.0
英語成績 83.0
Name: 0.75, dtype: float64
2.2對全表進行操作
2.2.1對每一列求分位數(shù)
df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx') print(df.quantile(0.25))
result:
數(shù)學(xué)成績 35.0
語文成績 46.0
英語成績 45.0
Name: 0.25, dtype: float64
2.2.2 對每一行求分位數(shù)
df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx') print(df.quantile(0.25, axis=1))
result:
0 83.5
1 34.0
2 34.0
3 56.5
4 55.5
5 86.0
6 64.0
7 40.0
8 56.5
Name: 0.25, dtype: float64
2.3 對單獨的一行或者一列進行操作
2.3.1 對某一列求分位數(shù)
df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx') print(df['數(shù)學(xué)成績'].quantile(0.25))
result:
35.0
2.3.2 對某一行求分位數(shù)
df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx') print(df.iloc[[0]].quantile(0.25))
result:
數(shù)學(xué)成績 89.0
語文成績 78.0
英語成績 98.0
Name: 0.25, dtype: float64
2.4 對多行或者多列進行操作
2.4.1 對多列求分位數(shù)
df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx') print(df[['數(shù)學(xué)成績', "語文成績"]].quantile(0.25))
result:
數(shù)學(xué)成績 35.0
語文成績 46.0
Name: 0.25, dtype: float64
2.4.2 對多行求分位數(shù)
df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx') print(df.iloc[[0, 1]].quantile(0.25))
result:
數(shù)學(xué)成績 48.5
語文成績 45.0
英語成績 50.0
Name: 0.25, dtype: float64
附:pandas 和 numpy計算分位數(shù)的區(qū)別
pandas 和 numpy中都有計算分位數(shù)的方法,pandas中是quantile,numpy中是percentile
兩個方法其實沒什么區(qū)別,用法上稍微不同,quantile的優(yōu)點是與pandas中的groupby結(jié)合使用,可以分組之后取每個組的某分位數(shù)
quantile代碼:
import pandas as pd import numpy as np data = pd.read_csv('order_rank_p_0409.txt',sep='\t') #將data按id_1 和 id_2 分組 grouped=data.groupby(['id_1','id_2']) #用quantile計算第40%的分位數(shù) grouped['gmv'].quantile(0.4) #用to_csv生成文件 x.to_csv('order_ran_re.txt',sep= '\t')
percentile代碼:
import pandas as pd import numpy as np data = pd.read_csv('order_rank_p_0409.txt',sep='\t') a = array(data['gmv']) np.percentile(a,0.4)
兩段代碼,兩種方法計算的結(jié)果是一樣的
總結(jié)
到此這篇關(guān)于Python pandas系列之眾數(shù)和分位數(shù)的文章就介紹到這了,更多相關(guān)pandas眾數(shù)和分位數(shù)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
pycharm-professional-2020.1下載與激活的教程
這篇文章主要介紹了pycharm-professional-2020.1下載與激活的教程,本文分為安裝和永久激活兩部分內(nèi)容,需要的朋友可以參考下2020-09-09如何利用python實現(xiàn)圖片轉(zhuǎn)化字符畫
這篇文章主要介紹了如何利用python實現(xiàn)圖片轉(zhuǎn)化字符畫,文章圍繞主題展開詳細的內(nèi)容介紹,具有一定的參考價值,需要的小伙伴可以參考一下2022-06-06Python利用BeautifulSoup解析Html的方法示例
BeautifulSoup是python的一個庫,最主要的功能是從網(wǎng)頁抓取數(shù)據(jù)。下面這篇文章主要給大家介紹了關(guān)于Python利用BeautifulSoup解析Html的方法示例,文中通過示例代碼介紹的非常詳細,需要的朋友們下面跟著小編來一起學(xué)習學(xué)習吧。2017-07-07詳解Python常用標準庫之時間模塊time和datetime
time和datetime是Python中常用的兩個時間模塊,本文將通過示例詳細為大家講講二者的使用方法,感興趣的小伙伴可以跟隨小編一起學(xué)習學(xué)習2022-05-05Python wxauto 庫解鎖微信自動化的無限可能(示例代碼)
wxauto庫是基于Python的一個自動化工具,它主要用于操作和自動化WxPython應(yīng)用程序,這篇文章主要介紹了Python wxauto 庫解鎖微信自動化的無限可能,需要的朋友可以參考下2024-07-07提高Python生產(chǎn)力的五個Jupyter notebook插件
Jupyter Notebook 因其可用性和實用性而成為數(shù)據(jù)分析和機器學(xué)習模型領(lǐng)域最流行的 IDE,它也是很多數(shù)據(jù)初學(xué)者的首選 IDE。它最具特色的是,擁有豐富的插件、擴展數(shù)據(jù)處理能力和提升工作效率2021-11-11Python編程中實現(xiàn)迭代器的一些技巧小結(jié)
只談迭代器的話在Python中只是一個泛指的概念,具體的可以用yield、生成器表達式、iter等多種方式來構(gòu)建,這里我們整理了Python編程中實現(xiàn)迭代器的一些技巧小結(jié):2016-06-06