欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python pandas入門系列之眾數(shù)和分位數(shù)

 更新時(shí)間:2021年08月04日 15:13:57   作者:不思量自難忘  
分位數(shù)(Quantile),也稱分位點(diǎn),是指將一個(gè)隨機(jī)變量的概率分布范圍分為幾個(gè)等份的數(shù)值點(diǎn),分析其數(shù)據(jù)變量的趨勢,而眾數(shù)(Mode)是代表數(shù)據(jù)的一般水平,這篇文章主要給大家介紹了Python pandas系列之眾數(shù)和分位數(shù)的相關(guān)資料,需要的朋友可以參考下

準(zhǔn)備

本文用到的表格內(nèi)容如下:

先來看一下原始情形:

import pandas as pd
​
df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df)

result:

   數(shù)學(xué)成績  語文成績  英語成績
0    89    78    98
1    35    34    34
2    43    56    25
3    35    78    83
4    67    46    65
5    89    89    83
6    96    45    83
7    35    67    45
8    35    78    83

1.求眾數(shù)

1.1對全表進(jìn)行操作

1.1.1求取每列的眾數(shù)

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.var())

result:

   數(shù)學(xué)成績  語文成績  英語成績
0    35    78    83

1.1.2 求取每行的眾數(shù)

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.mode(axis=1))

result:

      0     1     2
0  78.0  89.0  98.0
1  34.0   NaN   NaN
2  25.0  43.0  56.0
3  35.0  78.0  83.0
4  46.0  65.0  67.0
5  89.0   NaN   NaN
6  45.0  83.0  96.0
7  35.0  45.0  67.0
8  35.0  78.0  83.0

1.2 對單獨(dú)的一行或者一列進(jìn)行操作

1.2.1 求取單獨(dú)某一列的眾數(shù)

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.mode(axis=1))

result:

0    35
dtype: int64

1.2.2 求取單獨(dú)某一行的眾數(shù)

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.iloc[[0]].mode())

result:

   數(shù)學(xué)成績  語文成績  英語成績
0    89    78    98

1.3 對多行或者多列進(jìn)行操作

1.3.1 求取多列的眾數(shù)

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df[['數(shù)學(xué)成績', "語文成績"]].mode())

result:

   數(shù)學(xué)成績  語文成績
0    35    78

1.3.2 求取多行的眾數(shù)

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.iloc[[0, 1]].mode())

result:

   數(shù)學(xué)成績  語文成績  英語成績
0    35    34    34
1    89    78    98

2 求分位數(shù)

分位數(shù)是比中位數(shù)更加詳細(xì)的基于位置的指標(biāo),分位數(shù)主要有四分之一分位數(shù),二分之一分位數(shù)(就是中位數(shù))、四分之三分位數(shù)

2.1 求取不同分位的分位數(shù)

2.1.1 四分之一分位數(shù)

import pandas as pd
​
df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.quantile(0.25))

result:

數(shù)學(xué)成績    35.0
語文成績    46.0
英語成績    45.0
Name: 0.25, dtype: float64

2.1.2 四分之三分位數(shù)

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.quantile(0.75))

result:

數(shù)學(xué)成績    89.0
語文成績    78.0
英語成績    83.0
Name: 0.75, dtype: float64

2.2對全表進(jìn)行操作

2.2.1對每一列求分位數(shù)

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.quantile(0.25))

result:

數(shù)學(xué)成績    35.0
語文成績    46.0
英語成績    45.0
Name: 0.25, dtype: float64

2.2.2 對每一行求分位數(shù)

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.quantile(0.25, axis=1))

result:

0    83.5
1    34.0
2    34.0
3    56.5
4    55.5
5    86.0
6    64.0
7    40.0
8    56.5
Name: 0.25, dtype: float64

2.3 對單獨(dú)的一行或者一列進(jìn)行操作

2.3.1 對某一列求分位數(shù)

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df['數(shù)學(xué)成績'].quantile(0.25))

result:

35.0

2.3.2 對某一行求分位數(shù)

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.iloc[[0]].quantile(0.25))

result:

數(shù)學(xué)成績    89.0
語文成績    78.0
英語成績    98.0
Name: 0.25, dtype: float64

2.4 對多行或者多列進(jìn)行操作

2.4.1 對多列求分位數(shù)

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df[['數(shù)學(xué)成績', "語文成績"]].quantile(0.25))

result:

數(shù)學(xué)成績    35.0
語文成績    46.0
Name: 0.25, dtype: float64

2.4.2 對多行求分位數(shù)

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.iloc[[0, 1]].quantile(0.25))

result:

數(shù)學(xué)成績    48.5
語文成績    45.0
英語成績    50.0
Name: 0.25, dtype: float64

附:pandas 和 numpy計(jì)算分位數(shù)的區(qū)別

pandas 和 numpy中都有計(jì)算分位數(shù)的方法,pandas中是quantile,numpy中是percentile

兩個(gè)方法其實(shí)沒什么區(qū)別,用法上稍微不同,quantile的優(yōu)點(diǎn)是與pandas中的groupby結(jié)合使用,可以分組之后取每個(gè)組的某分位數(shù)

quantile代碼:

import pandas as pd
import numpy as np
data = pd.read_csv('order_rank_p_0409.txt',sep='\t')
#將data按id_1 和 id_2 分組
grouped=data.groupby(['id_1','id_2'])
#用quantile計(jì)算第40%的分位數(shù)
grouped['gmv'].quantile(0.4) 
#用to_csv生成文件
x.to_csv('order_ran_re.txt',sep= '\t')

percentile代碼:

import pandas as pd
import numpy as np
data = pd.read_csv('order_rank_p_0409.txt',sep='\t')
a = array(data['gmv'])
np.percentile(a,0.4)

兩段代碼,兩種方法計(jì)算的結(jié)果是一樣的

總結(jié)

到此這篇關(guān)于Python pandas系列之眾數(shù)和分位數(shù)的文章就介紹到這了,更多相關(guān)pandas眾數(shù)和分位數(shù)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • pycharm-professional-2020.1下載與激活的教程

    pycharm-professional-2020.1下載與激活的教程

    這篇文章主要介紹了pycharm-professional-2020.1下載與激活的教程,本文分為安裝和永久激活兩部分內(nèi)容,需要的朋友可以參考下
    2020-09-09
  • 如何利用python實(shí)現(xiàn)圖片轉(zhuǎn)化字符畫

    如何利用python實(shí)現(xiàn)圖片轉(zhuǎn)化字符畫

    這篇文章主要介紹了如何利用python實(shí)現(xiàn)圖片轉(zhuǎn)化字符畫,文章圍繞主題展開詳細(xì)的內(nèi)容介紹,具有一定的參考價(jià)值,需要的小伙伴可以參考一下
    2022-06-06
  • python Django的web開發(fā)實(shí)例(入門)

    python Django的web開發(fā)實(shí)例(入門)

    這篇文章主要介紹了python Django的web開發(fā)實(shí)例,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-07-07
  • Pytorch模型定義與深度學(xué)習(xí)自查手冊

    Pytorch模型定義與深度學(xué)習(xí)自查手冊

    這篇文章主要為大家介紹了Pytorch模型定義與深度學(xué)習(xí)的自查手冊,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2022-06-06
  • Python利用BeautifulSoup解析Html的方法示例

    Python利用BeautifulSoup解析Html的方法示例

    BeautifulSoup是python的一個(gè)庫,最主要的功能是從網(wǎng)頁抓取數(shù)據(jù)。下面這篇文章主要給大家介紹了關(guān)于Python利用BeautifulSoup解析Html的方法示例,文中通過示例代碼介紹的非常詳細(xì),需要的朋友們下面跟著小編來一起學(xué)習(xí)學(xué)習(xí)吧。
    2017-07-07
  • 詳解Python常用標(biāo)準(zhǔn)庫之時(shí)間模塊time和datetime

    詳解Python常用標(biāo)準(zhǔn)庫之時(shí)間模塊time和datetime

    time和datetime是Python中常用的兩個(gè)時(shí)間模塊,本文將通過示例詳細(xì)為大家講講二者的使用方法,感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)學(xué)習(xí)
    2022-05-05
  • Python wxauto 庫解鎖微信自動化的無限可能(示例代碼)

    Python wxauto 庫解鎖微信自動化的無限可能(示例代碼)

    wxauto庫是基于Python的一個(gè)自動化工具,它主要用于操作和自動化WxPython應(yīng)用程序,這篇文章主要介紹了Python wxauto 庫解鎖微信自動化的無限可能,需要的朋友可以參考下
    2024-07-07
  • 提高Python生產(chǎn)力的五個(gè)Jupyter notebook插件

    提高Python生產(chǎn)力的五個(gè)Jupyter notebook插件

    Jupyter Notebook 因其可用性和實(shí)用性而成為數(shù)據(jù)分析和機(jī)器學(xué)習(xí)模型領(lǐng)域最流行的 IDE,它也是很多數(shù)據(jù)初學(xué)者的首選 IDE。它最具特色的是,擁有豐富的插件、擴(kuò)展數(shù)據(jù)處理能力和提升工作效率
    2021-11-11
  • Python編程中實(shí)現(xiàn)迭代器的一些技巧小結(jié)

    Python編程中實(shí)現(xiàn)迭代器的一些技巧小結(jié)

    只談迭代器的話在Python中只是一個(gè)泛指的概念,具體的可以用yield、生成器表達(dá)式、iter等多種方式來構(gòu)建,這里我們整理了Python編程中實(shí)現(xiàn)迭代器的一些技巧小結(jié):
    2016-06-06
  • Python Flask框架模板操作實(shí)例分析

    Python Flask框架模板操作實(shí)例分析

    這篇文章主要介紹了Python Flask框架模板操作,結(jié)合實(shí)例形式較為詳細(xì)的分析了Python Flask框架使用Jinja2模板步驟及相關(guān)操作技巧,需要的朋友可以參考下
    2019-05-05

最新評論