欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python中DataFrame常用的描述性統(tǒng)計分析方法詳解

 更新時間:2023年07月07日 10:44:09   作者:侯小啾  
這篇文章主要介紹了python中DataFrame常用的描述性統(tǒng)計分析方法詳解,描述性統(tǒng)計分析是通過圖表或數(shù)學(xué)方法,對數(shù)據(jù)資料進行整理、分析,并對數(shù)據(jù)的分布狀態(tài)、數(shù)字特征和隨機變量之間的關(guān)系進行估計和描述的方法,需要的朋友可以參考下

DataFrame常用描述性統(tǒng)計分析方法

sum() 求和

使用sum()方法對DataFrame對象求和。
其中**set_option(‘display.unicode.east_asian_width’, True)**可以使顯示的DataFrame值與列名對齊。
sum有axis參數(shù),默認為0,表示對列求和

  • 設(shè)置為1表示對行求和。
  • 也可以設(shè)置 skipna參數(shù),改參數(shù)默認為True,表示不考慮缺失值,如果是False則表示考慮缺失值,當存在缺失值時,則對應(yīng)的結(jié)果表示為Nan。
  • (布爾類型的參數(shù)值,當傳入為其它類型的值時,也解讀為該值的布爾值)

這里對示例數(shù)據(jù)的行求和,然后生成一個新的列添加在數(shù)據(jù)中。

import pandas as pd
data = [[110, 105, 99], [105, 88, 115], [109, 120, 130]]
index = [1, 2, 3]
columns = ['語文', '數(shù)學(xué)', '英語']
pd.set_option('display.unicode.east_asian_width', True)
df = pd.DataFrame(data=data, index=index, columns=columns)
print(df)
print("================================")
# 增加一列
df['總成績'] = df.sum(axis=1, skipna=1)
print(df)

程序運行結(jié)果如下:

在這里插入圖片描述

mean() 求平均值

這里對生成數(shù)據(jù)的每一列求平均值,然后作為一個新的行增加給原數(shù)據(jù)。

通過示例可以看到,當原數(shù)據(jù)中存在空值時,計算均值時分子和分母都不計入該數(shù)據(jù)。即mean()求的是非空數(shù)據(jù)的平均值。

import pandas as pd
data = [[110, 105, 99], [105, 88, 115], [109, 120, 130], [112, 115]]
index = [1, 2, 3, 4]
columns = ['語文', '數(shù)學(xué)', '英語']
pd.set_option('display.unicode.east_asian_width', True)
df = pd.DataFrame(data=data, index=index, columns=columns)
print(df)
print("================================")
new = df.mean()
# 增加一行數(shù)據(jù)(語文、數(shù)學(xué)和英語的平均值,忽略索引)
df = df.append(new, ignore_index=True)
print(df)

在這里插入圖片描述

關(guān)于DataFrame的append()方法

DataFrame增添一行可以使用append()方法。設(shè)置參數(shù),ignore_index=True可以忽略掉索引。

當在DataFrame后邊追加的對象為Series時,必須把ignore_index設(shè)為True,或者除非Serise有name屬性。 當追加多列時,設(shè)置ignore_index為True可以避免出現(xiàn)索引值重復(fù)的異常事件。 此外DataFrame的append()方法在未來的版本即將被取消。將由concat替代。

max() 最大值 & min() 最小值

import pandas as pd
data = [[110, 105, 99], [105, 88, 115], [109, 120, 130]]
index = [1, 2, 3]
columns = ['語文', '數(shù)學(xué)', '英語']
pd.set_option('display.unicode.east_asian_width', True)
df = pd.DataFrame(data=data, index=index, columns=columns)
print(df)
print("================================")
df_max = df.max()
print(df_max)
print("================================")
df_min = df.min()
print(df_min)

在這里插入圖片描述

median() 中位數(shù)

import pandas as pd
data = [[110, 120, 110], [130, 130, 131], [115, 120, 130]]
columns = ['語文', '數(shù)學(xué)', '英語']
df = pd.DataFrame(data=data, columns=columns)
print(df)
print("================================")
print(df.median())

在這里插入圖片描述

mode() 眾數(shù)

import pandas as pd
data = [[110, 120, 110], [130, 130, 130], [130, 120, 130]]
columns = ['語文', '數(shù)學(xué)', '英語']
df = pd.DataFrame(data=data, columns=columns)
print(df)
# 三科成績的眾數(shù)
print(df.mode())
# 每一行的眾數(shù)
print(df.mode(axis=1))
# “數(shù)學(xué)”的眾數(shù)
print(df['數(shù)學(xué)'].mode())

在這里插入圖片描述

var() 方差

import pandas as pd
data = [[110, 113, 102, 105, 108], [118, 98, 119, 85, 118]]
index = ['小黑', '小白']
columns = ['物理1', '物理2', '物理3', '物理4', '物理5']
df = pd.DataFrame(data=data, index=index, columns=columns)
print(df)
print("========================================")
print(df.var(axis=1))

在這里插入圖片描述

std() 標準差

import pandas as pd
data = [[110, 120, 110], [130, 130, 130], [130, 120, 130]]
columns = ['語文', '數(shù)學(xué)', '英語']
df = pd.DataFrame(data=data, columns=columns)
print(df)
print("=============================")
print(df.std())

在這里插入圖片描述

quantile() 分位數(shù)

以35%分位數(shù)為例

import pandas as pd
# 創(chuàng)建DataFrame數(shù)據(jù)(數(shù)學(xué)成績)
data = [120, 89, 98, 78, 65, 102, 112, 56, 79, 45]
columns = ['數(shù)學(xué)']
df = pd.DataFrame(data=data, columns=columns)
print(df)
print("============================")
# 計算35%的分位數(shù)
x = df['數(shù)學(xué)'].quantile(0.35)
# 輸出淘汰學(xué)生
print(df[df['數(shù)學(xué)'] <= x])

在這里插入圖片描述

關(guān)于其他數(shù)據(jù)類型,如Timestamp,也可以使用分位數(shù)quantile()方法。

import pandas as pd
pd.set_option('display.unicode.east_asian_width', True)
df = pd.DataFrame({'A': [1, 2],
                   'B': [pd.Timestamp('2019'),
                         pd.Timestamp('2020')],
                   'C': [pd.Timedelta('1 days'),
                         pd.Timedelta('2 days')]})
print(df)
print("==============================")
print(df.quantile(0.5, numeric_only=False))

在這里插入圖片描述

到此這篇關(guān)于python中DataFrame常用的描述性統(tǒng)計分析方法詳解的文章就介紹到這了,更多相關(guān)python的DataFrame常用方法內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • python 調(diào)用Google翻譯接口的方法

    python 調(diào)用Google翻譯接口的方法

    這篇文章主要介紹了python 調(diào)用Google翻譯接口的方法,幫助大家更好的理解和使用python處理url,感興趣的朋友可以了解下
    2020-12-12
  • 把MySQL表結(jié)構(gòu)映射為Python中的對象的教程

    把MySQL表結(jié)構(gòu)映射為Python中的對象的教程

    這篇文章主要介紹了簡單地把MySQL表結(jié)構(gòu)映射為Python中的對象的方法,用到了Python中的SQLAlchemy庫,需要的朋友可以參考下
    2015-04-04
  • Python實戰(zhàn)之整蠱神器合集加速友盡

    Python實戰(zhàn)之整蠱神器合集加速友盡

    讀萬卷書不如行萬里路,學(xué)的扎不扎實要通過實戰(zhàn)才能看出來,本篇文章手把手帶用python來做幾個整蠱的小程序,大家可以在過程中查缺補漏,看看自己掌握程度怎么樣,發(fā)給朋友加固一下友誼
    2021-10-10
  • Python基于Matplotlib庫簡單繪制折線圖的方法示例

    Python基于Matplotlib庫簡單繪制折線圖的方法示例

    這篇文章主要介紹了Python基于Matplotlib庫簡單繪制折線圖的方法,涉及Python Matplotlib庫的相關(guān)使用技巧,需要的朋友可以參考下
    2017-08-08
  • anaconda虛擬環(huán)境python?sklearn庫的安裝過程

    anaconda虛擬環(huán)境python?sklearn庫的安裝過程

    Anaconda是專注于數(shù)據(jù)分析的Python發(fā)行版本,包含了conda、Python等190多個科學(xué)包及其依賴項,這篇文章主要給大家介紹了關(guān)于anaconda虛擬環(huán)境python?sklearn庫的安裝過程,需要的朋友可以參考下
    2023-11-11
  • Python練習(xí)之ORM框架

    Python練習(xí)之ORM框架

    這篇文章主要介紹了Python練習(xí)之ORM框架,通過使用SQLObject框架操作MySQL數(shù)據(jù)庫展開文章主題詳細內(nèi)容,具有一定的參考價值,需要的朋友可以參考一下
    2022-06-06
  • Python2.7基于笛卡爾積算法實現(xiàn)N個數(shù)組的排列組合運算示例

    Python2.7基于笛卡爾積算法實現(xiàn)N個數(shù)組的排列組合運算示例

    這篇文章主要介紹了Python2.7基于笛卡爾積算法實現(xiàn)N個數(shù)組的排列組合運算,涉及Python笛卡爾積算法及排列組合操作相關(guān)實現(xiàn)技巧,需要的朋友可以參考下
    2017-11-11
  • Python實現(xiàn)微博動態(tài)圖片爬取詳解

    Python實現(xiàn)微博動態(tài)圖片爬取詳解

    這篇文章主要為大家介紹了如何利用Python中的爬蟲實現(xiàn)微博動態(tài)圖片的爬取,文中的示例代碼講解詳細,感興趣的小伙伴可以跟隨小編一起動手試一試
    2022-03-03
  • python 中的[:-1]和[::-1]的具體使用

    python 中的[:-1]和[::-1]的具體使用

    這篇文章主要介紹了python 中的[:-1]和[::-1]的具體使用,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-02-02
  • Pandas異常值處理小結(jié)

    Pandas異常值處理小結(jié)

    在Pandas中,異常值是數(shù)據(jù)中那些與其他數(shù)據(jù)點顯著不同的點本文主要介紹了Pandas異常值處理小結(jié),文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2024-07-07

最新評論