這篇文章主要介紹了python驗(yàn)證多組數(shù)據(jù)之間有無顯著差異，利用方差分析和卡方分布驗(yàn)證多組數(shù)據(jù)之間的某些屬性有無顯著性差異，對(duì)于連續(xù)性屬性可以用方差分析，對(duì)于離散型屬性可以用卡方檢驗(yàn)。下面文章詳細(xì)內(nèi)容需要的小伙伴可以參考一下

一、方差分析

1.單因素方差分析

通過箱線圖可以人肉看出10組的訂單量看起來差不多，為了更科學(xué)比較10組的訂單量有無顯著差異，我們可以利用方差分析

from statsmodels.formula.api import ols
from statsmodels.stats.anova import anova_lm
model = ols('orders~C(label)',data=need_data).fit()
anova_table = anova_lm(model, typ = 2)
print(anova_table)

結(jié)果顯示，p值為0.62大于0.05，不能拒絕原假設(shè)，所以這10組的訂單量分布沒有顯著差異。

二、卡方檢驗(yàn)

如果是比較多組之間的非連續(xù)值指標(biāo)是否存在差異呢？

如檢查上面10組的男女比例是否存在顯著差異

計(jì)算各組觀察頻數(shù)：

data2=data1.melt(id_vars=['性別'],value_name='觀察頻數(shù)')
data2.head()

計(jì)算總體的男女比例：

rate=(data2.groupby(['性別'])['觀察頻數(shù)'].sum()/data2.groupby(['性別'])['觀察頻數(shù)'].sum().sum()).reset_index()
rate.columns=['性別','rate']
rate

計(jì)算各組用戶總數(shù)：

group_sum=data2.groupby(['組別'])['觀察頻數(shù)'].sum().reset_index()
group_sum.columns=['組別','組內(nèi)用戶數(shù)']
group_sum

計(jì)算卡方值：

import math
data3=pd.merge(data2,group_sum,on=['組別'],how='left')
data3=pd.merge(data3,rate,on=['性別'],how='left')
data3['期望頻數(shù)']=data3['組內(nèi)用戶數(shù)']*data3['rate']
data3['卡方值']=data3.apply(lambda x: math.pow((x.期望頻數(shù)-x.觀察頻數(shù)),2)/x.期望頻數(shù),axis=1)
data3.head()

本案例的自由度為(10-1)*(2-1)=9,選取顯著性水平為0.05，查卡方分布表得臨界值為18.31
因?yàn)?.01<18.31,所以不能拒絕原假設(shè)，即各組的性別分布不存在顯著性差異。

到此這篇關(guān)于python驗(yàn)證多組數(shù)據(jù)之間有無顯著差異的文章就介紹到這了,更多相關(guān)python驗(yàn)證多組數(shù)據(jù)之間有無顯著差異內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

python 實(shí)現(xiàn)以相同規(guī)律打亂多組數(shù)據(jù)

相關(guān)文章

python 刪除指定時(shí)間間隔之前的文件實(shí)例
下面小編就為大家分享一篇python 刪除指定時(shí)間間隔之前的文件實(shí)例，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
2018-04-04
python將ip地址轉(zhuǎn)換成整數(shù)的方法
這篇文章主要介紹了python將ip地址轉(zhuǎn)換成整數(shù)的方法,涉及Python針對(duì)IP地址的轉(zhuǎn)換技巧,需要的朋友可以參考下
2015-03-03
Python獲取時(shí)間戳的多種方法總結(jié)
時(shí)間戳是一個(gè)表示日期和時(shí)間的數(shù)值,通常以秒為單位,在Python中,獲取時(shí)間戳是常見的任務(wù),用于記錄事件、計(jì)時(shí)操作、以及在各種應(yīng)用中跟蹤時(shí)間,本文將介紹多種獲取時(shí)間戳的方法,包括標(biāo)準(zhǔn)庫和第三方庫的方式,并提供示例代碼以幫助你更好地理解
2023-11-11
python MD5加密的示例
這篇文章主要介紹了python MD5加密的示例，幫助大家更好的利用python進(jìn)行加密，感興趣的朋友可以了解下
2020-10-10
vscode配置與python虛擬環(huán)境切換的幾種方式總結(jié)
Python之所以強(qiáng)大,除了語言本身的特性外,更重要的是擁有無所不及的第三方庫,下面這篇文章主要給大家介紹了關(guān)于vscode配置與python虛擬環(huán)境切換的幾種方式,文中通過圖文介紹的非常詳細(xì),需要的朋友可以參考下
2022-12-12
這篇文章主要介紹了python字典排序?qū)崿F(xiàn)方法,實(shí)例分析了Python字典排序的相關(guān)技巧,需要的朋友可以參考下
2015-05-05

Python進(jìn)階之利用+和*進(jìn)行列表拼接

在我們學(xué)習(xí)python的過程中，有一個(gè)非常常見的語法，那就是利用+和*進(jìn)行序列的拼接以及其他操作。今天就帶大家從使用+和*進(jìn)行拼接出發(fā)認(rèn)識(shí)一個(gè)大家非常容易犯的代碼錯(cuò)誤。話不多說我們開始吧

2023-04-04

python讀取mat文件生成h5文件的實(shí)現(xiàn)

這篇文章主要介紹了python讀取mat文件生成h5文件的實(shí)現(xiàn)方式，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方，望不吝賜教

2022-07-07

Python?循環(huán)結(jié)構(gòu)詳解

這篇文章主要介紹了Python?循環(huán)結(jié)構(gòu)，程序的循環(huán)結(jié)構(gòu)邏輯，循環(huán)就是按照一定的條件重復(fù)的去做一件事情，當(dāng)條件不成立時(shí)就結(jié)束循環(huán)的內(nèi)容，需要的小伙伴一起和小編一起進(jìn)入下面文章學(xué)習(xí)吧

2022-02-02

Python SELENIUM上傳文件或圖片實(shí)現(xiàn)過程

這篇文章主要介紹了Python SELENIUM上傳文件或圖片實(shí)現(xiàn)過程,文中通過示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下

2019-10-10

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

軟件下載

源碼下載

軟件編程

網(wǎng)絡(luò)編程

在線工具

數(shù)據(jù)庫

CMS

常用工具

python驗(yàn)證多組數(shù)據(jù)之間有無顯著差異

目錄

一、方差分析

1.單因素方差分析

二、卡方檢驗(yàn)

相關(guān)文章

最新評(píng)論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具

python驗(yàn)證多組數(shù)據(jù)之間有無顯著差異

目錄

一、方差分析

1.單因素方差分析

二、卡方檢驗(yàn)

相關(guān)文章

最新評(píng)論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具

一、方差分析

二、卡方檢驗(yàn)