欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python驗證多組數(shù)據(jù)之間有無顯著差異

 更新時間:2022年01月02日 15:23:35   作者:fff2zrx?  
這篇文章主要介紹了python驗證多組數(shù)據(jù)之間有無顯著差異,利用方差分析和卡方分布驗證多組數(shù)據(jù)之間的某些屬性有無顯著性差異,對于連續(xù)性屬性可以用方差分析,對于離散型屬性可以用卡方檢驗。下面文章詳細內(nèi)容需要的小伙伴可以參考一下

一、方差分析

1.單因素方差分析

通過箱線圖可以人肉看出10組的訂單量看起來差不多,為了更科學(xué)比較10組的訂單量有無顯著差異,我們可以利用方差分析

from statsmodels.formula.api import ols
from statsmodels.stats.anova import anova_lm
model = ols('orders~C(label)',data=need_data).fit()
anova_table = anova_lm(model, typ = 2)
print(anova_table)

結(jié)果顯示,p值為0.62大于0.05,不能拒絕原假設(shè),所以這10組的訂單量分布沒有顯著差異。

二、卡方檢驗

如果是比較多組之間的非連續(xù)值指標(biāo)是否存在差異呢?

如檢查上面10組的男女比例是否存在顯著差異

計算各組觀察頻數(shù):

data2=data1.melt(id_vars=['性別'],value_name='觀察頻數(shù)')
data2.head()

計算總體的男女比例:

rate=(data2.groupby(['性別'])['觀察頻數(shù)'].sum()/data2.groupby(['性別'])['觀察頻數(shù)'].sum().sum()).reset_index()
rate.columns=['性別','rate']
rate

計算各組用戶總數(shù):

group_sum=data2.groupby(['組別'])['觀察頻數(shù)'].sum().reset_index()
group_sum.columns=['組別','組內(nèi)用戶數(shù)']
group_sum

計算卡方值:

import math
data3=pd.merge(data2,group_sum,on=['組別'],how='left')
data3=pd.merge(data3,rate,on=['性別'],how='left')
data3['期望頻數(shù)']=data3['組內(nèi)用戶數(shù)']*data3['rate']
data3['卡方值']=data3.apply(lambda x: math.pow((x.期望頻數(shù)-x.觀察頻數(shù)),2)/x.期望頻數(shù),axis=1)
data3.head()

本案例的自由度為(10-1)*(2-1)=9,選取顯著性水平為0.05,查卡方分布表得臨界值為18.31
因為7.01<18.31,所以不能拒絕原假設(shè),即各組的性別分布不存在顯著性差異。

到此這篇關(guān)于python驗證多組數(shù)據(jù)之間有無顯著差異的文章就介紹到這了,更多相關(guān)python驗證多組數(shù)據(jù)之間有無顯著差異內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Python進階之利用+和*進行列表拼接

    Python進階之利用+和*進行列表拼接

    在我們學(xué)習(xí)python的過程中,有一個非常常見的語法,那就是利用+和*進行序列的拼接以及其他操作。今天就帶大家從使用+和*進行拼接出發(fā)認(rèn)識一個大家非常容易犯的代碼錯誤。話不多說我們開始吧
    2023-04-04
  • python讀取mat文件生成h5文件的實現(xiàn)

    python讀取mat文件生成h5文件的實現(xiàn)

    這篇文章主要介紹了python讀取mat文件生成h5文件的實現(xiàn)方式,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2022-07-07
  • Python?循環(huán)結(jié)構(gòu)詳解

    Python?循環(huán)結(jié)構(gòu)詳解

    這篇文章主要介紹了Python?循環(huán)結(jié)構(gòu),程序的循環(huán)結(jié)構(gòu)邏輯,循環(huán)就是按照一定的條件重復(fù)的去做一件事情,當(dāng)條件不成立時就結(jié)束循環(huán)的內(nèi)容,需要的小伙伴一起和小編一起進入下面文章學(xué)習(xí)吧
    2022-02-02
  • Python SELENIUM上傳文件或圖片實現(xiàn)過程

    Python SELENIUM上傳文件或圖片實現(xiàn)過程

    這篇文章主要介紹了Python SELENIUM上傳文件或圖片實現(xiàn)過程,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
    2019-10-10
  • 最新評論