基于python實(shí)現(xiàn)計(jì)算兩組數(shù)據(jù)P值
我們?cè)谧鯝/B試驗(yàn)評(píng)估的時(shí)候需要借助p_value,這篇文章記錄如何利用python計(jì)算兩組數(shù)據(jù)的顯著性。
一、代碼
# TTest.py # -*- coding: utf-8 -*- ''' # Created on 2020-05-20 20:36 # TTest.py # @author: huiwenhua ''' ## Import the packages import numpy as np from scipy import stats def get_p_value(arrA, arrB): a = np.array(arrA) b = np.array(arrB) t, p = stats.ttest_ind(a,b) return p if __name__ == "__main__": get_p_value([1, 2, 3, 5, ], [6, 7, 8, 9, 10])
二、T檢驗(yàn):兩樣本T檢驗(yàn)
兩樣本t檢驗(yàn)是比較兩個(gè)樣本所代表的兩個(gè)總體均值是否存在顯著差異。除了要求樣本來自正態(tài)分布,還要求兩個(gè)樣本的總體方差相等也就是“方差齊性”。
檢驗(yàn)原假設(shè):樣本均值無差異(μ=μ0)
Python命令stats.ttest_ind(data1,data2)
當(dāng)不確定兩總體方差是否相等時(shí),應(yīng)先利用levene檢驗(yàn)檢驗(yàn)兩總體是否具有方差齊性stats.levene(data1,data2)如果返回結(jié)果的p值遠(yuǎn)大于0.05,那么我們認(rèn)為兩總體具有方差齊性。如果兩總體不具有方差齊性,需要加上參數(shù)equal_val并設(shè)定為False,如下。
stats.ttest_ind(data1,data2,equal_var=False) // TTest中默認(rèn)是具有方差齊性
三、結(jié)果解釋
當(dāng)p值小于某個(gè)顯著性水平α(比如0.05)時(shí),則認(rèn)為樣本均值存在顯著差異,具體的分析要看所選擇的是雙邊假設(shè)還是單邊假設(shè)(又分小于和大于)注意stats.ttest_ind進(jìn)行雙側(cè)檢驗(yàn)。
當(dāng)t值大于0,則有((1-p)* 100)%的把握認(rèn)為認(rèn)為第一組數(shù)據(jù)好與第二組數(shù)據(jù)。例如p=0.05,那么我們有95%的把握認(rèn)為第一組數(shù)據(jù)好于第二組數(shù)據(jù)。
以上就是本文的全部內(nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
詳解如何使用Python處理INI、YAML和JSON配置文件
在軟件開發(fā)中,配置文件是存儲(chǔ)程序配置信息的常見方式,INI、YAML和JSON是常用的配置文件格式,各自有著特定的結(jié)構(gòu)和用途,Python擁有豐富的庫和模塊,本文將重點(diǎn)探討如何使用Python處理這三種格式的配置文件,需要的朋友可以參考下2023-12-12Python入門教程(二十二)Python的類和對(duì)象
這篇文章主要介紹了Python入門教程(二十二)Python的類和對(duì)象,Python是一門非常強(qiáng)大好用的語言,也有著易上手的特性,本文為入門教程,需要的朋友可以參考下2023-04-04Python爬蟲實(shí)戰(zhàn)之爬取京東商品數(shù)據(jù)并實(shí)實(shí)現(xiàn)數(shù)據(jù)可視化
今天再帶大家簡單爬一波京東的商品數(shù)據(jù)唄,廢話不多說,文中有非常詳細(xì)的代碼示例,需要的朋友可以參考下2021-06-06Python+Pygame實(shí)現(xiàn)神廟逃亡游戲
這篇文章主要為大家介紹了如何利用Python和Pygame動(dòng)畫制作一個(gè)神廟逃亡類似的小游戲。文中的示例代碼講解詳細(xì),感興趣的小伙伴可以動(dòng)手嘗試一下2022-05-05python通過wxPython打開一個(gè)音頻文件并播放的方法
這篇文章主要介紹了python通過wxPython打開一個(gè)音頻文件并播放的方法,實(shí)例分析了wxPython操作音頻文件的技巧,具有一定參考借鑒價(jià)值,需要的朋友可以參考下2015-03-03