欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

R語言-如何實現(xiàn)卡方檢驗

 更新時間:2021年04月20日 09:49:53   作者:弓二竹  
這篇文章主要介紹了R語言實現(xiàn)卡方檢驗的操作,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧

卡方檢驗

在數(shù)據(jù)統(tǒng)計中,卡方檢驗是一種很重要的方法。

通??ǚ綑z驗的應(yīng)用主要為:

1、 卡方擬合優(yōu)度檢驗

2、卡方獨立性檢驗

本文主要通過使用自己編程的方法實現(xiàn)相關(guān)檢驗。

卡方擬合優(yōu)度檢驗

理論:

1、我們先做出0假設(shè):H0:總體服從假定的理論分布

2、我們再構(gòu)造一個統(tǒng)計量:

3、當(dāng)n充分大時

4、我們得到該拒絕域

代碼

#Chi_square Goodness Of Fit Test
#函數(shù)說明:
#n為所得樣本數(shù)據(jù);p為理論概率
#alpha為置信水平,df為自由度
cgoft <- function(n,p){
  N <- length(n)#N為樣本總?cè)萘?
  sumn <- sum(n)
  XX <- 0
  for (i in 1:N) {
    XX <- XX +(n[i]-sumn*p[i])^2/(sumn*p[i])
    print(XX)
  }
  return(XX)
}
c <- qchisq(1-aplha,df)

卡方獨立性檢驗

理論:

1、我們先做出0假設(shè):H0:二者沒有相關(guān)關(guān)系

2、我們再構(gòu)造一個統(tǒng)計量:

3、當(dāng)n充分大時

4、我們得到該拒絕域

代碼

#Chi_square Independence Test
#函數(shù)說明:
#n為樣本數(shù)據(jù),表格按行排列,寫成向量形式;row為表格行數(shù)
#alpha為置信水平,df為自由度
cit <- function(n,row){
  N <- length(n)
  sumn <- sum(n)
  n1 <- matrix(n,nrow=row,byrow = TRUE)
  column <- N/row
  pi <- c()
  for (i in 1:row) {
    pi[i] <- sum(n1[i,])/sumn
  }
  pj <- c()
  for (j in 1:column) {
    pj[j] <- sum(n1[,j])/sumn
  }
  XX <- 0
  print(pj)
  for (i in 1:row) {
    for (j in 1:column) {
      XX <- XX + (n1[i,j]-sumn*pi[i]*pj[j])^2/(sumn*pi[i]*pj[j])
    }
  }
  return(XX)
}
c <- qchisq(1-aplha,df)

補充:R語言實施皮爾森卡方檢驗

說明

檢查兩個數(shù)據(jù)集中的類別分量是否不同,在統(tǒng)計中會碰到離散型數(shù)據(jù)與計數(shù)數(shù)據(jù),比如性別分男、女,某個問題的態(tài)度分為贊成、反對,成績可分優(yōu)良差,能力可分高中低。對這類數(shù)據(jù)的統(tǒng)計處理的假設(shè)檢驗一般用計數(shù)數(shù)據(jù)的統(tǒng)計方法進行非參數(shù)檢驗。

卡方檢驗主要用于兩個方面,一是對總體分布進行擬合性檢驗,檢驗觀查次數(shù)是否與某種理論次數(shù)相一致。

二是獨立性檢驗,用于檢驗兩組或者多組資料相互關(guān)聯(lián)還是彼此獨立。

操作示例(獨立性檢驗)

#mtcars$am有0,1兩個因素表示行,mtcars$gear 有3,4,5三個因素表示列
library(stats)
data("mtcars)
ftable = table(mtcars$am,mtcars$gear)
ftable = table(mtcars$am,mtcars$gear)
ftable = table(mtcars$am,mtcars$gear)
> ftable
     3  4  5
  0 15  4  0
  1  0  8  5
#繪制列聯(lián)表的馬賽克圖
mosaicplot(ftable,main ="number of forward gears within automatic and manual cars",color = TRUE )

對列聯(lián)表執(zhí)行卡方檢驗,以檢測自動檔與手動檔汽車前驅(qū)的齒輪數(shù)目是否相同:

chisq.test(ftable)
    Pearson's Chi-squared test
data:  ftable
X-squared = 20.945, df = 2, p-value = 2.831e-05
Warning message:
In chisq.test(ftable) : Chi-squared近似算法有可能不準(zhǔn)

總結(jié)

卡方檢驗用于發(fā)現(xiàn)兩個類別變量之間是否存在某種關(guān)聯(lián),最適用于數(shù)組中非成組信息的檢驗。使用條件:1.數(shù)據(jù)都為類別數(shù)據(jù)2.變量包括兩個或者兩個以上獨立數(shù)據(jù)組。

H0:變量A與變量B相互獨立(gear數(shù)目相同)

H1:變量A與變量B相互不獨(gear數(shù)目不相同)

由圖知:自動檔的gear要小于手動檔的gear.p-value<0.05,拒絕H0,接收H1.

樣例輸出了一個警告信息,此次卡方檢驗的結(jié)果可能不正確,這是因為列聯(lián)表的個數(shù)小于5。

以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。

相關(guān)文章

最新評論