R語言 檢驗(yàn)多重共線性的操作
函數(shù)kappa()
df<-data.frame() df_cor=cor(df) kappa(df_cor, exact=T)
當(dāng) κ<100κ<100 , 說明共線性程度?。?/p>
當(dāng) 100<κ<1000100<κ<1000 , 有較強(qiáng)的多重共線性;
當(dāng) κ>1000κ>1000,存在嚴(yán)重的多重共線性。
函數(shù)qr()
x<-matrix() qr(x)$rank
qr(X)$rank 計(jì)算X矩陣的秩,如果不是滿秩的,說明其中有xixi可以用其他xjxj的線性組合表示;此時(shí)可以進(jìn)行逐步回歸,用step()命令。
fm<-lm() step(fm)
補(bǔ)充:多重共線性的產(chǎn)生原因、判別、檢驗(yàn)、解決方法
最近做回歸分析,出現(xiàn)了相關(guān)系數(shù)與回歸方程系數(shù)符號(hào)相反的問題,經(jīng)過研究,確認(rèn)是多重共線性問題并探索了解決方法。
在此將多重共線性的相關(guān)知識(shí)整理如下。
解釋變量理論上的高度相關(guān)與觀測(cè)值高度相關(guān)沒有必然關(guān)系,有可能兩個(gè)解釋變量理論上高度相關(guān),但觀測(cè)值未必高度相關(guān),反之亦然。所以多重共線性本質(zhì)上是數(shù)據(jù)問題。
造成多重共線性的原因有一下幾種:
1、解釋變量都享有共同的時(shí)間趨勢(shì);
2、一個(gè)解釋變量是另一個(gè)的滯后,二者往往遵循一個(gè)趨勢(shì);
3、由于數(shù)據(jù)收集的基礎(chǔ)不夠?qū)?,某些解釋變量可能?huì)一起變動(dòng);
4、某些解釋變量間存在某種近似的線性關(guān)系;
判別:
1、發(fā)現(xiàn)系數(shù)估計(jì)值的符號(hào)不對(duì);
2、某些重要的解釋變量t值低,而R方不低
3、當(dāng)一不太重要的解釋變量被刪除后,回歸結(jié)果顯著變化;
檢驗(yàn):
1、相關(guān)性分析,相關(guān)系數(shù)高于0.8,表明存在多重共線性;但相關(guān)系數(shù)低,并不能表示不存在多重共線性;
2、vif檢驗(yàn);
3、條件系數(shù)檢驗(yàn);
解決方法:
1、增加數(shù)據(jù);
2、對(duì)模型施加某些約束條件;
3、刪除一個(gè)或幾個(gè)共線變量;
4、將模型適當(dāng)變形;
5、主成分回歸
處理多重共線性的原則:
1、 多重共線性是普遍存在的,輕微的多重共線性問題可不采取措施;
2、 嚴(yán)重的多重共線性問題,一般可根據(jù)經(jīng)驗(yàn)或通過分析回歸結(jié)果發(fā)現(xiàn)。如影響系數(shù)符號(hào),重要的解釋變量t值很低。要根據(jù)不同情況采取必要措施。
3、 如果模型僅用于預(yù)測(cè),則只要擬合程度好,可不處理多重共線性問題,存在多重共線性的模型用于預(yù)測(cè)時(shí),往往不影響預(yù)測(cè)結(jié)果;
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章
R語言 實(shí)現(xiàn)將數(shù)據(jù)框中的字符類型數(shù)字轉(zhuǎn)換為數(shù)值
這篇文章主要介紹了R語言 實(shí)現(xiàn)將數(shù)據(jù)框中的字符類型數(shù)字轉(zhuǎn)換為數(shù)值,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2021-03-03R語言如何將大型Excel文件轉(zhuǎn)為dta格式詳解
這篇文章主要給大家介紹了關(guān)于R語言如何將大型Excel文件轉(zhuǎn)為dta格式的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2021-03-03R語言-如何將循環(huán)所得的矩陣組成一個(gè)矩陣
這篇文章主要介紹了R語言實(shí)現(xiàn)將循環(huán)所得的矩陣組成一個(gè)矩陣的操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2021-04-04R語言數(shù)據(jù)可視化ggplot添加左右y軸繪制天貓雙十一銷售圖
本篇文章主要介紹如何在R中,使用ggplot2包在一個(gè)圖像上添加左右兩個(gè) y 軸刻度,并在同一個(gè)圖像上繪制兩個(gè)完全不一樣的統(tǒng)計(jì)圖,有需要的朋友可以借鑒參考下2021-11-11R語言-實(shí)現(xiàn)將向量轉(zhuǎn)換成一個(gè)字符串
這篇文章主要介紹了R語言-實(shí)現(xiàn)將向量轉(zhuǎn)換成一個(gè)字符串,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2021-04-04R語言讀取txt文件中的內(nèi)容實(shí)現(xiàn)
R語言提供了多種讀取文本數(shù)據(jù)的函數(shù),本文主要介紹了R語言讀取txt文件中的內(nèi)容實(shí)現(xiàn),具有一定的參考價(jià)值,感興趣的可以了解一下2024-03-03