R語言中R-squared與Adjust R-squared參數(shù)的解釋
前言
最近做項目時,使用 R語言對一些數(shù)據(jù)做回歸計算,分析數(shù)據(jù)時,想查看這堆數(shù)據(jù)的相關性,得知R-squared可以得到我想要的信息,但是在打印線性關系式時,看到了R-squared,Adjust R-squared 這兩個參數(shù),有點疑惑,上網(wǎng)也查看了一部分資料,最后,發(fā)現(xiàn)有兩道題可以很明白解釋這兩個參數(shù),如下:
題一
如果在線性回歸模型中增加一個特征變量,下列可能發(fā)生的是(多選)?
A. R-squared 增大,Adjust R-squared 增大
B. R-squared 增大,Adjust R-squared 減小
C. R-squared 減小,Adjust R-squared 減小
D. R-squared 減小,Adjust R-squared 增大
答案:AB
**解析:**線性回歸問題中,R-Squared 是用來衡量回歸方程與真實樣本輸出之間的相似程度。其表達式如下所示
上式中,分子部分表示真實值與預測值的平方差之和,類似于均方差 MSE;分母部分表示真實值與均值的平方差之和,類似于方差 Var。一般來說,R-Squared 越大,表示模型擬合效果越好。R-Squared 反映的是大概有多準,因為,隨著樣本數(shù)量的增加,R-Squared 必然增加,無法真正定量說明準確程度,只能大概定量。
單獨看 R-Squared,并不能推斷出增加的特征是否有意義。通常來說,增加一個特征特征,R-Squared 可能變大也可能保持不變,兩者不一定呈正相關。
如果使用校正決定系數(shù)(Adjusted R-Squared):
其中,n 是樣本數(shù)量,p 是特征數(shù)量。Adjusted R-Squared 抵消樣本數(shù)量對 R-Squared 的影響,做到了真正的 0~1,越大越好。
增加一個特征變量,如果這個特征有意義,Adjusted R-Square 就會增大,若這個特征是冗余特征,Adjusted R-Squared 就會減小。
題二
在一個線性回歸問題中,我們使用 R 平方(R-Squared)來判斷擬合度。此時,如果增加一個特征,模型不變,則下面說法正確的是?
A. 如果 R-Squared 增加,則這個特征有意義
B. 如果R-Squared 減小,則這個特征沒有意義
C. 僅看 R-Squared 單一變量,無法確定這個特征是否有意義。
D. 以上說法都不對
答案:C
解析: 看題一解析
總結
到此這篇關于R語言中R-squared與Adjust R-squared參數(shù)解釋的文章就介紹到這了,更多相關R語言 R-squared與Adjust R-squared內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
R語言ComplexHeatmap繪制復雜熱圖heatmap
ComplexHeatmap可以繪制很復雜的熱圖,能滿足日常以及文章所需,本文介紹一下文章常見的復雜熱圖的繪制方式,含代碼,文章比較長,建議耐心看一下,也許就有你需要的熱圖2022-06-06關于R語言lubridate包處理時間數(shù)據(jù)的問題
這篇文章主要介紹了關于R語言lubridate包處理時間數(shù)據(jù)的問題,本文給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-05-05