R語(yǔ)言-summary()函數(shù)的用法解讀
summary():獲取描述性統(tǒng)計(jì)量,可以提供最小值、最大值、四分位數(shù)和數(shù)值型變量的均值,以及因子向量和邏輯型向量的頻數(shù)統(tǒng)計(jì)等。
結(jié)果解讀如下:
1. 調(diào)用:Call
lm(formula = DstValue ~ Month + RecentVal1 + RecentVal4 + RecentVal6 + RecentVal8 + RecentVal12, data = trainData)
當(dāng)創(chuàng)建模型時(shí),以上代碼表明lm是如何被調(diào)用的。
2. 殘差統(tǒng)計(jì)量:Residuals
Min 1Q Median 3Q Max -4806.5 -1549.1 -171.8 1368.7 6763.3
殘差第一四分位數(shù)(1Q)和第三分位數(shù)(Q3)有大約相同的幅度,意味著有較對(duì)稱的鐘形分布。
3. 系數(shù):Coefficients
Estimate Std. Error t value Pr(>|t|) (Intercept) 1.345e+06 5.659e+05 2.377 0.01879 * Month 8.941e+02 2.072e+02 4.316 3.00e-05 ***
分別表示: 估值 標(biāo)準(zhǔn)誤差 T值 P值
Intercept:表示截距
Month:影響因子/特征
Estimate的列:包含由普通最小二乘法計(jì)算出來(lái)的估計(jì)回歸系數(shù)。
Std. Error的列:估計(jì)的回歸系數(shù)的標(biāo)準(zhǔn)誤差。
P值估計(jì)系數(shù)不顯著的可能性,有較大P值的變量是可以從模型中移除的候選變量。
t 統(tǒng)計(jì)量和P值:從理論上說(shuō),如果一個(gè)變量的系數(shù)是0,那么該變量是無(wú)意義的,它對(duì)模型毫無(wú)貢獻(xiàn)。
然而,這里顯示的系數(shù)只是估計(jì),它們不會(huì)正好為0。
因此,我們不禁會(huì)問(wèn):從統(tǒng)計(jì)的角度而言,真正的系數(shù)為0的可能性有多大?這是t統(tǒng)計(jì)量和P值的目的,在匯總中被標(biāo)記為t value和Pr(>|t|)。
其 中,我們可以直接通過(guò)P值與我們預(yù)設(shè)的0.05進(jìn)行比較,來(lái)判定對(duì)應(yīng)的解釋變量的顯著性,我們檢驗(yàn)的原假設(shè)是:該系數(shù)顯著為0;若P<0.05,則拒絕原假設(shè),即對(duì)應(yīng)的變量顯著不為0。
可以看到Month、RecentVal4、RecentVal8都可以認(rèn)為是在P為0.05的水平下顯著不為0,通過(guò)顯著性檢驗(yàn);Intercept的P值為0.26714,不顯著。
4. Multiple R-squared和Adjusted R-squared
這兩個(gè)值,即R^{2},常稱之為“擬合優(yōu)度”和“修正的擬合優(yōu)度”,指回歸方程對(duì)樣本的擬合程度幾何,這里我們可以看到,修正的擬合優(yōu) 度=0.8416,表示擬合程度良好,這個(gè)值當(dāng)然是越高越好。
當(dāng)然,提升擬合優(yōu)度的方法很多,當(dāng)達(dá)到某個(gè)程度,我們也就認(rèn)為差不多了。
具體還有很復(fù)雜的判定內(nèi)容,有興趣的可以看看:http://baike.baidu.com/view/657906.htm
5. F-statistic
F-statistic,是我們常說(shuō)的F統(tǒng)計(jì)量,也成為F檢驗(yàn),常常用于判斷方程整體的顯著性檢驗(yàn),其值越大越顯著;其P值為p-value: < 2.2e-16,顯然是<0.05的,可以認(rèn)為方程在P=0.05的水平上還是通過(guò)顯著性檢驗(yàn)的。
簡(jiǎn)單總結(jié):
T檢驗(yàn):檢驗(yàn)解釋變量的顯著性;
R-squared:查看方程擬合程度;
F檢驗(yàn):是檢驗(yàn)方程整體顯著性。
如果是一元線性回歸方程,T檢驗(yàn)的值和F檢驗(yàn)的檢驗(yàn)效果是一樣的,對(duì)應(yīng)的值也是相同的。
補(bǔ)充:在R語(yǔ)言中顯示美麗的數(shù)據(jù)摘要summary統(tǒng)計(jì)信息
總結(jié)數(shù)據(jù)集
## Skim summary statistics ## n obs: 150 ## n variables: 5 ## ## Variable type: factor ## variable missing complete n n_unique top_counts ## 1 Species 0 150 150 3 set: 50, ver: 50, vir: 50, NA: 0 ## ordered ## 1 FALSE ## ## Variable type: numeric ## variable missing complete n mean sd min p25 median p75 max ## 1 Petal.Length 0 150 150 3.76 1.77 1 1.6 4.35 5.1 6.9 ## 2 Petal.Width 0 150 150 1.2 0.76 0.1 0.3 1.3 1.8 2.5 ## 3 Sepal.Length 0 150 150 5.84 0.83 4.3 5.1 5.8 6.4 7.9 ## 4 Sepal.Width 0 150 150 3.06 0.44 2 2.8 3 3.3 4.4 ## hist ## 1 ▇▁▁▂▅▅▃▁ ## 2 ▇▁▁▅▃▃▂▂ ## 3 ▂▇▅▇▆▅▂▂ ## 4 ▁▂▅▇▃▂▁▁
選擇要匯總的特定列
## Skim summary statistics ## n obs: 150 ## n variables: 5 ## ## Variable type: numeric ## variable missing complete n mean sd min p25 median p75 max ## 1 Petal.Length 0 150 150 3.76 1.77 1 1.6 4.35 5.1 6.9 ## 2 Sepal.Length 0 150 150 5.84 0.83 4.3 5.1 5.8 6.4 7.9 ## hist ## 1 ▇▁▁▂▅▅▃▁ ## 2 ▂▇▅▇▆▅▂▂
處理分組數(shù)據(jù)
可以處理已使用分組的數(shù)據(jù)dplyr::group_by。
## Skim summary statistics ## n obs: 150 ## n variables: 5 ## group variables: Species ## ## Variable type: numeric ## Species variable missing complete n mean sd min p25 median ## 1 setosa Petal.Length 0 50 50 1.46 0.17 1 1.4 1.5 ## 2 setosa Petal.Width 0 50 50 0.25 0.11 0.1 0.2 0.2 ## 3 setosa Sepal.Length 0 50 50 5.01 0.35 4.3 4.8 5 ## 4 setosa Sepal.Width 0 50 50 3.43 0.38 2.3 3.2 3.4 ## 5 versicolor Petal.Length 0 50 50 4.26 0.47 3 4 4.35 ## 6 versicolor Petal.Width 0 50 50 1.33 0.2 1 1.2 1.3 ## 7 versicolor Sepal.Length 0 50 50 5.94 0.52 4.9 5.6 5.9 ## 8 versicolor Sepal.Width 0 50 50 2.77 0.31 2 2.52 2.8 ## 9 virginica Petal.Length 0 50 50 5.55 0.55 4.5 5.1 5.55 ## 10 virginica Petal.Width 0 50 50 2.03 0.27 1.4 1.8 2 ## 11 virginica Sepal.Length 0 50 50 6.59 0.64 4.9 6.23 6.5 ## 12 virginica Sepal.Width 0 50 50 2.97 0.32 2.2 2.8 3 ## p75 max hist ## 1 1.58 1.9 ▁▁▅▇▇▅▂▁ ## 2 0.3 0.6 ▂▇▁▂▂▁▁▁ ## 3 5.2 5.8 ▂▃▅▇▇▃▁▂ ## 4 3.68 4.4 ▁▁▃▅▇▃▂▁ ## 5 4.6 5.1 ▁▃▂▆▆▇▇▃ ## 6 1.5 1.8 ▆▃▇▅▆▂▁▁ ## 7 6.3 7 ▃▂▇▇▇▃▅▂ ## 8 3 3.4 ▁▂▃▅▃▇▃▁ ## 9 5.88 6.9 ▂▇▃▇▅▂▁▂ ## 10 2.3 2.5 ▂▁▇▃▃▆▅▃ ## 11 6.9 7.9 ▁▁▃▇▅▃▂▃ ## 12 3.18 3.8 ▁▃▇▇▅▃▁▂
指定統(tǒng)計(jì)信息和類
可以用戶使用與該skim_with()功能組合的列表來(lái)指定自己的統(tǒng)計(jì)信息。
## Skim summary statistics ## n obs: 150 ## n variables: 5 ## ## Variable type: numeric ## variable iqr mad ## 1 Sepal.Length 1.3 1.04
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章
R語(yǔ)言 實(shí)現(xiàn)手動(dòng)設(shè)置xy軸刻度的操作
這篇文章主要介紹了R語(yǔ)言 實(shí)現(xiàn)手動(dòng)設(shè)置xy軸刻度的操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-04-04R語(yǔ)言中邏輯回歸知識(shí)點(diǎn)總結(jié)
在本篇文章里小編給大家總結(jié)了關(guān)于R語(yǔ)言中邏輯回歸知識(shí)點(diǎn)相關(guān)內(nèi)容,有需要的朋友們跟著學(xué)習(xí)下。2021-05-05R語(yǔ)言ARMA模型的參數(shù)選擇說(shuō)明
這篇文章主要介紹了R語(yǔ)言ARMA模型的參數(shù)選擇說(shuō)明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-04-04R語(yǔ)言學(xué)習(xí)初識(shí)Rcpp類型List
這篇文章主要為大家介紹了R語(yǔ)言中Rcpp的類型List的基礎(chǔ)學(xué)習(xí),有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步早日升職加薪2021-11-11R語(yǔ)言多元Logistic邏輯回歸應(yīng)用實(shí)例
這篇文章主要給大家介紹了關(guān)于R語(yǔ)言多元Logistic邏輯回歸應(yīng)用的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-03-03