R語言歸一化處理實(shí)例講解
歸一化就是要把你需要處理的數(shù)據(jù)經(jīng)過處理后(通過某種算法)限制在你需要的一定范圍內(nèi)。首先歸一化是為了后面數(shù)據(jù)處理的方便,其次是保正程序運(yùn)行時(shí)收斂加快。
R語言中的歸一化函數(shù):scale
數(shù)據(jù)歸一化包括數(shù)據(jù)的中心化和數(shù)據(jù)的標(biāo)準(zhǔn)化。
1. 數(shù)據(jù)的中心化
所謂數(shù)據(jù)的中心化是指數(shù)據(jù)集中的各項(xiàng)數(shù)據(jù)減去數(shù)據(jù)集的均值。
例如有數(shù)據(jù)集1, 2, 3, 6, 3,其均值為3,那么中心化之后的數(shù)據(jù)集為1-3,2-3,3-3,6-3,3-3,即:-2,-1,0,3,0
2. 數(shù)據(jù)的標(biāo)準(zhǔn)化
所謂數(shù)據(jù)的標(biāo)準(zhǔn)化是指中心化之后的數(shù)據(jù)在除以數(shù)據(jù)集的標(biāo)準(zhǔn)差,即數(shù)據(jù)集中的各項(xiàng)數(shù)據(jù)減去數(shù)據(jù)集的均值再除以數(shù)據(jù)集的標(biāo)準(zhǔn)差。
例如有數(shù)據(jù)集1, 2, 3, 6, 3,其均值為3,其標(biāo)準(zhǔn)差為1.87,那么標(biāo)準(zhǔn)化之后的數(shù)據(jù)集為(1-3)/1.87,(2-3)/1.87,(3-3)/1.87,(6-3)/1.87,(3-3)/1.87,即:-1.069,-0.535,0,1.604,0
數(shù)據(jù)中心化和標(biāo)準(zhǔn)化的意義是一樣的,為了消除量綱對(duì)數(shù)據(jù)結(jié)構(gòu)的影響。在R語言中可以使用scale方法來對(duì)數(shù)據(jù)進(jìn)行中心化和標(biāo)準(zhǔn)化。
scale函數(shù)是將一組數(shù)進(jìn)行處理,默認(rèn)情況下是將一組數(shù)的每個(gè)數(shù)都減去這組數(shù)的平均值后再除以這組數(shù)的標(biāo)準(zhǔn)差。
其中有兩個(gè)參數(shù):
center=TRUE,默認(rèn)的,是將一組數(shù)中每個(gè)數(shù)減去平均值,若為false,則不減平均值;
scale=TRUE,默認(rèn)的,是將一組數(shù)中每個(gè)數(shù)除以標(biāo)準(zhǔn)差。
scale默認(rèn)情況下:將一組數(shù)的每個(gè)數(shù)都減去這組數(shù)的平均值后再除以這組數(shù)的標(biāo)準(zhǔn)差。
> scale(ss) [,1] [1,] -1.3805850 [2,] -0.6371931 [3,] 0.1061988 [4,] 0.8495908 [5,] 1.5929827 [6,] 0.1061988 [7,] -0.6371931 attr(,"scaled:center") [1] 2.857143 attr(,"scaled:scale") [1] 1.345185
到此這篇關(guān)于R語言歸一化處理實(shí)例講解的文章就介紹到這了,更多相關(guān)R語言歸一化處理內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
R繪制漂亮的中國(guó)地圖的實(shí)現(xiàn)示例
本文主要介紹了R繪制漂亮的中國(guó)地圖的實(shí)現(xiàn)示例,文中通過示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-09-09R語言利用loess如何去除某個(gè)變量對(duì)數(shù)據(jù)的影響詳解
這篇文章主要給大家介紹了關(guān)于R語言利用loess去除某個(gè)變量對(duì)數(shù)據(jù)的影響的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧。2017-11-11R語言導(dǎo)入導(dǎo)出數(shù)據(jù)的幾種方法匯總
這篇文章主要給大家總結(jié)介紹了R語言導(dǎo)入導(dǎo)出數(shù)據(jù)的幾種方法,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2021-03-03R語言數(shù)據(jù)類型與相應(yīng)運(yùn)算的實(shí)現(xiàn)
本文主要介紹了R語言數(shù)據(jù)類型與相應(yīng)運(yùn)算的實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2022-03-03R語言 用均值替換、回歸插補(bǔ)及多重插補(bǔ)進(jìn)行插補(bǔ)的操作
這篇文章主要介紹了R語言 用均值替換、回歸插補(bǔ)及多重插補(bǔ)進(jìn)行插補(bǔ)的操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2021-03-03