使用R語言填補(bǔ)缺失值的方法
使用R語言填補(bǔ)缺失值
數(shù)據(jù)處理過程中,往往會存在缺失值,對于缺失值的處理,目前各大統(tǒng)計(jì)書提出的方法有剔除,用均數(shù)填補(bǔ),用眾數(shù)填補(bǔ),采用其他自變量進(jìn)行回歸,推算缺失值進(jìn)行填補(bǔ)等。在R語言中如何按要求進(jìn)行填補(bǔ)?下面將介紹如何進(jìn)行缺失值填補(bǔ)的各種方法
用某特定值替換缺失值
下面這段代碼表示使用0填補(bǔ)缺失值,x是需要填補(bǔ)的數(shù)據(jù)框的某行或某列,如果是其他值,將0改成需要的值即可。
FillNA <- function(x){ x[is.na(x )]<- 0; x }
使用均值,眾數(shù),中位數(shù)進(jìn)行填補(bǔ)
該過程函數(shù)是一樣的,只需要將后續(xù)填補(bǔ)要用的值進(jìn)行修正即可。
library(data.table) library(dplyr) library(tidyverse) #data.table setDT(data) data[,names(data):=lapply(.SD,function(x){x[is.na(x)] <- getmode(x) x})] #dplyr data %>% mutate_all(function(x){x[is.na(x)] <- getmode(x) x}) dplyr_if_else <- function(x) { mutate_all(x, ~if_else(is.na(.), 0, .)) } #tidyverse df %>% select(Pclass, Sex, SibSp, Embarked) %>% map_dfc(~ replace_na(.x, rstatix::get_mode(.x)[1]))
到此這篇關(guān)于使用R語言填補(bǔ)缺失值的方法的文章就介紹到這了,更多相關(guān)R語言填補(bǔ)缺失值內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
R語言中corrplot標(biāo)題居中及eps格式輸出
由于論文的需要,很多R語言繪圖需要eps格式矢量圖的方式進(jìn)行輸出,同時(shí)最近也需要繪制相關(guān)性圖,因此決定寫個(gè)博客作為記錄,有需要的朋友可以借鑒參考下2021-11-11基于R/RStudio中安裝包“無法與服務(wù)器建立連接”的解決方案
這篇文章主要介紹了基于R/RStudio中安裝包“無法與服務(wù)器建立連接”的解決方案,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-04-04R語言繪圖時(shí)輸出希臘字符上下標(biāo)及數(shù)學(xué)公式實(shí)現(xiàn)方法
這篇文章主要為大家介紹了R語言進(jìn)行繪圖時(shí)輸出希臘字符上標(biāo),下標(biāo)及數(shù)學(xué)公式的實(shí)現(xiàn)方法,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2021-11-11