使用R語(yǔ)言填補(bǔ)缺失值的方法
使用R語(yǔ)言填補(bǔ)缺失值
數(shù)據(jù)處理過(guò)程中,往往會(huì)存在缺失值,對(duì)于缺失值的處理,目前各大統(tǒng)計(jì)書提出的方法有剔除,用均數(shù)填補(bǔ),用眾數(shù)填補(bǔ),采用其他自變量進(jìn)行回歸,推算缺失值進(jìn)行填補(bǔ)等。在R語(yǔ)言中如何按要求進(jìn)行填補(bǔ)?下面將介紹如何進(jìn)行缺失值填補(bǔ)的各種方法
用某特定值替換缺失值
下面這段代碼表示使用0填補(bǔ)缺失值,x是需要填補(bǔ)的數(shù)據(jù)框的某行或某列,如果是其他值,將0改成需要的值即可。
FillNA <- function(x){
x[is.na(x )]<- 0;
x
}
使用均值,眾數(shù),中位數(shù)進(jìn)行填補(bǔ)
該過(guò)程函數(shù)是一樣的,只需要將后續(xù)填補(bǔ)要用的值進(jìn)行修正即可。
library(data.table)
library(dplyr)
library(tidyverse)
#data.table
setDT(data)
data[,names(data):=lapply(.SD,function(x){x[is.na(x)] <- getmode(x)
x})]
#dplyr
data %>%
mutate_all(function(x){x[is.na(x)] <- getmode(x)
x})
dplyr_if_else <- function(x) { mutate_all(x, ~if_else(is.na(.), 0, .)) }
#tidyverse
df %>%
select(Pclass, Sex, SibSp, Embarked) %>%
map_dfc(~ replace_na(.x, rstatix::get_mode(.x)[1]))
到此這篇關(guān)于使用R語(yǔ)言填補(bǔ)缺失值的方法的文章就介紹到這了,更多相關(guān)R語(yǔ)言填補(bǔ)缺失值內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
R語(yǔ)言中corrplot標(biāo)題居中及eps格式輸出
由于論文的需要,很多R語(yǔ)言繪圖需要eps格式矢量圖的方式進(jìn)行輸出,同時(shí)最近也需要繪制相關(guān)性圖,因此決定寫個(gè)博客作為記錄,有需要的朋友可以借鑒參考下2021-11-11
輕松學(xué)會(huì)R語(yǔ)言識(shí)別Excel日期
想知道如何用R語(yǔ)言識(shí)別Excel中的日期嗎?別擔(dān)心,我們有你需要的全部信息!本指南將向你展示如何使用R語(yǔ)言輕松識(shí)別Excel表格中的日期數(shù)據(jù),讓你在數(shù)據(jù)分析中游刃有余,快來(lái)掌握這一技巧,讓數(shù)據(jù)處理更加高效!2023-12-12
基于R/RStudio中安裝包“無(wú)法與服務(wù)器建立連接”的解決方案
這篇文章主要介紹了基于R/RStudio中安裝包“無(wú)法與服務(wù)器建立連接”的解決方案,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-04-04
R語(yǔ)言繪圖時(shí)輸出希臘字符上下標(biāo)及數(shù)學(xué)公式實(shí)現(xiàn)方法
這篇文章主要為大家介紹了R語(yǔ)言進(jìn)行繪圖時(shí)輸出希臘字符上標(biāo),下標(biāo)及數(shù)學(xué)公式的實(shí)現(xiàn)方法,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2021-11-11

