R語(yǔ)言中的因子類(lèi)型詳解
一、Factor函數(shù)
#函數(shù)factor可以把一個(gè)向量編碼為一個(gè)因子,其一般形式為: #factor(x,levels=sort(unique(x),na.last=TRUE),labels,exculde=NA,order=FALSE) #其中x是向量,levels是水平,可以自行指定各離散的取值,不指定時(shí)由x的不同值來(lái)表示,labels可以用來(lái)指定各水平的標(biāo)簽 #不指定時(shí)用各離散取值的對(duì)應(yīng)字符串 sex<-c("M","F","M","M","F") factor(sex) #使用is.factor來(lái)判斷對(duì)象是否為因子類(lèi)型 is.factor(sex) #使用as.factor來(lái)將對(duì)象轉(zhuǎn)換為因子類(lèi)型 sex.factor<-as.factor(sex) #使用levels來(lái)取得因子中的水平 levels(sex.factor) # [1] "F" "M"
二、tapply函數(shù)
#函數(shù)tapply() #當(dāng)我們知道5個(gè)人的性別以及5個(gè)人的身高的時(shí)候,就能計(jì)算出每個(gè)性別下的平均身高 height<-c(170,175,180,165,168) tapply(height,sex.factor,mean) # F M # 171.5000 171.6667 #tapply 的使用格式為tapply(x,index,fun) 其中x為對(duì)象,index為與x具有相同個(gè)數(shù)的因子類(lèi)型,fun為指定的方法
三、gl()函數(shù)
#gl()函數(shù) #gl函數(shù)能很快的產(chǎn)生因子,其基本用法為:gl(n,k,length=n*k,labels=1:n,order=false) gl(3,5) # [1] 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 # Levels: 1 2 3 gl(3,1,15) # [1] 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 # Levels: 1 2 3
補(bǔ)充:R語(yǔ)言中因子(factor)轉(zhuǎn)換成數(shù)值型(numeric)的問(wèn)題
一直覺(jué)得只要是數(shù)字,不管是什么類(lèi)型的,都可以通過(guò)as.numeric()函數(shù)轉(zhuǎn)換為對(duì)應(yīng)的numeric類(lèi)型的數(shù)字,例如
x<-“123”,x為character類(lèi)型,而as.numeric(x)則為numeric類(lèi)型的123。但是因子(factor)類(lèi)型卻不一樣。
a<-factor(c(100,200,300,301,302,400,10)),它們的值分別為100 200 300 301 302 400 10,然而as.numeric(a)對(duì)應(yīng)的值并非100 200 300 301 302 400 10,而是2 3 4 5 6 7 1。因子(factor)轉(zhuǎn)換成數(shù)值型(numeric)的規(guī)則是這樣的:
一共有n個(gè)數(shù),那么轉(zhuǎn)換后的數(shù)字就會(huì)在1——n中取值,數(shù)字最小的取一,次小的取二,以此類(lèi)推。
那么如何讓因子(factor)類(lèi)型里的數(shù)值轉(zhuǎn)換對(duì)應(yīng)的數(shù)值型呢?
as.numeric(as.character(factorname)) as.numeric(levels(factorname)[factorname])
以上代碼都可以實(shí)現(xiàn)將因子(factor)類(lèi)型里的數(shù)值轉(zhuǎn)換對(duì)應(yīng)的數(shù)值型,思路都是先轉(zhuǎn)換成字符型然后再轉(zhuǎn)換成數(shù)值型。
相關(guān)文章
R語(yǔ)言使用ggplot繪制畫(huà)中畫(huà)細(xì)節(jié)放大的方法
這篇文章主要為大家介紹了R語(yǔ)言使用ggplot繪制畫(huà)中畫(huà)細(xì)節(jié)放大的方法實(shí)現(xiàn)示例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步2021-11-11關(guān)于R語(yǔ)言lubridate包處理時(shí)間數(shù)據(jù)的問(wèn)題
這篇文章主要介紹了關(guān)于R語(yǔ)言lubridate包處理時(shí)間數(shù)據(jù)的問(wèn)題,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-05-05R語(yǔ)言繪圖數(shù)據(jù)可視化Ridgeline plot山脊圖畫(huà)法
這篇文章主要為大家介紹了R語(yǔ)言繪圖數(shù)據(jù)可視化Ridgeline plot山脊圖畫(huà)法的示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助2022-02-02R語(yǔ)言作圖之density plot(密度圖)的制作步驟
這篇文章主要介紹了R語(yǔ)言作圖之density plot(密度圖)的制作步驟,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-03-03R語(yǔ)言ggplot2拼圖包patchwork安裝使用
這篇文章主要介紹了R語(yǔ)言ggplot2拼圖包patchwork安裝使用的圖文示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-06-06R語(yǔ)言實(shí)現(xiàn)用cbind合并兩列數(shù)據(jù)
這篇文章主要介紹了R語(yǔ)言實(shí)現(xiàn)用cbind合并兩列數(shù)據(jù),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-04-04