R語(yǔ)言因子型數(shù)值轉(zhuǎn)數(shù)值型的操作
一直覺得只要是數(shù)字,不管是什么類型的,都可以通過as.numeric()函數(shù)轉(zhuǎn)換為對(duì)應(yīng)的numeric類型的數(shù)字,例如
x<-“123”,x為character類型,而as.numeric(x)則為numeric類型的123。
但是因子(factor)類型卻不一樣。
a<-factor(c(100,200,300,301,302,400,10)),它們的值分別為100 200 300 301 302 400 10,然而
as.numeric(a)對(duì)應(yīng)的值并非100 200 300 301 302 400 10,而是2 3 4 5 6 7 1。
因子(factor)轉(zhuǎn)換成數(shù)值型(numeric)的規(guī)則是這樣的:
一共有n個(gè)數(shù),那么轉(zhuǎn)換后的數(shù)字就會(huì)在1——n中取值,數(shù)字最小的取一,次小的取二,以此類推。
那么如何讓因子(factor)類型里的數(shù)值轉(zhuǎn)換對(duì)應(yīng)的數(shù)值型呢?
mean(as.numeric(as.character(factorname))) mean(as.numeric(levels(factorname)[factorname]))
以上代碼都可以實(shí)現(xiàn)將因子(factor)類型里的數(shù)值轉(zhuǎn)換對(duì)應(yīng)的數(shù)值型,思路都是先轉(zhuǎn)換成字符型然后再轉(zhuǎn)換成數(shù)值型。
補(bǔ)充:R_as.numeric()函數(shù)在轉(zhuǎn)換小數(shù)時(shí)返回?zé)o意義結(jié)果的解決
本文重點(diǎn)解決as.numeric()函數(shù)將factor轉(zhuǎn)為數(shù)值時(shí)得出的無意義結(jié)果的解決
假設(shè)有數(shù)據(jù)框aaa
x | y | value ------------------------------------------ a1 b2 0.510665432157769 a2 b3 0.887655678543227 .. .. ...
運(yùn)行as.numeric(aaa[1,3]),返回的結(jié)果居然是123?當(dāng)然,這只是個(gè)栗子,為了表達(dá)問題所在。真正運(yùn)行時(shí)不一定得到的結(jié)果是123
在R help中找到如下參考
Warning
If x is a factor, as.numeric will return the underlying numeric (integer) representation, which is often meaningless as it may not correspond to the factor levels, see the ‘Warning' section in factor (and the 2nd example below).
看到meaningless這個(gè)詞了嗎,意思是如果使用as.numeric轉(zhuǎn)換一個(gè)因子,則通常會(huì)返回一個(gè)無意義的結(jié)果,是因子的一個(gè)“整型數(shù)字象征”,因?yàn)镽為了節(jié)省內(nèi)存提高速度,因子類型底層是用C語(yǔ)言中的int實(shí)現(xiàn)的,因子的值與該整型數(shù)值的“轉(zhuǎn)換表格”存儲(chǔ)在內(nèi)存中。
那么我們?nèi)绾谓鉀Q呢?
嵌套使用
as.numeric(as.character(aaa[1,3]))
這樣返回的就是正常應(yīng)轉(zhuǎn)化的數(shù)值,而不是一個(gè)無意義的結(jié)果如一百二十三。
但上面的方法有一個(gè)問題,在小數(shù)點(diǎn)后位數(shù)太大時(shí)輸出結(jié)果會(huì)四舍五入。
對(duì)于這個(gè),我們可以使用print()函數(shù)中的參數(shù)digit,print(as.numeric(as.character(aaa[1,3])),digits = 16),輸出的就是不帶四舍五入的完整值
理論上format(xx, digits = 16)也可以保證長(zhǎng)度,但我沒在這種情況下試。
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章
R語(yǔ)言數(shù)據(jù)類型與相應(yīng)運(yùn)算的實(shí)現(xiàn)
本文主要介紹了R語(yǔ)言數(shù)據(jù)類型與相應(yīng)運(yùn)算的實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2022-03-03R語(yǔ)言修改下載安裝包install.package的默認(rèn)存儲(chǔ)路徑的操作方法
這篇文章主要介紹了R語(yǔ)言修改下載安裝包install.package的默認(rèn)存儲(chǔ)路徑的操作方法,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-03-03R語(yǔ)言ggplot2設(shè)置圖例(legend)的操作大全
ggplot2是一個(gè)繪制可視化圖形的R包,汲取了R語(yǔ)言基礎(chǔ)繪圖系統(tǒng)(graphics)和l?attice包的優(yōu)點(diǎn),下面這篇文章主要給大家介紹了關(guān)于R語(yǔ)言ggplot2設(shè)置圖例(legend)的操作大全,需要的朋友可以參考下2022-07-07R語(yǔ)言中quantile()函數(shù)的用法說明
這篇文章主要介紹了R語(yǔ)言中quantile()函數(shù)的用法說明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2021-04-04