R語言繪圖-點圖dot plot
點圖簡介
點圖又叫Cleveland dot plot,克利夫蘭點圖??梢栽谒骄€上繪制大量的點,更好的表示點之間的關(guān)系。強(qiáng)調(diào)數(shù)據(jù)的排序展示以及數(shù)據(jù)之間的差距。
點圖一般是橫向展示,所以y軸為類別型變量,x軸為需要展示的數(shù)據(jù)值。
dotchart函數(shù)
dotchart(x, labels = NULL, groups = NULL, gdata = NULL, ann = par("ann"), xaxt = par("xaxt"), frame.plot = TRUE, log = "", cex = par("cex"), pt.cex = cex, pch = 21, gpch = 21, bg = par("bg"), color = par("fg"), gcolor = par("fg"), lcolor = "gray", xlim = range(x[is.finite(x)]), main = NULL, xlab = NULL, ylab = NULL, ...)
R語言的base包里面自帶的dotchart函數(shù)可以繪制點圖。
上面簡介中的例子copy自dotchart的函數(shù)幫助文檔。
dotchart(VADeaths, main = "Death Rates in Virginia - 1940")
數(shù)據(jù)是1940年每1000人的死亡率。數(shù)據(jù)按照年齡段來區(qū)分,并且按照地方,男女性分組。
> VADeaths Rural Male Rural Female Urban Male Urban Female 50-54 11.7 8.7 15.4 8.4 55-59 18.1 11.7 24.3 13.6 60-64 26.9 20.3 37.0 19.3 65-69 41.0 30.9 54.6 35.1 70-74 66.0 54.3 71.1 50.0
dot 比較圖
我想比較特定地方的男女死亡率的比較。這樣的話,數(shù)據(jù)需要處理。下面的code處理的比較麻煩。但是達(dá)到了我要的效果。
ruralDFMale <- data.frame(rownames(VADeaths),VADeaths[,1], c("Male","Male","Male","Male","Male")) names(ruralDFMale ) <- c("AgeGroup", "DeathRate","Gender" ) ruralDFFeMale <- data.frame(rownames(VADeaths),VADeaths[,2], c("Female","Female","Female","Female","Female")) names(ruralDFFeMale) <- c("AgeGroup", "DeathRate","Gender" ) ruralDF <- rbind(ruralDFMale, ruralDFFeMale) colorFun <- function(gender) { colorVec <- vector() for(g in gender) { if(g == "Female") { colorVec <- c(colorVec, "Red") } else { colorVec <- c(colorVec, "Blue") } } colorVec } dotchart(ruralDF$DeathRate, main = "Death Rates in Virginia - 1940", groups=ruralDF$AgeGroup,color=colorFun(ruralDF$Gender))
處理過后的數(shù)據(jù)
> ruralDF AgeGroup DeathRate Gender 50-54 50-54 11.7 Male 55-59 55-59 18.1 Male 60-64 60-64 26.9 Male 65-69 65-69 41.0 Male 70-74 70-74 66.0 Male 50-541 50-54 8.7 Female 55-591 55-59 11.7 Female 60-641 60-64 20.3 Female 65-691 65-69 30.9 Female 70-741 70-74 54.3 Female
圖中的紅色為女性,藍(lán)色為男性。結(jié)果符合一般的常識,女性的壽命高于男性。所以同一年齡段的女性死亡率比男性低。
補(bǔ)充:R語言作圖——violin plot(小提琴圖)
小仙同學(xué)決定學(xué)習(xí)R語言來提升自己作圖的“格調(diào)”的時候,心中還有有些疑慮的(嘿嘿,我這么懶,可不愿意做無用功了?)。仔細(xì)想了想,貌似又找到了兩個學(xué)習(xí)R的理由。
一是R可以幫助我們避免重復(fù)勞動,實現(xiàn)“一勞永逸”的終極夢想。盡管非常不想承認(rèn)這一事實,在科研的過程中,小仙同學(xué)制造出了大量“無效”的數(shù)據(jù)(sign…),但也不得不“絞盡腦汁”、“竭盡全力”地進(jìn)行花式分析,試圖找出合理的解釋。這時候用Excel或者Origin作圖的劣勢就顯現(xiàn)出來了,每換一種分析方法或者是數(shù)據(jù),我們都需要經(jīng)過“插入圖表”、“調(diào)整顏色”、“調(diào)整間距”等等繁雜的工序畫出一張可以拿去“面圣”的圖。小仙同學(xué)一想到這些就感覺“累覺不愛”了。
二是R可以自動生成比較貌美的圖。不知道大家有沒有這樣的感受,自己辛辛苦苦畫了半天、調(diào)整的半天的圖會得到真實卻很殘忍的評價“很丑”(這是小仙同學(xué)心中永遠(yuǎn)的痛)。即使本小仙自以為眼光獨特、品味高雅,費勁嘗試“高級”的色系,但搭配出來總是那么不盡人意(實測網(wǎng)紅晚晚帶火的“莫蘭迪色”不適用于科研繪圖)。顏色的搭配、飽和度和透明度的調(diào)整沒有想象中那么容易。折騰了半天,天生就愛不服氣的本小仙,最后決定還是把專業(yè)的事交給專業(yè)的人做啦(偷偷告訴你,據(jù)說有科學(xué)家專門研究paper插圖的配色,所以自己畫的圖沒有那么貌美的時候也不要“妄自菲薄”啦)。
好了,叨叨這么多,終于要開始進(jìn)入正題啦。一開始用R繪圖的時候,小仙同學(xué)其實是非常痛苦的,因為沒有編程基礎(chǔ),又懟了好幾年瓶瓶罐罐,看到一行行代碼,腦子里飄過的全是“&%¥#@¥$”。尤其是當(dāng)你有實驗要做、報告要寫、作業(yè)要交的時候,平心靜氣地坐下來踏踏實實學(xué)習(xí)真的太難了(有人說小仙同學(xué)那么忙是因為效率低,好像真有些道理,我這真是“唉”,有苦說不出)。
后來本小仙的學(xué)習(xí)策略就非常簡單,用到啥就去搜啥,我對數(shù)據(jù)結(jié)構(gòu)、語法結(jié)構(gòu)一點都不感興趣,能讓我用最短的時間內(nèi)畫出我想要的圖,就是最好的方法。即使這樣,小仙同學(xué)還是費了一些功夫。因為網(wǎng)上的一些教程,很多都是從別處復(fù)制粘貼過來的,本身就不完整。另外一個原因,某些大神覺得自己的教程已經(jīng)足夠通俗易懂了,有些大家都知道的基礎(chǔ)知識根本不需要講(小仙同學(xué)不服,有基礎(chǔ)的同學(xué)不用看教程也可以自己摸索出來,真正需要教程的就是我們這些小白)。
小仙同學(xué)愿意嘗試一下,把最最全面、稍作修改就能拿去的方法code分享一下,也不枉費花了那么多的時間。
那就先從violin plot開始吧。
(假設(shè)你已經(jīng)安裝了R和RStudio)
Step1. 繪圖數(shù)據(jù)的準(zhǔn)備
首先要把你想要繪圖的數(shù)據(jù)調(diào)整成R語言可以識別的格式。
一般我們的數(shù)據(jù)都是保存在excel文檔里,這里建議大家在excel中保存成csv格式,讀寫的速度會比xlsx快很多。(小仙同學(xué)的親身經(jīng)驗,我的有些數(shù)據(jù)有兩萬行,xlsx在我的耐心范圍內(nèi)讀不進(jìn)去,RStudio崩潰)。
數(shù)據(jù)的格式如下圖:一列表示一種變量,第一行是列名
Step2. 繪圖數(shù)據(jù)的讀取
data<-read.csv(“your file path”, header = T) #注釋:header=T表示數(shù)據(jù)中
的第一行是列名,如果沒有列名就用header=F
Step3.繪圖所需package的安裝、調(diào)用
install.package(“ggplot2”) #注釋:ggplot2是目前公認(rèn)繪圖很強(qiáng)的一個安裝包 library(ggplot2) #注釋:package在使用之前需要調(diào)用
Step4.繪圖
data$dose <- as.factor(data$dose) #注釋:此處dose可用你的變量名稱替換,$表示取數(shù)據(jù)集里的某一個元素
p<-ggplot(data, aes(x = dose, y = len)) #注釋:”x=”,”y=”表示x軸和y軸表示的變量數(shù)值,p表示圖像對象 p+geom_violin() #注釋:畫出violin plot的函數(shù)
Step5.美化
p+geom_violin(aes(fill = dose)) #注釋:按組別填充不同的顏色
*如果你想手動改變顏色,可以使用這一句
p+geom_violin(aes(fill = “dose”))+scale_fill_manual(values=c("#56B4E9")) #注釋:”#56B4E9”可以用其他顏色的代碼來替換
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。