R語(yǔ)言ggplot2繪圖安裝與調(diào)試
0x01 安裝與R基礎(chǔ)
一直聽(tīng)說(shuō)數(shù)據(jù)分析里R語(yǔ)言是比較‘正統(tǒng)’,況且久聞ggplot2這些R語(yǔ)言的數(shù)據(jù)分析庫(kù)大名,想到今后數(shù)據(jù)分析和整理的需要,這里開(kāi)一個(gè)簡(jiǎn)單的系列學(xué)習(xí)一些R語(yǔ)言和ggplot2的繪圖基礎(chǔ)。本人學(xué)習(xí)的書(shū)籍是Winston Chang大佬的《R Graphics Cookbook》,且稍有一點(diǎn)Python里的Plotnine繪圖基礎(chǔ)。但我算是R語(yǔ)言小白,所以整個(gè)系列也可以記錄自己學(xué)習(xí)遇到的坑,供大家參考。
庫(kù)安裝
我使用的R版本為3.6.3,需要下載的庫(kù)包括ggplot2,gcookbook和dplyr庫(kù)??梢允褂萌缦碌陌惭b指令:
install.packages("ggplo2") install.packages("dplyr") install.packages("gcookbook")
如果遇到了installation of package ‘ggplot2’ had non-zero exit status類似的問(wèn)題,可以指定安裝程序強(qiáng)制安裝二進(jìn)制文件[1],如
install.packages("ggplo2", type = "binary")
R語(yǔ)言數(shù)據(jù)處理基礎(chǔ)
首先簡(jiǎn)單介紹數(shù)據(jù)輸入常用的兩種方法,一種是CSV數(shù)據(jù),我們可以采用函數(shù)read.csv(file, args)
輸入;另一種常用數(shù)據(jù)EXCEL數(shù)據(jù)可以使用read_excel(file)
函數(shù)輸入數(shù)據(jù)。
dplyr包(magrittr包)提供了一種運(yùn)算符%>%,可以在R中實(shí)現(xiàn)類似連續(xù)函數(shù)調(diào)用的編程方法,以嵌套函數(shù)f,g,h為例:
h(g(f(x))) # 等價(jià)于 x %>% f() %>% g() %>% h()
這樣的函數(shù)調(diào)用相比嵌套函數(shù)更加直觀,尤其是在多個(gè)連續(xù)的數(shù)據(jù)集處理場(chǎng)合。
基礎(chǔ)繪圖以及概念
散點(diǎn)圖和完整流程
繪制圖片使用的數(shù)據(jù)集為mtcars:
mtcars %>% head()
mpg cyl disp hp drat wt qsec vs am gear carb Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4 Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4 Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1 Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1 Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2 Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1
在開(kāi)始繪圖之前,有一點(diǎn)基本的R語(yǔ)言基礎(chǔ)設(shè)施需要準(zhǔn)備。R語(yǔ)言畫(huà)圖需要有基礎(chǔ)的畫(huà)布,可以用dev.new()函數(shù)來(lái)開(kāi)啟一個(gè)新的畫(huà)布(如果是windows系統(tǒng)需要使用windows()函數(shù))。
dev.new() # windows() # windows系統(tǒng)使用
下面直接展示最簡(jiǎn)單的散點(diǎn)圖繪制代碼:
p <- ggplot(mtcars, aes(x = wt, y = mpg)) + geom_point()
上面的代碼就是一個(gè)使用ggplot2繪圖的最基本結(jié)構(gòu),ggplot函數(shù)是保存數(shù)據(jù)集和映射信息(aes)等基本信息的繪圖主函數(shù),也可以理解為存儲(chǔ)所有信息的畫(huà)布底層。第一個(gè)參數(shù)放入數(shù)據(jù)集,后續(xù)的映射都在此數(shù)據(jù)集上進(jìn)行,本例中就是使用了mtcars中的wt列作為x,mpg列作為y值。ggplot2中的函數(shù)基本均是加法進(jìn)行組合,所以這里加上了geom_point函數(shù)組合進(jìn)繪圖。此時(shí)geom_point函數(shù)通過(guò)ggplot函數(shù)可以得知其繪圖需要用到的鍵信息(x, y)分別對(duì)應(yīng)的數(shù)據(jù)值。代碼運(yùn)行結(jié)果如下:
繪制完圖后,可以選擇print(p)來(lái)查看圖片并保存,或者使用ggplot2自帶的函數(shù)ggsave來(lái)保存圖片,基本的格式例如png,pdf等都有[2]。
ggsave(p, "p.png")
如果想要繪圖的數(shù)據(jù)不屬于同一個(gè)data frame,那么可以不指定ggplot函數(shù)的數(shù)據(jù)項(xiàng),在aes映射中直接定義,如下所示:
ggplot(data=null, aes(x = mtcars$wt, y = mtcars$mpg))
其他基本繪圖與基礎(chǔ)
下面的代碼展示了R語(yǔ)言繪制線形圖的基本函數(shù)geom_line,同時(shí)展示了ggplot2通過(guò)組合函數(shù)geom_line和geom_point來(lái)繪圖的基本邏輯:
p <- ggplot(pressure, aes(x = temperature, y = pressure)) + geom_line() + geom_point()
對(duì)于柱形圖,ggplot2的相關(guān)支持比較多,這里展示最基礎(chǔ)的兩種,一個(gè)是geom_bar函數(shù):
p <- ggplot(mtcars, aes(x = factor(cyl))) + geom_bar()
這里有一個(gè)新的函數(shù)factor,這個(gè)函數(shù)是將數(shù)據(jù)列變化為因子,體現(xiàn)在圖上類似于將連續(xù)變量轉(zhuǎn)化為了離散的變量??梢钥吹?,上述的映射信息中不包括y值。這是因?yàn)間eom_bar函數(shù)默認(rèn)的運(yùn)作方式count,也就是統(tǒng)計(jì)x的出現(xiàn)次數(shù)并繪圖,相當(dāng)于geom_bar(stat="count"),其中stat選項(xiàng)是統(tǒng)計(jì)函數(shù)的意思。如果需要繪制具體數(shù)值類似y值的柱形圖就需要用到下一個(gè)函數(shù)了。
第二個(gè)柱形圖的函數(shù)是geom_col函數(shù):
p <- ggplot(BOD, aes(x = factor(Time), y = demand)) + geom_col()
其實(shí)geom_col的效果與geom_bar(stat="identity")是一致的,這樣就能隨心所欲的繪制柱形圖了。
下面的代碼示例展示了繪制和柱形圖很像的直方圖的案例:
p <- ggplot(mtcars, aes(x = mpg)) + geom_histogram(binwidth = 3)
直方圖也是默認(rèn)的頻率統(tǒng)計(jì),這里略微調(diào)整了參數(shù)binwidth來(lái)放大每個(gè)直方的寬度。
下面的代碼展示了如何繪制箱型圖的例子:
p <- ggplot(ToothGrowth, aes(x = interaction(supp, dose), y = len)) + geom_boxplot()
上面除了基本代碼還用到了interaction函數(shù),用于組合變量,類似cross join的結(jié)果。
除開(kāi)這些基本繪圖,數(shù)學(xué)函數(shù)的繪制也比較容易:
# 自定義函數(shù) myfun <- function(xvar) { 1 / (1 + exp(-xvar + 10)) } p <- ggplot(data.frame(xdata = c(0, 20)), aes(x = xdata)) + stat_function(fun = myfun, geom = "line")
上面的代碼首先定義了一個(gè)簡(jiǎn)單的函數(shù),然后將函數(shù)作為自定義統(tǒng)計(jì)函數(shù)stat_function的fun參數(shù)輸入,并選擇繪圖方式為line,這樣就可以得到一條函數(shù)曲線。 總結(jié)
本節(jié)主旨在于R語(yǔ)言ggplot2繪圖的初探,熟悉基本的繪圖模式。后續(xù)將會(huì)一一展開(kāi)學(xué)習(xí)庫(kù)中的繪圖細(xì)節(jié),完善繪圖質(zhì)量。
ggplot2是R語(yǔ)言中最常用的繪圖包之一,使用前需要進(jìn)行安裝和調(diào)試。初學(xué)者可以通過(guò)學(xué)習(xí)ggplot2教程來(lái)更好地理解其繪圖語(yǔ)法和使用方法。掌握ggplot2可以幫助用戶輕松地創(chuàng)建高質(zhì)量的數(shù)據(jù)可視化圖表。
參考資料:
[1] 解決R包“had non-zero exit status”安裝報(bào)錯(cuò)。
[2] ggplot2圖片保存
到此這篇關(guān)于R語(yǔ)言ggplot2繪圖安裝與調(diào)試的文章就介紹到這了,更多相關(guān)R語(yǔ)言ggplot2繪圖安裝內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- R語(yǔ)言ggplot2設(shè)置圖例(legend)的操作大全
- R語(yǔ)言 ggplot2改變柱狀圖的順序操作
- R語(yǔ)言ggplot2之圖例的設(shè)置
- R語(yǔ)言ggplot2包之坐標(biāo)軸詳解
- R語(yǔ)言 使用ggplot2繪制好看的分組散點(diǎn)圖
- R語(yǔ)言ggplot2圖例標(biāo)簽、標(biāo)題、順序修改和刪除操作實(shí)例
- R語(yǔ)言ggplot2邊框背景去除的實(shí)現(xiàn)
- R語(yǔ)言學(xué)習(xí)ggplot2繪制統(tǒng)計(jì)圖形包全面詳解
- R語(yǔ)言 解決安裝ggplot2報(bào)錯(cuò)的問(wèn)題
- R語(yǔ)言ggplot2實(shí)現(xiàn)將多個(gè)照片拼接到一起
相關(guān)文章
rust解決嵌套——Option類型的map和and_then方法的使用
這篇文章主要介紹了rust解決嵌套——Option類型的map和and_then方法,本文結(jié)合實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2023-02-02關(guān)于Rust編譯時(shí)報(bào)link.exe?not?found錯(cuò)誤問(wèn)題
這篇文章主要介紹了Rust編譯的時(shí)候報(bào)出link.exe?not?found錯(cuò)誤問(wèn)題,解決方法是在命令行就是CMD執(zhí)行相應(yīng)的命令即可,本文給大家分解決方法,需要的朋友可以參考下2022-09-09Rust中FFI編程知識(shí)點(diǎn)整理總結(jié)(推薦)
這篇文章主要介紹了Rust中FFI編程知識(shí)點(diǎn)整理總結(jié),本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2022-09-09Rust中類型轉(zhuǎn)換在錯(cuò)誤處理中的應(yīng)用小結(jié)
隨著項(xiàng)目的進(jìn)展,關(guān)于Rust的故事又翻開(kāi)了新的一頁(yè),今天來(lái)到了服務(wù)器端的開(kāi)發(fā)場(chǎng)景,發(fā)現(xiàn)錯(cuò)誤處理中的錯(cuò)誤類型轉(zhuǎn)換有必要分享一下,對(duì)Rust錯(cuò)誤處理相關(guān)知識(shí)感興趣的朋友一起看看吧2023-09-09rust標(biāo)準(zhǔn)庫(kù)std::env環(huán)境相關(guān)的常量
在本章節(jié)中, 我們探討了Rust處理命令行參數(shù)的常見(jiàn)的兩種方式和處理環(huán)境變量的兩種常見(jiàn)方式, 拋開(kāi)Rust的語(yǔ)法, 實(shí)際上在命令行參數(shù)的處理方式上, 與其它語(yǔ)言大同小異, 可能影響我們習(xí)慣的也就只剩下語(yǔ)法,本文介紹rust標(biāo)準(zhǔn)庫(kù)std::env的相關(guān)知識(shí),感興趣的朋友一起看看吧2024-03-03Rust動(dòng)態(tài)數(shù)組Vec基本概念及用法
Rust中的Vec是一種動(dòng)態(tài)數(shù)組,它可以在運(yùn)行時(shí)自動(dòng)調(diào)整大小,本文主要介紹了Rust動(dòng)態(tài)數(shù)組Vec基本概念及用法,具有一定的參考價(jià)值,感興趣的可以了解一下2023-12-12