Python調(diào)用R語(yǔ)言實(shí)例講解
網(wǎng)絡(luò)上經(jīng)??吹接腥藛?wèn)數(shù)據(jù)分析是學(xué)習(xí)Python好還是R語(yǔ)言好,還有一些爭(zhēng)論P(yáng)ython好還是R好的文章。每次看到這樣的文章我都會(huì)想到李艦和肖凱的《數(shù)據(jù)科學(xué)中的R語(yǔ)言》,書(shū)中一直強(qiáng)調(diào),工具不分好壞,重要的是解決問(wèn)題的思路,就算是簡(jiǎn)單的excel,也能應(yīng)付數(shù)據(jù)分析中的大部分問(wèn)題。再者Python和R本來(lái)就沒(méi)有什么好對(duì)比的,一門(mén)是計(jì)算機(jī)工程語(yǔ)言,一門(mén)是統(tǒng)計(jì)語(yǔ)言,只有將兩者結(jié)合起來(lái),才能發(fā)揮更大的威力,不是嗎,對(duì)于數(shù)據(jù)分析的人來(lái)說(shuō),難道不是兩樣都要掌握的嗎?
rpy2是Python調(diào)用R程序的模塊,旨在方便Python調(diào)用R中的相關(guān)函數(shù),而不需要先將數(shù)據(jù)寫(xiě)入txt再傳給R來(lái)分析,從而可以做到全流程自動(dòng)化。在pandas 0.18的模塊中也添加了rpy2的支持,進(jìn)而更方便溝通了Python和R的數(shù)據(jù)流轉(zhuǎn),構(gòu)建數(shù)據(jù)分析的生態(tài)系統(tǒng)。
rpy2的安裝還是比較麻煩的,試了很多方法,百度了很多網(wǎng)頁(yè)最終安裝成功,做些筆記備忘。
我的安裝環(huán)境是:
- win7_64bit
- python3.5_64位,使用的是Anaconda發(fā)行版。Anaconda發(fā)行版集成了很多Python的有用的數(shù)據(jù)分析模塊,其使用界面和MATLAB很相似,用起來(lái)很方便,而且還很方便虛擬出不同版本的Python環(huán)境,對(duì)那些既想用python2.7,又想用python3.x的同學(xué)來(lái)說(shuō)是很好的選擇。
- R使用的是Revolution R Open 3.2.3_64bit,這是Revolution R現(xiàn)在已經(jīng)被微軟收購(gòu)了,改為MRO。MRO和CRAN的R沒(méi)有什么區(qū)別,只是改進(jìn)了多進(jìn)程并行計(jì)算的性能,比原生的R確實(shí)有一定的性能提升。當(dāng)然需要MRO網(wǎng)站上對(duì)應(yīng)的數(shù)學(xué)計(jì)算庫(kù)Math Library,這個(gè)在Revolution R Open的下載界面有。1.下載并安裝MRO
1.下載并安裝MRO
安裝對(duì)應(yīng)的并行數(shù)學(xué)計(jì)算庫(kù)(可選)。下載地址是:
https://mran.revolutionanalytics.com/download/
2.下載安裝Anaconda
下載地址是:
https://www.continuum.io/downloads
3.配置R的環(huán)境變量
這是比較重要的一般,很多安裝失敗的原因就是沒(méi)有很好配置環(huán)境變量。
1. 將R目錄添加至path環(huán)境變量
path:D:\Program Files\Microsoft\MRO\R-3.2.3\bin\x64;
2. 將R.dll添加至path環(huán)境變量
path:D:\Program Files\Microsoft\MRO\R-3.2.3\bin\x64\R.dll;
3. 設(shè)置R_HOME環(huán)境變量
R_HOME:D:\Program Files\Microsoft\MRO\R-3.2.3
4. 設(shè)置R_USER環(huán)境變量
R_USER:Administrator
R_USER就是你電腦的用戶(hù)名,如果沒(méi)有設(shè)置過(guò)用戶(hù)名就是Administrator,可以通過(guò)cmd命令行輸入net user
查看。
4.下載非官方版本的rpy2
為什么要下載非官方版本的rpy2我也不知道,反正我使用pip install ryp2
沒(méi)有成功,缺少對(duì)應(yīng)的編譯環(huán)境,百度出來(lái)的網(wǎng)頁(yè)很多都是說(shuō)使用非官方版本的rpy2.
下載地址是:http://www.lfd.uci.edu/~gohlke/pythonlibs/ 這是python下包的專(zhuān)用地址
需要下載版本和平臺(tái)都相對(duì)應(yīng)的whl包,我下的是rpy2-2.9.4-cp36-cp36m-win_amd64.whl,然后使用pip install rpy2-2.9.4-cp36-cp36m-win_amd64.whl
安裝即可。
5.python調(diào)用R
參考讓R與Python共舞和python中調(diào)用R
import rpy2.robjects as robjects # 此時(shí),有三種方法調(diào)用R對(duì)象 # 第一種 robjects.r['pi'] # 第二種 robjects.r('pi') # 這種方法從某種程度上講是萬(wàn)能的,因?yàn)榭梢詫⑷我獯笮『烷L(zhǎng)度的R代碼寫(xiě)成一個(gè)python字符串,之后通過(guò)robjects.r('Rcode')調(diào)用執(zhí)行 第三種 robjects.r.pi # 這種方法對(duì)于名稱(chēng)中有“點(diǎn)號(hào)”的變量會(huì)出問(wèn)題,比如data.frame/read.csv等,所以推薦使用第一種方法
# creat an R function robjects.r(''' f <- function(r){pi * r} ''') robjects.r['f'](3) # internal function in R robjects.r['ls']() # another internal function l = robjects.r['letters'] len(l) robjects.r['paste'](l, collapse = '-') # an alternative way of getting 'paste' function in R # eval the R code coder = 'paste(%s, collapse = "-")' % (l.r_repr()) robjects.r(coder)
6.pandas調(diào)用R
具體參考pandas官方文檔–rpy2 / R interface
7.pandas和R的函數(shù)對(duì)比
具體參考pandas官方文檔–Comparison with R / R libraries
列出了實(shí)現(xiàn)相同功能的pandas和R的代碼,很有啟發(fā)性。
同時(shí)也說(shuō)明,有想法,用什么工具實(shí)現(xiàn)都無(wú)所謂,糾結(jié)要選python還是R確實(shí)是舍本逐末了。如果時(shí)間不夠,精通其中的一門(mén)語(yǔ)言,另一門(mén)語(yǔ)言能夠掌握簡(jiǎn)單的使用,也就夠了。
以后有事時(shí)間再詳細(xì)寫(xiě)寫(xiě)pandas調(diào)用R的部分,以它們之間數(shù)據(jù)來(lái)回傳輸?shù)脑砗妥⒁馐马?xiàng)。
我把下載的包放到了d盤(pán)的programdata
到此這篇關(guān)于Python調(diào)用R語(yǔ)言實(shí)例講解的文章就介紹到這了,更多相關(guān)Python調(diào)用R語(yǔ)言?xún)?nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- Python實(shí)現(xiàn)類(lèi)似jQuery使用中的鏈?zhǔn)秸{(diào)用的示例
- 解決python調(diào)用matlab時(shí)的一些常見(jiàn)問(wèn)題
- python程序調(diào)用遠(yuǎn)程服務(wù)的步驟詳解
- 使用pycallgraph分析python代碼函數(shù)調(diào)用流程以及框架解析
- Python與C/C++的相互調(diào)用案例
- python調(diào)用百度AI接口實(shí)現(xiàn)人流量統(tǒng)計(jì)
- 詳解Python調(diào)用系統(tǒng)命令的六種方法
- 安裝python依賴(lài)包psycopg2來(lái)調(diào)用postgresql的操作
- Python調(diào)用系統(tǒng)命令os.system()和os.popen()的實(shí)現(xiàn)
- 詳解如何在VS2019和VScode中配置C++調(diào)用python接口
- python中如何實(shí)現(xiàn)鏈?zhǔn)秸{(diào)用
相關(guān)文章
R語(yǔ)言實(shí)現(xiàn)各種數(shù)據(jù)可視化的超詳細(xì)教程
Python語(yǔ)言越來(lái)越流行,尤其是在機(jī)器學(xué)習(xí)與深度學(xué)習(xí)等領(lǐng)域,但是R語(yǔ)言在數(shù)據(jù)分析與可視化方面仍然具有絕對(duì)的優(yōu)勢(shì),下面這篇文章主要給大家介紹了關(guān)于R語(yǔ)言實(shí)現(xiàn)各種數(shù)據(jù)可視化的超詳細(xì)教程,需要的朋友可以參考下2022-11-11pycharm實(shí)現(xiàn)R語(yǔ)言運(yùn)行環(huán)境安裝配置的實(shí)現(xiàn)步驟
大多數(shù)人仍然使用RStudio進(jìn)行R語(yǔ)言開(kāi)發(fā)。與RStudio相比,PyCharm具有更多的優(yōu)勢(shì),本文主要介紹了pycharm運(yùn)行R語(yǔ)言腳本的實(shí)現(xiàn)步驟,文中通過(guò)圖文介紹的非常詳細(xì),感興趣的可以了解一下2023-10-10R語(yǔ)言dplyr包之高效數(shù)據(jù)處理函數(shù)(filter、group_by、mutate、summarise)詳解
這篇文章主要介紹了R語(yǔ)言dplyr包之高效數(shù)據(jù)處理函數(shù)(filter、group_by、mutate、summarise)的相關(guān)知識(shí),本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-03-03R語(yǔ)言ggplot2設(shè)置圖例(legend)的操作大全
ggplot2是一個(gè)繪制可視化圖形的R包,汲取了R語(yǔ)言基礎(chǔ)繪圖系統(tǒng)(graphics)和l?attice包的優(yōu)點(diǎn),下面這篇文章主要給大家介紹了關(guān)于R語(yǔ)言ggplot2設(shè)置圖例(legend)的操作大全,需要的朋友可以參考下2022-07-07