R語(yǔ)言是什么 R語(yǔ)言簡(jiǎn)介
R是由Ross Ihaka和Robert Gentleman在1993年開發(fā)的一種編程語(yǔ)言,R擁有廣泛的統(tǒng)計(jì)和圖形方法目錄。它包括機(jī)器學(xué)習(xí)算法、線性回歸、時(shí)間序列、統(tǒng)計(jì)推理等。大多數(shù)R庫(kù)都是用R編寫的,但是對(duì)于繁重的計(jì)算任務(wù),最好使用C、c++和Fortran代碼。
R不僅在學(xué)術(shù)界很受歡迎,很多大公司也使用R編程語(yǔ)言,包括Uber、谷歌、Airbnb、Facebook等。用R進(jìn)行數(shù)據(jù)分析需要一系列步驟:編程、轉(zhuǎn)換、發(fā)現(xiàn)、建模和交流結(jié)果
R 語(yǔ)言是為數(shù)學(xué)研究工作者設(shè)計(jì)的一種數(shù)學(xué)編程語(yǔ)言,主要用于統(tǒng)計(jì)分析、繪圖、數(shù)據(jù)挖掘。
如果你是一個(gè)計(jì)算機(jī)程序的初學(xué)者并且急切地想了解計(jì)算機(jī)的通用編程,R 語(yǔ)言不是一個(gè)很理想的選擇,可以選擇 Python、C 或 Java。
R 語(yǔ)言與 C 語(yǔ)言都是貝爾實(shí)驗(yàn)室的研究成果,但兩者有不同的側(cè)重領(lǐng)域,R 語(yǔ)言是一種解釋型的面向數(shù)學(xué)理論研究工作者的語(yǔ)言,而 C 語(yǔ)言是為計(jì)算機(jī)軟件工程師設(shè)計(jì)的。
R 語(yǔ)言是解釋運(yùn)行的語(yǔ)言(與 C 語(yǔ)言的編譯運(yùn)行不同),它的執(zhí)行速度比 C 語(yǔ)言慢得多,不利于優(yōu)化。但它在語(yǔ)法層面提供了更加豐富的數(shù)據(jù)結(jié)構(gòu)操作并且能夠十分方便地輸出文字和圖形信息,所以它廣泛應(yīng)用于數(shù)學(xué)尤其是統(tǒng)計(jì)學(xué)領(lǐng)域。
R 語(yǔ)言官方網(wǎng)站:https://cran.r-project.org/
官方鏡像站列表:https://cran.r-project.org/mirrors.html
1、什么是R語(yǔ)言?
R是用于統(tǒng)計(jì)分析、繪圖的語(yǔ)言和操作環(huán)境。R是屬于GNU系統(tǒng)的一個(gè)自由、免費(fèi)、開源的軟件,它是一個(gè)用于統(tǒng)計(jì)計(jì)算和統(tǒng)計(jì)制圖的優(yōu)秀工具。
R語(yǔ)言是主要用于統(tǒng)計(jì)分析、繪圖的語(yǔ)言和操作環(huán)境。 R本來(lái)是由來(lái)自新西蘭奧克蘭大學(xué)的Ross Ihaka和Robert Gentleman 開發(fā)。 (也因此稱為R)現(xiàn)在由“R開發(fā)核心團(tuán)隊(duì)”負(fù)責(zé)開發(fā)。 R是基于S語(yǔ)言的一個(gè)GNU項(xiàng)目,所以也可以當(dāng)作S語(yǔ)言的一種實(shí)現(xiàn),通常用S語(yǔ)言編寫的代碼都可以不作修改的在R環(huán)境下運(yùn)行。 R的語(yǔ)法是來(lái)自Scheme。
2、R語(yǔ)言能干什么?
首先說(shuō)靠不靠譜這件事,真的是有點(diǎn)老生常談了,很多人習(xí)慣性的認(rèn)為免費(fèi)的東西就是不好的東西,這樣一竿子打死所有,是不合理的,有點(diǎn)酸葡萄的心理。筆者曾經(jīng)在PubMed上見(jiàn)到很多的文章都是用R語(yǔ)言做的統(tǒng)計(jì)分析,其中不乏頂級(jí)期刊,諸如Lancet,JCO這樣的。上圖,無(wú)圖無(wú)真相。
窺一斑而見(jiàn)全豹。所以關(guān)于靠不靠譜這事,到此為止。
下面說(shuō)說(shuō)R能做啥。對(duì)于醫(yī)學(xué)科研工作者來(lái)說(shuō),對(duì)于軟件的需求其實(shí)真的不是很大,基本的統(tǒng)計(jì)分析基本能夠滿足我們。但是,當(dāng)我們碰到復(fù)雜的數(shù)據(jù)時(shí),也不要怕,從數(shù)據(jù)的預(yù)處理到數(shù)據(jù)的分析建模,以及后續(xù)的繪圖,R都能幫你搞定。關(guān)于數(shù)據(jù)預(yù)處理和初步分析,在這里就不多說(shuō)了,因?yàn)槲覜](méi)辦法上圖(可以瀏覽“醫(yī)學(xué)方”所推出的“一本R書走天涯”推文教程和視頻教程)。下面說(shuō)說(shuō)R的可視化功能。各位看官瞧好了。
1、R是科學(xué)計(jì)算的強(qiáng)大工具包。
2、R主要擅長(zhǎng)統(tǒng)計(jì)分析方面工作。
3、R具有頂尖的繪圖功能。
基本的統(tǒng)計(jì)圖
火山圖
地圖
3D圖
4、R的交互式數(shù)據(jù)分析功能強(qiáng)大且靈活。
5、R可以輕松地從多個(gè)數(shù)據(jù)源導(dǎo)入數(shù)據(jù)。
6、金融領(lǐng)域數(shù)據(jù)統(tǒng)計(jì)與計(jì)算的強(qiáng)大工具。
7、數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)領(lǐng)域的必備工具。
3、R語(yǔ)言有什么優(yōu)勢(shì)?
1、R是免費(fèi)的。很多商業(yè)統(tǒng)計(jì)軟件價(jià)格不菲,投入成千上萬(wàn)美元都是有可能的。可能國(guó)內(nèi)一些人感覺(jué)不會(huì)很明顯,因?yàn)楹芏嗳耸鞘褂脝挝换驅(qū)W校集體購(gòu)買的軟件,或者使用破解過(guò)的統(tǒng)計(jì)軟件,而不是花自己錢。對(duì)于前者,并不是每個(gè)人都有機(jī)會(huì)享受這種福利。而對(duì)于破解過(guò)的統(tǒng)計(jì)軟件,其計(jì)算結(jié)果的準(zhǔn)確性很可能會(huì)被質(zhì)疑。
2、R主要擅長(zhǎng)統(tǒng)計(jì)分析方面工作。R最初是由兩位統(tǒng)計(jì)學(xué)家開發(fā)的,其主要優(yōu)勢(shì)也在于統(tǒng)計(jì)分析方面。它提供了各種各樣的數(shù)據(jù)處理和分析技術(shù),幾乎任何數(shù)據(jù)分析過(guò)程都可以在R中完成。與此相比較,SPSS、MINITAB、MATLAB等數(shù)據(jù)分析軟件更加適合于已經(jīng)處理好的、規(guī)范的數(shù)據(jù),而對(duì)于還未完成處理過(guò)程,或者在分析中仍需大量與處理過(guò)程的數(shù)據(jù)而言,它們可能會(huì)顯得繁瑣一些。
3、R具有頂尖的繪圖功能。尤其對(duì)于復(fù)雜數(shù)據(jù)的可視化問(wèn)題,R的優(yōu)勢(shì)更加明顯。一方面,R中各種繪圖函數(shù)和繪圖參數(shù)的綜合使用,可以得到各式各樣的圖形結(jié)果,無(wú)論對(duì)于常用的直方圖、餅圖、條形圖等,還是復(fù)雜的組合圖、地圖、熱圖、動(dòng)畫,以及自己腦子里突然想到的其他圖形展現(xiàn)方式,都可以采用R語(yǔ)言實(shí)現(xiàn)。另一方面,從數(shù)值計(jì)算到得到圖形結(jié)果的過(guò)程靈活,一旦程序?qū)懞煤?,如果需要修改?shù)據(jù)或者調(diào)整圖形,只需要修改幾個(gè)參數(shù)或者直接替換原始數(shù)據(jù)即可,不用重復(fù)勞動(dòng)。這對(duì)需要繪制大量同類圖形的用戶比較適用。例如,某用戶需要觀察某一因素與其他100個(gè)因素的交互關(guān)系,可以繪制100個(gè)條形圖或走勢(shì)圖。配合R的循環(huán)和條形圖功能,可以很快得到j(luò)pg、png、bmp、tiff、gif或postscript等格式的圖形結(jié)果。
4、R的交互式數(shù)據(jù)分析功能強(qiáng)大且靈活。一個(gè)完整的數(shù)據(jù)分析過(guò)程可以大體包括以下幾個(gè)步驟:(1)導(dǎo)入數(shù)據(jù);(2)數(shù)據(jù)準(zhǔn)備、探索和清洗;(3)擬合一個(gè)統(tǒng)計(jì)模型;(4)得到結(jié)果并進(jìn)行評(píng)估;(5)如果結(jié)果的評(píng)估不理想,重新完成(3)步驟;(6)得到多個(gè)模型的結(jié)果,并進(jìn)行交叉檢驗(yàn);(7)根據(jù)模型結(jié)果進(jìn)行預(yù)測(cè)、分析等;(8)形成報(bào)告。R中每個(gè)步驟的所有“輸出”都可以直接作為下一個(gè)步驟的“輸入”,可以批量完成以上所有的(8)個(gè)步驟。這個(gè)優(yōu)點(diǎn)主要與STATA、SPSS等統(tǒng)計(jì)軟件相比而言的,STATA和SPSS的統(tǒng)計(jì)分析結(jié)果是一大串圖表或統(tǒng)計(jì)量。如果只是一個(gè)或少數(shù)幾個(gè)步驟的分析,這種出現(xiàn)一大串結(jié)果的批處理更加直觀方便。但如果分析中涉及很多連串的模型,而且一些模型需要反復(fù)調(diào)用前面模型的結(jié)果,那么R的靈活性會(huì)更加凸顯。
5、R可以輕松地從多個(gè)數(shù)據(jù)源導(dǎo)入數(shù)據(jù),包括文本文件、數(shù)據(jù)庫(kù)、其他統(tǒng)計(jì)軟件等。這一點(diǎn)很多其他軟件還難以做到。如readLines()、read.table()等函數(shù)可以導(dǎo)入文本數(shù)據(jù),foreign包的read.spss()可以導(dǎo)入SPSS軟件的sav格式數(shù)據(jù),foreign包的read.dta()可以導(dǎo)入STATA軟件的dta格式數(shù)據(jù)等等。其他有關(guān)數(shù)據(jù)導(dǎo)入導(dǎo)出的函數(shù)可以參見(jiàn)R幫助文檔《R Data Import/Export》。
6、R的更新速度很快,包含最新的大量統(tǒng)計(jì)方法和案例。R社區(qū)由全球大量維護(hù)者共同維護(hù),再加上R包的擴(kuò)展性很強(qiáng),幾乎每天都有人為R社區(qū)貢獻(xiàn)新的方法,提供其他軟件中尚不可用的、新穎的統(tǒng)計(jì)計(jì)算案例。在本材料“R資源”部分會(huì)介紹一些常用的R資源獲取途徑。
7、R也可以很美。目前最基本的R軟件(R2.15.2)只有一個(gè)編程窗口,看起來(lái)挺丑的。但它穿上衣服以后也可以很漂亮,它的衣服就是各式各樣的GUI(Graphical User Interface,圖形用戶界面)工具。目前比較常用的GUI工具包括Rstudio、Rattle、Rattle、Red-R、Deducer、RKWard、JGR、R Commander、Tinn-R等。其中Rstudio可能是最受歡迎的。
補(bǔ)充
做過(guò)一點(diǎn)數(shù)據(jù)分析的人都知道,目前市場(chǎng)上最流行的統(tǒng)計(jì)分析軟件是SPSS,不可否認(rèn),這個(gè)軟件很好用,傻瓜式的點(diǎn)擊操作,一目了然的表格式的結(jié)果,甚至也能畫一些簡(jiǎn)單的圖形。但是,相信在很多時(shí)候,當(dāng)你使用SPSS進(jìn)行數(shù)據(jù)分析時(shí),你也會(huì)覺(jué)得束手無(wú)策,不是你不夠聰明,而是SPSS實(shí)在是巧婦難為無(wú)米之炊。點(diǎn)擊操作固然方便簡(jiǎn)單,但是在功能的靈活性上卻大打折扣。故而,你想到了SAS。不過(guò),在你使用SAS之前,請(qǐng)你先找一個(gè)正版的安裝包(什么破解版就不推薦了,畢竟我們要推崇版權(quán)意識(shí)嘛),在你的Windows系統(tǒng)上裝上它再說(shuō)吧。SAS就是一個(gè)航空母艦,戰(zhàn)斗力強(qiáng)大,但是卻顯得異常臃腫,我很好奇一個(gè)界面完全算不上好看的統(tǒng)計(jì)軟件,是如何把自己的安裝包一步一步升級(jí)到一個(gè)極品飛車安裝包的級(jí)別的。筆者不才,曾經(jīng)試圖兩次安裝SAS,但是由于并不精通計(jì)算機(jī)系統(tǒng),故而兩次均以失敗告終,萬(wàn)般無(wú)奈之際,選擇了R語(yǔ)言。
山重水復(fù)疑無(wú)路,柳暗花明又一村。R語(yǔ)言在前幾年的名氣遠(yuǎn)不及SPSS和SAS,甚至一度有很多人壓根就看不上這樣一個(gè)軟件,認(rèn)為它做出來(lái)的東西很有可能是錯(cuò)誤的,壓根就不靠譜。但是質(zhì)疑聲永遠(yuǎn)也不能阻止一個(gè)新生事物的快速發(fā)展。坦白說(shuō),我入了R的坑,從此SPSS和SAS是路人!
R是免費(fèi)的!安裝包僅有70M,而且安裝異常簡(jiǎn)單,所需操作環(huán)境十分隨意。就是這樣一個(gè)十分親民友好的軟件,功能卻是異常強(qiáng)大!我用的不是非常,而是異常!作為一名還不算資深的R粉,在我的數(shù)據(jù)清洗與數(shù)據(jù)分析的過(guò)程中,我深深的被R語(yǔ)言的簡(jiǎn)潔強(qiáng)大震撼到了。而且我十分贊賞R語(yǔ)言所推崇的“向量化操作”的理念:不寫循環(huán),但是能做循環(huán)一樣的事兒。
關(guān)于R,難以一言以蔽之,它就像一個(gè)航母戰(zhàn)斗群,不同的軍艦承載著不同的任務(wù),但是彼此和諧相處,毫不沖突。正如前言所說(shuō),R是為統(tǒng)計(jì)而生,但是隨著這幾年的快速發(fā)展,R的功能范圍已經(jīng)得到了極大的擴(kuò)展,比如自然語(yǔ)言處理,機(jī)器學(xué)習(xí)領(lǐng)域,生物信息學(xué)領(lǐng)域等等。即便如此,也永遠(yuǎn)不要忘了,R語(yǔ)言自身的統(tǒng)計(jì)功能!
現(xiàn)如今,在R的隊(duì)伍中,已經(jīng)存在了超過(guò)12000個(gè)擴(kuò)展包,這些擴(kuò)展包來(lái)自不同領(lǐng)域的牛人之手。所以,只要你想得到,沒(méi)有R做不到!因?yàn)槟阆氲降?,人家早就已?jīng)替你想過(guò)了。4、R語(yǔ)言編程工具
R語(yǔ)言安裝時(shí)會(huì)自帶一個(gè)GUI工具,當(dāng)然還有其他眾多集成開發(fā)工具,如:Rstudio、Rattle、Rattle、Red-R、Deducer、RKWard、JGR、R Commander、Tinn-R等。其中Rstudio可能是最受歡迎的。
5、為什么使用R ?
數(shù)據(jù)科學(xué)正在塑造企業(yè)運(yùn)營(yíng)的方式,毫無(wú)疑問(wèn),遠(yuǎn)離人工智能和機(jī)器將導(dǎo)致公司的失敗,最大的問(wèn)題是應(yīng)該使用哪種工具/語(yǔ)言?
市場(chǎng)上有很多工具可以用來(lái)進(jìn)行數(shù)據(jù)分析,學(xué)習(xí)一門新語(yǔ)言需要一些時(shí)間。下圖描述了與一種語(yǔ)言提供的業(yè)務(wù)能力相比的學(xué)習(xí)曲線,這種消極的關(guān)系意味著沒(méi)有免費(fèi)的午餐。如果你想從數(shù)據(jù)中獲得最好的見(jiàn)解,那么你需要花一些時(shí)間學(xué)習(xí)合適的工具,也就是R。
在圖的左上角,您可以看到Excel和PowerBI。這兩個(gè)工具學(xué)習(xí)起來(lái)很簡(jiǎn)單,但是沒(méi)有提供出色的業(yè)務(wù)功能,特別是在建模方面。在中間,您可以看到Python和SAS。
情景應(yīng)用程序是一個(gè)專門用于運(yùn)行業(yè)務(wù)統(tǒng)計(jì)分析的工具,但它不是免費(fèi)的。SAS是一個(gè)點(diǎn)擊并運(yùn)行的軟件,然而,Python是一種學(xué)習(xí)曲線單調(diào)的語(yǔ)言。Python是部署機(jī)器學(xué)習(xí)和人工智能的理想工具,但缺乏通信功能。由于具有相同的學(xué)習(xí)曲線,R是實(shí)現(xiàn)和數(shù)據(jù)分析之間的一個(gè)很好的權(quán)衡。
說(shuō)到數(shù)據(jù)可視化(DataViz),您可能聽說(shuō)過(guò)Tableau。Tableau無(wú)疑是通過(guò)圖形和圖表發(fā)現(xiàn)模式的好工具,另外,學(xué)習(xí)Tableau也不是很耗時(shí)。數(shù)據(jù)可視化的一個(gè)大問(wèn)題是,您可能永遠(yuǎn)找不到一個(gè)模式,或者只是創(chuàng)建大量無(wú)用的圖表。Tableau是快速可視化數(shù)據(jù)或商業(yè)智能的好工具,當(dāng)涉及到統(tǒng)計(jì)和決策工具時(shí),R更合適。
Stack Overflow是一個(gè)很大的編程語(yǔ)言社區(qū),如果您有編碼問(wèn)題或需要了解模型,Stack Overflow可以提供幫助。一年來(lái),與其他語(yǔ)言相比,R語(yǔ)言的提問(wèn)率大幅上升。這種趨勢(shì)當(dāng)然與數(shù)據(jù)科學(xué)蓬勃發(fā)展的時(shí)代高度相關(guān),但也反映了R語(yǔ)言對(duì)數(shù)據(jù)科學(xué)的需求。
在數(shù)據(jù)科學(xué)中,有兩種工具相互競(jìng)爭(zhēng),R和Python可能是定義數(shù)據(jù)科學(xué)的編程語(yǔ)言。
簡(jiǎn)而言之,R是探索和研究數(shù)據(jù)的好工具。使用R進(jìn)行復(fù)雜的分析,例如聚類,相關(guān)性和數(shù)據(jù)縮減。這是最關(guān)鍵的部分,如果沒(méi)有良好的特征工程和模型,則機(jī)器學(xué)習(xí)的部署將不會(huì)產(chǎn)生有意義的結(jié)果。
6、R語(yǔ)言學(xué)習(xí)路線圖
1.初級(jí)入門
《An Introduction to R》,這是官方的入門小冊(cè)子。其有中文版,由丁國(guó)徽翻譯,譯名為《R導(dǎo)論》?!禦4Beginners》,這本小冊(cè)子有中文版應(yīng)該叫《R入門》。除此之外,還可以去讀劉思喆的《153分鐘學(xué)會(huì)R》。這本書收集了R初學(xué)者提問(wèn)頻率最高的153個(gè)問(wèn)題。為什么叫153分鐘呢?因?yàn)樽畛踝髡邔懥?53個(gè)問(wèn)題,閱讀一個(gè)問(wèn)題花費(fèi)1分鐘時(shí)間,全局下來(lái)也就是153分鐘了。有了這些基礎(chǔ)之后,要去讀一些經(jīng)典書籍比較全面的入門書籍,比如《統(tǒng)計(jì)建模與R軟件》,國(guó)外還有《R Cookbook》和《R in action》。
2.高級(jí)入門
讀了上述書籍之后,你就可以去高級(jí)入門階段了。這時(shí)候要讀的書有兩本很經(jīng)典的。《Statistics with R》和《The R book》。之所以說(shuō)這兩本書高級(jí),是因?yàn)檫@兩本書已經(jīng)不再限于R基礎(chǔ)了,而是結(jié)合了數(shù)據(jù)分析的各種常見(jiàn)方法來(lái)寫就的,比較系統(tǒng)的介紹了R在線性回歸、方差分析、多元統(tǒng)計(jì)、R繪圖、時(shí)間序列分析、數(shù)據(jù)挖掘等各方面的內(nèi)容,看完之后你會(huì)發(fā)現(xiàn),哇,原來(lái)R能做的事情這么多而且如此簡(jiǎn)潔。
3.繪圖與可視化
亞里斯多德說(shuō),“較其他感覺(jué)而言,人類更喜歡觀看”。因此,繪圖和可視化得到很多人的關(guān)注和重視。那么,如何學(xué)習(xí)R畫圖和數(shù)據(jù)可視化呢?再簡(jiǎn)單些,如何畫直方圖?如何往直方圖上添加密度曲線呢?我想讀完下面這幾本書你就大致會(huì)明白了。
首先,畫圖入門可以讀《R Graphics》,個(gè)人認(rèn)為這本是比較經(jīng)典的,全面介紹了R中繪圖系統(tǒng)。該書對(duì)應(yīng)的有一個(gè)網(wǎng)站,google之就可以了。更深入的可以讀《Lattice:Multivariate Data Visualization with R》。上面這些都是比較普通的。當(dāng)然,有比較文藝和優(yōu)雅的——ggplot2系統(tǒng),看《ggplot2:Elegant Graphics for Data Analysis》。還有數(shù)據(jù)挖掘方面的書:《Data Mining with Rattle and R》,主要是用Rattle軟件,個(gè)人比較喜歡Rattle!當(dāng)然,Rattle不是最好的,Rweka也很棒!再有就是交互圖形的書了,著名的交互系統(tǒng)是ggobi,這個(gè)我已經(jīng)喜歡兩年多了,關(guān)于ggobi的書有《Interactive and Dynamic Graphics for Data Analysis With R and GGobi》,不過(guò),也只是適宜入門,更多更全面的還是去ggobi的主頁(yè)吧,上面有各種資料以及包的更新信息!
4.計(jì)量經(jīng)濟(jì)學(xué)
關(guān)于計(jì)量經(jīng)濟(jì)學(xué),首先推薦一本很薄的小冊(cè)子:《Econometrics In R》,做入門用。然后,是《Applied Econometrics with R》,該書對(duì)應(yīng)的R包是AER,可以安裝之后配合使用,效果甚佳。計(jì)量經(jīng)濟(jì)學(xué)中很大一部分是關(guān)于時(shí)間序列分析的,這一塊內(nèi)容在下面的地方說(shuō)。
5.時(shí)間序列分析
時(shí)間序列書籍的書籍分兩類,一種是比較普適的書籍,典型的代表是:《Time Series Analysis and Its Applications :with R examples》。該書介紹了各種時(shí)間序列分析的經(jīng)典方法及實(shí)現(xiàn)各種經(jīng)典方法的R代碼,該書有中文版。如果不想買的話,建議去作者主頁(yè)直接下載,英文版其實(shí)讀起來(lái)很簡(jiǎn)單。時(shí)間序列分析中有一大塊兒是關(guān)于金融時(shí)間序列分析的。這方面比較流行的書有兩本《Analysis of financial time series》,這本書的最初是用的S-plus代碼,不過(guò)新版已經(jīng)以R代碼為主了。這本書適合有時(shí)間序列分析基礎(chǔ)和金融基礎(chǔ)的人來(lái)看,因?yàn)闀嘘P(guān)于時(shí)間序列分析的理論以及各種金融知識(shí)講解的不是特別清楚,將極值理論計(jì)算VaR的部分就比較難看懂。另外一個(gè)比較有意思的是Rmetrics推出的《TimeSeriesFAQ》,這本書是金融時(shí)間序列入門的東西,講的很基礎(chǔ),但是很難懂。對(duì)應(yīng)的中文版有《金融時(shí)間序列分析常見(jiàn)問(wèn)題集》,當(dāng)然,目前還沒(méi)有發(fā)出來(lái)。經(jīng)濟(jì)領(lǐng)域的時(shí)間序列有一種特殊的情況叫協(xié)整,很多人很關(guān)注這方面的理論,關(guān)心這個(gè)的可以看《Analysis of Integrated and Cointegrated Time Series with R》。最后,比較高級(jí)的一本書是關(guān)于小波分析的,看《Wavelet Methods in Statistics with R》。
6.金融
金融的領(lǐng)域很廣泛,如果是大金融的話,保險(xiǎn)也要被納入此間。用R做金融更多地需要掌握的是金融知識(shí),只會(huì)數(shù)據(jù)分析技術(shù)意義寥寥。我覺(jué)得這些書對(duì)于懂金融、不同數(shù)據(jù)分析技術(shù)的人比較有用,只懂?dāng)?shù)據(jù)分析技術(shù)而不動(dòng)金融知識(shí)的人看起來(lái)肯定如霧里看花,甚至有人會(huì)覺(jué)得金融分析比較低級(jí)。這方面比較經(jīng)典的書籍有:《Advanced Topics in Analysis of Economic and Financial Data Using R》以及《Modelling Financial Time Series With S-plus》。金融產(chǎn)品定價(jià)之類的常常要用到隨機(jī)微分方程,有一本叫《Simulation Inference Stochastic Differential Equations:with R examples》的書是關(guān)于這方面的內(nèi)容的,有實(shí)例,內(nèi)容還算詳實(shí)!此外,是風(fēng)險(xiǎn)度量與管理類。比較經(jīng)典的有《Simulation Techniques in Financial Risk Management》、《Modern Actuarial Risk Theory Using R》和《Quantitative Risk Management:Concepts, Techniques and Tools》。投資組合分析類和期權(quán)定價(jià)類可以分別看《Portfolio Optimization with R》和《Option Pricing and Estimation of Financial Models with R》。
7.數(shù)據(jù)挖掘
這方面的書不多,只有《Data Mining with R:learing with case studies》。不過(guò),R中數(shù)據(jù)挖掘方面的包已經(jīng)足夠多了,參考包中的幫助文檔就足夠了。
7、R語(yǔ)言參考資料
相關(guān)書籍推薦:
《R in Action》(R語(yǔ)言實(shí)戰(zhàn))
《The Art of_R Programming》(R語(yǔ)言編程藝術(shù))
《An Introduction to R》(R導(dǎo)論)
《R Cookbook》
《R in a Nutshell》
《Statistics with R》
相關(guān)文章
R語(yǔ)言通過(guò)parallel包實(shí)現(xiàn)多線程運(yùn)行方式
這篇文章主要介紹了R語(yǔ)言通過(guò)parallel包實(shí)現(xiàn)多線程運(yùn)行方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-04-04R語(yǔ)言實(shí)現(xiàn)對(duì)數(shù)據(jù)框按某一列分組求組內(nèi)平均值
這篇文章主要介紹了R語(yǔ)言實(shí)現(xiàn)對(duì)數(shù)據(jù)框按某一列分組求組內(nèi)平均值,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-03-03R語(yǔ)言技巧Rcpp與Eigen庫(kù)之間的相互轉(zhuǎn)換
這篇文章主要為大家介紹了R語(yǔ)言中Rcpp與Eigen庫(kù)之間的相互轉(zhuǎn)換的技巧操作,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步2021-11-11R語(yǔ)言-計(jì)算平均值不同函數(shù)的區(qū)別說(shuō)明
這篇文章主要介紹了R語(yǔ)言-計(jì)算平均值不同函數(shù)的區(qū)別說(shuō)明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-04-04R語(yǔ)言數(shù)據(jù)可視化繪圖Slope chart坡度圖畫法
這篇文章主要為大家介紹了R語(yǔ)言數(shù)據(jù)可視化繪圖Slope?chart坡度圖的畫法示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-02-02R語(yǔ)言在散點(diǎn)圖中添加lm線性回歸公式的問(wèn)題
這篇文章主要介紹了R語(yǔ)言在散點(diǎn)圖中添加lm線性回歸公式的問(wèn)題,本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2022-09-09