R語(yǔ)言關(guān)于隨機(jī)森林算法的知識(shí)點(diǎn)詳解
在隨機(jī)森林方法中,創(chuàng)建大量的決策樹(shù)。 每個(gè)觀察被饋入每個(gè)決策樹(shù)。 每個(gè)觀察的最常見(jiàn)的結(jié)果被用作最終輸出。 新的觀察結(jié)果被饋入所有的樹(shù)并且對(duì)每個(gè)分類(lèi)模型取多數(shù)投票。
對(duì)構(gòu)建樹(shù)時(shí)未使用的情況進(jìn)行錯(cuò)誤估計(jì)。 這稱(chēng)為OOB(袋外)誤差估計(jì),其被提及為百分比。
R語(yǔ)言包“randomForest”用于創(chuàng)建隨機(jī)森林。
安裝R包
在R語(yǔ)言控制臺(tái)中使用以下命令安裝軟件包。 您還必須安裝相關(guān)軟件包(如果有)。
install.packages("randomForest")
包“randomForest”具有函數(shù)randomForest(),用于創(chuàng)建和分析隨機(jī)森林。
語(yǔ)法
在R語(yǔ)言中創(chuàng)建隨機(jī)森林的基本語(yǔ)法是
randomForest(formula, data)
以下是所使用的參數(shù)的描述
- formula是描述預(yù)測(cè)變量和響應(yīng)變量的公式。
- data是所使用的數(shù)據(jù)集的名稱(chēng)。
輸入數(shù)據(jù)
我們將使用名為readingSkills的R語(yǔ)言?xún)?nèi)置數(shù)據(jù)集來(lái)創(chuàng)建決策樹(shù)。 它描述了某人的readingSkills的分?jǐn)?shù),如果我們知道變量“age”,“shoesize”,“score”,以及該人是否是母語(yǔ)。
以下是示例數(shù)據(jù)。
# Load the party package. It will automatically load other required packages. library(party) # Print some records from data set readingSkills. print(head(readingSkills))
當(dāng)我們執(zhí)行上面的代碼,它產(chǎn)生以下結(jié)果及圖表
nativeSpeaker age shoeSize score 1 yes 5 24.83189 32.29385 2 yes 6 25.95238 36.63105 3 no 11 30.42170 49.60593 4 yes 7 28.66450 40.28456 5 yes 11 31.88207 55.46085 6 yes 10 30.07843 52.83124 Loading required package: methods Loading required package: grid ............................... ...............................
例
我們將使用randomForest()函數(shù)來(lái)創(chuàng)建決策樹(shù)并查看它的圖。
# Load the party package. It will automatically load other required packages. library(party) library(randomForest) # Create the forest. output.forest <- randomForest(nativeSpeaker ~ age + shoeSize + score, data = readingSkills) # View the forest results. print(output.forest) # Importance of each predictor. print(importance(fit,type = 2))
當(dāng)我們執(zhí)行上面的代碼,它產(chǎn)生以下結(jié)果
Call: randomForest(formula = nativeSpeaker ~ age + shoeSize + score, data = readingSkills) Type of random forest: classification Number of trees: 500 No. of variables tried at each split: 1 OOB estimate of error rate: 1% Confusion matrix: no yes class.error no 99 1 0.01 yes 1 99 0.01 MeanDecreaseGini age 13.95406 shoeSize 18.91006 score 56.73051
結(jié)論
從上面顯示的隨機(jī)森林,我們可以得出結(jié)論,鞋碼和成績(jī)是決定如果某人是母語(yǔ)者或不是母語(yǔ)的重要因素。 此外,該模型只有1%的誤差,這意味著我們可以預(yù)測(cè)精度為99%。
到此這篇關(guān)于R語(yǔ)言關(guān)于隨機(jī)森林算法的知識(shí)點(diǎn)詳解的文章就介紹到這了,更多相關(guān)R語(yǔ)言隨機(jī)森林算法內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
詳解R語(yǔ)言中生存分析模型與時(shí)間依賴(lài)性ROC曲線可視化
這篇文章主要介紹了R語(yǔ)言中生存分析模型與時(shí)間依賴(lài)性ROC曲線可視化,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-03-03R語(yǔ)言中c()函數(shù)與paste()函數(shù)的區(qū)別說(shuō)明
這篇文章主要介紹了R語(yǔ)言中c()函數(shù)與paste()函數(shù)的區(qū)別說(shuō)明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-04-04解決R語(yǔ)言報(bào)錯(cuò):Error?in?y?+?1:non-numeric?argument?to?binary
R語(yǔ)言編程中的常見(jiàn)錯(cuò)誤有一些錯(cuò)誤是R的初學(xué)者和經(jīng)驗(yàn)豐富的R程序員都可能常犯的,下面這篇文章主要給大家介紹了關(guān)于解決R語(yǔ)言報(bào)錯(cuò):Error?in?y?+?1:non-numeric?argument?to?binary?operator的相關(guān)資料,需要的朋友可以參考下2022-11-11R語(yǔ)言關(guān)于變量的知識(shí)點(diǎn)總結(jié)
在本篇文章里小編給大家整理了一篇關(guān)于R語(yǔ)言關(guān)于變量的知識(shí)點(diǎn)總結(jié)內(nèi)容,有興趣的朋友們可以學(xué)習(xí)下。2021-03-03R語(yǔ)言數(shù)據(jù)可視化繪圖Slope chart坡度圖畫(huà)法
這篇文章主要為大家介紹了R語(yǔ)言數(shù)據(jù)可視化繪圖Slope?chart坡度圖的畫(huà)法示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-02-02R語(yǔ)言安裝以及手動(dòng)安裝devtools的詳細(xì)圖文教程
R語(yǔ)言是一個(gè)強(qiáng)大的數(shù)據(jù)分析工具,其強(qiáng)大之處在于有各種各樣的R包幫助其實(shí)現(xiàn)各種各樣的功能,下面這篇文章主要給大家介紹了關(guān)于R語(yǔ)言安裝以及手動(dòng)安裝devtools的相關(guān)資料,需要的朋友可以參考下2022-08-08R語(yǔ)言可視化ggplot2繪制24小時(shí)動(dòng)態(tài)血糖圖
這篇文章主要為大家介紹了R語(yǔ)言可視化使用ggplot2繪制24小時(shí)動(dòng)態(tài)血糖,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-05-05