R語言數(shù)據(jù)挖掘方法及應(yīng)用 (薛薇 著) 完整pdf掃描版[188MB]
188MB / 08-08
數(shù)據(jù)挖掘:R語言實戰(zhàn) (黃文 著) 完整版PDF[57MB]
57.6MB / 12-21
數(shù)據(jù)挖掘與R語言 李洪成譯 中文pdf掃描版[23MB]
23MB / 12-11
基于R語言數(shù)據(jù)挖掘的統(tǒng)計與分析 (韋鵬程等著) 完整pdf掃描版[38M
38.7MB / 01-04
-
-
機(jī)器學(xué)習(xí)、深度學(xué)習(xí)面試筆試題300+合集 中文pdf完整版 編程其它 / 5.9MB
-
-
-
Arduino編程參考手冊 中文版PDF 編程其它 / 80KB
-
CODESYS基礎(chǔ)編程及應(yīng)用指南 中文pdf完整版 編程其它 / 10.6MB
-
Tcl教程中文版+入門教程 完整版PDF 編程其它 / 2.12MB
-
圖解算法小抄(筆記) 中文PDF完整版 編程其它 / 6.1MB
-
QNX官方開發(fā)手冊(中英文版) 完整版pdf 編程其它 / 6.32MB
-
詳情介紹
數(shù)據(jù)挖掘技術(shù)已經(jīng)廣泛用于政府機(jī)關(guān)、銀行、保險、零售、電信、醫(yī)藥和研究領(lǐng)域。最近,越來越多的數(shù)據(jù)挖掘工作開始使用R工具來完成,R是一個用于統(tǒng)計計算和制圖的免費軟件。在最近的調(diào)查中,R已經(jīng)被評為數(shù)據(jù)挖掘領(lǐng)域最流行的工具。本書介紹將R語言用于數(shù)據(jù)挖掘應(yīng)用(從學(xué)術(shù)研究到工業(yè)應(yīng)用),從大量數(shù)據(jù)中提取出有用知識的各種實用方法。
本書主要特色
- 介紹了R用于數(shù)據(jù)挖掘應(yīng)用的案例,涵蓋了最常用的數(shù)據(jù)挖掘技術(shù)。
- 提供了代碼示例和數(shù)據(jù),以便讀者可以輕松地學(xué)習(xí)數(shù)據(jù)挖掘技術(shù)。
- 現(xiàn)實應(yīng)用中的特色案例研究有助于讀者將學(xué)到的技術(shù)應(yīng)用到自己的工作和研究中。
目錄
第1章 簡介1
1.1 數(shù)據(jù)挖掘1
1.2 R1
1.3 數(shù)據(jù)集2
1.3.1 iris數(shù)據(jù)集2
1.3.2 bodyfat數(shù)據(jù)集3
第2章 數(shù)據(jù)的導(dǎo)入與導(dǎo)出4
2.1 R數(shù)據(jù)的保存與加載4
2.2 .CSV文件的導(dǎo)入與導(dǎo)出4
2.3 從SAS中導(dǎo)入數(shù)據(jù)5
2.4 通過ODBC導(dǎo)入與導(dǎo)出數(shù)據(jù)6
2.4.1 從數(shù)據(jù)庫中讀取數(shù)據(jù)7
2.4.2 從Excel文件中導(dǎo)入與導(dǎo)出數(shù)據(jù)7
第3章 數(shù)據(jù)探索8
3.1 查看數(shù)據(jù)8
3.2 探索單個變量10
3.3 探索多個變量12
3.4 更多探索15
3.5 將圖表保存到文件中19
第4章 決策樹與隨機(jī)森林21
4.1 使用party包構(gòu)建決策樹21
4.2 使用rpart包構(gòu)建決策樹24
4.3 隨機(jī)森林29
第5章 回歸分析33
5.1 線性回歸33
5.2 邏輯回歸38
5.3 廣義線性回歸38
5.4 非線性回歸40
第6章 聚類41
6.1 k-means聚類41
6.2 k-medoids聚類43
6.3 層次聚類45
6.4 基于密度的聚類46
第7章 離群點檢測50
7.1 單變量的離群點檢測50
7.2 局部離群點因子檢測53
7.3 用聚類方法進(jìn)行離群點檢測56
7.4 時間序列數(shù)據(jù)的離群點檢測58
7.5 討論59
第8章 時間序列分析與挖掘60
8.1 R中的時間序列數(shù)據(jù)60
8.2 時間序列分解60
8.3 時間序列預(yù)測62
8.4 時間序列聚類63
8.4.1 動態(tài)時間規(guī)整63
8.4.2 合成控制圖的時間序列數(shù)據(jù)64
8.4.3 基于歐氏距離的層次聚類65
8.4.4 基于DTW距離的層次聚類66
8.5 時間序列分類67
8.5.1 基于原始數(shù)據(jù)的分類67
8.5.2 基于特征提取的分類68
8.5.3 k-NN分類69
8.6 討論70
8.7 延伸閱讀70
第9章 關(guān)聯(lián)規(guī)則71
9.1 關(guān)聯(lián)規(guī)則的基本概念71
9.2 Titanic數(shù)據(jù)集71
9.3 關(guān)聯(lián)規(guī)則挖掘73
9.4 消除冗余78
9.5 解釋規(guī)則79
9.6 關(guān)聯(lián)規(guī)則的可視化80
9.7 討論與延伸閱讀82
第10章 文本挖掘84
10.1 Twitter的文本檢索84
10.2 轉(zhuǎn)換文本85
10.3 提取詞干86
10.4 建立詞項-文檔矩陣88
10.5 頻繁詞項與關(guān)聯(lián)90
10.6 詞云91
10.7 詞項聚類92
10.8 推文聚類94
10.8.1 基于k-means算法的推文聚類94
10.8.2 基于k-medoids算法的推文聚類96
10.9 程序包、延伸閱讀與討論98
第11章 社交網(wǎng)絡(luò)分析99
11.1詞項網(wǎng)絡(luò)99
11.2推文網(wǎng)絡(luò)102
11.3雙模式網(wǎng)絡(luò)107
11.4討論與延伸閱讀110
第12章 案例Ⅰ:房價指數(shù)的分析與預(yù)測111
12.1HPI數(shù)據(jù)導(dǎo)入111
12.2HPI數(shù)據(jù)探索112
12.3HPI趨勢與季節(jié)性成分118
12.4HPI預(yù)測120
12.5房地產(chǎn)估價122
12.6討論122
第13章 案例Ⅱ:客戶回復(fù)預(yù)測與效益最大化123
13.1簡介123
13.2KDD Cup 1998的數(shù)據(jù)123
13.3數(shù)據(jù)探索131
13.4訓(xùn)練決策樹137
13.5模型評估140
13.6選擇最優(yōu)決策樹143
13.7評分145
13.8討論與總結(jié)148
第14章 案例Ⅲ:內(nèi)存受限的大數(shù)據(jù)預(yù)測模型150
14.1簡介150
14.2研究方法150
14.3數(shù)據(jù)與變量151
14.4隨機(jī)森林152
14.5內(nèi)存問題153
14.6樣本數(shù)據(jù)的訓(xùn)練模型154
14.7使用已選變量建立模型156
14.8評分162
14.9輸出規(guī)則168
14.9.1以文本格式輸出規(guī)則168
14.9.2輸出SAS規(guī)則的得分172
14.10總結(jié)與討論177
第15章 在線資源178
15.1R參考文檔178
15.2R178
15.3數(shù)據(jù)挖掘179
15.4R的數(shù)據(jù)挖掘180
15.5R的分類與預(yù)測181
15.6R的時間序列分析181
15.7R的關(guān)聯(lián)規(guī)則挖掘181
15.8R的空間數(shù)據(jù)分析181
15.9R的文本挖掘182
15.10R的社交網(wǎng)絡(luò)分析182
15.11R的數(shù)據(jù)清洗與轉(zhuǎn)換182
15.12R的大數(shù)據(jù)與并行計算182
R語言數(shù)據(jù)挖掘參考文檔184
參考資料197
通用索引201
包索引203
函數(shù)索引204
下載地址
人氣書籍
下載聲明
☉ 解壓密碼:www.dbjr.com.cn 就是本站主域名,希望大家看清楚,[ 分享碼的獲取方法 ]可以參考這篇文章
☉ 推薦使用 [ 迅雷 ] 下載,使用 [ WinRAR v5 ] 以上版本解壓本站軟件。
☉ 如果這個軟件總是不能下載的請在評論中留言,我們會盡快修復(fù),謝謝!
☉ 下載本站資源,如果服務(wù)器暫不能下載請過一段時間重試!或者多試試幾個下載地址
☉ 如果遇到什么問題,請評論留言,我們定會解決問題,謝謝大家支持!
☉ 本站提供的一些商業(yè)軟件是供學(xué)習(xí)研究之用,如用于商業(yè)用途,請購買正版。
☉ 本站提供的R語言與數(shù)據(jù)挖掘最佳實踐和經(jīng)典案例 帶書簽?zāi)夸?pdf版 資源來源互聯(lián)網(wǎng),版權(quán)歸該下載資源的合法擁有者所有。