Hadoop大數(shù)據(jù)開發(fā)案例教程與項(xiàng)目實(shí)戰(zhàn) 高清pdf掃描版[133MB]
133.3MB / 06-20
大數(shù)據(jù)處理系統(tǒng)——Hadoop源代碼情景分析 (毛德操) 高清pdf版
13.6MB / 05-23
Hadoop大數(shù)據(jù)分析與挖掘?qū)崙?zhàn) 完整pdf掃描版[52MB]
51.7MB / 11-13
Hadoop大數(shù)據(jù)視頻教程全集打包 含Scala、Spark視頻教程
20GB / 02-20
R與Hadoop大數(shù)據(jù)分析實(shí)戰(zhàn) ([印]普賈帕提著) 帶目錄完整pdf[22MB]
22.4MB / 08-28
-
ElasticSearch7.x入門到案例實(shí)戰(zhàn)教程 中文pdf版+源碼 服務(wù)器 / 7.2MB
-
Zabbix v7.0使用手冊 中文版PDF 服務(wù)器 / 30MB
-
-
Nginx 安全配置指南技術(shù)手冊pdf版 服務(wù)器 / 488KB
-
DNS學(xué)習(xí)從入門到精通 完整PDF版 服務(wù)器 / 6.33MB
-
Windows Server 2016系統(tǒng)配置指南 完整pdf掃描版[155MB] 服務(wù)器 / 154.8MB
-
-
Windows Server 2016 Active Directory配置指南 中文PDF版 服務(wù)器 / 23.3MB
-
Windows Server 2012-2022 故障轉(zhuǎn)移群集 完整版PDF 服務(wù)器 / 6.64MB
-
vSAN操作指南 中文PDF完整版 服務(wù)器 / 6.11MB
詳情介紹
《數(shù)據(jù)算法:Hadoop/Spark大數(shù)據(jù)處理技巧》介紹了很多基本設(shè)計(jì)模式、優(yōu)化技術(shù)和數(shù)據(jù)挖掘及機(jī)器學(xué)習(xí)解決方案,以解決生物信息學(xué)、基因組學(xué)、統(tǒng)計(jì)和社交網(wǎng)絡(luò)分析等領(lǐng)域的很多問題。這還概要介紹了MapReduce、Hadoop和Spark。
主要內(nèi)容包括:
■ 完成超大量交易的購物籃分析。
■ 數(shù)據(jù)挖掘算法(K-均值、KNN和樸素貝葉斯)。
■ 使用超大基因組數(shù)據(jù)完成DNA和RNA測序。
■ 樸素貝葉斯定理和馬爾可夫鏈實(shí)現(xiàn)數(shù)據(jù)和市場預(yù)測。
■ 推薦算法和成對文檔相似性。
■ 線性回歸、Cox回歸和皮爾遜(Pearson)相關(guān)分析。
■ 等位基因頻率和DNA挖掘。
■ 社交網(wǎng)絡(luò)分析(推薦系統(tǒng)、三角形計(jì)數(shù)和情感分析)。
適讀人群 :這本書面向了解Java基礎(chǔ)知識并且想使用Hadoop和Spark 開發(fā)MapReduce 算法(數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、生物信息技術(shù)、基因組和統(tǒng)計(jì)領(lǐng)域)和解決方案的軟件工程師、軟件架構(gòu)師、數(shù)據(jù)科學(xué)家和應(yīng)用開發(fā)人員。
目錄
第1章二次排序:簡介 19
第2章二次排序:詳細(xì)示例 42
第3章 Top 10 列表 54
第4章左外連接 96
第5章反轉(zhuǎn)排序 127
第6章移動平均 137
第7章購物籃分析 155
第8章共同好友 182
第9章使用MapReduce實(shí)現(xiàn)推薦引擎 201
第10章基于內(nèi)容的電影推薦 225
第11章使用馬爾可夫模型的智能郵件營銷 .253
第12章 K-均值聚類 282
第13章 k-近鄰 296
第14章樸素貝葉斯 315
第15章情感分析 349
第16章查找、統(tǒng)計(jì)和列出大圖中的所有三角形 354
第17章 K-mer計(jì)數(shù) 375
第18章 DNA測序 390
第19章 Cox回歸 413
第20章 Cochran-Armitage趨勢檢驗(yàn) 426
第21章等位基因頻率 443
第22章 T檢驗(yàn) 468
第23章皮爾遜相關(guān)系數(shù) 488
第24章 DNA堿基計(jì)數(shù) 520
第25章 RNA測序 543
第26章基因聚合 553
第27章線性回歸 586
第28章 MapReduce和幺半群 600
第29章小文件問題 622
第30章 MapReduce的大容量緩存 635
第31章 Bloom過濾器 651Bloom
下載地址
人氣書籍
決戰(zhàn)Nginx系統(tǒng)卷:高性能Web服務(wù)器詳解與運(yùn)維 PDF掃描版[94MB]
Tomcat權(quán)威指南(第2版) PDF掃描版
Hadoop實(shí)戰(zhàn)(第2版)陸嘉恒著 PDF掃描版
Nginx高性能Web服務(wù)器詳解 pdf掃描版[178MB]
精通Windows Server 2008 R2 PDF掃描版[157MB]
大規(guī)模Web服務(wù)開發(fā)技術(shù) PDF掃描版[14MB]
Hadoop應(yīng)用開發(fā)技術(shù)詳解 pdf掃描版
深入剖析Tomcat (Paul Deck) pdf掃描版
Windows Server 2012 Hyper-V虛擬化管理實(shí)踐 PDF掃描版[223MB]
學(xué)習(xí)Nginx HTTP Server(中文版) PDF掃描版[23MB]
下載聲明
☉ 解壓密碼:www.dbjr.com.cn 就是本站主域名,希望大家看清楚,[ 分享碼的獲取方法 ]可以參考這篇文章
☉ 推薦使用 [ 迅雷 ] 下載,使用 [ WinRAR v5 ] 以上版本解壓本站軟件。
☉ 如果這個軟件總是不能下載的請?jiān)谠u論中留言,我們會盡快修復(fù),謝謝!
☉ 下載本站資源,如果服務(wù)器暫不能下載請過一段時間重試!或者多試試幾個下載地址
☉ 如果遇到什么問題,請?jiān)u論留言,我們定會解決問題,謝謝大家支持!
☉ 本站提供的一些商業(yè)軟件是供學(xué)習(xí)研究之用,如用于商業(yè)用途,請購買正版。
☉ 本站提供的數(shù)據(jù)算法:Hadoop/Spark大數(shù)據(jù)處理技巧 完整版 中文pdf掃描版[100MB]資源來源互聯(lián)網(wǎng),版權(quán)歸該下載資源的合法擁有者所有。