Mongodb中MapReduce實(shí)現(xiàn)數(shù)據(jù)聚合方法詳解
Mongodb是針對(duì)大數(shù)據(jù)量環(huán)境下誕生的用于保存大數(shù)據(jù)量的非關(guān)系型數(shù)據(jù)庫(kù),針對(duì)大量的數(shù)據(jù),如何進(jìn)行統(tǒng)計(jì)操作至關(guān)重要,那么如何從Mongodb中統(tǒng)計(jì)一些數(shù)據(jù)呢?
在Mongodb中,給我們提供了三種用于數(shù)據(jù)聚合的方式:
(1)簡(jiǎn)單的用戶聚合函數(shù);
(2)使用aggregate進(jìn)行統(tǒng)計(jì);
(3)使用mapReduce進(jìn)行統(tǒng)計(jì);
今天我們首先來(lái)講講mapReduce是如何統(tǒng)計(jì),在后續(xù)的文章中,將另起文章進(jìn)行相關(guān)說(shuō)明。
MapReduce是啥呢?以我的理解,其實(shí)就是對(duì)集合中的各個(gè)滿足條件的文檔進(jìn)行預(yù)處理,整理出想要的數(shù)據(jù)然后進(jìn)行統(tǒng)計(jì)得到最終的統(tǒng)計(jì)結(jié)果。其中map函數(shù)用于對(duì)集合中的各個(gè)滿足條件的文檔進(jìn)行預(yù)處理,整理出想要的數(shù)據(jù)。Reduce函數(shù)用于對(duì)整理出的數(shù)據(jù)進(jìn)行處理得到統(tǒng)計(jì)結(jié)果。Map函數(shù)和Reduce函數(shù)都是JavaScript函數(shù)。
首先,我們先構(gòu)造一個(gè)測(cè)試數(shù)據(jù)集test,使用js腳本往集合中隨機(jī)插入一組數(shù)據(jù),每條記錄是哪個(gè)人花了多少錢(qián)買(mǎi)了什么東西。具體腳本test1.js如下:
<span style="font-family:KaiTi_GB2312;"><span style="font-size:18px;">for( var i=0; i<100; i++){ var rID=Math.floor(Math.random()*10); var price = parseFloat((Math.random()*10).toFixed(2)); if(rID<3){ db.test.insert({"user":"majing","sku":rID,"price":price}); } else if(rID>=3 && rID<5){ db.test.insert({"user":"wufenglei","sku":rID,"price":price}); } else if(rID>=5 && rID<8){ db.test.insert({"user":"wufenglei","sku":rID,"price":price}); } else { db.test.insert({"user":"liyonghu","sku":rID,"price":price}); } }</span></span>
接下來(lái)我們通過(guò)在控制臺(tái)執(zhí)行腳本來(lái)向數(shù)據(jù)庫(kù)插入具體的數(shù)據(jù),具體執(zhí)行指令如下:
<span style="font-family:KaiTi_GB2312;"><span style="font-size:18px;">mongo 127.0.0.1:27017/test J:/test1.js</span></span>
執(zhí)行之后,通過(guò)MongoVUE來(lái)查看下具體的數(shù)據(jù),如下所示,數(shù)據(jù)已經(jīng)插入到集合中了:
接下來(lái),我們可以做幾個(gè)簡(jiǎn)單的統(tǒng)計(jì)操作了。
(1)統(tǒng)計(jì)不同用戶都買(mǎi)了多少個(gè)商品?編寫(xiě)js腳本test2.js,將結(jié)果保存到statis1集合中。
<span style="font-family:KaiTi_GB2312;"><span style="font-size:18px;"><span style="font-size:18px;">map=function(){ emit(this.user,1); } reduce=function(key, values){ var count = 0; values.forEach(function(val){count += val}); return count; } db.test.mapReduce(map, reduce, {out:"statics1"});</span></span></span>
按照剛才執(zhí)行腳本的方式執(zhí)行test2.js,并查看數(shù)據(jù):
從數(shù)據(jù)庫(kù)就可以直觀看到統(tǒng)計(jì)數(shù)據(jù)了,若想查看某個(gè)人如majing購(gòu)買(mǎi)了多少個(gè)商品,直接使用
<span style="font-family:KaiTi_GB2312;"> <span style="font-size:18px;"> <span style="font-size:18px;"> <span style="font-family:KaiTi_GB2312;font-size:18px;">db.statics1.find({"_id":"majing"}); </span> </span> </span> </span>
(2)統(tǒng)計(jì)每個(gè)用戶購(gòu)買(mǎi)的每個(gè)商品的數(shù)量情況
腳本test3.js如下所示:
<span style="font-family:KaiTi_GB2312;"><span style="font-size:18px;"><span style="font-size:18px;">map=function(){ emit({user:this.user,sku:this.sku},1); } reduce=function(key, values){ var count = 0; values.forEach(function(val){count += val}); return count; } db.test.mapReduce(map, reduce, {out:"statics2"});</span></span></span>
按照剛才執(zhí)行腳本的方式執(zhí)行test3.js,并查看數(shù)據(jù):
總共返回了10條記錄。此時(shí)如果我們想查找某個(gè)用戶購(gòu)買(mǎi)商品的情況,可以使用下面的查詢方法:
<span style="font-family:KaiTi_GB2312;"><span style="font-size:18px;"><span style="font-size:18px;">db.statics2.find({"_id.user":"majing"});</span></span></span>
如果我們想查找某個(gè)用戶購(gòu)買(mǎi)某個(gè)商品的情況,可以使用下面的查詢方法:
(3)統(tǒng)計(jì)每個(gè)用戶購(gòu)買(mǎi)商品的總量及花費(fèi)的總金額
腳本test4.js如下所示:
<span style="font-family:KaiTi_GB2312;"><span style="font-size:18px;"><span style="font-size:18px;">map=function(){ emit({user:this.user},{totalprice:this.price,count:1}); } reduce=function(key, values){ var res = {totalprice:0.00,count:1}; values.forEach(function(val){res.totalprice += val.totalprice;res.count+=val.count;}); return res; } db.test.mapReduce(map, reduce, {out:"statics3"});</span></span></span>
按照剛才執(zhí)行腳本的方式執(zhí)行test4.js,并查看數(shù)據(jù):
(4)統(tǒng)計(jì)每個(gè)用戶購(gòu)買(mǎi)商品的平均價(jià)錢(qián)
在這個(gè)情景下,我們需要用到說(shuō)道m(xù)apReduce里的另一個(gè)參數(shù)finalize,該參數(shù)是一個(gè)javascript腳本函數(shù),用于對(duì)reduce后的集合進(jìn)行一個(gè)后期處理操作。
執(zhí)行腳本test5.js,具體如下所示:
<span style="font-family:KaiTi_GB2312;"><span style="font-size:18px;"><span style="font-size:18px;">map=function(){ emit({user:this.user},{totalprice:this.price,count:1}); } reduce=function(key, values){ var res = {totalprice:0.00,count:1,average:0}; values.forEach(function(val){res.totalprice += val.totalprice;res.count+=val.count;}); return res; } finalizeFunc=function(key,reduceResult){ reduceResult.totalprice=(reduceResult.totalprice).toFixed(2); reduceResult.average=(reduceResult.totalprice/reduceResult.count).toFixed(2); return reduceResult; } db.test.mapReduce(map, reduce, {out:"statics4",finalize:finalizeFunc});</span></span></span>
執(zhí)行之后查看得到的數(shù)據(jù),具體如下所示,顯示了總價(jià)錢(qián),商品數(shù)量和商品單價(jià)。
如果想查找某個(gè)人的,可以和上面的查詢方法一樣,使用find()方法進(jìn)行查詢:
<span style="font-family:KaiTi_GB2312;"><span style="font-size:18px;"><span style="font-size:18px;">db.statics4.find({"_id.user":"majing"});</span></span></span>
以上通過(guò)4個(gè)簡(jiǎn)單的例子對(duì)Mongodb中的MapReduce進(jìn)行了簡(jiǎn)單的說(shuō)明,當(dāng)然MapReduce功能很強(qiáng)大,大家如果想知道其他高級(jí)的使用方法,可以到Mongodb的官網(wǎng)進(jìn)行查閱和學(xué)習(xí),網(wǎng)址為
https://docs.mongodb.com/manual/reference/method/db.collection.mapReduce/ 謝謝。
以上所述是小編給大家介紹的Mongodb中MapReduce實(shí)現(xiàn)數(shù)據(jù)聚合方法詳解,希望對(duì)大家有所幫助,如果大家有任何疑問(wèn)請(qǐng)給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對(duì)腳本之家網(wǎng)站的支持!
- Go語(yǔ)言實(shí)現(xiàn)MapReduce的示例代碼
- 使用golang實(shí)現(xiàn)一個(gè)MapReduce的示例代碼
- golang并發(fā)工具M(jìn)apReduce降低服務(wù)響應(yīng)時(shí)間
- Golang編程并發(fā)工具庫(kù)MapReduce使用實(shí)踐
- golang如何實(shí)現(xiàn)mapreduce單進(jìn)程版本詳解
- MongoDB中MapReduce的使用方法詳解
- MongoDB學(xué)習(xí)筆記之MapReduce使用示例
- MongoDB中的MapReduce簡(jiǎn)介
- MongoDB中MapReduce編程模型使用實(shí)例
- Go通用的?MapReduce?工具函數(shù)詳解
相關(guān)文章
MongoDB數(shù)據(jù)庫(kù)基礎(chǔ)操作總結(jié)
這篇文章主要介紹了MongoDB數(shù)據(jù)庫(kù)基礎(chǔ)操作,結(jié)合實(shí)例形式總結(jié)分析了MongoDB數(shù)據(jù)庫(kù)創(chuàng)建、刪除、集合、文檔等基本操作技巧,需要的朋友可以參考下2020-06-06MongoDB插入、更新、刪除文檔實(shí)現(xiàn)代碼
本文通過(guò)實(shí)例代碼給大家簡(jiǎn)單介紹了mongodb插入、更新、刪除文檔的方法,需要的的朋友參考下吧2017-04-04MongoDB自動(dòng)刪除過(guò)期數(shù)據(jù)的方法(TTL索引)
這篇文章主要給大家介紹了關(guān)于MongoDB自動(dòng)刪除過(guò)期數(shù)據(jù)(TTL索引)的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2018-11-11centos yum 安裝 mongodb 以及php擴(kuò)展
MongoDB是一個(gè)基于分布式文件存儲(chǔ)的數(shù)據(jù)庫(kù)。由C++語(yǔ)言編寫(xiě)。旨在為WEB應(yīng)用提供可擴(kuò)展的高性能數(shù)據(jù)存儲(chǔ)解決方案。2014-07-07Mongodb 副本集搭建問(wèn)題總結(jié)及解決辦法
這篇文章主要介紹了Mongodb 副本集搭建問(wèn)題總結(jié)及解決辦法的相關(guān)資料,在Mongodb 副本集搭建過(guò)程中會(huì)遇到很多問(wèn)題,這里就對(duì)常見(jiàn)問(wèn)題進(jìn)行總結(jié)并提供解決辦法,需要的朋友可以參考下2016-12-12MongoDB超大塊數(shù)據(jù)問(wèn)題解決
這篇文章主要為大家介紹了MongoDB超大塊數(shù)據(jù)問(wèn)題的技術(shù)瓶頸解決方法,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-02-02Mongodb 利用mongoshell進(jìn)行數(shù)據(jù)類型轉(zhuǎn)換的實(shí)現(xiàn)方法
下面小編就為大家分享一篇Mongodb 利用mongoshell進(jìn)行數(shù)據(jù)類型轉(zhuǎn)換的實(shí)現(xiàn)方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2017-12-12