欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Hadoop Combiner使用方法詳解

 更新時間:2017年10月25日 10:16:34   作者:csguo007  
這篇文章主要介紹了 Hadoop Combiner使用方法詳解的相關(guān)資料,希望通過本文能幫助到大家讓大家理解掌握這部分內(nèi)容,需要的朋友可以參考下

Hadoop Combiner使用方法詳解

Combiner函數(shù)是一個可選的中間函數(shù),發(fā)生在Map階段,Mapper執(zhí)行完成后立即執(zhí)行。使用Combiner有如下兩個優(yōu)勢:

  1. Combiner可以用來減少發(fā)送到Reducer的數(shù)據(jù)量,從而提高網(wǎng)絡(luò)效率。
  2. Combiner可以用于減少發(fā)送到Reducer的數(shù)據(jù)量,這將提高Reduce端的效率,因為每個reduce函數(shù)將處理相對較少記錄,相比于未使用Combiner之前。

Combiner與Reducer結(jié)構(gòu)相同,因為Combiner和Reducer都對Mapper的輸出進(jìn)行處理。這給了我們一個復(fù)用Reducer作為Combiner的好機(jī)會。但問題是,復(fù)用Reducer作為Combiner總是是一個好主意嗎?

特點:

Combiners是MapReduce中的一個優(yōu)化,允許在shuffle和排序階段之前在本地進(jìn)行聚合。Combiners的首要目標(biāo)是通過最小化鍵值對的數(shù)量來節(jié)省盡可能多的帶寬

Reducer作為Combiner的適用場景

假設(shè)我們正在編寫一個MapReduce程序來計算股票數(shù)據(jù)集中每個股票代碼的最大收盤價。Mapper將數(shù)據(jù)集中每個股票記錄的股票代碼作為key和收盤價作為value。Reducer然后將循環(huán)遍歷股票代碼對應(yīng)的所有收盤價,并從收盤價列表中計算最高收盤價。假設(shè)Mapper 1 處理 股票代碼為ABC 的3個記錄,收盤價分別為50,60和111。讓我們假設(shè)Mapper 2 處理股票代碼為ABC的2個記錄,收盤價分別為100和31。那么Reducer將收到股票代碼ABC五個收盤價---50,60,111,100和31。Reducer的工作非常簡單,它將簡單地循環(huán)遍歷所有收盤價,并將計算最高收盤價為111。

我們可以在每個Mapper之后使用相同的Reducer作為Combiner。Mapper 1 上的Combiner將處理3個收盤價格--50,60和111,并且僅輸出111,因為它是3個收盤價的最大值。Mapper 2 上的Combiner將處理2個收盤價格--100和31,并且僅輸出100,因為它是2個收盤價的最大值?,F(xiàn)在使用Combiner之后,Reducer僅處理股票代碼ABC的2個收盤價(原先需要處理5個收盤價),即來自Mapper 1 的111和來自Mapper 2 的100,并且將從這兩個值中計算出最大收盤價格為111。

正如我們看到的,使用Combiner情況下Reducer輸出與沒有使用Combiner的輸出結(jié)果是相同的,因此在這種情況下復(fù)用Reducer作為

Combiner是沒有問題。

Reducer作為Combiner的不適用場景

假設(shè)我們正在編寫一個MapReduce程序來計算股票數(shù)據(jù)集中每個股票代碼的平均交易量(average volume for each symbol)。Mapper將數(shù)據(jù)集中每個股票記錄的股票代碼作為key和交易量(volume)作為value。Reducer然后將循環(huán)遍歷股票代碼對應(yīng)的所有交易量,并從交易量列表中計算出平均交易量(average volume from the list of volumes for that symbol)。假設(shè)Mapper 1 處理 股票代碼為ABC 的3個記錄,收盤價分別為50,60和111。讓我們假設(shè)Mapper 2 處理股票代碼為ABC的2個記錄,收盤價分別為100和31。那么Reducer將收到股票代碼ABC五個收盤價---50,60,111,100和31。Reducer的工作非常簡單,它將簡單地循環(huán)遍歷所有交易量,并將計算出平均交易量為70.4。

50 + 60 + 111 + 100 + 31 / 5 = 352 / 5 = 70.4

讓我們看看如果我們在每個Mapper之后復(fù)用Reducer作為Combiner會發(fā)生什么。Mapper 1 上的Combiner將處理3個交易量--50,60和111,并計算出三個交易量的平均交易量為73.66。

Mapper 2 上的Combiner將處理2個交易量--100和31,并計算出兩個交易量的平均交易量為65.5。那么在復(fù)用Reducer作為Combiner的情況下,Reducer僅處理股票代碼ABC的2個平均交易量,來自Mapper1的73.66 和 來自Mapper2的65.5,并計算股票代碼ABC最終的平均交易量為69.58。

73.66 + 65.5 /2 = 69.58

這與我們不復(fù)用Reducer作為Combiner得出的結(jié)果不一樣,因此復(fù)用Reducer作為Combiner得出平均交易量是不正確的。

所以我們可以看到Reducer不能總是被用于Combiner。所以,當(dāng)你決定復(fù)用Reducer作為Combiner的時候,你需要問自己這樣一個問題 - 使用Combiner與不使用Combiner的輸出結(jié)果是否一樣?

如有疑問請留言或者到本站社區(qū)交流討論,感謝閱讀,希望能幫助到大家,謝謝大家對本站的支持!

相關(guān)文章

  • 使用@PathVariable接收兩個參數(shù)

    使用@PathVariable接收兩個參數(shù)

    這篇文章主要介紹了使用@PathVariable接收兩個參數(shù)的操作,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2021-08-08
  • Junit Mockito實現(xiàn)單元測試方法介紹

    Junit Mockito實現(xiàn)單元測試方法介紹

    JUnit是用于編寫和運行可重復(fù)的自動化測試開源測試項目框架,這樣可以保證我們的代碼按與其工作。JUnit可廣泛用于工業(yè)和作為支架(從命令行)或IDE(如IDE)內(nèi)單獨的java程序
    2022-09-09
  • java9在interface中定義私有方法詳解

    java9在interface中定義私有方法詳解

    在本篇內(nèi)容里小編給大家整理的是一篇關(guān)于java9在interface中定義私有方法,有興趣的朋友們可以學(xué)習(xí)下。
    2020-10-10
  • 如何用Springboot Admin監(jiān)控你的微服務(wù)應(yīng)用

    如何用Springboot Admin監(jiān)控你的微服務(wù)應(yīng)用

    這篇文章主要介紹了如何用Springboot Admin監(jiān)控你的微服務(wù)應(yīng)用,幫助大家更好的理解和使用springboot框架,感興趣的朋友可以了解下。
    2021-01-01
  • Java編程復(fù)用類代碼詳解

    Java編程復(fù)用類代碼詳解

    這篇文章主要介紹了Java編程復(fù)用類代碼詳解,分享了相關(guān)代碼示例,小編覺得還是挺不錯的,具有一定借鑒價值,需要的朋友可以參考下
    2018-01-01
  • SpringBoot發(fā)送短信驗證碼的實例

    SpringBoot發(fā)送短信驗證碼的實例

    第三方短信發(fā)送平臺有很多種,各個平臺有各自的優(yōu)缺點,在選擇的時候可以根據(jù)自己的具體實際情況定奪,本文主要介紹了SpringBoot發(fā)送短信驗證碼的實例,感興趣的可以了解一下
    2022-02-02
  • 將下載好的jar包導(dǎo)入到本地maven倉庫中操作

    將下載好的jar包導(dǎo)入到本地maven倉庫中操作

    這篇文章主要介紹了將下載好的jar包導(dǎo)入到本地maven倉庫中操作,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-08-08
  • 七個Spring核心模塊詳解

    七個Spring核心模塊詳解

    這篇文章主要為大家詳細(xì)介紹了七個Spring的核心模塊,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2018-03-03
  • 詳解Java中finally和return的執(zhí)行順序

    詳解Java中finally和return的執(zhí)行順序

    try-catch-finally是一種針對程序運行時出錯的響應(yīng)手段,對于一些可以預(yù)料到的出錯類型,在發(fā)生時對其進(jìn)行報告和補(bǔ)救,這篇文章主要介紹了Java中finally和return的執(zhí)行順序,需要的朋友可以參考下
    2024-01-01
  • Spring集成Redis詳解代碼示例

    Spring集成Redis詳解代碼示例

    這篇文章主要介紹了Spring集成Redis詳解代碼示例,介紹了Eclipse工程結(jié)構(gòu),POM依賴,Spring配置,Redis配置信息以及Java代碼等相關(guān)內(nèi)容,具有一定參考價值,需要的朋友可以了解下。
    2017-11-11

最新評論