欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Apache Hadoop版本詳解

 更新時間:2017年09月28日 10:00:29   投稿:mrr  
本文總結(jié)了ApacheHadoop和Cloudera Hadoop的版本衍化過程,并給出了選擇Hadoop版本的一些建議。感興趣的朋友一起看看吧

由于Hadoop版本混亂多變,因此,Hadoop的版本選擇問題一直令很多初級用戶苦惱。本文總結(jié)了ApacheHadoop和Cloudera Hadoop的版本衍化過程,并給出了選擇Hadoop版本的一些建議。

1.Apache HadoopApache版本衍化

截至目前(2012年12月23日),ApacheHadoop版本分為兩代,我們將第一代Hadoop稱為Hadoop 1.0,第二代Hadoop稱為Hadoop2.0。第一代Hadoop包含三個大版本,分別是0.20.x,0.21.x和0.22.x,其中,0.20.x最后演化成1.0.x,變成了穩(wěn)定版,而0.21.x和0.22.x則NameNodeHA等新的重大特性。第二代Hadoop包含兩個版本,分別是0.23.x和2.x,它們完全不同于Hadoop1.0,是一套全新的架構(gòu),均包含HDFS Federation和YARN兩個系統(tǒng),相比于0.23.x,2.x增加了NameNodeHA和Wire-compatibility兩個重大特性。

經(jīng)過上面的大體解釋,大家可能明白了Hadoop以重大特性區(qū)分各個版本的,總結(jié)起來,用于區(qū)分Hadoop版本的特性有以下幾個:

(1)Append支持文件追加功能,如果想使用HBase,需要這個特性。

(2)RAID在保證數(shù)據(jù)可靠的前提下,通過引入校驗碼較少數(shù)據(jù)塊數(shù)目。詳細鏈接:

https://issues.apache.org/jira/browse/HDFS/component/12313080

(3)Symlink支持HDFS文件鏈接,具體可參考:https://issues.apache.org/jira/browse/HDFS-245

(4)SecurityHadoop安全,具體可參考:https://issues.apache.org/jira/browse/HADOOP-4487

(5)NameNodeHA具體可參考:https://issues.apache.org/jira/browse/HDFS-1064

(6)HDFSFederation和YARN



需要注意的是,Hadoop2.0主要由Yahoo獨立出來的hortonworks公司主持開發(fā)。

Apache版本下載

(1)各版本說明:http://hadoop.apache.org/releases.html。

(2)下載穩(wěn)定版:找到一個鏡像,下載stable文件夾下的版本。

(3)Hadoop最全版本:http://svn.apache.org/repos/asf/hadoop/common/branches/,可直接導到eclipse中。

2.Cloudera HadoopCDH版本衍化

Apache當前的版本管理是比較混亂的,各種版本層出不窮,讓很多初學者不知所措,相比之下,Cloudera公司的Hadoop版本管理的要很多。

我們知道,Hadoop遵從Apache開源協(xié)議,用戶可以免費地任意使用和修改Hadoop,也正因此,市面上出現(xiàn)了很多Hadoop版本,其中比較出名的一是Cloudera公司的發(fā)行版,我們將該版本稱為CDH(ClouderaDistributionHadoop)。截至目前為止,CDH共有4個版本,其中,前兩個已經(jīng)不再更新,最近的兩個,分別是CDH3(在Apache Hadoop0.20.2版本基礎(chǔ)上演化而來的)和CDH4在Apache Hadoop2.0.0版本基礎(chǔ)上演化而來的),分別對應(yīng)Apache的Hadoop 1.0和Hadoop2.0,它們每隔一段時間便會更新一次。



Cloudera以patch level劃分小版本,比如patch level為923.142表示在原生態(tài)Apache Hadoop0.20.2基礎(chǔ)上添加了1065個patch(這些patch是各個公司或者個人貢獻的,在Hadoopjira上均有記錄),其中923個是最后一個beta版本添加的patch,而142個是穩(wěn)定版發(fā)行后新添加的patch。由此可見,patchlevel越高,功能越完備且解決的bug越多。

Cloudera版本層次更加清晰,且它提供了適用于各種操作系統(tǒng)的Hadoop安裝包,可直接使用apt-get或者yum命令進行安裝,更加省事。

CDH版本下載

(1)版本含義介紹:

https://ccp.cloudera.com/display/DOC/CDH+Version+and+Packaging+Information

(2)各版本特性查看:

https://ccp.cloudera.com/display/DOC/CDH+Packaging+Information+for+Previous+Releases

(3)各版本下載:

CDH3:http://archive.cloudera.com/cdh/3/

CDH4:http://archive.cloudera.com/cdh4/cdh/4/

注意,Hadoop壓縮包在這兩個鏈接中的最上層目錄中,不在某個文件夾里,很多人進到鏈接還找不到安裝包!

3.如何選擇Hadoop版本

當前Hadoop版本比較混亂,讓很多用戶不知所措。實際上,當前Hadoop只有兩個版本:Hadoop1.0和Hadoop 2.0,其中,Hadoop1.0由一個分布式文件系統(tǒng)HDFS和一個離線計算框架MapReduce組成,而Hadoop2.0則包含一個支持NameNode橫向擴展的HDFS,一個資源管理系統(tǒng)YARN和一個運行在YARN上的離線計算框架MapReduce。相比于Hadoop1.0,Hadoop 2.0功能更加強大,且具有更好的擴展性、性能,并支持多種計算框架。

當我們決定是否采用某個軟件用于開源環(huán)境時,通常需要考慮以下幾個因素:

(1)是否為開源軟件,即是否免費。

(2)是否有穩(wěn)定版,這個一般軟件官方網(wǎng)站會給出說明。

(3)是否經(jīng)實踐驗證,這個可通過檢查是否有一些大點的公司已經(jīng)在生產(chǎn)環(huán)境中使用知道。

(4)是否有強大的社區(qū)支持,當出現(xiàn)一個問題時,能夠通過社區(qū)、論壇等網(wǎng)絡(luò)資源快速獲取解決方法。

考慮到以上幾個因素,我們分析一下開源軟件Hadoop。對于Hadoop2.0而言,目前尚不穩(wěn)定,無法用于生產(chǎn)環(huán)境,因此,如果當前你正準備使用Hadoop,那么只能從Hadoop1.0中選擇一個版本,而目截至目前(2012年12月23日),Apache和Cloudera最新的穩(wěn)定版分別是Hadoop1.0.4和CDH3U4,因此,你可以從中任選一個使用。

總結(jié)

以上所述是小編給大家介紹的Apache Hadoop版本詳解,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!

相關(guān)文章

  • linux托盤不斷閃爍之解決方法

    linux托盤不斷閃爍之解決方法

    紅旗6sp1雖然升級了一些配置和軟件,但是也出現(xiàn)很多問題 比較突出的就是 當通過 網(wǎng)絡(luò) 設(shè)置 一個pppoe adsl 上網(wǎng)以后,系統(tǒng)托盤不停的閃爍
    2008-07-07
  • LAMP服務(wù)器性能優(yōu)化技巧之加速PHP

    LAMP服務(wù)器性能優(yōu)化技巧之加速PHP

    目前LAMP (Linux + Apache + MySQL + PHP) 近幾年來發(fā)展迅速,已經(jīng)成為Web 服務(wù)器的事實標準。本文我們將介紹基于LAMP組合的服務(wù)器的性能優(yōu)化技巧:加速PHP。
    2012-02-02
  • linux下如何創(chuàng)建守護進程的步驟

    linux下如何創(chuàng)建守護進程的步驟

    本篇文章主要介紹了linux下如何創(chuàng)建守護進程的步驟,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2017-07-07
  • linux下用csplit命令分割文件的方法示例

    linux下用csplit命令分割文件的方法示例

    csplit命令用于將一個大文件分割成小的碎片,并且將分割后的每個碎片保存成一個文件。下面這篇文章主要跟大家介紹了linux下用csplit命令分割文件的方法示例,對大家具有一定的參考學習價值,需要的朋友們下面來一起看看吧。
    2017-06-06
  • Nginx虛擬主機多server_name的順序問題

    Nginx虛擬主機多server_name的順序問題

    今天在配置Nginx + PHP + MediaWiki中,發(fā)現(xiàn)一個問題:MediaWiki所在的Nginx虛擬主機綁定了多個域名,但是不管通過什么域名訪問MediaWiki首頁,都會被跳轉(zhuǎn)到其中的一個域名上。
    2008-12-12
  • apache負載均衡的安裝和實現(xiàn)方法

    apache負載均衡的安裝和實現(xiàn)方法

    在負載均衡技術(shù)中,硬件設(shè)備是比較昂貴的,對于負載均衡的學習者如果不是在企業(yè)中應(yīng)用或者是學員中學習,很少有機會能碰到實際操作的訓練。所以,很多朋友都會選擇軟件方面的設(shè)置進行研究?,F(xiàn)在我們就來介紹一下再Apache下的Tomcat負載均衡的一些使用問題
    2012-10-10
  • CentOS服務(wù)器apache綁定多個域名的方法

    CentOS服務(wù)器apache綁定多個域名的方法

    這篇文章主要為大家詳細介紹了CentOS服務(wù)器apache綁定多個域名的相關(guān)資料,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2016-11-11
  • CentOS7.4下 安裝JDK1.8的圖文教程

    CentOS7.4下 安裝JDK1.8的圖文教程

    這篇文章主要介紹了CentOS7.4下 安裝JDK1.8的圖文教程,本文圖文并茂給大家介紹的非常詳細,具有一定的參考借鑒價值,需要的朋友可以參考下
    2020-03-03
  • Linux?命令?systemctl?基本介紹和常用選項

    Linux?命令?systemctl?基本介紹和常用選項

    這篇文章主要介紹了Linux命令systemctl,包括systemctl命令的基本介紹和常用選項、命令及示例,使用systemctl命令需要有管理員權(quán)限(例如root或具有sudo權(quán)限的用戶),需要的朋友可以參考下
    2023-06-06
  • centos6-7 yum安裝php的方法(推薦)

    centos6-7 yum安裝php的方法(推薦)

    這篇文章主要介紹了centos6-7 yum安裝php的方法,非常不錯,具有一定的參考借鑒價值,需要的朋友可以參考下
    2020-01-01

最新評論