關(guān)于Hadoop的HDFS集群
HDFS 集群是建立在 Hadoop 集群之上的,由于 HDFS 是 Hadoop 最主要的守護(hù)進(jìn)程,所以 HDFS 集群的配置過(guò)程是 Hadoop 集群配置過(guò)程的代表。
使用 Docker 可以更加方便地、高效地構(gòu)建出一個(gè)集群環(huán)境。
每臺(tái)計(jì)算機(jī)中的配置
Hadoop 如何配置集群、不同的計(jì)算機(jī)里又應(yīng)該有怎樣的配置,這些問(wèn)題是在學(xué)習(xí)中產(chǎn)生的。本章的配置中將會(huì)提供一個(gè)典型的示例,但 Hadoop 復(fù)雜多樣的配置項(xiàng)遠(yuǎn)超于此。
HDFS 命名節(jié)點(diǎn)對(duì)數(shù)據(jù)節(jié)點(diǎn)的遠(yuǎn)程控制是通過(guò) SSH 來(lái)實(shí)現(xiàn)的,因此關(guān)鍵的配置項(xiàng)應(yīng)該在命名節(jié)點(diǎn)被配置,非關(guān)鍵的節(jié)點(diǎn)配置要在各個(gè)數(shù)據(jù)節(jié)點(diǎn)配置。也就是說(shuō),數(shù)據(jù)節(jié)點(diǎn)與命名節(jié)點(diǎn)的配置可以不同,不同數(shù)據(jù)節(jié)點(diǎn)之間的配置也可以有所不同。
但是本章為了方便建立集群,將使用相同的配置文件通過(guò) Docker 鏡像的形式同步到所有的集群節(jié)點(diǎn),特做解釋。
具體步驟
總體思路是這樣的,我們先用一個(gè)包含 Hadoop 的鏡像進(jìn)行配置,配置成集群中所有節(jié)點(diǎn)都可以共用的樣子,然后再以它為原型生成若干個(gè)容器,構(gòu)成一個(gè)集群。
配置原型
首先,我們將使用之前準(zhǔn)備的 hadoop_proto 鏡像啟動(dòng)為容器:
docker run -d --name=hadoop_temp --privileged hadoop_proto /usr/sbin/init
進(jìn)入 Hadoop 的配置文件目錄:
cd $HADOOP_HOME/etc/hadoop
現(xiàn)在對(duì)這里的文件的作用做簡(jiǎn)單的描述:
文件 | 作用 |
workers | 記錄所有的數(shù)據(jù)節(jié)點(diǎn)的主機(jī)名或 IP 地址 |
core-site.xml | Hadoop 核心配置 |
hdfs-site.xml | HDFS 配置項(xiàng) |
mapred-site.xml | MapReduce 配置項(xiàng) |
yarn-site.xml | YARN 配置項(xiàng) |
注:YARN 的作用是為 MapReduce 提供資源管理服務(wù),此處暫時(shí)用不著。
我們現(xiàn)在設(shè)計(jì)這樣一個(gè)簡(jiǎn)單的集群:
- 1 個(gè)命名節(jié)點(diǎn) nn
- 2 個(gè)數(shù)據(jù)節(jié)點(diǎn) dn1, dn2
首先編輯 workers ,更改文件內(nèi)容為:
dn1 ???????dn2
然后編輯 core-site.xml,在 中添加以下配置項(xiàng):
<!-- 配置 HDFS 主機(jī)地址與端口號(hào) --> <property> <name>fs.defaultFS</name> <value>hdfs://nn:9000</value> </property> <!-- 配置 Hadoop 的臨時(shí)文件目錄 --> <property> <name>hadoop.tmp.dir</name> <value>file:///home/hadoop/tmp</value> </property>
配置 hdfs-site.xml,在 中添加以下配置項(xiàng):
<!-- 每個(gè)數(shù)據(jù)塊復(fù)制 2 份存儲(chǔ) --> <property> <name>dfs.replication</name> <value>2</value> </property> <!-- 設(shè)置儲(chǔ)存命名信息的目錄 --> <property> <name>dfs.namenode.name.dir</name> <value>file:///home/hadoop/hdfs/name</value> </property>
最后需要配置一下 SSH :
ssh-keygen -t rsa -P "" -f ~/.ssh/id_rsassh-copy-id -i ~/.ssh/id_rsa hadoop@localhost
到此為止,集群的原型就配置完畢了,可以退出容器并上傳容器到新鏡像 cluster_proto :
docker stop hadoop_tempdocker commit hadoop_temp cluster_proto
此處如果有必要可以刪除臨時(shí)鏡像 hadoop_temp 。
部署集群
接下來(lái)部署集群。
首先,要為 Hadoop 集群建立專用網(wǎng)絡(luò) hnet :
docker network create --subnet=172.20.0.0/16 hnet
接下來(lái)創(chuàng)建集群容器:
docker run -d --name=nn --hostname=nn --network=hnet --ip=172.20.1.0 --add-host=dn1:172.20.1.1 --add-host=dn2:172.20.1.2 --privileged cluster_proto /usr/sbin/init docker run -d --name=dn1 --hostname=dn1 --network=hnet --ip=172.20.1.1 --add-host=nn:172.20.1.0 --add-host=dn2:172.20.1.2 --privileged cluster_proto /usr/sbin/init docker run -d --name=dn2 --hostname=dn2 --network=hnet --ip=172.20.1.2 --add-host=nn:172.20.1.0 --add-host=dn1:172.20.1.1 --privileged cluster_proto /usr/sbin/init
進(jìn)入命名節(jié)點(diǎn):
docker exec -it nn su hadoop
格式化 HDFS:
hdfs namenode -format
如果沒(méi)有出錯(cuò),那么下一步就可以啟動(dòng) HDFS:
start-dfs.sh
成功啟動(dòng)之后,jps 命令應(yīng)該能查到 NameNode 和 SecondaryNameNode 的存在。命名節(jié)點(diǎn)不存在 DataNode 進(jìn)程,因?yàn)檫@個(gè)進(jìn)程在 dn1 和 dn2 中運(yùn)行。
至此,你可以檢測(cè) HDFS 的運(yùn)行,使用 HDFS 的方式也沒(méi)有差別(命名節(jié)點(diǎn)代表整個(gè)集群)。
到此這篇關(guān)于關(guān)于Hadoop的HDFS集群的文章就介紹到這了,更多相關(guān)HDFS集群內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Spring Boot Web應(yīng)用開(kāi)發(fā) CORS 跨域請(qǐng)求支持
本篇文章主要介紹了Spring Boot Web應(yīng)用開(kāi)發(fā) CORS 跨域請(qǐng)求支持,小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2017-05-05SpringBoot通過(guò)注解下載任意對(duì)象
下載功能應(yīng)該是比較常見(jiàn)的功能了,雖然一個(gè)項(xiàng)目里面可能出現(xiàn)的不多,但是基本上每個(gè)項(xiàng)目都會(huì)有,而且有些下載功能其實(shí)還是比較繁雜的,這篇文章主要介紹了SpringBoot一個(gè)注解就能幫你下載任意對(duì)象,需要的朋友可以參考下2023-08-08Mybatis如何自動(dòng)生成數(shù)據(jù)庫(kù)表的實(shí)體類(lèi)
這篇文章主要介紹了Mybatis自動(dòng)生成數(shù)據(jù)庫(kù)表的實(shí)體類(lèi)的操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-06-06Spring?Security使用數(shù)據(jù)庫(kù)登錄認(rèn)證授權(quán)
本文主要介紹了Spring?Security使用數(shù)據(jù)庫(kù)登錄認(rèn)證授權(quán),文中通過(guò)示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2022-01-01SpringBoot整合EasyExcel實(shí)現(xiàn)文件導(dǎo)入導(dǎo)出
這篇文章主要介紹了SpringBoot整合EasyExcel實(shí)現(xiàn)文件導(dǎo)入導(dǎo)出的方法,幫助大家更好的理解和學(xué)習(xí)使用SpringBoot,感興趣的朋友可以了解下2021-05-05Java數(shù)據(jù)結(jié)構(gòu)之循環(huán)隊(duì)列簡(jiǎn)單定義與用法示例
這篇文章主要介紹了Java數(shù)據(jù)結(jié)構(gòu)之循環(huán)隊(duì)列簡(jiǎn)單定義與用法,簡(jiǎn)要描述了循環(huán)隊(duì)列的概念、原理,并結(jié)合實(shí)例形式分析了java循環(huán)隊(duì)列的定義與使用方法,需要的朋友可以參考下2017-10-10maven實(shí)現(xiàn)docker自動(dòng)化部署插件的使用
本文主要介紹了maven實(shí)現(xiàn)docker自動(dòng)化部署插件的使用,分享給大家,感興趣的小伙伴們可以參考一下2021-06-06Java讀寫(xiě)txt文件時(shí)防止中文亂碼問(wèn)題出現(xiàn)的方法介紹
這篇文章主要介紹了Java讀寫(xiě)txt文件時(shí)防止中文亂碼問(wèn)題出現(xiàn)的方法,同時(shí)需要注意系統(tǒng)默認(rèn)的文本保存編碼的設(shè)置,需要的朋友可以參考下2015-12-12