欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

HDFS免重啟掛載新磁盤

 更新時(shí)間:2022年04月06日 15:50:12   投稿:wdc  
這篇文章主要介紹了HDFS免重啟掛載新磁盤,需要的朋友可以參考下

在生產(chǎn)環(huán)境中,集群節(jié)點(diǎn)磁盤大小不同,其使用率也會(huì)不同,HDFS雖有均衡策略,但也會(huì)有數(shù)據(jù)不平衡的情況,有些節(jié)點(diǎn)磁盤就會(huì)被打滿,然后這個(gè)節(jié)點(diǎn)就不健康了(Unhealthy Nodes),Yarn的磁盤閾值檢查(yarn.nodemanager.disk-health-checker.min-healthy-disks),默認(rèn)是90%,超過這個(gè)值就會(huì)不健康,集群有個(gè)節(jié)點(diǎn)不健康,就會(huì)導(dǎo)致任務(wù)運(yùn)行緩慢,之后任務(wù)再擠壓,Yarn資源被集中占用,最終影響上層服務(wù)。

問題

  • 磁盤空間不足,待擴(kuò)容,可動(dòng)態(tài)增刪磁盤

  • yarn資源不足,待優(yōu)化,可動(dòng)態(tài)調(diào)整

本篇內(nèi)容只添加新磁盤,yarn資源優(yōu)化我們?cè)诹硪黄恼略賹iT詳解。

官方說明

官方文檔:DataNode Hot Swap Drive

DataNode Hot Swap Drive

Datanode supports hot swappable drives. The user can add or replace HDFS data volumes without shutting down the DataNode. The following briefly describes the typical hot swapping drive procedure:

  • If there are new storage directories, the user should format them and mount them appropriately.

  • The user updates the DataNode configuration dfs.datanode.data.dir to reflect the data volume directories that will be actively in use.

  • The user runs dfsadmin -reconfig datanode HOST:PORT start to start the reconfiguration process. The user can use dfsadmin -reconfig datanode HOST:PORT status to query the running status of the reconfiguration task.

  • Once the reconfiguration task has completed, the user can safely umount the removed data volume directories and physically remove the disks.

經(jīng)過谷歌翻譯如下:

DataNode 熱插拔驅(qū)動(dòng)器

Datanode 支持熱插拔驅(qū)動(dòng)器。用戶可以在不關(guān)閉 DataNode 的情況下添加或替換 HDFS 數(shù)據(jù)卷。下面簡要介紹典型的熱插拔驅(qū)動(dòng)器過程:

  • 如果有新的存儲(chǔ)目錄,用戶應(yīng)該格式化它們并適當(dāng)?shù)貟燧d它們。

  • 用戶更新 DataNode 配置dfs.datanode.data.dir 以反映將被積極使用的數(shù)據(jù)卷目錄。

  • 用戶運(yùn)行dfsadmin -reconfig datanode HOST:PORT start來啟動(dòng)重新配置過程。用戶可以使用 dfsadmin -reconfig datanode HOST:PORT status 查詢重配置任務(wù)的運(yùn)行狀態(tài)。

  • 重新配置任務(wù)完成后,用戶可以安全地卸載已移除的數(shù)據(jù)卷目錄并物理移除磁盤。

我們先說添加新的磁盤,大意就是不需要重啟任何節(jié)點(diǎn),在需要添加磁盤的節(jié)點(diǎn)上,添加好磁盤,這個(gè)需要運(yùn)維操作,就是掛載一個(gè)新目錄,文檔中是說要配置DataNode的目錄,這里我們建議加上NameNode的目錄dfs.namenode.name.dir,然后再執(zhí)行一個(gè)使配置生效的命令,最后查看配置狀態(tài)。

具體操作

這里假設(shè)已有集群,需要加磁盤的節(jié)點(diǎn)為node2。運(yùn)維也已經(jīng)幫我們掛載好磁盤,新磁盤目錄為/data2

第一步:新增目錄

在node2上添加新目錄,數(shù)據(jù)目錄和元數(shù)據(jù)目錄

mkdir -p /data2/soft/hadoop/tmp/dfs/data

mkdir -p /data2/soft/hadoop/tmp/dfs/name

第二步:修改配置

修改節(jié)點(diǎn)node2的配置文件hdfs-site.xml,主要兩個(gè)屬性

修改前

<!--指定hdfs中namenode的存儲(chǔ)位置-->
<property>
    <name>dfs.namenode.name.dir</name>
    <value>/data/soft/hadoop/tmp/dfs/name</value>
</property>
<!--指定hdfs中datanode的存儲(chǔ)位置-->
<property>
    <name>dfs.datanode.data.dir</name>
    <value>/data/soft/hadoop/tmp/dfs/data</value>
</property>

修改后

<!--指定hdfs中namenode的存儲(chǔ)位置-->
<property>
    <name>dfs.namenode.name.dir</name>
    <value>/data/soft/hadoop/tmp/dfs/name,/data2/soft/hadoop/tmp/dfs/name</value>
</property>
<!--指定hdfs中datanode的存儲(chǔ)位置-->
<property>
    <name>dfs.datanode.data.dir</name>
    <value>/data/soft/hadoop/tmp/dfs/data,/data2/soft/hadoop/tmp/dfs/data</value>
</property>

第三步:使配置生效

重新配置DataNode的配置,使配置生效。

hdfs dfsadmin -reconfig datanode node2:50020 start

hdfs dfsadmin -reconfig datanode node2:50020 status

第四步:平衡數(shù)據(jù)

HDFS數(shù)據(jù)本身并不總是均勻的放置在DataNode中,在添加新磁盤后,我們需要重新平衡下數(shù)據(jù),HDFS為我們提供了一個(gè)工具,可以分析數(shù)據(jù)塊放的位置和跨 DataNode 重新平衡數(shù)據(jù):balancer

官方文檔:hdfs balancer

hdfs balancer
    [-threshold <threshold>]:磁盤容量百分百,判斷集群是否平衡的目標(biāo)參數(shù),每一個(gè) datanode 存儲(chǔ)使用率和集群總存儲(chǔ)使用率的差值都應(yīng)該小于這個(gè)閥值,越小越平衡,默認(rèn)10,越大平衡越快。
    [-policy <policy>]:datanode(默認(rèn)):如果每個(gè)數(shù)據(jù)節(jié)點(diǎn)都是平衡的,則集群是平衡的。blockpool:如果每個(gè)數(shù)據(jù)節(jié)點(diǎn)中的每個(gè)塊池都是平衡的,則集群是平衡的。
    [-exclude [-f <hosts-file> | <comma-separated list of hosts>]]:將指定的數(shù)據(jù)節(jié)點(diǎn)排除在平衡器的平衡之外。
    [-include [-f <hosts-file> | <comma-separated list of hosts>]]:僅包括要由平衡器平衡的指定數(shù)據(jù)節(jié)點(diǎn)。
    [-idleiterations <idleiterations>]:rebalanecing server啟動(dòng)的線程數(shù),默認(rèn)5。

平衡前操作

在平衡時(shí)受帶寬影響,每個(gè)數(shù)據(jù)節(jié)點(diǎn)每秒使用的最大字節(jié)數(shù)是有限的,所以我們先臨時(shí)設(shè)置這個(gè)值,此值會(huì)覆蓋hdfs-site.xml中dfs.datanode.balance.bandwidthPerSec的值,默認(rèn)是1M,本操作命令不會(huì)持久,命令如下:

hdfs dfsadmin -setBalancerBandwidth 104857600

其他值:1024*1024=1M(1048576),52428800=50M,104857600=100M

開始平衡

本次執(zhí)行平衡命令,磁盤平衡目標(biāo)數(shù)為20 nohup hdfs balancer -threshold 20 > balancer.log &

其他平衡命令

平衡所有節(jié)點(diǎn) nohup hdfs balancer > balancer.log &

平衡指定節(jié)點(diǎn),磁盤平衡目標(biāo)數(shù)為10 nohup hdfs balancer -include node7,node9,node10,node11 -threshold 10 > balancer.log &

平衡指定節(jié)點(diǎn),磁盤平衡目標(biāo)數(shù),啟動(dòng)線程數(shù)為10 nohup hdfs balancer -include node7,node9,node10,node11 -threshold 10 -idleiterations 10 > balancer.log &

注(可選):一般在平衡時(shí),可以先停止存儲(chǔ)比較高的節(jié)點(diǎn)上的NodeManager,這樣在該節(jié)點(diǎn)上就不會(huì)受本地NodeManager落數(shù)據(jù)到本地,使得本地存儲(chǔ)迅速增加的影響。

yarn-daemon.sh stop nodemanager yarn-daemon.sh start nodemanager

更多關(guān)于HDFS免重啟掛載新磁盤的文章請(qǐng)查看下面的相關(guān)鏈接

相關(guān)文章

  • 完美解決IIS和APACHE的301重定向(帶參數(shù))

    完美解決IIS和APACHE的301重定向(帶參數(shù))

    感覺BAIDU spider對(duì)404的重定向似乎無動(dòng)于衷,于是近日干脆對(duì)原失效的鏈接重新設(shè)置301重定向。
    2010-11-11
  • win2003服務(wù)器一招廢掉所有木馬(防提權(quán))

    win2003服務(wù)器一招廢掉所有木馬(防提權(quán))

    木馬的危害,在于它能夠遠(yuǎn)程控制你的電腦。當(dāng)你成為“肉雞”的時(shí)候,別人(控制端)就可以進(jìn)入你的電腦,偷看你的文件、盜竊密碼、甚至用你的QQ發(fā)一些亂七八糟的東西給你的好友
    2012-03-03
  • Chat2DB?Web版?服務(wù)器端安裝部署啟動(dòng)步驟

    Chat2DB?Web版?服務(wù)器端安裝部署啟動(dòng)步驟

    Chat2DB是款數(shù)據(jù)庫連接工具,主要就是使用JDBC做數(shù)據(jù)庫連接,外加多對(duì)接了幾個(gè)聊天AI網(wǎng)站,把數(shù)據(jù)庫和AI做了個(gè)集成,比使用傳統(tǒng)工具Navicat,再另外去AI查方便一點(diǎn),這篇文章主要介紹了Chat2DB?Web版?服務(wù)器端安裝部署啟動(dòng)流程,需要的朋友可以參考下
    2023-11-11
  • 服務(wù)器的MSDTC不可用解決辦法

    服務(wù)器的MSDTC不可用解決辦法

    MSDTC(分布式交易協(xié)調(diào)器),協(xié)調(diào)跨多個(gè)數(shù)據(jù)庫、消息隊(duì)列、文件系統(tǒng)等資源管理器的事務(wù)。該服務(wù)的進(jìn)程名為Msdtc.exe,該進(jìn)程調(diào)用系統(tǒng)Microsoft Personal Web Server和Microsoft SQL Server。該服務(wù)用于管理多個(gè)服務(wù)器
    2015-07-07
  • Tomcat 啟動(dòng)錯(cuò)誤(8080端口被占用)處理方法

    Tomcat 啟動(dòng)錯(cuò)誤(8080端口被占用)處理方法

    8080端口被占用的解決方法,其實(shí)這個(gè)方法,可以用于其它一些端口被占用的問題。
    2009-07-07
  • 用 Win2003 架設(shè)郵件服務(wù)器 圖文詳解

    用 Win2003 架設(shè)郵件服務(wù)器 圖文詳解

    很多企業(yè)局域網(wǎng)內(nèi)都架設(shè)了郵件服務(wù)器,用于進(jìn)行公文發(fā)送和工作交流。但使用專業(yè)的企業(yè)郵件系統(tǒng)軟件需要大量的資金投入,這對(duì)于很多企業(yè)來說是無法承受的
    2012-10-10
  • 游戲服務(wù)器中的Netty應(yīng)用以及源碼剖析

    游戲服務(wù)器中的Netty應(yīng)用以及源碼剖析

    這篇文章主要為大家介紹了游戲服務(wù)器中的Netty應(yīng)用以及源碼剖析,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2022-08-08
  • Windows10下hyperledger fabric1.4環(huán)境搭建過程圖解

    Windows10下hyperledger fabric1.4環(huán)境搭建過程圖解

    這篇文章主要介紹了Windows10下hyperledger fabric1.4環(huán)境搭建過程,本文圖文并茂給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2019-10-10
  • VPS服務(wù)器常用性能測試腳本匯總

    VPS服務(wù)器常用性能測試腳本匯總

    這篇文章主要介紹了VPS服務(wù)器常用性能測試腳本匯總,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-11-11
  • Apache,IIS下Discuz x1.5偽靜態(tài)設(shè)置方法

    Apache,IIS下Discuz x1.5偽靜態(tài)設(shè)置方法

    有時(shí)候我們?cè)诩僭O(shè)論壇的時(shí)候,為了優(yōu)化搜索引擎收錄效果,需要設(shè)為偽靜態(tài),除了后臺(tái)的設(shè)置,也需要服務(wù)器支持,下面的具體的實(shí)現(xiàn)方法,
    2011-05-05

最新評(píng)論