Hadoop中namenode和secondarynamenode工作機制講解
1)流程
2)FSImage和Edits
nodenode是HDFS的大腦,它維護著整個文件系統(tǒng)的目錄樹,以及目錄樹里所有的文件和目錄,這些信息以倆種文件存儲在文件系統(tǒng):一種是命名空間鏡像(也稱為文件系統(tǒng)鏡像,File System Image,FSImage),即HDFS元數據的完整快照,每次NameNode啟動的時候,默認會加載最新的命名空間鏡像,另一種是命令空間鏡像的編輯日志(Edit log)。
FSImage文件其實是文件系統(tǒng)元數據的一個永久性檢查點,但并非每一個寫操作都會更新這個文件,因為FSImage是一個大型文件,如果頻繁地執(zhí)行寫操作,會使系統(tǒng)運行極為緩慢。解決方案是NameNode只將改動內容預寫日志,即寫入命名空間鏡像的編輯日志.隨著時間的推移,編輯日志會變得越來越大,那么一旦發(fā)生故障,將會話費非常多的時間來回滾操作,所以就像傳統(tǒng)的關系數據庫一樣,需要定期地合并FSImage和編輯日志。如果由NameNode來做合并操作,那么NameNode在為集群提供服務時可能無法提供足夠的資源,為了徹底解決這一問題,SecondaryNameNode應允而生。
3)第一階段:namenode 啟動
- (1)第一次啟動 namenode 格式化后,創(chuàng)建 fsimage 和 edits 文件。如果不是第一次啟動,直接加載編輯日志和鏡像文件到內存。
- (2)客戶端對元數據進行增刪改的請求。
- (3)namenode 記錄操作日志,更新滾動日志。
- (4)namenode 在內存中對數據進行增刪改查。
4)第二階段:Secondary NameNode 工作
- (1)Secondary NameNode 詢問 namenode 是否需要 checkpoint。直接帶回 namenode 是否檢查結果。
- (2)Secondary NameNode 請求執(zhí)行 checkpoint。
- (3)Secondary NameNode引導namenode 滾動更新編輯正在寫的 edits 日志。
- (4) Secondary NameNode載入FSImage文件,回放編輯日志,將其合并到FSImage,將新的FSImage文件壓縮后寫入磁盤。
- (5)拷貝 fsimage到 namenode。
- (6)namenode 將 fsimage重新命名成 fsimage。
默認情況下,該過程每小時發(fā)生一次,或者當NameNode的編輯日志文件到達默認的64MB也會觸發(fā)。
總結
以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對腳本之家的支持。如果你想了解更多相關內容請查看下面相關鏈接
相關文章
詳解百度https認證提示"請將您的http站點301重定向到https站點"的解決辦法
對于301重定向這一概念玩SEO的同志們都不陌生了,近些年來https協(xié)議越來越火,百度大大已經明確了對https的扶持政策,這篇文章主要介紹了詳解百度https認證提示"請將您的http站點301重定向到https站點"的解決辦法,感興趣的小伙伴們可以參考一下2018-12-12GitLab?Pipeline規(guī)范及流程觸發(fā)詳解
這篇文章主要為大家介紹了GitLab?Pipeline規(guī)范及流程觸發(fā)詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2023-04-04IBM X346 板載 Raid1 功能啟用及Win2003系統(tǒng)安裝小記
有兩臺IBM X346 m/t-8840-cdr 服務器,板載raid控制器版本號為v.4.30.9,硬盤位0,1各裝一塊146G IBM 原裝SCSI硬盤。2011-04-04iis、apache、nginx使用X-Frame-Options防止網頁被Frame的解決方法
X-Frame-Options HTTP響應頭是用來確認是否瀏覽器可以在frame或iframe標簽中渲染一個頁面,網站可以用這個頭來保證他們的內容不會被嵌入到其它網站中2017-03-03