checkpoint 機(jī)制具體實(shí)現(xiàn)示例詳解
checkpoint 機(jī)制的具體實(shí)現(xiàn)
我們都知道為了優(yōu)化分布式存儲(chǔ)系統(tǒng)中 NameNode 的重啟性能,我們引進(jìn)了 checkpoint 機(jī)制和 FsImage 快照,使得 FsImage 和 editslog 共同為系統(tǒng)元數(shù)據(jù)提供持久化功能。
那么我們今天就來學(xué)習(xí)一下,checkpoint 機(jī)制具體應(yīng)該要怎么實(shí)現(xiàn)??
BackNode 節(jié)點(diǎn)冷備份
NameNode 的主要工作時(shí)維護(hù)系統(tǒng)中文件元數(shù)據(jù),并實(shí)現(xiàn)其持久化;在每執(zhí)行一個(gè)操作之后,NameNode 都要生成一個(gè) editslog,最后刷盤(但是不是每生成一條數(shù)據(jù)就刷盤一次)。
從這我們可以發(fā)現(xiàn),NameNode 進(jìn)程,它需要額外分配出來一個(gè)線程,后臺(tái)線程定時(shí)的去進(jìn)行磁盤IO的操作,其實(shí)這個(gè)是很影響本地 CPU 負(fù)載的;另外,假設(shè)這時(shí)候來了很多操作請(qǐng)求,那么系統(tǒng)中將有大量的線程用來來更新內(nèi)存的文件目錄樹,這時(shí)候肯定是要加鎖的了。此時(shí)如果系統(tǒng)還要每隔一段時(shí)間,耗費(fèi)比如說幾秒鐘,甚至幾分鐘的時(shí)間來對(duì)文件目錄樹進(jìn)行加鎖,讀取數(shù)據(jù),寫入本地磁盤;這樣就會(huì)導(dǎo)致更新文件目錄樹,和讀取文件目錄樹寫入磁盤,它們之間會(huì)產(chǎn)生巨大的鎖的沖突。
如果上述所有操作都在 NameNode 上執(zhí)行的話,就太影響 NameNode 節(jié)點(diǎn)的性能了。
為此,我們需要考慮給系統(tǒng)中增加一個(gè)角色——BackNode,其實(shí)它的功能就有點(diǎn)像 HDFS 中的 SecondaryNameNode。
BackNode 是充當(dāng)于 NameNode 的一個(gè)冷備份的角色,我們可以將 checkpoint 的操作交給其來執(zhí)行,這樣就可以減輕 NameNode 這邊的性能消耗了。
checkpoint 的實(shí)現(xiàn)
BackNode 在啟動(dòng)的時(shí)候會(huì)啟動(dòng)一個(gè) checkpoint 的調(diào)度任務(wù):
// 調(diào)度任務(wù):fsImageCheckpointer defaultScheduler.schedule("FSImage Checkpoint操作", fsImageCheckpointer, backupnodeConfig.getCheckpointInterval(), backupnodeConfig.getCheckpointInterval(), TimeUnit.MILLISECONDS);
這是一個(gè)定時(shí)任務(wù),每隔一段時(shí)間就會(huì)被執(zhí)行一次。
下面我們一起來看看 checkpoint 任務(wù)具體需要做些什么?
- 判斷當(dāng)前系統(tǒng)中的 txid 和上一次 checkpoint 時(shí)的是否一致,不一致才繼續(xù)執(zhí)行
- 根據(jù)當(dāng)前系統(tǒng)中的數(shù)據(jù)生成 FsImage
- 處理掉舊的 FsImage
具體代碼如下:
/** * checkpoint 任務(wù) */ @Override public void run() { log.info("BackupNode啟動(dòng)checkpoint后臺(tái)線程."); try { // 如果是正在恢復(fù)元數(shù)據(jù),則直接返回 if (nameSystem.isRecovering()) { log.info("正在恢復(fù)元數(shù)據(jù)..."); return; } // 當(dāng)前 maxid 和 之前記錄的 maxid 相等 if (nameSystem.getMaxTxId() == lastCheckpointTxId) { log.info("EditLog和上次沒有變化,不進(jìn)行checkpoint: [txId={}]", lastCheckpointTxId); return; } // 以下討論的情況是:當(dāng)前 maxid 和 之前記錄的 maxid 不相等(大于) // 對(duì)當(dāng)前內(nèi)存中的數(shù)據(jù)生成快照 FsImage fsImage = nameSystem.getFsImage(); // 更新記錄中的 maxid lastCheckpointTxId = fsImage.getMaxTxId(); // 路徑 String fsImageFile = backupNodeConfig.getFsImageFile(String.valueOf(System.currentTimeMillis())); log.info("開始執(zhí)行checkpoint操作: [maxTxId={}]", fsImage.getMaxTxId()); // 寫入FsImage文件 doCheckpoint(fsImage, fsImageFile); // 上傳 FsImage 給 NameNode uploadFsImage(fsImageFile); // 刪除舊的FSImage namenodeClient.getDefaultScheduler().scheduleOnce("刪除FSImage任務(wù)", fsImageClearTask, 0); } catch (Exception e) { log.error("FSImageCheckPointer error:", e); } }
以上就是checkpoint 機(jī)制具體實(shí)現(xiàn)示例詳解的詳細(xì)內(nèi)容,更多關(guān)于checkpoint 機(jī)制實(shí)現(xiàn)的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
在Mybatis中association標(biāo)簽多層嵌套的問題
這篇文章主要介紹了在Mybatis中association標(biāo)簽多層嵌套的問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-03-03創(chuàng)建SpringBoot工程并集成Mybatis的方法
這篇文章主要介紹了創(chuàng)建SpringBoot工程并集成Mybatis,需要的朋友可以參考下2018-06-06mybatis通過if語句實(shí)現(xiàn)增刪改查操作
這篇文章主要介紹了mybatis通過if語句實(shí)現(xiàn)增刪改查操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2020-11-11springboot 設(shè)置server.port不生效的原因及解決
這篇文章主要介紹了springboot 設(shè)置server.port不生效的原因及解決方案,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-08-08springmvc直接不經(jīng)過controller訪問WEB-INF中的頁面問題
這篇文章主要介紹了springmvc直接不經(jīng)過controller訪問WEB-INF中的頁面問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-02-02詳解JavaScript中的函數(shù)聲明和函數(shù)表達(dá)式
這篇文章主要介紹了詳解JavaScript中的函數(shù)聲明和函數(shù)表達(dá)式,是JS入門學(xué)習(xí)中的基礎(chǔ)知識(shí),需要的朋友可以參考下2015-08-08springboot中server.ssl.key-store配置路徑的問題小結(jié)
這篇文章主要介紹了springboot中server.ssl.key-store配置路徑的問題,文中還記錄了Spring Boot SSL(https)實(shí)例,介紹在web程序中使用自簽名的SSL(HTTPS)證書及創(chuàng)建SSL認(rèn)證,感興趣的朋友跟隨小編一起看看吧2024-02-02idea快速找到項(xiàng)目中對(duì)應(yīng)的類圖文詳解(包括源碼)
用IDEA開發(fā)Java項(xiàng)目時(shí)經(jīng)常會(huì)使用到各種快捷鍵,其中搜索是最常用的之一,下面這篇文章主要給大家介紹了關(guān)于idea如何快速找到項(xiàng)目中對(duì)應(yīng)的類(包括源碼)的相關(guān)資料,文中通過圖文介紹的非常詳細(xì),需要的朋友可以參考下2023-06-06