腳本之家服務(wù)器常用軟件

快捷導(dǎo)航

Flink實(shí)踐Savepoint使用示例詳解

更新時(shí)間：2022年07月27日 11:19:07 作者：Flink 實(shí)戰(zhàn)演練

這篇文章主要為大家介紹了Flink實(shí)踐Savepoint使用示例詳解，有需要的朋友可以借鑒參考下，希望能夠有所幫助，祝大家多多進(jìn)步，早日升職加薪

一、背景

什么是 savepoint，為什么要使用 savepoint ？

保障 flink 作業(yè)在配置迭代、flink 版本升級(jí)、藍(lán)綠部署中的數(shù)據(jù)一致性，提高容錯(cuò)、降低恢復(fù)時(shí)間；

在此之前引入幾個(gè)概念：

Snapshot 狀態(tài)快照

Flink 通過(guò)狀態(tài)快照實(shí)現(xiàn)容錯(cuò)處理

Flink 中的狀態(tài)： keyed state, operator state ..
Flink 中的狀態(tài)后端：A. 狀態(tài)數(shù)據(jù)如何存？B. 運(yùn)行時(shí)存在哪里？C. 狀態(tài)快照保存在哪？

注1：自 1.13 版本之后，設(shè)置 Working State 和設(shè)置 Snapshot State 拆離成了兩個(gè)接口，便于讀者更易于理解；

StateBackend

CheckpointStorage

注2：一般默認(rèn)使用 FsStateBackend，運(yùn)行時(shí)狀態(tài)放在堆中保障性能，快照備份時(shí)數(shù)據(jù)存于 Hdfs 保障容錯(cuò)性；當(dāng)業(yè)務(wù)有大狀態(tài)的 flink 作業(yè)存在時(shí)，可以通過(guò)配置化的方式將用戶(hù)作業(yè)的狀態(tài)后端設(shè)置為 RocksDBSateBackend。

分布式快照

Checkpoint – a snapshot taken automatically by Flink for the purpose of being able to recover from faults. Checkpoints can be incremental, and are optimized for being restored quickly.

Alignment checkpoint

Unaligment checkpoint

未對(duì)齊的 checkpoint 確保障礙物盡快到達(dá)接收器。

適用于至少有一條緩慢移動(dòng)的數(shù)據(jù)路徑的應(yīng)用程序，避免對(duì)齊時(shí)間過(guò)長(zhǎng)。然而，
會(huì)增加了額外的輸入/輸出壓力，會(huì)造成 checkpoint size 的增加，當(dāng)狀態(tài)后后端 IO 有瓶頸時(shí)，不合適；

注：一般默認(rèn)使用 Alignment checkpoint；當(dāng)出現(xiàn)被壓時(shí)，一般優(yōu)先采用

1. 優(yōu)化邏輯 2. 增加并發(fā)能力的方式進(jìn)行處理；

Checkpoint & Savepoint

Checkpoint 使 Flink 的狀態(tài)具有良好的容錯(cuò)性，通過(guò) checkpoint 機(jī)制，F(xiàn)link 可以對(duì)作業(yè)的狀態(tài)和計(jì)算位置進(jìn)行恢復(fù)。

Savepoint 是依據(jù) Flink checkpointing 機(jī)制所創(chuàng)建的流作業(yè)執(zhí)行狀態(tài)的一致鏡像；

Checkpoint 的主要目的是為意外失敗的作業(yè)提供恢復(fù)機(jī)制(如 tm/jm 進(jìn)程掛了)。
Checkpoint 的生命周期由 Flink 管理，即 Flink 創(chuàng)建，管理和刪除 Checkpoint - 無(wú)需用戶(hù)交互。
Savepoint 由用戶(hù)創(chuàng)建，擁有和刪除。他們的用例是計(jì)劃的，手動(dòng)備份和恢復(fù)。
Savepoint 應(yīng)用場(chǎng)景，升級(jí) Flink 版本，調(diào)整用戶(hù)邏輯，改變并行度，以及進(jìn)行紅藍(lán)部署等。 Savepoint 更多地關(guān)注可移植性和對(duì)前面提到的作業(yè)更改的支持。

除去這些概念上的差異，Checkpoint 和 Savepoint 的當(dāng)前實(shí)現(xiàn)基本上使用相同的代碼并生成相同的格式（rocksDB 增量 checkpoint 除外，未來(lái)可能有更多類(lèi)似的實(shí)現(xiàn)）

二、Flink on yarn 如何使用 savepoint

觸發(fā) savepoint 保留到 hdfs, 在重新調(diào)度作業(yè)時(shí)，提供給用戶(hù)選擇即可。

關(guān)鍵點(diǎn)：執(zhí)行 savepoint 需要指定 jobId，因此在設(shè)計(jì)數(shù)據(jù)平臺(tái)的元數(shù)據(jù)時(shí)，需要保留 jobId 數(shù)據(jù)。

使用 YARN 觸發(fā) Savepoint #
$ bin/flink savepoint :jobId [:targetDirectory] -yid :yarnAppId
這將觸發(fā) ID 為 :jobId 和 YARN 應(yīng)用程序 ID :yarnAppId 的作業(yè)的 Savepoint，并返回創(chuàng)建的 Savepoint 的路徑。
使用 Savepoint 取消作業(yè) #
$ bin/flink cancel -s [:targetDirectory] :jobId
這將自動(dòng)觸發(fā) ID 為 :jobid 的作業(yè)的 Savepoint，并取消該作業(yè)。此外，你可以指定一個(gè)目標(biāo)文件系統(tǒng)目錄來(lái)存儲(chǔ) Savepoint 。該目錄需要能被 JobManager(s) 和 TaskManager(s) 訪(fǎng)問(wèn)。
從 Savepoint 恢復(fù) #
$ bin/flink run -s :savepointPath [:runArgs]
這將提交作業(yè)并指定要從中恢復(fù)的 Savepoint 。 你可以給出 Savepoint 目錄或 _metadata 文件的路徑。
跳過(guò)無(wú)法映射的狀態(tài)恢復(fù) #
默認(rèn)情況下，resume 操作將嘗試將 Savepoint 的所有狀態(tài)映射回你要還原的程序。 如果刪除了運(yùn)算符，則可以通過(guò) --allowNonRestoredState（short：-n）選項(xiàng)跳過(guò)無(wú)法映射到新程序的狀態(tài)：
$ bin/flink run -s :savepointPath -n [:runArgs]
刪除 Savepoint #
$ bin/flink savepoint -d :savepointPath
這將刪除存儲(chǔ)在 :savepointPath 中的 Savepoint。

附錄：一致性語(yǔ)義

確保精確一次（exactly once）

當(dāng)流處理應(yīng)用程序發(fā)生錯(cuò)誤的時(shí)候，結(jié)果可能會(huì)產(chǎn)生丟失或者重復(fù)。Flink 根據(jù)你為應(yīng)用程序和集群的配置，可以產(chǎn)生以下結(jié)果：

Flink 不會(huì)從快照中進(jìn)行恢復(fù)（at most once）
沒(méi)有任何丟失，但是你可能會(huì)得到重復(fù)冗余的結(jié)果（at least once）
沒(méi)有丟失或冗余重復(fù)（exactly once）

Flink 通過(guò)回退和重新發(fā)送 source 數(shù)據(jù)流從故障中恢復(fù)，當(dāng)理想情況被描述為精確一次時(shí)，這并不意味著每個(gè)事件都將被精確一次處理。相反，這意味著每一個(gè)事件都會(huì)影響 Flink 管理的狀態(tài)精確一次。

Barrier 只有在需要提供精確一次的語(yǔ)義保證時(shí)需要進(jìn)行對(duì)齊（Barrier alignment）。如果不需要這種語(yǔ)義，可以通過(guò)配置 CheckpointingMode.AT_LEAST_ONCE 關(guān)閉 Barrier 對(duì)齊來(lái)提高性能。

端到端精確一次

為了實(shí)現(xiàn)端到端的精確一次，以便 sources 中的每個(gè)事件都僅精確一次對(duì) sinks 生效，必須滿(mǎn)足以下條件：

sources 必須是可重放的，并且
sinks 必須是事務(wù)性的（或冪等的）

以上就是Flink實(shí)踐Savepoint使用示例詳解的詳細(xì)內(nèi)容，更多關(guān)于Flink Savepoint使用的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章！

您可能感興趣的文章:

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

軟件下載

源碼下載

軟件編程

網(wǎng)絡(luò)編程

在線(xiàn)工具

數(shù)據(jù)庫(kù)

CMS

常用工具

Flink實(shí)踐Savepoint使用示例詳解

目錄