Flink部署集群整體架構(gòu)源碼分析
概覽
本篇我們來了解Flink的部署模式和Flink集群的整體架構(gòu)
部署模式
Flink支持如下三種運(yùn)行模式
運(yùn)行模式 | 描述 |
---|---|
Application Mode | Flink Cluster只執(zhí)行提交的整個(gè)job,然后退出;main方法在cluster中執(zhí)行;支持yarn和k8s;官方建議yarn和k8s上的運(yùn)行方式 |
pre-job mode | Flink Cluster只執(zhí)行提交的整個(gè)job,然后退出;main方法在client中執(zhí)行;支持yarn;官方建議yarn上運(yùn)行方式, 該模式在Flink 1.15中被廢棄了,建議用application mode |
session mode | 支持在一個(gè)Flink Cluster中提交多個(gè)任務(wù);main方法在client中執(zhí)行;支持yarn和k8s |
Flink的部署步驟分為如下2步:
- 部署啟動(dòng)一個(gè)Flink Cluster,負(fù)責(zé)接收job提交請(qǐng)求和管理job信息;
- 向Flink Cluster提交job; 根據(jù)Flink Cluster可以運(yùn)行的任務(wù)的數(shù)量(1個(gè)或多個(gè))和提交job請(qǐng)求的地點(diǎn)(遠(yuǎn)端或Cluster端)的不同,從而有了不同的運(yùn)行模式。由于pre-job模式已經(jīng)被廢棄了,下面我們主要來學(xué)習(xí)下Application mode和session mode
Application mode
Application mode是Flink Cluster運(yùn)行1個(gè)job,提交任務(wù)的地點(diǎn)為Cluster端。其提交方式如下
./bin/flink run-application -t yarn-application ./examples/streaming/TopSpeedWindowing.jar
其處理流程為,客戶端提交部署請(qǐng)求,服務(wù)端啟動(dòng)Flink Cluster, 服務(wù)端運(yùn)行Flink Application提交Job到Cluster。下面我們分析下具體實(shí)現(xiàn)細(xì)節(jié)。
客戶端提交請(qǐng)求
通過flink命令提交請(qǐng)求,其運(yùn)行的類為CliFrontend。為支持部署到不同的資源管理平臺(tái),所以有和對(duì)應(yīng)資源管理系統(tǒng)交互的類,具體如下:
- CliFrontend:flink命令對(duì)應(yīng)的類,發(fā)起提交請(qǐng)求,后面session mode的提交Flink Application也是由該類負(fù)責(zé)
- ClusterClientFactory:集群客戶端工廠類,負(fù)責(zé)生成不同資源管理平臺(tái)的客戶端
- ClusterDescriptor:負(fù)責(zé)和對(duì)應(yīng)的資源管理平臺(tái)交互,申請(qǐng)資源和提交請(qǐng)求
- ClusterEntrypoint:在資源管理平臺(tái)運(yùn)行的類,啟動(dòng)Flink Cluster。 針對(duì)不同資源管理平臺(tái)的對(duì)應(yīng)實(shí)現(xiàn)類如下:
接口類 | yarn | kubernates |
---|---|---|
ClusterClientFactory | YarnClusterClientFactory | KubernetesClusterClientFactory |
ClusterDescriptor | YarnClusterDescriptor | KubernetesClusterDescriptor |
ClusterEntrypoint | YarnApplicationClusterEntryPoint | KubernetesApplicationClusterEntrypoint |
服務(wù)端啟動(dòng)&提交Application
服務(wù)端啟動(dòng)對(duì)應(yīng)的ClusterEntrypoint,其中會(huì)啟動(dòng)一個(gè)REST Server來接受提交Flink Application,另外有個(gè)Dispatcher負(fù)責(zé)作業(yè)的調(diào)度,其他部分后面我們分析運(yùn)行流程時(shí)再展開介紹。作業(yè)的提交請(qǐng)求是在Dispatcher中的DispatcherBootstrap屬性實(shí)例化的時(shí)候觸發(fā)。 Flink Application運(yùn)行時(shí),是在StreamExecutionEnvironment.execute()方法來觸發(fā)實(shí)際提交,提交相關(guān)的調(diào)用鏈如下:
這幾個(gè)都是接口類,在Application模式下對(duì)應(yīng)的實(shí)現(xiàn)類如下
接口類 | 實(shí)現(xiàn)類 |
---|---|
PipelineExecutorServiceLoader | EmbeddedExecutorServiceLoader |
PipelineExecutorFactory | EmbeddedExecutorFactory |
PipelineExecutor | EmbeddedExecutor |
session mode
session mode是一個(gè)Flink Cluster可以來運(yùn)行多個(gè)Flink job。那這里的提交會(huì)分為2個(gè)步驟
// 提交啟動(dòng)session cluster // yarn session ./bin/yarn-session.sh --detached // kubernates session ./bin/kubernetes-session.sh -Dkubernetes.cluster-id=my-first-flink-cluster // 提交job ./bin/flink run ./examples/streaming/TopSpeedWindowing.jar
- 通過yarn-session.sh (或kubernates-session.sh) 來提交部署Flink Cluster,這塊和前面application mode類似,以yarn模式為例,底層也是調(diào)用了YarnClusterDescriptor來提交相應(yīng)的請(qǐng)求,提交到服務(wù)器的是YarnSessionClusterEntrypoint類。
- 提交Job,這塊是在client端來單獨(dú)提交的,直接提交信息到服務(wù)器的REST Server,根據(jù)提交的目標(biāo)資源管理系統(tǒng)的不同,使用了不同的實(shí)現(xiàn)類
接口類 | 實(shí)現(xiàn)類yarn | 實(shí)現(xiàn)類kubernates |
---|---|---|
PipelineExecutorServiceLoader | DefaultExecutorServiceLoader | DefaultExecutorServiceLoader |
PipelineExecutorFactory | YarnSessionClusterExecutorFactory | YarnSessionClusterExecutorFactory |
PipelineExecutor | YarnSessionClusterExecutor | KubernetesSessionClusterExecutor |
Cluster架構(gòu)
Flink是一個(gè)Master/Worker的架構(gòu),Master節(jié)點(diǎn)負(fù)責(zé)整個(gè)任務(wù)的管理,Worker節(jié)點(diǎn)負(fù)責(zé)執(zhí)行對(duì)應(yīng)的任務(wù)。其整體結(jié)構(gòu)如下:
* JobManager: Master節(jié)點(diǎn)的統(tǒng)稱,目前版本沒有該類,其中有幾個(gè)重點(diǎn)的服務(wù),如上圖所示,目前的代碼中對(duì)應(yīng)的組合了這些服務(wù)的類為:
Dispatcher
ResourceManager
Component。
* Dispatcher: Job調(diào)度器,負(fù)責(zé)接收J(rèn)ob的提交,保存Job和管理JobMaster來執(zhí)行作業(yè)。前面我們提到的提交作業(yè)到Cluster,實(shí)際上是提交給了Dispatcher的。
* ResourceManager: 負(fù)責(zé)和不同的資源調(diào)度系統(tǒng)交互,管理資源申請(qǐng)。
* WebMonitorEndpoint: 負(fù)責(zé)web界面的Rest請(qǐng)求處理
* JobMaster: 負(fù)責(zé)運(yùn)行單個(gè)JobGraph,包括TaskManager的管理,任務(wù)的調(diào)度等。
* TaskManager: 負(fù)責(zé)任務(wù)的執(zhí)行,也沒有TaskManager的類,對(duì)應(yīng)的類為TaskExecutor,來執(zhí)行多個(gè)Task
說明:JobManager可能是原來的JobMaster,具體通過Dispatcher.java的如下代碼可以看出,重點(diǎn)在對(duì)其具體結(jié)構(gòu)的理解,這個(gè)變化的邏輯我們就不考究了。
private JobManagerRunner createJobMasterRunner(JobGraph jobGraph) throws Exception
Cluster的啟動(dòng)流程
上面介紹了Cluster的整體架構(gòu),接下來我們看看Cluster的啟動(dòng)流程。以Application mode部署到Y(jié)arn為例(其他模式的啟動(dòng)類似,只是啟動(dòng)的主類不同)。該方式下的主類為:YarnApplicationClusterEntryPoint,其內(nèi)部調(diào)用了ClusterEntrypoint的方法,最終是通過ClusterEntrypoint類的runCluster()方法來創(chuàng)建DispatcherResourceManagerComponent對(duì)象。
DispatcherResourceManagerComponent
接下來我們看看DispatcherResourceManagerComponent中的具體屬性信息
@Nonnull private final DispatcherRunner dispatcherRunner; @Nonnull private final ResourceManagerService resourceManagerService; @Nonnull private final RestService webMonitorEndpoint; @Nonnull private final LeaderRetrievalService dispatcherLeaderRetrievalService; @Nonnull private final LeaderRetrievalService resourceManagerRetrievalService;
Runner代碼
這里我們并沒有看到Dispatcher,而是一個(gè)類似名字的DispatcherRunner.DispatcherRunner是來管理Dispatcher如何運(yùn)行的。類似ResourceManagerService是來管理ResourceManager的生命周期的。
HA代碼框架
另外由于這些服務(wù)都有雙機(jī)容錯(cuò)機(jī)制(HA), 所以這里在看相關(guān)代碼的時(shí)候會(huì)產(chǎn)生一定的干擾,本篇的最后我們來介紹下這塊HA的相關(guān)的機(jī)制,這樣對(duì)大家來梳理相關(guān)的流程會(huì)更清晰。 Leader的選舉,是通過LeaderElectionService(選舉服務(wù),實(shí)現(xiàn)類為DefaultLeaderElectionService)和LeaderContender(競(jìng)選者)共同來完成的。具體過程為L(zhǎng)eaderElectionService.start(LeaderContender),啟動(dòng)選舉服務(wù),傳入LeaderContender信息,等選舉成功后,會(huì)回調(diào)LeaderContender的grantLeadership()方法,F(xiàn)link中相關(guān)的服務(wù)都實(shí)現(xiàn)了LeaderContender接口。所以理清這個(gè)邏輯后,我們?cè)诳吹较嚓P(guān)服務(wù)的start()方法中只調(diào)用了leaderElectionService.start方法時(shí)也不用懵了,直接看該服務(wù)的grantLeadership方法來梳理邏輯。 LeaderElectionDriver:進(jìn)行Leader的選舉和保存Leader的信息,具體的實(shí)現(xiàn)有ZooKeeperLeaderElectionDriver和KubernetesLeaderElectionDriver
那如何獲取Leader的地址呢,也提供了相應(yīng)的接口LeaderRetrievalService和LeaderRetrievalLister,啟動(dòng)一個(gè)對(duì)Leader地址的監(jiān)聽,leader有變化時(shí)會(huì)得到通知。
總結(jié)
本篇我們了解了Flink的部署模式,按Job提交方式和一個(gè)集群可同時(shí)運(yùn)行任務(wù)的數(shù)量的不同,分為ApplicationMode和SessionMode2種模式。接著介紹了Cluster的整體架構(gòu)和啟動(dòng)流程,主要包括Dispatcher、ResourceManager和WebMonitorEndpoint。最后介紹了HA處理的整體框架,便于大家更好的梳理核心流程。
以上就是Flink部署集群整體架構(gòu)源碼分析的詳細(xì)內(nèi)容,更多關(guān)于Flink部署集群架構(gòu)的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
java多線程CountDownLatch與線程池ThreadPoolExecutor/ExecutorService案
這篇文章主要介紹了java多線程CountDownLatch與線程池ThreadPoolExecutor/ExecutorService案例,2021-02-02Request對(duì)象如何獲取請(qǐng)求頭數(shù)據(jù)
這篇文章主要介紹了Request對(duì)象如何獲取請(qǐng)求頭數(shù)據(jù)問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2024-07-07基于SpringBoot整合SSMP案例(開啟日志與分頁(yè)查詢條件查詢功能實(shí)現(xiàn))
這篇文章主要介紹了基于SpringBoot整合SSMP案例(開啟日志與分頁(yè)查詢條件查詢功能實(shí)現(xiàn)),本文通過實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋參考下吧2023-11-11分析Java非阻塞算法Lock-Free的實(shí)現(xiàn)
非阻塞算法一般會(huì)使用CAS來協(xié)調(diào)線程的操作。雖然非阻塞算法有諸多優(yōu)點(diǎn),但是在實(shí)現(xiàn)上要比基于鎖的算法更加繁瑣和負(fù)責(zé)。本文將會(huì)介紹兩個(gè)是用非阻塞算法實(shí)現(xiàn)的數(shù)據(jù)結(jié)構(gòu)。2021-06-06JAVA實(shí)現(xiàn)圖書管理系統(tǒng)項(xiàng)目
相信每一個(gè)學(xué)生學(xué)編程的時(shí)候,應(yīng)該都會(huì)寫一個(gè)小項(xiàng)目——圖書管理系統(tǒng)。為什么這么說呢?我認(rèn)為一個(gè)學(xué)校的氛圍很大一部分可以從圖書館的氛圍看出來,而圖書管理系統(tǒng)這個(gè)不大不小的項(xiàng)目,接觸的多,也比較熟悉,不會(huì)有陌生感,能夠練手,又有些難度,所以我的小項(xiàng)目也來了2021-10-10Java中的CAS無鎖機(jī)制實(shí)現(xiàn)原理詳解
這篇文章主要介紹了Java中的CAS無鎖機(jī)制實(shí)現(xiàn)原理詳解,無鎖機(jī)制,是樂觀鎖的一種實(shí)現(xiàn),并發(fā)情況下保證對(duì)共享變量值更改的原子性,CAS是Java中Unsafe類里面的方法,底層通過調(diào)用C語言接口,再通過cup硬件指令保證原子性,需要的朋友可以參考下2024-01-01