Flink部署集群整體架構(gòu)源碼分析
概覽
本篇我們來了解Flink的部署模式和Flink集群的整體架構(gòu)
部署模式
Flink支持如下三種運行模式
運行模式 | 描述 |
---|---|
Application Mode | Flink Cluster只執(zhí)行提交的整個job,然后退出;main方法在cluster中執(zhí)行;支持yarn和k8s;官方建議yarn和k8s上的運行方式 |
pre-job mode | Flink Cluster只執(zhí)行提交的整個job,然后退出;main方法在client中執(zhí)行;支持yarn;官方建議yarn上運行方式, 該模式在Flink 1.15中被廢棄了,建議用application mode |
session mode | 支持在一個Flink Cluster中提交多個任務(wù);main方法在client中執(zhí)行;支持yarn和k8s |
Flink的部署步驟分為如下2步:
- 部署啟動一個Flink Cluster,負責(zé)接收job提交請求和管理job信息;
- 向Flink Cluster提交job; 根據(jù)Flink Cluster可以運行的任務(wù)的數(shù)量(1個或多個)和提交job請求的地點(遠端或Cluster端)的不同,從而有了不同的運行模式。由于pre-job模式已經(jīng)被廢棄了,下面我們主要來學(xué)習(xí)下Application mode和session mode
Application mode
Application mode是Flink Cluster運行1個job,提交任務(wù)的地點為Cluster端。其提交方式如下
./bin/flink run-application -t yarn-application ./examples/streaming/TopSpeedWindowing.jar
其處理流程為,客戶端提交部署請求,服務(wù)端啟動Flink Cluster, 服務(wù)端運行Flink Application提交Job到Cluster。下面我們分析下具體實現(xiàn)細節(jié)。
客戶端提交請求
通過flink命令提交請求,其運行的類為CliFrontend。為支持部署到不同的資源管理平臺,所以有和對應(yīng)資源管理系統(tǒng)交互的類,具體如下:
- CliFrontend:flink命令對應(yīng)的類,發(fā)起提交請求,后面session mode的提交Flink Application也是由該類負責(zé)
- ClusterClientFactory:集群客戶端工廠類,負責(zé)生成不同資源管理平臺的客戶端
- ClusterDescriptor:負責(zé)和對應(yīng)的資源管理平臺交互,申請資源和提交請求
- ClusterEntrypoint:在資源管理平臺運行的類,啟動Flink Cluster。 針對不同資源管理平臺的對應(yīng)實現(xiàn)類如下:
接口類 | yarn | kubernates |
---|---|---|
ClusterClientFactory | YarnClusterClientFactory | KubernetesClusterClientFactory |
ClusterDescriptor | YarnClusterDescriptor | KubernetesClusterDescriptor |
ClusterEntrypoint | YarnApplicationClusterEntryPoint | KubernetesApplicationClusterEntrypoint |
服務(wù)端啟動&提交Application
服務(wù)端啟動對應(yīng)的ClusterEntrypoint,其中會啟動一個REST Server來接受提交Flink Application,另外有個Dispatcher負責(zé)作業(yè)的調(diào)度,其他部分后面我們分析運行流程時再展開介紹。作業(yè)的提交請求是在Dispatcher中的DispatcherBootstrap屬性實例化的時候觸發(fā)。 Flink Application運行時,是在StreamExecutionEnvironment.execute()方法來觸發(fā)實際提交,提交相關(guān)的調(diào)用鏈如下:
這幾個都是接口類,在Application模式下對應(yīng)的實現(xiàn)類如下
接口類 | 實現(xiàn)類 |
---|---|
PipelineExecutorServiceLoader | EmbeddedExecutorServiceLoader |
PipelineExecutorFactory | EmbeddedExecutorFactory |
PipelineExecutor | EmbeddedExecutor |
session mode
session mode是一個Flink Cluster可以來運行多個Flink job。那這里的提交會分為2個步驟
// 提交啟動session cluster // yarn session ./bin/yarn-session.sh --detached // kubernates session ./bin/kubernetes-session.sh -Dkubernetes.cluster-id=my-first-flink-cluster // 提交job ./bin/flink run ./examples/streaming/TopSpeedWindowing.jar
- 通過yarn-session.sh (或kubernates-session.sh) 來提交部署Flink Cluster,這塊和前面application mode類似,以yarn模式為例,底層也是調(diào)用了YarnClusterDescriptor來提交相應(yīng)的請求,提交到服務(wù)器的是YarnSessionClusterEntrypoint類。
- 提交Job,這塊是在client端來單獨提交的,直接提交信息到服務(wù)器的REST Server,根據(jù)提交的目標(biāo)資源管理系統(tǒng)的不同,使用了不同的實現(xiàn)類
接口類 | 實現(xiàn)類yarn | 實現(xiàn)類kubernates |
---|---|---|
PipelineExecutorServiceLoader | DefaultExecutorServiceLoader | DefaultExecutorServiceLoader |
PipelineExecutorFactory | YarnSessionClusterExecutorFactory | YarnSessionClusterExecutorFactory |
PipelineExecutor | YarnSessionClusterExecutor | KubernetesSessionClusterExecutor |
Cluster架構(gòu)
Flink是一個Master/Worker的架構(gòu),Master節(jié)點負責(zé)整個任務(wù)的管理,Worker節(jié)點負責(zé)執(zhí)行對應(yīng)的任務(wù)。其整體結(jié)構(gòu)如下:
* JobManager: Master節(jié)點的統(tǒng)稱,目前版本沒有該類,其中有幾個重點的服務(wù),如上圖所示,目前的代碼中對應(yīng)的組合了這些服務(wù)的類為:
Dispatcher
ResourceManager
Component。
* Dispatcher: Job調(diào)度器,負責(zé)接收Job的提交,保存Job和管理JobMaster來執(zhí)行作業(yè)。前面我們提到的提交作業(yè)到Cluster,實際上是提交給了Dispatcher的。
* ResourceManager: 負責(zé)和不同的資源調(diào)度系統(tǒng)交互,管理資源申請。
* WebMonitorEndpoint: 負責(zé)web界面的Rest請求處理
* JobMaster: 負責(zé)運行單個JobGraph,包括TaskManager的管理,任務(wù)的調(diào)度等。
* TaskManager: 負責(zé)任務(wù)的執(zhí)行,也沒有TaskManager的類,對應(yīng)的類為TaskExecutor,來執(zhí)行多個Task
說明:JobManager可能是原來的JobMaster,具體通過Dispatcher.java的如下代碼可以看出,重點在對其具體結(jié)構(gòu)的理解,這個變化的邏輯我們就不考究了。
private JobManagerRunner createJobMasterRunner(JobGraph jobGraph) throws Exception
Cluster的啟動流程
上面介紹了Cluster的整體架構(gòu),接下來我們看看Cluster的啟動流程。以Application mode部署到Y(jié)arn為例(其他模式的啟動類似,只是啟動的主類不同)。該方式下的主類為:YarnApplicationClusterEntryPoint,其內(nèi)部調(diào)用了ClusterEntrypoint的方法,最終是通過ClusterEntrypoint類的runCluster()方法來創(chuàng)建DispatcherResourceManagerComponent對象。
DispatcherResourceManagerComponent
接下來我們看看DispatcherResourceManagerComponent中的具體屬性信息
@Nonnull private final DispatcherRunner dispatcherRunner; @Nonnull private final ResourceManagerService resourceManagerService; @Nonnull private final RestService webMonitorEndpoint; @Nonnull private final LeaderRetrievalService dispatcherLeaderRetrievalService; @Nonnull private final LeaderRetrievalService resourceManagerRetrievalService;
Runner代碼
這里我們并沒有看到Dispatcher,而是一個類似名字的DispatcherRunner.DispatcherRunner是來管理Dispatcher如何運行的。類似ResourceManagerService是來管理ResourceManager的生命周期的。
HA代碼框架
另外由于這些服務(wù)都有雙機容錯機制(HA), 所以這里在看相關(guān)代碼的時候會產(chǎn)生一定的干擾,本篇的最后我們來介紹下這塊HA的相關(guān)的機制,這樣對大家來梳理相關(guān)的流程會更清晰。 Leader的選舉,是通過LeaderElectionService(選舉服務(wù),實現(xiàn)類為DefaultLeaderElectionService)和LeaderContender(競選者)共同來完成的。具體過程為LeaderElectionService.start(LeaderContender),啟動選舉服務(wù),傳入LeaderContender信息,等選舉成功后,會回調(diào)LeaderContender的grantLeadership()方法,F(xiàn)link中相關(guān)的服務(wù)都實現(xiàn)了LeaderContender接口。所以理清這個邏輯后,我們在看到相關(guān)服務(wù)的start()方法中只調(diào)用了leaderElectionService.start方法時也不用懵了,直接看該服務(wù)的grantLeadership方法來梳理邏輯。 LeaderElectionDriver:進行Leader的選舉和保存Leader的信息,具體的實現(xiàn)有ZooKeeperLeaderElectionDriver和KubernetesLeaderElectionDriver
那如何獲取Leader的地址呢,也提供了相應(yīng)的接口LeaderRetrievalService和LeaderRetrievalLister,啟動一個對Leader地址的監(jiān)聽,leader有變化時會得到通知。
總結(jié)
本篇我們了解了Flink的部署模式,按Job提交方式和一個集群可同時運行任務(wù)的數(shù)量的不同,分為ApplicationMode和SessionMode2種模式。接著介紹了Cluster的整體架構(gòu)和啟動流程,主要包括Dispatcher、ResourceManager和WebMonitorEndpoint。最后介紹了HA處理的整體框架,便于大家更好的梳理核心流程。
以上就是Flink部署集群整體架構(gòu)源碼分析的詳細內(nèi)容,更多關(guān)于Flink部署集群架構(gòu)的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
java多線程CountDownLatch與線程池ThreadPoolExecutor/ExecutorService案
這篇文章主要介紹了java多線程CountDownLatch與線程池ThreadPoolExecutor/ExecutorService案例,2021-02-02基于SpringBoot整合SSMP案例(開啟日志與分頁查詢條件查詢功能實現(xiàn))
這篇文章主要介紹了基于SpringBoot整合SSMP案例(開啟日志與分頁查詢條件查詢功能實現(xiàn)),本文通過實例代碼給大家介紹的非常詳細,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋參考下吧2023-11-11