flink進階富函數(shù)生命周期介紹

end-to-end exactly-once
exactly-once只能保證Flink內部狀態(tài)的一致性。而這個語義主要依賴Checkpoint機制。
在外部交互的一致性則無法保證,端到端的Exactly-Once問題是分布式系統(tǒng)領域最具挑戰(zhàn)性的問題之一,很多框架都在試圖攻克這個難題。
Flink的exactly-once主要依賴Source和Sink提供的一些功能。Source需要支持重發(fā)功能,Sink需要采用一定的數(shù)據(jù)寫入技術,比如冪等寫或事務寫。
對于Source重發(fā)功能,只要我們記錄了輸入的偏移量Offset,故障重啟后數(shù)據(jù)發(fā)送方從該Offset重新開始發(fā)送數(shù)據(jù)即可。Kafka的Producer除了發(fā)送數(shù)據(jù),還會將數(shù)據(jù)持久化寫到日志文件中。如果下游應用重啟,Producer根據(jù)下游提供的Offset,從持久化的文件中定位到數(shù)據(jù),可以重新開始向下游發(fā)送數(shù)據(jù)。
Source的重發(fā)會導致一條數(shù)據(jù)被處理多次,為了保證只對下游系統(tǒng)產(chǎn)生一次影響,還需要依賴Sink的冪等寫或事務寫。
富函數(shù)
“富函數(shù)”是DataStream API提供的一個函數(shù)類的接口,所有Flink函數(shù)類都有其Rich版本。它與常規(guī)函數(shù)的不同在于,可以獲取運行環(huán)境的上下文,并擁有一些生命周期方法,所以可以實現(xiàn)更復雜的功能。
富函數(shù)舉例
**RichMapFunction **
**RichFlatMapFunction **
**RichFilterFunction **
Rich Function有一個生命周期的概念。典型的生命周期方法有:
- open()方法是rich function的初始化方法,當一個算子例如map或者filter被調用之前open()會被調用。
這里可以做一些初始化工作,例如建立一個和數(shù)據(jù)源的連接
- **close()方法是生命周期中的最后一個調用的方法,做一些清理工作。 **
這里做一些清理工作,例如斷開和數(shù)據(jù)源的連接。
- getRuntimeContext()方法提供了函數(shù)的RuntimeContext的一些信息,例如函數(shù)執(zhí)行的并行度,任務的名字,以及state狀態(tài)
其他的和FlatMapFunction算子的重寫方法類似。
以上就是flink進階富函數(shù)生命周期介紹的詳細內容,更多關于flink 富函數(shù)生命周期的資料請關注腳本之家其它相關文章!
相關文章
使用google.kaptcha來生成圖片驗證碼的實現(xiàn)方法
這篇文章主要介紹了使用google.kaptcha來生成圖片驗證碼的實現(xiàn)方法,非常不錯具有一定的參考借鑒價值,需要的朋友可以參考下2018-09-09
spring MVC + bootstrap實現(xiàn)文件上傳示例(帶進度條)
本篇文章主要介紹了spring MVC + bootstrap實現(xiàn)文件上傳示例(帶進度條),非常具有使用價值,有需要的朋友可以了解一下。2017-03-03
java文件下載設置中文名稱的實例(response.addHeader)
下面小編就為大家分享一篇java文件下載設置中文名稱的實例(response.addHeader),具有很好的參考價值,希望對大家有所幫助2017-12-12
MyBatis學習教程(八)-Mybatis3.x與Spring4.x整合圖文詳解
這篇文章主要介紹了MyBatis學習教程(八)-Mybatis3.x與Spring4.x整合圖文詳解的相關資料,需要的朋友可以參考下2016-05-05

