jstorm源碼解析之bolt異常處理方法
問題
用過storm或者jstorm的都知道,如果在bolt代碼中發(fā)生了沒被catch住的異常,所在worker進程會退出。本文就從源碼角度分析一下具體設(shè)計,其實并不是“有異常然后進程崩了”這么簡單。
實質(zhì)
我們先看BasicBoltExecutor的源碼:
public void execute(Tuple input) { _collector.setContext(input); try { _bolt.execute(input, _collector); _collector.getOutputter().ack(input); } catch (FailedException e) { if (e instanceof ReportedFailedException) { _collector.reportError(e); } _collector.getOutputter().fail(input); } }
_bolt.execute(input, _collector) 就是執(zhí)行我們自己編寫的bolt里的excute方法。可以看到,在這里,只會catch storm自己定義的FailedException,并且發(fā)送fail消息,標(biāo)記tuple處理失敗, 其余異常則會被放過。
再外層是BoltExecutors的processTupleEvent方法:
try { if (!isSystemBolt && tuple.getSourceStreamId().equals(Common.TOPOLOGY_MASTER_CONTROL_STREAM_ID)) { backpressureTrigger.handle(tuple); } else { bolt.execute(tuple); } } catch (Throwable e) { error = e; LOG.error("bolt execute error ", e); report_error.report(e); }
在這里,所有異常都會被catch住,但是只會進行report_error,并不會發(fā)fail消息,相關(guān)tuple只能等超時才能被標(biāo)記為失敗。
再來看report_error.report(e) 的具體實現(xiàn),通過看構(gòu)造函數(shù),可以看到report_error是一個TaskReportErrorAndDie類,
@Override public void report(Throwable error) { this.reporterror.report(error); this.haltfn.run(); }
在這里,reporterror是一個AsyncLoopDefaultKill類
@Override public void run() { JStormUtils.halt_process(1, "Async loop died!"); }
這里就是整個過程的最終步驟了, JStormUtils.halt_process()方法會打印一條"Async loop died!"的日志后將worker進程殺死。
思考
通過代碼可以出來,對于jstorm,“異常后worker退出”是一個故意設(shè)計出的特性,并非程序不健壯。猜測這一塊的設(shè)計理念就是對于已知異常,開發(fā)人員自己捕獲并重新拋出FailedException,使相應(yīng)消息失?。晃粗惓t強制使進程直接失敗退出,避免過度的catch導(dǎo)致問題被掩蓋。
不過雖然話是這么說,對這個設(shè)計還是持保留意見,畢竟storm和普通的java程序不一樣,storm的worker進程在退出后是會自動被重啟的,所以這種異常處理方式并不能起到failfast的效果。
相反,worker的持續(xù)重啟,還會帶來一些其他問題。再一個,不主動將消息標(biāo)為失敗,而是等超時,如果設(shè)置的超時時間過長(當(dāng)然超時時間太長也不合理),也會引入一些問題。比如說kafkaSpout, 一條消息沒被ack之前是不會繼續(xù)取后邊的數(shù)據(jù)的,這樣如果有一條數(shù)據(jù)需要等超時,同分區(qū)下的數(shù)據(jù)在這一個超時周期內(nèi),就都無法被處理了。
從另一方面來說,如果像FailedException一樣處理其他所有異常,由于異常之后可以看到有數(shù)據(jù)fail,也并不會掩蓋問題。
所以說,這一塊的處理邏輯,個人感覺還是需要斟酌一下。
以上這篇jstorm源碼解析之bolt異常處理方法就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
學(xué)習(xí)Spring-Session+Redis實現(xiàn)session共享的方法
本篇文章主要介紹了學(xué)習(xí)Spring-Session+Redis實現(xiàn)session共享的方法,具有一定的參考價值,感興趣的小伙伴們可以參考一下2017-05-05通過Feign進行調(diào)用@FeignClient?找不到的解決方案
這篇文章主要介紹了通過Feign進行調(diào)用@FeignClient?找不到的解決方案,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-03-03Java調(diào)用Python腳本傳遞數(shù)據(jù)并返回計算結(jié)果
實際工程項目中可能會用到Java和python兩種語言結(jié)合進行,這樣就會涉及到一個問題,Java如何調(diào)用Python腳本,感興趣的可以了解一下2021-05-05Spring?Boot和Vue前后端分離項目架構(gòu)的全過程
前后端分離是目前互聯(lián)網(wǎng)開發(fā)中比較廣泛使用的開發(fā)模式,主要是將前端和后端的項目業(yè)務(wù)進行分離,下面這篇文章主要給大家介紹了關(guān)于Spring?Boot和Vue前后端分離項目架構(gòu)的相關(guān)資料,需要的朋友可以參考下2022-04-04