分布式系統(tǒng)下調(diào)用鏈追蹤技術(shù)面試題
引言
一個復(fù)雜的分布式系統(tǒng),用戶發(fā)起一個請求,這個請求可能調(diào)用幾十到幾百個服務(wù),經(jīng)過很多業(yè)務(wù)層,而每個業(yè)務(wù)又是多個機(jī)器集群,一個請求具體被隨機(jī)到哪臺機(jī)器上又無法確定,如果最后用戶的請求失敗,只返回一個錯誤提示,作為開發(fā)人員,該如何定位解決問題?你需要定位以下問題:
- 問題出在哪個服務(wù),是你負(fù)責(zé)的服務(wù)還是調(diào)用別人服務(wù)的某一個環(huán)節(jié)。
- 同一個服務(wù)集群有多臺機(jī)器,到底要去哪個機(jī)房哪臺機(jī)器定位某條報(bào)錯信息。
- 同一個接口可能有多次請求,到底是哪一次報(bào)錯了。
- 多個服務(wù)之間調(diào)用順序是怎樣的。
- 如果需要響應(yīng)速度優(yōu)化,到底是哪個環(huán)節(jié)哪個服務(wù)耗時了,如何定位。
1、面試官:
分布式微服務(wù)環(huán)境下那么多機(jī)器,調(diào)用鏈又很長,你們是如何定位問題的?
問題分析:這個問題,如果你使用過微服務(wù)框架,對于服務(wù)治理你一定知道這種技術(shù),如果作為微服務(wù)架構(gòu)的小白,你只是知道一些基礎(chǔ)知識,突然被問到這個問題,確實(shí)比較懵逼。這么多機(jī)器集群,我怎么知道每次服務(wù)打到哪個機(jī)器上了,我怎么知道到底是哪個環(huán)節(jié)拋異常了?
我:分布式系統(tǒng)中針對上述問題,我們急需一套鏈路追蹤(Trace)系統(tǒng)來解決這些痛點(diǎn),這個系統(tǒng)主要的任務(wù)就是收集各服務(wù)的日志,上報(bào)日志,分析日志,保存展示。其關(guān)鍵核心在于調(diào)用鏈,為每個請求生成全局唯一的ID(Traceld),通過Traceld 將不同系統(tǒng)的“孤立地”調(diào)用信息關(guān)聯(lián)在一起,還原出更多有價值的數(shù)據(jù)。
(如果你還不明白到底怎么搞直接看看成品圖)

通過一個Trace查詢某一次請求,這個Trace是全劇唯一,通過這個鏈路追蹤系統(tǒng),你可以清楚的知道服務(wù)調(diào)用深度,涉及服務(wù)個數(shù),每個服務(wù)調(diào)用的時間及狀態(tài),到底是哪個服務(wù)出現(xiàn)異常,具體到方法名,查找耗時長的鏈路時,可以通過在查詢結(jié)果頁面點(diǎn)擊“耗時”二字,讓數(shù)據(jù)以耗時升序或降序排列,都一目了然,上面的問題都得到解決了。
2、面試官:
你知道哪些成熟的調(diào)用鏈開源工具?
Google Dapper
Dapper一開始是一個自包含的跟蹤工具,但后來發(fā)展成為一個監(jiān)控平臺,具有高性能,代碼侵入性低,支持集群擴(kuò)展特性。
dapper 處理日志分為3個階段:
- 各個服務(wù)將span數(shù)據(jù)寫到本機(jī)日志上;
- dapper守護(hù)進(jìn)程進(jìn)行拉取日志文件,將文件讀到dapper收集器里;
- dapper收集器將結(jié)果寫到bigtable中,一次跟蹤被記錄為一行。
阿里巴巴的分布式調(diào)用跟蹤系統(tǒng) - 鷹眼(EagleEye)
EagleEye 是一個以調(diào)用鏈追蹤技術(shù)為核心的監(jiān)控系統(tǒng),通過收集,存儲,分析分布式系統(tǒng)中的調(diào)用事件參數(shù),協(xié)同開發(fā)人員進(jìn)行故障定位,容量預(yù)估,性能瓶頸定位,系統(tǒng)請求鏈路梳理等,EagleEye 的開發(fā)也是基于Google Dapper 的設(shè)計(jì)思想。


圖片來源:github EagleEye 社區(qū)
美團(tuán)分布式會話追蹤系統(tǒng) - MTrace
MTrace是美團(tuán)點(diǎn)評內(nèi)部的分布式會話跟蹤系統(tǒng),也借鑒了2010年Google的 dapper,通過一個全局的ID將分布在各個服務(wù)節(jié)點(diǎn)上的同一次請求串聯(lián)起來,還原原有的調(diào)用關(guān)系、追蹤系統(tǒng)問題、分析調(diào)用數(shù)據(jù)、統(tǒng)計(jì)系統(tǒng)指標(biāo),MTrace支持美團(tuán)內(nèi)部RPC中間件,HTTP中間件,MySQL,Tair,MQ等中間件的數(shù)據(jù)埋點(diǎn)。
總結(jié)
無論哪個公司使用哪個框架,我們發(fā)現(xiàn) trace 系統(tǒng)最終要解決的問題都是相同的,大致歸納如下:
- 復(fù)雜網(wǎng)絡(luò)環(huán)境中定位問題,通過異常log綁定記錄,輕松定位。
- 發(fā)現(xiàn)熱點(diǎn),發(fā)現(xiàn)瓶頸問題。
- 預(yù)估系統(tǒng)容量,按照上下游調(diào)用比例,粗略計(jì)算哪些機(jī)器需要提前擴(kuò)容。
- 優(yōu)化鏈路,通過鏈路分析,從更高的全局角度分析可以優(yōu)化的點(diǎn)。
以上就是分布式系統(tǒng)下調(diào)用鏈追蹤技術(shù)面試題的詳細(xì)內(nèi)容,更多關(guān)于分布式系統(tǒng)下調(diào)用鏈追蹤的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
Idea啟動多個SpringBoot項(xiàng)目的3種最新方案
SpringBoot自帶Tomcat,直接運(yùn)行main方法里面的SpringApplication.run即可,并且訪問時不需要帶項(xiàng)目名,這篇文章主要介紹了Idea啟動多個SpringBoot項(xiàng)目的3種方案,需要的朋友可以參考下2023-02-02
springboot+gradle 構(gòu)建多模塊項(xiàng)目的步驟
這篇文章主要介紹了springboot+gradle 構(gòu)建多模塊項(xiàng)目的步驟,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2018-05-05
SpringBoot?使用?Sa-Token?完成注解鑒權(quán)功能(權(quán)限校驗(yàn))
Sa-Token?是一個輕量級?java?權(quán)限認(rèn)證框架,主要解決登錄認(rèn)證、權(quán)限認(rèn)證、單點(diǎn)登錄、OAuth2、微服務(wù)網(wǎng)關(guān)鑒權(quán)?等一系列權(quán)限相關(guān)問題,這篇文章主要介紹了SpringBoot使用Sa-Token完成注解鑒權(quán)功能,需要的朋友可以參考下2023-05-05
SpringBoot雪花算法主鍵ID傳到前端后精度丟失問題的解決
本文主要介紹了SpringBoot雪花算法主鍵ID傳到前端后精度丟失問題的解決,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2022-08-08
Java 實(shí)戰(zhàn)范例之線上新聞平臺系統(tǒng)的實(shí)現(xiàn)
讀萬卷書不如行萬里路,只學(xué)書上的理論是遠(yuǎn)遠(yuǎn)不夠的,只有在實(shí)戰(zhàn)中才能獲得能力的提升,本篇文章手把手帶你用java+jsp+jdbc+mysql實(shí)現(xiàn)一個線上新聞平臺系統(tǒng),大家可以在過程中查缺補(bǔ)漏,提升水平2021-11-11
Java精品項(xiàng)目瑞吉外賣之新增菜品與分頁查詢篇
這篇文章主要為大家詳細(xì)介紹了java精品項(xiàng)目-瑞吉外賣訂餐系統(tǒng),此項(xiàng)目過大,分為多章獨(dú)立講解,本篇內(nèi)容為新增菜品和分頁查詢功能的實(shí)現(xiàn),文中示例代碼介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們可以參考一下2022-05-05
java的Map集合中按value值進(jìn)行排序輸出的實(shí)例代碼
下面小編就為大家?guī)硪黄猨ava的Map集合中按value值進(jìn)行排序輸出的實(shí)例代碼。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2016-08-08

