分布式系統(tǒng)下調(diào)用鏈追蹤技術(shù)面試題
引言
一個復(fù)雜的分布式系統(tǒng),用戶發(fā)起一個請求,這個請求可能調(diào)用幾十到幾百個服務(wù),經(jīng)過很多業(yè)務(wù)層,而每個業(yè)務(wù)又是多個機器集群,一個請求具體被隨機到哪臺機器上又無法確定,如果最后用戶的請求失敗,只返回一個錯誤提示,作為開發(fā)人員,該如何定位解決問題?你需要定位以下問題:
- 問題出在哪個服務(wù),是你負(fù)責(zé)的服務(wù)還是調(diào)用別人服務(wù)的某一個環(huán)節(jié)。
- 同一個服務(wù)集群有多臺機器,到底要去哪個機房哪臺機器定位某條報錯信息。
- 同一個接口可能有多次請求,到底是哪一次報錯了。
- 多個服務(wù)之間調(diào)用順序是怎樣的。
- 如果需要響應(yīng)速度優(yōu)化,到底是哪個環(huán)節(jié)哪個服務(wù)耗時了,如何定位。
1、面試官:
分布式微服務(wù)環(huán)境下那么多機器,調(diào)用鏈又很長,你們是如何定位問題的?
問題分析:這個問題,如果你使用過微服務(wù)框架,對于服務(wù)治理你一定知道這種技術(shù),如果作為微服務(wù)架構(gòu)的小白,你只是知道一些基礎(chǔ)知識,突然被問到這個問題,確實比較懵逼。這么多機器集群,我怎么知道每次服務(wù)打到哪個機器上了,我怎么知道到底是哪個環(huán)節(jié)拋異常了?
我:分布式系統(tǒng)中針對上述問題,我們急需一套鏈路追蹤(Trace)系統(tǒng)來解決這些痛點,這個系統(tǒng)主要的任務(wù)就是收集各服務(wù)的日志,上報日志,分析日志,保存展示。其關(guān)鍵核心在于調(diào)用鏈,為每個請求生成全局唯一的ID(Traceld),通過Traceld 將不同系統(tǒng)的“孤立地”調(diào)用信息關(guān)聯(lián)在一起,還原出更多有價值的數(shù)據(jù)。
(如果你還不明白到底怎么搞直接看看成品圖)
通過一個Trace查詢某一次請求,這個Trace是全劇唯一,通過這個鏈路追蹤系統(tǒng),你可以清楚的知道服務(wù)調(diào)用深度,涉及服務(wù)個數(shù),每個服務(wù)調(diào)用的時間及狀態(tài),到底是哪個服務(wù)出現(xiàn)異常,具體到方法名,查找耗時長的鏈路時,可以通過在查詢結(jié)果頁面點擊“耗時”二字,讓數(shù)據(jù)以耗時升序或降序排列,都一目了然,上面的問題都得到解決了。
2、面試官:
你知道哪些成熟的調(diào)用鏈開源工具?
Google Dapper
Dapper一開始是一個自包含的跟蹤工具,但后來發(fā)展成為一個監(jiān)控平臺,具有高性能,代碼侵入性低,支持集群擴展特性。
dapper 處理日志分為3個階段:
- 各個服務(wù)將span數(shù)據(jù)寫到本機日志上;
- dapper守護進程進行拉取日志文件,將文件讀到dapper收集器里;
- dapper收集器將結(jié)果寫到bigtable中,一次跟蹤被記錄為一行。
阿里巴巴的分布式調(diào)用跟蹤系統(tǒng) - 鷹眼(EagleEye)
EagleEye 是一個以調(diào)用鏈追蹤技術(shù)為核心的監(jiān)控系統(tǒng),通過收集,存儲,分析分布式系統(tǒng)中的調(diào)用事件參數(shù),協(xié)同開發(fā)人員進行故障定位,容量預(yù)估,性能瓶頸定位,系統(tǒng)請求鏈路梳理等,EagleEye 的開發(fā)也是基于Google Dapper 的設(shè)計思想。
圖片來源:github EagleEye 社區(qū)
美團分布式會話追蹤系統(tǒng) - MTrace
MTrace是美團點評內(nèi)部的分布式會話跟蹤系統(tǒng),也借鑒了2010年Google的 dapper,通過一個全局的ID將分布在各個服務(wù)節(jié)點上的同一次請求串聯(lián)起來,還原原有的調(diào)用關(guān)系、追蹤系統(tǒng)問題、分析調(diào)用數(shù)據(jù)、統(tǒng)計系統(tǒng)指標(biāo),MTrace支持美團內(nèi)部RPC中間件,HTTP中間件,MySQL,Tair,MQ等中間件的數(shù)據(jù)埋點。
總結(jié)
無論哪個公司使用哪個框架,我們發(fā)現(xiàn) trace 系統(tǒng)最終要解決的問題都是相同的,大致歸納如下:
- 復(fù)雜網(wǎng)絡(luò)環(huán)境中定位問題,通過異常log綁定記錄,輕松定位。
- 發(fā)現(xiàn)熱點,發(fā)現(xiàn)瓶頸問題。
- 預(yù)估系統(tǒng)容量,按照上下游調(diào)用比例,粗略計算哪些機器需要提前擴容。
- 優(yōu)化鏈路,通過鏈路分析,從更高的全局角度分析可以優(yōu)化的點。
以上就是分布式系統(tǒng)下調(diào)用鏈追蹤技術(shù)面試題的詳細內(nèi)容,更多關(guān)于分布式系統(tǒng)下調(diào)用鏈追蹤的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
springboot+gradle 構(gòu)建多模塊項目的步驟
這篇文章主要介紹了springboot+gradle 構(gòu)建多模塊項目的步驟,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2018-05-05SpringBoot?使用?Sa-Token?完成注解鑒權(quán)功能(權(quán)限校驗)
Sa-Token?是一個輕量級?java?權(quán)限認(rèn)證框架,主要解決登錄認(rèn)證、權(quán)限認(rèn)證、單點登錄、OAuth2、微服務(wù)網(wǎng)關(guān)鑒權(quán)?等一系列權(quán)限相關(guān)問題,這篇文章主要介紹了SpringBoot使用Sa-Token完成注解鑒權(quán)功能,需要的朋友可以參考下2023-05-05SpringBoot雪花算法主鍵ID傳到前端后精度丟失問題的解決
本文主要介紹了SpringBoot雪花算法主鍵ID傳到前端后精度丟失問題的解決,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2022-08-08Java 實戰(zhàn)范例之線上新聞平臺系統(tǒng)的實現(xiàn)
讀萬卷書不如行萬里路,只學(xué)書上的理論是遠遠不夠的,只有在實戰(zhàn)中才能獲得能力的提升,本篇文章手把手帶你用java+jsp+jdbc+mysql實現(xiàn)一個線上新聞平臺系統(tǒng),大家可以在過程中查缺補漏,提升水平2021-11-11