排除路由故障的常見方法
一 靜態(tài)路由故障
1. 靜態(tài)路由和有類別查找
當(dāng)路由選擇表進(jìn)程檢查一條使用中間地址(路由選擇表中作為下一跳引用的IP地址)的可解析的靜態(tài)路由時(shí),這個(gè)檢查總是在有類別方式下完成的,無論是否使用ip classless命令如果在路由選擇表中有類別方式下的中間地址不能解析,則刪除該靜態(tài)路由。
使用show ip route查看路由選擇表。
使用debug 可以顯示某個(gè)網(wǎng)絡(luò)宕掉了。
如果使用無類別方式并有一條默認(rèn)路由存在,那么具有高管理距離的備份表態(tài)路由將永遠(yuǎn)不會在主靜態(tài)路由失效時(shí)裝入到路由選擇表中。這是因?yàn)槿魏戊o態(tài)路由,即便是指向不存在的中間地址的靜態(tài)路由,都會使用默認(rèn)路由進(jìn)行解析。
CISCO路由選擇表進(jìn)程每60S調(diào)用一個(gè)檢查路由選擇表的靜態(tài)路由功能來根據(jù)動(dòng)態(tài)變化的路由選擇表安裝或刪除靜態(tài)路由。
2.靜態(tài)路由和中間地址
靜態(tài)路由可以使用中間網(wǎng)絡(luò)地址或出接口來創(chuàng)建。大多數(shù)情況下,使用出接口在路由選擇表進(jìn)程中解析靜態(tài)路由更加有效。
只要中間IP地址可以在路由選擇表中解析,它不必是真實(shí)的下一跳路由器的接口。靜態(tài)網(wǎng)絡(luò)路由(如中間地址)必須最終被解析為路由選擇表中一條具有出接口的路由。
每當(dāng)路由選擇表進(jìn)程需要為x.x.x.0/24網(wǎng)絡(luò)使用靜態(tài)路由表項(xiàng)時(shí),它還需要解析中間地址y.y.y.y,稱為遞歸查找。一次額外的路由查找或許對路由選擇進(jìn)程的性能沒有多少影響。但是,采取多次遞歸查找來獲得解析的靜態(tài)路由可能會影響性能。
3.靜態(tài)路由優(yōu)化
為避免遞歸查找: 串行網(wǎng)絡(luò):使用出接口
以太網(wǎng)絡(luò):同時(shí)使用中間地址和出接口
4.反復(fù)的靜態(tài)路由安裝和刪除
盡可能地使用出接口而不是中間地址來配置靜態(tài)路由。
5.使用丟棄路由
有時(shí)網(wǎng)絡(luò)中有環(huán)路的產(chǎn)生。通過周期性的查看路由器接口上的計(jì)數(shù)器可以看到路由選擇環(huán)路的結(jié)果。
clear counters serial0/0
show interface serial0/0
路由環(huán)路的問題在網(wǎng)絡(luò)中產(chǎn)生了一個(gè)黑洞。一旦IP頭中的生存期(TTL)減到0就丟棄分組。
解決1:有類別模式的路由選擇(no ip classless)——在用戶網(wǎng)絡(luò)路由器上使用no ip classless.路由器在至少一個(gè)已知子網(wǎng)存在時(shí)不會使用任何超網(wǎng)或默認(rèn)路由。但不是首選。因?yàn)樗淖兞怂蟹纸M的路由選擇表查找行為。
解決2:使用一條丟棄路由——當(dāng)路由選擇表中沒有特定的匹配,而且使用一條超網(wǎng)或默認(rèn)路由來轉(zhuǎn)發(fā)那些分組并不合適時(shí),一條丟棄路由把分組送給了null0,即比特桶。
ip route x.x.0.0 255.255.0.0 null0
ip route x.x.0.0 255.255.0.0 null0 200
后一個(gè)命令行配置僅在主路由失效時(shí)使用的另一條丟棄路由。通過將靜態(tài)路由的默認(rèn)管理距離改為比所使用的動(dòng)態(tài)路由選擇協(xié)議的管理距離更高的一個(gè)值來實(shí)現(xiàn)。
二 排除RIP故障
1.不兼容的版本類型
debug ip rip
show ip protocols 對檢查接口上發(fā)送和接收的RIP分組版本十分有用。
如果R1不支持V2的版本,只能接收RIPv1分組,那么R2配置成RIPv1和RIPv2.
可在接口級指定發(fā)送和接收RIP分組的特定版本
interface e0
ip rip send version 1 2
ip rip receive version 1 2
2.不匹配的認(rèn)證密鑰
RIPv2的一個(gè)選項(xiàng)是可以認(rèn)證的RIPv2更新,為了增強(qiáng)安全性,當(dāng)使用認(rèn)證時(shí),必須在雙方配置口令。這個(gè)口令被稱為認(rèn)證密鑰。如果這一密鑰與另一方的密鑰不匹配,雙方都將忽略RIPv2更新。
在接口上配置ip rip authentication key-chain cisco
用debug ip rip調(diào)試。
3.達(dá)到RIP的路數(shù)限制
RIP度量標(biāo)準(zhǔn)的最大值是15跳。
無法克服這個(gè)問題??梢允褂梅?5跳限制的路由選擇協(xié)議。IGRP最大跳數(shù)是255,EIGRP最大跳數(shù)是224,二者默認(rèn)都是100.
4.不連續(xù)網(wǎng)絡(luò)
當(dāng)主網(wǎng)絡(luò)被另一個(gè)主網(wǎng)絡(luò)分隔開時(shí),被稱為不連續(xù)網(wǎng)絡(luò)。
解決1:使用靜態(tài)路由
解決2:在路由器之間的鏈路地址改為左右不連續(xù)網(wǎng)絡(luò)中的一部分。
解決3:在兩臺路由器上用no auto-summary配置啟用RIPv2的無類別路由選擇版本。
router rip
version 2
network x.x.x.0
no auto-summary
解決4:使用無類別路由選擇協(xié)議。如OSPF,EIGRP,IS-IS替代RIPv1路由選擇協(xié)議。
5.不合法的源地址
當(dāng)RIP告訴路由選擇表安裝路由時(shí),它執(zhí)行源合法性檢查。如果源所在子網(wǎng)與本地接口不同,RIP則忽略更新并且不在路由選擇表中安裝從這個(gè)源來的路由。
當(dāng)一方是有編號而另一方是無編號時(shí),必須關(guān)閉這個(gè)檢查。
router rip
no validate-update-source
6.翻動(dòng)(flapping)路由
路由翻動(dòng)是指路由選擇表中一條路由的不斷刪除和再插入。為了檢查路由是否真的翻動(dòng),檢查路由選擇表并查看路由的壽命(age)。如果壽命被不斷的重置為00:00:00,這就意味這路由正在翻動(dòng)。
RIP有180S沒有收到一條路由,那么該路由將保持240S,然后被清除。
使用show interface來檢查接口統(tǒng)計(jì)值。
最常見幀中繼環(huán)境分組丟失。
使用show ip route rip可以檢查RIP多久沒有更新。
使用show interface serial 0可查看到接口上有大量的廣播分組是否被丟棄。幀中繼情況下,可能需要調(diào)整幀中繼廣播隊(duì)列。在非幀中繼的環(huán)境中,可能需要增加輸入或輸出保留隊(duì)列。
7.大型路由選擇表
接口上使用ip summary-address匯總路由。
三 排除EIGRP故障
1.不匹配的K值
EIGRP為了建立它的鄰居關(guān)系,計(jì)算EIGRP度量標(biāo)準(zhǔn)的K常數(shù)值必須相同。
K1-帶寬 K2-負(fù)載 K3-延遲 K4,K5-可靠性
router eigrp 1
network x.x.x.x
metric weights 0 1 1 1 1 0
2.不匹配的AS編號
EIGRP不會與具有不同自治系統(tǒng)編號的路由器形成任何鄰居關(guān)系。
3.活動(dòng)粘滯
(1)確定問題
可能的原因有:
。 壞的或擁塞的鏈路;
。 低的路由器資源,如路由器上的低內(nèi)存和高CPU處理。
。 長的查詢范圍
。 過多的冗余
默認(rèn)活動(dòng)粘滯定時(shí)器只有180S.
使用show ip eigrp topology active 命令幫助故障排除EIGRP活動(dòng)粘滯錯(cuò)誤,僅在問題發(fā)生時(shí)有用,用戶一次只有180S的時(shí)間來確定。鄰居有一個(gè)r跟在后面表示它沒有應(yīng)答查詢。
(2)故障排除方法
追蹤查詢,一跳接一跳,在每一跳找出活動(dòng)路由的狀態(tài)。
(3)最終解決方案
盡可能手工匯總路由并有一個(gè)分層次的網(wǎng)絡(luò)設(shè)計(jì)。EIGRP匯總的網(wǎng)絡(luò)越多,主收斂發(fā)生時(shí)需要做的事情越少。
4.重復(fù)的路由ID
EIGRP只是為了外部路由而使用路由器ID的概念來防止環(huán)路。EIGRP基于路由器上回環(huán)接口的最大IP地址來選擇路由器ID.如果路由器沒有回環(huán)接口,則選擇所有接口中最大的激活I(lǐng)P地址作為EIGRP的路由器ID.
debug ip eigrp可以看到接口上通告某個(gè)網(wǎng)絡(luò)。
經(jīng)驗(yàn)法則:永遠(yuǎn)不要在網(wǎng)絡(luò)的兩個(gè)地方配置相同的IP地址。
四 排除OSPF故障
1.不匹配的參數(shù)
使用debug ip ospf adj命令能夠看到大多數(shù)的不匹配問題。
(1)hello/dead間隔不匹配——匹配才可以形成鄰居。
(2)不匹配的認(rèn)證類型——OSPF下有MD5和純文本認(rèn)證。
router ospf 1
area 0 authentication message-digest
network x.x.0.0 0.0.255.255 area 0
(3)不匹配的區(qū)域ID——區(qū)域信息在OSPF的HELLO分組中發(fā)送。不同,不會形成鄰接。
(4)不匹配的短截/傳輸/NSSA區(qū)域選項(xiàng)——當(dāng)OSPF與一個(gè)鄰居交換HELLO分組時(shí),它所交換的一項(xiàng)內(nèi)容是由8比特表示的可選能力。選項(xiàng)字段之一是E比特,即OSPF短截標(biāo)志。當(dāng)E比特置0時(shí),該路由關(guān)聯(lián)的區(qū)域是一個(gè)短截區(qū)域,外部LSA不允許進(jìn)入這個(gè)區(qū)域。
2.OSPF狀態(tài)問題
成為鄰居的路由器不保證交換鏈路狀態(tài)更新。一旦路由器決定與一個(gè)鄰居形成鄰接,它就開始交換其鏈路狀態(tài)數(shù)據(jù)庫的一份完整拷貝。
(1)OSPF陷入ATTEMPT——僅對neighbor語句的NBMA網(wǎng)絡(luò)有效。陷入ATTEMPT是指一臺路由器試圖通過發(fā)送它的HELLO來聯(lián)系鄰居但是它沒有收到響應(yīng)。
show ip ospf neighbor查看。
原因:錯(cuò)誤配置neighbor;NBMA上的單播連通性斷了,這可能是由錯(cuò)誤的DLCI,訪問列表或轉(zhuǎn)換單播的NAT引起的。
(2)OSPF陷入INIT——INIT狀態(tài)表示路由器收到來自鄰居的HELLO分組,但是雙向通信并沒有建立 .
原因:
。 一方訪問列表阻止了HELLO;
。 一方的多播能力失效(一個(gè)交換機(jī)故障);
。 僅在一方啟用了認(rèn)證;
。 一方的frame-relay map/dialer map語句缺少了broadcast關(guān)鍵字。
。 一方的HELLO在第2層丟失了。
(3)OSPF陷入2-WAY——雙向狀態(tài)是指路由器在HELLO分組的鄰居字段中見到了自己的路由器ID.類似于所有路由器的優(yōu)先級都為0,則不會發(fā)生選舉,所有路由器停留在雙向狀態(tài)中。
解決:確保至少一臺路由器具有一個(gè)至少為1的IP OSPF優(yōu)先級。
(4)OSPF陷入EXSTART/EXCHANGE——在EXSTART或EXCHANGE狀態(tài)的OSPF鄰居正處于嘗試交換DBD(數(shù)據(jù)庫描述)分組的過程中。
原因:
。 不匹配的接口MTU
。 鄰居上重復(fù)的路由器ID
。 無法用超過特定MTU 長度進(jìn)行PING
。 斷掉的單播連通性,它可能是因?yàn)殄e(cuò)誤的DLCI,訪問列表或轉(zhuǎn)換單播的NAT
(5)OSPF陷入LOADING——鄰居沒有應(yīng)答或鄰居的應(yīng)答從未到達(dá)本地路由器,路由器也會陷入LOADING狀態(tài)。常有"%OSPF-4-BADLSA"控制臺信息。
原因:
。 不匹配的MTU
。 錯(cuò)誤的鏈路狀態(tài)請求分組
3.點(diǎn)到點(diǎn)鏈路的一方是無編號的
interface s0
ip unnumbered loopback0
解決:雙方都需要成為一個(gè)有編號點(diǎn)到點(diǎn)鏈路或一個(gè)無編號點(diǎn)到點(diǎn)鏈路。
4.ABR沒有產(chǎn)生一個(gè)類型4的匯總LSA
類型4的匯總LSA的一個(gè)功能是宣告到其他區(qū)域的ASBR的可達(dá)性。如果同一個(gè)區(qū)域中存在ASBR則不需要類型4的LSA.
show ip ospf database external 命令的輸出顯示在路由器的外部OSPF數(shù)據(jù)庫中是否存在路由。
show ip ospf database asbr-summary 命令的輸出顯示路由是否有類型4的LSA.
檢查R是否真是ABR.如果是,則產(chǎn)生類型3或類型4的匯總LSA.show ip ospf
5.轉(zhuǎn)發(fā)地址不能通過區(qū)域內(nèi)或區(qū)域間路由獲知
當(dāng)OSPF獲得一條外部LSA時(shí),它在將該路由裝入路由選擇表之前要確定轉(zhuǎn)發(fā)地址可通過一條OSPF區(qū)域內(nèi)或區(qū)域間路由獲知。如果轉(zhuǎn)發(fā)地址不能通過區(qū)域內(nèi)或區(qū)域間路由獲知,OSPF不會將路由裝入路由選擇表中。
有可能的解決:
。 不在ABR上進(jìn)行匯總
。 在ASBR上過濾再分布入OSPF中的直接子網(wǎng)
router ospf 1
redistribute rip subnets
6.路由匯總問題
兩種類型匯總:
。 可執(zhí)行在ABR上的區(qū)域間路由匯總
。 可執(zhí)行在ASBR上的外部路由匯總
(1)區(qū)域間匯總
router ospf 1
area 3 range x.x.x.0 255.255.255.0
通過show ip ospf可以查看
(2)外部匯總
router ospf 1
summary-address x.0.0.0 255.0.0.0
7.CPUHOG問題
產(chǎn)生在:。 鄰居形成過程
。 LSA刷新過程
8.SPF計(jì)算和路由翻動(dòng)
只要拓?fù)溆凶兓?,OSPF就運(yùn)行SPF算法再次計(jì)算最短路徑優(yōu)先樹。,可能引起鏈路的不穩(wěn)定。
原因:
。 區(qū)域內(nèi)的接口翻動(dòng)
。 區(qū)域內(nèi)的鄰居接口翻動(dòng)
。 重復(fù)的路由器ID
使用show ip ospf命令可查看在一個(gè)給定區(qū)域中SPF算法運(yùn)行的次數(shù);
使用debug ip ospf monitor來隔離一個(gè)翻動(dòng)的LSA;
使用show log命令顯示由接口引起的翻動(dòng)。
解決:
。 修復(fù)正在翻動(dòng)的鏈路
。 重新定義區(qū)域邊界
五 排除IS-IS故障
1.IS-IS鄰接問題
通常由鏈路故障和配置錯(cuò)誤引起。
show clns neighbors 顯示所有希望與被調(diào)查的路由器成為鄰接的鄰居
debug isis adj-packets 命令來調(diào)試
2.部分或所有鄰接沒有形成
步驟1——檢查鏈路故障。show ip interface brief
步驟2——檢查配置錯(cuò)誤。show run
步驟3——檢查不匹配的1級和2級接口。
步驟4——檢查區(qū)域的錯(cuò)誤配置。
步驟5——檢查錯(cuò)誤配置的子網(wǎng)
步驟6——檢查重復(fù)的系統(tǒng)ID
3.鄰接陷入INIT狀態(tài)
常見原因:不匹配的接口MTU和認(rèn)證參數(shù)。show clns neighbors可看到
步驟1——檢查認(rèn)證 debug isis adj-packets
步驟2——檢查不匹配的MTU debug isis adj-packets
步驟3——檢查IS-IS的HELLO填充禁止 (命令同上)
使用show clns interface查看接口上的HELLO填充狀態(tài)
4.ES-IS鄰接形成代替了IS-IS鄰接形成
在IP環(huán)境中運(yùn)行IS-IS的CISCO路由器仍然監(jiān)聽ES-IS協(xié)議所產(chǎn)生的ISH.當(dāng)物理層和數(shù)據(jù)鏈路層工作時(shí),即使沒有建立IS-IS鄰接的適當(dāng)條件,仍能形成ES-IS鄰接。
show clns neighbors
5.路由通告問題
大多數(shù)路由通告問題都可被限制為源端的配置問題或鏈路狀態(tài)分組(LSP)的傳播問題。
Dijkstra算法運(yùn)行在LS數(shù)據(jù)庫上來獲得每個(gè)被通告路由的最佳路徑。
debug isis update-packets
debug isis snp-packets
以上兩個(gè)調(diào)試幫助故障排除LSP洪泛問題和鏈路狀態(tài)數(shù)據(jù)庫同步。
路由沒有到達(dá)網(wǎng)絡(luò)遠(yuǎn)端的問題可能有許多潛在原因,包括鄰接問題,第1/2層問題,IS-IS錯(cuò)誤配置以及其他問題。
6.路由翻動(dòng)問題
網(wǎng)絡(luò)中SPF進(jìn)程的高CPU利用率(SHOW PROCESS CPU命令)也應(yīng)標(biāo)記為不穩(wěn)定。
不穩(wěn)定鏈路。
翻動(dòng)還有可能是由LSP的錯(cuò)誤風(fēng)暴或一個(gè)路由選擇環(huán)路引起。
show isis spf-log命令顯示哪個(gè)LSP變化最頻繁以及哪個(gè)LSP角發(fā)了SPF計(jì)算。
show isis update-packets
六 排除BGP故障
1.故障排除BGP鄰居關(guān)系問題
遵循:首先,應(yīng)檢查第1/2層,然后是IP連通性(第3層),TCP連接(第4層),最后是BGP配置。
(1)直接的外部BGP鄰居沒有初始化
自治系統(tǒng)(AS)不會向AS發(fā)送或從AS接收任何IP前綴更新,除非鄰居關(guān)系達(dá)到established狀態(tài),該狀態(tài)是BGP鄰居建立的最后階段。當(dāng)AS有一條單一的EBGP連接時(shí),直到BGP完成了它的收發(fā)IP前綴操作后IP連通性
才能發(fā)生。
原因:
。 第2層宕掉了,阻止了與直接的EBGP鄰居通信
。 在BGP配置中有錯(cuò)誤的鄰居IP地址
命令:show ip bgp summary和 show ip bgp neighbors檢查BGP鄰居關(guān)系
active狀態(tài)表示鄰居間沒有發(fā)生成功的通信,并且鄰居未形成。用PING測試其連通性,失敗則表示要修復(fù)第1/2層問題。
debug ip bgp能夠幫助診斷問題
(2)非直接的外部BGP鄰居沒有初始化
有些情況下,EBGP鄰居不是直連的。BGP鄰居關(guān)系能夠建立在試圖形成由一臺或多臺路由器分隔開的EBGP鄰居關(guān)系的路由器之間。這種鄰居在IOS中被稱為EBGP多跳。
當(dāng)路由器之間存在多個(gè)接口并且需要在那些接口之間IP流量負(fù)載均衡時(shí),通常在回環(huán)接口之間建立EBGP對等實(shí)體。
可能的原因:
。 到非直連對等實(shí)體地址的路由從路由選擇表中丟失了
。 BGP配置中缺少ebgp-multihop命令
。 缺少update-source interface命令
命令:show ip bgp summary 和show bgp neighbors
router bgp 109
neighbor x.x.x.x remote-as 110
neighbor x.x.x.x ebgp-multihop 2
neighbor x.x.x.x update-source loopback0
(3)內(nèi)部BGP鄰居沒有初始化
原因:
。 到非直接IBGP鄰居的路由丟失了
。 BGP配置中缺少update-source interface命令
(4)BGP鄰居(外部和內(nèi)部)沒有初始化
接口訪問列表/過濾是BGP鄰居活動(dòng)問題的一個(gè)常見原因。
2.故障排除BGP路由通告
發(fā)生在BGP路由通告的產(chǎn)生和接收中。
(1)沒有產(chǎn)生BGP路由
原因:
。 IP路由選擇表中沒有匹配的路由
。 發(fā)生了配置錯(cuò)誤
。 BGP自動(dòng)匯總到有類別/網(wǎng)絡(luò)邊界
(2)向IBGP/EBGP鄰居傳播/產(chǎn)生一條BGP路由的問題
配置的分布列表過濾可能是該問題的起因,或者是策略路由選擇有問題。
(3)向EBGP鄰居但沒有向IBGP鄰居傳播一條BGP路由的問題
show run
show ip bgp
show ip bgp summary
解決:
。 使用IBGP全互聯(lián)
。 設(shè)計(jì)一個(gè)路由反射器模型。
router bgp 109
neighbor x.x.x.x route-reflector-client
。 設(shè)計(jì)一個(gè)聰明模型
(4)向IBGP/EBGP鄰接傳播一條IBGP路由的問題
一條BGP路由只有首先通過IGP或靜態(tài)路由獲得后才是同步的。
show ip bgp命令的輸出顯示了BGP表中的不同步路由。
3.排除路由沒有裝入IP路由選擇表中的故障
原因:
(1)IBGP原因
。 IBGP路由不同步
。 BGP下一跳不可達(dá)
(2)EBGP原因
。 在多跳EBGP情況下BGP下一跳不可達(dá)
。 BGP路由被抑制
。 多出口鑒別器(MED)值為無窮
4.BGP下一跳不可達(dá)
解決:
。 使用靜態(tài)路由或再分布經(jīng)由IGP宣告EBGP下一跳
router ospf 1
network x.x.x.0 0.0.0.255 area 0
。 使用next-hop-self命令將下一跳改變?yōu)橐粋€(gè)內(nèi)部對等實(shí)體地址
router bgp 109
router ospf x.x.x.x next-hop-self
4.BGP路由被抑制
抑制(dampening)是減小本地BGP網(wǎng)絡(luò)中來自EBGP鄰居的不穩(wěn)定BGP路由所引起的不穩(wěn)定性的方法。
抑制是一種為一條翻動(dòng)的BGP路由指派一個(gè)罰點(diǎn)的方法。
router bgp 109
bgp dampening
相關(guān)文章
配置路由器實(shí)現(xiàn)多設(shè)備控制端口訪問
配置路由器實(shí)現(xiàn)多設(shè)備控制端口訪問...2007-09-09