網(wǎng)絡(luò)故障排除思路_第1頁
網(wǎng)絡(luò)故障排除思路_第2頁
網(wǎng)絡(luò)故障排除思路_第3頁
網(wǎng)絡(luò)故障排除思路_第4頁
網(wǎng)絡(luò)故障排除思路_第5頁
已閱讀5頁,還剩31頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

網(wǎng)絡(luò)故障排除思路

網(wǎng)絡(luò)故障排除技術(shù)總結(jié) .網(wǎng)絡(luò)故障排除技術(shù)概覽 在當(dāng)今日益復(fù)雜的網(wǎng)絡(luò)中進(jìn)行故障排除 網(wǎng)絡(luò)故障的一般分類 一般網(wǎng)絡(luò)故障的解決步驟 .網(wǎng)絡(luò)排錯(cuò)常用診斷工具介紹 Ping命令 Traceroute命令 Show命令 Clear命令 Debug命令 錯(cuò)誤未定義書簽。.故障排除常用方法 分層故障排除法 分塊故障排除法 分段故障排除法 替換法 .故障排除對(duì)排錯(cuò)技術(shù)人員的要求 對(duì)協(xié)議要求有精深的理解 能夠引導(dǎo)客戶詳細(xì)描述出故障現(xiàn)象和相關(guān)信息 充分了解自己所管理和維護(hù)的網(wǎng)絡(luò) 及時(shí)進(jìn)行故障排除的文檔記錄和經(jīng)驗(yàn)總結(jié) 網(wǎng)絡(luò)故障排除技術(shù)總結(jié).網(wǎng)絡(luò)故障排除技術(shù)概覽在當(dāng)今日益復(fù)雜的網(wǎng)絡(luò)中進(jìn)行故障排除當(dāng)今的網(wǎng)絡(luò)互連環(huán)境是日趨復(fù)雜的,而且隨著需求發(fā)展的步伐這種復(fù)雜性是日益增長的,主要原因如下:?現(xiàn)代的網(wǎng)絡(luò)要求支持更廣泛的應(yīng)用:包括內(nèi)容上的數(shù)據(jù)、語音、視頻的應(yīng)用;接入方式上有線,光纖,無線,多協(xié)議轉(zhuǎn)換器,邏輯鏈路的應(yīng)用;網(wǎng)絡(luò)結(jié)構(gòu)上二層,三層,二三層混合,VPN等的應(yīng)用。?新業(yè)務(wù)發(fā)展使得網(wǎng)絡(luò)的的需求不斷增長,新技術(shù)的不斷出現(xiàn)。例如:百兆以太網(wǎng)向千兆、萬兆以太網(wǎng)的演進(jìn);各種防范攻擊技術(shù)的出現(xiàn);提供QoS能力;TPV6的支持等。.新技術(shù)的應(yīng)用同時(shí)還要兼顧傳統(tǒng)的技術(shù)。例如,傳統(tǒng)的網(wǎng)絡(luò)體系結(jié)構(gòu)仍在某些場合使用。各種協(xié)議的發(fā)展,使得新網(wǎng)絡(luò)的建設(shè)需要兼容原來的基礎(chǔ)而進(jìn)行改造。圖1-1多樣業(yè)務(wù)的需求和各種先進(jìn)技術(shù)的引入使網(wǎng)絡(luò)日益復(fù)雜因此,現(xiàn)代的互連網(wǎng)絡(luò)是協(xié)議、技術(shù)、介質(zhì)和拓?fù)涞幕旌象w。互連網(wǎng)絡(luò)環(huán)境越復(fù)雜,意味著網(wǎng)絡(luò)的連通性和性能故障發(fā)生的可能性越大,而且引發(fā)故障的原因也越發(fā)難以確定。同時(shí),由于人們?cè)絹碓蕉嗟囊蕾嚲W(wǎng)絡(luò)處理日常的工作和事務(wù),一旦網(wǎng)絡(luò)故障不能及時(shí)修復(fù),其所造成的損失可能很大甚至是災(zāi)難性的。能夠正確地維護(hù)網(wǎng)絡(luò)盡量不出現(xiàn)故障,并確保出現(xiàn)故障之后能夠迅速、準(zhǔn)確地定位問題并排除故障,對(duì)網(wǎng)絡(luò)維護(hù)人員和網(wǎng)絡(luò)管理人員來說是個(gè)挑戰(zhàn),這不但要求我們對(duì)網(wǎng)絡(luò)協(xié)議和技術(shù)有著深入的理解,更重要的是要建立一個(gè)系統(tǒng)化的故障排除思想并合理應(yīng)用于實(shí)際中,以將一個(gè)復(fù)雜的問題隔離、分解或縮減排錯(cuò)范圍,從而及時(shí)修復(fù)網(wǎng)絡(luò)故障。網(wǎng)絡(luò)故障的一般分類網(wǎng)絡(luò)故障一般分為兩大類:連通性問題和性能問題。它們各自故障排除的關(guān)注點(diǎn)如下:?連通性問題硬件、系統(tǒng)、電源、媒介故障配置錯(cuò)誤不正確的相互作用?性能問題網(wǎng)絡(luò)擁塞到目的地不是最佳路由轉(zhuǎn)發(fā)異常路由環(huán)路網(wǎng)絡(luò)錯(cuò)誤一般網(wǎng)絡(luò)故障的解決步驟故障排除系統(tǒng)化是合理地一步一步找出故障原因并解決的總體原則。它的基本思想是系統(tǒng)地將由故障可能的原因所構(gòu)成的一個(gè)大集合縮減(或隔離)成幾個(gè)小的子集,從而使問題的復(fù)雜度迅速下降故障排除時(shí)有序的思路有助于解決所遇到的任何困難,下圖給出了一般網(wǎng)絡(luò)故障解決的處理流程。圖1-2網(wǎng)絡(luò)故障排除基本步驟我們以一個(gè)故障排除的實(shí)例來學(xué)習(xí)如何應(yīng)用這些步驟。案例:某用戶網(wǎng)段廣播包過多造成該網(wǎng)段的服務(wù)器FTP業(yè)務(wù)傳輸速度變慢組網(wǎng)圖如下:某校園網(wǎng)的三個(gè)局域網(wǎng),其中圖1-3用戶網(wǎng)段廣播包過多造成該網(wǎng)段的服務(wù)器FTP業(yè)務(wù)傳輸速度慢.故障現(xiàn)象描述要想對(duì)網(wǎng)絡(luò)故障做出準(zhǔn)確的分析,首先應(yīng)該了解故障表現(xiàn)出來的各種現(xiàn)象,然后才能確定可能產(chǎn)生這些現(xiàn)象的故障根源或癥結(jié)。因此,對(duì)網(wǎng)絡(luò)故障做出完整、清晰的描述是重要的一步。如上述案例,用戶反映:“日志服務(wù)器與備份服務(wù)器間備份發(fā)生問題。”這就是一個(gè)不完整不清晰的故障現(xiàn)象描述。因?yàn)檫@個(gè)描述沒有講述清楚下列問題:.這個(gè)問題是連續(xù)出現(xiàn),還是間斷出現(xiàn)的?是完全不能備份,還是備份的速度慢(即性能下降).哪個(gè)或哪些局域網(wǎng)服務(wù)器受到影響,地址是什么正確的故障現(xiàn)象描述是:在網(wǎng)絡(luò)的高峰期,日志服務(wù)器只有。.故障案例相關(guān)信息收集本步驟是搜集有助于查找故障原因的更詳細(xì)的信息。主要是三種途徑:.向受影響的用戶、網(wǎng)絡(luò)人員或其他關(guān)鍵人員提出問題;.根據(jù)故障描述性質(zhì),使用各種工具搜集情況,如網(wǎng)絡(luò)管理系統(tǒng)、協(xié)議分析儀、相關(guān)show命令等;.測試性能與網(wǎng)絡(luò)基線進(jìn)行比較。如上述案例,可以向用戶提問或自行收集下列相關(guān)信息:.網(wǎng)絡(luò)結(jié)構(gòu)或配置是否最近修改過,即問題出現(xiàn)是否與網(wǎng)絡(luò)變化有關(guān).是否有用戶訪問受影響的服務(wù)器時(shí)沒有問題.在非高峰期日志服務(wù)器和備份服務(wù)器間FTP傳輸速度是多少通過該步驟,可以收集到了下面一些相關(guān)信息:..0網(wǎng)段的客戶機(jī)不斷在增加;.網(wǎng)段的機(jī)器與備份服務(wù)器間進(jìn)行FTP傳輸時(shí)速度正常為7Mbps,與日志服務(wù)器間進(jìn)行FTP傳輸時(shí)速度慢,只有;.在非高峰期日志服務(wù)器和備份服務(wù)器間FTP傳輸速度正常,大約為6Mbps;.經(jīng)驗(yàn)判斷和理論分析利用前兩個(gè)步驟收集到的數(shù)據(jù),并根據(jù)自己以往的故障排除經(jīng)驗(yàn)和所掌握的互連網(wǎng)絡(luò)設(shè)備和協(xié)議的知識(shí),來確定一個(gè)排錯(cuò)范圍。通過范圍的劃分,就只需注意某一故障或與故障情況相關(guān)的那一部分產(chǎn)品、介質(zhì)和主機(jī)。由于.各種可能原因列表該步驟列出根據(jù)經(jīng)驗(yàn)判斷和理論分析后總結(jié)的各種可能原因。如上述案例,可能原因如下:.日志服務(wù)器A的性能問題.對(duì)每一原因?qū)嵤┡佩e(cuò)方案根據(jù)所列出的可能原因制定故障排查計(jì)劃,分析最有可能的原因,確定一次只對(duì)一個(gè)變量進(jìn)行操作,這種方法使你能夠重現(xiàn)某一故障的解決辦法。如果有多個(gè)變量同時(shí)被改變,而問題得以解決,那么如何判斷哪個(gè)變量導(dǎo)致了故障發(fā)生呢說明:我們?cè)趯?duì)故障處理流程5、6、7步驟介紹完畢后,再繼續(xù)進(jìn)行上述實(shí)例案例的排錯(cuò)步驟介紹。.觀察故障排查結(jié)果當(dāng)我們對(duì)某一原因執(zhí)行了排錯(cuò)方案后,需要對(duì)結(jié)果進(jìn)行分析,判斷問題是否解決,是否弓1入了新的問題。如果問題解決,那么就可以直接進(jìn)入文檔化過程;如果沒有解決問題,那么就需要再次循環(huán)進(jìn)行到故障排查過程。.循環(huán)進(jìn)行故障排查過程當(dāng)實(shí)施了一個(gè)方案沒有達(dá)到預(yù)期的排錯(cuò)目的時(shí),我們進(jìn)入到該步驟——這是一個(gè)努力縮小可能原因的清單過程。在進(jìn)行下一循環(huán)之前必須做的事情就是將網(wǎng)絡(luò)恢復(fù)到實(shí)施上一方案前的狀態(tài)。如果保留上一方案對(duì)網(wǎng)絡(luò)的改動(dòng),很可能導(dǎo)致新的問題,例如:假設(shè)修改了訪問列表但沒有產(chǎn)生預(yù)期的結(jié)果,此時(shí)如果不將訪問列表恢復(fù)到原始狀態(tài),就會(huì)導(dǎo)致出現(xiàn)不可預(yù)期的結(jié)果。循環(huán)排錯(cuò)可以有兩個(gè)切入點(diǎn):.當(dāng)針對(duì)某一可能原因的排錯(cuò)方案沒有達(dá)到預(yù)期目的,循環(huán)進(jìn)入下一可能原因制定排錯(cuò)方案并實(shí)施;.當(dāng)所有可能原因列表的排錯(cuò)方案均沒有達(dá)到排錯(cuò)目的,重現(xiàn)進(jìn)行故障相關(guān)信息收集以分析新的可能原因。如上述案例,我們?cè)诹谐隽丝赡茉蛄斜砗螅_始制定方案進(jìn)行故障排除。(1)可能原因1:“”“Traceroute”命令,發(fā)現(xiàn)探測報(bào)文返回時(shí)長僅為10ms,表明該可能原因并不是造成故障的原因。

我們進(jìn)入循環(huán)排錯(cuò)過程。(2)可能原因2:“日志服務(wù)器A的性能問題”制定的方案:測試同一網(wǎng)段的主機(jī)C和日志服務(wù)器間的FTP傳輸速度,是6Mbps正常。可見問題與服務(wù)器A無關(guān)。(3)可能原因3:“”制定的方案:測試主機(jī)C和備份服務(wù)器B間FTP傳輸速度是7Mbps,正常。排除了網(wǎng)關(guān)因素,因?yàn)锽、C在不同網(wǎng)段上而速度正常。(4)可能原因3:“”showinterfacesfastEthernet0/Xcounters",輸出如下:Interface:Fa0/x5minuteinputrate5minuteoutputrateInOctets4800bits/sec,4packets/sec55936bits/sec,5packets/secInUcastPkts390531InMulticastPkts39InBroadcastPktsOutOctets13164OutUcastPkts33133OutMulticastPkts1840OutBroadcastPkts12611廣播與單播的比例在1:3,顯然太大了。“showinterfacesfastEthernet0/xcounters”輸出如下:Interface:Fa0/135minuteinputrate5minuteoutputrateInOctetsInUcastPkts4800bits/sec,4packets/sec55936bits/sec,5packets/sec4253824InMulticastPkts39InBroadcastPktsOutOctets11061OutUcastPktsOutMulticastPkts1840OutBroadcastPkts12611廣播與單播的比例在1:280,是正常的。由于這是一個(gè)網(wǎng)絡(luò)布局不恰當(dāng)?shù)膯栴},于是重新安排服務(wù)器的位置,將服務(wù)器移動(dòng)網(wǎng)段后,故障排除。.故障排除過程文檔化當(dāng)最終排除了網(wǎng)絡(luò)故障后,那么排除流程的最后一步就是對(duì)所做的工作進(jìn)行文字記錄。文檔化過程決不是一個(gè)可有可無的工作,原因如下:.文檔是排錯(cuò)寶貴經(jīng)驗(yàn)的總結(jié),是“經(jīng)驗(yàn)判斷和理論分析”這一過程中最重要的參考資料;. 文檔記錄了這次排錯(cuò)中網(wǎng)絡(luò)參數(shù)所做的修改,這也是下一次網(wǎng)絡(luò)故障應(yīng)收集的相關(guān)信息。文檔記錄主要包括以下幾個(gè)方面:. 故障現(xiàn)象描述及收集的相關(guān)信息. 網(wǎng)絡(luò)拓?fù)鋱D繪制.網(wǎng)絡(luò)中使用的設(shè)備清單和介質(zhì)清單.網(wǎng)絡(luò)中使用的協(xié)議清單和應(yīng)用清單.故障發(fā)生的可能原因. 對(duì)每一可能原因制定的方案和實(shí)施結(jié)果. 本次排錯(cuò)的心得體會(huì).其他:如排錯(cuò)中的使用的參考資料列表等請(qǐng)讀者對(duì)照上述案例完成文檔記錄工作。2.網(wǎng)絡(luò)排錯(cuò)常用診斷工具介紹銳捷的產(chǎn)品提供了一套完整的命令集,可以用于監(jiān)控網(wǎng)絡(luò)互聯(lián)環(huán)境的工作狀況和解決基本的網(wǎng)絡(luò)故障。主要包括以下命令:Ping命令Traceroute命令.Show命令.Clear命令Debug命令Ping命令1原理:“ping”這個(gè)詞源于聲納定位操作,指來自聲納設(shè)備的脈沖信號(hào)。Ping命令的思想與發(fā)出一個(gè)短促的雷達(dá)波,通過收集回波來判斷目標(biāo)很相似;即源站點(diǎn)向目的站點(diǎn)發(fā)出一個(gè)ICMPEchoRequest報(bào)文,目的站點(diǎn)收到該報(bào)文后回一個(gè)ICMPEchoReply報(bào)文,這樣就驗(yàn)證了兩個(gè)節(jié)點(diǎn)間IP層的可達(dá)性--表示了網(wǎng)絡(luò)層是連通的。2.功能Ping命令用于檢查IP網(wǎng)絡(luò)連接及主機(jī)是否可達(dá)。平臺(tái)的ping命令在RG系列設(shè)備上,Ping命令的格式如下:Pingip-address例如,向主機(jī)Ping報(bào)文RG#PING!!Successrateis100percent(2/2)Minimum=21msMaximum=22ms,Average=21msRG# Successrateis0percent(0/5)平臺(tái)的Ping命令在PC機(jī)上或WindwosNT為平臺(tái)的服務(wù)器上,Ping命令的格式如下:Ping[-nnumber][-t][-lnumber]ip-addressnPing報(bào)文的個(gè)數(shù),缺省值為5;t持續(xù)地ping直到人為地中斷,Ctr+Breack暫時(shí)中止ping命令并查看當(dāng)前的統(tǒng)計(jì)結(jié)果,而Ctr+C則中斷命令的執(zhí)行。1設(shè)置Ping報(bào)文所攜帶的數(shù)據(jù)部分的字節(jié)數(shù),設(shè)置范圍從0至65500。例:向主機(jī)發(fā)出2個(gè)數(shù)據(jù)部分大小為3000Bytes的ping報(bào)文C:\>3000time=321msTTL=123Packets:Sent=2,Received=2,Lost=0(0%loss),Approximateroundtriptimesinmilli-seconds:Minimum=297ms,Maximum= 321ms,Average= 309ms說明:實(shí)際上Windows平臺(tái)的Ping命令的參數(shù)非常多,這里只介紹其中最重要的三個(gè)參數(shù)。其他參數(shù)介紹請(qǐng)參考Windows在線幫助。5.巧用Ping命令進(jìn)行故障排除案例一:連通性問題還是性能問題(1)案例描述?工程師小C,在配置完一臺(tái)路由器之后執(zhí)行Ping命令檢測鏈路是否通暢。發(fā)現(xiàn)5個(gè)報(bào)文都沒有Ping通,于是檢查雙方的配置命令并查看路由表,卻一直沒有找到錯(cuò)誤所在。最后又重復(fù)執(zhí)行了一遍相同的Ping命令,發(fā)現(xiàn)這一次5個(gè)報(bào)文中有1個(gè)Ping通了--原來是線路質(zhì)量不好存在比較嚴(yán)重的丟包現(xiàn)象。?工程師小C又配置了一臺(tái)路由器,然后執(zhí)行Ping命令訪問Internet上某站點(diǎn)的IP地址,但沒有Ping通。有了上次的教訓(xùn)小L,再一次Ping了20個(gè)報(bào)文,仍舊沒有響應(yīng)。于是小L斷定是網(wǎng)絡(luò)故障。但是在費(fèi)勁周折檢查了配置鏈路之后仍沒有發(fā)現(xiàn)任何可疑之處,最后小L采取逐段檢測的方法對(duì)鏈路中的網(wǎng)關(guān)進(jìn)行逐級(jí)測試,發(fā)現(xiàn)都可以Ping通,但是響應(yīng)的時(shí)間越來越長,最后一個(gè)網(wǎng)關(guān)的響應(yīng)時(shí)間在1800ms左右。會(huì)不會(huì)是由于超時(shí)而導(dǎo)致顯示為Ping不同呢受此啟發(fā),小L將Ping命令報(bào)文的超時(shí)時(shí)間改為4000ms,這次成功Ping通了,顯示所有的報(bào)文響應(yīng)時(shí)間都在2200ms左右。(2)建議和總結(jié):真的是Ping不通嗎這個(gè)問題需要定位清楚,因?yàn)檫B通性問題和性能問題排錯(cuò)的關(guān)注點(diǎn)是不一樣的——問題定位錯(cuò)誤必然會(huì)導(dǎo)致排錯(cuò)過程的周折。使用一般的Ping命令,缺省是發(fā)送5個(gè)報(bào)文的,超時(shí)時(shí)長是2000ms。如果Ping不通情況發(fā)生,最好能夠再用帶參數(shù)-c和-t的Ping命令再執(zhí)行一遍,如:Ping-c20-t4000ip-address,即連續(xù)發(fā)送20個(gè)報(bào)文,每個(gè)報(bào)文的超時(shí)時(shí)長為4000ms,這樣一般可以判斷出到底是連通性問題還是性能問題。案例二:使用大包ping對(duì)端進(jìn)行MTU不一致的故障排除(1)現(xiàn)象描述:某次開局,使用RG路由器與其他廠商的某路由器互連,并運(yùn)行OSPF協(xié)議。數(shù)據(jù)配置完畢后,一切正常,并在今后相當(dāng)長的時(shí)間內(nèi)設(shè)備運(yùn)轉(zhuǎn)穩(wěn)定。但兩個(gè)月后,用戶反饋網(wǎng)絡(luò)中斷。(2)相關(guān)信息顯示:?登錄到兩臺(tái)路由器上,發(fā)現(xiàn)雙方連接正常,可以相互Ping通對(duì)端地址。但OSPF協(xié)議中斷;?登錄RG路由器查看鄰居狀態(tài),發(fā)現(xiàn)鄰居狀態(tài)機(jī)處于Exstart狀態(tài)。打開相應(yīng)的debug開關(guān)查看相應(yīng)的報(bào)文信息,發(fā)現(xiàn)雙方都可以收到Hello報(bào)文,但RG路由器發(fā)送DD報(bào)文后,一直沒有收到對(duì)方回應(yīng)的DD報(bào)文;?登錄其他廠商的那臺(tái)路由器,打開相應(yīng)的debug開關(guān),發(fā)現(xiàn)對(duì)方收到RG路由器發(fā)送的DD報(bào)文后,一發(fā)送了相應(yīng)的DD報(bào)文予以回應(yīng)。(3)原因分析:初步斷定,RG路由器沒有收到DD回應(yīng)報(bào)文,但對(duì)方確實(shí)發(fā)出來了。既然可以接收到HELLO報(bào)文說明鏈路是通暢的,而且多播報(bào)文的收發(fā)也沒有問題。那么有可能是對(duì)方發(fā)送的DD報(bào)文有錯(cuò)誤導(dǎo)致RG路由器拒收,但查看相應(yīng)的信息,并沒有報(bào)告接收到錯(cuò)誤的DD報(bào)文。仔細(xì)查看某廠商路由器的調(diào)試信息發(fā)現(xiàn)這個(gè)DD報(bào)文很大有2000多字節(jié)。會(huì)不會(huì)是由于報(bào)文太大導(dǎo)致的問題呢試著Ping了一個(gè)2000字節(jié)的報(bào)文,結(jié)果不通。那么故障原因很可能是--由于雙方的MTU不一致導(dǎo)致大包不通。(4)處理過程:檢查配置,發(fā)現(xiàn)對(duì)方路由器的MTU設(shè)置為4000多而RG路由器的MTU設(shè)置為1500,于是修改對(duì)端路由器的MTU為1500。故障排除。那么為什么工程初期沒有問題呢這是因?yàn)榍捌贒D報(bào)文長度小于1500字節(jié),而后來網(wǎng)絡(luò)擴(kuò)容導(dǎo)致路由信息過多使DD報(bào)文的長度超過了1500字節(jié)。(5)建議和總結(jié):由于Ping缺省報(bào)文是56個(gè)字節(jié),所以顯示的Ping通信息只是表示56字節(jié)的報(bào)文可以通而并不一定表示其他大小的報(bào)文仍舊可以通。所以,應(yīng)當(dāng)善于使用Ping的其他參數(shù)來進(jìn)行故障排除。案例三:A能Ping通B,B就一定能Ping通A嗎(1)現(xiàn)象描述組網(wǎng)圖如下:圖1-4案例:A能Ping通B,B就一定能

Ping通A嗎在RouterA上配置一條指向的靜態(tài)路由:RouterA(config)#在RouterA上PingRouterB的以太網(wǎng)地址,顯示可以正常Ping通;但是在RouterB上PingRouterA的以太網(wǎng)地址,卻無法Ping通。(2)原因分析:由于在RouterB上卻沒有相應(yīng)的配置到路由,所以從RouterB上Ping不通RouterA的以太網(wǎng)口。但是為何在A上可以Ping通呢同樣是沒有回程路由呀打開路由器上的IP報(bào)文調(diào)試開關(guān)發(fā)現(xiàn),原來從RouterA上發(fā)出的ICMP報(bào)文的源地址填寫的是而不是,由于兩臺(tái)路由器的s0口處于同一網(wǎng)段,所以響應(yīng)報(bào)文可以順利到達(dá)RouterB。(3)建議和總結(jié):A能夠Ping通B則B一定能夠Ping通A(不考慮防火墻的因素),這句話的對(duì)錯(cuò)取決于A和B到底是指主機(jī)還是指路由器。?如果是指兩臺(tái)主機(jī),那么這句話就是正確的。?如果是指兩臺(tái)路由器那就是錯(cuò)誤的,因?yàn)槁酚善魍ǔ?huì)有多個(gè)IP地址。現(xiàn)在就有如下問題:當(dāng)從一臺(tái)路由器上執(zhí)行Ping命令它發(fā)出的ICMP氏ho報(bào)文的源地址究竟選擇哪一個(gè)呢實(shí)際情況是路由器選擇發(fā)出報(bào)文的接口的IP地址。Traceroute命令1原理Traceroute是為了探測源節(jié)點(diǎn)到目的節(jié)點(diǎn)之間數(shù)據(jù)報(bào)文所經(jīng)過的路徑。利用IP報(bào)文的TTL域在每經(jīng)過一個(gè)路由器的轉(zhuǎn)發(fā)后減一,當(dāng)TTL=0時(shí)則向源節(jié)點(diǎn)報(bào)告TTL超時(shí)這個(gè)的特性。Traceroute首先發(fā)送一個(gè)TTL為1的UDP報(bào)文,因此第一跳發(fā)送回一個(gè)ICMP錯(cuò)誤消息以指明此數(shù)據(jù)報(bào)不能被發(fā)送(因?yàn)門TL超時(shí)),之后Traceroute再發(fā)送一個(gè)TTL為2的報(bào)文,同樣第二跳返回TTL超時(shí),這個(gè)過程不斷進(jìn)行,直到到達(dá)目的地,此時(shí)由于數(shù)據(jù)報(bào)中使用了無效的端口號(hào)(缺省為33434)此時(shí)目的主機(jī)會(huì)返回一個(gè)ICMP的目的地不可達(dá)消息,表明該Traceroute操作結(jié)束。Traceroute記錄下每一個(gè)ICMPTTL超時(shí)消息的源地址,從而提供給用戶報(bào)文到達(dá)目的地所經(jīng)過的網(wǎng)關(guān)IP地址。2.功能Traceroute命令用于測試數(shù)據(jù)報(bào)文從發(fā)送主機(jī)到目的地所經(jīng)過的網(wǎng)關(guān),主要用于檢查網(wǎng)絡(luò)連接是否可達(dá),以及分析網(wǎng)絡(luò)什么地方發(fā)生了故障。平臺(tái)的Traceroute命令在銳捷RG系列路由器上,Traceroute命令的格式如下:Traceroutehost『destination]例如:查看到目的主機(jī)中間所經(jīng)過的網(wǎng)關(guān)。RG#tracerouteTypeesc/CTRL^c/CTRLAz/qtoabort.175ms160ms145ms230ms185ms220msTracecompletesuccessfully.平臺(tái)的Tracert命令在PC機(jī)上或WindwosNT為平臺(tái)的服務(wù)器上,Tracert命令的格式如下:tracert[-d][-hmaximum_hops][-jhost-list][-wtimeout]hostd不解析主機(jī)名;h指定最大TTL大小;j設(shè)定松散源地址路由列表;w用于設(shè)置UDP報(bào)文的超時(shí)時(shí)間,單位毫秒;例如:查看到目的主機(jī)中間所經(jīng)過的前兩個(gè)網(wǎng)關(guān)。C:\>tracert1 3ms2msTracecomplete.5.使用Traceroute命令進(jìn)行故障排除案例一:使用Traceroute命令定位不當(dāng)?shù)木W(wǎng)絡(luò)配置點(diǎn)(1)現(xiàn)象描述組網(wǎng)情況如下圖所示:圖1-5案例:使用Traceroute命令定位不當(dāng)

的網(wǎng)絡(luò)配置點(diǎn)(2)相關(guān)信息顯示在主機(jī)上2顯示如下:C:\DocumentsandSettings\c>ping-n10-l10002Pingingwith1000bytesofdata:Replyfrom:bytes=1000time=552msTTL=250Replyfrom:bytes=1000time=5735msTTL=250Replyfrom:bytes=1000time=551msTTL=250Replyfrom:bytes=1000time=5734msTTL=250Replyfrom:bytes=1000time=549msTTL=250Replyfrom:bytes=1000time=5634msTTL=250Replyfrom:bytes=1000time=555msTTL=250Replyfrom:bytes=1000time=5738msTTL=250Replyfrom:bytes=1000time=455msTTL=250Replyfrom:bytes=1000time=5811msTTL=250原因分析上面的Ping顯示出一個(gè)規(guī)律:奇數(shù)報(bào)文的返回時(shí)長短,而偶數(shù)報(bào)文返回時(shí)長很長(是奇數(shù)報(bào)文的10倍多)。可以初步判斷奇數(shù)報(bào)文和偶數(shù)報(bào)文是通過不同的路徑傳輸?shù)摹,F(xiàn)在我們需要使用Traceroute命令來追蹤這不同的路徑。在RouterC上,TracerouteRouterC(config)#tracerouteTargetIPaddressorhost:Maximumnumberofhopstosearchfortarget[30]:10Repeatcountforeachecho[3]:8Waittimeoutmillisecondsforeachreply[2000]:Typeesc/CTRL^c/CTRLAz/qtoabort.traceroute 1 6ms4ms4ms4ms4ms4ms4ms4ms。。。。。。(中間省略)520ms16ms15ms16ms16ms16ms16ms16ms630ms278ms25ms279ms25ms278ms25ms277msRouterC(config)#通過詢問該段網(wǎng)絡(luò)的管理員,得知這兩路由器間有一主一備兩串行鏈路,主鏈路為(s0口之間),備份鏈路為128Kbps(s1口之間)。網(wǎng)絡(luò)管理員在此兩路由器間配置了靜態(tài)路由。RouterB上如下配置:RouterB(config)#RouterB(config)#RouterA上如下配置:RouterA(config)#.RouterA(config)#于是問題就清楚了。例如RouterB,由于管理員配置時(shí)沒有給出靜態(tài)路由的優(yōu)先級(jí),這兩條路由項(xiàng)的管理距離就同為缺省值1,于是就同時(shí)出現(xiàn)在路由表中,實(shí)現(xiàn)的是負(fù)載分擔(dān),而不能達(dá)到主備的目的。(3)處理過程可以有兩種處理方法:繼續(xù)使用靜態(tài)路由,進(jìn)行配置更改RouterB上進(jìn)行如下更改:RouterB(config)#(主鏈路仍使用缺省)RouterB(config)#100(備份鏈路的降低至200)RouterA上進(jìn)行如下更改:RouterA(config)#RouterA(config)# 100這樣,只有當(dāng)主鏈路發(fā)生故障,備份鏈路的路由項(xiàng)才會(huì)出線在路由表中,從而接替主鏈路完成報(bào)文轉(zhuǎn)發(fā),實(shí)現(xiàn)主備目的。在兩路由器上運(yùn)行動(dòng)態(tài)路由協(xié)議,如IGRP、EIGRP、OSPF等,但不要運(yùn)行RIP協(xié)議(因?yàn)镽IP協(xié)議僅以hop作為Metric的)(4)建議和總結(jié)本案例的目的不是為了解釋網(wǎng)絡(luò)配置問題,而是用來展示Ping命令和Traceroute命令的相互配合來找到網(wǎng)絡(luò)問題的發(fā)生點(diǎn)。尤其在一個(gè)大的組網(wǎng)環(huán)境中,維護(hù)人員可能無法沿著路徑逐機(jī)排查,此時(shí),能夠迅速定位出發(fā)生問題的線路或路由器就非常重要了。案例二:使用Traceroute命令發(fā)現(xiàn)路由環(huán)路(1)現(xiàn)象描述組網(wǎng)情況如下圖所示:(2)相關(guān)信息顯示RouterA#ping2timeoutis2000milliseconds.Successrateis0percent(0/5)RouterA#tracerouteTypeesc/CTRL^c/CTRLAz/qtoabort.traceroute 16ms4ms4ms(RouterB)28:ms8ms,8ms(RouterA)312ms12ms12ms(RouterB)416ms16ms16ms(RouterA)(3)原因分析從上面的Traceroute命令的顯示可以立即發(fā)現(xiàn),在RouterA和RouterB間產(chǎn)生了路由環(huán)路。由于是配置的是靜態(tài)路由,基本可以斷定是RouterA或RouterB的靜態(tài)路由配置錯(cuò)誤。(4)處理過程修改RouterB的配置如下:RouterB(config)#noiprouteRouterB(config)#ip故障排除。(5)建議和總結(jié)Traceroute命令能夠很容易發(fā)現(xiàn)路由環(huán)路等潛在問題。當(dāng)路由器A認(rèn)為路由器B知道到達(dá)目的地的路徑,而路由器B也認(rèn)為路由器A知道目的地時(shí),就是路由環(huán)路發(fā)生了。使用Ping命令只能知道接收端出現(xiàn)超時(shí)錯(cuò)誤,而Traceroute能夠立即發(fā)現(xiàn)環(huán)路所在——如果Traceroute命令兩次或者多次顯示同樣的接口。當(dāng)通過Traceroute發(fā)現(xiàn)路由環(huán)路后,如果配置為:. 靜態(tài)路由:幾乎可以肯定是手工配置有問題,如本案例所示。. OSPF協(xié)議:可能是地址聚合產(chǎn)生的問題。. 多路由協(xié)議:可能是路由引入產(chǎn)生的問題。Show命令Show命令是用于了解路由器的當(dāng)前狀況、檢測相鄰路由器、從總體上監(jiān)控網(wǎng)絡(luò)、隔離互連網(wǎng)絡(luò)中故障的最重要的工具之一。幾乎在任何故障排除和監(jiān)控場合,Show命令都是必不可少的。例如:基于RGNOS路由平臺(tái)的Show命令選項(xiàng)如下所示:RG#showaccess-groupaccess-listsaccountingaddress-bindAggregatePortarpclass-mapMACaccess-groupListaccesslistsAccountingconfigurationsparametersaddressbindingtableAggregatePortIEEEARPtableShowQoSClassMap

clockclusterconfigurecpudebuggingdetectdot1xfileclockclusterconfigurecpudebuggingdetectdot1xfilegvrphostinterfacesiPip-auth-modekeylinelldploggingmacClusterinformationContentsofNon-VolatilememoryCPUstatisticsStateofeachdebuggingoptiondetectuseripIEEEinformationShowfilesysteminformationGVRPconfigurecommandIPdnshosttableInterfacestatusandconfigurationIPinformationShowIPauthenticationmodeKeyinformationTTYlineinformationLLDPinformationShowthecontentsofloggingbuffersmac-address-tableMACforwardingtablemembermemorymlsmonitorpolicy-mapport-securityprivilegeradius-serverrate-controlreloadrmonShowmembersinformationMemorystatisticsShowMultiLayerSwitchinginformationmac-address-tableMACforwardingtablemembermemorymlsmonitorpolicy-mapport-securityprivilegeradius-serverrate-controlreloadrmonShowmembersinformationMemorystatisticsShowMultiLayerSwitchinginformationShowaSPANsessionShowQoSPolicyMapShowsecureportinformationShowcurrentprivilegelevelShowRADIUSqueryparametersRatecontrolconfigurationinformationHaltandperformacoldrestartrmonstatisticsrunning-configsecurityservicesmp-serversnmpsnmp-serversntpspanning-treestorm-controltime-rangeversionCurrentoPeratingconfigurationSecuritySettingsShownetworkmanagementservicesSMPServerParameterssnmpstatisticsShowSNMPparametersshowsntpparameterSpanningtreetopologyShowpacketstormcontrolconfigurationShowtime-rangeinformationSystemhardwareandsoftwarestatusvlanVLANstatus曾說明:上述清單列出了Show命令可以使用的全部一級(jí)關(guān)鍵字,其中大部分關(guān)鍵字后還可以跟更多的關(guān)鍵字,以使用戶能夠清晰的了解到特定的信息。在故障排除中最有用的是那些用黑體字顯示的關(guān)鍵字,用戶應(yīng)該記住它們并熟悉它們的輸出信息。本章僅介紹部分最常用的、全局性的show命令,而與各協(xié)議相關(guān)的show命令,將在后面章節(jié)相應(yīng)的協(xié)議故障排除中詳細(xì)介紹。ShowVersion命令ShowVersion命令是最基本的命令之一,它用于顯示路由器硬件和軟件的基本信息。因?yàn)椴煌陌姹居胁煌奶卣鳎瑢?shí)現(xiàn)的功能也不完全相同,所以,查看硬件和軟件的信息是解決問題的重要一步。在進(jìn)行故障排除時(shí),我們通常從這個(gè)命令開始收集數(shù)據(jù)。該命令將幫助用戶收集下列信息:RGNOS軟件版本是哪一系列的產(chǎn)品輸出示例如下,請(qǐng)找到上述提及的相應(yīng)項(xiàng)。Switch#shverSystemdescription :Red-GiantGigabitIntelligentSwitch(S2126G)ByRuijieNetworkSystemuptime :1d:2h:41m:11sSystemhardwareversion:Systemsoftwareversion:(3)BuildSep72006RelSystemBOOTversion :RG-S2126G-BOOT03-02-02SystemCTRLversion :RG-S2126G-CTRL03-11-02RunningSwitchingImage:Layer2running-config和Showstartup-config命令Showrunning-config用于查看當(dāng)前的配置信息。Showstartup-config用于顯示NVRAM或Flash中的路由器配置文件,即路由器下次上電啟動(dòng)時(shí)所用的配置文件。配置文件為一文本文件,其格式如下:以命令格式保存;.為節(jié)約空間,只保存非缺省的常數(shù)命令;組織以命令模式為基本框架,同一命令模式的命令組織在一起,形式一節(jié),節(jié)與節(jié)間以注釋行隔開(以“!”開始的語句為注釋行). 節(jié)的順序安排:全局配置、物理接口配置、邏輯接口配置、路由協(xié)議配置等;以end為結(jié)束。示例如下:Switch#showrunning-configSystemsoftwareversion:(3)BuildSep72006RelBuildingconfiguration...Currentconfiguration:287bytes!version!hostnameSwitchvlan1!enablesecretlevel145$2,1u_;C3&-8U0<D4',tj9=GQ+/7R:>Henablesecretlevel155$*T73C,tZ[V/4D+S(\W&QG1X)sv'!interfacevlan1noshutdown!endSwitch#強(qiáng)烈建議網(wǎng)絡(luò)維護(hù)或管理人員保存一份啟動(dòng)配置文件的拷貝存放到路由器以外的其他設(shè)備上。這有幾點(diǎn)好處:. 這將使維護(hù)人員能夠迅速配置一個(gè)替代的路由器;. 這個(gè)保存在外部的文本文件也可以按上述規(guī)定的格式脫機(jī)編輯然后使用Downloadconfig命令加載到路由器上;可以將該配置文件通過E-mail形式發(fā)給銳捷技術(shù)支持人員以幫助定位配置問題。interface命令Showinterface命令可以顯示所有接口的當(dāng)前狀態(tài),如果只是想查看特定接口的狀態(tài),請(qǐng)?jiān)谠撁詈筝斎虢涌陬愋秃徒涌谔?hào),例如:showinterfaceFastEthernet0/13命令將查看以太口0/3的運(yùn)行狀態(tài)和相關(guān)信息。Switch#showinterfaceFastEthernet0/13Interface:FastEthernet100BaseTX0/13Description:AdminStatus:upOperStatus:upHardware:10/100BaseTXMtu:1500LastChange:0d:22h:32m:50sAdminDuplex:AutoOperDuplex:FullAdminSpeed:AutoOperSpeed:100FlowControlAdminStatus:OffFlowControlOperStatus:OffPriority:0Broadcastblocked:DISABLEUnknownmulticastblocked:DISABLEUnknownunicastblocked:DISABLEClear命令在介紹完畢Show命令的基本使用后,必須提及一下Clear命令的作用——用于清空當(dāng)前的統(tǒng)計(jì)信息以排除以前積累的數(shù)據(jù)的干擾。Clear命令中最主要的是Clear和Clearcounters命令。對(duì)于端口收發(fā)的各計(jì)數(shù)器的刷新必須使用Clearcounters,可通過showinterface命令來觀察;對(duì)于端口硬件邏輯的刷新使用Clear來刷新,通過showinterface命令來觀察。Clear命令適用場合如下:許多情況下,我們需要使用帶參數(shù)的Ping命令來測試鏈路的通斷,同時(shí)在一段時(shí)間內(nèi)Ping后,通過Showinterface或Showipinterface命令來查看端口報(bào)文的收發(fā)及CRC校驗(yàn)等情況的正確與否,從而分析報(bào)文的收發(fā)在什么地方出現(xiàn)了問題。但show命令的顯示值是自從路由器運(yùn)行以來(或上次Clear后)的所有統(tǒng)計(jì)值,這個(gè)值是無法分析的。因此,實(shí)際我們需要進(jìn)行的步驟為:首先使用Clear命令清空統(tǒng)計(jì)值,然后使用一系列Ping命令使路由器端口收發(fā)報(bào)文,最后使用Show命令來查看統(tǒng)計(jì)值。例如:通過ShowinterfaceFastEthernet0/13counters觀察到端口有如下統(tǒng)計(jì)數(shù)據(jù):Interface:Fa0/135minuteinputrate:76208bits/sec,53packets/sec5minuteoutputrate:340600bits/sec,53packets/secInOctets:53193982InUcastPkts:253095InMulticastPkts:32InBroadcastPkts:10655OutUcastPkts:336100OutMulticastPkts:1740OutBroadcastPkts:12981Undersizepackets:0Oversizepackets:0collisions :0Fragments:0Jabbers :0CRCalignmenterrors:16AlignmentErrors:0FCSErrors:0droppedpacketevents(duetolackofresources):0packetsreceivedoflength(inoctets):64:157041,65-127:127987,128-255:10115,256-511:7169,512-1023:14593,1024-1518:297698我們發(fā)現(xiàn)端口收發(fā)有了錯(cuò)誤,但這些錯(cuò)誤是否是最近產(chǎn)生的呢可用ClearcountersinterfaceFastEthernet0/13來進(jìn)行刷新,再通過Ping一組報(bào)文測試路由器端口的收發(fā),最后再使用ShowinterfaceFastEthernet0/13counters看結(jié)果統(tǒng)計(jì)。如果仍然顯示發(fā)生錯(cuò)誤,那么我們就需要分析原因進(jìn)行故障排除了。Debug命令Debug命令概述RG系列路由器提供大量的debug命令,可以幫助用戶在網(wǎng)絡(luò)發(fā)生故障時(shí)獲得路由器中交換的報(bào)文和幀的細(xì)節(jié)信息,這些信息對(duì)網(wǎng)絡(luò)故障的定位是至關(guān)重要的。打開相應(yīng)的調(diào)試開關(guān)例如:打開IPpacket調(diào)試開關(guān),命令為:RG#debugippacketDebug命令使用注意事項(xiàng)由于調(diào)試信息的輸出在CPU處理中賦予了很高的優(yōu)先級(jí),許多形式的debug命令會(huì)占用大量的CPU運(yùn)行時(shí)間,在負(fù)荷高的路由器上運(yùn)行debug命令可能弓[起嚴(yán)重的網(wǎng)絡(luò)故障(如網(wǎng)絡(luò)性能迅速下降)。但debug命令的輸出信息對(duì)于定位網(wǎng)絡(luò)故障又是如此的重要,是維護(hù)人員必須使用的工具。因此,我們總結(jié)了一些使用debug命令的注意要點(diǎn),如下:(1)應(yīng)當(dāng)使用debug命令來查找故障,而不是用來監(jiān)控正常的網(wǎng)絡(luò)運(yùn)行。(2)盡量在網(wǎng)絡(luò)使用的低峰期或網(wǎng)絡(luò)用戶較少時(shí)使用,以降低debug命令對(duì)系統(tǒng)的影響性。(3)在沒有完全掌握某debug命令的工作過程以及它所提供的信息前,不要輕易使用該debug命令。(4)不要輕易使用類似debugall之類將產(chǎn)生大量輸出的命令。僅當(dāng)尋找某些類型的流量或故障并且已將故障原因縮小到一個(gè)可能的范圍時(shí),才使用某些特定的debug命令。(5)在使用debug命令獲得足夠多的信息后,應(yīng)立即以“nodebugxx”命令終止debug命令的執(zhí)行。可以使用showdebugging命令查看當(dāng)前已打開哪些調(diào)試開關(guān)并使用相應(yīng)命令關(guān)閉;或干脆使用nodebugall命令關(guān)閉所有調(diào)試開關(guān)。案例一:忘記關(guān)閉debug開關(guān)弓I起的路由器報(bào)文轉(zhuǎn)發(fā)速度變慢的故障排除(1)現(xiàn)象描述某電信局安裝了RG路由器作為接入服務(wù)器的出口網(wǎng)關(guān),一段時(shí)間運(yùn)轉(zhuǎn)良好。某日用戶反映該設(shè)備明顯速度變慢。執(zhí)行PING操作,PING對(duì)端路由器設(shè)備,所用時(shí)間為正常的2倍多。(2)相關(guān)信息收集該路由器的日志中記錄了大量的收發(fā)IP報(bào)文的信息。(3)原因分析初步分析可能有以下幾種原因:線路質(zhì)量不好。. 對(duì)端設(shè)備問題,導(dǎo)致回應(yīng)較慢。自身配置錯(cuò)誤. 網(wǎng)絡(luò)繁忙.軟硬件故障(4)處理過程. 檢查線路,沒有發(fā)現(xiàn)問題;.PING與之相連的其他路由器設(shè)備,故障依舊,說明對(duì)端設(shè)備無問題;.對(duì)照以前運(yùn)轉(zhuǎn)良好時(shí)備份的Running-config文件,檢查路由器上的配置,沒有錯(cuò)誤;. 當(dāng)時(shí)并非上網(wǎng)高峰期,且只是變慢,而無丟包,應(yīng)當(dāng)不是網(wǎng)絡(luò)負(fù)荷問題;. 檢查該路由器的日志信息,發(fā)現(xiàn)其中記錄了大量的收發(fā)IP報(bào)文的信息,執(zhí)行命令showdebugging命令,發(fā)現(xiàn)該路由器的debugippacket處于打開狀態(tài)。由于設(shè)備需要記錄每一個(gè)被轉(zhuǎn)發(fā)的IP報(bào)文,大大降低了路由器的處理速度,導(dǎo)致變慢。關(guān)閉該debug開關(guān)后,故障排除。(5)建議與總結(jié)山重水復(fù)疑無路,柳暗花明又一村。排除此類故障時(shí)應(yīng)該想一下debug開關(guān)的問題。案例二:通過串口telnet到路由器,在該串口上打開debug命令產(chǎn)生問題當(dāng)遠(yuǎn)程調(diào)試RG路由器時(shí),有時(shí)需要通過某個(gè)串口telnet上該路由器,如果該串口上的鏈路層協(xié)議封裝的是FR、PPP或HDLC,千萬不能打開該串口相應(yīng)的鏈路層調(diào)試開關(guān)(可以打開其他串口的鏈路層調(diào)試開關(guān)),否則由于數(shù)據(jù)流量太大,會(huì)使該串口的協(xié)議down掉。如果鏈路層協(xié)議是,則沒有這個(gè)限制。命令和debug命令的配合使用Show命令能夠提供某個(gè)時(shí)間的設(shè)備運(yùn)行狀況的視圖(靜態(tài)),而debug命令能夠展示一段時(shí)間內(nèi)設(shè)備運(yùn)行的變化情況(動(dòng)態(tài))。因此,要在故障排除時(shí)了解系統(tǒng)運(yùn)行的總體情況,必須同時(shí)使用這兩個(gè)命令。例如:當(dāng)進(jìn)行OSPF協(xié)議的故障排除時(shí),需要使用showiproute命令來了解路由器當(dāng)前已經(jīng)知道了哪些路由表項(xiàng),需要使用debugipospfevents命令來了解路由表是如何更新的。如果不知道路由表的當(dāng)前內(nèi)容,路由更新的信息對(duì)故障排除是不夠的。Debug命令并不能直接告訴你設(shè)備已知到的信息,而show命令則不能告訴路由表的變化情況,兩者的配合使用,才能全面了解正在發(fā)生的事情。一般說來,Show命令不會(huì)影響系統(tǒng)的運(yùn)行性能,而debug命令則會(huì)對(duì)系統(tǒng)性能造成影響。因此兩者的使用應(yīng)遵循如下規(guī)則:首先使用相關(guān)的多個(gè)show命令查看設(shè)備當(dāng)前的運(yùn)行狀況,分析可能原因,縮減故障到適當(dāng)范圍,然后打開某個(gè)特定的debug命令觀察變化情況,以定位和排除問題。3.故障排除常用方法分層故障排除法.層次化的故障排除思想過去的十幾年,互連網(wǎng)絡(luò)領(lǐng)域的變化是驚人的,但有一件事情沒有變化:論述互連網(wǎng)絡(luò)技術(shù)的方法都與osi模型有關(guān),即使新的技術(shù)與OSI模型不一定精確對(duì)應(yīng),但所有的技術(shù)都仍然是分層的。因此,我們重要的是要培養(yǎng)一種層次化的網(wǎng)絡(luò)故障分析方法。分層法思想很簡單:所有模型都遵循相同的基本前提--當(dāng)模型的所有低層結(jié)構(gòu)工作正常時(shí),它的高層結(jié)構(gòu)才能正常工作。在確信所有低層結(jié)構(gòu)都正常運(yùn)行之前,解決高層結(jié)構(gòu)問題完全是浪費(fèi)時(shí)間。例如:在一個(gè)幀中繼網(wǎng)絡(luò)中,由于物理層的不穩(wěn)定,幀中繼連接總是出現(xiàn)反復(fù)失去連接的問題,這個(gè)問題的直接表象是到達(dá)遠(yuǎn)程端點(diǎn)的路由總是出現(xiàn)間歇性中斷。這使得維護(hù)工程師第一反應(yīng)是路由協(xié)議出問題了,然后憑借著這個(gè)感覺來對(duì)路由協(xié)議進(jìn)行大量故障診斷和配置,其結(jié)果是可想而知的。如果他能夠從OSI模型的底層逐步向上來探究原因的話,維護(hù)工程師將不會(huì)做出這個(gè)錯(cuò)誤的假設(shè),并能夠迅速定位和排除問題。.各層次的關(guān)注點(diǎn)⑴物理層物理層負(fù)責(zé)通過某種介質(zhì)提供到另一設(shè)備的物理連接,包括端點(diǎn)間的二進(jìn)制流的發(fā)送與接收,完成與數(shù)據(jù)鏈路層的交互操作等功能。物理層需要關(guān)注的是:電纜、連接頭、信號(hào)電平、編碼、時(shí)鐘和組幀,這些都是導(dǎo)致端口處于Shutdown狀態(tài)的因素。(2)數(shù)據(jù)鏈路層數(shù)據(jù)鏈路層負(fù)責(zé)在網(wǎng)絡(luò)層與物理層之間進(jìn)行信息傳輸;規(guī)定了介質(zhì)如何接入和共享;站點(diǎn)如何進(jìn)行標(biāo)識(shí);如何根據(jù)物理層接收的二進(jìn)制數(shù)據(jù)建立幀。封裝的不一致是導(dǎo)致數(shù)據(jù)鏈路層故障的最常見原因。當(dāng)使用Showinterface命令顯示端口和協(xié)議均為up時(shí),我們基本可以認(rèn)為數(shù)據(jù)鏈路層工作正常;而如果端口up而協(xié)議為down,那么數(shù)據(jù)鏈路層存在故障。鏈路的利用率也和數(shù)據(jù)鏈路層有關(guān),端口和協(xié)議是好的,但鏈路帶寬有可能被過度使用,從而弓I起間歇性的連接失敗或網(wǎng)絡(luò)性能下降。(3)網(wǎng)絡(luò)層網(wǎng)絡(luò)層負(fù)責(zé)實(shí)現(xiàn)數(shù)據(jù)的分段打包與重組以及差錯(cuò)報(bào)告,更重要的是它負(fù)責(zé)信息通過網(wǎng)絡(luò)的最佳路徑。地址錯(cuò)誤和子網(wǎng)掩碼錯(cuò)誤是弓[起網(wǎng)絡(luò)層故障最常見的原因;互聯(lián)網(wǎng)絡(luò)中的地址重復(fù)是網(wǎng)絡(luò)故障的另一個(gè)可能原因;另外,路由協(xié)議是網(wǎng)絡(luò)層的一部分,也是排錯(cuò)重點(diǎn)關(guān)注的內(nèi)容。排除網(wǎng)絡(luò)層故障的基本方法是:沿著從源到目的地的路徑查看路由器上的路由表,同時(shí)檢查那些路由器接口的IP地址。通常,如果路由沒有在路由表中出現(xiàn),就應(yīng)該通過檢查來弄清是否已經(jīng)輸入了適當(dāng)?shù)撵o態(tài)、默認(rèn)或動(dòng)態(tài)路由,然后,手工配置丟失的路由或排除動(dòng)態(tài)路由協(xié)議選擇過程的故障以使路由表更新。分塊故障排除法Show命令的介紹中提及了RG系列路由器Running-config文件的組織結(jié)構(gòu),它是以全局配置、物理接口配置、邏輯接口配置、路由配置等方式編排的。其實(shí)我們還能夠以另一種角度看待這個(gè)配置文件,該配置分為以下幾塊:■管理部分(路由器名稱、口令、服務(wù)、日志等).端口部分(地址、封裝、cost、認(rèn)證等)■路由協(xié)議部分(靜態(tài)路由、RIP、OSPF、BGP、路由引入等).策略部分(路由策略、策略路由、安全配置等).接入部分(主控制臺(tái)、Telnet登錄或啞終端、撥號(hào)等).其他應(yīng)用部分(語言配置、VPN配置、Qos配置等)上述分類給故障定位提供了一個(gè)原始框架,當(dāng)出現(xiàn)一個(gè)故障案例現(xiàn)象時(shí),我們可以把它歸入上述某一類或某幾類中,從而有助于縮減故障定位范圍。例如:當(dāng)使用“Showiproute”命令,結(jié)果只顯示出了直連路由,那么問題可能發(fā)生在哪里呢看上述的分塊,我們發(fā)現(xiàn)有三部分可能弓I起該故障:路由協(xié)議、策略、端口。如果沒有配置路由協(xié)議或配置不當(dāng),路由表就可能為空;如果訪問列表配置錯(cuò)誤,就可能妨礙路由的更新;如果端口的地址、掩碼或認(rèn)證配置錯(cuò)誤,也可能導(dǎo)致路由表錯(cuò)誤。分段故障排除法如果兩個(gè)路由器跨越電信部門提供的線路而不能相互通信時(shí),分段故障排除法是有效的。如:.主機(jī)到路由器LAN接口的這一段.路由器到CSU/DSU接口的這一段.CSU/DSU到電信部門接口的這一段.WAN電路CSU/DSU本身問題路由器本身問題下面案例是一個(gè)典型的分段故障排除法的應(yīng)用。案例:路由器通過DDN專線連接時(shí)的調(diào)試方法目前路由器在網(wǎng)上較多的一種應(yīng)用是通過DDN專線連接,這種應(yīng)用對(duì)路由器來說配置并不太復(fù)雜,而問題多容易出在線路和Modem方面。以下是對(duì)這種組網(wǎng)實(shí)際調(diào)試中的一些經(jīng)驗(yàn)。組網(wǎng)圖如下:圖1-6DDN專線連接組網(wǎng)圖正常情況下,Modem上指示燈狀態(tài)為:PWR(電源指示燈)、RTS、DCD三個(gè)燈常亮,TD、RD在有數(shù)據(jù)收發(fā)時(shí)閃爍。兩側(cè)路由器連上并完成配置后,S口應(yīng)激活,線路協(xié)議應(yīng)激活,雙方可以相互ping通。當(dāng)出現(xiàn)問題時(shí),可按照以下步驟進(jìn)行測試:(1)在Routeri上打開調(diào)試開關(guān)。以封裝PPP為例,在全局模式下輸入debugppppacket命令。2)將ModemA上的ANA鍵按下。此時(shí)Modem的RTS、DCD、TEST常亮,在Routeri上能看到大量經(jīng)過環(huán)回的LCP層收發(fā)消息包。此時(shí)表示ModemA和Routeri之間連接正常。(3)將ModemA的REM鍵按下。此時(shí)若燈狀態(tài)同上,路由器上看到的debug消息也同上,則表示從Routeri到ModemB之間連接正常。(4)請(qǐng)本地?cái)?shù)據(jù)局在節(jié)點(diǎn)機(jī)C上進(jìn)行環(huán)回,觀察是否有環(huán)回的數(shù)據(jù)包。(5)請(qǐng)對(duì)端數(shù)據(jù)局在節(jié)點(diǎn)機(jī)D上向本端進(jìn)行環(huán)回,觀察是否有環(huán)回的數(shù)據(jù)包。(6)對(duì)端將ModemF的DIG鍵按下,若能看到環(huán)回的數(shù)據(jù)包,則表示從Routeri一直到ModemF都正常。若不通,可以在Router2上重復(fù)以上操作步驟,直至找出有問題的一段。替換法當(dāng)我們?cè)跈z查硬件是否存在問題時(shí)最常用的方法。當(dāng)懷疑是網(wǎng)線問題時(shí),更換一根確定是好的網(wǎng)線試一試;當(dāng)懷疑是接口模塊有問題時(shí),更換一個(gè)其他接口模塊試一試。.故障排除對(duì)排錯(cuò)技術(shù)人員的要求對(duì)協(xié)議要求有精深的理解案例:RIPvl和OSPF相互路由弓|入的問題在一個(gè)地址空間為的網(wǎng)絡(luò)中配置了OSPF域,其中該網(wǎng)絡(luò)的某些子網(wǎng)的掩碼是24位,另一些是26位;同時(shí)在該網(wǎng)絡(luò)中還配置了一個(gè)24位子網(wǎng)掩碼的RIP域,并在OSPF域和RIP域間相互進(jìn)行路由弓|入。結(jié)果發(fā)現(xiàn),RIP域中的路由器不能Ping通OSPF域中的某些接口。為什么會(huì)出現(xiàn)這樣的結(jié)果我們知道,RIP1不支持VLSM,因此RIP域中的子網(wǎng)必須使用相同長度的子網(wǎng)掩碼且它們必須是相鄰的;OSPF支持可變長度子網(wǎng)掩碼并且不要

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論