H3C核心交換機常見故障定位手冊_第1頁
H3C核心交換機常見故障定位手冊_第2頁
H3C核心交換機常見故障定位手冊_第3頁
H3C核心交換機常見故障定位手冊_第4頁
H3C核心交換機常見故障定位手冊_第5頁
已閱讀5頁,還剩39頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

H3手頁-CAL-FENGHAI.-(YICAI)-Company本頁僅作為文檔封面,使用請直接刪除

核心交換機常見故障處理手冊i

目錄錯誤未指書。信設息其息故和處原模分的措

錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未定簽單描處電描處風描處溫描處

錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯誤未指書。端描處端up·····························描處端Up描處1-1

錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。

端描處光障描處

錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯誤未指書。不描處障描處障描處轉描處

錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未定簽描處描處

錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未定簽描處內率描處資描處1-2

錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。錯!未指書。

11.11.1.1

故障處通流程信息搜集info-center搜集設備日志信息收執行displaydiagnostic-information令后,請輸入Y”,以選擇將保存到CF卡中(選擇display會出現信息搜集不全)。設備上單板越多,信息搜集的時間越長,信息搜集期間不能輸入命令,請耐心等待。也可以將diag信息直接顯示出來(不建議這樣搜集),搜集前請先執行screen-lengthdisable避免屏幕輸出被打斷,如下:其

1.1.2

搜集其他運行信息除設備日志信息外,還需要搜集設備的其他運行信息(包括但不限于以下):搜集信息越全面、越詳細,越有利于故障的快速定位。1.2

故障定位和處理設備出現故障時,請先搜集設備運行的相關信息,判斷大致的故障類型,然后參照對應類型的故障處理流程進行確認。如遇到故障無法確認,請將故障描述連同搜集的信息發送給公司技術支持人員分析。1.2.1

故障處理流程圖錯誤!未指書簽。故障處理的一般流程,可以大致判斷出故障的類型。故故障分析時常用的方法有:開1.2.2

故障原因分類單如單板出現異常重啟、狀態異常、無法啟動、反復重啟,請參照誤!未指書簽。錯誤!未指定書。處理。

電如設備電源指示燈異常、不斷打印告警信息,請參照誤!未指定簽。誤!未指定簽。處理。風如設備風扇指示燈異常、風扇停轉、不斷打印風扇告警信息,請參照誤!未指書簽。錯誤!未指定簽。處理。

溫如設備打印溫度告警,請參照誤!未指定書。錯誤未指定書簽處理。鏈如端口出現無法UP、頻繁、端口錯包,請參照錯誤!未指書簽。誤!未指書簽。。硬如日志不斷出現Forwardingfault、Boardfault:chassisXslotY,pleasecheckit等打印信息,請參照錯誤!未指定書簽。錯!未指定書簽。理。報如出現ping、tracert丟包或不通、二層丟包或不通、三層丟包或不通、業務異常等,請參照錯誤!未指定書。錯誤未指定書簽。如設備無法形成IRF、IRF裂等,請參照錯誤!未指定書簽錯誤!指定書簽。如設備單板CPU占用率很高,請參照誤!未指定簽。錯!未指定簽。處理。如設備單板內存占用率很高,請參照誤!未指定簽。錯!未指定簽。處理。如設備打印Noenoughresource資源不足,請參照錯誤!未指書簽。誤!未指書簽。處理。1.2.3

故障模型及影響分析錯誤!未指書簽。一個典型網絡故障模型,為提高網絡的可靠性,便于故障時快速切換恢復,組網中采用雙上行鏈路,兩臺核心交換機之間互為備份。

典故

可能現象

1(光模塊)234

端口down端口錯包增加單板fault單板芯片故障(單板狀態正常)軟件異常同1設備down

業務會切換影響該鏈路上的業務(影響范圍大)業務會切換該芯片上的業務異常交換網板芯片故障會影響整機設備重啟,業務會切換協議模塊異常一般會影響業務影響該接入層交換機上的業務(影響范圍比故障點小一些)影響該設備下的業務1-6

1.2.4

單板芯片故障軟件異常5同16網絡正常,業務異常常見的故障恢復措施常

影響部分端口或整機業務設備重啟,影響設備下連業務協議模塊異常一般會影響業務影響該鏈路上服務器涉及的業務影響該服務器涉及業務故障原因硬件軟件鏈路其他

業務恢復動作隔離故障單板;調整業務流向來隔離故障設備(如可以調整路由的優先級,避免流量經過故障設備,實現流量切換)重啟故障設備的協議;調整業務流向來隔離故障設備調整業務流向來隔離故障線路修改錯誤配置;正確連接設備端口;調整業務流向來隔離故障線路

故障排除動作更換備件(備件上線應用前應進行必要的測試)升級版本(含補丁版本);調整組網或配置消除引發故障因素檢修線路修改錯誤配置;正確連接設備端口;檢修機房的電源、空調等支撐系統22.12.1.1

硬件類障理單板故障故障描述單單板狀態包括:Normal、Master、Slave、Absent、Fault、Loading。Master與Slave分別表示主、備主控板。Normal示單板處于正常運行狀態。如果發現單板狀態出現Fault、Loading或該槽位存在單板但狀態卻是的,說明單板可能出現故障,請參考誤!未指定簽。錯!未指定簽。處理。

2-7

單可以通過logfile日志或displayversion看設備啟動后運行時間來確認單板有沒有出現過重啟,出現過重啟的單板運行時間會明顯短于設備上其他單板。如果有單板出現過重啟,請參考錯誤!未指書簽。錯誤!未定書簽處理。:

2.1.2

故障處理步驟單單2-8

單這里的單板重啟是指單板出現過重啟,而當前單板狀態是。displayversion:2.22.2.1

電源故障故障描述設備電源指示燈異?;蛏蠄?.2.2

故障處理步驟檢使用displaypower命顯示電源模塊狀態,查看是否存Fault或Absent狀態的電源模塊。

如果存在Absent狀態的電源模塊,請前往步驟。如果存在Fault狀態的電源模塊,請前往步驟。檢查看電源異常狀態:Absent或者Fault.使用displayalarm命令。如果存在Absent狀態的電源模塊,請前往步驟。如果存在Fault狀態的電源模塊,請前往步驟。檢如果電源模塊狀態為Absent表示對應槽位沒有在位的電源模塊或者電源模塊沒有安裝牢固。如果電源模塊槽位有電源模塊在位且顯示為,請將電源模塊拆卸后重新安裝,然后使用displaypower命查看對應槽位電源狀態是否顯示Normal。如果仍然顯示為Absent狀態,請更換新電源模塊。如果更換新電源模塊后仍然顯示為狀態,請前往步驟5。檢如果存在Fault狀態電源模塊,表示該電源模塊異常,無法供電。電源處于Fault狀態可能有以下原因:(1).電源線可能沒接穩而脫落。如果電源線脫落,那么電源的電流和電壓都會顯示為0,電源狀態顯示為Fault請檢查電源是否接線,接線后使用displaypower令查看對應槽位電源狀態是否顯示為。如果沒有恢復為,請前往(2)。(2).可能是電源模塊本身溫度過高導致。如果電源模塊上積灰較多可能引起電源模塊溫度升高。請查看電源模塊積灰情況,如果灰塵較多,請清理灰塵,并將電源模塊拆卸后重新安裝。然后使用display

power令查看對應槽位電源狀態是否顯示為Normal如果沒有恢復為Normal,請將該電源模塊插入其它空閑電源模塊槽位并查看電源狀態是否為。如果該電源模塊仍然顯示為Fault狀態,請更換電源模塊。如果更換新電源模塊后仍然顯示為狀態,請前往步驟5。尋如果上述檢查完成后故障仍無法排除,請聯系的技術支持工程師。2.32.3.1

風扇故障故障描述風扇框指示燈異常,設備打印風扇異常信息,如:2.3.2

故障處理步驟度

2.42.4.1

溫度告警故障描述設備打印溫度過低、過高等告警信息,如:2.4.2

故障處理步驟錯誤未定簽錯未指書。displayenvironment1123456123

33.13.1.1

鏈路端故處理端口錯包故障描述使用displayinterface令查詢端口的入、出方向流量統計信息,發現錯包統計計數不為0。-0000-

3-14

3.1.2

0-端端倍:故障處理步驟端錯誤未定簽錯!未定簽端Overrun計數是由于端口輸入速率超過端口處理能力,導致丟包。display

3.23.2.1

,端端端口無法p故障描述端口無法正常Up。3.2.2

故障處理步驟端Up雙DuplexFull

Speed

10GSupport

1000MSupport

100MSupport

10MSupport

HalfNosupportNosupportNosupportNosupport

錯誤未定簽錯!未定簽3.33.3.1

端口由變成D故障描述端口狀態由Up變成Down。3.3.2

故障處理步驟操配,Loopbackdetectiondown)錯!未定簽錯!未定簽

3.43.4.1

端口頻繁p/Down故障描述端口頻繁Up/Down。3.4.23.53.5.1

故障處理步驟錯誤未定簽錯!未定簽。信光模塊故障故障描述安裝光模塊的接口不能正常工作。3.5.2

故障處理步驟光字段

描述SFP/SFP+RXlossofsignalRXpowerhighRXpowerlowTXfaultTXbiashighTXbiaslow

接收信號丟失接收光功率高告警接收光功率低告警發送錯誤偏置電流高告警偏置電流低告警

字段

描述TXpowerhigh

發送光功率高告警3-18

TXpowerlowTemphighTemplowVoltagehighVoltagelowTransceiverinfoI/OerrorTransceiverinfochecksumerrorTransceivertypeandportconfigurationmismatchTransceivertypenotsupportedbyporthardwareXFPRXlossofsignalRXnotreadyRXCDRlossoflockRXpowerhighRXpowerlowTXnotreadyTXfaultTXCDRlossoflockTXbiashighTXbiaslowTXpowerhighTXpowerlowModulenotreadyAPDsupplyfaultTECfaultWavelengthunlockedTemphighTemplowVoltagehighVoltagelowTransceiverinfoI/Oerror

發送光功率低告警溫度高告警溫度低告警電壓高告警電壓低告警模塊信息讀寫錯誤模塊信息校驗和錯誤模塊類型和端口配置不匹配端口不支持該模塊類型接收信號丟失接收狀態未就緒RXCDR時鐘失鎖接收光功率高告警接收光功率低告警發送狀態未就緒發送錯誤TXCDR時鐘失鎖偏置電流高告警偏置電流低告警發送光功率高告警發送光功率低告警模塊狀態未就緒APDPhoto雪崩光電二極管)錯誤TECCooler熱電冷卻器)錯誤光信號波長失鎖溫度高告警溫度低告警電壓高告警電壓低告警模塊信息讀寫錯誤3-18

TransceiverinfochecksumerrorTransceivertypeandportconfigurationmismatchTransceivertypenotsupportedbyporthardware

模塊信息校驗錯誤模塊類型和端口配置不匹配端口不支持該模塊類型H3C定制光模塊的接收光功率、發送光功率可以通過displaytransceiverdiagnosis命令查詢到(非H3C定制的光模塊可能查詢不到)。H3C定制光模塊的光功率上下門限值可以通過下面方式查看(二選一):端_displaytransceiverinterface_transceiverdiagnosisinterface

在端口Up時:建議盡量使用H3C定制光模塊??赏ㄟ^displaytransceivermanuinfo令來查詢光模塊的定制廠商信息,如果VendorName為H3C,說明是定制光模塊。4報文轉故處理4.1ping通或丟包4.1.1

故障描述報文轉發丟包,ping不通或丟包,tracert異常。

4.1.2

故障處理步驟設報文轉發異常通常會涉及多臺設備,需要逐一排查。為方便排查,排查前建議先明確報文的轉發走向,如經過哪些中間設備,在設備的哪些接口進入設備,又會從哪些接口出去。通過鏡像抓包或配置ACL規則統計設備有沒有收到或發出相應的業務報文,以配置ACL規則統計端口入方向Ping報文為例::報如果設備未收到Ping報文,請排查上游的相鄰設備;如果設備發送的報文計數正確,建議排查下游的相鄰設備;如果報文入出計數不正確,請參照錯誤!未指定書。、錯誤!未指定簽。、錯誤未指定簽。繼續排查。

4.2L2發故障4.2.1

故障描述S12500-X與屬于同一個網段、使用相同的設備之間,二層流量丟包/通。報文在設備上進行二層轉發的條件是報文的目的與交換機自身的MAC不相等。注意:交換機自身的MAC地址有多個,屬于同一個地址段,比如下面顯示的是交換機VLAN接口的。00004.2.2

故障處理步驟配檢查二層配置是否正常,如:檢查MAC學習的端口是否正確,是否存在環路導致學習到錯誤端口,必要時可以配置靜態MAC來快速恢復業務。環

的表7漂4.3L3發故障4.3.1

故障描述故障現象通常有三層業務異常、丟包/不通。注意三層轉發的IP路由表并不是真正的轉發表,路由管理通過各路由協議選擇最佳的路由,并將選中的路由發送給軟件轉發表(FIB),FIB再將路由同步到芯片驅動轉發表,最終實現業務轉發,如誤未指定書。所示。

4.3.2

路故障處理步驟報報文在交換機上進行三層轉發的條件是報文的目的為交換機本身的MAC。通過鏡像或抓包確認這個條件是否滿足。注意交換機自身的地址有多個,屬于同一個地址段,比如下面顯示的是VLAN接口的MAC0000路檢查設備到某一目的IP網段的路由是否存在,如路由不存在,請檢查路由協議配置、狀態是否正確。檢查設備到某一目的IP網段的表項是否存在,如路由存在、FIB表項異常,請將故障信息發送技術支持人員分析。1檢查設備ARP學習的接口是否正確,如學習接口不正確,請通過arp令重新學習ARP,必要時可以配置靜態。如ARP學習的接口一直不正確,請將故障信息發送技術支持人員分析。

如4.4MPLS發故障4.4.1

故障描述MPLS常見故障現象有:4.4.2

故障處理步驟VLL、VPLS、L3VPN是基于建立的。在LSP入節點(即錯誤未指定書簽。的PE1)上通過下列方式來檢查、確認網絡中哪臺設備存在配置錯誤。

displaycurrent-configurationconfigurationmpls-ldp配displaymplsinterface命mplslsr-id是接|4-26

路IP表::000004-27

5IRF類故處理5.1IRF法形成5.1.1

故障描述IRF無法正常建立。5.1.2

故障處理步驟通常為配置錯誤引起,請檢查以下配置是否正確。

通過displayinterface詢IRF物理端口狀態是UP:配5.2IRF現分裂5.2.1

故障描述IRF運行過程中出現分裂。5.2.2

故障處理步驟irfdetect,

錯誤!未定簽錯誤!未定簽錯未指書。錯!未指定簽錯!未定簽:為保持IRF系統的健壯性,防止分裂,建議:框6系統管維類故障理6.1CPU用率高6.1.1

故障描述確連續使用命令displaycpu-usage看占用率,確定哪個槽位單板占用率高。如果CPU占用率持續在80以上,說明有某個任務長時間占用CPU,需要確認高的具體原因。6.1.2

故障處理步驟CPU占用率高的原因通常有:

查使用隱藏模式命令displayprocess[slot如1槽位CPU高。15

]觀察占CPU多的任務,比路通過displayroute-policy令可以查看設備配置的路由策略,請檢查配置的路由策略是否過多,導致CPU處理的負擔增加。::報在設備端口抓包,使用Wireshark工具分析報文特征,確認攻擊源。然后針對攻擊源配置報文防攻擊。

也可以通過設備debug開關打印上送的報文,并轉換后分析:鏈鏈路成環時,網絡振蕩,大量的協議報文上送處理也可能導致CPU占用率升高。存在環路時流量成環,可能會出現廣播,設備很多端口的流量會變得很大,端口使用率達到%以上:0如鏈路出現環路:6.26.2.1

內存占用率高故障描述多次查看單板內存占用率持續升高,始終處于%以上,這類問題通常為軟件問題引起,如內存泄露,也存在如路由數目過多導致的情況。請按照下述章節描述進一步搜集信息發送給技術支持人員分析。11

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論