PTN簡單故障維護-20080709-A_第1頁
PTN簡單故障維護-20080709-A_第2頁
PTN簡單故障維護-20080709-A_第3頁
PTN簡單故障維護-20080709-A_第4頁
PTN簡單故障維護-20080709-A_第5頁
已閱讀5頁,還剩35頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、HUAWEI TECHNOLOGIES CO., LTDHuawei Confidential Security Level: 2022-3-6PTNPTN簡單故障維護簡單故障維護HUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 2NB 1IMA/ATMCESNB2PTNPTN層次化故障維護結構ETHNB3PTNSDHor ETHPTNPTNSDHor ETHPTNRNCCoreNetwrokPTNRNCSTM-XGE/FESTM-1GEMLPPP物理層:單板物理層:單板 / ETH端口端口 / SDH端口端口 / E1口口鏈路層:鏈路

2、層: MLPPP / STM / LAG隧道層:隧道層:Tunnel / PW / MPLS APS業務層:業務層:ETH / CES / IMA / ATMMLPPPHUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 3目錄鏈路層故障維護 2 2物理層故障維護 1 1隧道層故障維護 3 3業務層故障維護 4 4數據采集 5 5HUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 4單板指示燈單板指示燈含義含義名稱名稱屬性屬性狀態狀態規范建議規范建議工作狀態指示STAT紅|綠|黃亮(綠

3、色)表示單板正常工作亮(紅色)表示單板硬件故障滅表示單板沒有開工或單板沒有被創建或單板沒有上電狀態業務狀態指示SRV紅|綠|黃亮(綠色)表示業務工作正常,沒有任何業務告警產生亮(紅色)表示業務有危急或主要告警亮(黃色)表示業務有次要和遠端告警滅表示業務沒有配置 激活狀態指示ACT/ACTX/ACTC綠亮(綠色)業務處于激活狀態,單板工作滅正常情況,表示業務處于非激活態100ms間隔閃爍(綠)保護系統中,表示系統數據庫批量備份時鐘同步指示SYNC紅|綠亮(綠色)時鐘工作正常亮(紅色)時鐘源丟失或時鐘源倒換程序狀態指示PROG紅|綠亮(綠色)表示上層軟件初始化;(上電/復位過程中),或軟件正常運行

4、亮(紅色)表示內存自檢失敗;或上層軟件加載不成功;或文件丟失;滅無100毫秒亮100毫秒滅(綠色)表示正在進行寫FLASH操作或軟件加載;(上電/復位過程中,)300毫秒亮300毫秒滅(綠色)表示正處在BIOS引導階段(上電/復位過程中)循環100毫秒亮100毫秒滅(紅色)表示BOOTROM自檢失敗(上電/復位過程中)HUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 5NB 1IMA/ATMCESNB2PTNPTN硬件故障相關的告警硬件故障相關的告警ETHNB3PTNSDHor ETHPTNPTNSDHor ETHPTNRNCCoreN

5、etwrokPTNRNCSTM-XGE/FESTM-1GEMLPPPTEMP_OVER工作溫度過限故障原因:故障原因:(1)環境溫度過高;(2)制冷設備故障;(3)防塵網被堵;(4)單板故障HARD_BAD硬件故障故障原因:故障原因:單板內器件有故障;故障原因:故障原因:(1)數據庫操作失效; (2)數據庫數據損壞; (3)單板故障DBMS_ERROR數據庫錯誤COMMUN_FAIL單板通信失敗故障原因:故障原因:(1)通信芯片或器件故障;(通信芯片或器件故障;(2)出現倒針或拉死;()出現倒針或拉死;(3)背板總線故障)背板總線故障BD_STATUS單板不在線故障原因:故障原因:(1)單板未

6、插;單板未插; (2)單板插座已松動;單板插座已松動; (3)板間通訊故障;(板間通訊故障;(4)子卡沒有插;()子卡沒有插;(5)子卡插座已松動;)子卡插座已松動;HUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 6NB 1IMA/ATMCESNB2PTNPTNGE/FEGE/FE端口故障端口故障ETHNB3PTNSDHor ETHPTNPTNSDHor ETHPTNRNCCoreNetwrokPTNRNCSTM-XGE/FESTM-1GEMLPPPETH_LOS光信號丟失故障原因:故障原因:(1)光纖斷;光纖斷;(2)光模塊壞;光模

7、塊壞;(3)光衰減過大;光衰減過大;ETH_LINK_DOWN網口連接故障故障原因:故障原因:兩端工作模式不一致,造成協商失敗;電纜、光纖連接或者對端設備故障。兩端工作模式不一致,造成協商失敗;電纜、光纖連接或者對端設備故障。MAC_FCS_EXC誤碼越限故障原因:故障原因:MAC層檢測到誤碼越限;線路信號劣化;光纖性能劣化;光口不潔凈層檢測到誤碼越限;線路信號劣化;光纖性能劣化;光口不潔凈ETHDROP丟包事件故障原因:故障原因:由于缺乏資源而導致丟包的事件數由于缺乏資源而導致丟包的事件數ETHCRCALI錯包計數故障原因:故障原因:有有FCS(幀校驗序列)錯誤或者對齊錯誤(非整數字節)的包

8、總數。(幀校驗序列)錯誤或者對齊錯誤(非整數字節)的包總數。HUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 7NB 1IMA/ATMCESNB2PTNPTNSDHSDH端口故障端口故障ETHNB3PTNSDHor ETHPTNPTNSDHor ETHPTNRNCCoreNetwrokPTNRNCSTM-XGE/FESTM-1GEMLPPPR_LOS光信號丟失故障原因:故障原因:(1)斷纖;)斷纖; (2)線路衰耗過大;)線路衰耗過大; (3)對端站發送部分故障,線路發送失效;)對端站發送部分故障,線路發送失效;R_LOC時鐘丟失故障原

9、因:故障原因:(1)接收到的信號失效;接收到的信號失效;(2)時鐘提取模塊故障;時鐘提取模塊故障;R_LOF幀丟失故障原因:故障原因:(1)接收信號衰減過大;)接收信號衰減過大; (2)對端站發送信號無幀結構;)對端站發送信號無幀結構; (3)本板接收方向故障)本板接收方向故障J0_MM追蹤識別符失配故障原因:故障原因:對端應發對端應發J0 字節與本端應收字節與本端應收J0 字節不一致字節不一致RSBBE再生段誤碼故障原因:故障原因:B1字節監測得知存在誤碼;字節監測得知存在誤碼;AUPJCHIGHAU指針正調整故障原因:故障原因:SDH網中各網元的時鐘不同步;網中各網元的時鐘不同步;HUAW

10、EI TECHNOLOGIES CO., LTD.Huawei Confidential Page 8NB 1IMA/ATMCESNB2PTNPTNE1E1端口故障端口故障ETHNB3PTNSDHor ETHPTNPTNSDHor ETHPTNRNCCoreNetwrokPTNRNCSTM-XGE/FESTM-1GEMLPPPT_ALOS信號丟失故障原因:故障原因:(1)E1/T1業務未接入;業務未接入; (2)DDF架側架側E1/T1接口輸出端口脫落或松動;接口輸出端口脫落或松動; (3)本站)本站E1/T1接口輸接口輸入端口脫落或松動;入端口脫落或松動; (4)單板故障;)單板故障; (5

11、)電纜故障)電纜故障ALM_E1RAI遠端告警指示故障原因:故障原因:對端有告警;對端有告警;E1_DELAY時延告警故障原因:故障原因:IMA鏈路發送時延超過鏈路時延門限;鏈路發送時延超過鏈路時延門限;E1_LCV_SDH編碼錯誤計數故障原因:故障原因:E1業務線路側編碼錯誤檢測記數;業務線路側編碼錯誤檢測記數;HUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 9TPSTPS故障故障CXPCXPMD1MD1MD1MD1L75L75TPSTPSTPS_ALMTPS倒換告警產生原因:產生原因:工作板有硬件故障,發生TPS 自動倒換。下發T

12、PS 倒換命令。處理措施:處理措施:如果是下發TPS倒換命令引起的,則是正常現象,不需要處理。如果是硬件壞觸發的TPS自動倒換,則說明工作子卡發生了離線、變壞等情況,需進一步查詢該子卡的告警,及時進行更換。HUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 10TPSTPS故障故障CXPCXPMD1MD1MD1MD1L75L75TPSTPSTPS_FAILTPS倒換失敗產生原因:產生原因:保護板有硬件故障,造成TPS倒換失敗。處理措施:處理措施:如果是在工作板好的情況下,下發TPS倒換命令引起的,則暫時不會影響業務,要及時更換備板。如果是

13、工作和保護板都壞的情況下,TPS自動倒換失敗引起的,則當前業務已中斷,需及時更換工作和保護板。HUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 11目錄鏈路層故障維護 2 2物理層故障維護 1 1隧道層故障維護 3 3業務層故障維護 4 4數據采集 5 5HUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 12NB 1IMA/ATMCESNB2PTNPTNMLPPPMLPPP故障故障ETHNB3PTNSDHor ETHPTNPTNSDHor ETHPTNRNCCoreNetwrok

14、PTNRNCSTM-XGE/FESTM-1GEMLPPPMP_DOWNMLPPP組失效故障原因:故障原因:MLPPP組中有效激活的成員數小于預先配置值;組中有效激活的成員數小于預先配置值;單主控復位,造成單主控復位,造成PPP協議無法協商;協議無法協商;MP_DELAY組成員延時告警故障原因:故障原因:組成員的延遲大于配置值時產生告警;組成員的延遲大于配置值時產生告警;HUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 13NB 1IMA/ATMCESNB2PTNPTNLAGLAG故障故障ETHNB3PTNSDHor ETHPTNPTNS

15、DHor ETHPTNRNCCoreNetwrokPTNRNCSTM-XGE/FESTM-1LAGMLPPPLAG_MEMBER_DOWN成員端口不可用告警故障原因:故障原因:1. 端口端口link down/disable2. 端口未收到端口未收到LACP報文報文3. 端口半雙工端口半雙工4. 端口自環端口自環LAG_DOWNLAG組無效故障原因:故障原因:聚合組中激活狀態的成員數為聚合組中激活狀態的成員數為0HUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 14NB 1IMA/ATMCESNB2PTNPTNLMSPLMSP故障故障E

16、THNB3PTNSDHor ETHPTNPTNSDHor ETHPTNRNCCoreNetwrokPTNRNCLMSPGE/FESTM-1GEMLPPPLPS_UNI_BI_M單雙端模式失配故障原因:故障原因:復用段兩端模式配置錯誤,一邊為單端模式、另一邊為雙端模式;復用段兩端模式配置錯誤,一邊為單端模式、另一邊為雙端模式;K2_M1+1/1:1方式失配故障原因:故障原因:復用段兩端復用段兩端1+1/1:1方式配置錯誤,一邊為方式配置錯誤,一邊為1+1方式、另一邊為方式、另一邊為1:1方式;方式;K1_K2_M倒換失敗故障原因:故障原因:發送的發送的K 字節和接收的字節和接收的K 字節指示的通

17、道號不一致。字節指示的通道號不一致。說明倒換失敗,兩端走的工作說明倒換失敗,兩端走的工作/保護路徑選擇不一致。保護路徑選擇不一致。HUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 15定位手段之定位手段之EFMEFM功能功能lETH Link Layer OAM實現了以太網鏈路實現了以太網鏈路(FE、GE)的故障發現和故障定位,的故障發現和故障定位,PTN1900&3900基于基于802.3ah實現的功能包括實現的功能包括:p鏈路發現p鏈路監視p遠端故障指示p遠端環回HUAWEI TECHNOLOGIES CO., LTD.Hu

18、awei Confidential Page 16定位手段之定位手段之EFMEFM功能功能OAMOAM功能功能作用作用告警和動作告警和動作應用場景應用場景發現(Discovery )檢測對方設備是否支持802.3ah OAM功能如果協商失敗,上報告警說明失敗的具體原因故障檢測,故障定位鏈路監視(Link monitoring )檢測鏈路性能情況并通知對端使能端口OAM功能后自動檢測鏈路性能事件并上報告警,包括:Errored Symbol Period EventErrored Frame EventErrored Frame Period EventErrored Frame Seconds

19、 Summary Event故障檢測關鍵鏈路事件指示(Critical link events)檢測關鍵鏈路事件并通知對端使能端口OAM功能后自動檢測并上報告警,包括:Link fault故障檢測遠端環回(Remote loopback )鏈路雙向連通性檢測,將遠端端口的數據報文全部環回手動發起,遠端上報環回狀態告警故障定位HUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 17定位手段之定位手段之BFDBFD功能功能l應用場景:應用場景:p連通性檢測p基于端口創建BFD會話,可以創建BFD會話的端口為VLAN子接口和三層ETH端口p目前

20、只支持單跳、異步的檢測方式,檢測周期為3秒p當探測倍數時間內沒有接收到BFD報文,則上報BFD_DOWN告警HUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 18目錄鏈路層故障維護 2 2物理層故障維護 1 1隧道層故障維護 3 3業務層故障維護 4 4數據采集 5 5HUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 19NB 1IMA/ATMCESNB2PTNPTNMPLS OAM連通性檢測ETHNB3PTNMPLSPTNPTNMPLSPTNRNCCoreNetwrokPTNR

21、NCSTM-XGE/FESTM-1GEMLPPPMPLS_TUNNEL_LOCVHUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 20NB 1IMA/ATMCESNB2PTNPTNMPLS OAM轉發錯誤(MISMATCH)ETHNB3PTNMPLSPTNPTNMPLSPTNRNCCoreNetwrokPTNRNCSTM-XGE/FESTM-1GEMLPPPMPLS_TUNNEL_MISMATCHMPLS_TUNNEL_LOCVHUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 2

22、1NB 1IMA/ATMCESNB2PTNPTNMPLS OAM轉發錯誤(MISMERGE)ETHNB3PTNMPLSPTNPTNMPLSPTNRNCCoreNetwrokPTNRNCSTM-XGE/FESTM-1GEMLPPPMPLS_TUNNEL_MISMERGEMPLS_TUNNEL_LOCVHUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 22NB 1IMA/ATMCESNB2PTNPTNMPLS OAM故障指示(BDI)ETHNB3PTNMPLSPTNPTNMPLSPTNRNCCoreNetwrokPTNRNCSTM-XGE/

23、FESTM-1GEMLPPPMPLS_TUNNEL_LOCV綁定反向隧道綁定反向隧道MPLS_TUNNEL_BDIHUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 23NB 1IMA/ATMCESNB2PTNPTNMPLS OAM故障指示(FDI)ETHNB3PTNMPLSPTNPTNMPLSPTNRNCCoreNetwrokPTNRNCSTM-XGE/FESTM-1GEMLPPPMPLS_TUNNEL_FDIHUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 24NB 1IMA/

24、ATMCESNB2PTNPTNLSP PingETHNB3PTNMPLSPTNPTNMPLSPTNRNCCoreNetwrokPTNRNCSTM-XGE/FESTM-1GEMLPPPHUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 25NB 1IMA/ATMCESNB2PTNPTNLSP TraceRouteETHNB3PTNMPLSPTNPTNMPLSPTNRNCCoreNetwrokPTNRNCSTM-XGE/FESTM-1GEMLPPPHUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential

25、 Page 26NB 1IMA/ATMCESNB2PTNPTNPW VCCVETHNB3PTNMPLSPTNPTNMPLSPTNRNCCoreNetwrokPTNRNCSTM-XGE/FESTM-1GEMLPPPHUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 27MPLS APSETH_APS_TYPE_MISMATCH保護類型信息不一致1、兩端配置的1+1或1:1模式不一致;2、兩端配置的單端或雙端倒換的模式不一致;3、兩端配置的恢復式或非恢復式的模式不一致;ETH_APS_PATH_MISMATCHAPS工作、保護路徑不一致1、保

26、護組兩端設備配置的工作路徑、保護路徑不一致;2、物理鏈路上存在有錯連;ETH_APS_SWITCH_FAIL保護倒換失敗1、倒換失敗;ETH_APS_LOSTAPS幀丟失1、對方沒有配置保護;2、保護通道業務中斷;HUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 28目錄鏈路層故障維護 2 2物理層故障維護 1 1隧道層故障維護 3 3業務層故障維護 4 4數據采集 5 5HUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 29ETH業務pETH業務的故障維護主要是采用ETH Se

27、rvice OAM (802.1ag/Y.1731定義) , OAM實現的故障管理方式主要包括:pCC(Continuity Check),用于預設的端到端連通性檢查(proactive continuity check )。pLB(Loopback),用于命令觸發的(On-demand) 連通性檢查。pLT(Link Trace),命令觸發的以太網鏈路追蹤,用于故障的定位。pEthernet remote defect indication(RDI) ,遠端故障指示功能。HUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 30NB 1I

28、MA/ATMCESNB2PTNPTNETH OAM(CC)ETHNB3PTNETHPTNPTNMPLSPTNRNCCoreNetwrokPTNRNCSTM-XGE/FESTM-1GEMLPPPMEPMDETH_CFM_LOCHUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 31NB 1IMA/ATMCESNB2PTNPTNETH OAM(LB)ETHNB3PTNETHPTNPTNMPLSPTNRNCCoreNetwrokPTNRNCSTM-XGE/FESTM-1GEMLPPPMEPMDHUAWEI TECHNOLOGIES CO., L

29、TD.Huawei Confidential Page 32NB 1IMA/ATMCESNB2PTNPTNETH OAM(LT)ETHNB3PTNETHPTNPTNMPLSPTNRNCCoreNetwrokPTNRNCSTM-XGE/FESTM-1GEMLPPPMEPMDMIPHUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 33CES業務NB 1IMA/ATMCESNB2PTNPTNETHNB3PTNETHPTNPTNMPLSPTNRNCCoreNetwrokPTNRNCSTM-XGE/FESTM-1GEMLPPPCES_JTROVR

30、_EXCCES_JTROVR_EXCCES_JTRUDR_EXCCES_JTRUDR_EXCCES_LOSPKT_EXCCES_LOSPKT_EXCCES_MALPKT_EXCCES_MALPKT_EXCCES_MISORDERPKT_EXCCES_MISORDERPKT_EXCCES_STRAYPKT_EXCCES_STRAYPKT_EXClCES業務的故障檢測方式是監測相關告警。業務的故障檢測方式是監測相關告警。HUAWEI TECHNOLOGIES CO., LTD.Huawei Confidential Page 34CES業務CES_JTROVR_EXC抖動緩沖上溢次數超過閾值告警網

31、絡側端口在一段時間(默認為2.5s)內接收CES 報文的延時抖動導致抖動緩沖區上溢的CESoEth 幀所占百分比持續超過一個定義閾值CES_JTRUDR_EXC抖動緩沖下溢次數超過閾值告警網絡側端口在一段時間(默認為2.5s)內接收CES 報文的延時抖動導致抖動緩沖區下溢的CESoEth 幀所占百分比持續超過一個定義閾值CES_LOSPKT_EXC單位時間內丟包數超過閾值告警從網絡側端口上報CES 報文的丟包率在一定時內(默認為2.5s)持續超過一個定義閾值CES_MALPKT_EXC單位時間內畸幀數超過閾值告警當畸幀率超過閾值一定時間則上報告警CES_MISORDERPKT_EXC單位時間內亂序丟包數超過

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論