PTN常見故障處理_第1頁
PTN常見故障處理_第2頁
PTN常見故障處理_第3頁
PTN常見故障處理_第4頁
PTN常見故障處理_第5頁
已閱讀5頁,還剩62頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、huawei technologies co., ltdhuawei confidential security level: 2021-10-19ptnptn常見故障處理常見故障處理huawei technologies co., ltd.huawei confidential page 2目錄tunnel/pw故障定位 3 3常見故障定位流程 1 1鏈路故障定位 4 4保護故障定位 5 5時鐘故障定位 6 6業務故障定位 2 2帶內dcn故障定位 7 7故障定位典型案例 8 8參考文檔 9 9huawei technologies co., ltd.huawei confidential

2、page 3常見故障定位流程 業務業務tunnel鏈路鏈路huawei technologies co., ltd.huawei confidential page 4故障定位信息收集 (1)該業務是創建后一直沒有通,還是歷史上通,突然間不通。)該業務是創建后一直沒有通,還是歷史上通,突然間不通。(2)該業務端到端的完整路徑,包括源節點、目的節點、)該業務端到端的完整路徑,包括源節點、目的節點、transt節點。節點。(3)完整的業務定位信息,包括業務)完整的業務定位信息,包括業務id,業務屬性。,業務屬性。(4)業務的源宿端口信息。)業務的源宿端口信息。(5)業務所在的)業務所在的tunne

3、l和和pw信息。信息。(6)業務涉及的保護信息。)業務涉及的保護信息。(7)當前告警信息。)當前告警信息。(8)各種相關性能計數(如業務涉及的端口性能計數,業務本身的性能)各種相關性能計數(如業務涉及的端口性能計數,業務本身的性能計數等)。計數等)。huawei technologies co., ltd.huawei confidential page 5目錄tunnel/pw故障定位 3 3常見故障定位流程 1 1鏈路故障定位 4 4保護故障定位 5 5時鐘故障定位 6 6業務故障定位 2 2帶內dcn故障定位 7 7故障定位典型案例 8 8參考文檔 9 9huawei technolog

4、ies co., ltd.huawei confidential page 6ces業務故障定位流程 huawei technologies co., ltd.huawei confidential page 7ces業務常見故障現象 huawei technologies co., ltd.huawei confidential page 8ces業務常見故障現象(續) huawei technologies co., ltd.huawei confidential page 9ces業務故障常見原因l原因1:單板硬件故障、溫度過高或板間通信故障,無法正常工作。l原因2:處理板、接口板的接口

5、接入的信號丟失或惡化。l原因3:承載ces 業務的tunnel 或pw 中斷。l原因4:網元的同步時鐘源級別丟失,或同步時鐘源丟失。l原因5:承載ces 業務的pw 在單位時間內丟包數、錯包數或抖動緩沖超過閾值。huawei technologies co., ltd.huawei confidential page 10ces業務常見故障處理方法原因1:單板硬件故障、溫度過高或板間通信故障,無法正常工作。1. 查詢系統當前告警,是否有hard_bad、temp_over、commun_fail 或bus_err 告警,并確定上報告警的單板。2. 參考告警和性能事件參考手冊,處理hard_ba

6、d、temp_over、commun_fail 或bus_err 告警,排除故障。 原因2:處理板、接口板的接口接入的信號丟失或惡化。1. 查詢系統是否有t_alos、up_e1_ais 或down_e1_ais 告警,處理t_alos、up_e1_ais 或down_e1_ais 告警。2. 查詢系統是否有r_los 告警,處理r_los 告警。3. 查詢系統是否有laser_mod_err、lsr_will_die、in_pwr_abn、tem_ha 或lsr_bcm_alm 告警,處理laser_mod_err、lsr_will_die、in_pwr_abn、tem_ha 或lsr_bc

7、m_alm 告警。huawei technologies co., ltd.huawei confidential page 11ces業務常見故障處理方法(續)原因3:承載ces 業務的tunnel 或pw 中斷。1. 查詢系統是否存在mpls_tunnel_locv 告警。若存在,處理mpls_tunnel_locv 告警。2. 查詢系統是否存在pw_down 告警。若存在,處理pw_down 告警。原因4:網元的同步時鐘源級別丟失,或同步時鐘源丟失。1. 查詢系統是否有sync_c_los 或lti 告警,處理sync_c_los 或lti 告警。原因5:承載ces 業務的pw 在單位時

8、間內丟包數、錯包數或抖動緩沖超過閾值。1. 查詢系統是否有ces_lospkt_exc、ces_misorderpkt_exc 或ces_straypkt_exc 告警,處理ces_lospkt_exc、ces_misorderpkt_exc 或ces_straypkt_exc 告警。2. 查詢系統是否有ces_jtrudr_exc 或ces_jtrovr_exc 告警,處理ces_jtrudr_exc 或ces_jtrovr_exc 告警。huawei technologies co., ltd.huawei confidential page 12eth業務故障定位流程 開始有hard_b

9、ad/fpga_abn/commun_fail/bd_status單板故障告警?復位/更換單板eth業務恢復?有r_los(光纖接入)/eth_los(網線接入)告警?檢查輸入光功率,處理光纖或網線問題eth業務恢復?是是否否否否有eth_link_down告警?檢查端口的配置,包括端口屬性,端口工作模式等問題eth業務恢復?否否eth業務配置錯誤?重新配置eth業務eth業務恢復?否否是是是是是是是否存在環回配置?解除環回eth業務恢復?否否是是結束聯系華為工程師協助分析處理huawei technologies co., ltd.huawei confidential page 13eth

10、業務故障常見現象huawei technologies co., ltd.huawei confidential page 14eth業務故障常見原因 l原因1:單板硬件故障、溫度過高或板間通信故障,無法正常工作。l原因2:接收信號丟失。l原因3:以太網網口連接錯誤,端口協商失敗。l原因4:端口配置了環回。l原因5:接口流量限值配置過低,源宿兩端接口配置不一致。huawei technologies co., ltd.huawei confidential page 15eth業務常見故障處理方法 原因1:單板硬件故障、溫度過高或板間通信故障,無法正常工作。1. 查詢系統當前告警,是否有har

11、d_bad、temp_over、commun_fail 或bus_err 告警,并確定上報告警的單板。2. 參考告警和性能事件參考手冊,處理hard_bad、temp_over、commun_fail 或bus_err 告警。原因2:接收信號丟失。1. 查詢系統是否有eth_los 或eth_auto_link_down 告警,處理eth_los 或eth_auto_link_down 告警。2. 查詢系統是否有r_los 告警,處理r_los 告警。3. 查詢系統是否有laser_shut 或lsr_will_die 告警,處理laser_shut或lsr_will_die 告警。4. 查詢

12、系統是否有mac_fcs_exc 告警,處理mac_fcs_exc 告警。huawei technologies co., ltd.huawei confidential page 16eth業務常見故障處理方法(續) 原因3:以太網網口連接錯誤,端口協商失敗。1. 查詢系統是否有eth_link_down 告警,處理eth_link_down 告警。原因4:端口配置了環回。1. 查詢系統是否有loop_alm 告警,處理loop_alm 告警。2. 查詢系統是否有eth_efm_loopback 告警,處理eth_efm_loopback告警。原因5:接口流量限值配置過低,源宿兩端接口配置不

13、一致。1. 查詢系統是否有flow_over 告警,處理flow_over 告警。2. 查詢系統是否有eth_cfm_unexperi 告警,處理eth_cfm_unexperi 告警。huawei technologies co., ltd.huawei confidential page 17目錄tunnel/pw故障定位 3 3常見故障定位流程 1 1鏈路故障定位 4 4保護故障定位 5 5時鐘故障定位 6 6業務故障定位 2 2帶內dcn故障定位 7 7故障定位典型案例 8 8參考文檔 9 9huawei technologies co., ltd.huawei confidentia

14、l page 18tunnel故障定位流程 huawei technologies co., ltd.huawei confidential page 19tunneltunnel故障常見現象和原因故障常見現象和原因常見現象常見現象l mpls tunnel 創建失敗,業務不通。l mpls tunnel 故障,業務中斷。l 保護倒換失敗,業務中斷或出現丟包、誤碼。常見原因常見原因l 原因1:路由失敗。l 原因2:交叉創建失敗。l 原因3:tunnel 所在的物理鏈路故障。l 原因4:保護倒換失敗。huawei technologies co., ltd.huawei confidential

15、 page 20tunneltunnel常見故障處理方法常見故障處理方法原因1:路由失敗。1. 對照網絡規劃,檢查tunnel 兩端端口參數配置是否正確,例如端口ip。修正不正確的端口參數后,再次創建tunnel。2. 檢查tunnel 首末節點所在的網元間是否存在完整可達的鏈路。若不存在,修復鏈路中殘缺或故障的部分。3. 可選: 確認動態tunnel 配置的“route constraint”條件和“color”(親和屬性)是否正確。修正不正確的參數信息,具體操作請參見使用路徑方式創建動態mpls tunnel 和frr 保護。4. 可選: 如果tunnel 配置了帶寬,檢查鏈路帶寬是否滿足

16、tunnel 的要求。原因2:交叉創建失敗。1. 檢查網絡中是否存在不同的網元使用相同的網段。如果存在,需要修改端口ip地址。2. 檢查tunnel 是否配置了不兼容的保護特性。詳細內容請參見版本說明書。3. 查看tunnel 所經過的網元或單板,確認已創建tunnel 個數是否已經達到了最大值。如果是,需要重新規劃或刪除冗余的tunnel。huawei technologies co., ltd.huawei confidential page 21tunneltunnel常見故障處理方法(續)常見故障處理方法(續)原因3:tunnel 所在的物理鏈路故障。1. 查詢系統中是否存在hard_

17、bad、r_los、eth_los、ppp_lcp_fail 或mp_down 等告警,指示tunnel 使用的物理鏈路故障。2. 若存在,優先處理hard_bad、r_los、eth_los、ppp_lcp_fail 或mp_down 告警。3. 查看并處理系統中存在的下列告警:mpls_tunnel_bdi、mpls_tunnel_excess、mpls_tunnel_fdi、mpls_tunnel_locv、mpls_tunnel_mismatch、mpls_tunnel_mismerge、mpls_tunnel_sd、mpls_tunnel_sf、mpls_tunnel_unknown

18、4. 檢查對端設備是否存在單板故障或網元復位等異常狀況。排除對端設備的異常情況。原因4:保護倒換失敗。1. mpls aps 保護倒換失敗,參考保護故障處理。huawei technologies co., ltd.huawei confidential page 22pwpw故障常見現象和原因故障常見現象和原因常見現象常見現象l pw 創建失敗,業務不通。l pw 故障,業務中斷或出現丟包、誤碼。常見原因常見原因l 原因1:ldp 會話創建失敗,pw 創建不成功(動態)。l 原因2:物理鏈路故障,ldp 會話失效。l 原因3:pw 交叉建立失敗。l 原因4:pw 所在的tunnel 故障。h

19、uawei technologies co., ltd.huawei confidential page 23pwpw常見故障處理方法常見故障處理方法原因1:ldp 會話創建失敗,pw 創建不成功(動態)。1. 檢查pw 兩端網元是否配置了ldp 對等體。若未配置,需要重新配置ldp 對等體。2. 檢查pw 兩端參數是否配置正確。例如:l“control word use policy”,是否一端配置為“must use”,另一端配置為“nonuse”。l對ethernet 業務,兩端的“mtu”是否配置一致。l對ces 業務,兩端的“rtp head”、“packet loading tim

20、e”等參數是否配置一致。原因2:物理鏈路故障,ldp 會話失效。1. 檢查pw 首末節點間物理鏈路是否正常,系統中是否存在hard_bad、laser_mod_err、r_los 或eth_los 等告警。2. 若存在,優先處理hard_bad、laser_mod_err、r_los 或eth_los告警。3. 查詢并處理系統中存在的pw_down、pw_droppkt_exc 或pw_exc_traffic 告警。4. 檢查對端設備是否存在單板故障或網元復位等異常狀況。排除對端設備的異常情況。huawei technologies co., ltd.huawei confidential p

21、age 24pwpw常見故障處理方法(續)常見故障處理方法(續)原因3:pw 交叉建立失敗。1. 查看pw 所經過的網元或單板,確認已創建pw 個數是否已經達到了最大值。如果是,需要重新規劃或刪除冗余的pw。原因4:pw 所在的tunnel 故障。1. tunnel 故障,參考tunnel故障處理。huawei technologies co., ltd.huawei confidential page 25目錄tunnel故障定位 3 3常見故障定位流程 1 1鏈路故障定位 4 4保護故障定位 5 5時鐘故障定位 6 6業務故障定位 2 2帶內dcn故障定位 7 7故障定位典型案例 8 8參

22、考文檔 9 9huawei technologies co., ltd.huawei confidential page 26鏈路故障定位流程 huawei technologies co., ltd.huawei confidential page 27bts 1cescesbts 2ptnptnetheth鏈路告警排查鏈路告警排查ethbts 3ptnmplsptnptnmplsptnbsccorenetwrokptnbsc10g/gege/festm-1stm-110g/geeth_los光信號丟失故障原因:故障原因:(1)光纖斷;光纖斷;(2)光模塊壞;光模塊壞;(3)光衰減過大;光衰

23、減過大;eth_link_down網口連接故障故障原因:故障原因:兩端工作模式不一致,造成協商失敗;電纜、光纖連接或者對端設備故障。兩端工作模式不一致,造成協商失敗;電纜、光纖連接或者對端設備故障。mac_fcs_exc誤碼越限故障原因:故障原因:mac層檢測到誤碼越限;線路信號劣化;光纖性能劣化;光口不潔凈層檢測到誤碼越限;線路信號劣化;光纖性能劣化;光口不潔凈huawei technologies co., ltd.huawei confidential page 28bts 1cescesbts 2ptnptnsdhsdh鏈路告警排查鏈路告警排查ethbts 3ptnmplsptnptn

24、mplsptnbsccorenetwrokptnbscgege/festm-1stm-1ge/10ger_los光信號丟失故障原因:故障原因:(1)斷纖;)斷纖; (2)線路衰耗過大;)線路衰耗過大; (3)對端站發送部分故障,線路發送失效;)對端站發送部分故障,線路發送失效;r_loc時鐘丟失故障原因:故障原因:(1)接收到的信號失效;接收到的信號失效;(2)時鐘提取模塊故障;時鐘提取模塊故障;r_lof幀丟失故障原因:故障原因:(1)接收信號衰減過大;)接收信號衰減過大; (2)對端站發送信號無幀結構;)對端站發送信號無幀結構; (3)本板接收方向故障)本板接收方向故障huawei tec

25、hnologies co., ltd.huawei confidential page 29bts 1cescesbts 2ptnptne1e1鏈路告警排查鏈路告警排查ethbts 3ptnmplsptnptnmplsptnbsccorenetwrokptnbscge/10gege/festm-1stm-1ge/10get_alos信號丟失故障原因:故障原因:(1)e1/t1業務未接入;業務未接入; (2)ddf架側架側e1/t1接口輸出端口脫落或松動;接口輸出端口脫落或松動; (3)本站)本站e1/t1接口輸接口輸入端口脫落或松動;入端口脫落或松動; (4)單板故障;)單板故障; (5)電纜

26、故障)電纜故障alm_e1rai遠端告警指示故障原因:故障原因:對端有告警;對端有告警;huawei technologies co., ltd.huawei confidential page 30mlppp故障定位流程 huawei technologies co., ltd.huawei confidential page 31mlpppmlppp故障常見現象故障常見現象huawei technologies co., ltd.huawei confidential page 32mlppp故障常見原因 l原因1:mp 組失效。l原因2:mp 組成員端口接收信號丟失。l原因3:高階通道或

27、低階通道失效。l原因4:mp 組成員兩端協議協商失敗。l原因5:mp 組成員延時超過閾值。l原因6:業務通道誤碼超限。huawei technologies co., ltd.huawei confidential page 33mlppp常見故障處理方法 原因1:mp 組失效。1. 查詢是否存在mp_down 告警,參考告警和性能事件參考手冊,清除mp_down 告警。原因2:mp 組成員端口接收信號丟失。1. 檢查mp 組各成員是否存在r_los、ms_ais 或t_alos 告警,清除r_los、ms_ais 或t_alos 告警。原因3:高階通道或低階通道失效。1. 檢查mp 組各成員

28、是否存在hp_slm 或hp_uneq 告警。若存在,清除hp_slm 或hp_uneq 告警。2. 檢查mp 組各成員是否存在tu_ais_vc12 或tu_lop_vc12 告警。若存在,清除tu_ais_vc12 或tu_lop_vc12 告警。huawei technologies co., ltd.huawei confidential page 34mlppp常見故障處理方法(續) 原因4:mp 組成員兩端協議協商失敗。1. 檢查mp 組各成員是否存在ppp_lcp_fail 或ppp_ncp_fail 告警。若存在,修改mp 組成員兩端配置,清除ppp_lcp_fail 或ppp

29、_ncp_fail告警。原因5:mp 組成員延時超過閾值。1. 檢查mp 組是否存在mp_delay 告警,清除mp_delay 告警。原因6:業務通道誤碼超限。1. 檢查mp 組各成員是否存在b1_exc、b2_exc、b3_exc 或bip_exc 等告警,清除b1_exc、b2_exc、b3_exc 或bip_exc 告警。huawei technologies co., ltd.huawei confidential page 35目錄tunnel故障定位 3 3常見故障定位流程 1 1鏈路故障定位 4 4保護故障定位 5 5時鐘故障定位 6 6業務故障定位 2 2帶內dcn故障定位

30、7 7故障定位典型案例 8 8參考文檔 9 9huawei technologies co., ltd.huawei confidential page 36aps故障定位流程 huawei technologies co., ltd.huawei confidential page 37apsaps故障常見現象故障常見現象huawei technologies co., ltd.huawei confidential page 38aps故障常見原因 l原因1:aps 保護組兩端配置不一致。l原因2:aps 保護組兩端協議狀態未激活。l原因3:光纖或電纜連接錯誤。l原因4:保護通道所在單板存

31、在硬件類告警,無法發送aps 幀。l原因5:系統存在時鐘類告警。l原因6:工作tunnel 或保護tunnel 故障。huawei technologies co., ltd.huawei confidential page 39aps常見故障處理方法 原因1:aps 保護組兩端配置不一致。1. 查詢是否存在eth_aps_path_mismatch 或eth_aps_type_mismatch 告警,參考告警和性能事件參考手冊,清除告警。原因2:aps 保護組兩端協議狀態未激活。1. 檢查aps 保護組是否存在eth_aps_lost 或eth_aps_switch_fail 告警,清除告警

32、。原因3:光纖或電纜連接錯誤。1. 檢查光纖或電纜連接是否正確,若不正確,重新連接光纖或電纜。huawei technologies co., ltd.huawei confidential page 40aps常見故障處理方法(續) 原因4:保護通道所在單板存在硬件類告警,無法發送aps 幀。1. 檢查aps 保護通道所在單板是否存在hard_bad、commun_fail 或bus_err 等硬件類告警,若存在,清除告警后,查看aps 保護組是否能夠正常倒換。原因5:系統存在時鐘類告警。1. 檢查系統是否存在tr_loc、sync_c_los 或lti 等時鐘類告警, 若存在,清除告警后,

33、查看aps 保護組是否能夠正常倒換。原因6:保護tunnel 故障。1. 檢查工作tunnel 或保護tunnel 是否存在tunnel 級別的告警,若存在,則該tunnel 已失去保護能力,優先清除該tunnel 存在的告警后,查看aps保護組是否能夠正常倒換。huawei technologies co., ltd.huawei confidential page 41lmsp故障定位流程 huawei technologies co., ltd.huawei confidential page 42lmsplmsp故障常見現象故障常見現象huawei technologies co.,

34、ltd.huawei confidential page 43lmsp故障常見原因 l原因1:保護通道單板故障或單板離線,無法正常工作。l原因2:保護通道接收側信號丟失或不可用。l原因3:線性復用段單雙端模式不匹配。l原因4:k1、k2 字節失配或k2 字節失配。l原因5:保護通道接收信號中復用段b2 信號劣化或誤碼過量。huawei technologies co., ltd.huawei confidential page 44lmsp常見故障處理方法 原因1:保護通道單板故障或單板離線,無法正常工作。1. 查詢系統當前告警,是否有hard_bad 或bd_status 告警,并確定上報告

35、警的單板, 參考告警和性能事件參考手冊,處理hard_bad 或bd_status 告警。原因2:保護通道接收側信號丟失或不可用。1. 查詢系統是否有r_los 或r_lof 告警,處理r_los 或r_lof 告警。2. 查詢系統是否有ms_ais 告警,處理ms_ais 告警。原因3:線性復用段單雙端模式不匹配。1. 查詢系統是否有lps_uni_bi_m 告警,處理lps_uni_bi_m 告警。原因4:k1、k2 字節失配或k2 字節失配。1. 查詢系統是否有k1_k2_m 或k2_m 告警,處理k1_k2_m 或k2_m 告警。原因5:保護通道接收信號中復用段b2 信號劣化或誤碼過量

36、。1. 查詢系統是否有b2_sd 或b2_exc 告警,處理b2_sd 或b2_exc 告警。huawei technologies co., ltd.huawei confidential page 45lag故障定位流程 huawei technologies co., ltd.huawei confidential page 46laglag故障常見現象故障常見現象huawei technologies co., ltd.huawei confidential page 47lag故障常見原因 l原因1:聚合組兩端網元配置錯誤。l原因2:聚合組成員端口工作模式設置為半雙工。l原因3:聚合

37、組成員端口配置了環回。l原因4:聚合組成員端口連接故障或丟失。huawei technologies co., ltd.huawei confidential page 48lag常見故障處理方法 原因1:聚合組兩端網元配置錯誤。1. 查詢當前告警,是否存在lag_down 或lag_member_down 告警。2. 檢查聚合組兩端網元配置是否不一致,若不一致,修改兩端網元配置一致后,查看告警是否清除。原因2:聚合組成員端口工作模式設置為半雙工。1. 檢查聚合組各成員端口的工作模式是否設置為半雙工,若存在,修改端口工作模式為全雙工。原因3:聚合組成員端口配置了環回。1. 檢查聚合組各成員端口

38、是否存在loop_alm 告警。若存在,重新設置端口的環回狀態,清除loop_alm 告警。2. 檢查聚合組各成員端口是否存在eth_efm_loopback 告警。若存在,禁止遠端環回,清除eth_efm_loopback 告警。原因4:聚合組成員端口連接故障或丟失。1. 檢查聚合組各成員端口是否存在eth_los 或eth_link_down 告警, 若存在,參考告警和性能事件參考手冊,清除告警。huawei technologies co., ltd.huawei confidential page 49tps故障定位流程 huawei technologies co., ltd.hua

39、wei confidential page 50tpstps故障常見現象和原因故障常見現象和原因l原因1:工作板故障,觸發tps 保護倒換。l原因2:工作板硬復位,觸發tps 保護倒換。l原因3:人工下發強制倒換命令。l原因4:保護板不在位或故障。l原因5:同一tps 保護組內其它工作板已發生tps 保護倒換,無空余的保護板。huawei technologies co., ltd.huawei confidential page 51tps常見故障處理方法 原因1:工作板故障,觸發tps 保護倒換。1. 查詢當前告警,檢查工作板是否存在hard_bad 等硬件類告警, 若存在,更換上報告警的

40、單板。經過“等待恢復時間”后,業務將自動倒換回工作板。原因2:工作板硬復位,觸發tps 保護倒換。1. 在網管的“運行態”槽位視圖中查看該單板的工作狀態是否為藍色,若是,則該單板處于硬復位狀態。2. 等待3 至5 分鐘,當單板的工作狀態轉成綠色時,單板完成硬復位。3. 再經過“等待恢復時間”后,業務將自動倒換回工作板,tps 恢復原保護狀態。原因3:人工下發強制倒換命令。1. 清除倒換,恢復原tps 保護狀態。huawei technologies co., ltd.huawei confidential page 52tps常見故障處理方法(續) 原因4:保護板不在位或故障。1. 查詢當前告

41、警,檢查保護板是否存在bd_status 告警或hard_bad 等硬件類告警, 若存在,參考告警和性能事件參考手冊處理保護板的告警,或更換保護板。原因5:同一tps 保護組內其它工作板已發生tps 保護倒換,無空余的保護板。1. 查詢本網元是否存在tps_alm 告警,若存在,說明已有其它工作板觸發了tps 保護倒換,無空余的保護板。2. 排除已觸發tps 保護倒換的工作板的故障,使保護板恢復保護狀態后,確認是否可正常進行tps 保護倒換,查看告警是否消除。huawei technologies co., ltd.huawei confidential page 53目錄tunnel故障定位

42、 3 3常見故障定位流程 1 1鏈路故障定位 4 4保護故障定位 5 5時鐘故障定位 6 6業務故障定位 2 2帶內dcn故障定位 7 7故障定位典型案例 8 8參考文檔 9 9huawei technologies co., ltd.huawei confidential page 54時鐘故障常見現象和原因時鐘故障常見現象和原因l原因1:優先級表中業務板上的同步時鐘源級別丟失。l原因2:同步時鐘源丟失,網元的時鐘處于不正常狀態。l原因3:在ssm 模式下時鐘源發生倒換,網元跟蹤的時鐘源也發生了倒換。l原因4:同步時鐘源的信號劣化。l原因5:外部時鐘源丟失。l原因6:時鐘進入非跟蹤工作模式。

43、l原因7:外部時間源丟失。huawei technologies co., ltd.huawei confidential page 55時鐘常見故障處理方法 原因1:優先級表中業務板上的同步時鐘源級別丟失。1. 查詢系統是否有sync_c_los 告警,參考告警和性能事件參考手冊,處理sync_c_los 告警。原因2:同步時鐘源丟失,網元的時鐘處于不正常狀態。1. 查詢系統是否有lti 告警,處理lti 告警。原因3:在ssm 模式下時鐘源發生倒換,網元跟蹤的時鐘源也發生了倒換。1. 查詢系統是否有s1_syn_change 告警,處理s1_syn_change 告警。原因4:同步時鐘源的

44、信號劣化。1. 查詢系統是否有syn_bad 告警,處理syn_bad 告警。原因5:外部時鐘源丟失。1. 查詢系統是否有ext_sync_los 告警,處理ext_sync_los 告警。原因6:時鐘進入非跟蹤工作模式。1. 查詢系統是否有clk_no_trace_mode 告警,處理clk_no_trace_mode 告警。原因7:外部時間源丟失。1. 查詢系統是否有ext_time_loc 告警,處理ext_time_loc 告警。huawei technologies co., ltd.huawei confidential page 56目錄tunnel故障定位 3 3常見故障定位流

45、程 1 1鏈路故障定位 4 4保護故障定位 5 5時鐘故障定位 6 6業務故障定位 2 2帶內dcn故障定位 7 7故障定位典型案例 8 8參考文檔 9 9huawei technologies co., ltd.huawei confidential page 57帶內dcn故障定位流程 huawei technologies co., ltd.huawei confidential page 58帶內帶內dcndcn故障常見現象和原因故障常見現象和原因常見原因常見原因l原因1:全網內的網元id、網元ip 或者子網掩碼存在沖突。l原因2:故障網元的帶內dcn 端口未使能,或對接端口參數配置不

46、一致。l原因3:故障網元與網管之間的物理連接中斷。l原因4:接收信號丟失或接收光功率過低,無法提取dcn 報文。l原因5:單板故障。l原因6:dcn 穿越的第三方網絡不健康,引入dcn 風暴或dcn 中斷。l原因7:帶內dcn 通道帶寬配置過低。l原因8:故障網元主控板正在復位或發生了主備倒換,帶內dcn 報文得不到響應。常見現象常見現象l網管與網元通信中斷,網管上網元圖標變灰色,網元脫管。l網管操作命令沒有響應。若響應中斷時間持續超過2 分鐘,網管與網元通信中斷。l網管查詢信息部分丟失。huawei technologies co., ltd.huawei confidential page

47、 59帶內dcn常見故障處理方法 原因1:全網內的網元id、網元ip 或者子網掩碼存在沖突。1. 此原因一般由全網中新添加的網元引入。對照網元規劃表,檢查新網元的網元id、網元ip、子網掩碼的配置是否正確。 若配置錯誤,或與現有網元存在沖突,請正確配置新網元的參數。原因2:故障網元的帶內dcn 端口未使能,或對接端口參數配置不一致。1. 檢查是否存在光纖或電纜連接到默認使能dcn 的端口。如果沒有,換用默認使能dcn 的端口。2. 檢查鏈路兩端的端口是否已使能dnc。如果沒有,使能端口的帶內dcn。3. 檢查兩端端口的參數配置是否一致,例如以太網端口的工作模式。如果不一致,修改參數配置使兩端一

48、致。原因3:故障網元與網管之間的物理連接中斷。1. 檢查故障網元的網線或光纖是否從端口中脫落。如果是,重新插上網線或光纖。原因4:接收信號丟失或接收光功率過低,無法提取dcn 報文。1. 檢查網元的歷史告警中是否存在r_los、eth_los 或in_pwr_abn 等告警,清除相關告警。huawei technologies co., ltd.huawei confidential page 60帶內dcn常見故障處理方法(續) 原因5:單板故障。1. 查詢單板的歷史告警中是否存在hard_bad 或temp_over 告警,若存在,更換上報告警的單板。原因6:dcn 穿越的第三方網絡不健康

49、,引入dcn 風暴或dcn 中斷。1. 若帶內dcn 通信穿越了第三方網絡,需要檢查第三方網絡中是否存在端口環回、物理通道中斷等故障。如果存在,需要立即排除第三方網絡中的故障。原因7:帶內dcn 通道帶寬配置過低。1. 當端口配置的業務數量超過某一數目時,可能造成部分查詢信息丟失,此時需要適當增大帶內dcn 通道的帶寬配置。原因8:故障網元主控板正在復位或發生了主備倒換,帶內dcn 報文得不到響應。1. 觀察主控板的prog 指示燈是否處于綠燈閃爍狀態,若是,則主控板正處于復位狀態。等prog 指示燈常亮綠色時,主控板完成復位,dcn 將自動恢復連接。2. 若dcn 未恢復響應,檢查其它單板是

50、否發生保護倒換,造成帶內dcn 報文處于重路由狀態。3. 若存在單板發生保護倒換,等待dcn 完成重路由后,將自動恢復響應。huawei technologies co., ltd.huawei confidential page 61目錄tunnel故障定位 3 3常見故障定位流程 1 1鏈路故障定位 4 4保護故障定位 5 5時鐘故障定位 6 6業務故障定位 2 2帶內dcn故障定位 7 7故障定位典型案例 8 8參考文檔 9 9huawei technologies co., ltd.huawei confidential page 62網元id id 重復導致無法遠程登錄網元現象:新建的ptn 網絡中,ne01、ne02 和ne03 三個ptn 網元構成鏈形拓撲。可以從ne02遠程登錄到ne03,但從ne01 卻無法遠程登錄ne03。分析

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論