華為交換設備MGW重大故障判斷規則V1.doc_第1頁
華為交換設備MGW重大故障判斷規則V1.doc_第2頁
華為交換設備MGW重大故障判斷規則V1.doc_第3頁
華為交換設備MGW重大故障判斷規則V1.doc_第4頁
華為交換設備MGW重大故障判斷規則V1.doc_第5頁
免費預覽已結束,剩余9頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

中國移動通信集團湖北有限公司網管中心重大告警判定規則-華為MGW部分1、全局業務阻斷11.1 虛擬媒體網關遷移出業務態11.2 M3UA目的信令點不可達32、某局向信令或話路全阻52.1 MTP3目的信令點不可達53、其它可能引起全局阻斷的重大告警83.1 單機框不可用83.2 CPU擁塞93.3 L2UA鏈路組故障121、全局業務阻斷1.1 虛擬媒體網關遷移出業務態【告警標題】: 虛擬媒體網關遷移出業務態【告警編號】: 1802【告警正文】:參數名稱 含義 備注 機框號 產生告警的機框編號 無 槽位號 產生告警的槽位編號 無 板位置 產生告警的板位置 無 板類型 產生告警的單板類型 無 板組號 產生告警的單板的板組號 無 虛擬媒體網關號 產生告警的虛擬媒體網關號 無 原因 單板遷移出業務態的原因 告警上報時填寫統一的遷移原因,具體原因可以查看系統日志 例如:暫無【告警含義】:當虛擬媒體網關因某種外界原因遷移出業務態時產生此告警。【設備類型】:G9-MGW【告警關聯邏輯】:無關聯告警。【對系統的影響】:虛擬媒體網關退出業務后,該虛擬媒體網關無法接受新的呼叫,而且也會影響已有的呼叫,系統會在特定的時間內釋放已有的呼叫。【告警產生原因】:通過MML命令切換MGC;人工或MGC要求網關退出業務;H248鏈路故障;MGC退出業務;MGC要求MGW重新注冊。【告警處理步驟】:查看MGW狀態、H248信令鏈路狀態。DSP VMGW: VMGWID=0;%RETCODE = 0 執行成功VMGW狀態= 業務態 /正常情況下為業務態,欺余均為異常VMGW目前工作在MGC = 0 序號 = 0 Mgc索引 = 0 主備地位 = 主用控制器 序號 = 1 Mgc索引 = 沒有配置 主備地位 = 備用控制器 序號 = 2 Mgc索引 = 沒有配置 主備地位 = 備用控制器端點資源使用情況端點類型 配置數量 使用數量 狀態- IP 端點 86016 0 開TDM 端點 400384 41 開ATM 端點 221184 0 開- END查看H248信令鏈路狀態DSP H248LNK:MODE=VMGW;%RETCODE = 0 執行成功H248信令鏈路連接信息- 序號 = 0 PPU板板組號 = 0 H248信令鏈路號 = 0 虛擬媒體網關號 = 2 媒體網關控制器號 = 0 本地IP地址 = 10.25.66.250 本地端口號 = 5000 目的IP地址 = 10.25.66.249 目的端口號 = 7200 鏈路名稱 = NO_NAME 鏈路狀態 = UP /正常狀態為UP,其余為異常 協議類型 = SCTP通知各分公司檢查是否人工退出服務、檢查SERVER上MGC狀態、MC接口板狀態、以及是否傳輸故障等。【重大故障定位】:虛擬媒體網關退出業務后,該虛擬媒體網關無法接受新的呼叫,而且也會影響已有的呼叫,符合第(5)、(6)、(9)條判定規則,定位為重大故障。1.2 M3UA目的信令點不可達【告警標題】: M3UA目的信令點不可達【告警編號】: 3993【告警正文】:參數名稱 含義 備注 目的實體索引 產生告警的目的信令點對應的目的實體索引 無 目的信令點 產生告警的目的信令點編碼 無 目的實體名稱 產生告警的目的實體的名稱 如果沒有定義名稱,則顯示為“NULL” 本地實體索引 產生告警的目的實體對應的本地實體索引 無 源信令點 產生告警的源信令點編碼 無 本地實體名稱 產生告警的本地信令點編碼 如果沒有定義名稱,則顯示為“NULL” 網絡標識 產生告警的目的信令點編碼對應的 網絡標識 無 例如:暫無【告警含義】:當系統檢測到M3UA目的實體不可達時產生此告警,表示從本局到目的實體的所有路由都無效。【設備類型】:G9-MGW【告警關聯邏輯】:無關聯告警。【對系統的影響】:對于MGW,M3UA目的實體就是SERVER,所以該告警即表示至至目的實體的所有路由均無效,M3UA信令業務全部阻斷。一般來說只有關口局上才會用到M3UA適配,所以M3UA目的信令不可達告警只見于關口局。【告警產生原因】:到該目的實體所有路由均無效。【告警處理步驟】:根據告警定位信息確定故障目的實體索引,查看至該目的實體的狀態。LST M3UADE:; /作用:得出告警相對應目的實體索引號(如果告警定位信息中有目的實體索引,可以不執行此步);DSP M3UADE:MODE=ByDsp,DEX=65; / /查看至告警目的實體的狀態RETCODE = 0 執行成功顯示M3UA目的實體狀態- 目的實體索引 = 65 名稱 = YCHD3 擁塞標志 = 否 目的實體狀態 = 可達 /正常為可達,其余均為異常(結果個數 = 1)查看是否同時存在相同目的實體的M3UA路由無效3992、M3UA目的實體路由無效告警3991,還是否伴有M3UA鏈路組、M3UA鏈路告警,查看相關M3UA鏈路狀態DSP M3LKS、DSP M3LNK;如果伴有H248信令鏈路故障,則說明MC口出現故障,參照MGW退出服務處理。通知各分公司檢查SPF、BSG單板狀態、是否修改數據、是否人工刪除、以及是否傳輸故障等。【重大故障定位】:M3UA目的實體不可達后表示至SERVER的信令適配中斷,符合第(5)、(6)、(9)條判定規則,定位為重大故障。2、某局向信令或話路全阻2.1 MTP3目的信令點不可達【告警標題】: MTP3目的信令點不可達【告警編號】: 3980【告警正文】:參數名稱 含義 備注 板類型 產生該告警的SPF板的單板類型 無 目的信令點索引 目的信令點的索引 無 網絡標識 目的信令點的網絡標識 無 目的信令點編碼 目的信令點的編碼 無 目的信令點名稱 目的信令點的名稱 如果沒有定義名稱,則顯示為“NULL” 源信令點編碼 源信令點的編碼 無 源信令點名稱 源信令點的名稱 如果沒有定義名稱,則顯示為“NULL” 例如:暫無【告警含義】:當SPF單板軟件檢測到MTP3目的信令點不可達時,產生此告警 。【設備類型】:G9-MGW【告警關聯邏輯】:該告警由“3981 MTP3鏈路故障”告警引發。【對系統的影響】:MTP3目的信令點不可達表明到達該目的信令點的所有MTP3信令鏈路不可用。由于MTP3目的信令點就是MTP3信令網絡的鄰接局向,所以MTP3目的信令點不可達將導致MTP3承載的7號信令消息無法到達該鄰接局向,導致所有到達該局向的ISUP/TUP/SCCP等消息中斷。 【告警產生原因】:MTP3鏈路所使用MTP2鏈路對應的E32/T32/S2L單板與對端設備之間物理連接中斷,或者端口故障,導致無法與對端設備正常通信;由于時鐘等原因導致MTP3鏈路所使用MTP2鏈路對應的E32/T32/S2L單板接收信元有誤碼;兩端設備之間的物理連接錯誤,比如連接到錯誤的端口;配置錯誤,包括MTP3兩端設備的源信令點、目的信令點、路由、MTP3鏈路、MTP2鏈路參數配置不正確,都將導致無法完成正常的信令處理過程;對端設備故障。【告警處理步驟】:根據告警定位信息確定故障目的信令點,查看至該DSP的狀態。LST N7DSP:;/作用:得出告警相對應目的信令點的DSP索引號(如果告警定位信息中有目的信令點索引,可以不執行此步);LST N7DSP:;RETCODE = 0 執行成功查詢MTP3目的信令點- 索引 名稱 對應的源信令點編碼 網絡標識 目的信令點編碼 選擇掩碼 信令轉接功能 相鄰 37 YCH-3G-MGW 11ffad 國內網 11ffe4 15 是 是 55 YCHG1 11ffad 國內網 11ff08 15 是 是 56 YCH-3G-MGC 11ffad 國內網 11ffe3 15 否 是 57 YCHG3 11ffad 國內網 11ff21 15 是 是 (結果個數 = 20)DSP N7DSP:INDEX=57;/查看至告警目的信令點是否可達RETCODE = 0 執行成功查詢MTP3目的信令點狀態- 目的信令點索引 = 57 是否可達 = 是 /正常為是,除此之外其余均為異常 是否擁塞 = 否(結果個數 = 1)通知各分公司檢查硬件連線、單板狀態、是否修改數據、是否人工閉塞、以及是否傳輸故障等。【重大故障定位】:符合第(9)條“某局向信令或話務全阻”,定位為重大故障。3、其它可能引起全局阻斷的重大告警3.1 單機框不可用【告警標題】: 單機框不可用【告警編號】: 41【告警正文】:參數名稱 含義 備注 機框號 產生告警的單板的機框號 例如:暫無【告警含義】:該機框與主控框的通訊失敗,導致主控框認為該機框不可用,上報此告警。【設備類型】:G9-MGW【告警關聯邏輯】:無關聯告警。【對系統的影響】:如果單機框出現故障,將造成該機框上的業務中斷。【告警產生原因】:該機框中的所有主控板(FMPU/MMPU/FTNC/MTNC)都發生了復位現象,導致與主控框通訊中斷。【告警處理步驟】:查看該機框MPU單板狀態:DSP BRD:BT=MPU;%RETCODE = 0 執行成功槽位記錄表-框號 槽號 位置 板類型 硬件類型 板組號 備份狀態 主備狀態 管理狀態 安裝狀態 操作狀態0 7 前插 MPU MMPU 0 1+1 備份 主用 安裝 正常 0 8 前插 MPU MMPU 0 1+1 備份 備用 安裝 正常 2 8 前插 MPU MMPU 1 1+1 備份 主用 安裝 正常 2 7 前插 MPU MMPU 1 1+1 備份 備用 安裝 正常 /正常情況下單板狀態為正常,其余為異常通知各分公司進行現場處理,對該框MPU板進行復位,對于復位仍無法啟動的,檢查單板單板軟件版本是否一致,更換版本加載,或更換單板。【重大故障定位】:單機框不可用將造成該機框上的業務中斷,如果是中心交換框(機框號為0)不可用,將造成全局業務的阻斷,符合第(5)、(6)、(9)條判定規則,定位為重大故障。3.2 CPU擁塞【告警標題】: CPU擁塞【告警編號】: 1402【告警正文】:參數名稱 含義 備注 機框號 產生告警的機框編號 無 槽位號 產生告警的槽位編號 無 板位置 產生告警的單板位置 無 板類型 產生告警的單板類型 無 板組號 產生告警的板組編號 無 CPU占用率 CPU占用率的平滑值 無 CPU忙門限 單板設定的CPU忙門限值 無 例如:暫無【告警含義】:系統中各個單板默認的CPU忙門限值是90,即當CPU占用率超過90%的情況下會產生CPU擁塞告警。CPU忙門限值的有效范圍是50,90,當單板的CPU占用率低于CPU忙門限值或者通過MML命令MOD BRD重新設置CPU忙門限值的情況下,CPU擁塞告警被恢復。 【設備類型】:G9-MGW【告警關聯邏輯】:伴隨告警有“1401 CPU過載告警”【對系統的影響】:導致系統性能超過規定限制;導致單板內部軟件模塊間響應速度變慢;導致單板外部消息應答時延增加,甚至超時;嚴重情況下影響業務的正常處理。出現CPU擁塞告警后,系統會進行更加嚴格的內部消息流量控制,同時調整資源分配的策略,適當減少告警單板的負荷,以減輕系統負擔。當告警恢復后,系統恢復相應的處理。【告警產生原因】:單板業務忙,負載過重;單板遭受異常數據沖擊。【告警處理步驟】:對由于話務量沖擊瞬間產生、且能自動恢復的CPU過載告警,不需做后續處理。如果持續過載,則利用DSP CPUR查看實時CPU負荷;DSP CPUR: FN=0, SN=7, BP=BACK;%RETCODE = 0 執行成功0框7槽后插單板-CPU占用率 = 29%利用LST BRD查看告警單板當前的CPU忙門限值,是否為門限值設置過低引起;LST BRD: FN=1;%RETCODE = 0 執行成功槽位記錄表- 機框號 = 1 槽位號 = 0 板位置 = 前插 板類型 = VPU 硬件類型 = MTCB 板組號 = 0 備份狀態 = 負荷分擔 主備狀態 = 管理狀態 = 激活 CPU忙門限 = 90CPU正常門限 = 80 安裝狀態 = 安裝 操作狀態 = 正常通知各分公司進行核實話務量情況、同類型單板負荷、業務分布是否合理等。【重大故障定位】:持續出現或同時出現多個模塊CPU過載,對系統業務有重大影響,可能導致重大規則中的第2、5、6、9條中的影響某個局向,或全局業務阻斷。3.3 L2UA鏈路組故障【告警標題】: L2UA鏈路組故障【告警編號】: 3905【告警正文】:參數名稱 含義 備注 協議 產生該告警的L2UA協議類型(IUA 、V5UA 、M2UA ) 無 鏈路組號 產生該告警的L2UA鏈路組號 無 例如:tab + HUGUMG 2007-02-02 23:55:50 ALARM 106507897 Fault Critical MGW 3905 Communication System NE name = HUGUMG NE type = MGW Equipment Serial No. = 4209090 Alarm name. = L2UA linkset fault Location info = Protocol Type=M2UA, Linkset No.=6 Alarm occuring time = 2007-02-02 23:55:50 Module No. = 0【告警含義】:當系統檢測到L2UA鏈路組故障時,系統產生此告警。L2UA是IUA,V5UA,M2UA三種協議的總稱,由協議類型字段來具體區分 。【設備類型】:G9-MGW【告警關聯邏輯】:該告警由“3905 L2UA鏈路故障”告警引發。【對系統的影響】:告警鏈路組內的所有信令業務全部中斷,如果所有的L2UA鏈路組全部中斷,則業務受阻。【告警產生原因】:鏈路組內全部L2UA鏈路都變為UNESTABLISH狀態 。【告警處理步驟】: 如果單個鏈路組告警,根據告警信息中的協議類型和鏈路組號查看相應鏈路組的狀態。DSP L2UALKS: PROTYPE=M2UA, LKS=6; (LKS為告警中鏈路組號)RETCODE = 0 執行成功查詢 L2UA鏈路組狀態- 鏈路組號 =6 鏈路組狀態 = 激活 / 有斷開、去激活、激活、掛起四種狀態,正常為激活 鏈路組中的鏈路數 = 1L2UA鏈路狀態- 鏈路號 鏈路狀態 0 激活(結果個數 = 1)- END 根據“鏈路組狀態”直接判斷鏈路組故障,并根據步查看是否配置在單獨的SPF或BSG上,通知各分公司處理。如果多個鏈路組同時出現告警,除按查詢各鏈路組狀態外,還可查看是否開在相同的SPF(MGW)或BSG(SERVER)故障。LST L2UALNK:;RETCODE = 0 執行成功查詢 L2UA鏈路 協議類型 鏈路號 鏈路名稱 SPF板板組號 鏈路組號 客戶端/服務器 優先級 M2UA 0

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論