GPRS系統愛立信健康檢查手冊_第1頁
GPRS系統愛立信健康檢查手冊_第2頁
GPRS系統愛立信健康檢查手冊_第3頁
GPRS系統愛立信健康檢查手冊_第4頁
GPRS系統愛立信健康檢查手冊_第5頁
已閱讀5頁,還剩29頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、GPRS系統健康檢查手冊 (愛立信)中國移動通信集團公司文檔版本:V0.1文檔狀態: 草案發布日期:2007年12月6日擬 制:日 期:審 核:日 期:審 核:日 期:批 準:日 期:文檔說明:本文檔針對愛立信GPRS系統健康檢查手冊,對愛立信GPRS系統健康檢查將遵循本文進行(本文檔編號依照以下原則進行:x.y.z x: 大版本更新,文檔結構變化,0表示草案 y: 具體方案的更改,部分內容的修正 z: 文字修改,奇數為包含對上一版修改記錄的稿子偶數為對上修改稿的定稿 )文檔修訂歷史版本更新日期撰稿人核稿人單位更新說明0.12007-12-6羅由陳偉棟廣東公司初稿0.22007-12-26羅由

2、鄔學農、陳偉棟、馬坤、甄振微、王建膠、趙海濤、王冼、陳鵬、王曉金、顏 晗、蘇鋒廣東、重慶、山東、河北、黑龍江、上海、江蘇 、湖北、廣西規范文檔的格式和結構,并根據評審意見更新細化DATACOM部分的內容,增加部分SGSN和GGSN的檢查內容。參加評審的公司:廣東、山東、河北、黑龍江、上海、江蘇、湖北、廣西、重慶目 錄第1章 健康檢查手冊使用說明6第2章 SGSN檢查項目72.1 SGSN檢查7第3章 GGSN檢查項目113.1 GGSN檢查11第4章 FW檢查項目124.1 系統狀態檢查124.2 路由狀態檢查124.3 FW 主備同步和流量檢查124.4 FW 策略檢查124.5 狀態統計1

3、3第5章 SW檢查項目145.1 交換機基本運行情況145.2 二層協議檢查145.3 三層協議檢查14第6章 Router檢查項目156.1 Router基本運行情況15第7章 CG (BGw) 健康檢查項目167.1 系統檢查167.2 文件檢查167.3 磁帶備份檢查177.4 進程檢查17第8章 DNS健康檢查項目188.1 操作系統檢查188.2 DNS配置檢查188.3 業務數據統計19第9章 健康檢查結果記錄表20附錄1.1健康檢查結果匯總表20附錄1.2健康檢查結果詳表21關鍵詞:SGSN、GGSN、FW、CG、DNS、SWITCH,健康檢查摘要:本文介紹了針對愛立信GPRS系

4、統的健康檢查項目。縮略語清單:參考資料清單:1 ERICSSON ALEX SGSN R6.2 ERICSSON ALEX GGSN R3.3 NetScreen Resource 第1章 健康檢查手冊使用說明1、 本手冊適用于愛立信GPRS核心網設備,具體設備如下:SGSN,GGSN,FIREWALL, SWITCH,ROUTER,NTP,DNS,CG。設備名稱設備硬件平臺設備軟件版本軟件補丁版本編號SGSNWPP 6.0R6GGSNJ20R3FIREWALLNS-204/NS-500/NS-ISG-1000ROUTERJuniper M7ISWITCHALPINE 3804/SUMMIT

5、24/SUMMIT 48iCGSUN-4800SunOs 5.9DNSSUN V240BIND NTPTrueTime NTS-2002、 本手冊涉及檢查指令和檢查標準等,如無特殊說明,均指ERICSSON GPRS系統。3、 本文檔附件一為檢查記錄表,在對設備進行健康檢查后應將結果記錄在該表中。4、 在對設備進行檢查時,除根據要求進行記錄檢查結果外,建議以日志方式將檢查指令和設備輸出結果以日志方式記錄下來,以便后期核對。第2章 SGSN檢查項目2.1 SGSN檢查編號檢查內容檢查方法檢查標準1查詢當前SGSN的IDgsh get_ne設備名稱與實際設備相符。2磁盤空間檢查df -k磁盤利用率

6、低于65%.3負荷檢查topCPU和內存利用率小于65%,沒有異常進程占用過多CPU資源4查詢告警gsh list_alarms檢查是否存在關鍵或緊急的告警,如果存在請盡快聯系愛立信人員.5Events事件gsh list_events檢查是否存在異常事件6ISP log 檢查tail -100 /Core/log/isp.log檢查是否存在restart、reboot或reload事件,如果存在請收集相關的log信息,并聯系愛立信7NCB板messages日志文件檢查cd /var/logmore messages沒有存在異常情況8mobility、session、alarm、event和O

7、MS日志檢查cd /tmp/OMS_LOGS/mobility_event_log/readycd /tmp/OMS_LOGS/ session_event_log/readycd /tmp/OMS_LOGS/ fm_alarm/readycd /tmp/OMS_LOGS/ fm_event/readymore logfilename日志沒有存在異常情況9NCB 工作狀態gsh get_active_ncbgsh get_passive_ncb顯示EquipmentId信息10Chargingls -ltr /charging/chsLog/ready/顯示最新時間的計費文件,文件名稱為bgw

8、Ack.xxx11PM Job logsgsh list_pm_jobs檢查是否存在大量的 pm job logs,如果有請聯系相關人員刪除文件.SGSN節點并不對對logs文件進行存儲.12Load Distributioneci dist其中一塊板的負荷為0,其它板的負荷分擔均衡.13PXM在IE中輸入SGSN的IP地址,端口為8888打開一個PXM GUI圖形界面,檢查它是否正常工作14檢查Gr 接口1. gsh action_ss7_sys_statlinks1. 鏈路是“In Service” 狀態;15檢查Gb接口gsh list_nses -agsh list_bvcs nse

9、所有NSE建立正常16檢查Gn和Gom接口路由信息gsh show_router_instance_ip_route端口狀態正常,路由表正常。17CheckpointlistSCs補丁正確;按照集團要求定期做checkpoint18時鐘檢查gsh list_ntp_serverntpq -preach值為377(Comment: + Active, * Standby)19DNSgsh get_dns/tmp/DPE_SC/ApplicationData/dnsApp/test_resolvcmwapcmnetquit正常解釋到GGSN的IP地址20SGSN nodeprop檢查gsh lis

10、t_nodepropsgsh get_nodeprop NodePropIdnodeprop值符合集團的規范要求。21SGSN feature檢查gsh list_feature -state onfeature配置值符合集團的規范要求。22SGSN checkpoint備份檢查Su GbsBackup按照集團的要求定期做備份23PDP激活成功率、ATTACH成功率、RAU成功率檢查用以下指令從SGSN上提取counter值,根據集團的公司計算成功率:gsh get_pm_type_report -mo SM. -mt AttActPdpContext.Ggsh get_pm_type_rep

11、ort -mo SM. -mt SuccActPdpContext.Ggsh get_pm_type_report -mo SM. -mt UnsuccActPdpContextCC32_33.Ggsh get_pm_type_report -mo SM. -mt UnsuccActPdpContextCC29.Ggsh get_pm_type_report -mo SM. -mt UnsuccActPdpContextCC27_28.Ggsh get_pm_type_report -mt attGprsAttachgsh get_pm_type_report -mt succGprsAtta

12、chgsh get_pm_type_report -mt gprsMmSgsnUnsuccessfulAttachRequestsgsh get_pm_type_report -mo MM. -mt UnsuccAttachCC7.Ggsh get_pm_type_report -mo MM. -mt UnsuccAttachCC8.Ggsh get_pm_type_report -mo MM. -mt UnsuccAttachCC14.Ggsh get_pm_type_report -mt attInterSgsnRaUpdategsh get_pm_type_report -mt succ

13、InterSgsnRaUpdategsh get_pm_type_report -mt attIntraSgsnRaUpdategsh get_pm_type_report -mt succIntraSgsnRaUpdate性能指標良好,符合集團公司的要求。第3章 GGSN檢查項目3.1 GGSN檢查注:以下檢查適用于J20 R3版本的網元編號檢查內容檢查方法檢查標準24J20 IDstart shellhostname確認當前的J20設備的ID.25IP 和路由Show interface terseShow route路由表正常26文件系統Show system storage檢查并保證文

14、件系統處于非滿狀態.27告警show chassis alarms沒有告警.28Eventsshow log messages不存在異常事件29Routing Engine 工作狀態show chassis routing-enginerouting-engine工作狀態正常,一主一備。30檢查PICs是否在服務狀態show chassis hardwareshow chassis pic fpc-slot x pic-slot yPIC板的 State為Online31Chargingstart shellls ltr /var/log/ggsn檢查是否存在任何charging file,正

15、常狀態是沒有的.32Startup 狀態show system uptimeshow system boot-messages沒有異常啟動信息33Load Distributionshow services ggsn statusCheck the load distribution for all pics.34Checkpoint在configuration模式下,J20將把配置文件保存在用戶的主目錄下.35Patch 狀態show system software軟件版本正常36NTPshow ntp status正常獲取到外部時鐘信息, offset絕對值不大于30037負載檢查star

16、t shelltopCPU和內存利用率不高于40%.38Gn/Gi接口的工作模式及統計檢查show interfaces 端口工作模式匹配,沒有丟包和誤碼39APN地址池檢查show services ggsn statistics apn 地址池利用率小于85%40檢查內容計費流量是否正常show services ggsn statistics apn cmwapService ID statistics下各項內容計費流量正常41APN的PDP激活成功率檢查show services ggsn statistics apn cmwapPDP激活成功率指標優良(99%以上),網絡性能正常。4

17、2局數據配置檢查show config內容計費等局數據配置符合集團公司規范第4章 FW檢查項目4.1 系統狀態檢查編號檢查內容檢查方法檢查標準43設備名稱start shellhostname檢查設備名稱定義44硬件狀態show chassis alarms檢查硬件總體的使用情況45CPU利用率start shelltop檢查CPU峰值利用率情況46端口狀態show interfaces 所有Gn,Gi, O&M接口都處于UP狀態47事件檢查show log messages沒有error級別以上的事件4.2 路由狀態檢查編號檢查內容檢查方法檢查標準48路由表Show route缺省路由等設置

18、正確,路由狀態正常49直連端口arpshow arp顯示直連端口MAC地址與IP地址對應關系4.3 FW 主備同步和流量檢查編號檢查內容檢查方法檢查標準50主備狀態show chassis routing-engine配置正常,防火墻主備狀態正常。51連接數show security session最大值沒有超過系統配置值52NAT數show counter statistics interface eth1查看trust端口的統計信息,no dip數為04.4 FW 策略檢查編號檢查內容檢查方法檢查標準53策略配置show config策略配置符合集團要求,沒有遺漏數據4.5 狀態統計編號檢

19、查內容檢查方法檢查標準54運行show interfaces 沒有丟包、誤碼等異常信息第5章 SW檢查項目5.1 交換機基本運行情況編號檢查內容檢查方法檢查標準55軟件信息show version查看設備命名和軟件,符合集團入網要求56硬件模塊show switch查看硬件配置是否與實際情況一致57CPU狀態topCPU利用率低于70%58端口show port statshow port configshow port utilizationshow port tx | rx沒有丟包和錯包情況59LOG信息Show log沒有錯誤信息60環境狀態show switch溫度、電源等狀態都為OK

20、61配置檢查show config配置符合集團要求5.2 二層協議檢查編號檢查內容檢查方法檢查標準62STP生成樹show stpd生成樹處于穩定狀態,或者沒有起STP生成樹63vlan檢查show vlan detailvlan配置正確64mac地址show iparp直連端口數據齊全、正常5.3 三層協議檢查編號檢查內容檢查方法檢查標準65ESRPshow esrp主備狀態正常66OSPFshow ospfshow ospf interfaceOSPF的鄰居狀態穩定67誤碼和丟包檢查show ipstaterrors和discards為068路由表檢查show iproute路由表正常第6

21、章 Router檢查項目6.1 Router基本運行情況編號檢查內容檢查方法檢查標準69配置檢查show configuration數據配置正確70端口狀態檢查show interfaces端口工作模式正常;在用端口為up;端口流量正常,沒有誤碼和丟包71文件系統Show system storage檢查并保證文件系統處于非滿狀態./var和/tmp目錄空間利用率低于30%72告警show chassis alarms沒有告警.73Eventsshow log messages不存在異常事件74Routing Engine 工作狀態show chassis routing-enginerout

22、ing-engine工作狀態正常。75SSB 工作狀態show chassis ssbssb工作狀態正常。76檢查PICs是否在服務狀態show chassis hardwareshow chassis pic fpc-slot x pic-slot yPIC板的 State為Online77Startup 狀態show system uptimeshow system boot-messages沒有異常啟動信息78Patch 狀態show system software軟件版本正常79負載檢查start shelltopCPU和內存利用率不高于40%.80路由表檢查show route路由表

23、正常81OSPFshow ospf neighborshow ospf routerOSPF的鄰居狀態穩定OSPF路由表正常第7章 CG (BGw) 健康檢查項目7.1 系統檢查編號檢查內容檢查方法檢查標準82檢查硬盤狀態vxprint -ht全部磁盤卷應該正常83檢查硬盤利用率df -k磁盤空間利用率小于70%84檢查虛擬內存vmstat 3 10swap -s正常情況下,SWAP存儲區應有足夠空間,分頁不應過高, Column r b w 應全部為零. CPU idle的時間比例高意味著系統負載輕.85檢查預處理器mpstat 5 5大部分時間系統應該處于輕負載狀態,CPU idle比例應

24、該達到47%以上.86檢查/var/adm/messagesmore /var/adm/messages沒有系統錯誤信息。7.2 文件檢查編號檢查內容檢查方法檢查標準87檢查工作目錄是否有文件堆積cd /var/opt/BGw/Server1/GPRS/CXC1122516_R2C_1/storage1/ corruptls alcorrupt目錄下沒有文件。88檢查工作目錄是否有文件堆積cd /var/opt/BGw/Server1/GPRS/CXC1122516_R2C_1/storage1/ inbufferls alinbuffer目錄下文件數小于30。89檢查工作目錄是否有文件堆積c

25、d /var/opt/BGw/Server1/GPRS/CXC1122516_R2C_1/storage1/ outbufferls aloutbuffer目錄下文件數小于10。90檢查工作目錄是否有文件堆積cd /var/opt/BGw/Server1/GPRS/templs altemp目錄下文件數小于100。7.3 磁帶備份檢查編號檢查內容檢查方法檢查標準91檢查磁帶備份cd /var/opt/BGw/Server1/BGwTTStorage/STS/workingls |wc -l磁帶機非滿,備份的CDRs應工作正常.7.4 進程檢查編號檢查內容檢查方法檢查標準92BGw進程檢查ps

26、-ef|grep BGw|grep -v grep |wc l/usr/ucb/ps -aux |grep BGw有22個左右進程,進程運行正常第8章 DNS健康檢查項目8.1 操作系統檢查編號檢查內容檢查方法檢查標準93系統進程# ps -elf 沒有僵死進程,named進程正常94網絡接口狀態# ifconfig a# netstat接口工作正常,路由信息正常編號檢查內容檢查方法檢查標準95CPU利用率#vmstat 10 20#ps elf如果系統出現很慢的響應時間,CPU空閑時間為零,過高的用戶占用CPU時間或過高的系統占用CPU時間,或者長時間的有很長的運行進程隊列, 那么CPU已經

27、成為系統的瓶頸,這需要優化系統進程或采用處理能力更強的CPU96內存利用率#vmstat 10 20#vmstat S 10 20系統的free內存一直保持在遠大于active virtual memory。內存能滿足系統的需求97SYSLOG#cat /var/adm/messages無錯誤信息8.2 DNS配置檢查編號檢查內容檢查方法檢查標準98named.conf#cat /etc/named.conf無配置錯誤99apn配置db文件more /var/named/ db.*.*.*.mcc460.gprscmwap,cmnet,企業apn配置數據正確100RAC配置db文件more d

28、ersgsn.*.mcc0460.gprsRAC數據配置齊全、正確。8.3 業務數據統計編號檢查內容檢查方法檢查標準101對國際和國內APN進行解析登錄到DNS服務器,鍵入nslookup操作實例:rootGDDND01Ber # nslookupDefault Server: localhost cmwapServer: localhost第9章 健康檢查結果記錄表本附錄用于記錄檢查結果,分為匯總表和詳表。在進行健康檢查后,應對每一臺設備輸出一份匯總表和詳表。在詳表中,“異常情況記錄”和“整改方案和計劃”只針對檢查不合格的項目。在“異常情況記錄”中要記錄不合格的輸出結果

29、和不合格之處,“整改方案和計劃”要填寫針對不合格之處的整改方案和計劃整改時間,如內容較多,可以圖標方式嵌入附件,同時將計劃整改時間寫入表格內。附錄1.1 健康檢查結果匯總表檢查人:檢查日期:設備管理IP安裝地點設備生產商設備型號入網時間檢查項目數合格項目數合格率附錄1.2 健康檢查結果詳表第一部分:SGSN檢查項目檢查項目數合格項目數合格率編號檢查內容檢查結果異常情況記錄整改方案及計劃1.查詢當前SGSN的ID正常異常未涉及2.IP 和路由正常異常未涉及3.查詢文件系統正常異常未涉及4.查詢告警正常異常未涉及5.Events事件正常異常未涉及6.ISP log 檢查正常異常未涉及7.NCB 工

30、作狀態正常異常未涉及8.GPBs in service正常異常未涉及9.Charging正常異常未涉及10.Startup Status正常異常未涉及11.PM Job logs正常異常未涉及12.PM Jobs正常異常未涉及13.硬件和軟件失敗正常異常未涉及14.Load Distribution正常異常未涉及15.PXM正常異常未涉及16.檢查Gr 接口正常異常未涉及17.檢查Gb接口正常異常未涉及18.檢查Gn接口正常異常未涉及19.檢查Gom 接口正常異常未涉及20.Crontab正常異常未涉及21.Checkpoint正常異常未涉及22.Patch 狀態正常異常未涉及23.NTP正常

31、異常未涉及24.DNS正常異常未涉及25.Overload check正常異常未涉及26.檢查N3 REQUESTS正常異常未涉及27.檢查T3 RESPONSE正常異常未涉及28.附著用戶數正常異常未涉及29.激活用戶統計正常異常未涉及30.其它正常異常未涉及第二部分:GGSN檢查項目檢查項目數合格項目數合格率編號檢查內容檢查結果異常情況記錄整改方案及計劃31.J20 ID正常異常未涉及32.IP 和路由正常異常未涉及33.文件系統正常異常未涉及34.告警正常異常未涉及35.Events正常異常未涉及36.Routing Engine 工作狀態正常異常未涉及37.SSB 工作狀態正常異常未涉及38.檢查PICs是否在服務狀態正常異常未涉及39.Charging正常異常未涉及40.Startup 狀態正常異常未涉及41.PM Job logs正常異常未涉及42.Load Distribution正常異常未涉及43.Checkpoint正常異常未涉及44.Patch 狀態正常異常未涉及45

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論