




全文預覽已結束
下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
IBM AIX 小型機巡檢常用命令及流程第一:首先是機房溫度以及濕度的檢查,當然這些一般情況都沒問題。 參考值:溫度(攝氏 ) 10 40 濕度 8% 80%第二:就是關于電源的檢測,這個只要不是新裝機,一般沒問題。 參考值: 零-地電壓 小于1V 火-地電壓 200-240V (補充:當然59系列的機器相間380V,相地240V)第三:關于報錯。 主要查看硬件的永久性報錯 #errpt -dH | pg 軟件的永久性報錯 #errpt -dS | pg 還有系統又沒又報警燈 第三:機器的序列號:#uname -Mu第四:操作系統版本:#oslevel -r 注:有時候不能使用是因為系統版本低的原因第五:其他檢測執行sysdumpdev l (檢查dump是否設置為always allow sysdump)執行sysdumpdev e (檢查當前dump大小應該為主dump設備的大小的80以下)執行lsvg -l rootvg (檢查有否stale狀態的邏輯卷)執行lsps -s (檢查內存交換區占用情況)執行df k (檢查文件系統的分配狀況,一般不要超過80%)執行lsdev Cc disk (檢查硬盤狀態為available)執行lsdev Cc adapter (檢查PCI卡狀態為available)執行lsdev Cc tape (檢查磁帶機狀態為available)執行lsdev Cc processor (檢查CPU狀態為available)執行lsattr El sys0|grep autorestart (檢查系統crash后是否自動重新啟動)執行lsattr El sys0|grep cpuguard (檢查CPU GUARD是否開啟)執行lsattr El mem0 (檢查內存狀態正常size=goodsize)執行 vmstat 2iostat,topas觀察us,sy,pi,po, (內存占用率,硬盤讀寫速度等檢查是否有性能瓶頸)執行netstat in和netstat rn (觀察網絡狀態)執行entstat d enX (檢測網卡運行速率與交換機速率是否匹配)(網卡速率由10M半工改為自適應時,缺省網關會丟失。更改網卡速率后需要在系統中執行smitty route 操作重新激活缺省路由。如果進行網卡速率的調整,請務必小心。)執行ping命令 (檢查網絡連接狀況)執行lsdev C|grep aio (檢查異步IO是否可用)執行lssrc g cluster (查看是否有三個進程均為active狀態)(這個主要看起了幾個HA的進程了,有的時候是一個或兩個)執行/usr/sbin/cluster/clstat a (查看cluster狀態是否正常)檢查/etc/hosts, 確保雙機配置中IP別名不會存在包含關系(share_ip1包含了share_ip)執行 #more /usr/es/adm/cluster.log #more /usr/es/sbin/cluster/history/* #cat /tmp/hacmp.out (檢查這三個日志中是否有error或者fail.)檢查7133面板上的指示燈,如果黃燈亮則需要診斷問題HOTspare 磁盤檢測1、檢查是否有raid保護 # smitty ssaraid-List All Defined SSA RAID Arrays2、檢查是否有Hot Spare # smitty ssaraid-List Components in a Hot Spare Pool對于7133,執行Smitty ssaraid? List All Defined SSA RAID Arrays查看7133 raid狀態,正常應該為good狀態。對于7133,執行Smitty ssaraid?Change/Show Use of an SSA Physical Disk查看7133硬盤狀態,正常應該為member或者spare狀態對于FastT,分別登錄上兩個controller (登陸方法后面詳細講解),查看是否有錯誤日志。記錄檢查結果cpu (主頻*數量) #lsattr -El proc0內置磁盤個數: #lsdev -Cc disk 網卡信息: #lsdev -Cc adapter系統屬性: #lsattr -E -l sys0 1 系統錯誤報告(Error Log)的檢查: 硬件故障檢測命令:# errpt -d H -T PERM 若有故障執行命令# errpt -a -d H -T PERM/tmp/harderror.log保存,分析結果報告給客戶 軟件故障檢測命令:# errpt -d S -T PERM 若有故障執行命令# errpt -a -d S -T PERM/tmp/softerror.log保存,分析結果報告給客戶 2 有否發給root用戶的錯誤報告(mail): #mail (1) 觀察所有未讀消息,注意有關diagela的消息。 (2) 常用命令: h Display headings of group containing message t Display messages in or current message. n Display next message. q Quit (3) 對發現的問題詳細分析,結果報告給客戶 3 文件系統的檢查: 命令: # df k %Used為文件系統的使用率。所有文件系統的使用率不能大于80%4 通信系統的檢測: (1) 網卡的狀態 命令: #ifconfig a 輸出判斷: en0: flags=e080863 inet 192.9.200.2 netmask 0xffffff00 broadcast 192.9.200.255 en1: flags=e080863 inet 192.9.201.1 netmask 0xffffff00 broadcast 192.9.200.255 主備網卡的flag為UP屬正常。同時檢查ip地址和netmask是否正確。 (2) 路由的檢測 命令: #lsattr El inet0 authm 65536 Authentication Methods True hostname h24 Host Name True gateway Gateway True route net,0,172.16.23.81 Route True bootup_option no Serial Optical Network Interface True rout6 FDDI Network Interface True (3) 網絡的檢測 命令: #ping ip address 輸出判斷: 用ping命令對/etc/hosts文件中的IP地址進行操作,檢測網絡是否聯通。 5系統DUMP設置的檢查 命令: #sysdumdev l 輸出判斷: 結果應為 primary /dev/hd6 secondary /dev/sysdumpnull copy directory /var/adm/ras forced copy flag TRUE always allow dump FALSE dump compression OFF 若不正確請用下列命令修改: #sysdumdev P p /dev/hd6 s /dev/sysdumpnull 6系統硬件診斷: 命令順序為: (1)#diag (2).Enter (3).Diagnostic Routines (4).System Verification (5).All Resources (6).F7 輸出判斷: 結果應為No trouble was found.7補丁程序(PTF)的檢查 (1) 系統維護補丁版本為ML09,檢查命令為: #instfix i |grep ML 8系統參數的檢查 (1)HIGH water mark for pending write I/Os # lsattr -El sys0 |grep maxpout 輸出判斷: 結果應為 maxpout 33 HIGH water mark for pending write I/Os per file True (2)LOW water mark for pending write I/Os # lsattr -El sys0|grep minpout 輸出判斷: 結果應為 minpout 24 LOW water mark for pending write I/Os per file True 更改命令為: #chdev -l sys0 -a maxpout=33 -a minpout=24 (3)Syncd參數 # grep syncd /sbin/rc.boot 輸出判斷: 結果應為 nohup /usr/sbin/syncd 10 /dev/null 2&1 & 更改命令為: #vi /sbin/rc.boot (4)aio參數 # lsdev -Cc aio 輸出判斷: 結果應為 aio0 Available Asynchronous I/O # lsattr -El aio0 輸出判斷: 結果應為 minservers 1 MINIMUM number of servers True maxservers 10 MAXIMUM number of servers True maxreqs 4096 Maximum number of REQUESTS True kprocprio 39 Server PRIORITY True autoconfig available STATE to be configured at system restart True fastpath enable State of fast path True 更改命令為: #smitty aio (5)Limits文件的設置: #ulimit a 輸出判斷: 結果應為 time(seconds) unlimited file(blocks) 2097151 data(kbytes) 262144 /尤其是這項參數 stack(kbytes) 32768 memory(kbytes) 32768 coredump(blocks) 2097151 nofiles(descriptors) 2000 更改命令為: #vi /etc/security/limits 更改data為5242889.集群狀態檢查smitty ssaraid List All Defined SSA RAID Arrayshdisk1 40263B2E0DF74CK system good 91.1GB RAID-5 array(如果是good就正常)IBM巡檢流程1、檢查系統硬件情況:設備故障燈是否有亮 2、系統錯誤報告(errlog) 3、有否發給root用戶的錯誤報告(mail) 4、檢查hacmp.out,smit.log,boot.log 5、關鍵系統的文件使用率不大于80% 6、邏輯卷有否stale 7、內存交換區使用率是否超過70% 8、內存交換區的大小是否為物理內存的1.5倍 9、檢查備份情況(有否系統備份、用戶數據備份、磁帶機是否需要清洗) 10、通信(網卡、IP、路由表、ping、etchosts、DNS設置等) 11、是否有數據保護方式如RAID10RAID5,是否有Hot spare 12、系統DUMP設置是否正確 13、檢查系統參數是否正確 1)etcenviroment中的TZ不能有夏時制 2)如有數據庫: Aioavailable 3)HACMP中 IO pacingHigh Water MarkLow Water MArk3324 4)HACMP中 Syncd10 5)HACMP中 Power Monitoroff 14、檢查rootvg是否有鏡象 15、檢查errdemon,srcmstr是否正常運行 16、機房環境(電壓、濕度) 17、系統性能:有否性能瓶頸(topas,vmstat) 18、補丁程序(PTF)、微碼(是否需要升級) 19、HACMP測試:Cluster Verification 20、系統硬件診斷 21、運行#snap -ac,生成文件snap+sn.pax.Z 22、機器清潔 注115為A類維護(季度維護),1618為B類維護(半年維護),1922為C類維護(年度維護)1、檢查系統硬件情況:設備故障燈是否有亮 2、系統錯誤報告(errlog) errpt -d H -T PERM 對有懷疑的進一步errpt -aj 錯誤代碼more3、有否發給root用戶的錯誤報告(mail) mail 4、檢查hacmp.out,smit.log,boot.log #cd tmp ls hacmp.out找到時間最近的字節不為零的文件,vi查看 如果懷疑系統曾經有調整操作,檢查smit.logalog -ot boot5、關鍵系統的文件使用率不大于80% #df k (查看%Used)6、邏輯卷有否stale #lsvg -l 卷組名稱 (查看狀態是否有stale的邏輯卷)7、內存交換區使用率是否超過70% #lsps a (查看占用率是否超過70%) 8、內存交換區的大小是否為物理內存的1.5倍 命令同上現在原則有所改變,2G內存以下可按照1.5倍的標準,2G內存以上如果交換區占用率不高,可用2GB標準9、檢查備份情況(有否系統備份、用戶數據備份、磁帶機是否需要清洗) 口頭詢問:系統備份、數據備份 檢查磁帶機面板,提醒用戶清洗10、通信(網卡、IP、路由表、ping、etchosts、DNS設置等) #netstat in #netstat rn #netstat I #vi etchosts (檢查DNS相關文件內容)11、是否有數據保護方式如RAID10RAID5,是否有Hot spare 如果是7133,diagTask SelectionSSA Service AidsLink Verification,smitty ssaraidFAStT產品使用其管理軟件Storage Manager查看 ESS使用ESS控制臺查看12、系統DUMP設置是否正確 sysdumpdev -l 13、檢查系統參數是否正確1)etcenvironment中的TZ不能有夏時制 #vi etcenvironment檢查環境變量TZ,其格式應該是這樣:TAIST-8,而不能是TAIST-8TAIDT-7這樣的格式2)如有數據庫:Aioavailable #lsdev -Cgrep aio (查看其狀態是否available)如不是:smitty chgaio,將狀態修
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 標準化政策研究-洞察闡釋
- 雨污管網改造項目規劃設計方案(范文)
- 嗎啡類藥物的濫用與預防研究-洞察闡釋
- 懸掛式離子風機項目投資風險評估報告
- 混沌與智能城市-洞察闡釋
- 數字經濟賦能體育旅游產業轉型升級路徑與邏輯
- 人工智能在社會工作本土化發展中的應用研究
- 菱帥自動駕駛安全風險識別-洞察闡釋
- 廣東新安職業技術學院《西方經濟學(上)》2023-2024學年第二學期期末試卷
- 山東財經大學《大學體育Ⅳ》2023-2024學年第二學期期末試卷
- 2025年廣東省廣州市白云區中考語文二模試卷
- 2025年天津市河西區中考二模數學試題(含部分答案)
- 醫院培訓課件:《藥品不良反應報告和監測工作簡介》
- 2025 屆九年級初三畢業典禮校長講話:星河長明共赴新程
- 2025年伽師縣(中小學、幼兒園)教師招聘考試模擬試題及答案
- 醫院培訓中心管理制度
- GM/T 0009-2023SM2密碼算法使用規范
- 中等職業教育與普通高中教育融合發展路徑研究
- 網約車轉讓合同協議書
- 2025年小學畢業生語文考試試題及答案
- 女性不孕癥中西醫結合診療指南
評論
0/150
提交評論