




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
XXXX有限公司
服務器運維管理手冊
XXXX有限公司
運維服務部
2012/8/30
一、文檔簡介
本文檔根據桑菲消費通信服務器硬件設備與系統應用管理需求,針對日常維護
內容進行技術歸類于總結,描述具體操作步驟與操作方法,積累服務潛事件處
理能力,使之服務運維能力更為主動可控。
二、文檔目的
標準服務器故障處理方法指引,服務器管理知識庫積累。
三、文檔范圍
服務器硬件故障判斷與標準處理操作
服務器系統日常性能檢測與標準檢測
四、事件處理流程
五、具體操作說明
1)服務器硬件管理
1.檢查與故障判斷:
服務器硬件的主動檢查方式主要分三種:
設備面板指示燈檢查
硬件系統日志檢查
第三方工具檢查
(一)面板指示燈檢查
IBM服務器上面有,電源指示燈,硬盤/IDE設備活動指示燈,網卡指示燈,系統
過熱報警燈.硬盤槽還有硬盤指示燈。HP服務器上面指示燈一般為UID,內部和
外部健康燈,其他就是電源網口燈了,DELL的機種有的上面有風扇,內
存,CPU,指示燈情況,圖標都是很直觀的,其它服務器與IBM,HP的差不多。
圖示說明
詳細描述:
(二)系統日志檢查
檢查內容|
硬件歷史異常報錯信息
計算機管理二〉系統工具->事件查看器,查看系統日志
重點關注:紅色高危事件信息、日常頻繁硬件報錯信息二
備注:查看硬件歷史異常故障情況,分析硬件性能與使用生命周期
(三)第三方檢測工具檢查
檢查內容
硬件歷史異常報錯信息
HP診斷工具:
打開開始----程序----HPSystemTools---HPInsightDiagnosticsonline
EditionforWindows----IIPInsightDiagnosticsonlineEditionfor
Windowso
DELL診斷工具:
第三方硬件設備診斷工具
IBM診斷工具:
IBMSystemsDirector、IBMSystemsDirectorActiveEnergyManager、IBM
ServorGuido
相關圖解:
進入診斷網頁,在第一選項卡Survey中,上部有2個下拉項,左側選擇
Advanced,右側選擇All,會顯示出更多硬件信息,點擊右下的Save按鈕保
存。
此界面可以看到服務器所有硬件信息。
2.硬件設備變更操作標準:
判斷并確定最快恢復時間
判斷是否有做冗余設置
判斷是否需要關機操作
磁盤設備檢測并確定陣列信息,確定有做數據備份
是否對其它關聯應用有影響
制定問退方案,保證數據與應用的可.用性
設備變更操作
設備兼容性測試
應用系統運行測試
設備變更后正式應用
3.相關巡檢記錄單:
備注:《服務器信息列表》《服務器指示燈巡檢表》
2)服務器系統管理
服務器系統管理主要分為:
Windows系統管理
Linux系統管理
1.Windows系統管理
L1.磁盤空間使用
計算機管理一一磁盤管理
磁盤空間使用率是否已經到達80%
1.2.進程監控
任務管理器-一進程
查看進程的CPU使用率和內存使用率是否超閥值
1.3.CPU性能
任務管理器一一性能
查看CPU最高峰值與一般使用率是否超閥值
L4.內存性能
任務管理器一一性能
查看內存最高峰值與一般使用率是否超閥值
存使用率是否超過70%
J:或者其他定義閥值,
1.5.網絡查看
任務管理器一一聯網
檢查是否能正常訪問站點頁面
1.6.日志
記錄錯誤報警信息
一應用程序日志
由應用程序或者系統程序記錄的事件
一安全性日志
查看有效和無效的登錄嘗試事件,以及資源使用相關的事件
---系統日志
Windows系統組件記錄的事件
2.Linux系統管理
L1.平均負載(uptime)
描述:
uptime命令過去只顯示系統運行多久.現在,可以顯示系統運行多久、當前有多少的用戶登
錄、在過去的1,5,15分鐘里平均負載時多少。
1.2.磁盤空間使用率(df-h)
描述:
Filesystem文件系統Size文件系統容量Used文件系統已經使用的容量Use%文件系統
使用百分比Mountedon掛載的目錄
1.3.進程監控(ps-efIgrepjava)
查看應用程序啟動進程數是否正常
L4.內存監控(free—m)
描述:
total:總計物理內存的大小used:已使用多大free:可用有多少
shared:多個進程共享的內存總額buffers/cciched:磁盤緩存的大小。
第三行(-/+buffers/cached):
used:已使用多大。free:可用有多少.
1.5.CPU占用率(top)
描述:
top提供一個當前運行系統實時動態的視圖,也就是正在運行進程。在默認情況下,CPU
使用率最高的任務排在第一行,并每5秒鐘刷新一次。
1.6.I/O監控(vmstat210)
process:
-r:等待runtime的進程數?b:在不可打斷的休眠狀態下的進程數
memory:
-swpd:虛擬內存使用量(KB)-free:閑置內存使用量(KB)
-buff:被當做buffer使用的內存量(KB)
swap:
-si:swap到磁盤的內存量(KBps)-so:從磁盤swap出去的內存量(KBps)
10:
-bi:每秒讀取的塊數(blocks/s)-bo:每秒寫入的塊數(blocks/s)
系統:
in:每秒中斷數,包括時鐘中斷cs:每秒上下文切換數。
CPU(以百分比表示):
us:用戶進程執行時間(usertime)sy:系統進程執行時間(systemtime)
id:空閑時間(包括10等待時間)wa:等待10時間
1.7.日志系統
---系統日志(cat/var/1og/messages|grep'Jul23'Igreperror)
記錄報警信息
-硬件啟動日志(dmesg|greperror)
記錄系統啟動錯誤信息
一一應用系統日志
服務器各個應用的日志系統,比如:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫院康復患者管理制度
- 公路橋梁安全檢測方法試題及答案
- 公海客戶資源管理制度
- 安全現場分級管理制度
- 工地廚房獎罰管理制度
- 公司清潔外包管理制度
- 行政組織協作機制考題及答案
- 數據的生命周期管理流程試題及答案
- 安全操作規定管理制度
- 學校防疫學生管理制度
- 酸奶工廠設計說明書
- 小學一年級食品安全課件
- 《蛙泳腿部技術動作》教學設計
- MOOC 考古發現與中國文化-浙江大學 中國大學慕課答案
- MOOC 材料成形技術基礎-西安交通大學 中國大學慕課答案
- 2023版《管理學》考試復習題庫500題(含答案)
- 掛牌上鎖控制程序全套
- 人教版七年級下學期期末考試數學試卷共五套(含答案解析)
- 中石化合規管理手冊
- 氣溶膠及其氣候效應課件
- 工廠介紹文案
評論
0/150
提交評論