


下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、效勞器故障排除方法相比 PC 而言,效勞器出故障的機率是小多了, 但是它出故障造成的損失可也大多了。 作為效勞器維修人員需要了解一些效勞器故障恢復的根本知識, 知道在維修時可以做些什 么來最快速的解決問題也可以減少故障停機時間。本文并不是一本效勞器故障解決的完全手冊, 但如果能夠認真的按照下面的步驟維修 維護,它也許可以解決大多數問題,但當你做完所有的這一切仍不管用時,不用慚愧,去 找維修專家吧,可以放心的是,這些維修步驟不會出現大的損害,最壞的情形是“It doesnot work at all 。本文主要分三局部,第一局部講的是效勞器故障排除的根本原那么性問題。第二局部講述了一些效勞器硬件
2、故障排除的實例。第三局部講述了一些效勞器軟件故障排除的實例第一局部 效勞器故障排除的根本原那么性問題一、效勞器開機無顯示應怎么辦1. 檢查供電環境,零 -火;零 -地電壓?2. 檢查電源指示燈,如果亮,正常嗎?3. 按下電源開關時,鍵盤上指示燈亮嗎?風扇全部轉動嗎?4. 是否更換過顯示器,更換另一臺顯示器。5. 去掉增加內存6. 去掉增加的 CPU8. 檢查內存和 CPU 插的是否牢靠9. Clear CMOS10. 更換主要備件,如系統板,內存和 CPU二、效勞器故障排錯的根本原那么是什么1. 盡量恢復系統缺省配置a:硬件配置:去除第三方廠商備件和非標配備件;b:資源配置:去除CMOS,恢復
3、資源初始配置;c: BIOS, F/W,驅動程序:升級最新的BIOS , F/W和相關驅動程序;d: TPL:擴展的第三方的I/O卡屬于該機型的硬件兼容列表TPL嗎?2. 從根本到復雜a:系統上從個體到網絡:首先將存在故障的效勞器獨立運行,待測試正常后再接入網 絡運行,觀察故障現象變化并處理。b:硬件上從最小系統到現實系統:指從可以運行的硬件開始逐步到現實系統為止。c: 軟件上從根本系統到現實系統:指從根本操作系統開始逐步到現實系統為止。3. 交換比照a:在最大可能相同的條件下,交換操作簡單效果明顯的部件;b: 交換 NOS 載體,既交換軟件環境;c:交換硬件,既交換硬件環境;d:交換整機,既
4、交換整體環境;三、效勞器故障排除需要收集哪些信息 ?效勞器信息:1. 機器型號2. 機器序列號 S/N: 如: NC000755343. Bios 版本4. 是否增加其它設備,如網卡,SCSI 卡,內存, CPU5. 硬盤如何配置,是否做陣列 , 陣列級別6. 安裝什么操作系統及版本 Winnt 4, Netware, Sco, others? 故障信息1. 在 POST 時,屏幕顯示的異常信息2. 效勞器本身指示燈的狀態 ?3. 報警聲和 BEEP CODES4. NOS 的事件記錄文件 ?5. Events Log 文件? 確定故障類型和故障現象 :1. 開機無顯示;2. 上電自檢階段故障
5、;3. 安裝階段故障和現象;4. 操作系統加載失敗;5. 系統運行階段故障;第二局部 效勞器硬件故障處理幾例硬件故障是指效勞器硬件出現異常而導致的各類錯誤。由于效勞器構成比擬復雜,因 此在檢查的時候必須認真、仔細。 下面以一臺萬全 4500 為例說明。例子,在實際問題中 如果遇到相似現象,也需要具體問題具體分析,不要盲目套用有一臺萬全 4500,配有 256M 內存,使用一個 PIII XEON 500 帶 2M 高速緩存的處理 器。開機后沒有任何顯示,但系統日志上提示了一條 CPU 電壓為 0 伏的信息,系統指示 燈三燈不停在閃爍指示燈三燈閃爍是效勞器的另一種報警方式,我會在文后說明 。這
6、種錯誤一般是處理器電壓調節模塊VRM出錯或CPU出錯或CPU與CPU板塊接觸不 良,但也可能是 CPU 板塊出錯,這時情況就比擬復雜了,必須經過認真慎重的思考。因 為 CPU 板塊在整個效勞器中,占有舉足輕重的地位,如果它出錯效勞器是會報致命錯誤 的,并且在系統日志中會提示致命錯誤, 但報 CPU 電壓錯的情況也有 5%左右。我們立刻 把 CPU 調換在另一 CPU 插槽中,開機后依然是剛剛的那種故障。所以在初步判斷中,可 以排除是 CPU 板塊壞。這時,取出 CPU 仔細擦拭金手指,以及 CPU 板塊中與 CPU 接觸的地方后,開機依然 無顯示。相對處理器壞的情況來說處理器電壓模塊 VRM
7、出現故障的情況比擬大。于是立即 在另一臺萬全 4500 中取下一個處理器電壓模塊,安裝在此效勞器中。開機后,效勞器依 然沒有任何顯示,系統日志上依然提示 CPU 電壓為 0 伏的信息,系統指示燈三燈依然不 停在閃爍。這時的情況就比擬明顯了。于是立即從另一臺萬全4500中取下一個CPU安裝后,開機正??偨Y:在效勞器的維修中,線索都會顯得撲朔迷離,一般來說不可能一次就可以準確地判斷 出問題的所在。 這樣就要求相關人員要有信心及耐心。 出現錯誤一般的流程是通過系統日 志上的信息來解決,如果沒有解決問題再找出其它因素,然后再看日志信息。總之,效勞 器出錯后,必須一步一步解決,沒有捷徑可言。又如:有一臺
8、萬全 4200 開機不顯示,發現開機時系統日志沒有任何信息,且系統指示燈不 亮。初步判斷是電源方面出現了錯誤。經過仔細檢查,發現效勞器的電源是正常的,因此 最大的可能就是效勞器的電源管理板出現故障。 更換電源管理板后, 開機顯示正常。 但這 時,新的問題來了:自檢時,用 CTRL+M 不能檢測到硬盤。硬盤在別的效勞器上是正常的,因此立即去除此效勞器的CMOS,但依然不正常。立刻上網找到此效勞器的最新 BIOS,升級BIOS后也不能解決問題。又檢查硬盤籠子和 效勞器里的數據線及電源線后依然出錯。這時,一般情況會疑心是效勞器的I/O板輸入輸出板塊有問題。但就在這個時候,我發現在 I/O 板上有一個
9、非聯想的舊式網卡,立即 去除此網卡后效勞器就一切正常。硬件故障并不單單指硬件有問題, 它也指硬件之間不兼容。 因為效勞器的正常運作需 要各部件之間的大力協調。 建議大家在采購各元件時, 都采用同一品牌原裝的, 并且要采 用能發揮效勞器性能的元件上例中的舊式網卡即使正常也會嚴重影響效勞器性能 ,這 樣才不會發生莫明其妙的故障。還有一種情況: 用戶需要把他的萬全 3200升級到雙網卡, 我建議他購置原裝網卡, 但 當他看到萬全 4500的網卡是采用的 INTEL 82559 芯片后,斷然決定不使用原裝網卡而采 用另一品牌也采用 INTEL 82559 的網卡。過了幾天,他打 給我說,他的新網卡不能
10、使 用網絡冗余及數據校驗,并疑心效勞器有問題。維修工程師帶了一個 INTEL 82559 網卡 到用戶那里,仔細檢查了效勞器的環境完全正常后,把 INTEL 82559 網卡安裝到機器上 后一切正常。 這個例子更加說明了, 要發揮效勞器的最大性能及功能, 必須使用原品牌原 裝的配件。 非原品牌非原裝的配件, 不能支持效勞器的某些功能, 嚴重的會影響到效勞器 的正常使用。要防止硬件故障發生頻率,效勞器管理人員必須注意效勞器的使用環境完全正常。比 較重要的效勞器必須在恒溫、恒濕的環境;電壓也要符合,不僅要采用UPS,還必須接地線,必須是左零線、右火線,零地電壓在 13 伏。在開、關效勞器上必須符合
11、正常的流 程。工作人員必須嚴格執行操作流程。一般情況來說,效勞器維修人員對于硬件故障只要有豐富的經驗都能很快找出故障所 在,如果不能解決就必須迅速與效勞器的售后效勞中心 8008108888聯系。第三局部 效勞器常見軟故障解決思路與實例效勞器軟件故障是在效勞器故障中占有比例最高的部份,約占70%,解決的過程必須更加深思熟慮。導致效勞器出現軟件故障的原因有很多,最常見的是效勞器 BIOS 版本太 低、效勞器的管理軟件或效勞器的驅動程序有BUG、應用程序有沖突及人為造成的軟件故障。下面分別舉例說明各類軟件故障的維修方法。有一臺萬全3500效勞器,配置為雙 PIII 500帶521K高速緩存的CPU
12、、512M內存。 開機后,系統日志報電壓調節模塊異常 VRM 的錯誤,報錯的信息是: “。從外表來 看,極有可能是效勞器的電壓調節模塊或其它硬件出現故障, 極容易導致維護人員認為是 硬件故障。維護人員立刻使用其它萬全 3500的硬件來測試,發現即使使用新的配件,此 效勞器依然報VRM錯。就在一籌莫展的時候,維修工程師帶來了最新的CPU管理板CPUManagement Control的固件FIRMWARE,于是升級了 CPU 管理板塊的 FIRMWARE 后,效勞器恢復立即正常。FIRMWARE 升級方法是, 1 用軟盤啟動電腦,然后插入 firmware 軟盤并運行上面 的相關文件cabril
13、lo ; 2系統刷新BMC主板控制器和HSC熱插拔背板控制器; 3 然后系統詢問執行第幾個選項 通常為 2; 4 然后系統詢問效勞器的電源配置 通 常為 2;5 如果答復有兩個電源,系統詢問效勞器是否有輔助風扇即在第三個電源冗余電源的位置上 是否有風扇通常為 N; 6 然后系統詢問是否重寫 BMC kernel use area;通常為N然后系統詢問是否輸入一個 asset tag 通常為N7最后系 統詢問在刷新后是否要重新啟動系統; 通常為 Y 。這種升級方法也適合刷新系統 BIOS 等,命令的參數不同以及更新 FIRMWARE 及 BIOS 文件名不同,參數請參考效勞器的說 明。任何一款效
14、勞器的FIRMWARE及BIOS都會有不同的BUG,因為BUG在所難免,所 以我們不能錯誤地認為效勞器的 BIOS 程序就很完善,而應該經常更新效勞器的 FIRMWARE及BIOS,只是在升級之前應該小心謹慎,錯誤的升級方法將會導致嚴重的后 果。目前流行的中高檔效勞器都擁有強大的管理程序,為客戶提供了方便的管理途徑;服 務器也擁有各種操作系統下的驅動程序, 方便了客戶在各種操作系統中的使用。 但是,世 上任何一款程序都會有一些 BUG,這些BUG將影響用戶使用。但是效勞器廠商總是會在 第一時間內開發出新的程序,客戶只需要及時更新這些程序就可以防止這類故障。當效勞器的軟件故障為此類時,表現的現象
15、也不盡相同。一般來說,管理程序BUG會導致系統速度變慢, CPU 占用率變高,無法正常使用某些功能等;驅動程序的 BUG 會 導致死機、 與某些軟件有沖突, 磁盤工作不穩定等。 查看管理程序是否出錯的最好的方法 就是在系統中首先禁止此類管理工具, 再觀察效勞器是否還是異常。 由于管理工具是隨著 系統啟動而啟動的,所以應首先防止它的啟動。以 WINDOWS NT4 為例,就首先在管理 工具效勞中禁用某些效勞器軟件效勞, 再修改注冊表中的啟動項即可。 如果是驅動程序有 問題的話,就以平安模式進入系統,看是否正常。但是需要注意的是,在平安模式中,系 統速度變慢是正常的特別是磁盤 I/O 方面。效勞器
16、的維護人員就應該經常在效勞器網站上下載最新的管理工具程序及驅動程序 這樣會減少很大一部份軟件故障的發生。相比之下,軟件沖突造成的故障判斷比擬困難,需要管理人員有比擬豐富的經驗以及 敏銳的觀察力。曾經有一位用戶說, 他有一臺萬全的效勞器無法安裝 SQL SERVER 2000,已經重裝 N 次 NT 了,排除是系統故障。而這唯一的效勞器又將作為非常重要數據庫效勞器,因此非 常著急。 于是維修工程師去了他的公司查看。 這臺效勞器所在的機房是非常標準、 完善的 機房,檢查了這臺效勞器的情況, 發現并沒有硬件上的故障, 于是排除了光驅讀盤力差的 可能。但是,用戶刻的 SQL SERVER 2000光盤引起了工程師的疑心,工程師讓他拿出了 正版的 SQL SERVER 安裝,結果還是不行。在安裝的過程中,沒有出現絲毫錯誤,可就 是在運行的時候會自動退出, 沒有任何提示。 但是,我在管理工具中的事件查看器的系統 日志中卻發現了一條信息:win data.exe導致一個無效的數據溢出。 Win data是用戶自己編 寫的一個程序, 而且是隨操作系統啟動而啟動的程序。 我立即結束掉這個進程后, 再運行 SQL 一切正常。對于此類軟件故障,操作員最好先查看有關的日志,看看系統中是否有可疑的進程。 目
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 學校福利房管理制度
- 學校茶水房管理制度
- 學生會人事管理制度
- 學生課堂上管理制度
- 安保部工作管理制度
- 安全痕跡化管理制度
- 安防部宿舍管理制度
- 定制類店面管理制度
- 實訓室創意管理制度
- 客車站風險管理制度
- 農業投資合同協議書
- 重慶市渝北區名校2025屆生物七下期末復習檢測模擬試題含解析
- 2025年5月12日陜西省公務員面試真題及答案解析
- 《臨床研究論文撰寫》課件
- 隱匿性陰莖的護理
- 扳手訂單合同協議
- 購買居間協議書范本
- 瀝青路面施工方案
- 【西安交通大學】2025年電力人工智能多模態大模型創新技術及應用報告
- 2025年上海國企中鐵十五局集團有限公司招聘筆試參考題庫含答案解析
- 2025電梯年檢項目整改合同田王
評論
0/150
提交評論