




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、H3Cloud云計算軟件套件故障處理手冊Copyright © 2012 杭州華三通信技術有限公司 版權所有,保留一切權利。非經本公司書面許可,任何單位和個人不得擅自摘抄、復制本文檔內容的部分或全部,并不得以任何形式傳播。本文檔中的信息可能變動,恕不另行通知。目錄存儲故障處理1問題1共享文件系統存儲池啟動失敗處理1故障描述1故障處理流程2故障處理步驟2問題2 Web界面上無法暫停或刪除存儲池2故障描述2故障處理流程2故障處理步驟2問題3刪除iSCSI存儲器上邏輯資源導致物理重啟3故障描述3故障處理流程3故障處理步驟3問題4物理機之間系統時間差別很大時,導致共享文件系統集群異常3故障描
2、述3故障處理流程3故障處理步驟3問題5共享文件系統使用的磁盤容量較小時的異常4故障描述4故障處理流程4故障處理步驟4問題6虛擬機采用FTP方式備份異常4故障描述4故障處理流程4故障處理步驟4HA故障處理5問題1 啟用動態資源調整,虛擬機未自動遷移或遷 移失敗5故障描述5故障處理流程5故障處理步驟5問題2 集群中在線遷移虛擬機,使用本地存儲提示失敗6故障描述6故障處理流程6故障處理步驟6問題3 集群中離線遷移虛擬機失敗7故障描述7故障處理流程7故障處理步驟7問題4 集群中某主機宕機,虛擬機未在其它主機中重新啟動8故障描述8故障處理流程8故障處理步驟8問題5 集群啟用HA,虛擬機未能納入HA管理9
3、故障描述9故障處理流程9故障處理步驟10問題6 集群啟用HA失敗,設置主機在線失敗11故障描述11故障處理流程11故障處理步驟11問題7 集群虛擬機遷移時出現宕機等故障,之后啟動虛擬機失敗12故障描述12故障處理流程12故障處理步驟12問題8 集群啟用HA,虛擬機啟動超時失敗13故障描述13故障處理流程13故障處理步驟13問題9 集群啟用HA,虛擬機啟動失敗14故障描述14故障處理流程14故障處理步驟14問題10 集群新加入主機,組織管理員部署虛擬機失敗15故障描述15故障處理流程15故障處理步驟15問題11 集群啟用HA,虛擬機在線遷移失敗16故障描述16故障處理流程16故障處理步驟16虛擬
4、機故障處理17問題1虛擬機啟動失敗故障處理17故障描述17故障處理流程17故障處理步驟18問題2啟動時連接光驅失敗故障處理19故障描述19故障處理流程19故障處理步驟19問題3虛擬機遷移失敗故障處理19故障描述19故障處理流程19故障處理步驟19問題4關閉虛擬機失敗故障處理19故障描述19故障處理流程20故障處理步驟20虛擬交換機故障處理21問題1有網口接入VEPA或多通道類型的虛擬交換機上的虛擬機,啟動成功后,界面上提示”虛擬網卡異常”21故障描述21故障處理流程22故障處理步驟22問題2服務器同非VEPA交換機的連接在iMC拓撲上未正確展現25故障描述25故障處理流程25故障處理步驟25虛
5、擬機客戶操作系統使用的故障處理26問題1在Google Chrome瀏覽器中打開H3Cloud云計算管理平臺,打開某虛擬機的控制臺,無法出現控制臺窗口26故障描述26故障處理流程26故障處理步驟27問題2火狐中打開自助服務頁面的”我的首頁”,點擊某虛擬機的”遠程桌面”按鈕后未顯示遠程桌面窗口28故障描述28故障處理流程28故障處理步驟28問題3Win7虛擬機的資源管理器反復重啟29故障描述29故障處理流程29故障處理步驟29問題4Windows系列的虛擬機克隆后、從備份中恢復后或異常關機后啟動,從控制臺上看提示錯誤恢復30故障描述30故障處理流程31故障處理步驟31問題5Linux系列的虛擬機
6、克隆后、從備份中恢復后或異常關機后啟動,從控制臺上看一直停留在菜單選擇頁上31故障描述31故障處理流程32故障處理步驟32iii存儲故障處理問題1共享文件系統存儲池啟動失敗處理故障描述· iSCSI存儲管理器上,創建“iSCSI共享文件系統”類型的存儲池時,顯示“internal error Child process (/bin/mount -t ocfs2 /dev/disk/by-path/ip-:3260-iscsi-iqn.2007-.h3c:storware.target4-lun-0 /vms/target4) status unexpected
7、: exit status 1"Figure 1 啟動存儲池失敗提示信息Figure 2 只讀屬性故障處理流程1. iSCSI存儲上配置的物理主機對于target的權限是只讀造成的,修改其權限為非獨占式讀寫時;2. 由于物理主機和iSCSI存儲之間的session(會話)已經建立,無法重新賦予物理主機權限,需要手工采用ssh或其它方式登錄到物理主機上,斷開物理主機和iSCSI存儲target之間的會話。故障處理步驟1. 管理員手工登錄到對應的物理服務器上, 如采用ssh,或直接登錄到物理機上;2. 采用命令查詢對應的session會話:iscsiadm -m session 如查詢出
8、結果為: rootvmc-10:/vms/isos# iscsiadm -m session tcp: 2 :3260,1 iqn.2007-.h3c:storware.target4 tcp: 4 :3260,1 iqn.2007-.h3c:storware.640f02.target33. 選擇需要logout的target會話,在iSCSI存儲管理器上的targetiqn.2007-.h3c:storware.target4取消失敗,則執行命令: rootvmc-10:/vms/isos# iscsiadm -m node -T iqn.2
9、007-.h3c:storware.target4 -u Logging out of session sid: 2, target: iqn.2007-.h3c:storware.target4, portal: ,3260 Logout of sid: 2, target: iqn.2007-.h3c:storware.target4, portal: ,3260: successful4. 在iSCSI存儲管理器上,將對應的物理主機從iqn.2007-.h3c:storware.target4上取消關聯即可, 如取消vmc-10物理主機對于
10、target的使用。問題2 Web界面上無法暫停或刪除存儲池故障描述· 服務器上某些進程正在使用存儲池掛接的目錄, 導致umount命令失敗,報錯:“internal error Child process (/bin/umount /vms/target3) status unexpected: exit status 1”Figure 5 停止共享文件系統的存儲池失敗故障處理流程1. 檢查物理服務器上是否有進程或用戶正在使用對應的存儲池;2. 根據查詢結果,確認可以停止對應的進程后,將使用對應的存儲池的進程殺掉;3. 在H3Clou配置臺上再次暫停或刪除共享存儲池。故障處理步驟1
11、. 手工登錄(如采用ssh,或者直接通過終端)到對應的物理服務器上;2. 如存儲池掛接到/vms/share_dir目錄下,則采用命令行:lsof +d /vms/share_dir 查詢出所有使用該目錄的進程; rootvmc-216:# lsof +d /vms/target3 COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME bash 11349 root cwd DIR 8,16 3896 513 /vms/target3 vim 12138 root cwd DIR 8,16 3896 513 /vms/target3 vim 12
12、138 root 3u REG 8,16 12288 1412504 /vms/target3/.test.txt.swp3. 采用“kill -9 進程號”方式殺掉所有查詢出來的進程;注意:這里執行完一次kill -9之后,都需要重新采用lsof +d /vms/target3查詢一下,直到沒有為止; rootvmc-216:# kill -9 11349 rootvmc-216:# lsof +d /vms/target34. 在H3Cloud配置臺部分,對應的存儲池就可以暫停或刪除了。問題3刪除iSCSI存儲器上邏輯資源導致物理重啟故障描述· 在iSCSI存儲管理器上刪除共享文
13、件系統使用的target中的邏輯資源,導致使用該target的物理服務器重新啟動。 故障處理流程1. 管理員需要在H3Cloud上確認是否有物理主機使用target作為共享文件系統后再作刪除決定;2. 管理員需要預先評估這種在iSCSI存儲管理器上刪除的風險,和其它的類似風險。故障處理步驟1. iSCSI存儲管理員預先評估風險后,再作刪除操作。問題4物理機之間系統時間差別很大時,導致共享文件系統集群異常故障描述· 共享文件系統的各個使用物理接點之間系統時間差別很大時,會導致共享文件系統集群異常,有些物理機會出現共享存儲池的訪問異常,無法列出最新的文件等。故障處理流程1. 在加入對應的
14、物理節點時,需要檢查物理服務器的系統時間是否一致,確保和節點之間的系統時間差別在5分鐘之內。故障處理步驟1. 檢查各個物理節點的系統時間,確保各個節點間的系統時間差別小于5分鐘。問題5共享文件系統使用的磁盤容量較小時的異常故障描述· 共享文件系統采用了OCFS2文件系統格式化磁盤,當磁盤容量小于10G,且其格式化時采用了很多節點,如32個節點,可能格式化成功,但磁盤共享文件系統不可用。故障處理流程1. 對于容量較小的磁盤作為共享文件系統,采用OCFS2格式化的時候選擇輸入數目小的節點數,如4個,而不采用默認的32個節點。故障處理步驟1. 共享文件系統格式化時采用數據較少的訪問節點。F
15、igure 14 格式化時選擇4個訪問節點問題6虛擬機采用FTP方式備份異常故障描述· 虛擬機備份的時候,采用FTP方式備份,由于在FTP上缺少登錄用戶的上傳和創建目錄權限,導致備份過程中無法在FTP上創建目錄并上傳文件,備份失敗。故障處理流程1. 修改FTP服務器上備份時采用的登錄用戶的權限,增加創建目錄和上載權限。故障處理步驟1. 修改FTP服務器上備份時采用的登錄用戶的權限,增加創建目錄和上載權限;2. 再次備份虛擬機到FTP服務器。HA故障處理問題1 啟用動態資源調整,虛擬機未自動遷移或遷 移失敗故障描述集群啟用動態資源調整,設置好持續時間、CPU和內存利用率閥值、檢查時間間
16、隔,發現主機達到資源調整條件,但虛擬機未自動遷移,或遷移失敗。遷移失敗,在系統管理-操作日志中顯示,如下圖顯示Figure 17 虛擬機遷移失敗故障處理流程1. 如果虛擬機未自動遷移,則查看自動遷移條件,是否已經滿足遷移條件。2. 如果虛擬機自動遷移失敗,則查看是否是本地存儲等。故障處理步驟· 如果虛擬機未自動遷移,則按以下步驟查找:1. 檢查動態資源調整設置閥值,是否某臺主機CPU和內存都已超過閥值,而其余某臺主機的CPU和內存都未超過該設置的閥值?待遷移主機CPU和內存都要超過閥值,而集群中存在CPU和內存都未超過該閥值的主機。如果條件滿足,則檢查步驟2。2. 查看CPU和內存都
17、超過閥值的主機中虛擬機是否都已勾選“允許自動遷移”選項,如果沒有勾選,則在修改虛擬機面板中勾選即可。3. 如果以上條件滿足,還未遷移,則聯系技術人員支持。· 如果虛擬機遷移失敗,則按以下步驟查找:1. 查看遷移失敗的虛擬機是否是本地存儲,如果是本地存儲,則會自動遷移,但遷移失敗。2. 查看遷移失敗的虛擬機中是否掛載著光驅,而待遷移到的主機中沒有光驅,如果掛載著光驅,則在修改虛擬機面板取消連接即可。3. 查看遷移失敗的虛擬機中是否掛載著本地的iso文件,如果是則在修改虛擬機面板中取消連接即可。如果非以上步驟引起失敗,則查看后臺日志,請技術人員支持,查看后臺日志方法,如下步驟。4. 登錄
18、到集群中主機中,依次查看后臺HA腳本處理日志,查看方法 tail -100f /var/log/ha_shell_2012*.log(*為當前月份),查看當前時刻是否有HA腳本vm_migrate_*.sh相關錯誤信息?如果錯誤日志出現“Failed to migrate vm.”則繼續查看libvirt和qemu日志。5. 查看libvirt日志,查看方法 tail -100f /var/log/libvirt/libvirtd.log,查看具體遷移失敗原因。查看qemu日志,查看方法tail -100f /var/log/libvirt/qemu/*.log(*為遷移的虛擬機名稱),查看具
19、體遷移失敗原因。問題2 集群中在線遷移虛擬機,使用本地存儲提示失敗故障描述在集群中手動在線遷移虛擬機時,提示該虛擬機使用本地存儲,不允許在線遷移失敗。Figure 20 使用本地存儲的虛擬機不允許在線遷移故障處理流程1. 查看虛擬機的磁盤是否使用本地存儲或另一臺主機不能識別共享存儲。2. 查看虛擬機的光驅中是否掛載有本地或另一臺主機不能識別存儲的iso,是否掛載有主機的光驅。故障處理步驟1. 如果虛擬機的磁盤使用本地存儲或另一臺主機不能識別共享存儲,則不能遷移。2. 如果虛擬機有多個磁盤,其中某個磁盤使用本地存儲,需要修改虛擬機面板,刪除該磁盤后即可遷移。3. 如果虛擬機的光驅掛載到主機光驅,
20、則不能遷移,則修改虛擬機面板,取消光驅連接后既可以遷移。4. 如果虛擬機的光驅中掛載有本地或另一臺主機不能識別存儲的iso,則修改虛擬機面板,取消光驅連接后既可以遷移。問題3 集群中離線遷移虛擬機失敗故障描述手動離線遷移虛擬機,遷移虛擬機的存儲,提示失敗,如下圖所示。故障處理流程1. 查看任務臺中任務描述,如果失敗描述原因清楚比如SSH連接錯誤,目標存儲已存在等,則可知道原因。如果原因不清晰則需查看日志。2. 登錄到云計算管理平臺的安裝主機中,查看運行日志;查看方法 tail -100f /var/log/tomcat6/ catalina.out,查看該時刻是否有異常情況?3. 登錄到集群中
21、主機中,依次查看后臺HA腳本處理日志,查看方法 tail -100f /var/log/ha_shell_2012*.log(*為當前月份),查看當前時刻是否有HA腳本vm_migrate_*.sh相關錯誤信息?如果錯誤日志出現“Failed to migrate vm.”則繼續查看libvirt和qemu日志。故障處理步驟1. 如果遷移到的主機的存儲中已經存在該虛擬機的同名鏡像,則遷移需要先確認刪除該同名鏡像,本錯誤為遷移的鏡像在目標主機中已存在,但也可能由以下錯誤引起遷移失敗(非存儲存在失敗)。注意,如果虛擬機有多個磁盤,是一并遷移,所以保證不能有一個存在沖突。2. 如果遷移到的主機的存儲
22、中剩余磁盤容量小于虛擬機鏡像大小,則需要重新掛接磁盤。注意,離線遷移存儲,如果虛擬機有多個磁盤,是一并遷移,要保證遷移到的主機有容納該全部磁盤的容量。3. 如果為網絡異常比如SSH連接錯誤,確認網絡聯通后即可。4. 非以上原因,則聯系技術人員處理,查看日志方法。登錄到云計算管理平臺的安裝主機中,查看運行日志;查看方法 tail -100f /var/log/tomcat6/ catalina.out,查看該時刻是否有異常情況?5. 登錄到集群中主機中,依次查看后臺HA腳本處理日志,查看方法 tail -100f /var/log/ha_shell_2012*.log(*為當前月份),查看當前時
23、刻是否有HA腳本vm_migrate_*.sh相關錯誤信息?如果錯誤日志出現“Failed to migrate vm.”則繼續查看libvirt和qemu日志。6. 查看libvirt日志,查看方法 tail -100f /var/log/libvirt/libvirtd.log,查看具體遷移失敗原因。查看qemu日志,查看方法tail -100f /var/log/libvirt/qemu/*.log(*為遷移的虛擬機名稱),查看具體遷移失敗原因。問題4 集群中某主機宕機,虛擬機未在其它主機中重新啟動故障描述集群中多臺主機,如果某臺主機出現宕機或網絡故障,而其上的虛擬機未在集群中其余主機中
24、重新啟動。故障處理流程1. 查看該前臺集群是否已經啟用HA,如果該集群未啟用HA,則不會擁有高可靠性,不會重新啟動虛擬機。2. 如果已經啟用HA,虛擬機還未啟動,查看未啟動的虛擬機是否采用了本地存儲,如果采用本地存儲,則不能重新啟動。3. 非以上問題,則查看后臺日志。故障處理步驟1. 查看該前臺集群是否已經啟用HA,如果該集群未啟用HA,則不會擁有高可靠性,不會重新啟動虛擬機。2. 如果前臺已經啟用HA,則ssh登錄后臺,輸入crm status命令,如果出現類似如下的輸出:rootH3CRDS09-RD:/# crm statusConnection to cluster failed: c
25、onnection failedrootH3CRDS09-RD:/#則表示后臺未啟用HA,前后臺HA不一致,聯系技術人員處理。如果出現類似以下輸出,則表示后臺HA運行正常rootH3CRDS13-RD:/# crm status=Last updated: Thu Sep 13 17:24:23 2012Last change: Wed Sep 12 14:11:19 2012 via crm_resource on H3CRDS13-RDStack: openaisCurrent DC: H3CRDS13-RD - partition with quorumVersion: 1.1.6-99
26、71ebba4494012a93c03b40a2c58ec0eb60f50c4 Nodes configured, 4 expected votes173 Resources configured.=Online: H3CRDS10-RD H3CRDS11-RD H3CRDS12-RD H3CRDS13-RD VMv0000-h05170-160.50(ocf:heartbeat:VirtualDomain):Started H3CRDS10-RD VMv0052-z00398-160.113(ocf:heartbeat:VirtualDomain):Started H3CRDS11-RD V
27、Mv0105-z01925-160.166(ocf:heartbeat:VirtualDomain):Started H3CRDS11-RD fence-ssh(stonith:external/ssh):Started H3CRDS11-RDrootH3CRDS13-RD:/#如果后臺HA也正常,則是未知錯誤,則聯系技術人員支持。查看后臺日志方法,如下:3. 登錄到云計算管理平臺的安裝主機中,查看運行日志;查看方法 tail -100f /var/log/tomcat6/ catalina.out,查看該時刻是否有異常情況?4. 登錄到集群中主機中,依次查看后臺HA腳本處理日志,查看方法 t
28、ail -100f /var/log/ha_shell_2012*.log(*為當前月份),查看當前時刻是否有HA腳本相關錯誤信息? 5. 如果HA腳本沒有相關錯誤信息,則查看syslog日志,查看是否有pacemaker的相關錯誤信息?查看方法:tail -100f /var/log/syslog問題5 集群啟用HA,虛擬機未能納入HA管理故障描述集群中主機已經存在多臺虛擬機,現在集群啟用HA,其集群下的全部虛擬機要納入HA管理,便于主機宕機時虛擬機的重啟。在啟用HA時,某臺虛擬機可能未能納入HA管理,此時啟動虛擬機,則失敗,提示集群內不存在虛擬機。類似如下錯誤:故障處理流程1. 查看任務臺
29、中任務描述,表示在集群中不存在該主機,就是啟用HA時,該虛擬機未能納入HA管理。2. ssh登錄到集群任一主機中,crm status查看集群狀態。3. 如果確認該虛擬機為加入集群,則后臺手動添加該虛擬機到集群中。命令如下(共四個參數):vm_add.sh vm-name vm-priority 1 host-name ; echo $?4. 命令運行失敗,查看后臺HA腳本處理日志,查看方法 tail -100f /var/log/ha_shell_2012*.log(*為當前月份),查看當前時間段內,該日志的錯誤信息顯示。 故障處理步驟1. 查看任務臺中任務描述,表示在集群中不存在該主機,就
30、是啟用HA時,該虛擬機未能納入HA管理。2. ssh登錄到集群任一主機中,crm status查看集群狀態,如果HA出現未知錯誤,類似如下:rootH3CRDS09-RD:/# crm statusConnection to cluster failed: connection failedrootH3CRDS09-RD:/#請聯系技術人員處理。否則,顯示集群中虛擬機的狀態,如下:rootH3CRDS13-RD:/# crm status=Last updated: Thu Sep 13 17:24:23 2012Last change: Wed Sep 12 14:11:19 2012 vi
31、a crm_resource on H3CRDS13-RDStack: openaisCurrent DC: H3CRDS13-RD - partition with quorumVersion: 1.1.6-9971ebba4494012a93c03b40a2c58ec0eb60f50c4 Nodes configured, 4 expected votes173 Resources configured.=Online: H3CRDS10-RD H3CRDS11-RD H3CRDS12-RD H3CRDS13-RD VMv0000-h05170-160.50(ocf:heartbeat:V
32、irtualDomain):Started H3CRDS10-RD VMv0052-z00398-160.113(ocf:heartbeat:VirtualDomain):Started H3CRDS11-RD VMv0105-z01925-160.166(ocf:heartbeat:VirtualDomain):Started H3CRDS11-RD fence-ssh(stonith:external/ssh):Started H3CRDS11-RDrootH3CRDS13-RD:/#查看該狀態信息,確認出現錯誤的虛擬機不在集群狀態顯示中,則進行第3步驟。否則該虛擬機出現在該顯示狀態信息中
33、,則聯系技術人員處理。3. 后臺手動添加該虛擬機到集群中。命令如下(共四個參數):vm_add.sh vm-name vm-priority 1 host-name ; echo $?Vm-name表示要加入虛擬機的名稱。vm-priority表示HA中虛擬機的啟動優先級,為high/middle/low中的一個,如圖,查看集群的虛擬機啟動優先級,中級為middle,其余類似。Figure 29 集群啟用HA并指定虛擬機啟動優先級 Host-name表示要加入的主機的名稱,隨便選擇集群中的一個虛擬機較少主機即可。命令返回值:如果為0,表示命令執行成功,如果不為0,表示失敗,請確認命令調用是否錯
34、誤,如果失敗,定位錯誤日志,請聯系技術人員處理,則進行步驟4。如果命令執行成功,再運行crm status,查看該虛擬機是否已經加入到集群中,如果已加入集群中,則說明已成功恢復虛擬機狀態,否則,聯系技術人員處理,則進行步驟4。4. 查看后臺HA腳本處理日志,查看方法 tail -100f /var/log/ha_shell_2012*.log(*為當前月份),查看當前時間段內,該日志的錯誤信息顯示。問題6 集群啟用HA失敗,設置主機在線失敗故障描述集群中主機已經存在多臺虛擬機,現在集群啟用HA,啟用HA過程中任務等待時間較長,之后任務臺報錯,錯誤如下:Figure 30 集群啟用HA時設置主機
35、在線失敗 故障處理流程1. 登錄到集群主機中,查看運行日志,如果多臺主機,依次ssh登錄,查看后臺錯誤日志。2. 查看網絡信息后,請重新嘗試。 故障處理步驟1. 登錄到集群主機中,查看運行日志,如果多臺主機,依次ssh登錄,查看后臺錯誤日志,因為錯誤日志可能在任一臺中。查看方法 tail -100f /var/log/ha_shell_2012*.log(*為當前月份),查看當前時刻HA腳本”Host online failed”相關錯誤信息, 再查看syslog日志,查看該時間段是否有pacemaker的相關錯誤類似信息?Totem is unable to form a cluster b
36、ecause of an operating system or network fault.查看方法:tail -100f /var/log/syslog。之后進行步驟2。2. 確認出現錯誤日志的主機的網絡連接正常,如果網絡中流量過大,請等待網絡流量變小后,重新啟用HA。如果還出現該錯誤,請聯系技術人員處理。問題7 集群虛擬機遷移時出現宕機等故障,之后啟動虛擬機失敗故障描述集群在手動遷移虛擬機或自動遷移虛擬機時,目標主機出現宕機或者其它嚴重故障,導致遷移失敗,但源主機的遷移任務還一直在持續,也未出現任務超時,任務失敗(未知原因)。之后啟動虛擬機出現故障。如果集群未啟用HA,則前臺報如下錯誤:
37、如果集群啟用HA,則前臺報錯誤不明確,如下,此時需要后臺確認日志報錯。后臺libvirt日志/var/log/libvirt/libvirt.log出現如下錯誤error : qemuDomainObjBeginJobInternal:781 : Timed out during operation: cannot acquire state change lock, current job mini2 migration out故障處理流程1. 查看后臺日志,確認錯誤信息。2. Virsh domjobinfo vm-name, virsh domjobabort vm-name等命令修改該
38、遷移錯誤。 故障處理步驟1. Ssh登錄到該虛擬機所在主機,查看后臺libvirt日志,查看方法:tail -100f /var/log/libvirt/libvirt.log,如果確認為該錯誤,則進行后續步驟。2. 運行命令virsh domjobinfo vm-name; vm-name為出現錯誤的虛擬機名稱。運行該命令后,會出現類似如下信息:此時再運行virsh domjobabort vm-name,取消該任務,再次運行virsh domjobinfo vm-name,出現如下信息:則任務取消成功。3. 再次啟動虛擬機,會啟動正常,如果再有該錯誤,則聯系技術人員處理。 問題8 集群啟用
39、HA,虛擬機啟動超時失敗故障描述集群啟用HA,之后啟動虛擬機,但是虛擬機啟動過程過慢,導致超時,啟動失敗,啟動過程過慢可能是因為主機內存過少,CUP利用率過高導致。集群啟用HA,則前臺報錯誤不明確,如下,此時需要后臺確認日志報錯。后臺HA日志/var/log/ ha_shell_2012*.log(*為當前月份),出現如下錯誤error : Virtual domain mini2 hasn't been started yet(60 s), FAILED!因為是啟動超時(即60秒內,因為內存小主機慢等原因,未能啟動完全),可能超時后,虛擬機還會啟動成功。故障處理流程1. 查看后臺日志
40、,確認錯誤信息。2. 確認錯誤信息后,等待幾秒,刷新前臺,看是否超時后虛擬機又啟動成功。 故障處理步驟1. Ssh登錄到該虛擬機所在主機,查看后臺libvirt日志,查看方法:tail -100f /var/log/ ha_shell_2012*.log(*為當前月份),如果確認為該錯誤,則進行后續步驟。2. 確認錯誤信息后,等待幾十秒,刷新前臺,看是否超時后該虛擬機又啟動成功運行正常,如果又啟動成功,則停止操作即可了。如果還是啟動失敗,則查看主機內存CPU等信息,清理無用任務減少內存使用或CPU使用后,再重新啟動該虛擬機,如果還出現異常,則聯系技術人員處理。問題9 集群啟用HA,虛擬機啟動失
41、敗故障描述集群啟用HA,之后啟動虛擬機,但因為未知錯誤,導致虛擬機啟動失敗。集群啟用HA,則前臺報錯誤不明確,如下,此時需要后臺確認日志報錯。導致虛擬機啟動失敗的原因很多,主要有:虛擬機網卡vswitch配置不正確,虛擬機掛接光驅但主機光驅沒有,主機內存不夠,虛擬機鏡像不能找到等。其詳細信息,請參見<<libvirt 故障處理手冊>>中的虛擬機啟動失敗故障。故障處理流程1. 查看后臺HA日志,查看方法:tail -100f /var/log/ ha_shell_2012*.log(*為當前月份), 2. 查看后臺libvirt和qemu日志。查看libvirt日志,查看
42、方法 tail -100f /var/log/libvirt/libvirtd.log。查看qemu日志,查看方法tail -100f /var/log/libvirt/qemu/*.log(*為虛擬機名稱),查看具體啟動原因。 故障處理步驟1. 查看后臺HA日志,查看方法:tail -100f /var/log/ ha_shell_2012*.log(*為當前月份)。2. 查看后臺libvirt和qemu日志。查看libvirt日志,查看方法 tail -100f /var/log/libvirt/libvirtd.log。查看qemu日志,查看方法tail -100f /var/log/l
43、ibvirt/qemu/*.log(*為虛擬機名稱),查看具體啟動原因。3. 查找完具體原因后,重新啟動虛擬機,如果還失敗,請聯系技術人員處理。問題10 集群新加入主機,組織管理員部署虛擬機失敗故障描述系統中存在組織,系統管理員已經分配集群、虛擬交換機、共享存儲、虛擬機模板給該組織使用,該組織管理員可用使用分配的虛擬機模板在分配的集群中創建虛擬機。如果該集群加入一臺新主機,而新主機的虛擬交換網絡和存儲與集群中的原主機不同,此時新主機可以加入集群,但是,已經分配使用該集群的組織管理員,通過模板部署虛擬機時可能會失敗(虛擬機正好部署到新主機中,且新主機沒有虛擬機所使用的網絡與存儲,就會失敗,否則不
44、會失敗)。錯誤如下,但原因可能不同:故障處理流程1. 查看集群中新加入主機與集群中其余主機的虛擬交換機配置和存儲配置。2. 修改新主機的虛擬交換機配置和存儲配置,使其與集群中其它主機一致。 故障處理步驟1. 查看集群中新加入主機與集群中其余主機的網絡配置和存儲配置,前臺虛擬機交換機查看位置如下:Figure 41 虛擬交換機配置前臺存儲查看位置如下:Figure 42 主機上的存儲配置2. 修改新主機的虛擬交換機配置和存儲配置,使其與集群中其它主機一致。3. 虛擬交換機修改如上圖虛擬機交換機圖示所示,修改即可。4. 存儲修改也如上圖所示,但是刪除存儲不允許修改,如要修改需刪除后再添加。但是刪除
45、存儲時,如果有虛擬機使用該存儲,則不允許刪除該存儲。所以需要先刪除虛擬機再刪除存儲,如果虛擬機不能刪除,則需要全部遷移到其它主機中,之后再刪除存儲。實際現場情況,添加的新主機多數是沒有虛擬機,則只需添加比其它主機少的存儲,刪除比其它主機多的存儲即可。5. 如果新添加主機與集群中其它主機虛擬交換機配置和存儲配置一致,部署還是失敗,請聯系技術人員處理。問題11 集群啟用HA,虛擬機在線遷移失敗故障描述集群啟用HA,虛擬機在線遷移時,出現錯誤,類似如下。故障處理流程1. 根據任務臺提示和查看后臺HA日志,可以得出出錯原因是由于目標主機中同名虛擬機已經啟動。查看方法:tail -100f /var/l
46、og/ ha_shell_2012*.log(*為當前月份)。2. Virsh list查看目標主機中,啟動的主機中是否有待遷移的同名虛擬機。3. 如果存在同名虛擬機啟動,調用virsh destroy vm-name銷毀該虛擬機,之后再遷移虛擬機就可以了。 故障處理步驟1. 根據任務臺提示和查看后臺HA日志,可以得出出錯原因是由于目標主機中同名虛擬機已經啟動。集群啟用HA,則所有的主機中都會存在一份相同的虛擬機,以便于某臺主機出現故障,虛擬機在其它主機中重啟,但是相同虛擬機只能有一個在運行或暫停,此時因為異常原因導致2臺虛擬機同時運行,所以遷移時出錯。查看方法:tail -100f /var
47、/log/ ha_shell_2012*.log(*為當前月份)。2. Virsh list查看目標主機中,啟動的主機中是否有待遷移的同名虛擬機,結果如下:如果沒有同名主機在運行,請聯系技術人員處理。3. 如果存在同名虛擬機啟動,調用virsh destroy vm-name停止該虛擬機,vm-name為虛擬機名稱,再調用virsh list查看是否已經停止該虛擬機。4. 再次遷移虛擬機就可以了。如果遷移還失敗,請聯系技術人員處理。虛擬機故障處理問題1虛擬機啟動失敗故障處理故障描述· 虛擬機啟動失敗故障處理流程1. 查看虛擬機鏡像文件是否存在如果虛擬機鏡像文件不存在或者大小為,查看日
48、志文件/var/log/libvirt/libvirt.log,顯示如下錯誤:cannot stat file '/vms/images/test_libvirt': No such file or directory。2. 查看虛擬機光驅是否存在如果光驅掛載的是iso文件,到存放iso文件的目錄下查看掛載的iso文件是否存在,如果iso文件不存在查看/var/log/libvirt/libvirt.log,顯示如下錯誤:cannot stat file '/vms/zxk/vmc-1.63.iso': No such file or directory3. 查
49、看與該虛擬機連接的虛擬交換機是否存在。查看服務器上是否存在與該虛擬機連接的虛擬交換機,如果不存在查看/var/log/libvirt/libvirt.log,顯示如下錯誤:Cannot get interface MTU on 'vs1': No such device4. 查看服務器內存是否被分配完。虛擬機所在的物理主機上的物理內存太小,已經啟動的虛擬機的內存總和大于實際物理內存大小,導致虛擬機無法啟動,查看/var/log/libvirt/libvirt.log,顯示如下錯誤:Failed to allocate 2529165312 B: Cannot allocate
50、memory故障處理步驟1. 用qemu-img命令重新創建虛擬機鏡像文件。2. 將系統iso鏡像文件拷貝到相應的目錄下。3. 創建xml文件中定義的虛擬交換機或者改變與虛擬機網卡相連的虛擬交換機。4. 給服務器添加物理內存。問題2啟動時連接光驅失敗故障處理故障描述系統從光驅啟動時不出現系統安裝界面。 故障處理流程1. 檢查光驅是否連接選擇修改虛擬機選項,查看IDE光驅選項,看光驅是否處于連接狀態。2. 如果源路徑是/dev/cdrom,查看服務器上沒有光驅或者光驅中沒有放入安裝盤。3. 如果源路徑是文件,該路徑下不存在鏡像文件。故障處理步驟1. 連接光驅,源路徑選擇/dev/cdrom或者鏡
51、像文件。2. 如果沒有光驅可以選擇鏡像文件方式安裝,如果有光驅,將安裝盤放入光驅,然后從光驅啟動。3. 將安裝鏡像拷貝到相應目錄下。問題3虛擬機遷移失敗故障處理故障描述兩臺主機運行正常,虛擬機從一臺主機遷移到另一臺主機失敗。 故障處理流程1. 虛擬機使用了本地存儲,所以不能在線遷移。2. 虛擬機鏡像文件存儲在共享文件系統,但是目的主機上沒有掛載該共享文件系統,所以遷移失敗。3. 遷移的目的主機上不存在同名虛擬交換機或者存在同名虛擬交換機但是轉發模式不同。故障處理步驟1. 遷移之前先關閉虛擬機,選擇更改數據存儲或同時遷移主機和數據存儲。2. 在目的主機上創建和和源主機相同的共享文件系統,或者將源
52、主機上虛擬機鏡像文件存儲到一個和目的主機相同的共享文件系統中。3. 將源主機上待遷移的虛擬機網卡連接到另外一臺虛擬交換機,該交換機的名稱與轉發模式在與目的主機上存在的虛擬交換機相同。或者在目的主機上創建虛擬交換機,該交換機的名字和轉發模式同源主機上連接待遷移虛擬機的虛擬交換機相同。問題4關閉虛擬機失敗故障處理故障描述點擊關閉按鈕不能關閉虛擬機。故障處理流程1. 檢查要關閉的是否linux虛擬機,如果是linux虛擬機,由于缺少acpid進程,所以關閉按鈕不起作用。故障處理步驟1. 直接點擊關閉電源按鈕關閉虛擬機。虛擬交換機故障處理問題1有網口接入VEPA或多通道類型的虛擬交換機上的虛擬機,啟動
53、成功后,界面上提示”虛擬網卡異常” 故障描述· 主機h3cvms01上創建有多通道類型的虛擬交換機vs1,其上行物理接口為eth1,eth1同鄰接交換機的Ten-GigabitEthernet1/0/11直連,且在交換機(比如s5830v2)的直連接口上已配置使能EVB功能,如下:#interface Ten-GigabitEthernet1/0/11 evb enable evb vdp timer resource-wait-delay exponent 22lldp tlv-enable dot1-tlv evb#交換機上已經配置default manager ID為iMC的地址(例如1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中國的歷史遺跡保護與文化傳承價值研究教案
- 基于CATIA-CAA的CAD-CAE一體化應用研究與開發
- 山中雜記詩詞鑒賞與意境探索教案
- 長春、延邊兩地區人群側貌審美評價及敏感指標的研究
- 具有熱管理功能的微納纖維膜制備及性能研究
- 兩只烏鴉300字13篇
- 一株新根瘤菌的分類鑒定及其結瘤固氮能力研究
- 唐僧給悟空的一封信一封信作文8篇
- 守住陽光的中考作文15篇范文
- 2024年呼和浩特市消防救援支隊招聘政府專職消防員筆試真題
- 多元化考試評價體系
- 《核分析技術》課件
- 國開《人文英語4》機考總題庫
- 空壓機說明書(中文)
- 【基于Python的電商系統設計與實現14000字(論文)】
- 《西方經濟學》(下冊)課程教案
- 錄用體檢操作手冊(試行)
- 2021年四川省內江市隆昌市小升初數學試卷及答案解析
- lenovo臺式機報價單
- 農民工工資表(模板)
- 【新能源汽車新技術及應用研究5200字(論文)】
評論
0/150
提交評論