




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 深信服企業級云高可用性最佳實踐 適用版本 aCloud 5.3文檔版本 v1.0發布日期 2017-08-15 深信服科技 文檔密級:外部HA_Best_Practices_aCloud 5.3 版權聲明本文中出現的任何文字敘述、文檔格式、插圖、照片、方法、過程等內容,除另有特別注明,版權均屬 深信服所有,受到有關產權及版權法保護。任何個人、機構未經深信服的書面授權許可,不得以任何方式復制或引用本文的任何片斷。 i深信服科技版權所有修訂歷史 編號 修訂內容簡述 修訂日期 修訂前版本號 修訂后版本號 修訂人 批準人 1V1.0 定稿 2017/8/15鄧俊峰
2、 注:修訂歷史記錄本文檔提交時的當前有效的基本控制信息,當前版本文檔有效期將在新版本文檔生效時自動結束。文檔版本號小于 1.0 時,表示該版本文檔為草案,僅供參考。 文檔密級:外部HA_Best_Practices_aCloud 5.3目錄第 1 章高可用基礎概念第 2 章部署架構高可用網絡架構2.1服務器配置2.2存儲多路徑2.3第 3 章云平臺高可用云平臺管理高可用3.1分布式虛擬交換機3.2虛擬路由器高可用3.3虛擬安全設備高可用3.4動態資源調度 DRS3.5分布式存儲多副本3.6分布式存儲熱備盤3.7云平臺在線擴容主機3.8云平臺在線擴容磁盤3.9第 4 章虛擬機高可用虛擬機高可用
3、HA主機故障HA4.1.2虛擬機故障 HA虛擬機主機在線遷移4.2ii深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud 5.3虛擬機存儲在線遷移4.3虛擬機跨集群遷移4.4虛擬機資源熱添加4.5動態資源擴容 DRX4.6第 5 章數據高可用虛擬機備份虛擬機備份池創建5.1.2虛擬機手動備份5.1.3虛擬機自動備份策略配置5.1.4虛擬機備份恢復虛擬機快照5.2云平臺配置備份恢復5.3云平臺回收站恢復5.4第 6 章業務高可用Oracle RAC 集群6.1SQL Server AlwaysOn
4、集群6.2AD 服務器負載均衡6.3第 7 章容災高可用火星艙7.1美創7.2企業級云高可用總結第 8 章 iii深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud 5.3第1章 高可用基礎概念高可用通常指的是通過技術手段,盡量縮短因日常維護操作(計劃)和突發的系統(非計劃)所導致的停機時間,以提高系統和應用的可用性。 計劃性停機的原因包含:升級、打補丁、硬件維修、災備演練等; 非計劃性停機的原因包含:人為誤操作、硬件故障、網絡故障、自然災害、軟件故障、病毒等; 深信服科技版權所有風險類別內容
5、自然災害 自然災害、地質災害 機房環境風險 火災、機房結構性損壞、供電系統癱瘓、空調系統故障 社會 傳染性疾病、污染、恐怖、 硬件多點故障 多臺服務器、網絡多點故障、存儲多點故障 硬件單點故障 單臺服務器故障、網絡單點故障、存儲單點故障 軟件故障 應用軟件故障、數據庫軟件故障、操作系統故障 數據庫邏輯故障 數據庫損壞、數據表誤刪除或修改 風險類別內容系統日常維護/ 升級計劃停電/檢修/操作系統升級/數據庫版本升級/應用升級/數據庫維護/硬件微碼升級系統遷移機房搬遷、系統遷移、整合容災演習定期的系統切換或回切文檔密級:外部HA_Best_Practices_aCloud 5.3 深信服企業級云通
6、過持續創新,從物理層、虛擬化層、數據層、業務層、數據中心容災等方面為用戶提供了全方位的高可用性保護,保證了用戶服務持續性和業務連續性。 深信服科技版權所有人為故障 人為失誤或故意破壞 系統性能問題 主機、存儲、網絡、數據庫、應用程序等 文檔密級:外部HA_Best_Practices_aCloud 5.3第2章 部署架構高可用網絡架構2.1 名詞解釋: 存儲單交換機鏈路 用戶組建分布式存儲 aSAN 時使用一臺交換機或者堆疊的兩臺交換機作為存儲交換機,同一臺服務器的兩個存儲網口均接入該交換機,兩條鏈路間實現鏈路負載均衡。 存儲雙交換機鏈路 用戶組建分布式存儲
7、 aSAN 時使用獨立的兩臺交換機作為存儲交換機,同一臺服務器的兩個存儲網口分別接入不同的交換機,兩條鏈路間實現鏈路負載均衡。 深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud 5.3組網說明: 核心層 建議采用具備大容量網絡報文轉發能力的數據中心核心交換機,要求交換機型號支持堆疊或者集群技術,下行端口速率 10GE。 接入層 大規模部署場景下,建議管理、業務、vxlan 網絡平面分別采用支持堆疊技術的兩臺數據中心千兆接入交換機,下行端口速率 GE 接入服務器,上行端口速率 10GE,多條 10GE 鏈路使用鏈路聚合方式接入核
8、心交換機,構建冗余、低收斂比、無阻塞業務交換網絡。存儲網絡則采用兩立的萬兆交換機,做雙交換機鏈路聚保證 aSAN 性能,同時提高整個網絡架構的健壯性。 小規模部署場景下,建議管理、業務、vxlan 網絡平面采用兩臺堆疊的數據中心千兆接入交換機,各個網絡平面劃分不同vlan 做邏輯隔離。存儲網絡同樣采用兩立的萬兆交換機,采用雙交換機鏈路,保障 aSAN 性能,同時提高整個網絡架構的健壯性。 服務器接入 服務器 6*GE/2*10GE 場景(高性能場景,推薦配置) 服務器配置 6*GE、2*10GE 網口時,管理、業務、vxlan 網絡各采用 2*GE 網口,并做網口聚合綁定; 存儲網絡采用 2*
9、10GE 網口,采用雙交換機鏈路,增加網絡冗余性和傳輸帶寬。對于管理、業務、vxlan 網絡平面,服務器網卡聚合支持根據 IP、mac 地址、輪詢三種方式負載均衡模式,建議采用按照 IP 方式進行負載均衡,接入層交換機端口需要配置相應的端口聚合模式,如果接入交換機是思科交換機則配置 mode on 與底層聚合網卡進行對接。對于存儲獨立雙交換機,保持存儲連接的交換機端口配置 access vlan 1 即可。深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud 5.3 服務器 6*GE 場景(小規模低成本場景,推薦配置) 服務器配置
10、 6*GE 網口時,可以采用“接入層”章節描述的大小規模部署方式(存儲改為千兆交換機),也可以僅使用一套堆疊的千兆交換機,管理、業務、vxlan、存儲網絡均復用該交換機。推薦管理、存儲網絡各采用 2*GE 網口,vxlan、業務網絡雙網口復用,采用 2*GE網口, vxlan、業務兩個網口做 IP 方式負載均衡聚合綁定,存儲網絡采用雙交換機鏈路(僅有一套堆疊交換機則使用單交換機鏈路),該方式使用戶業務無單點故障,提升業務的可靠性。另外,由于企業級云平臺無法感知機柜,建議企業級云部署時盡量使用雙機雙柜的部署方式,即堆疊的雙交換機放置于兩個機柜中,單一集群中內服務器建議放置于兩個以上機柜中。服務器
11、配置2.2企業級云平臺分布式存儲模塊 aSAN 具備防腦裂仲裁機制,為了保證平臺穩定性,建議集群內服務器至少 3 臺起步,每臺服務器采用相同的硬件配置,參考配置如下:表格 1深信服科技版權所有硬件 推薦配置 備注 網卡支持巨幀,推薦配置 6*GE,2*10GERAID 卡支持 non-raid、jbod 模式,使用 aSAN,緩存盤和數據盤必須配置成 non-raid 或者 jbod 模式。磁盤深信服一體機系統盤默認最低使用 128G SSD 盤;如果系統盤是 SAS/SATA 盤,使用兩塊盤做 RAID1分布式存儲使用 SSD 作為緩存盤,SATA(也可以
12、是 SAS) 作為數據盤,SSD 和 SATA 的個數比推薦值為 1:3,一般 8 盤位服務器使用 2 塊 SSD 和 6 塊HDD。容量比推薦值為 1:10,文檔密級:外部HA_Best_Practices_aCloud 5.3存儲多路徑2.3企業級云支持 FC 存儲陣列多路徑使用。存儲多路徑提供鏈路冗余,提升存儲的可靠性;實現鏈路的負載均衡,增加存儲鏈路帶寬,提升整個云平臺的性能。n 企業級云推薦配置:每臺云服務器配置兩個 HBA 卡,每個 HBA 卡配置一個存儲光模塊,提供 1*8GE 鏈路;接受 HBA 卡存在單點故障風險前提下時可以考慮使用一個 HBA 卡,每個 HBA 卡配置兩個存
13、儲光模塊,提供 2*8G 鏈路;FC 存儲陣列配置 AB 控,每個控制器提供 2*8GE 鏈路;兩臺存儲 FC 交換機;接受 FC 交換機存在單點故障風險前提下時可以使用 1 臺存儲 FC交換機n 企業推薦存儲組網如下:深信服科技版權所有一般不要低于 1:20,SSD 容量比越高,整體性能越好。文檔密級:外部HA_Best_Practices_aCloud 5.3n 組網配置說明 兩個 fc 交換機設置不同的 domain id FC 存儲交換機獨立部署,服務器的 hba0 和hba1 分別接入兩臺 FC 交換機 按照最小 zone 配置原則進行 zone
14、劃分,即一個服務hba 卡與一個控制器 hba 卡劃分到同一個 zone 內。zone 劃分可按照 wwpn 劃分,也可以按照端口進行劃分,推薦使用 wwpn 配置。n 配置示例 以domain1 交換機進行端 wwpn zone 劃分示例定義別名alias s1_hba0 wwpn_s1s2_hba0 wwpn_s2;zone1(s1_hba0,wwpn_B0),zone2(s1_hba0,wwpn_A0),深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud 5.3zone3(s2_hba0,wwpn_B0),zone4(s2
15、_hba0,wwpn_A0), 以 domain1 交換機進行端口 zone 劃分示例zone1(s1_hba0,(1,3),zone2(s1_hba0,(1,4),zone3(s2_hba0,(1,3),zone4(s2_hba0,(1,4),深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud 5.3第3章 云平臺高可用云平臺管理高可用3.1企業級云從集群主機中自動選擇一臺主機成為“主控”,作為平臺管理主機并配置集群 IP,用戶使用集群 IP 管理集群。當該主機故障時,主控可以切換到其他主機上運行。 在主控所在主機出現故障時,
16、系統會提示主控離線,用戶在確認主控所在主機無法恢復的前提下,可以在管理平臺“實體機”中選擇一臺正常運行的物理主機,在“更多”中設置當前物理主機為主控。 分布式虛擬交換機3.2分布式虛擬交換機實現了虛擬交換機跨主機分布部署,用于不同主機間東西向流量通信。不同主機上運行同一分布式虛擬機交換機不同實例,交換機不同示例網絡配置相同,從而實現虛擬機跨主機遷移時網絡保持一致。在集群中分布在多臺主機的單一交換機邏輯上組成一個大的集中式交換機,使虛擬環境中的網絡配置不再以主機為單位,簡化虛擬機網絡連接的部署、管理和監控,適合于大規模的網絡部署。 分布式虛擬交換機對外提供“廣播風暴抑制”的高級配置功能,可以限制
17、廣播報文轉發數深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud 5.3量,超過報文轉發限制數量后系統斷開網口以阻斷風暴,但是廣播抑制在正常情況下開啟容易導致正常報文被丟棄,建議正常使用時不開啟該功能“”,該選項系統默認不開啟,日常使用無須關注;當云平臺內部出現廣播風暴時,通過觀察各交換機鏈路流量,開啟流量過大的交換機廣播抑制功能,限制報文轉發數量。 虛擬路由器高可用3.3虛擬路由器創建完成后默認不啟用 HA,當虛擬路由器運行的主機故障時也會在其他主機重新創建一個新的路由器,這種方式故障恢復時間較長。 建議在虛擬路由器高級配置中
18、啟用“高可用 HA”。啟用高可用特性后,系統會在兩個主機上創建路由器,并實時同步會話信息,運行于主備模式。當路由器運行的主機出現故障時,可以實現秒級故障切換,但啟用高可用特性后由于同步會話信息會占用少量帶寬。 深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud 5.3 虛擬安全設備高可用3.4虛擬機安全設備如 vAC、vAD、vAF、vSSL VPN 等創建完成后系統默認勾選“運行異常時重啟” ,當設備出現無響應、卡死時自動重啟設備;同時開啟“高可用HA” ,當設備所在主機出現故障時,自動切換到其它物理主機上運行。 建議不要停用
19、虛擬網絡設備“運行異常時重啟”和“故障遷移 HA”選項。 深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud 5.3動態資源調度 DRS3.5集群內發生用戶通過自選主機創建虛擬資源、在線遷移、故障 HA 等情況時可能造成集群內各主機 CPU、內存資源利用率不平衡。負載過輕的主機資源利用率低,造成浪費;負載過重的主機容易出現資源超配,會降低虛擬機的性能和穩定性,從而影響業務的正常運行 DRS(Dynamic Resource Scheduler,動態資源調度)能夠持續監控當前集群中各主機節點的 CPU、內存的使用情況和虛擬機的主機
20、分布情況,并自動生成虛擬機在線主機遷移調整計劃,動態調整虛擬機的運行位置,使集群的計算資源達到均衡使用的效果。 DRS 技術采用的是“虛擬機主機在線遷移”的方式,只調整虛擬機的主機運行位置,不會改變存儲運行位置,遷移過程不會對虛擬機上的業務造成影響。 DRS 只對同時滿足以下條件的虛擬機有效: 創建虛擬機主機運行位置配置為“自動選擇” 虛擬機已安裝性能優化工具; 虛擬機運行存儲位置在共享存儲或者分布式存儲 aSAN 上。 DRS 支持手動和自動兩種調度方式: 手動。系統根據資源負載的規則,給出調度建議,管理員可以手動執行調度建議。用戶可以在業務空閑時間手動 DRS,減少對運行業務的影響,因此手
21、動調度為目前云平臺 DRS 推薦方式。 自動。系統根據資源負載的規則,自動進行調度,節省管理員運維工作量。 DRS 策略使用最佳實踐 DRS 全局調度策略配置 深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud 5.3 DRS 特定虛擬機額外調度策略配置 通過“新增”添加虛擬機,自定義特定虛擬機調度方式為“自動”或者“禁用”。數據庫等集群方式部署的業務虛擬機建議禁用 DRS。 手動執行 DRS 調度計劃 深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud 5.3當
22、首頁出現集群負載失衡圖標“”時,點擊該圖標進入集群調度頁面,根據生成調度建議,按照同時在線遷移單個虛擬機的方式調度虛擬機。調度完成后首頁顯示為集群負載恢復平衡狀態圖標“”。 分布式存儲多副本3.6存儲副本,是將數據保存多份的一種冗余技術,對用戶呈現一個訪問入口,用戶不需要關心副本間數據同步的問題,由副本復制模塊來負責副本的同步。 配置副本是可以有效降低磁盤故障而導致數據丟失的風險,冗余副本數越多,當磁盤故障后越容易從其他磁盤中的副本中快速恢復數據,但副本數越多,磁盤空間利用率越低。 當前深信服分布式存儲 aSAN 支持雙副本和三副本技術,基于容量、成本考慮,推薦創建分布式存儲 aSAN 時采用
23、存儲雙副本,實際存儲可用容量為所有服務器數據盤可用存儲容量的一半,在損壞一臺主機情況下不影響用戶業務。 分布式存儲熱備盤3.7熱備盤是被指定用于替代分布式存儲 aSAN 中損壞數據盤的硬盤,用于承載損壞硬盤中的數據,當硬盤損壞時,熱備盤會自動替換原有的損壞的硬盤。在分布式存儲 aSAN 自動使用熱備盤替換故障磁盤后,頁面上依然會提示原來的故障磁盤損壞,此時用戶可以通過更換磁盤,將新替換的硬盤會作為熱備盤使用。 深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud 5.3為保證存儲系統的可靠性,建議在創建分布式存儲時創建熱備盤。熱備
24、盤的類型、容量建議與分布式存儲數據盤的類型、容量保持一致。 推薦 aSAN 在初始化階段配置不小于集群副本數個磁盤作為集群全局熱備盤。例如客戶采用三臺主機組成企業級云集群,分布式存儲 aSAN 采用雙副本技術,則平臺至少需要配置兩塊熱備盤,并分布在不同的主機上。 云平臺在線擴容主機3.8企業級云平臺支持在線擴容集群主機,有效解決用戶集群資源使用量激增而導致集群總體資源不足的問題。擴容后的主機不僅可以增加整個集群的計算資源,分擔其它主機上的業務負載,同時主機上的磁盤也可以在線擴容到 aSAN 分布式存儲中,擴展存儲資源池的容量,同時不影響客戶業務虛擬機運行,解決用戶資源需求的同時保證了客戶業務的
25、連續性。 云平臺在線擴容注意事項: 待擴容主機需加入集群物理網絡中 推薦在線擴容的主機與集群內其他主機的硬件配置保持一致; 推薦一次性擴容不小于副本數的主機。 主機擴容后建議參考動態資源調度 DRS 章節對集群進行負載平衡 在線擴容主機 在實體機頁面,選擇“添加主機”,進入“添加物理主機”向導。 深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud 5.3 云平臺在線擴容磁盤3.9企業級云平臺支持以主機添加磁盤的方式,縱向地擴展分布式存儲容量,解決用戶集群存儲容量不足的問題。深信服分布式存儲 aSAN 支持磁盤熱插拔,可以在線狀態
26、增加磁盤資源而不影響用戶業務虛擬機運行,保證了用戶業務連續性。 深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud 5.3在線擴容磁盤前提條件: 集群服務器需有額外的磁盤槽位 集群服務器 Raid 卡支持并預先配置成 jbod 或者 non-raid 模式 推薦用戶在aSAN 增加磁盤擴容時,擴容磁盤數整數倍副本數并均勻分布在不同的主機上。 在線擴容磁盤 深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud 5.3 深信服科技版權所有.
27、cn文檔密級:外部HA_Best_Practices_aCloud 5.3第4章 虛擬機高可用虛擬機高可用 HA 主機故障 HAHA(High Available,高可用性集群)通常需要兩個或者兩個以上的主機組成集群,當虛擬機所在主機發生意外(主機故障、網口掉線等)時,將選擇集群中另外正常運行的主機重啟該虛擬機,極大的降低了業務中斷時間。 主機故障 HA 目標主機選擇規則: 1、 首先選擇集群內有相同的網絡的其他正常主機 2、 如果有分布式存儲,優先選擇有副本的正常運行的主機 3、 主機計算資源 主機故障 HA 生效前提條件: 創建虛擬機時啟用“主機故障 HA” 深信服科技版權
28、所有文檔密級:外部HA_Best_Practices_aCloud 5.3 為了最大限度保障用戶業務連續性,在云平臺管理中建議勾選“虛擬機直連的物理出口”對應的 HA(對應到截圖 5 和 6 場景),啟用業務口斷鏈 HA 機制;敏感度支持“高”、“中高”、“中”“中低”、“低”,分別對應故障持續時間 30 秒、1 分鐘、2 分鐘、5 分鐘、10 分鐘,用戶可以根據業務時間需求選擇,需注意此選項是集群全局設置,無法針對特定主機或虛擬機進行設置。 深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud
29、 5.3 對應的 HA 關系如下: 深信服科技版權所有類別對應上圖HA場景編號虛擬機 HA 具體情況描述虛擬機運行在共享存儲上1、2、3、4 某臺主機存儲網絡中斷運行在該主機上的虛擬機觸發故障 HA,在另外一臺正常主機上重啟5 某臺主機僅業務出口網絡中斷運行在該主機上、連接到該業務出口的虛擬機觸發故障 HA,在另外一臺正常主機上重啟。6 某臺主機管理網絡和業務出口同時中斷運行在該主機上的虛擬機觸發故障 HA,在另外一臺正常主機上重啟7 僅管理網絡中斷平臺不處理虛擬機運行在aSAN 上1、2 某臺主機aSAN 存儲私網中斷、管理網絡不中斷運行在該主機上的虛擬機
30、在本地有副本,虛擬機仍可正常訪問aSAN 存儲,不觸發故障 HA。運行在該主機上的虛擬機在本地無副本,虛擬機無法訪問aSAN 存儲,該虛擬機觸發故障 HA,在另外一臺正常主機上重啟。(優先選擇有該虛擬機副本的主機)3、4 管理網絡、aSAN 存儲私網同時中斷運行在該主機上的虛擬機在本地有副本,虛擬機仍可正常訪問aSAN 存儲,但該主機管理網離線,集群其他主機仍可通過HA 機制拉起虛擬機,此時該虛擬機有兩個實例存在,由于仲裁機制保證數據一致性,存儲私網恢復后aSAN 會殺掉舊的虛擬機,并修復合法虛擬機副本。運行在該主機上的虛擬機在本地無副本,無法正常訪問aSAN 存儲,該虛擬機觸發故障 HA,在
31、集群其他正常主機上重啟。5、6、7與虛擬機運行在共享存儲上處理方式相同文檔密級:外部HA_Best_Practices_aCloud 5.3 4.1.2 虛擬機故障 HA虛擬機操作系統出現藍屏、黑屏、卡死是常見的業務中斷問題,若是集群沒有偵測應用層心跳并實現主動 HA 的機制,則需要管理員主動重啟業務虛擬機,不僅業務中斷的時間不可控,還增加了管理員的運維工作量。 通過在虛擬機中安裝深信服的性能優化工具,該工具持續向虛擬機運行所在主機發送心跳,主機根據虛擬機反饋的心跳、磁盤 IO、網絡流量狀態,判斷虛擬機的 Guest 操作系統是否藍屏、黑屏、卡死等。如果虛擬機操作系統持續 90 秒不反饋心跳,
32、磁盤 IO 為 0,網絡流量為 0,系統判斷該虛擬機發生了藍屏、黑屏等故障,將虛擬機關機并在原物理主機重啟。 虛擬機故障 HA 生效前提條件: 虛擬機已安裝性能優化工具 創建虛擬機時啟用“虛擬機異常重啟” 推薦在創建虛擬機時啟用“虛擬機異常重啟” ,保證系統運行穩定性。另外需要說明的是,虛擬機故障 HA 僅會重啟操作系統,并不會開機啟動應用,用戶需要手動將應用系統加入到 Linux、Windows 的自啟動服務中達到無需人工干預,應用自動故障恢復的目的。此功能只能判斷操作系統級別故障,無法偵測到應用級別故障。應用級別故障 HA 需要使用應用監控或應用集群或使用深信服應用交付 AD 來解決應用高
33、可用。 深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud 5.3 虛擬機主機在線遷移4.2虛擬機主機在線遷移使用戶業務無感知情況下,達到虛擬機開機更換主機運行位置的目的。該技術適用于主機硬件維護、更換主機、平衡主機負載等運維場景,用戶可以提前進行虛擬機主機在線遷移,虛擬機無須關機,增強了用戶業務連續性。建議在業務非高峰期間進行虛擬機主機在線遷移操作。 虛擬機主機在線遷移注意事項: 虛擬機待遷移目標主機需配置相同的網絡; 業務物理出口連接所有的主機。 深信服科技版權所有文檔密級:外部HA_Be
34、st_Practices_aCloud 5.3 虛擬機存儲在線遷移4.3虛擬機存儲在線遷移技術使用戶業務無感知情況下,達到虛擬機開機更換主機存儲運行位置的目的。該技術適用于當前存儲池資源不足并增加新的存儲池進行存儲容量擴容的場景,用戶可以使用該技術將虛擬機從高負載的存儲池遷移到低負載的存儲池,虛擬機無須關機,增強了用戶業務連續性。由于存儲在線遷移會產生大量的 IO 操作,為了避免影響業務,建議在業務非高峰期間進行虛擬機存儲在線遷移操作,存儲在線遷移操作的時間取決于網絡環境和虛擬機配置存儲空間的大小。 虛擬機存儲在線遷移前提條件: 虛擬機運行在共享存儲或者分布式存儲上。 深信服科技版權所有www
35、.文檔密級:外部HA_Best_Practices_aCloud 5.3 虛擬機跨集群遷移4.4虛擬機跨集群遷移技術可以支持用戶將虛擬機在線遷移至另外一個企業級云集群。該技術適用于客戶由單一集群擴展到多個集群、業務由單一安全分區擴展多個安全分區的場景,遷移過程務不中斷,最大限度保證了客戶的業務連續性。跨集群遷移會遷移虛擬機運行位置和虛擬機存儲文件,由于存儲在線遷移會產生大量的 IO 操作,為了避免影響業務,建議在業務非高峰期間進行虛擬機存儲在線遷移操作,存儲在線遷移操作的時間取決于網絡環境和虛擬機配置存儲空間的大小。 虛擬機跨集群遷移注意事項: 當前企業級云版本僅支
36、持同版本集群之間的虛擬機遷移; 遷移時目的集群需要配置相同網絡,保證遷移后虛擬機業務網絡可用性。 深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud 5.3 虛擬機資源熱添加4.5用戶在業務虛擬機的負載爆發增長而超出現有配置時,企業級云平臺支持虛擬機在線添加CPU、內存、磁盤、網卡資源,快速提升虛擬機計算、IO 性能,相比需要關機修改虛擬機配置的傳統方案更加靈活,保證用戶業務可用性和業務連續性。 磁盤、網卡熱添加支持所有的操作系統;CPU、內存熱添加只支持特定操作系統的資源熱添加,該限制是由于部分操作系統運行時不能識別在線添加的
37、 CPU、內存資源所致。 磁盤、網卡熱添加特性在虛擬機安裝性能優化工具后即可生效;CPU、內存熱添加除了安裝性能優化工具,還需要在虛擬機高級配置中勾選“啟用 CPU 熱添加”、“啟用內存熱添加”之后才能生效,如果操作系統在兼容性列表內,并且預計虛擬機在不久會有計算資源擴容的需求,建議虛擬機安裝操作系統后關機勾選 CPU/內存熱添加選項。 深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud 5.3 動態資源擴容 DRX4.6DRX(Dynamic Resource eXtension,動態資源擴展)是在虛擬機 CPU、內存熱添加技
38、術的基礎上,增加了自動化策略,適用于業務虛擬機資源使用可能出現無法提前預測的爆炸性增長而用戶又無法及時監控虛擬機資源使用率,無法快速調整虛擬機資源的場景。DRX 功能提供的自動化策略,大幅度減少了用戶運維的工作量,快速響應業務狀態增長變化對虛擬機 CPU、內存資源進行動態擴展,既保證了業務的連續性和性能,又解決用戶業務增長帶來的敏捷運維問題。 動態資源擴容 DRX 生效前提條件: 虛擬機已安裝性能優化工具 虛擬機高級選項已配置“啟用 CPU 熱添加”、“啟用內存熱添加” 深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud 5.3
39、DRX 衡量因素包括“CPU”和“內存”兩種,并可以設置閾值,用戶可根據實際業務需求配置閾值大小。 CPU:當虛擬機的“CPU 利用率”大于閾值時,為虛擬機添加 CPU,每次增加原配置一個插槽的核數,上限是虛擬機原配置的兩倍。限制是不超過當前運行主機的 CPU 核心數。 內存:當虛擬機的“內存利用率”大于閾值時,為虛擬機添加內存,每次增加原配置大小的八分之一(自動取整),上限是虛擬機原配置的兩倍。限制是不超過當前運行主機的內存。 敏感度:有“保守”、“激進”兩種,動態資源添加響應分別對應 10 分鐘、3 分鐘,用戶可根據實際需求配置兩種策略。 保守:在該模式下,系統檢測到衡量因素達到閾值并持續
40、 10 分鐘,將對虛擬機進行動態資源添加。 激進:在該模式下,系統檢測到衡量因素達到閾值并持續 3 分鐘,將對虛擬機進行動態資源添加。 深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud 5.3第5章 數據高可用虛擬機備份5.1企業級云平臺自帶虛擬機備份功能,降低用戶操作失誤、系統故障等 IT 事故以及發生時造成的用戶數據損失,提升用戶數據高可用性,保證了用戶業務連續性。 虛擬機備份方式支持虛擬機全量備份和增量備份(平臺內部備份機制,頁面不可設置),兩種備份方式都僅備份虛擬機實際使用的磁盤數據量。用戶首次虛擬機備份為虛擬機全量備
41、份,備份保留周期內其他備份為增量備份,保留時間超過備份保留周期(即備份保留時間)的增量備份會與虛擬機全量備份合并為新的全量備份。如果用戶備份更換備份位置,系統會重新為虛擬機做一次全量備份。 虛擬機備份策略支持用戶手動備份和系統自動備份。手動備份適用于重要業務虛擬機較少、業務虛擬機需要立即備份的場景,系統自動備份適用于用戶規模運維的場景。 虛擬機備份支持自定義備份位置(備份池),目前企業級云平臺支持的備份池包含 NAS(僅支持 NFS 協議)、共享陣列存儲、分布式存儲、windows 服務器共享目錄,一個企業級云集群可以支持多個備份池。備份建議備份在第三方平臺上,基于成本考慮 windows 服
42、務器共享目錄優先,基于管理考慮NAS 存儲優先;次選分布式存儲作為備份池,用戶需要單獨劃分一部分空間作為備份。 虛擬機備份池的容量建議未來計劃備份的虛擬機實際使用的存儲(共享存儲和分布式存儲)總容量的 150%。 深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud 虛擬機備份池創建 創建 Windows 共享服務目錄備份池。 創建目錄并共享 創建 windows 共享目錄備份池 指定備份空間大小 深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud
43、 5.3 創建分布式存儲備份池 創建分布式存儲備份池 5.1.2 虛擬機手動備份用戶手動備份可以從虛擬機列表快捷方式或者進入虛擬機詳情進行備份 深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud 5.3 自定義備份名稱和存儲位置 深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud 5.3 5.1.3 虛擬機自動備份策略配置 默認備份策略 當用戶所有業務虛擬機都需要備份的時候,建議使用默認備份策略。默認備份策略會將所有虛擬機自動備份,不需要人工干預,對用戶而言,該策
44、略優點在于操作簡單,維護方便。 默認策略備份位置建議選擇第三方存儲位置。如果只有一個備份位置,手動指定和自動指定位置無區別;如果有多個備份池,建議選擇“自動指定位置”。 備份頻率支持按周、按天、按小時備份,備份時間建議配置為業務空閑時間。系統默認設置為按天備份,一般業務空閑時間區間為晚上 23 點到第二天早上 8 點。備份保留時間建議 2 周以上,也可以根據用戶實際要求調整,超過備份保留周期的虛擬機增量備份會與虛擬機全量備份進行合并。建議勾選“自動清理備份點,節省備份空間”,可以節省備深信服科技版權所有文檔密級:外部HA_Best_Practices_aCl
45、oud 5.3份空間。 自定義備份策略 當用戶僅需要針對重要虛擬機備份時,建議使用自定義備份策略,并禁用默認備份策略。自定義備份策略與默認備份策略不同的地方在于用戶需要選擇部分虛擬機備份,新建虛擬機不會自動加入備份,如果后期再備份其他虛擬機需要手動將其加入該策略當中。建議用戶根據虛擬機 SLA 等級選擇制定不同的備份策略。 深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud 5.3 5.1.4 虛擬機備份恢復 本地集群恢復 當虛擬機需要恢復時,如果用戶本地企業級云平臺可用,只需要到選擇相應的備份文件進行恢復即可 深信服科技版權所
46、有文檔密級:外部HA_Best_Practices_aCloud 5.3 異地集群恢復 將備份 NAS 或者 windows 共享目錄掛載到新的集群上,平臺自動識別出共享目錄內已有備份文件進行恢復。 虛擬機快照5.2虛擬機快照類似于系統還原點,一個虛擬機可以存在多個快照。虛擬機快照通常應用于系統補丁、軟件更新后導致系統或者服務異常等場景,用戶可以通過快照來快速恢復系統,是一種方便使用的應急和系統回退操作手段,減少由于系統錯誤或人為錯誤引起的停機時間。虛擬機快照注意事項: 虛擬機開機創建快照會導致業務中斷 1s 左右 快照恢復時虛擬機需要重啟;另外,系統會自動
47、創建一個當前系統點的快照,防止系統還原后無法恢復到當前狀態 建議僅針對需要還原的系統做快照,勿將快照作為備份使用。 快照創建 深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud 5.3 快照恢復 云平臺配置備份恢復5.3企業級云平臺支持對系統配置包括企業級云集群配置 、虛擬機備份策略、 高可用(HA)配置、動態熱添加配置 、用戶體驗計劃 、時間同步設置 、告警條件、集群資源調度配置、恢復 NUMA 配置等進行備份恢復。該特性解決了用戶配置恢復的問題,增強了云平臺的數據恢復能力。 深信服科技版權所有.
48、cn文檔密級:外部HA_Best_Practices_aCloud 5.3當前系統配置備份支持系統自動備份、用戶手動備份至本地兩種備份方式,恢復則支持從系統自動備份以及本地備份兩種方式恢復。 系統每天凌晨 12 點會自動備份,系統默認會保留一個月的配置備份。建議用戶每個月進行手動備份一次,防止無法恢復幾個月前的系統配置。 云平臺回收站恢復5.4企業級云平臺提供了類似 Windows 回收站功能,系統會將用戶刪除的網絡設備、虛擬機、虛擬共享盤、備份文件自動放入回收站內保存 30 天,用戶可以在回收站內恢復刪除的文件,也可以徹底刪除釋放回收站空間。該特性有效解決了用戶誤刪除導致業務中斷或者數據丟失
49、的問題,提升了用戶業務可用性。 回收站恢復注意事項: 回收站恢復后的網絡設備和虛擬機不會恢復網絡連接關系,需要手動添加。 深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud 5.3 深信服科技版權所有文檔密級:外部HA_Best_Practices_aCloud 5.3第6章 業務高可用Oracle RAC 集群6.1Oracle RAC 數據庫作為數據中心的核心業務系統,在企業、政府、教育、醫療等行業被廣泛應用。深信服企業級云平臺在 I/O、網絡、共享盤等領域做出重大創新,解決了虛擬化環境中
50、運行 Oracle 數據庫系統原本存在的性能問題。 企業級云平臺上的 Oracle RAC 支持向導式部署,數據庫除了自帶的多節點負載均衡和故障容錯切換的能力外,還具備 rac 節點主機互斥、節點故障 HA 等高可用特性,進一步增強了Oracle 數據庫的高可用性。 SQL Server AlwaysOn 集群6.2SQL Server AlwaysOn 集群作為微軟新一代數據庫全面的高可用性和恢復解決方案,在商業數據庫領域大量應用。深信服企業級云平臺優化了 SQL Server AlwaysOn 集群部署和性能,支持向導式部署 SQL Server AlwaysOn 集群,提供集群自帶數據庫級和實例級高可用性,支持多節點負載均衡和故障轉移特性,同時具有故障 HA 等虛擬化平臺特性,提高了 SQL Server AlwaysOn 集群的高可用性。 AD 服務器負載均衡6.3企業級云平臺提供深信服國內領先的虛擬應用交付組件 vAD,vAD 提供了服務器負載、鏈路負載等功能,支持輪詢、加權等多種負載均衡模式以及基于 cookie 等會話保持技術,支持多業務節點故障容錯能力,并為分布式業務系統提供流量負載均衡功能,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 供水施救安裝管理制度
- 供熱收費大廳管理制度
- 供電企業預算管理制度
- 供電安全施工管理制度
- 保健食品安全管理制度
- 保安上班制度管理制度
- 保安公司內部管理制度
- 保安公司環保管理制度
- 保安公司門崗管理制度
- 保安宿舍規范管理制度
- DB43T 1173-2016 鋼-超高韌性混凝土輕型組合結構橋面技術規范
- 三維網客土噴播植草護坡方案
- 白酒經銷商與酒店合作協議書模板
- 天棚簾施工方案
- 《積極心理學(第3版)》 課件 第4章 樂觀
- 戶外廣告牌施工方案
- 國家開放大學本科《商務英語4》一平臺機考真題及答案(第三套)
- 傳統文化與生態文明建設智慧樹知到期末考試答案章節答案2024年云南大學
- YYT 0698.5-2009 最終滅菌醫療器械包裝材料 第5部分:透氣材料與塑料膜組成的可密封組合袋和卷材 要求和試驗方法
- 廣東省佛山市南海區2021-2022學年八年級下學期期末數學試題
- 糖尿病家庭醫生:簽約講座計劃
評論
0/150
提交評論