




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、數(shù)據(jù)中心解決方案之災(zāi)備方案設(shè)計1.數(shù)據(jù)中心容災(zāi)備份解決方案 隨著社會的發(fā)展和科技的進(jìn)步,政府日常工作越來越依賴于數(shù)據(jù)處理來進(jìn)行, 政務(wù)系統(tǒng)的連續(xù)性依賴于數(shù)據(jù)中心系統(tǒng)的穩(wěn)定運行。然而,災(zāi)難就像灰塵一樣 伏擊在運營環(huán)境周圍,政務(wù)系統(tǒng)的數(shù)據(jù)中心可能正在一個充滿風(fēng)險和威脅的環(huán) 境下運行。如果不能對這些風(fēng)險采取有效治理,一旦數(shù)據(jù)由于某種原因丟失, 就很有可能對政府的日常工作造成嚴(yán)重的影響。如果核心數(shù)據(jù)丟失,將會使得 某些核心功能陷入癱瘓,造成不可估量的損失。因此,保證政務(wù)的連續(xù)性和數(shù) 據(jù)的高可靠性和可用性,已經(jīng)成為政府部門在數(shù)據(jù)中心建設(shè)中,必須要考慮的 問題。1.1 災(zāi)備解決方案原則首先,在制定容災(zāi)系統(tǒng)
2、方案的過程中要考慮的就是容災(zāi)系統(tǒng)建設(shè)對原有業(yè)務(wù)系 統(tǒng)帶來的影響。比如,采用數(shù)據(jù)復(fù)制技術(shù)對系統(tǒng) I/O 帶來的延遲,應(yīng)用數(shù)據(jù)同 步對日常業(yè)務(wù)處理系統(tǒng)帶來的壓力等。因此,企業(yè)要通過周密的測試和分析來 規(guī)避容災(zāi)系統(tǒng)建設(shè)時帶來的這些風(fēng)險,以保證業(yè)務(wù)系統(tǒng)不會因容災(zāi)系統(tǒng)的建設(shè) 而出現(xiàn)在處理性能上下降的問題。第二,數(shù)據(jù)狀態(tài)要保持同步。為保證在災(zāi)難發(fā)生時,業(yè)務(wù)可以成功地切換到備 份中心,就必須保證容災(zāi)系統(tǒng)數(shù)據(jù)同步機制的可靠性。因此,建立可靠的數(shù)據(jù) 同步校驗機制是必須的 ; 同時,還要考慮建立定時的、自動的數(shù)據(jù)同步核查對 比機制,以檢驗兩個中心數(shù)據(jù)的一致性,這是數(shù)據(jù)容災(zāi)工作中非常重要的一部 分。第三,容災(zāi)系統(tǒng)的
3、日常維護工作要盡可能輕,并能承擔(dān)部分業(yè)務(wù)處理和測試的 工作。容災(zāi)系統(tǒng)的維護和管理是容災(zāi)切換成功的重要保證,在系統(tǒng)建設(shè)中,就 必須要考慮系統(tǒng)的維護管理流程。生產(chǎn)中心任何業(yè)務(wù)處理過程的改變都必須完 整地復(fù)制到備份中心 ; 所有新業(yè)務(wù)系統(tǒng)上線時,必須通知備份中心,并在備份 中心配置好數(shù)據(jù)同步機制 ; 對原程序的改動也必須保證兩個中心同時上線。第四,系統(tǒng)恢復(fù)時間要盡可能短。容災(zāi)系統(tǒng)主要是為了實現(xiàn)在主中心系統(tǒng)發(fā)生 災(zāi)難時,可以在規(guī)定時間切換到備份中心,保證數(shù)據(jù)不會丟失,并且繼續(xù)向用 戶提供服務(wù)。但往往在災(zāi)難發(fā)生時,主要技術(shù)人員不能及時到達(dá)現(xiàn)場,為了順 利實現(xiàn)系統(tǒng)間的切換,應(yīng)該讓系統(tǒng)切換操作盡可能地簡單
4、; 并建立固定化的、 標(biāo)準(zhǔn)化的切換流程,要求維護人員在切換演習(xí)時嚴(yán)格按照流程的指導(dǎo)步驟進(jìn)行 操作。第五,可實現(xiàn)部分業(yè)務(wù)子系統(tǒng)的切換和回切。當(dāng)人事變動、業(yè)務(wù)變化、 IT 設(shè)施 變化以及其他可能引起恢復(fù)規(guī)劃文檔失效的變化發(fā)生時,應(yīng)及時更新各恢復(fù)規(guī) 劃文檔,并在必要時啟動模擬測試或演習(xí),確保業(yè)務(wù)連續(xù)性系統(tǒng)的工作能力。第六,技術(shù)方案選擇要遵循成熟穩(wěn)定、高可靠性、可擴展性、透明性的原則。 目前,國際上比較成熟的容災(zāi)技術(shù)包括: SAN/NAS 技術(shù)、遠(yuǎn)程鏡像技術(shù)、虛 擬存儲、基于 IP 的 SAN 互連技術(shù)以及快照技術(shù)等。其中基于 IP 的 SAN 遠(yuǎn)程 數(shù)據(jù)容災(zāi)備份技術(shù)應(yīng)用比較廣泛,其是利用基于 IP
5、的 SAN 的互連協(xié)議,將主 數(shù)據(jù)中心 SAN 中的信息通過現(xiàn)有的 TCP/IP 網(wǎng)絡(luò),遠(yuǎn)程復(fù)制到備份中心的 SAN 中的。當(dāng)備份中心存儲的數(shù)據(jù)量過大時,可利用快照技術(shù)將其備份到磁帶 庫或光盤庫。這種基于 IP 的 SAN 遠(yuǎn)程容災(zāi)備份,可以跨越 LAN 、MAN 和 WAN ,成本低、可擴展性好。基于 IP 的互連協(xié)議主要包括 FCIP、 iFCP、 InfiniBand 、iSCSI 等。第七,構(gòu)建系統(tǒng)方案可以選擇多種技術(shù)組合方式。目前,業(yè)內(nèi)應(yīng)用較多的容災(zāi) 方案是基于智能存儲系統(tǒng)的遠(yuǎn)程數(shù)據(jù)復(fù)制技術(shù),它是由智能存儲系統(tǒng)自身實現(xiàn) 的數(shù)據(jù)遠(yuǎn)程復(fù)制和同步,即智能存儲系統(tǒng)將對該系統(tǒng)中的存儲器 I/O
6、 操作請求 復(fù)制到遠(yuǎn)端的存儲系統(tǒng)中并執(zhí)行。由于在這種方式下,數(shù)據(jù)復(fù)制軟件運行在存 儲系統(tǒng)內(nèi),因此較容易實現(xiàn)主中心和容災(zāi)備份中心的操作系統(tǒng)、數(shù)據(jù)庫、系統(tǒng) 庫和目錄的實時拷貝及維護能力,且不會影響主中心主機系統(tǒng)的性能。如果在 系統(tǒng)恢復(fù)場具備了實時數(shù)據(jù),那么就可以做到在災(zāi)難發(fā)生時,及時開始應(yīng)用處 理過程的恢復(fù)。但這種方案也有開放性差 ( 不同廠家的存儲設(shè)備系統(tǒng)一般不能配 合使用 )、對于主、備中心之間的網(wǎng)絡(luò)條件 (穩(wěn)定性、帶寬、鏈路空間距離 )要求 較苛刻等缺點。1.2 災(zāi)備解決方案設(shè)計需要考慮的因素1.2.1 RTO 和 RPORTO(RecoveryTime Object ):是指災(zāi)難發(fā)生后,從
7、 IT 系統(tǒng)宕機導(dǎo)致業(yè)務(wù)停 頓之刻開始,到 IT 系統(tǒng)恢復(fù)至可以支持各部門運作,業(yè)務(wù)恢復(fù)運營之時,此兩 點之間的時間段成為RTO。RTO是反映業(yè)務(wù)恢復(fù)及時性的指標(biāo),表示業(yè)務(wù)從中 斷到回復(fù)正常所需要的時間。 RTO 值越小,代表容災(zāi)系統(tǒng)的數(shù)據(jù)恢復(fù)能力越強。各種容災(zāi)解決方案的 RTO 有較大差別,基于光通道技術(shù)的同步數(shù)據(jù)復(fù)制, 配合異地備用的業(yè)務(wù)系統(tǒng)和跨業(yè)務(wù)中心與備份中心的高可用管理,這種容災(zāi)解 決方案具有最小的 RTO 。RPO(Recovery Point Objective ),是指從系統(tǒng)和應(yīng)用數(shù)據(jù)而言,要實現(xiàn)能 夠恢復(fù)至可以支持各部門業(yè)務(wù)運作,系統(tǒng)及生產(chǎn)數(shù)據(jù)應(yīng)恢復(fù)到怎樣的更新程 度。 RP
8、O 是反映恢復(fù)數(shù)據(jù)完整性的指標(biāo),在同步數(shù)據(jù)復(fù)制方式下,RPO 等于數(shù)據(jù)傳輸延遲的時間;在異步數(shù)據(jù)復(fù)制下, RPO 基本為異步傳輸數(shù)據(jù)排隊的時 間。在實際應(yīng)用中,考慮導(dǎo)數(shù)據(jù)傳輸?shù)囊蛩兀瑯I(yè)務(wù)數(shù)據(jù)庫與容災(zāi)備份數(shù)據(jù)庫的 一致性(SCN)是不同的,RPO表示業(yè)務(wù)數(shù)據(jù)庫與容災(zāi)備份數(shù)據(jù)庫 SCN的時 間差。發(fā)生災(zāi)難后,啟動容災(zāi)系統(tǒng)完成數(shù)據(jù)恢復(fù), RPO 就是新恢復(fù)業(yè)務(wù)系統(tǒng)的 數(shù)據(jù)損失量。設(shè)計容災(zāi)系統(tǒng)不能只看 RTO和RPO,對于不同的業(yè)務(wù)系統(tǒng)和用戶特殊的要 求,其它一些指標(biāo)有可能成為選擇容災(zāi)解決方案的主要因素。例如,某些地區(qū) 為了防范一些特定自然災(zāi)害的風(fēng)險,要求容災(zāi)備份中心與業(yè)務(wù)中心保持足夠的 距離,在這種
9、情況下,容災(zāi)備份中心與業(yè)務(wù)中心的距離要求就是容災(zāi)系統(tǒng)的重 要指標(biāo)。1.2.2 數(shù)據(jù)安全數(shù)據(jù)的完整性,一致性是保證業(yè)務(wù)連續(xù)的關(guān)鍵。在本地,數(shù)據(jù)安全需要使用RAID 技術(shù)來保證。在災(zāi)備方案的設(shè)計中,數(shù)據(jù)復(fù)制方案的設(shè)計是整個設(shè)計的 基礎(chǔ)。目前業(yè)界主流的數(shù)據(jù)復(fù)制技術(shù)有:基于數(shù)據(jù)庫本身的復(fù)制技術(shù),基于操 作系統(tǒng)的數(shù)據(jù)復(fù)制,基于虛擬存儲的復(fù)制技術(shù)和基于存儲的復(fù)制技術(shù)。在方案 所用技術(shù)的選擇時,應(yīng)當(dāng)根據(jù)客戶的預(yù)算,現(xiàn)場的條件,綜合來進(jìn)行考量。后 續(xù)在 1.6.1 數(shù)據(jù)同步章節(jié),將會有這 4 類數(shù)據(jù)復(fù)制技術(shù)的綜合對比,可以作為 選擇的參考。1.2.3 網(wǎng)絡(luò)安全通信網(wǎng)絡(luò)是容災(zāi)系統(tǒng)的組成部分,通信線路的質(zhì)量也是容
10、災(zāi)系統(tǒng)的性能指標(biāo)之 一,其中包括網(wǎng)絡(luò)的數(shù)據(jù)傳輸帶寬、網(wǎng)絡(luò)傳輸通道的冗余和網(wǎng)絡(luò)服務(wù)商的服務(wù) 水平(網(wǎng)絡(luò)年中斷率)。如果容災(zāi)系統(tǒng)使用的通信網(wǎng)絡(luò)是確定的,為了比較不 同容災(zāi)解決方案,可以用單位存儲容量的數(shù)據(jù)庫在同一通信網(wǎng)絡(luò)上的數(shù)據(jù)完全 恢復(fù)時間作為一項設(shè)計指標(biāo)。124業(yè)務(wù)連續(xù)性業(yè)務(wù)連續(xù)性是災(zāi)備方案的最終目標(biāo),是方案的價值所在。為了保證業(yè)務(wù)的連 續(xù),首先需要數(shù)據(jù)的連續(xù),之前我們討論了數(shù)據(jù)安全相關(guān)的內(nèi)容。其次,在數(shù) 據(jù)連續(xù)的基礎(chǔ)上,出現(xiàn)災(zāi)難時,系統(tǒng)需要能夠滿足(1)網(wǎng)絡(luò)切換(2)應(yīng)用切換。以此,來保證系統(tǒng)能夠順利切換到災(zāi)備地,繼續(xù)安全運營,最大化保證客 戶利益。1.3國標(biāo)系統(tǒng)災(zāi)備等級劃分及應(yīng)對措施國家信
11、息系統(tǒng)災(zāi)難恢復(fù)規(guī)范( GB/T 20988-2007 )規(guī)定了六個級別的容 災(zāi),下表分別針對每個級別給出了相應(yīng)的應(yīng)對措施。級別內(nèi)容措施Level6數(shù)據(jù)零丟失和遠(yuǎn)程集群支持實現(xiàn)遠(yuǎn)程數(shù)據(jù)實時備份,實現(xiàn)零丟失; 應(yīng)用軟件可以實現(xiàn)實時無縫切換; 遠(yuǎn)程集群系統(tǒng)的實時監(jiān)控和自動切換能力;Level5實時數(shù)據(jù)傳輸及完整設(shè)備支持實現(xiàn)遠(yuǎn)程數(shù)據(jù)復(fù)制技術(shù);備用網(wǎng)絡(luò)也具備子哦那個或集中切換能力;Level4電子傳輸及完整設(shè)備支持配置所需要的全部數(shù)據(jù)和通訊線路及網(wǎng)絡(luò)設(shè)備,并處于就緒7*24運行;更咼的技術(shù)支持和運維管理;Level3電子傳輸和部分設(shè)備支持配置部分?jǐn)?shù)據(jù),通信線路和網(wǎng)絡(luò)設(shè)備; 每天實現(xiàn)多次的數(shù)據(jù)電子傳輸;
12、備用場地配置專制的運行管理人員;Level2備用場地支持預(yù)定時間調(diào)配數(shù)據(jù),通信線路和網(wǎng)絡(luò)設(shè)備;備用場地管理制度;設(shè)備及網(wǎng)絡(luò)緊急供貨協(xié)議;Level1基本支持每周至少做一次完全數(shù)據(jù)備份;制定介質(zhì)存取/驗證和轉(zhuǎn)儲的管理制度; 完整測試和演練的災(zāi)難恢復(fù)計劃;1.4容災(zāi)技術(shù)分析(1) 冷備份1.4.1備份方式備份系統(tǒng)未安裝或未配置成與當(dāng)前使用的系統(tǒng)相同或相似的運行環(huán)境 , 應(yīng)用系 統(tǒng)數(shù)據(jù)沒有及時裝入備份系統(tǒng)。一旦發(fā)生災(zāi)難,需安裝配置所需的運行環(huán)境, 用數(shù)據(jù)備份介質(zhì)(磁帶或光盤)恢復(fù)應(yīng)用數(shù)據(jù),手工逐筆或自動批量追補孤立 數(shù)據(jù),將終端用戶通過通訊線路切換到備份系統(tǒng),恢復(fù)業(yè)務(wù)運行。優(yōu)點:設(shè)備 投資較少,節(jié)省
13、通信費用,通信環(huán)境要求不高。缺點:恢復(fù)時間較長,一般要 數(shù)天至 1 周,數(shù)據(jù)完整性與一致性較差。(2) 溫備份將備份系統(tǒng)已安裝配置成與當(dāng)前使用的系統(tǒng)相同或相似的系統(tǒng)和網(wǎng)絡(luò)運行環(huán) 境,安裝了應(yīng)用系統(tǒng)業(yè)務(wù)定期備份數(shù)據(jù)。一旦發(fā)生災(zāi)難,直接使用定期備份數(shù) 據(jù),手工逐筆或自動批量追補孤立數(shù)據(jù)或?qū)⒔K端用戶通過通訊線路切換到備份 系統(tǒng),恢復(fù)業(yè)務(wù)運行。優(yōu)點:設(shè)備投資較少,通信環(huán)境要求不高。缺點:恢復(fù) 時間長,一般要十幾個小時至數(shù)天,數(shù)據(jù)完整性與一致性較差。(3) 熱備份備份處于聯(lián)機狀態(tài),當(dāng)前應(yīng)用系統(tǒng)通過高速通信線路將數(shù)據(jù)實時傳送到備份系 統(tǒng),保持備份系統(tǒng)與當(dāng)前應(yīng)用系統(tǒng)數(shù)據(jù)的同步;也可定時在備份系統(tǒng)上恢復(fù)應(yīng) 用
14、系統(tǒng)的數(shù)據(jù)。一旦發(fā)生災(zāi)難,不用追補或只需追補很少的孤立數(shù)據(jù),備份系 統(tǒng)可快速接替生產(chǎn)系統(tǒng)運行,恢復(fù)營業(yè)。優(yōu)點:恢復(fù)時間短,一般幾十分鐘到 數(shù)小時,數(shù)據(jù)完整性與一致性最好,數(shù)據(jù)丟失可能性最小。缺點:設(shè)備投資 大,通信費用高,通信環(huán)境要求高,平時運行管理較復(fù)雜。在計算機服務(wù)器備份和恢復(fù)中,冷備份服務(wù)器( cold server )是在主服務(wù)器丟 失的情況下才使用的備份服務(wù)器。冷備份服務(wù)器基本上只在軟件安裝和配置的 情況下打開,然后關(guān)閉直到需要時再打開。溫備份服務(wù)器( warm server )一般都是周期性開機,根據(jù)主服務(wù)器內(nèi)容進(jìn)行 更新,然后關(guān)機。經(jīng)常用溫備份服務(wù)器來進(jìn)行復(fù)制和鏡像操作。熱備份服
15、務(wù)器( hot server )時刻處于開機狀態(tài),同主機保持同步。當(dāng)主機失 靈時,可以隨時啟用熱備份服務(wù)器來代替。對于關(guān)鍵的業(yè)務(wù), Primeton 建議采用同城熱備異地?zé)醾涞姆绞竭M(jìn)行部署, 對于一般性的業(yè)務(wù),建議采用同城熱備異地溫備(應(yīng)用不啟動,數(shù)據(jù)保持異 步復(fù)制)的方式進(jìn)行部署。1.4.2數(shù)據(jù)復(fù)制技術(shù)目前數(shù)據(jù)復(fù)制技術(shù)主要有如下表所列4種,基于紅色字體部分的要求,結(jié)合客戶的需要,Primet on推薦采用基于存儲或者基于應(yīng)用程序的數(shù)據(jù)復(fù)制技術(shù)來 進(jìn)行數(shù)據(jù)同步。基本原理數(shù)據(jù)的復(fù)制過程通過本 地的存儲系統(tǒng)和遠(yuǎn)端的 存儲系統(tǒng)之間的通信完 成。復(fù)制技術(shù)是伴隨著存 儲局 域網(wǎng)的出現(xiàn)引入的,通過 構(gòu)建虛
16、擬存儲上實現(xiàn)數(shù)據(jù) 復(fù)制。通過操作系統(tǒng)或者數(shù) 據(jù)卷管理器來實現(xiàn)對 數(shù)據(jù)的遠(yuǎn)程復(fù)制。數(shù)據(jù)庫的異地復(fù)制技術(shù) 日志復(fù)制功能,依靠本 機間的日志歸檔與傳遞 的數(shù)據(jù)一致。平臺 要求同構(gòu)存儲與平臺無關(guān),需要增加專有的復(fù)制服務(wù) 器或帶有復(fù)制功能的 SAN 交換機同構(gòu)主機、異構(gòu)存儲與平臺無關(guān)復(fù)制性能高高高較咼資源 占用對生產(chǎn)系統(tǒng)存儲性能有 影響對網(wǎng)絡(luò)要求咼對生產(chǎn)系統(tǒng)主機性能 有影響占用部分生產(chǎn)系統(tǒng)數(shù)據(jù)技術(shù) 成熟 度成熟成熟度有待提咼,非主流 復(fù)制技術(shù)。成熟成熟投入成本高,需要同構(gòu)存儲較高,需要專有設(shè)備較高,需要同構(gòu)主機一般部分軟件免費,如Data復(fù)制 軟件IBM PPRCEMC SRDFHP CA( Conti
17、nuesAccess)HDS TrueCopyBrocade Tapestry DMMUIT SVMEMC VSM原廠技術(shù):IBM AIX LVMHP-UINX MirrorDiskSun Solaris SVM專業(yè)的復(fù)制軟件:Syma ntec SF/VVROracle DataGuardOracle Golde nGateDNT IDRDSG RealS yncQuest SharePlex重復(fù)數(shù)據(jù)刪除技術(shù)是指將存儲系統(tǒng)中存在的大量內(nèi)容相同的數(shù)據(jù)刪除,只保留其中一份,從而縮減存儲空間的技術(shù)。在云災(zāi)備中,該技術(shù)既能大幅減少災(zāi)備中心存儲的數(shù)據(jù)量,降低災(zāi)備中心的建設(shè)和運維成本,又能大幅減少數(shù)據(jù)備
18、份和恢復(fù)過程中用戶和災(zāi)備提供商間的數(shù)據(jù)傳輸量,提高備份和恢復(fù)的性能,是 一項十分重要的技術(shù)。隨著災(zāi)備中心的規(guī)模不斷增大,存儲的數(shù)據(jù)量和訪問量不斷增加,單一節(jié)點上 的重復(fù)數(shù)據(jù)刪除方法已不能滿足性能和容量的需求。除上述基本重復(fù)數(shù)據(jù)刪除 技術(shù)外,一些優(yōu)化和改進(jìn)技術(shù)對云災(zāi)備是至關(guān)重要的,包括高性能、可擴展 的、分布式的重復(fù)數(shù)據(jù)刪除技術(shù),以及為提高災(zāi)備中心數(shù)據(jù)可靠性的高可靠重 復(fù)數(shù)據(jù)刪除技術(shù)。1.4.4 操作系統(tǒng)虛擬化技術(shù) ?除了數(shù)據(jù)級的災(zāi)備,還應(yīng)提供系統(tǒng)級的災(zāi)備。即在將數(shù)據(jù)復(fù)制到云端的同時, 也將受保護的應(yīng)用程序的狀態(tài)復(fù)制到云端,當(dāng)災(zāi)難發(fā)生時可以立即切換到云端 的應(yīng)用程序運行,保證業(yè)務(wù)連續(xù)性。系統(tǒng)級災(zāi)
19、備是通過操作系統(tǒng)虛擬化和檢查 點實現(xiàn)的。檢查點用來捕獲進(jìn)程某一時刻的運行狀態(tài),從而實現(xiàn)進(jìn)程遷移。進(jìn) 程遷移既可以是用戶應(yīng)用程序進(jìn)程到云災(zāi)備中心的遷移,也可以是云災(zāi)備中心 內(nèi)部的虛擬機池間進(jìn)程遷移,以實現(xiàn)根據(jù)前端用戶的需求自動地調(diào)節(jié)災(zāi)備服務(wù) 提供商有限的硬件與軟件資源,動態(tài)地、彈性的反應(yīng)前端業(yè)務(wù)對災(zāi)備的需求。當(dāng)程序因故障中斷,如果不能保留其中間運行狀態(tài),恢復(fù)后從頭運行將會帶來極大的消耗。檢查點技術(shù)能夠解決這個問題。通過保留各個進(jìn)程的運行狀態(tài), 恢復(fù)時能夠復(fù)原到最近一次保留的數(shù)據(jù)映像。傳統(tǒng)的檢查員機制是基于庫的檢查點機制。例如以靜態(tài)庫的形式實現(xiàn),或通過加載動態(tài)鏈接庫來追蹤程序運行過程中的數(shù)據(jù)變化。
20、也有一些檢查點機制實現(xiàn) 于內(nèi)核級別甚至硬件級別。例如通過在文件系統(tǒng)層之上引入一個中間層來實現(xiàn) 保留文件系統(tǒng)狀態(tài)的檢查點機制;或者借助 Fuse 內(nèi)核模塊實現(xiàn)的支持檢查點 機制的文件系統(tǒng),通過 Fuse 偵測、攔截內(nèi)核級別的文件系統(tǒng)操作并將控制權(quán) 傳遞給用戶,從而能夠在用戶空間對文件系統(tǒng)狀態(tài)進(jìn)行保留。隨著操作系統(tǒng)虛擬化技術(shù)的發(fā)展,基于虛擬容器的檢查點技術(shù)也得到了很好的 應(yīng)用。虛擬容器是通過系統(tǒng)虛擬化技術(shù)構(gòu)建出來的一個進(jìn)程運行的較獨立的上下文環(huán)境。虛擬容器檢查點技術(shù)能夠有效保護容器內(nèi)運行的應(yīng)用程序和服務(wù)而 不需要對應(yīng)用進(jìn)行修改。1.5 總體架構(gòu)設(shè)計1.5.1Primeton “兩地三中心”容災(zāi)解決
21、方案架構(gòu)設(shè)計結(jié)合近年國內(nèi)出現(xiàn)的大范圍自然災(zāi)害,以同城雙中心加異地災(zāi)備中心的“兩地 三中心”的災(zāi)備模式也隨之出現(xiàn),這一方案兼具高可用性和災(zāi)難備份的能力。1.5.1.1 “兩地三中心”本地高可用和容災(zāi)保護策略(1)本地保護策略:? 本地高可用? 本地 clone? 持續(xù)數(shù)據(jù)保護? B2D BVTL? 磁帶備份? Archive Log 備份(2)容災(zāi)保護策略? 應(yīng)用級或者數(shù)據(jù)級容災(zāi)? 同級容災(zāi)、降級容災(zāi)? 同步數(shù)據(jù)保護異步數(shù)據(jù)保護? 容災(zāi)數(shù)據(jù)復(fù)制技術(shù)? 主備中心運營方式雙主中心運營方式多中心運營方式? 短、中、遠(yuǎn)期容災(zāi)策略生產(chǎn)中心同城備份中心異地災(zāi)備中心生產(chǎn)生產(chǎn)(雙活或熱備)生產(chǎn)備份備份備份災(zāi)備災(zāi)
22、備災(zāi)備開發(fā)監(jiān)控測試測試監(jiān)控監(jiān)控管理管理同城雙中心是指在同城或鄰近城市建立兩個可獨立承擔(dān)關(guān)鍵系統(tǒng)運行的數(shù)據(jù)中 心,雙中心具備基本等同的業(yè)務(wù)處理能力并通過高速鏈路實時同步數(shù)據(jù),日常 情況下可同時分擔(dān)業(yè)務(wù)及管理系統(tǒng)的運行,并可切換運行;災(zāi)難情況下可在基 本不丟失數(shù)據(jù)的情況下進(jìn)行災(zāi)備應(yīng)急切換,保持業(yè)務(wù)連續(xù)運行。與異地災(zāi)備模 式相比較,同城雙中心具有投資成本低、建設(shè)速度快、運維管理相對簡單、可 靠性更高等優(yōu)點。異地災(zāi)備中心是指在異地的城市建立一個備份的災(zāi)備中心,用于雙中心的數(shù)據(jù) 備份,當(dāng)雙中心出現(xiàn)自然災(zāi)害等原因而發(fā)生故障時,異地災(zāi)備中心可以用備份 數(shù)據(jù)進(jìn)行業(yè)務(wù)的恢復(fù)。1.5.1.3 “兩地三中心”容災(zāi)架
23、構(gòu)設(shè)計邏輯架構(gòu)模型設(shè)計:備用數(shù)據(jù)縫理備用網(wǎng)絡(luò)Site B(同城容災(zāi))amnmMum慮用悴與中伶BS*tf敢份SAN交機Site A住產(chǎn)中心)(B»M)用BHttW (i»耳is用5)(nta7c*av)»)物理架構(gòu)設(shè)計mu 異步數(shù)據(jù)U制r_*巧二匚 tL-P- I-*-萬案特點:?同城范圍有效保證了數(shù)據(jù)的安全性和業(yè)務(wù)連續(xù)性;?異地復(fù)制數(shù)據(jù)根據(jù)災(zāi)難情形,盡可能降低數(shù)據(jù)丟失機率;?同城雙中心為同步復(fù)制,數(shù)據(jù)實時同步,RPO=0 ;?異地?zé)o距離限制,保證數(shù)據(jù)一致性,保證了數(shù)據(jù)的有效保護;?異地容災(zāi)帶寬要求低,先進(jìn)的復(fù)制機制提高帶寬利用率 對于本地本級備份,應(yīng)建立在線、近
24、線、離線等多級存儲備份系統(tǒng),充分利用 先進(jìn)的備份手段和備份策略,形成完整的本地備份管理解決方案;備份的數(shù)據(jù) 包括操作系統(tǒng)、數(shù)據(jù)文件以及應(yīng)用服務(wù)環(huán)境等多個方面;日常訪問的重要數(shù)據(jù) 采用磁盤或者虛擬帶庫方式備份,歸檔數(shù)據(jù)和非重要數(shù)據(jù)采用磁帶庫方式備 份;重要數(shù)據(jù)應(yīng)至少保證每周做一個全量備份,平時做增量備份。對于數(shù)據(jù)級異地災(zāi)備中心,選址上,應(yīng)進(jìn)行風(fēng)險分析,避免異地備份中心與主 中心同時遭受同類風(fēng)險;網(wǎng)絡(luò)備用系統(tǒng)上,必須在核心網(wǎng)絡(luò)層面實現(xiàn)熱備,保 證災(zāi)備中心區(qū)域內(nèi)通信的可靠性;數(shù)據(jù)備份系統(tǒng)上,主中心與備份中心的備份 鏈路應(yīng)有冗余,并確保 2小時內(nèi)將主中心的增量數(shù)據(jù)復(fù)制或備份到災(zāi)備中心; 數(shù)據(jù)處理備用系
25、統(tǒng)上,配備災(zāi)難恢復(fù)所需的全部數(shù)據(jù)處理設(shè)備,并處于就緒狀 態(tài)或運行狀態(tài),與主中心共同承擔(dān)部分核心應(yīng)用的查詢服務(wù)功能。對于同城應(yīng)用級災(zāi) 備中心,選址上,主中心 與同城 災(zāi)備中 心距離 應(yīng)小于 100KM ;網(wǎng)絡(luò)備用系統(tǒng)上,在核心網(wǎng)絡(luò)層面實現(xiàn)熱備,主中心與應(yīng)用級災(zāi)備中 心間通過裸光纖互聯(lián)或 VPLS互聯(lián),部署TRILL構(gòu)建大二層網(wǎng)絡(luò),滿足虛擬化 需求;網(wǎng)絡(luò)負(fù)載均衡上,主中心網(wǎng)絡(luò)與災(zāi)備中心網(wǎng)絡(luò)的負(fù)載均衡,提高災(zāi)備網(wǎng) 絡(luò)利用率與災(zāi)備網(wǎng)絡(luò)可用性,正常情況下數(shù)據(jù)流同時使用兩個中心的網(wǎng)絡(luò),主 中心網(wǎng)絡(luò)出現(xiàn)故障時,貝U全部數(shù)據(jù)流向災(zāi)備網(wǎng)絡(luò);應(yīng)用集群切換上,關(guān)鍵業(yè)務(wù) 系統(tǒng)集群實現(xiàn)手動切換,主中心與同城災(zāi)備中心之間
26、建立高可用性監(jiān)控技術(shù), 實現(xiàn)災(zāi)備中心應(yīng)用服務(wù)器集群與主中心生產(chǎn)服務(wù)器集群之間的高可用性切換; 云計算技術(shù)采用上,采用虛擬化技術(shù)對同城災(zāi)備中心進(jìn)行規(guī)劃建設(shè),同時,根 據(jù)業(yè)務(wù)關(guān)鍵程度、對性能的要求,系統(tǒng)平臺選擇不同檔次和不同平臺的主機資 源池、存儲資源池。1.5.2基于不同服務(wù)需求選擇不同可靠性“兩地三中心”架構(gòu)1.521服務(wù)等級劃分的可靠性服 務(wù) 級 別tierltier2tier3服關(guān)鍵任務(wù)服務(wù),需要最高級別的可靠性。高端技術(shù)關(guān)鍵業(yè)務(wù)服務(wù)的運維和tierl 一樣,高端技術(shù)和工務(wù)和工具將會被用來滿足最高級別的可靠性。如果但是某些限制非可靠級別的服務(wù)可以盡量(略低于內(nèi)丟失一個組件,如服務(wù)器,一塊存
27、儲,或者一個容忍短時間的不可恢復(fù)的影響。咼端和 tier2 ) 被容通信鏈接,都將會導(dǎo)致服務(wù)不可靠。每個應(yīng)用和 基礎(chǔ)服務(wù)都會制定性能指標(biāo)。這些指標(biāo)都將會被 監(jiān)控,并會通過業(yè)務(wù)支持的流程以特疋格式輸 出。這個site不僅僅包含基礎(chǔ)架構(gòu)組件。技術(shù)和工具將會盡量(略低于tierl )被用來滿足最高級別的可靠 性。系統(tǒng)設(shè)計和指導(dǎo)里面必須包含一 沒有單點故障。足最高級別的 性。允許有多 故障。僅僅在 有一些伸縮性關(guān) 鍵 指 標(biāo)99.99%的可靠性,數(shù)據(jù)中性能夠切換,廠家支持 (小于2小時的響應(yīng)時間),硬件容錯性,沒有 單點故障,N+1,數(shù)據(jù)中心的切換選擇,硬件冗余99.5%的可靠性,數(shù)據(jù)中性能夠切 換,
28、廠家支持(小于 4小時的響應(yīng)時 間),硬件具備容錯性,沒有單點故障,N+195%的可靠性 性能夠切換, 持(小于24 應(yīng)時間)分 鐘 宕機/月4.32216.002160.001.522 Primet on通用的基于服務(wù)的“兩地三中心”架構(gòu)示意圖服務(wù)HA苴礎(chǔ)架構(gòu)計劃內(nèi)更新/可靠性級別:99.XXX本地:生產(chǎn)環(huán)境十同城備份yv.、入、|廠井她±和車地環(huán)境輜同或新和、牛:產(chǎn)壞境杷同或舟汝召活躍的CA)割門*耳si*ta 沖TiTJLrifffcFWi*.flR+X”應(yīng)蚩專此:«r«a+tet4fir)nW托Eig理冋*耳本地 ”皿兀Aft*HUM1; FlRI也暑mj
29、n«ri龍列也賈松陽握遠(yuǎn) 的肺地1.5.2.3 Primeton基于不同的服務(wù)質(zhì)量,達(dá)到不同級別的整體可靠性(tier )(1)場景1AOLTP: 100%* IA 樣 OLTAP: N/A 杜處理】WAtier 2 or 17556和本地-*樣2*-1. 町林性j&|l99.999Ki2. HA+DRim所有組井均冗余配置j4 町釆用Art陽佃鴕嗅式來保證業(yè)務(wù)連續(xù)性<A/P1100%和A樣1 4|44111?75%和本地一樣I1IOnline 10094 A*ff 槪址艸=H/AOLTP” 0L4P.75%和本地一樣本地生產(chǎn)環(huán)境* H 異地災(zāi)備愛infx倍主環(huán)境如圖中A所示,包含了數(shù)據(jù)庫,應(yīng)用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中學(xué)生物試題及答案
- 中醫(yī)適宜技術(shù)試題及答案
- 浙江省9+1高中聯(lián)盟長興中學(xué)2025年高二數(shù)學(xué)第二學(xué)期期末質(zhì)量跟蹤監(jiān)視模擬試題含解析
- 長春市第十一中學(xué)2025年物理高二第二學(xué)期期末聯(lián)考試題含解析
- 浙江省紹興市紹興一中2025年數(shù)學(xué)高二第二學(xué)期期末質(zhì)量跟蹤監(jiān)視模擬試題含解析
- 云南省瀘水五中2025屆物理高二第二學(xué)期期末檢測模擬試題含解析
- 鹽城市時楊中學(xué)高二下學(xué)期期中考試數(shù)學(xué)試題
- 鹽城市射陽二中高一上學(xué)期教學(xué)質(zhì)量調(diào)研(三)英語試題
- 新能源產(chǎn)業(yè)廠房出售與技術(shù)研發(fā)合同
- 車輛租賃公司市場拓展及戰(zhàn)略聯(lián)盟合同
- 教研組工作匯報課件
- 臨終關(guān)懷服務(wù)技術(shù)創(chuàng)新與應(yīng)用探索
- 渤海大學(xué)《材料合成與制備技術(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 重度哮喘診斷與處理中國專家共識(2024)解讀
- 魯科版選修3《物質(zhì)結(jié)構(gòu)與性質(zhì)》全一冊學(xué)案有答案
- 六年級科學(xué)下冊知識點梳理
- 人力資源(人事)及行政管理制度體系資料文件
- 十年(2015-2024)高考真題數(shù)學(xué)分項匯編(全國)專題03 平面向量(學(xué)生卷)
- 管線探挖方案
- 期末質(zhì)量測試卷(試題)-2023-2024學(xué)年牛津上海版(三起)英語五年級下冊
- 中藥連翹課件
評論
0/150
提交評論