數據中心建設項目大數據中心建設方案_第1頁
數據中心建設項目大數據中心建設方案_第2頁
數據中心建設項目大數據中心建設方案_第3頁
免費預覽已結束,剩余45頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第48頁共48頁數據中心建設項目大數據中心建設方案大數據中心建設方案信息技術有限公司目錄第1章方案概述31.1.建設背景31.2.當前現狀41.3.建設目標6第2章方案設計原則72.1.設計原則72.2.設計依據9第3章數據中心方案架構103.1數據中心架構設計103.2大數據處理設計163.3大數據存儲設計213.4安全設計233.5平臺搭建實施步驟283.6物理架構設計29第4章數據中心網絡方案組成324.1.防火墻設計324.2.接入層設計324.3.網絡拓撲33第5章數據中心基礎設施方案組成345.1.機柜系統設計345.2.制冷系統設計365.3.供配電系統設計415.4.模塊監控系統設計45第6章運維方案516.1.技術和售后服務516.2.售后服務項目516.3.售后服務項目內容51第1章方案概述“百年大計,教育為本”,教育行業是我國經濟發展的關鍵命脈之一,伴隨著數據集中在教育業信息化的逐漸展開,數據中心在企業和信息化的地位越來越重要。教育數據中心建設已成為教育機構信息化趨勢下的必然產物。教育數據中心作為承載教育機構業務的重要IT基礎設施,承擔著教育機構穩定運行和業務創新的重任。在教育機構新型客戶服務模式下,數據中心需要更高效地支持后臺業務和信息共享需求,同時要24小時不間斷的提供服務,支持多種服務手段。這對教育數據中心的資整合,全面安全,高效管理和業務連續性提出更高的要求。此數據中心建設方案主要對數據中心的基礎設施和網絡規劃部分提出整體建議,保證數據中心的高性能、安全、可靠,從而使數據中心能承載更多高品質的業務。1.1.建設背景自從出現數字化教育以來,數據中心作為數字化交易的核心,被各個教育系統廣泛采用。目前隨著教育電子化的推廣,客戶市場細分的深入,教育產品設計的專業化,以及對于教育系統安全性的要求。教育系統的數據中心需要更強大的運算能力,更多的存儲空間,更安全可靠的規劃和設計。不僅如此,教育系統相比其他行業的數據中心有其自身特有的特點和要求。教育行業數據中心的非常重要的一點就是安全和可靠。因為哪怕是短時間的網絡癱瘓也會造成非常廣泛和嚴重的后果。這對教育數據中心的資整合,全面安全,高效管理和業務連續性提出更高的要求。所以教育行業數據中心產品和方案的應用必須采用更高等級的產品和整體設計方案,以滿足對于系統安全性的要求。從數據大集中到多業務整合,教育行業的數據中心建設正圍繞著業務發展的需要迅速展。教育基礎設施的建設,很重要的一個環節就是教育數據中心的建設。教育數據中心工程不僅集建筑、電氣、安裝、網絡等多個專業技術于一體,更需要豐富的工程實施和管理經驗。教育數據中心設計與施工的優劣直接關系到數據中心內計算機系統是否能穩定可靠地運行,是否能保證各類信息通訊暢通無阻。由于教育數據中心的環境必須滿足計算機等各種數據,以達到反饋信息和處理問題的功效。特別是要將需要解決電池放電狀態和旁路運行狀態的監控管理問題等重要信息發到主要負責人的手機上,以便能隨時掌握信息,對一些天氣災害停電而有應急預案。1.2.當前現狀隨著業務的發展,數據中心的問題與日俱增,數據中心所面臨的壓力和挑戰也越來越大:業務的不斷調整和改變讓數據中心總體架構面臨極大的壓力、有限的物理空間讓數據中心擴展性和靈活性有所限制、虛擬化的欠缺讓數據中心資調配能力有限、復雜多變的異構環境讓數據中心管理效率異常低下、高居不下的耗電量讓數據中心能成本迅速上升。這些問題與挑戰讓數據中心管理者迫切需要對數據中心進行整合和升級。通過有效的整合讓傳統數據中心升級成為一個智能化、自動化、高效化的數據中心。當前數據中心面臨的問題:l可靠性問題供電可靠性是數據中心安全性的重要保障,隨著以信息技術為支撐的新業務的不斷涌現,教育行業數據中心對供電可靠性的要求大大提升。在數據中心領域,動力平臺的可用性指標分別高于數據中心的可用性指標和整個網絡系統的可用性指標,因此,對動力平臺的關注理應放到最核心的位置。比如服務器電的冗余方式發生了變化,供電系統就應當做出相應改變。刀片服務器以及虛擬化的應用,使高熱密度問題凸顯,數據中心環境更加惡劣,制冷模式就也需要做出改變。l節能降耗問題數據中心建設的加速,導致的最直接后果就是能消耗量的急劇攀升。在當前全球能緊張的大背景下,節能降耗是整個數據中心行業的大趨勢。對于企業本身而言,能耗的急劇增長大大提升了數據中心的運行成本,數據中心的節能和能效改善已成為整個行業的迫切要求。l管理與維護問題數據中心是一個龐大而復雜的系統,這些系統是一個有機的整體,牽一發而動全身,數據中心可靠性的發揮有賴于每個設備的正常運行,有賴于這些設備的協調一致,任何一個環節出現故障,都有可能造成巨大損失。因此,對整個系統的管理越來越重要,而難度也越來越大。l擴容問題隨著業務量的不斷擴大,教育行業IT應用系統日益增長,服務器規模變得日益龐大,帶來了高能耗、數據中心空間緊張、IT預算緊張等問題。同時,數據中心動力平臺的匹配性卻不夠,要么利用率低,資浪費嚴重;要么供電與制冷明顯不足,影響數據中心可用性。簡言之,動力系統對核心設備供電或者制冷需求的反映不夠靈敏。針對上述問題,技術有限公司推出了創新型的數據中心解決方案。該解決方案具有高可用性、高節能性、高靈活性、高可維護性等四大特點,能夠幫助教育行業客戶解決數據中心建設與應用的難題,滿足教育企業在信息化過程中對數據中心動力安全、節能環保等方面日益增長的應用需求。.2.1.3.建設目標數據中心建設應達成以下目標:高可用數據中心的高可用直接影響到業務系統的可用性,高可用至少包括高可靠、高安全和先進性三個方面:u高可靠:應采用高可靠的產品和技術,充分考慮系統的應變能力、容錯能力和糾錯能力,確保整個基礎設施運行穩定、可靠。當今,關鍵業務應用的可用性與性能要求比任何時候都更為重要。u高安全:基礎設計的安全性,涉及到核心數據安全。應按照端到端訪問安全、網絡分層安全兩個維度對安全體系進行設計規劃,采用軟硬件安全設備,從局部安全、全局安全到智能安全,將安全理念滲透到整個數據中心網絡中。u先進性:數據中心將長期支撐企業的業務發展,數據中心建設需要考慮后續的機會成本,采用主流的、先進的技術和產品,建立高性能,大容量存儲的數據中心。u易擴展隨著信息化的發展,企業內通信網絡的建立和全面覆蓋,未來的業務范圍會更多更廣,業務系調整與擴展再所難免,因此數據中心必須能夠適應業務系統的頻繁調整,同時在性能上應至少能夠滿足未來5~10年的業務發展。對于設備的選擇和協議的部署,應遵循業界標準,保證良好的互通性和互操作性,支持業務的快速部署。u易管理數據中心是IT技術最為密集的地方,數據中心的設備繁多,各種協議和應用部署越來越復雜,對運維人員的要求也越來越高,單獨依賴運維人員個人的技術能力和業務能力是無法保證業務運行的持續性的。因此數據中心需要提供完善的運維管理平臺,對數據中心IT資進行全局掌控,減少日常的運維的人為故障。同時一旦出現故障,能夠借助工具直觀、快速定位。第2章方案設計原則.設計原則根據“先進、實用、穩定、可靠”的總原則,對云數據中心軟硬件系統進行科學合理的設計,保證中心建設的勝利完成。數據中心工程是智能弱電工程的重要組成部分。其基本要求可歸納為:保證系統運行的可靠性、保證系統的設計壽命、保證信息安全的要求、保證操作人員的工作環境。設計一個好的數據中心,要以兼顧人機并重之原則,一個合格的現代化計算機數據中心,應該是一個安全可靠、舒適實用、節能高效和具有可擴充性的數據中心,設計應以運行條件、安全可靠作為首要的考慮因素。因此對數據中心建設要求遵循以下設計原則:1.高安全可靠性為保證數據中心能為用戶提供連續不間斷的7×24小時服務,數據中心必須具有高可靠性。在系統設計時應注意盡量減少單點故障的存在,對存在單點故障的環節,在設計上必須減少其對整個系統的影響。由于該數據中心內部計算機系統涉及到機密信息,其泄密可能嚴重危害社會秩序,所以需要保證數據中心的安全性,必須具有安保系統以保證用戶的設備和數據不受侵害。實現高安全性的措施包括:閉路電視監測、門禁系統、自動安全報警系統等。中心軟硬件系統要高度可靠,虛擬機出現故障要能自動遷移,數據要有冗余備份,可以從故障中及時恢復。。2.可擴展性鑒于信息網絡系統需求的不斷發展與變化,技術也在不斷提高,故在建設時應考慮這些變化對資需求的改變,以使整個系統具有靈活的可擴展性,特別是精密空調、配電開關及配電柜、UPS及供電母線等。中心的服務器、存儲、網絡都可以不用停機就線性擴容服務器、存儲、網絡等設備。3.易于管理通過使用先進和可靠的管理工具來實現系統的高質量管理,以節約人力資。由于數據中心內設備繁多,具有一定復雜性,隨著業務的不斷發展,管理的任務必定會日益繁重。所以在設計時,必須建立一套完善的數據中心管理和監控系統。實時監控、監測整個數據中心的運行狀況、語音報警,實時事件記錄,可以迅速確定故障,提高可靠性,簡化數據中心管理人員的維護工作。中心的資池支持方便靈活地管理維護和審計。4.高性能價格比數據中心所需設備的選型應該以適用為主,合理選擇材料與設備;不要造成資浪費;同時也要保證該數據中心的高可靠性。以較高的性能價格比設計數據中心,能以較低的成本、較少的人員投入來維持系統運轉,提供高效能與高效益。中心的軟硬件設施選擇合理,具有高性價比。2.2.設計依據《電子計算機數據中心設計規范》GB50174-932《計算機場地技術條件》GB2287-892《計算機場地安全要求》GB9361-882《計算機機房活動地板技術條件》GB6650-862《建筑物防雷設計規范》GB50057-942《高層民用建筑設計防火規范》GBJ452《電子計算機機房施工及驗收規范》SJ/T30003-932《建筑防火設計規范》GB5004-952《空調與通風工程施工及驗收規范》GB50243-972《建筑與建筑群綜合布線系統工程設計規范》GB/T50311-20002《建筑與建筑群綜合布線系統工程驗收規范》GB/T50312-20002《中華人民共和國通信行業標準》YD-T9261、2、32《國際綜合布線標準》TIA/EIA568-B2《供配電系統設計規范》GB50052-92《火災自動報警系統設計規范》GBJ116-982《工業企業通信接地設計規范》GBJ79-852《高性能屏蔽室屏蔽效能的測量方法》GB12190第3章數據中心方案架構3.1數據中心架構設計云計算數據中心通過運行在單獨的服務器上的云操作系統對服務器、存儲、網絡等資進行虛擬化管理,提供可以自定義的虛擬機,在虛擬機上安裝Hadoop、hbase等Nosql分布式數據庫集群,對現有的數據ETL采集、清洗、轉換、匯總進來,使用海量數據分布存儲技術,用spark、storm等大數據處理軟件對hbase中的數據進行分析^p處理,挖掘數據價值。還可以在虛擬機上運行業務應用系統,提供負載均衡和冗余備份,達到系統的穩定、高可用和方便的擴展性。通過安裝SSR等安全軟件和安全服務器,可以保證提升操作系統的安全級別,從而達到國家等級保護的三級要求,為客戶構建真正的安全長城。云計算數據中心可以自動管理和動態分配、部署、配置、重新配置以及回收資,也可以自動安裝軟件和應用,具有良好的彈性和靈活性,管理、使用方便。云中心可以向用戶提供虛擬基礎架構。用戶可以自己定義虛擬基礎架構的構成,如服務器配置、數量,存儲類型和大小等等。用戶通過自服務界面提交請求,每個請求的生命周期由平臺維護。服務器虛擬化系統基于服務器,存儲和網絡設備構建資池,在資池上通過資的管理、調度和鏡像管理實現系統的各種高級功能,例如計算層面的系統負載均衡和虛擬機高可用,存儲層面的鏡像復制和冗余。系統支持以主機或者虛擬群集為單位管理資,虛擬群集為一組共享存儲資的物理主機。云中心既是一個企業云,也可以對外提供服務,擴展成公有云。學校還可以使用別的公有云如阿里云,形成混合云。云中心包括iaas、paas、saas三層服務:1).SaaS:提供給客戶的服務是運營商運行在云計算基礎設施上的應用程序,用戶可以在各種設備上通過客戶端界面訪問,如瀏覽器。消費者不需要管理或控制任何云計算基礎設施,包括網絡、服務器、操作系統、存儲等等;2).PaaS:提供給消費者的服務是把客戶采用提供的開發語言和工具(例如Java,python,.等)開發的或收購的應用程序部署到供應商的云計算基礎設施上去。客戶不需要管理或控制底層的云基礎設施,包括網絡、服務器、操作系統、存儲等,但客戶能控制部署的應用程序,也可能控制運行應用程序的托管環境配置;可以使用docker容器完成應用系統的部署和管理。3).IaaS:提供給消費者的服務是對所有計算基礎設施的利用,包括處理CPU、內存、存儲、網絡和其它基本的計算資,用戶能夠部署和運行任意軟件,包括操作系統和應用程序。消費者不管理或控制任何云計算基礎設施,但能控制操作系統的選擇、存儲空間、部署的應用,也有可能獲得有限制的網絡組件(例如路由器、,防火墻,、負載均衡器等)的控制。云中心采用xen、kvm、VMware進行虛擬化,LXC提供Linux容器,支持docker應用容器。一.服務器采用浪潮整機柜服務器SmartRack

,面向海量數據的存儲和處理,適合云資池如虛擬化、分布式存儲,大數據處理如Hadoop集群等應用,目前在國內服務器中占主導地位,特點如下:定位多種應用,支持各類服務器節點。針對不同業務對存儲、計算、IO吞吐量、功耗的不同要求,設計開發出不同種類的服務器節點,包括:1U全寬雙路12盤位綜合型節點、1U全寬單路18盤位冷存儲節點、1U半寬雙路計算型節點,滿足不同需求。整機柜集中供電、集中散熱,相比其他架構服務器,運行功耗降低10%以上。整機柜由一組電模塊集中供電,最大輸出功率高達22.5kw,直接支持交流或高壓直流供電,各節點通過銅排從電模塊取電,結合電負載動態調整技術,電轉換效率高達94%以上。機柜背部風扇墻集中散熱,根據節點數量靈活調節風扇墻高度,采用140mm大尺寸風扇,相同功耗下可提供更大散熱量。領先的架構設計,保障系統高可靠運行。服務器節點中無獨立的電和風扇,有效降低單點故障。根據整機柜實際負載情況,電可實現N+N/N+2/N+1多種冗余方式。風扇可根據溫度狀況自動調節轉速,支持2+1冗余。對整機柜節點、電、風扇進行集中監控管理。實現管理中心RMC對整個機柜各模塊的統一監控和管理,節點、電、風扇的健康狀況、溫度、配置信息一目了然,還可進行批量開關機、重啟,功耗控制,風扇轉速自動/手動調節等功能,搭配專為SmartRack設計的可視化管理軟件,輕松實現簡易化智能管理。簡易維護,無需繁瑣拆裝。獨有節點前維護設計、各模組免工具熱插拔設計、優化的線纜走線設計,使得系統運維難度大大降低。風扇等易損部件全部裸露在外,更加方便更換維護。二.云操作系統建議采用浪潮云海·云數據中心操作系統V3.0

,此系統秉承開放化、模塊化、標準化的設計理念,基于虛擬化技術,實現了數據中心資融合、資管理及服務交付,簡化了云數據中心運維,提高了云數據中心服務水平。云海·云數據中心操作系統有以下特點:自主可控、安全可靠的云數據中心操作系統:浪潮自主研發的國產云數據中心操作系統,加強了WEB安全、虛擬化安全、數據安全、訪問控制、安全審計等方面的安全控制,可幫助用戶構建安全可控的云數據中心。異構資管理:云海OS支持對數據中心各類異構硬件設備及軟件資的統一管理;支持對VMWarevSphere、InspuriVirtual等異構虛擬化資池的集中管理,已部署的虛擬化環境可被云海OS無縫接管;精細的軟硬件資監控:云海OS支持對數據中心主流廠商的服務器、網絡設備、存儲設備等物理資,操作系統、數據庫、WEB應用等軟件資,VMWarevSphere、InspuriVirtual等虛擬化環境的精細監控,提供界面、郵件、短信等多種告警方式,通過詳盡清晰的報表分析^p數據,幫助數據中心的運維人員隨時掌握數據中心的各類資的運行狀況,降低運維管理復雜度,提高運維效率。快速的服務交付:云海OS支持通過虛擬機模板、應用服務模板的方式,實現業務的快速交付,業務上線時間由原來的幾周、幾天,縮短為幾分鐘,大大提高數據中心的服務水平。資使用按量計費:實時的資使用情況統計,讓用戶精確掌控自身資和費用使用情況,幫助IT部門實現由成本中心向價值中心的角色轉變。資按需服務:云海OS可實現將基礎架構作為服務交付,用戶可通過自助服務門戶在線申請及訪問自己的虛擬數據中心、應用服務、虛擬機等資,實現資的按需申請、便捷獲取、自助使用。可定制的業務流程:云海OS支持用戶創建與原工作流程吻合的資申請的審批流程,實現業務流程的個性化、可定制化。靈活的服務交付方式:云海OS既支持從下到上的資申請與審批,也支持從上到下的資創建與分配的服務交付方式,可滿足不同客戶對資獲取方式的不同需要。多租戶私有云:云海OS可創建多個組織,一個組織可代表某業務部門、分部或子公司。每個組織都有各自獨立的虛擬數據中心、用戶及獨有的目錄,可將組織資分配給本組織的用戶,每個組織如同擁有自己的數據中心。利用基于權限的用戶控制機制和基于虛擬交換機的網絡隔離技術,實現多租戶環境下的安全性和可靠性,以此構建安全的多租戶私有云。靈活可控的權限管理:云海OS支持用戶自定義角色類型,不同的權限可自由組合,實現靈活可控的系統權限管理。服務全生命周期管理:云海OS涵蓋服務提供所需的各個環節,包括服務的申請審批;服務的交付和回收;服務的使用統計和計費;服務的運行監控服務移動性:通過vApp封裝多個虛擬機服務和相關的網絡連接策略,遵循OVF等開放式標準,實現同一個云環境的終端用戶彼此之間可以輕松共享服務,而不同的云環境的用戶可以輕松的在云之間遷移服務。3.2大數據處理設計通過在虛擬機上安裝Hadoop2.6、hbase1.0等Nosql數據庫集群,用sqoop1.3把現有的數據匯總進來,要對現有數據做個總的分析^p,對字段統一定義規劃,制定轉換策略,做到正確性、唯一性、可用性,去除重復字段,通過ETL抽取、清洗數據,把數據導入hbase,這樣就可以消除信息孤島,用spark、storm等大數據處理軟件對hbase中的數據進行分析^p處理,挖掘數據價值。云中心通過調度系統自動采集、加工、存儲數據,為應用系統提供支持:在云中心的平臺上,開發招生、創業、就業、數據實驗室等應用系統,通過元數據庫管理所有的數據數據經過采集、加工后進入hbase,消除信息孤島,統一管理使用:一.hadoop2架構體系下圖是hadoop2的架構圖1.HDFS文件系統,Hadoop實現了一個分布式文件系統(HadoopDistributedFileSystem),簡稱HDFS。HDFS有高容錯性的特點,并且設計用來部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(highthroughput)來訪問應用程序的數據,適合那些有著超大數據集(largedataset)的應用程序。HDFS放寬了(relax)POSIX的要求,可以以流的形式訪問(streamingaccess)文件系統中的數據。2、YARN是一套資統一管理和調度平臺,可管理各種計算框架,包括MapReduce,Spark,MPI等。包括以下內容:ResourceManager(RM):整個系統只有一個RM,它就只管調度方面的事情,并且為集群應用而優化,因而具有很好的性能。RM的一個核心是它的Scheduler。調度包含兩個過程,一要搜集各節點的情況;二要根據某種調度策略,分配合適的節點。搜集節點情況是基于一個資容器(resourcecontainer)的概念,該容器包括cpu,disk,work等(目前只用到cpu)NodeManager(NM):NM是每個節點一個實例,管理每個節點,它觸發應用容器(applicationcontainer),監控節點的資(cpu/disk等),并向RM報告資的情況。ApplicationMaster(AM):AM是每個應用一個實例,它是一個特定的框架接口庫,一方面與RM中的Scheduler協商得到resourcecontainer,另一方面與NM一起執行和監控各子任務部件,從系統的角度,AM本身也一種container(下圖中將它與container畫得一樣)。Container:從邏輯上,container可認為是資的分配容器,它包括hostname,cpu,memory等屬性。AM發送ResourceRequest給RM,然后RM分配合適的Container給AM,AM再將此Container提交給它所在節點的NM,NM采用此資容器運行任務。實際上,Container是一種使用資的“授權”,AM得到此授權后,在NM的管理下,可以運行任何進程(包括非Java應用,這一點與1.0不同)。二、Hive是基于Hadoop的一個數據倉庫工具,處理能力強而且成本低廉。主要特點:存儲方式是將結構化的數據文件映射為一張數據庫表。提供類SQL語言,實現完整的SQL查詢功能。可以將SQL語句轉換為MapReduce任務運行,十分適合數據倉庫的統計分析^p。三、HBaseHBase是一個分布式的、面向列的開數據庫,它不同于一般的關系數據庫,是一個適合于非結構化數據存儲的數據庫。另一個不同的是HBase基于列的而不是基于行的模式。HBase使用和BigTable非常相同的數據模型。用戶存儲數據行在一個表里。一個數據行擁有一個可選擇的鍵和任意數量的列,一個或多個列組成一個ColumnFamily,一個Fmaily下的列位于一個HFile中,易于緩存數據。表是疏松的存儲的,因此用戶可以給行定義各種不同的列。在HBase中數據按主鍵排序,同時表按主鍵劃分為多個HRegion,如下圖所示(HBase數據表結構圖):四.

Sqoop是一款開的工具,主要用于在HADOOP(Hive)與傳統的數據庫(mysql、oracle...)間進行數據的傳遞,可以將一個關系型數據庫(例如:MySQL,Oracle,Postgres等)中的數據導進到Hadoop的HDFS中,也可以將HDFS的數據導進到關系型數據庫中。五.spark架構體系Spark與Hadoop的對比◆Spark的中間數據放到內存中,對于迭代運算效率更高。Spark更適合于迭代運算比較多的ML和DM運算。因為在Spark里面,有RDD的抽象概念。◆Spark比Hadoop更通用。Spark提供的數據集操作類型有很多種,不像Hadoop只提供了Map和Reduce兩種操作。比如map,filter,flatMap,sle,groupByKey,reduceByKey,union,join,cogroup,mapValues,sort,partionBy等多種操作類型,Spark把這些操作稱為Transformations。同時還提供Count,collect,reduce,lookup,save等多種actions操作。Spark的mllib支持機器學習。這些多種多樣的數據集操作類型,給給開發上層應用的用戶提供了方便。各個處理節點之間的通信模型不再像Hadoop那樣就是唯一的DataShuffle一種模式。用戶可以命名,物化,控制中間結果的存儲、分區等。可以說編程模型比Hadoop更靈活。不過由于RDD的特性,Spark不適用那種異步細粒度更新狀態的應用,例如web服務的存儲或者是增量的web爬蟲和索引。就是對于那種增量修改的應用模型不適合。◆容錯性。在分布式數據集計算時通過checkpoint來實現容錯,而checkpoint有兩種方式,一個是checkpointdata,一個是loggingtheupdates。用戶可以控制采用哪種方式來實現容錯。◆可用性。Spark通過提供豐富的Scala,Java,PythonAPI及交互式Shell來提高可用性。Spark與Hadoop的結合◆Spark可以直接對HDFS進行數據的讀寫,同樣支持SparkonYARN。Spark可以與MapReduce運行于同集群中,共享存儲資與計算,數據倉庫Shark實現上借用Hive,幾乎與Hive完全兼容。Spark的適用場景◆Spark是基于內存的迭代計算框架,適用于需要多次操作特定數據集的應用場合。需要反復操作的次數越多,所需讀取的數據量越大,受益越大,數據量小但是計算密集度較大的場合,受益就相對較小◆由于RDD的特性,Spark不適用那種異步細粒度更新狀態的應用,例如web服務的存儲或者是增量的web爬蟲和索引。就是對于那種增量修改的應用模型不適合。◆總的來說Spark的適用面比較廣泛且比較通用。3.3大數據存儲設計采用浪潮AS13000存儲大數據

,支持容量、性能的在線無限擴展,提供軟硬件故障情況下的數據重建、遠程容災功能,是適用于云計算、大數據業務并兼具高性能、高可靠、高可擴展、大容量特征的新一代存儲系統平臺,具有以下特點:。海量存儲,在線橫向擴展:1.控制器集群體系架構,所有控制器并行承擔數據IO、保障系統整體負載均衡,數據分散存儲,避免單控制器故障帶來的風險和性能的瓶頸,支持控制器在線橫向擴展,滿足持續增長的容量和性能需求。2.支持NAS/Object/IP-SAN/IB-SAN存儲接口,并且支持SAN、NAS、Object同時運行,滿足客戶在不同時間、不同地點、不同業務對存儲的不同需求,支持Windows、Linux、Unix等多種操作系統并存的復雜網絡環境中,輕松實現跨操作系統的數據存儲與共享,另外支持NFS/CIFS/FTP等多種文件共享協議。3.支持豐富的主機連接接口,支持1Gb/10GbiSCSI、40Gb/56GbInfiniBand主機連接,無縫接入用戶現有環境,滿足客戶對高帶寬及高性能的差異化需求。4.全面支持Flash/SSD/SAS/SATA各類常見存儲介質,模塊化的容量擴展模式,支持數據分級存儲,滿足各類型應用。數據持續保護,業務運行無憂:1.支持數據卷隔離映射功能、數據快照功能、快照回滾、遠程卷復制(同步/異步)、遠程數據復制及恢復、邏輯分區動態擴容。2.支持數據副本、數據糾刪碼、自動分層等多種數據冗余保護和性能加速功能,為用戶提供高級別的數據保護及容災功能。3.支持全集群Active-Active、Active-Standby、全局熱備等控制器工作模式,保障整體系統的高可用,確保數據存取及業務運行萬無一失。4.支持軟硬件故障時的數據自動修復,系統可用性達到99.999%。模塊化設計,人性化管理1.AS13000各主要部件均采用模塊化設計,客戶按需選擇,維護、升級、管理簡單方便:2.支持數據副本、全局熱備,以及自動構建RAID、各RAID級別間執行在線遷移不影響正常數據應用3.完備監控管理方式,當系統出現異常時,除了通過機器指示燈報警外,可通過郵件等方式將異常狀況及時通知管理員4.集中部署,統一管理綠色節能:1).全系統選取節能降耗的處理器、芯片組、風扇和散熱片等部件,提高系統的能效利用率。2).支持在線擴容/縮減時數據自動遷移,確保系統按需配置,同時支持Maid磁盤節能技術,降低磁盤能耗,節約開支。3).支持自動精簡技術,大大提高存儲資利用率。3.4安全設計一.采用浪潮SSR主機安全增強系統,這是一款基于操作系統內核層開發的安全加固軟件。與傳統的防火墻、IDS/IPS不同,SSR工作在最貼近用戶數據的操作系統層面,不僅可以避免外部的黑客攻擊,同樣可以預防來自內網攻擊的風險。該產品彌補了傳統信息安全解決方案在主機層安全的“短板”,與傳統信息安全產品形成了良好的互補,提升操作系統的安全級別,從而達到國家等級保護的三級要求。為客戶構建真正的安全長城。功能特性:1、強制訪問控制在操作系統內核層實現文件、注冊表、進程、服務、網絡等對象的強制訪問控制,可配置針對以上對象不同的訪問策略來保護系統和應用資,即使是系統管理員也不能破壞被保護的資。2、完整性檢測對文件和服務進行完整性檢測,并可設置定期檢測項目,當發現文件或者服務篡改時進行報警并發現哪些文件發生改變。3、防格式化保護功能開啟時,可防止病毒和入侵者惡意格式化磁盤,同時降低管理員意外格式化磁盤的風險。系統資監控與報警:對系統的CPU、內存、磁盤、網絡資進行監控,當這些資的使用狀況超過設置的閥值時將進行報警,以提前發現資不足、濫用等問題。4、雙因子認證和組合式密碼認證不僅提供SSR安全管理員和SSR審計官員的USBKEY+密碼的雙因子認證功能,還可對系統用戶配發USBKEY實現雙因子認證。對于遠程登陸和虛擬化系統而無法識別USBKEY的服務器,SSR提供可配置兩個密碼組合的登陸認證方式,只有掌握密碼的兩個人同時存在才能登陸系統,以此確保自然人的可信。5、自我保護SSR采用內核密封技術和完整性保護技術來保證SSR的文件不被惡意篡改,進程不被惡意注入。6、統一管理在一個SSR控制臺可以同時對多個平臺的SSR進行管理和維護,且SSR可開放接口給第三方管理平臺集成,實現與不同產品間管理的融合。7、靈活多樣的策略模板提供經過驗證的分等級的安全策略模板,全面保護系統,方便易用,降低用戶的使用難度。8、維護模式當用戶擔心自己配置的策略是否會影響系統和應用時,可開啟此功能,此時SSR將只記錄違規的日志而不進行阻止,便于管理員在不造成業務中斷的情況下調整策略。功能亮點:1、免疫病毒木馬,抵御黑客攻擊SSR采用的ROST技術對系統中的文件、注冊表、進程、網絡、服務、帳戶等多方面進行防護構建立體防護體系,從文件創建、執行、訪問資到結束層層把關,從根本上免疫各種已知未知病毒、后門等惡意代碼,抵御黑客的攻擊,確保系統和應用安全穩定運行。2、降低“零日漏洞”風險,延遲漏洞修復SSR采用強制訪問控制和白機制,只允許可信的帳戶和進程訪問被保護資,并對操作系統中重要二進制文件進行完整性保護。即使惡意代碼利用漏洞獲取了系統的權限,也不能破壞系統文件和植入木馬,降低了從“零日漏洞”發現到用戶打上補丁之間這段“真空期”的安全風險,同時允許用戶延遲補丁部署,推遲到定期修補周期進行修補。4、提升系統安全級別,增強用戶合規體驗SSR在操作系統內核層實現了安全標記和強制訪問控制機制,與用戶系統自身的自主訪問控制相融合,為系統和用戶重要應用提供更強的約束和更高的安全控制級別,同時提供三權分立、完整性校驗、雙因素認證、剩余信息保護等緊貼信息安全標準的功能,幫助用戶在系統安全建設時的合規要求。5、統一管理機制,化繁為簡管理員可以從任何地方通過雙因子身份認證后,對所有被保護的服務器進行安全策略制定和維護,實現集中管理,減少日常維護工作量。二.采用浪潮SSA安全應用交付硬件系統,特點是:1.豐富的應用負載均衡功能,保障數據中心應用可用性。支持豐富的四到七層應用負載均衡功能;支持針對多種算法的全局負載均衡;支持針對不同運營商多鏈路的負載均衡;支持豐富的健康檢查功能,保障后臺服務實時可用;可以實現N+1臺設備的集群、雙機熱備、雙機互備等多種高可用性部署模式;支持冗余電,最大化網絡運行時間,降低了系統宕機或網絡故障對業務的影響。2.多項應用加速技術,降低服務器負載,提升訪問速度,改善用戶體驗。采用內存緩存技術,有效降低服務器負載,并提升訪問響應速度。采用業界標準Gzip、Deflate壓縮算法,對文本類型資可實現80%以上的壓縮率,能降低服務器的壓力,提高帶寬的利用率。可對多個客戶端的TCP連接進行合并,通過少量的長連接與后臺服務器通信。SSL卸載功能,將加解密負荷卸載到應用交付設備上,有效降低服務器壓力,并保證用戶安全。3.強大的應用攻擊檢測和防御能力,應用與安全并重。內置多種DDOS監測算法,可有效防御4-7層DDOS、配合防止各類SQL注入、XSS、緩沖區溢出黑客攻擊,為客戶提供最佳的應用漏洞和未知威脅的防御能力。三.對管理員密碼進行嚴格管理,半年定期更換。四.網絡設備可以采用華為的產品,性價比高,行銷世界,可以抵御DDOS攻擊。五.對數據進行冗余存儲,以防不測,有問題可以及時恢復。3.5平臺搭建實施步驟1.搭建機房、供電、冷卻設備,購買服務器10臺(可以提供1000個4G內存的虛擬機)、存儲設備(2P)、云操作系統、安全軟件、路由器、交換機、防火墻等網絡設備,搭建云計算平臺,建立虛擬資池,設置虛擬機。2.制定遷移計劃,通過docker容器,打包把學校原有的應用系統遷移到虛擬機上,在另外的虛擬機上搭建hadoop、spark集群,安裝hive、hbase,根據需要建立hbase數據庫表和列,一張表可以有幾千列,幾十億條數據,把原有的所有數據庫合為一張表,便于大數據處理,原有數據庫的數據通過sqoop導入hbase。再把學校原有的服務器、存儲、網絡設備接入云平臺,進行虛擬化。3.根據需要,用spark對hbase數據進行準實時分析^p,用機器學習處理大數據進行預測,用storm對hbase數據進行實時分析^p、處理,還可對數據進行可視化。還可以基于云平臺開發應用系統。3.6物理架構設計模塊化數據中心采用一系列模塊化設計的動力設備,如一體化集成機柜系統、供配電系統、制冷系統、監控系統和綜合布線系統,高集成設計,通過簡單的接口將相關模塊進行組合,從而形成一個完整的數據中心。具有高密模塊化,高可靠性與安全性,快速靈活部署,簡單低耗,完善監控等特點。模塊化數據中心充分考慮組件設計、功能和相關性,按照在標準化級別與用戶靈活性之間取得最佳平衡的方式進行模塊化。例如,模塊化電系統在電、冗余模塊和運行時間方面均實現了可擴展性,可以根據當前的IT需求進行部署,并且考慮后續業務的擴展,這種系統規模優化能力顯著降低了總擁有成本。而且提供熱插拔,從而在不需要停止運行系統的條件下進行維護設備。單排密封通道的模塊化數據中心如下圖所示。模塊化數據中心整體架構,如下圖所示。模塊化設計為滿足不斷變化的IT需求提供了極大的靈活性。在安裝、升級、重新配置或移動模塊化系統時,獨立組件、標準接口既節省了時間又節約了費用。同時也方便設備的選型、采購、安裝、維護和擴容,降低整體運營成本,越來越具有吸引力。l模塊化數據中心特點模塊化數據中心集成方案具有高密模塊化,高可靠性和安全性,快速靈活部署,低成本和低能耗,完善的監控等特點,是新一代集成模塊化數據中心產品。1.高密模塊化l集成機柜系統、供配電系統、制冷系統、監控系統和綜合布線系統,高集成設計,提供完整的解決方案。l與云主機、桌面云業務無縫集成,提供端到端數據中心解決方案。2.快速靈活部署l工廠預制部件,現場快速組裝,部署靈活。l建設周期縮短50%以上,場地限制少。3.按需定制l采用模塊化的部件和統一的接口標準,可實現以機架為單位或以模塊。l為單位按需擴容,實現按需調度和動態調整網絡資,節省投資。4.智能管理l彈性IT平臺,全面的虛擬化能力,極大提升管理效率。l可通過多種傳感器,實現對數據中心內各功能模塊的不間斷監控。l應用智能化的運營管理平臺,可實現對數據中心基礎設施動力、環境、視頻、門禁全領域的遠程監控,統一管理、統一部署、統一監控和統一備份。5.低成本和低能耗l可以直接安裝在樓宇水泥地面上,無需專用數據中心,可減少外配套工程。l空調靠近設備提高送風效率;水平送風空調靠近熱,送風距離大大縮短,從而減少了距離導致的氣流壓力損失,冷空氣的泄漏損失,提高了冷量的利用效率。l供應周期短,快速交付,快速安裝,有效降低成本。第4章數據中心網絡方案組成根據業界企業數據中心網絡最佳設計實踐參考,結合新一代的業務現狀及發展趨勢,我們可以看到未來幾年內業務處于一個高速成長期,必須在本期網絡架構中充分考慮未來的可擴展性。網絡規劃如,通過防火墻接入Inter,通過策略允許云管理服務器與外網通訊;內網通過VLAN技術,即將每臺分析^p服務器與云管理服務器之間隔離,每臺分析^p服務器之間在內網不通訊.防火墻設計為保護數據的安全性,在云管理服務器接外網之間,架設一臺防火墻。通過防火墻的策略對云管理服務器進行保護。通過防火墻上制定策略,提高網絡的安全性。4.2.接入層設計接入層交換機采用千兆接入與每臺服務器通訊,各服務器之間采用VLAN將各服務器邏輯上網絡隔離,服務器之間不允許數據通訊,只允許分析^p服務器與云管理服務器通訊。4.3.網絡拓撲刀片服務器通過機架上的2個交換機連接到核心交換機,核心交換機通過防火墻連接路由器,路由器連接inter。2臺云管理服務器運行云操作系統,采用Haproxy形成冗余,對云中心進行管理,oracle、sqlserver數據庫通過交換機接入網絡,安全服務器、存儲也接入交換機。Mysql數據庫可以安裝在虛擬機上,oracle、sqlserver數據庫不能裝在虛擬機上,否則性能降低60%。通過在防火墻上制定策略,對云中心服務器進行過濾,保護云中心的服務器。第5章數據中心基礎設施方案組成根據模塊化數據中心建設的功率密度需要和機柜數量,設計1個10機柜模塊,便于快速建設、安全部署,模塊IT負載按80KW設計,制冷系統設計兩個40KW的行間空調。建議采用長×寬為800cm×800cm的空間,數據中心尺寸如下圖。圖:數據中心布局5.5.1.機柜系統設計數據中心:按項目需求,共10個IT設備機柜,設計10機柜模塊,單機柜功率密度8KW,采用封閉冷通道設計,室內制冷行間空調采用兩臺風冷型40KW行間空調,如下圖所示。機柜采用“面對面“的擺放方式不僅可以使數據中心看起來整潔,有利于工作人員觀察機柜內設備運作情況。同時,也可以提升機柜的通風散熱。機柜面對面的布局形成了冷風通道,機柜之間的冷熱風不會混合在一起,形成短路氣流,有效提到制冷效果,保護好冷通道不被破壞。采用兩臺面向排列的制冷系統,冷卻系統可以和成排的機架設備離得更近,每一排設備好像是有了專用空調一樣。通過將空調放置在IT機架之間,或者放在冷通道上方,氣流的通路會變得更短,風向也更加容易確定。氣流的冷卻能力更加容易預測,也就更容易達到更高的功率密度。此外,這樣的結構無須花費安裝地板提升系統的費用就可以實現。圖:模塊化設計圖機柜側視圖,配有單模塊監控、配電管理系統單元。圖:模塊側視圖:模塊化數據中心5.2.制冷系統設計配置2臺40KW600寬風冷型行間空調,安全可靠。1、直膨式行間空調工作原理2、直膨式行間空調室內機工作原理圖:室內機3、直膨式行間空調室內機、室外機連接示意圖圖:室內室外機安裝示意圖行間空調自帶變頻壓縮機,根據熱負荷智能調節壓縮機的輸出容量,并且在不同容量輸出段均保持較高的COP表現。行間空調按照行間部署方式設計,近熱制冷,支持封閉通道應用。精密空調監控系統以及電子膨脹閥的配合使用,保證了系統具備敏銳的機動性能,實時根據熱負荷的變化智能調節整機輸出冷量。在保證數據中心安全、穩定制冷的同時,為綠色數據中心節約每一度電。產品特征:變容量輸出壓縮機設計,保證最佳制冷效果并保持高COP值;EC-FAN和電子膨脹閥助力精密制冷調節;行間空調全部使用對大自然沒有破壞作用的環保冷媒;行間空調采用了壓縮機Pump-Down技術,在增強整機可靠性的同時延長了整機的使用壽命;提供可調節空調出風方向的冷風分配組件選配設計高顯熱比設計,減小冷凝水排出和加濕問題帶來的煩惱;提供加濕器選配設計;支持風冷和水冷兩種散熱冷卻模式;近熱制冷的行間空調風格設計,等機架尺寸設計與機架完美配合;支持封閉通道運用;支持常規回風溫度高達40℃的應用;CCU-A系列主要規格參數:ModelNameCCU-040AC-600制冷量*kW45壓縮機形式定頻渦旋壓縮機位置室內機側產品尺寸(寬*深*高,mm)600×1200×2000額定工況顯熱比100%最大輸入功率kW15風量m3/h8000風機形式EC-Fan膨脹閥熱力膨脹閥COP*3.2冷卻方式風冷室內外機連管長度30米室內外機安裝落差-5~20米供電形式交流供電,三相通信連接RS485ORTCP/IP濾網過濾G3冷卻介質R410A接口尺寸In:16mm,Out:22mm(冷凝器對接口,焊接)注:1、風冷機型標定工況:回風溫度35℃,25%相對濕度,室外溫度35℃;2、對于風冷冷卻型產品還需要配置一個風冷冷凝器作為室外側的散熱單元;支持性能、規格、尺寸定制。5.3.供配電系統設計模塊內自帶90KWHVDC、電池柜、列頭配電柜,模塊內服務器由市電及HVDC雙路供電。風冷空調由市電提供電。對供電要求:由大樓配電房引1路市電160A/3P輸入開關和1路帶發電機(或應急母排)160A/3P輸入開關進入模塊。圖:模塊化數據中心供配電系統設計選用杭州中恒HVDC系統。杭州中恒為互聯網、運營商HVDC產品第一品牌。配置15KW直流模塊6個,合計90kw(含充電功率10kw),組成HVDC系統。杭州中恒HVDC系統一套,包括:1、綜合配電屏1臺2、整流模塊:15kw*63、監控管理系統1套4、電池30min配置:20*C&;D12-150ALBT電池交流配電電池組1電池組2動力環境集中監控整流模塊直流配電列頭柜配電監控絕緣監測配電監控電池巡檢監控單元RS485RS485/232AC1AC2中恒HVDC產品介紹:1、拓撲簡潔、模塊化設計。2、電網適應能力323Vac~475Vac滿功率輸出,在250Vac~323Vac之間限功率輸出。3、整流器采用先進的LLC串聯諧振變換器,并申請專利保護,相關專利請查看附件HVDC專利以及軟件著作權(7項專利,1項軟件著作權)。4、ZHR24015K整流模塊,無中線輸入,功率因數0.99。滿載THDi2.5%,50%負載為94.8%效率,100%負載下95.6%,具備完善的休眠、喚醒功能。5、高效節能:50%負載效率為95.6%,100%負載為95.2%電池健康管理系統模塊的HVDC與電池,與服務器直接并柜,電池的安全可靠性是第一要求。領先的電池健康管理系統,實時在線監控管理每一個電池的電壓、內阻、極柱溫度、組電流等參數,確保電池的安全,包括過溫、短路、火災等惡性事故的預付等。電池監控系統的組成:l電池傳感器每一塊電池配置一個獨立的電池傳感器,實現單體電壓、單體溫度的實時在線檢測。并在監控主機配合下,檢測電池單體內阻。電池傳感器之間采用串口總線式通信方式,線纜為RJ45,實現手拉手式通信連接。電池傳感器絕不從電池取電,確保任何意外情況下電池安全。蓄電池健康管理監控主機監控主機與每一個單體電池的電池傳感器通信,實現對于電池的單體電壓、單體內阻、單體溫度、電池組電流及環境溫度的實時監測。根據測試蓄電池的種類不同數據采集模塊可分為2V、6V和12V模塊。每個模塊為標準19英寸1U的外形尺寸設計。每個模塊最多能夠連接48只蓄電池,支持48只串聯蓄電池或2組24只蓄電池監測。多個檢測模塊可以通過RS485接口進行連接,通過網絡擴展滿足各種蓄電池配置的要求。5.4.模塊監控系統設計模塊監控管理系統有效的解決數據中心運維多專業、高實時性等多方面要求,并形成統一的監控管理平臺,對數據中心模塊進行全面、有效、實時監控,監控項包括:智能電量儀監控、ATS監控、綜合配電系統監控、高壓直流系統監控、電池監測儀監控、UPS監控、空調監控、環境溫濕度監控、漏水監控、壓差監控、極早期系統監控、消防系統監控、門禁系統監控、視頻系統監控等。系統采用模塊嵌入式服務器MDU,并在該服務器的基礎上建立了TCP/IP監控平臺,可極其方便地為現場設備管理和環境監控提供一體化的解決方案,不但大大簡化了現場設備的監控,降低了監控設備投入成本,而且有效地提高了整個系統的穩定性和安全性,適用各模塊化數據中心的集中監控。實現對各系統7×24×365小時的統一監控與管理,極大地減輕了數據中心維護人員工作負擔,同時又大大提高了整個系統運行的可靠性、穩定性和兼容性、可擴性,實現了數據中心的科學管理,真正使“無人值守”模塊化數據中心成為現實。圖:軟件結構1、部署架構圖:系統部署圖:MDU監控主機與傳感器模塊智能監控管理系統由底層的被監控設備、MDU嵌入式采集終端、集中管理平臺組成。嵌入式主機將現場設備的各種信息進行實時處理、分析^p、輸出,或將控制命令發往前端設備的智能模塊,同時將信息上傳至集中管理平臺。嵌入式主機具備本地存儲、脫網運行、獨立報警能力,可避免網絡故障導致的系統非正常運行,并具有強大的集成功能。模塊化數據中心中的MDU嵌入式主機采集數據并對數據進行分析^p、上傳,協助完成各種統計報表,并在監控中心的集中管理平臺上實現各種高端管理應用,如集中監控管理、報表事件集中管理、告警過濾等功能,系統提供網頁瀏覽(B/S架構),其中B/S架構能輕易支持100個以上客戶端接入。在監控平臺上實現各數據中心的數據管理、信息查詢管理、報表管理、報警管理、日志管理、聯動控制管理、安全管理等功能。2、監控內容本次模塊智能監控系統包括但不限于以下各項:智能電量儀監控、ATS監控、綜合配電系統監控、高壓直流系統監控、電池監測儀監控、精密空調監控、環境溫濕度監控、漏水監控、壓差監控、極早期系統監控、消防系統監控、門禁系統監控、視頻系統監控。各系統監控內容包括但不限于以下各項:(1)智能電量儀:監測模塊市電和IT總負載電壓、電流、電量等參數,精度要求滿足±1%。(2)ATS:監測主備路電壓、頻率、主備切換開關狀態等參數。(3)綜合配電柜:監測輸入電壓、輸入電流、各交流支路電流、各交流支路空開狀態、各直流支路電流、各直流支路空開狀態等參數。(4)高壓直流系統:監測系統電壓、總負載、電池狀態、交流輸入電壓、交流輸入電流、交流輸入頻率、整流模塊輸出電壓、整流模塊輸出電流、直流輸出電壓、直流輸出電流、欠壓保護開關狀態等。(5)電池監控:需配備專用電池健康管理,監測電池單體電壓、單體內阻、電池單體溫度、電池總電壓、充放電電流等。(6)精密空調:監測送風溫濕度、回風溫濕度、啟停狀態、壓縮機故障、濾網狀態、回風高溫告警、高濕告警、異常掉電、冷

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論