




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 基于云平臺的數(shù)據(jù)儲存與文件管理研究 辛躍華摘 要 當前數(shù)字信息和互聯(lián)網(wǎng)技術快速發(fā)展,基于互聯(lián)網(wǎng)的應用和服務層出不窮,隨之而來的是,網(wǎng)絡之間需要處理的數(shù)據(jù)也是呈現(xiàn)出幾何倍數(shù)增長。對大量數(shù)字信息和服務數(shù)據(jù)給予及時處理,并且向用戶提供安全有效的網(wǎng)絡服務,變得極為關鍵。隨著云計算的出現(xiàn),為數(shù)據(jù)的處理方式提供了有效的方案,利用虛擬機、網(wǎng)絡資源池、共享存儲存儲器等技術,用戶可以便捷的進行應用的遷移和擴展,進而使得傳統(tǒng)的pc機作為處理模式的方式逐漸被淘汰。不過伴隨著云計算的逐漸使用,如何獲得高效率、低成本的存儲空間與管理云端大數(shù)據(jù)逐漸成為很多研究人員關注
2、的熱點問題,這需要具有良好的云端平臺以及優(yōu)化的數(shù)據(jù)庫結構、處理模式設計。關鍵詞 數(shù)字信息 云計算 數(shù)據(jù)庫:tp311.52 :a doi:10.16400/ki.kjdks.2016.10.024abstract the digital information technology and the internet have rapid development, the use of the internet to is used to provide service to all kinds. at the same time, the network between the need to
3、 deal with the data is also showing a geometric ratio growth. for a large number of service information and data to give treatment, and to provide users with safe and effective network services, has become extremely critical. with the advent of cloud computing, making for processing of these data fo
4、r the effective solution to provide its proposed use of fast and convenient internet technology and has a high security data storage technology, which makes the traditional pc as a way of processing mode is gradually phased out. but with the growing use of cloud computing, to obtain high efficiency
5、and low cost of storage and management of a cloud of data gradually become a lot of enterprises and researchers have paid attention to the problem, which need to have good cloud platform and database structure, and the process model of the design.keywords digital information; cloud computing; databa
6、se0 引言在信息化快速發(fā)展的今天,互聯(lián)網(wǎng)內部的數(shù)據(jù)越來越多,其服務的種類也是越來越多,伴隨著數(shù)字技術和智能終端技術的進步,以及網(wǎng)絡帶寬的擴展,網(wǎng)絡通訊量爆炸式增長,給互聯(lián)網(wǎng)系統(tǒng)帶來嚴重負擔。目前存在一個問題,即在互聯(lián)網(wǎng)內部系統(tǒng)資源利用效率不高,一些應用需要大量的計算與儲存資源,而另外一些系統(tǒng)的資源大部分處于空閑狀態(tài)。對這些問題,解決的要點是實現(xiàn)資源與計算能力的虛擬化,解決海量數(shù)據(jù)的管理和存儲,通過分布式共享機制提升服務質量。云計算自提出以來,受到了業(yè)界的普遍關注,很大程度上改變了整個it技術發(fā)展的方向。云計算是一種全新的計算方式,基于網(wǎng)絡基礎架構的虛擬化,使之具有安全可靠的數(shù)據(jù)存儲與處理能力
7、,進而使得傳統(tǒng)的pc作為基礎的信息處理模式發(fā)生了很大變化。因為云計算技術具有分布式、可擴展、高性能、高可靠等優(yōu)勢,較以往以數(shù)據(jù)庫為中心的計算模式,具有很好的發(fā)展?jié)摿εc優(yōu)越的性能。伴隨著企業(yè)信息化的不斷發(fā)展,大部分數(shù)據(jù)開始在網(wǎng)絡上多個節(jié)點中分散存儲,網(wǎng)絡間對這些數(shù)據(jù)的快速傳播逐漸成為人們越來越關注的問題。由于云計算逐步廣泛應用,對這些數(shù)據(jù)的管理以及存儲如何實現(xiàn)快速和較低成本,也是人們關注與研究的熱點問題。特別是針對那些對云計算有著專門研究的相關機構,其首先要解決的問題就是要擺脫傳統(tǒng)的存儲模式,其原因就是大量的新增數(shù)據(jù)出現(xiàn),那些舊的存儲方式以及信息處理模式已經無法為新的業(yè)務和計算流程提供服務。針對
8、上述問題,本文設計一種新的數(shù)據(jù)存儲解決方案,能夠利用云計算技術,以及文件虛擬化管理模式,為面向爆炸式增長的數(shù)據(jù)提供快速訪問和讀寫服務。1云計算平臺中數(shù)據(jù)存儲方式1.1數(shù)據(jù)模型存在于云計算平臺的大部分數(shù)據(jù)都屬于半結構化數(shù)據(jù)或是結構化數(shù)據(jù),利用分布式數(shù)據(jù)庫管理保存這些數(shù)據(jù)。分布式數(shù)據(jù)庫必須為每個數(shù)據(jù)集建立一個稀疏的、長期儲存的、多維度的映射表格。用戶將數(shù)據(jù)存儲在表格內部,在每一行里面都含有一個排序的主鍵以及任意多個數(shù)列。不過因為稀疏程度不同,在一張表格的內部每行數(shù)據(jù)都是不同列進行排列。例如對名字的格式定義為<族>和<標簽>,利用的都是字符串的基本結構模式,每一張數(shù)據(jù)表格都是
9、具有一個合集,這樣合集模式不會改變,等同于關系表基本關系結構模型。但是label數(shù)值對所有行都能夠進行有效變更,通過改變表面結構來實現(xiàn)有關變化。 針對分布式數(shù)據(jù)庫來說,每一個關系表都擁有一個目錄,其對應的表數(shù)據(jù)文件都存儲在該目錄下,對文件的操作都屬于數(shù)據(jù)庫內部封閉操作,即我們能夠將每一行當作是一個原子元素,對所有元素都能夠實施加鎖。在更新每一個關系表的時候要標記好更新時間。在更新數(shù)據(jù)后會進行新版本的獲取,同時在數(shù)據(jù)內部還會留有原來版本,這樣的數(shù)值就是能夠以時間為依據(jù)來開始有關設置,比如說針對兩個最新的版本,或者就是要對近四天的版本進行保存。在客戶端能夠對距離某時間最近的版本進行選擇利用,或是對
10、所有版本進行一次獲取。如圖1所示,每一行的主鍵名是一個反向url,例如.wanfangdata.g,在基本陣列族存放網(wǎng)頁內容,錨點列族存放網(wǎng)頁鏈接文本,例如wanfangdata的主頁被企業(yè)信息網(wǎng)(http:/)的主頁所利用,因為該行含有名叫做“錨點:”的列。對于每一個錨鏈只具有一個版本,利用的標記裝置為時間戳,比如具有t9以及t8等,但是對于內容表項,具有的版本可以多項化,例如圖1中劃分了三個時間戳,標記為t3、t5以及t6。1.2分布式數(shù)據(jù)庫體系結構在服務器所具備的體系結構中,需要以主從服務器具備的基本結構為依據(jù),借助于服務器節(jié)點集群的資源,并通過master來管理操作分布式數(shù)據(jù)庫。節(jié)點服
11、務器所具備的主要功能是節(jié)點訪問模式,對于內部slave服務器節(jié)點,在主master服務器內會將這些節(jié)點進行同時注冊。此時若是主服務器出現(xiàn)故障,則會導致整個系統(tǒng)癱瘓,我們采用雙備份冗余機制來避免此類問題的發(fā)生。由主master服務器切換到從master服務器,并獲取slave服務器列表。節(jié)點同主服務器的關系保存在節(jié)點內部,其他類型節(jié)點被分配到不同服務器中。同時依據(jù)數(shù)據(jù)列表含有的特征函數(shù),主服務器需要時刻感知節(jié)點所在位置,用戶可以在自己的客戶端上獲得相關節(jié)點的元數(shù)據(jù)信息和具體位置信息。云計算的數(shù)據(jù)表格與傳統(tǒng)關系數(shù)據(jù)庫存在非常大的不同,云計算屬于稀疏分布類型,其中存在的映射和排序非常多,而傳統(tǒng)關系數(shù)
12、據(jù)庫則相反。所有以模式為基礎的映射數(shù)據(jù)庫僅能夠進行鍵-數(shù)據(jù)的映射模式的表示,這對數(shù)據(jù)庫的結構進行了極大簡化。2數(shù)據(jù)的處理結構在文件分布式存儲問題上面,利用并行數(shù)據(jù)處理引擎mapreduce軟件可以很好的解決這類問題,其可以對海量數(shù)據(jù)給予非常好的處理,并且根據(jù)編程模式,能夠有效處理大規(guī)模數(shù)據(jù)的并行運算過程。這種處理模式有著非常多的優(yōu)點:首先就是對容錯、并行處理模式的封裝,并且針對計算進行本地化的處理,使得那些比較小的節(jié)點也是可以獲得均衡的負載,同時在外部還具有強大功能的數(shù)據(jù)接口。然后就是擁有良好的通用性。最終使其能夠對很多不同問題給予有效解決。mapreduce實現(xiàn)的機制如圖2所示。mapred
13、uce的主要處理流程包括以下操作。其一是分割,首先把輸入文件切分成若干小份,數(shù)據(jù)塊大小為16m-4mb不等,其可以通過用戶設定的參數(shù)來獲得,集群能夠對有關操作進行實現(xiàn),啟動集群內部大部分任務。第二就是能夠借助于map/reduce來對有關任務進行初始化并執(zhí)行,在大部分執(zhí)行程序中來進行管理主控程序的主機,其他部分中存在的工作機都是通過制定的模式完成的。對于主控程序來說,主要任務就是指派空閑的工作機來完成相關任務。其三為對程序的讀取,對于指派的map任務來說讀取相關數(shù)據(jù),在輸入數(shù)據(jù)內部獲得相關的數(shù)值,這些數(shù)值被用戶定義的map函數(shù)處理之后被轉存到緩存區(qū)域。其四為本地寫入,針對向內存進行緩存的中間鍵
14、值會以函數(shù)存在的周期特點為依據(jù),分別放入r個不同區(qū)域,并且在本地磁盤之中進行寫入。第五為在遠端讀取,對于執(zhí)行規(guī)約任務的工作機被通知這些鍵數(shù)值具體的位置之后,可以利用遠程控制的模式來獲得map任務工作機里面具有的本地緩存的數(shù)據(jù)。第六位對文件數(shù)據(jù)給予傳輸,對reduce工作的判別是通過其所有的中間數(shù)據(jù)來實現(xiàn)的,該中間數(shù)據(jù)借助于唯一一個中間關鍵字來同其所發(fā)送的關鍵字進行對應,并通過中間數(shù)值為reduce函數(shù)進行定義。在完成reduce任務以及map任務后,在管理機構會執(zhí)行有關程序,并向程序使用起點進行返回,接著開展前面的程序操作。3.云存儲平臺的數(shù)據(jù)庫設計3.1系統(tǒng)基本結構依據(jù)云計算系統(tǒng)具有的基本結
15、構,本文設計的云存儲平臺主要功能模塊以及基本結構如圖3所示。在這個結構里面,管理節(jié)點對所有子節(jié)點和用戶端關鍵信息進行存儲,主要包括文件塊信息、文件目標還有系統(tǒng)的元數(shù)據(jù)。客戶端發(fā)出對文件元數(shù)據(jù)的讀寫請求,管理節(jié)點接收到該指令后,會以請求的信息為依據(jù)讀取客戶端的數(shù)據(jù)信息并返回。在客戶端獲取到源文件數(shù)據(jù)后,便能夠在子節(jié)點連接所需數(shù)據(jù),來實現(xiàn)數(shù)據(jù)的輸入和輸出,同時其還能對子節(jié)點以及節(jié)點間的聯(lián)系進行管理,保持暢通,在對數(shù)據(jù)進行輸入時,管理節(jié)點能夠借助于操作指令來降低子節(jié)點的資源占用率,子節(jié)點會向管理節(jié)點進行變更信息的返回。對于文件的存儲組織模塊,利用的基本單元是數(shù)據(jù)塊。一個文件可以具有很多的塊,在每一個
16、塊里面僅可對一個文件內容給予有效存儲,文件大小是64m。該種選擇存在很多優(yōu)勢:首先可以減少訪問量,進而使得客戶端與管理節(jié)點之間的交互大大減少,同時如果用戶需要對同一個文件塊進行讀寫操作的時候只需要向客戶端管理節(jié)點提出請求,就可以完成相關的操作。其次,能夠有效降低網(wǎng)絡內部消化,能夠在對大文件持續(xù)訪問時,借助于保持節(jié)點數(shù)據(jù)tcp長連接來對網(wǎng)絡開銷給以有效降低,最終使得管理節(jié)點的管理得以減少。3.2云計算中文件分布式存儲流程在實現(xiàn)命令數(shù)據(jù)以及信息數(shù)據(jù)的傳輸?shù)臅r候是要借助不同計算機進行的。命令數(shù)據(jù)的cmd作用主要就是有效管理節(jié)點以及子節(jié)點,借助于命令數(shù)據(jù)對其需要實現(xiàn)的任務進行判斷。信息數(shù)據(jù)系統(tǒng)可對每一
17、個任務實現(xiàn)數(shù)據(jù)的拷貝,比如對文件信息部分以及具有的信息功能進行相關的描述,不過這些數(shù)據(jù)一般具有比較大的數(shù)據(jù)量。我們通過將計算遷移到存儲的方式,降低傳輸壓力,在系統(tǒng)中用戶文件數(shù)據(jù)的傳出是非常少的,這極大的提高了系統(tǒng)的運行效率。在進行文件的存儲的時候,系統(tǒng)應該先借助于客戶端同管理節(jié)點的連接對其含有的root.dat文件來說通過數(shù)據(jù)模式來讀取,提供給用戶的是有效節(jié)點位置的ip地址信息。在利用node.dat文件來獲得相關的位置信息,由于管理節(jié)點對子節(jié)點的ip地址列表來獲得相關的信息,利用上面具有的信息對多線程的數(shù)據(jù)進行啟動與連接等活動,同時還可以對這些數(shù)據(jù)進行分別存儲,最后最終對username表進
18、行更新以此來在訪問過程中進行文件分布狀況的重新獲取。在某個節(jié)點上進行username文件的存儲,管理節(jié)點便以現(xiàn)存username文件的分布狀況為依據(jù),將節(jié)點的ip地址分配給用戶來進行username文件的存放,文件名便成為用戶的用戶名,因為系統(tǒng)中用戶名具備唯一特性,因此所有的username都是唯一的,具體見圖4。在圖4中,主要借助消息傳遞機制,利用基礎函數(shù)接口對mpi程序進行描述來完成為文件的并行寫入和分割,mpi程序能夠快速獲取機器名和進程標志,并對比較阻塞的信息進行傳遞,實現(xiàn)復雜數(shù)據(jù)結構的傳遞,以此來有效實現(xiàn)map/reduce并行計算功能。4 結束語本文針對在云計算環(huán)境下存在的文件管理以及數(shù)據(jù)存儲的安全模式進行深入研究,在對云計算服務進行有效利用的基礎上,對其優(yōu)勢:高性能和低成本以及彈性計算和存儲能力給予充分發(fā)揮,使得云計算平臺中存在的成本較低和高速的數(shù)據(jù)存儲問題進行有效解決,針對存在的云儲存問題提出了一種靈活的解決方案。參考文獻1 王德文. 基于云計算的電力數(shù)據(jù)中心基礎架構及其關鍵技術j. 電力系統(tǒng)自動化,2012,v.36;no.48911:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 無人機飛行途中常見問題試題及答案
- 滅火器配置標準試題及答案
- 消防演習策劃中的關鍵要素試題及答案
- 持續(xù)進步的入團考試學習試題及答案要點
- 財務分析與決策支持系統(tǒng)試題及答案
- 高級審計師考試成功案例試題及答案解析
- 高級審計師考試各大科目試摘要試題及答案
- 護理職業(yè)心理調適試題及答案
- 適航性及設備檢查的知識考題及答案
- 【熔化焊接與熱切割】考試題及答案
- GB/T 45501-2025工業(yè)機器人三維視覺引導系統(tǒng)通用技術要求
- 2025年武漢數(shù)學四調試題及答案
- GB 19081-2025飼料加工系統(tǒng)粉塵防爆安全規(guī)范
- 2024年云南省初中學業(yè)水平考試地理試卷含答案
- 2024年全國高中數(shù)學聯(lián)賽北京賽區(qū)預賽一試試題(解析版)
- 培訓課件 -溝通的方法 -溝通訓練營 脫不花
- 腰椎ODI評分完整版
- 工廠如何消除靜電與防止靜電實踐篇
- 我學會了洗碗作文
- 武漢市住宅專項維修資金使用申請表
- 霍尼韋爾x溫控儀中文說明書——有程序設定篇
評論
0/150
提交評論