




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)冗余存儲(chǔ)2學(xué)習(xí)任務(wù)初步了解HDFS數(shù)據(jù)冗余存儲(chǔ)熟悉HDFS數(shù)據(jù)存儲(chǔ)的優(yōu)缺點(diǎn)3知識(shí)目標(biāo)什么是數(shù)據(jù)冗余存儲(chǔ)結(jié)合HDFS說明數(shù)據(jù)冗余存儲(chǔ)了解HDFS數(shù)據(jù)存儲(chǔ)的優(yōu)缺點(diǎn)01能力目標(biāo)能夠掌握數(shù)據(jù)冗余存儲(chǔ)的基本概念針對(duì)HDFS存儲(chǔ)優(yōu)缺點(diǎn)加深理解02學(xué)習(xí)目標(biāo)4目錄01數(shù)據(jù)冗余簡(jiǎn)介02HDFS的數(shù)據(jù)冗余存儲(chǔ)簡(jiǎn)介03HDFS數(shù)據(jù)存儲(chǔ)優(yōu)點(diǎn)04HDFS數(shù)據(jù)存儲(chǔ)缺點(diǎn)5數(shù)據(jù)冗余簡(jiǎn)介數(shù)據(jù)冗余是指數(shù)據(jù)之間的重復(fù),也可以說是同一數(shù)據(jù)存儲(chǔ)在不同數(shù)據(jù)文件中的現(xiàn)象。可以說增加數(shù)據(jù)的獨(dú)立性和減少數(shù)據(jù)冗余是企業(yè)范圍信息資源管理和大規(guī)模信息系統(tǒng)獲得成功的前提條件。6HDFS的數(shù)據(jù)冗余存儲(chǔ)簡(jiǎn)介HDFS是一種高度分布的多層次結(jié)構(gòu)布局。典型的HDFS集群是由數(shù)百個(gè)服務(wù)器被同時(shí)部署在同一個(gè)集群之中,并且可以同時(shí)被來自同一或者不同地點(diǎn)的多個(gè)客戶機(jī)進(jìn)行訪問。概述7HDFS的數(shù)據(jù)冗余存儲(chǔ)簡(jiǎn)介為了實(shí)現(xiàn)這兩個(gè)目的,僅僅在多臺(tái)機(jī)器上進(jìn)行單一存儲(chǔ)是不夠的,并不能預(yù)防硬件設(shè)備失誤帶來的損失。因此而采用的是多副本存儲(chǔ)復(fù)制。概述8HDFS數(shù)據(jù)存儲(chǔ)優(yōu)點(diǎn)數(shù)據(jù)自動(dòng)保存多個(gè)副本。它通過增加副本的形式,提高容錯(cuò)性。某一個(gè)副本丟失以后,可以自動(dòng)恢復(fù),這是由HDFS內(nèi)部機(jī)制實(shí)現(xiàn)的,我們不必關(guān)心。高容錯(cuò)性9HDFS數(shù)據(jù)存儲(chǔ)優(yōu)點(diǎn)它是通過移動(dòng)計(jì)算而不是移動(dòng)數(shù)據(jù)。它會(huì)把數(shù)據(jù)位置暴露給計(jì)算框架。適合批處理10HDFS數(shù)據(jù)存儲(chǔ)優(yōu)點(diǎn)數(shù)據(jù)規(guī)模:能夠處理數(shù)據(jù)規(guī)模達(dá)到
GB、TB、甚至PB級(jí)別的數(shù)據(jù)。文件規(guī)模:能夠處理百萬(wàn)規(guī)模以上的文件數(shù)量,數(shù)量相當(dāng)之大。節(jié)點(diǎn)規(guī)模:能夠處理10K節(jié)點(diǎn)的規(guī)模。適合大數(shù)據(jù)處理11HDFS數(shù)據(jù)存儲(chǔ)優(yōu)點(diǎn)一次寫入,多次讀取,不能修改,只能追加。它能保證數(shù)據(jù)的一致性。流式數(shù)據(jù)訪問12HDFS數(shù)據(jù)存儲(chǔ)優(yōu)點(diǎn)它通過多副本機(jī)制,提高可靠性。它提供了容錯(cuò)和恢復(fù)機(jī)制。比如某一個(gè)副本丟失,可以通過其它副本來恢復(fù)。可構(gòu)建在廉價(jià)機(jī)器上13HDFS數(shù)據(jù)存儲(chǔ)缺點(diǎn)比如毫秒級(jí)的來存儲(chǔ)數(shù)據(jù),這是不行的,它做不到。它適合高吞吐率的場(chǎng)景,就是在某一時(shí)間內(nèi)寫入大量的數(shù)據(jù)。但是它在低延時(shí)的情況下是不行的,比如毫秒級(jí)以內(nèi)讀取數(shù)據(jù),這樣它是很難做到的。不適合低延時(shí)數(shù)據(jù)訪問14HDFS數(shù)據(jù)存儲(chǔ)缺點(diǎn)存儲(chǔ)大量小文件的話,它會(huì)占用NameNode大量的內(nèi)存來存儲(chǔ)文件、目錄和塊信息。這樣是不可取的,因?yàn)镹ameNode的內(nèi)存總是有限的。小文件存儲(chǔ)的尋道時(shí)間會(huì)超過讀取時(shí)間,它違反了HDFS的設(shè)計(jì)目標(biāo)。無(wú)法高效的對(duì)大量小文件進(jìn)行存儲(chǔ)15HDFS數(shù)據(jù)存儲(chǔ)缺點(diǎn)一個(gè)文件只能有一個(gè)寫,不允許多個(gè)線程同時(shí)寫。僅支持?jǐn)?shù)據(jù)
append(追加),不支持文件的隨機(jī)修
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 第四章液體洗滌劑28課件
- 第三節(jié)組合體本節(jié)主要內(nèi)容17課件
- 廢舊電池危害教學(xué)課件
- 口腔科消毒隔離管理課件
- 口腔禮儀知識(shí)培訓(xùn)課件
- 小學(xué)生種植豆芽課件
- 2025年小學(xué)語(yǔ)文課程標(biāo)準(zhǔn)考試測(cè)試卷及參考答案
- 建筑農(nóng)民工權(quán)益保障2025年行業(yè)規(guī)范與新型用工模式創(chuàng)新策略
- 2025年教育質(zhì)量評(píng)估與認(rèn)證體系教育質(zhì)量評(píng)價(jià)體系應(yīng)用研究報(bào)告
- 2025年公共衛(wèi)生應(yīng)急資金申請(qǐng)項(xiàng)目執(zhí)行監(jiān)控報(bào)告
- 《實(shí)驗(yàn)室應(yīng)急預(yù)案》專題培訓(xùn)
- 技術(shù)、售后服務(wù)計(jì)劃及質(zhì)量保障措施
- 保山隆陽(yáng)區(qū)小升初數(shù)學(xué)試卷
- 工程消防資料承包合同范本
- 急性腎功能不全護(hù)理查房
- 《水利水電工程可行性研究報(bào)告編制規(guī)程》
- 2024版住建部二手房買賣合同范本
- 儀表工線路培訓(xùn)
- 2024年初升高數(shù)學(xué)銜接教材講義
- 鐵路技術(shù)規(guī)章:018鐵路軍事運(yùn)輸管理辦法
- 農(nóng)行反洗錢培訓(xùn)
評(píng)論
0/150
提交評(píng)論