Hadoop期末復習題庫_第1頁
Hadoop期末復習題庫_第2頁
Hadoop期末復習題庫_第3頁
Hadoop期末復習題庫_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

一、選擇題(可能是單選可能是不定選擇題)

一個M叩Reduce程序中的MapTask的個數由什么決定?(c)

A、輸入的總文件數

B、客戶端程序設置的mapTask的個數

C、FilelnputFormat.getSplits(JobContextjob)計算出的邏輯切片的數量

D、輸入的總文件大小/數據塊大小

關于SecondaryNameNode哪項是正確的?(c)

A.它是NameNode的熱備

B.它對內存沒有要求

C.它的目的是幫助NameNode合并編輯日志,減少NameNode啟動時間

I).SecondaryNameNode應與NameNode部署到一個節點

HBase中的批量加載底層使用(a)實現。

A、MapReduce

B、Hive

C、Coprocessor

D、BloomFilter

DFS檢查點(Checkpoint)的作用是可以減少下面哪個組件的啟動時間?(b)

A.SecondaryNameNodeB.NameNodeC.DataNodeI).JournalNode

如下哪一個命令可以幫助你知道shell命令的用法(c)o

A、man

B、pwd

C、help

D、more

解壓.tar.gz結尾的HBase壓縮包使用的Linux命令是(a)。

A、tar-zxvf

B、tar-zx

C>tar-s

D、tar-nf

YARNWeb界面默認占用哪個端口?(b)

A、50070

B、8088

C、50090

D、9000

Flume的Agent包含以下那些組件?(ac)

A.Source

B.ZNode

C.Channel

D.Sink

面描述HBase的Region的內部結構不正確的是?(d)

A.每個Storerfl一個MemStore和0至多個StoreFile組成

B.Region由一個或者多個Store組成

C.MemStore存儲在內存中,StoreFile存儲在HDFS

D.每個Store保存一個Co1umn

關于HDFS集群中的DataNodc的描述正確的是?(bed)

A.一個DataNode上存儲一個數據塊的多個副本

B.存儲客戶端上傳的數據的數據塊

C.響應客戶端的所有讀寫數據請求,為客戶端的存儲和讀取數據提供支撐

D.當Datanode讀取數據塊的時候,會計算它的校驗和(checksum),如果計算后的校驗和,

與數據塊創建時值不一樣,說明該數據塊已經損壞

下面關于使用Hive的描述中正確的是?(bd)

A.Hive支持數據刪除和修改

B.Hive中的join查詢只支持等值鏈接,不支持非等值連接

C.Hive中的join查詢支持左外連接,不支持右外連接

【).Hive默認倉庫路徑為/user/hive/warehouse/

HDFS的NameNode負責管理文件系統的命名空間,將所有的文件和文件夾的元數據保存在

一個文件系統樹中,這些信息也會在硬盤上保存成以下文件:()。

A、日志

B、命名空間鏡像

C、兩者都是

D、兩者都不是

HDFS的是基于流數據模式訪問和處理超大文件的需求而開發的,默認的最基本的存儲單位

是64M,具有高容錯、高可靠性、高可擴展性、高吞吐率等特征,適合的讀寫任務是(c)0

A、一次寫入,少次讀寫

B、多次寫入,少次讀寫

C、一次寫入,多次讀寫

D、多次寫入,多次讀寫

以下關于ZooKeeper的描述,哪個是正確的?(abed)

A.ZooKeeper采用Zab協議來實現消息傳輸的一致性

B.ZooKeeper節點可以向Leader同步最新數據

C.ZooKeeper采用樹形層次結構的數據模型

D.ZooKeeper中的數據節點分為臨時節點和永久節點

關于HDFS的文件寫入,正確的是(c)a

A、支持多用戶對同一文件的寫操作

B、用戶可以在文件任意位置進行修改

C、默認將文件塊復制成三份存放

D、復制的文件塊默認都存在同一機架上

Flume的Agent包含以下那些組件?(acd)

A.Source

B.ZNode

C.Channel

D.Sink

HDFS集群中的NameNode職責包括?(abc)

A、維護HDFS集群的目錄樹結構

B、維護HDFS集群的所有數據塊的分布、副本數和負載均衡

C、響應客戶端的所有讀寫數據請求

D、負責保存客戶端上傳的數據

YARN中,任務進度監控是向哪個組件匯報的?(c)

A.ResourceManager

B.NodeManager

C.ApplicationMaster

I).Container

有關MapReduce的輸入輸出,說法錯誤的是(b)。

A、鏈接多個MapReduce作業時,序列文件是首選格式

B.FilelnputFormat中實現的getSplits()可以把輸入數據劃分為分片,分片數目和大小任意

定義

C、想完全禁止輸出,可以使用NullOutputFormat

D、每個reduce需將它的輸出寫入自己的文件中,輸出無需分片

下列哪些說法是正確的?':)

A.Hadoop適合數據的隨機讀寫。

B.Hadoop的數據塊大小(BlockSize)是不可以修改的。

C.Hadoop集群默認沒有嚴格的權限管理和安全措施保障。

D.因為IIDFS有多個副本,所以NameNode是不存在單點問題的。

MapReduce更擅長:(a)

A.離線計算

B.實時計算

C.流式計算

I).DAG(有向圖)計算

MapReduce編程模型中以下組件哪個是最后執行的?(c)

A.Mapper

B.Partitioner

C.Reducer

D.RecordReader

關于Flume與Sqoop的描述正確的是:()

A.Flume用于實時采集日志,一般用于實時計算

B.Sqoop主要采集關系型數據庫中數據,常用于離線計算批量處理

C.Sqoop腳本最終會變成提交到YARN上的一個個map任務

D.Sqoop只支持從關系型數據庫導入到IIDFS,不支持從IIDFS導入到關系型數據庫。

二、填空題。

Hadoop的數據塊默認冗余度是________,Hadoop1.x數據塊大小默認是________MB,

Hadoop2.x數據塊大小默認是MB.

Hadoop是項目的總稱。主要是由一和―組成。

大數據的核心問題是________和_________,這兩個核心問題分別對應Hadoop的

和這兩個技術。

—程序負責HDFS數據存儲。

—是IIBase中分布式存儲和負載均衡的最小單元。

結束后臺進程的命令是Io

安裝Hadoop,執行hadoop格式化的命令是:。

Hadoop完全分布模式安裝好后,通過jps命令可以查看進程。進程可分兩類,一類進程屬

于HDFS,進程包括NameNode、、,另一類進程屬于YARN,進

程的包括、

四、判斷題

Client端上傳文件到HDFS,數據經過NameNode傳遞給DataNode

IIDFSFederation,當一個Nanienode掛掉了,不會影響其他Namenode

Hbase的Region由一個或者多個Store組成

Zookcoper通過命令"create-s/tmptmpvalue”可以創建一個臨時節

MapReduce程序只能對key排序

MapReduce擅長對PB級以上海顯數據進行實時處理

Zookeeper服務端默認的對外服務端口是3888

五、應用題

提示:理解Hbase的shell指令相關操作。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論