Hadoop試題題庫

上傳人：y*** IP屬地：天津上傳時間：2022-01-06 格式：DOCX 頁數：22 大小：65.79KB 積分：25 舉報 版權申訴

免費預覽已結束，剩余17頁可下載查看

 下載本文檔

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

1、w 1.以下哪一項不屬于 Hadoop可以運行的模式 C.贛A.單機本地模式范B.偽分布式模式» C.互聯模式輯D.分布式模式肇2. Hadoop的作者是下面哪一位_B.a A. Martin Fowler蒂 B. Doug cutting蠶 C. Kent Beck腿 D. Grace Hopperb3.以下哪個程序通常與NameNode在同一個節點啟動 _D衿 A. TaskTracker曹 B. DataNode芾 C. SecondaryNameNode荽 D. Jobtracker奧4. HDFS 默認Block Size的大小是 B.薄 A.32MB芾 B.64MB蔽 C

2、.128MB蒂 D.256M芳5.以下哪項通常是集群的最主要瓶頸 C_o 前 A. CPU蠢B.網絡腿C.磁盤IO肇D.內存藏6.以下關于 MapReduce說法不正確的選項是 C_.英A. MapReduce是一種計算框架蒙B. MapReduce來源于google的學術論文w C. MapReduce程序只能用java語言編寫« D. MapReduce隱藏了并行計算的細節,方便使用高可靠性、裊8. HDF%基于流數據模式訪問和處理超大文件的需求而開發的,具有高容錯、高可擴展性、高吞吐率等特征,適合的讀寫任務是_D.羈A. 一次寫入,少次讀» B.屢次寫入,少次讀期C

3、.屢次寫入,屢次讀HD. 一次寫入,屢次讀董9. HBase依靠 A存儲底層數據.蠶 A. HDFS靴 B. Hadoop蒂 C. Memory賺 D. MapReduce芨10. HBase依賴 D_提供強大的計算水平.祎 A. Zookeeper蛔 B. Chubby袂 C. RPC蓬 D. MapReduce祎11. HBase依賴 A提供消息通信機制瞧 A. Zookeeper方 B. Chubby腿 C. RPC噩 D. Socket薄12.下面與HDFSI似的木g架是 C?nA. NTFSs B. FAT32肆 C. GFS螞 D. EXT3蔓13.關于SecondaryNameN

4、ode下面哪項是正確的 C.蟆A.它是NameNode的熱備滕B.它對內存沒有要求肅C.它的目的是幫助 NameNode合并編輯日志,減少 NameNode啟動時間膂 D. SecondaryNameNode 應與 NameNode 部署到一個節點蟄14.大數據的特點不包括下面哪一項D.芍A.巨大的數據量蔻B.多結構化數據蝕C.增長速度快覆D.價值密度高蒞HBase測試題裊1. HBase來源于哪一項？C前 A The Google File System羋 B MapReduce菜 C BigTable黃 D Chubby蜜2.下面對HBase的描述哪些是正確的？B、C、D筮A不是開源的菜B

5、是面向列的蒙C是分布式的英D是一一種NoSQ改據庫膀3. HBase依靠存儲底層數據 A薄 A HDFS裂B Hadoop荒 C Memory袈 D MapReduce蛔4. HBase依賴提供消息通信機制A充A Zookeeper蟻 B Chubby蝸 C RPC嵋 D Socket蛔5. HBase依賴提供強大的計算水平D蒂A Zookeeper蝕 B Chubby襖 C RPC螂 D MapReduce袁6. MapReduce與HBase的關系,哪些描述是正確的？B、C唐A兩者不可或缺, MapReduce是HBase可以正常運行的保證肄B兩者不是強關聯關系,沒有 MapReduce

6、HBase可以正常運行膈C MapReduce可以直接訪問 HBase蒲D它們之間沒有任何關系荽7.下面哪些選項正確描述了HBase的特性？ A、B C、D荽A高可靠性螂B高性能芳C面向列唐D可伸縮夔8.下面與Zookeeper類似的框架是？ D膈 A Protobuf輯 B Java羋 C Kafka期 D Chubby蒲9.下面與HDF或似的框架是？ C芨 A NTFS噩 B FAT32帔 C GFS蟄 D EXT3膀10.下面哪些I念是 HBase框架中使用的？ A、C嵋 A HDFS祎 B GridFS賺C Zookeeper # D EXT3蜩第二局部：HBase核心知識點裊11.

7、LSM含義是？ A蕨A日志結構合并樹方B二叉樹薇C平衡二叉樹箍D基于日志結構的合并樹幕12.下面對LSM吉構描述正確的選項是？A、C蛔A順序存儲莆B直接寫硬盤b C需要將數據Flush到磁盤聿D是一種搜索平衡樹盆13. LSM更能保證哪種操作的性能？BB A讀瞧B寫蓬C隨機讀贛D合并膈14. LSM的讀操作和寫操作是獨立的？A茁A是.袂B否.第C LSM并不區分讀和寫噩D LSM中讀寫是同一種操作蒞15. LSM結構的數據首先存儲在.B節A硬盤上肇B內存中蛔C磁盤陣列中菜D閃存中蜜16 HFile 數據格式中的 Data字段用于.A蠅A存儲實際的 KeyValue數據崛B存儲數據的起點案C指

8、定字段的長度蜜D存儲數據塊的起點奠17 HFile 數據格式中的 MetaIndex字段用于.D藏A Meta塊的長度薄B Meta塊的結束點范C Meta塊數據內容量D Meta塊的起始點黃18 HFile數據格式中的 Magic字段用于.A妨A存儲隨機數,預防數據損壞螞B存儲數據的起點蟻C存儲數據塊的起點*D指定字段的長度刷19 HFile數據格式中的KeyValue數據格式,以下選項描述正確的選項是.A、D肅A是byte數組腿B沒有固定的結構肇C數據的大小是定長的襖D有固定的結構膀20 HFile 數據格式中的 KeyValue數據格式中Value局部是.C袁A擁有復雜結構的字符串w B

9、字符串肄C二進制數據奠D壓縮數據芨第三局部：HBase高級應用介紹薄31 HBase中的批量加載底層使用實現. A肄 A MapReduce羈 B Hive聿 C Coprocessor新 D Bloom Filter肄32. HBase性能優化包含下面的哪些選項？A、B、C、D前A讀優化曹B寫優化勘C配置優化艘D JVM優化螃33. Rowkey設計的原那么,以下哪些選項的描述是正確的？A、B C膀A盡量保證越短越好滕B可以使用漢字范C可以使用字符串» D本身是無序的研34. HBase構建二級索引的實現方式有哪些？A、B« A MapReduce蒂 B Coproces

10、sor荒 C Bloom Filter蔗 D Filter«35.關于HBase二級索引的描述,哪些是正確的？A、B蒙A核心是倒排表墨B二級索引概念是對應 Rowkey這個"一級"索引建C二級索引使用平衡二叉樹羈D二級索引使用LSM結構蟆36.以下關于 Bloom Filter的描述正確的選項是？A、C勘A是一個很長的二進制向量和一系列隨機映射函數襖B沒有誤算率»C有一定的誤算率w D可以在Bloom Filter中刪除元素箍第四局部：HBase安裝、部署、啟動盾37. HBase官方版本可以安裝在什么操作系統上？A、B、C聿 A CentOSm B

11、Ubuntu建 C RedHat賺 D Windows蠅38. HBase虛擬分布式模式需要個節點？A芍A 1蒙B 2裂C 3# D最少3個英39. HBase分布式模式最好需要個節點？C肄A 1筮B 2勘C 3蔻D最少蒞關于hadoop的選擇題肅1、Doug Cutting所創立的工程的名稱都受到其家人的啟發,以下工程不是由他創立的工程是橇 A. Hadoop薄 B. Nutch蒂 C. Lucene奠 D.Solr腿答案：D薄2、配置Hadoop時,JAVA_HOMfe含在哪一個配置文件中裂 A. hadoop-default.xml范 B. hadoop-env.sh袈 C. hado

12、op-site.xml«D. configuration.xsl先答案：B蝕知識點：hadoop配置里的羈3、 Hadoop酉己置文件中,hadoop-site.xml 顯示覆蓋 hadoop-default.xml 內容.在版本0.20中,hadoop-site.xml 被別離成三個 XM做件,不包括肇 A. conf-site.xmlb B. mapred-site.xml蒂 C. core-site.xml蠶 D. hdfs-site.xml膈答案：A索知識點：hadoop配置» 4、曹 A. mapred-site.xml膈 B. core-site.xml膂 C.

13、 hdfs-site.xml蕨D.以上均不是芾答案：B芾知識點：hadoop配置蒲5、關于Hadoop單機模式和偽分布式模式的說法,正確的選項是聿A.兩者都起守護進程,且守護進程運行在一臺機器上方B.單機模式不使用HDFS但加載守護進程勘C.兩者都不與守護進程交互,預防復雜性肄D.后者比前者增加了 HDFS俞入輸出以及可檢查內存使用情況螂答案：D聿知識點：hadoop配置藏6、以下關于Hadoop API的說法錯誤的選項是蒞A. Hadoop的文件API不是通用的,只用于 HDFSC件系統方B. Configuration類的默認實例化方法是以HDF繇統的資源配置為根底的崛C. FileSta

14、tus對象存儲文件和目錄的元數據薇答案：A蕨 /HDFS輻7、HDFS勺NameNode1責治理文件系統的命名空間,將所有的文件和文件夾的元數據保存在一個文件系統樹中,這些信息也會在硬盤上保存成以下文件：薇A.日志蝸B.命名空間鏡像蠢C.兩者都是菽答案：C蝕知識點：蟆8、HDFSnamenod裸存了一個文件包括哪些數據塊,分布在哪些數據節點上, 這些信息也存儲在硬盤上.蒂A.正確犀B.錯誤芨答案：B蟆知識點：在系統啟動的時候從數據節點收集而成的蝴9、 Secondary namenode就是namenod劉現問題時的備用節點德A.正確腿B.錯誤初答案：B瞧知識點：它和元數據節點負責不同的事情

15、.其主要功能就是周期性將元數據節點的命名空間鏡像文件和修改日志合并, 以防日志文件過大.合并過后的命名空間鏡像文件也在 Secondary namenode保存了一份,以防namenod既敗的時候, 可以恢復.其10、出現在datanode的VERSIO就件格式中彳！不出現在 namenode的VERSION 文件格式中的是膀 A. namespaceID噩 B. storageID節 C. storageType蠢 D. layoutVersion量答案：B肆知識點：其他三項是公有的.layoutVersion 是一個負整數,保存了 HDFS勺持續化在硬盤上的數據結構的格式版本號；na

16、mespaceID是文件系統的唯一標識符, 是在文件系統初次格式化時生成的；storageType表示此文件夾中保存的是數據節點的類型董11、Client在HDFS上進行文件寫入時,namenode根據文件大小和配置情況, 返回局部datanode信息,誰負責將文件劃分為多個 Block ,根據DataNode的地址信息,按順序寫入到每一個 DataNode塊蓬 A.Client蟆 B. Namenode滕 C. Datanode肄 D. Secondary namenode膈答案：A藏知識點：hdfSc件寫入黃12、HDFS勺是基于流數據模式訪問和處理超大文件的需求而開發的,默認的最根本

17、的存儲單位是64M具有高容錯、高可靠性、高可擴展性、高吞吐率等特征, 適合的讀寫任務是菜A. 一次寫入,少次讀寫蟻B.屢次寫入,少次讀寫薄C, 一次寫入,屢次讀寫莆D.屢次寫入,屢次讀寫螞答案：C前知識點：HDFSt性羋13、HDFS6法高效存儲大量小文件,想讓它能處理好小文件,比擬可行的改良策略不包括莆A.利用SequenceFile、MapFile、Har等方式歸檔小文件黃B.多Master設計肄C. Block大小適當調小筮D.調大namenode內存或將文件系統元數據存到硬盤里徵答案：D蟻知識點：HDFSt性蟆14、關于HDFS勺文件寫入,正確的選項是童A. 支持多用戶對同一文件的

18、寫操作» B. 用戶可以在文件任意位置進行修改肇C. 默認將文件塊復制成三份存放充D. 復制的文件塊默認都存在同一機架上膈答案：C輯知識點：在HDFS勺一個文件中只有一個寫入者,而且寫操作只能在文件末尾完成,即只能執行追加操作.默認三份文件塊兩塊在同一機架上, 另一份存放在其他機架上.唐15、Hadoop fs中的-get和-put命令操作對象是噩A. 文件袂B.目錄量C. 兩者都是期答案：C英知識點：HDF階令蟻16、NamenodeS啟動時自動進入平安模式,在平安模式階段,說法錯誤的選項是聿A. 平安模式目的是在系統啟動時檢查各個 DataNode上數據塊的有效性肇B, 根據

19、策略對數據塊進行必要的復制或刪除滕C. 當數據塊最小百分比數滿足的最小副本數條件時,會自動退出平安模式妨D. 文件系統允許有修改腿答案：D曹知識點：HDF斂全模式薄“MapReduce蒙17、MapReducelf架提供了一種序列化鍵/值對的方法,支持這種序列化的類能夠在Map和Reduce過程中充當鍵或值,以下說法錯誤的選項是芳A.實現 Whtable 接口的類是值衿B.實現 WritableComparable<T>接口的類可以是值或鍵芍 C. Hadoop 的根本類型 Text 并不實現 WritableComparable<T> 接口節D.鍵和值的數據類型可以

20、超出 Hadoop自身支持的根本類型菽答案：C勞18、以下四個Hadoop預定義的Mapper實現類的描述錯誤的選項是螃 A. IdentityMapper<K, V> 實現 Mapper<K, V, K, V> ,將輸入直接映射到輸出充 B. InverseMapper<K, V> 實現 Mapper<K, V, K, V> ,反轉鍵/值對唐 C. RegexMapper<K>3KW Mapper<K, Text, Text, LongWritable> ,為每個常規表達式的匹配項生成一個(match, 1)對莆 D

21、. TokenCountMapper<K>3KW Mapper<K, Text, Text, LongWritable> ,當輸入的值為分詞時,生成(taken, 1)對菜答案：B肅知識點：InverseMapper<K, V> 實現 Mapper<K, V, V, K>覆19、以下關于HDF效存儲MapReduce行切分和處理的數據做的設計,錯誤的是蟆A. FSDataInputStream 擴展了 DataInputStream 以支持隨機讀胭B.為實現細粒度并行,輸入分片(Input Split) 應該越小越好袂C.一臺機器可能被指派從

22、輸入文件的任意位置開始處理一個分片# D.輸入分片是一種記錄的邏輯劃分,而HDFS&據塊是對輸入數據的物理分割膈答案：B蛔知識點：每個分片不能太小,否那么啟動與停止各個分片處理所需的開銷將占很大一局部執行時間莫20、針對每行數據內容為" Timestamp Url 的數據文件,在用 JobConf對象 conf 設置 conf.setlnputFormat(WhichlnputFormat.class)來讀取這個文件時,WhichlnputFormat應該為以下的妍 A. TextInputFormat覆 B. KeyValueTextInputFormat荀 C. Seq

23、uenceFileInputFormat妨 D. NLineInputFormat蜩答案：B蟆知識點：四項主要的InputFormat類.KeyValueTextInputFormat 以每行第一個分隔符為界,分隔符前為key,之后為value,默認制表符為t嵋21、有關MapReduce!勺輸入輸出,說法錯誤的選項是蒂A.鏈接多個MapReducd乍業時,序列文件是首選格式袈B. FileInputFormat中實現的getSplits() 可以把輸入數據劃分為分片,分片數目和大小任意定義腿C.想完全禁止輸出,可以使用 NullOutputFormat薇D.每個reduce需將它的輸出寫入

24、自己的文件中,輸出無需分片膂答案：B節知識點：分片數目在# 22、HadoopStreaming支持腳本語言編寫簡單 MapReduce®序,以下是一個例子：肄 bin/hadoop jar contrib/streaming/hadoop-0.20-streaming.jar瞧input input/filename節output output量mapper 'dosth.py 5 '期file dosth.py蠢23、以下說法不正確的選項是前A. Hadoop Streaming 使用Unix中的流與程序交互箴B. Hadoop Streaming允許我們使用任

25、何可執行腳本語言處理數據流艘C.采用腳本語言時必須遵從 UNIX的標準輸入STDIN并輸出到STDOUT螂D. Reduce沒有設定,上述命令運行會出現問題蒂答案：D妨知識點：沒有設定特殊的reducer ,默認使用IdentityReducer肄24、在高階數據處理中,往往無法把整個流程寫在單個MapReduce乍業中,下列關于鏈接MapReducd乍業的說法,不正確的選項是蠶A. Job和JobControl類可以治理非線性作業之間的依賴蠅B. ChainMapper和ChainReducer類可以用來簡化數據預處理和后處理的構成b C.使用ChainReducer時,每個mapper和r

26、educer對象都有一個本地 JobConf 對象蔽D. ChainReducer.addMapper()方法中,一般對鍵/值對發送設置成值傳遞,性能好且平安性高螂答案：D衿知識點：ChainReducer.addMapper()方法中,值傳遞平安性高,引用傳遞性能高荽25、下面哪個程序負責HDFS數據存儲.答案C datanode充 a)NameNode蓬 b)Jobtracker量 c)Datanodew d)secondaryNameNode蟻 e)tasktracker方26. HDfS中的block 默認保存幾份？答案A默認3分聿a)3份肄b)2份蒂c)1份肇d)不確定聿27.以

27、下哪個程序通常與NameNode在一個節點啟動？答案D英 a)SecondaryNameNode袁 b)DataNode犀 c)TaskTracker腿 d)Jobtracker嵋 28. Hadoop 作者答案 C Doug cutting蒲 a)Martin Fowler苞 b)Kent Beck芳 c)Doug cutting滕29. HDFS 默認 Block Size 答案：B量 a)32MB蠶 b)64MB芨 c)128MB蝸30、以下哪項通常是集群的最主要瓶頸：答案： C磁盤螃 a)CPU螞b網絡曹c磁盤IO螭d內存菜31.關于SecondaryNameNode哪項是正確的？答案

28、 C蓬a它是NameNode的熱備> b它對內存沒有要求瞧c它的目的是幫助NameNode合并編輯日志,減少 NameNode啟動時間蠢 dSecondaryNameNode 應與 NameNode 部署到一個節點.膀多項選擇題：妍1.以下哪項可以作為集群的治理？答案： ABD菱 aPuppet蛔 bPdsh量 cCloudera Manager螂 dZookeeper贛2.配置機架感知的下面哪項正確：答案 ABC建a如果一個機架出問題,不會影響數據讀寫輻b寫入數據的時候會寫到不同機架的 DataNode中崛cMapReduce會根據機架獲取離自己比擬近的網絡數據肅3. Client端上傳文件的時候以下哪項正確？答案 B蝴a數據經過NameNode傳遞給DataNode蜜bClient 端將文件切分為 Block ,依次上傳袈cClient 只上傳數據到一臺 DataNode,然后由NameNode負責Block復制工作蔻4.以下哪個是Hadoop運

人人文庫> 全部分類> 應用文書 > 作業報告

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
5. 人人文庫網僅提供信息存儲空間，僅對用戶上傳內容的表現方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

老太爷的乳妓h开裆裤,久久久久久精品国产三级非禁歌 ,久久久久久久99精品国产片,免费观看交性大片

Hadoop試題題庫

文檔簡介

溫馨提示

最新文檔

評論

老太爷的乳妓h开裆裤,久久久久久精品国产三级非禁歌 ,久久久久久久99精品国产片,免费观看交性大片

Hadoop試題題庫

文檔簡介

溫馨提示

最新文檔

評論

相關文檔