Hadoop精彩試題題庫

上傳人：y*** IP屬地：天津上傳時間：2022-01-08 格式：DOCX 頁數：15 大小：59.35KB 積分：18 舉報 版權申訴

免費預覽已結束，剩余10頁可下載查看

 下載本文檔

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

1、實用文檔1.以下哪一項不屬于 Hadoop可以運行的模式 CA.單機本地模式B.偽分布式模式C.互聯模式D.分布式模式2 . Hadoop的作者是下面哪一位_B.A. Martin FowlerB. Doug cuttingC. Kent BeckD. Grace Hopper3 .以下哪個程序通常與 NameNode在同一個節點啟動 _DA. TaskTrackerB. DataNodeC. SecondaryNameNodeD. Jobtracker4 . HDFS 默認 Block Size的大小是 B.A.32MBB.64MBC.128MBD.256M5 .以下哪項通常是集群的最主要瓶

2、頸 C_oA. CPUB.網絡C.磁盤IOD.內存6.以下關于 MapReduce說法不正確的選項是 C_.A. MapReduce是一種計算框架B. MapReduce來源于google的學術論文C. MapReduce程序只能用java語言編寫D. MapReduce隱藏了并行計算的細節,方便使用8. HDFS是基于流數據模式訪問和處理超大文件的需求而開發的,具有高容錯、高可靠性、高可擴展性、高吞吐率等特征,適合的讀寫任務是_D.A. 一次寫入,少次讀B.屢次寫入,少次讀C.屢次寫入,屢次讀D. 一次寫入,屢次讀標準文案實用文檔9. HBase依靠 A存儲底層數據.A. HDFSB. H

3、adoopC. MemoryD. MapReduce10. HBase依賴 D_提供強大的計算水平.A. ZookeeperB. ChubbyC. RPCD. MapReduce11. HBase依賴 A 提供消息通信機制A. ZookeeperB. ChubbyC. RPCD. Socket12. 下面與HDF砥似的木g架是 C?A. NTFSB. FAT32C. GFSD. EXT313. 關于SecondaryNameNode下面哪項是正確的 C.A.它是NameNode的熱備B.它對內存沒有要求C.它的目的是幫助 NameNode合并編輯日志,減少 NameNode啟動時間D. Sec

4、ondaryNameNode 應與 NameNode 部署到一個節點14.大數據的特點不包括下面哪一項D.A.巨大的數據量B.多結構化數據C.增長速度快D.價值密度高HBase測試題1. HBase來源于哪一項？C標準文案實用文檔A The Google File SystemB MapReduceC BigTableD Chubby2 .下面對HBase的描述哪些是正確的？B、C DA不是開源的B是面向列的C是分布式的D是一種NoSQ改據庫3 . HBase依靠存儲底層數據AA HDFSB HadoopC MemoryD MapReduce4 . HBase依賴提供消息通信機制AA Zook

5、eeperB ChubbyC RPCD Socket5 . HBase依賴提供強大的計算水平DA ZookeeperB ChubbyC RPCD MapReduce6 . MapReduce與HBase的關系,哪些描述是正確的？B、CA兩者不可或缺,MapReduceH HBase可以正常運行的保證B兩者不是強關聯關系,沒有 MapReduce HBase可以正常運行C MapReduce可以直接訪問 HBaseD它們之間沒有任何關系7 .下面哪些選項正確描述了HBase的特性？ A、B、C DA高可靠性B高性能C面向列D可伸縮8 .下面與Zookeeper類似的框架是？ DA Protobu

6、f標準文案實用文檔B JavaC KafkaD Chubby9 .下面與HDF睽似的框架是？ CA NTFSB FAT32C GFSD EXT310 .下面哪些概念是 HBase框架中使用的？ A、CA HDFSB GridFSC ZookeeperD EXT3第二局部：HBase核心知識點11 . LSM含義是？ AA日志結構合并樹B二叉樹C平衡二叉樹D基于日志結構的合并樹12 .下面對LSM結構描述正確的選項是？A、CA順序存儲B直接寫硬盤C需要將數據Flush到磁盤D是一種搜索平衡樹13 . LSM更能保證哪種操作的性能？BA讀B寫C隨機讀D合并14 . LSM的讀操作和寫操作是獨立的？

7、AA是.B否.C LSM并不區分讀和寫D LSM中讀寫是同一種操作15 . LSM結構的數據首先存儲在.BA硬盤上標準文案實用文檔B內存中C磁盤陣列中D閃存中16 HFile數據格式中的 Data字段用于.AA存儲實際的 KeyValue數據B存儲數據的起點C指定字段的長度D存儲數據塊的起點17 HFile 數據格式中的 Metalndex字段用于.DA Meta塊的長度B Meta塊的結束點C Meta塊數據內容D Meta塊的起始點18 HFile數據格式中的 Magic字段用于°AA存儲隨機數,預防數據損壞B存儲數據的起點C存儲數據塊的起點D指定字段的長度19 HFile數據格

8、式中的 KeyValue數據格式,以下選項描述正確的選項是.A、DA是byte口數組B沒有固定的結構C數據的大小是定長的D有固定的結構20 HFile 數據格式中的 KeyValue數據格式中 Value局部是.CA擁有復雜結構的字符串B字符串C二進制數據D壓縮數據第三局部：HBase高級應用介紹31. HBase中的批量加載底層使用實現. AA MapReduceB HiveC CoprocessorD Bloom Filter32. HBase性能優化包含下面的哪些選項？A、B C、DA讀優化B寫優化C配置優化標準文案實用文檔D JVM優化33. Rowkey設計的原那么,以下哪些選項的描

9、述是正確的？A、B、CA盡量保證越短越好B可以使用漢字C可以使用字符串D本身是無序的34. HBase構建二級索引的實現方式有哪些？A、BA MapReduceB CoprocessorC Bloom FilterD Filter35. 關于HBase二級索引的描述,哪些是正確的？A、BA核心是倒排表B二級索引概念是對應 Rowkey這個“一級索引C二級索引使用平衡二叉樹D二級索引使用LSM吉構36. 以下關于Bloom Filter的描述正確的選項是？ A、CA是一個很長的二進制向量和一系列隨機映射函數B沒有誤算率C有一定的誤算率D可以在 Bloom Filter中刪除元素第四局部：HBas

10、e安裝、部署、啟動37. HBase官方版本可以安裝在什么操作系統上？A、B、CA CentOSB UbuntuC RedHatD Windows38. HBase虛擬分布式模式需要個節點？ AA 1B 2C 3D最少3個39. HBase分布式模式最好需要個節點？ CA 1B 2C 3D最少標準文案實用文檔關于hadoop的選擇題1、Doug Cutting所創立的工程的名稱都受到其家人的啟發,以下工程不是由他創立的工程是A. HadoopB. NutchC. LuceneD. Solr答案：D2、配置Hadoop時,JAVA_HOMfe含在哪一個配置文件中A. hadoop-defaul

11、t.xmlB. hadoop-env.shC. hadoop-site.xmlD. configuration.xsl答案：B知識點：hadoop配置3、Hadoop配置文件中,hadoop-site.xml 顯示覆蓋 hadoop-default.xml 里的內容.在版本0.20中,hadoop-site.xml 被別離成三個 XMLt件,不包括A. conf-site.xmlB. mapred-site.xmlC. core-site.xmlD. hdfs-site.xml答案：A知識點：hadoop配置4、HDFSR認的當前工作目錄是/user/$USER, fs.default.na

12、me的值需要在哪個配置文件內說明A. mapred-site.xmlB. core-site.xmlC. hdfs-site.xmlD.以上均不是答案：B知識點：hadoop配置5、關于Hadoop單機模式和偽分布式模式的說法,正確的選項是A. 兩者都起守護進程,且守護進程運行在一臺機器上B. 單機模式不使用HDFS但加載守護進程C. 兩者都不與守護進程交互,預防復雜性D. 后者比前者增加了 HDFS俞入輸出以及可檢查內存使用情況答案：D知識點：hadoop配置6、以下關于Hadoop API的說法錯誤的選項是標準文案實用文檔A. Hadoop的文件API不是通用的,只用于 HDFSfc件系統

13、B. Configuration類的默認實例化方法是以HDF繇統的資源配置為根底的C. FileStatus對象存儲文件和目錄的元數據D. FSDataInputStream 是 java.io.DataInputStream 的子類答案：A/HDFS 7、HDFS勺NameNod總責治理文件系統的命名空間,將所有的文件和文件夾的元數據保存在一個文件系統樹中,這些信息也會在硬盤上保存成以下文件： A.日志B.命名空間鏡像C.兩者都是答案：C知識點：8、HDFS勺namenodef呆存了一個文件包括哪些數據塊,分布在哪些數據節點上, 這些信息也存儲在硬盤上.A.正確8 .錯誤答案：B知識點：在

14、系統啟動的時候從數據節點收集而成的9 、 Secondary namenode就是namenod劉現問題時的備用節點A.正確B.錯誤答案：B知識點：它和元數據節點負責不同的事情.其主要功能就是周期性將元數據節點的命名空間鏡像文件和修改日志合并,以防日志文件過大.合并過后的命名空間鏡像文件也在Secondary namenode呆存了一份,以防namenod吹敗的時候,可以恢復.10、出現在datanode的VERSIONt件格式中但不出現在 namenode的VERSION 文件格式中的是A. namespaceIDB. storageIDC. storageTypeD. layoutVe

15、rsion答案：B知識點：其他三項是公有的.layoutVersion 是一個負整數,保存了 HDFS的持續化在硬盤上的數據結構的格式版本號；namespaceID是文件系統的唯一標識符, 是在文件系統初次格式化時生成的；storageType表示此文件夾中保存的是數據節點的類型11、Client在HDFS±進行文件寫入時,namenodet艮據文件大小和配置情況,返標準文案實用文檔回局部datanode信息,誰負責將文件劃分為多個 Block ,根據DataNode的地址信息,按順序寫入到每一個DataNode塊A. ClientB. NamenodeC. DatanodeD

16、. Secondary namenode答案：A知識點：HDFSC件寫入12、HDFS的是基于流數據模式訪問和處理超大文件的需求而開發的,默認的最根本的存儲單位是64M具有高容錯、高可靠性、高可擴展性、高吞吐率等特征, 適合的讀寫任務是A. 一次寫入,少次讀寫B.屢次寫入,少次讀寫C. 一次寫入,屢次讀寫D.屢次寫入,屢次讀寫答案：C知識點：HDFS!性13、HDFS無法高效存儲大量小文件,想讓它能處理好小文件,比擬可行的改良策略不包括A. 利用SequenceFile、MapFile、Har等方式歸檔小文件B. 多Master設計C. Block大小適當調小D. 調大namenode內存

17、或將文件系統元數據存到硬盤里答案：D知識點：HDFSI性14、關于HDFS勺文件寫入,正確的選項是A. 支持多用戶對同一文件的寫操作B. 用戶可以在文件任意位置進行修改C. 默認將文件塊復制成三份存放D. 復制的文件塊默認都存在同一機架上答案：C知識點：在HDFS勺一個文件中只有一個寫入者,而且寫操作只能在文件末尾完成,即只能執行追加操作.默認三份文件塊兩塊在同一機架上, 另一份存放在其他機架上.15、Hadoop fs中的-get和-put命令操作對象是A. 文件B. 目錄C. 兩者都是答案：C知識點：HDF階令標準文案實用文檔16、Namenod在啟動時自動進入平安模式,在平安模式階段,

18、說法錯誤的選項是A. 平安模式目的是在系統啟動時檢查各個 DataNode上數據塊的有效性B. 根據策略對數據塊進行必要的復制或刪除C. 當數據塊最小百分比數滿足的最小副本數條件時,會自動退出平安模式D. 文件系統允許有修改答案：D知識點：HDFSe全模式/MapReduce17、MapReduce框架提供了一種序列化鍵/值對的方法,支持這種序列化的類能夠在Map和Reduce過程中充當鍵或值,以下說法錯誤的選項是A. 實現Writable接口的類是值B. 實現WritableComparable<T>接口的類可以是值或鍵C. Hadoop 的根本類型 Text 并不實現 Wri

19、tableComparable<T> 接口D. 鍵和值的數據類型可以超出 Hadoop自身支持的根本類型答案：C18、以下四個Hadoop預定義的Mapper實現類的描述錯誤的選項是A. IdentityMapper<K, V> 實現 Mapper<K, V, K, V> ,將輸入直接映射到輸出B. InverseMapper<K, V> 實現 Mapper<K, V, K, V> ,反轉鍵/值對C. RegexMapper<K>實現 Mapper<K, Text, Text, LongWritable> ,為

20、每個常規表達式的匹配項生成一個(match, 1)對D. TokenCountMapper<K>實現 Mapper<K, Text, Text, LongWritable> ,當輸入的值為分t時,生成(taken, 1)對答案：B知識點：InverseMapper<K, V> 實現 Mapper<K, V, V, K>19、以下關于HDF勃存儲MapReduce并行切分和處理的數據做的設計,錯誤的A. FSDataInputStream 擴展了 DataInputStream 以支持隨機讀B. 為實現細粒度并行,輸入分片(Input Spli

21、t) 應該越小越好C. 一臺機器可能被指派從輸入文件的任意位置開始處理一個分片D. 輸入分片是一種記錄的邏輯劃分,而HDF激據塊是對輸入數據的物理分割答案：B知識點：每個分片不能太小,否那么啟動與停止各個分片處理所需的開銷將占很大一局部執行時間20、針對每行數據內容為" Timestamp Url 的數據文件,在用JobConf對象conf 設置 conf.setlnputFormat(WhichlnputFormat.class) 來讀取這個文件時, WhichlnputFormat應該為以下的A. TextlnputFormatB. KeyValueTextlnputForma

22、tC. SequenceFilelnputFormat標準文案實用文檔D. NLineInputFormat答案：B知識點：四項主要的InputFormat類.KeyValueTextInputFormat以每行第一個分隔符為界,分隔符前為key,之后為value,默認制表符為t21、有關MapReduce!勺輸入輸出,說法錯誤的選項是A. 鏈接多個MapReducd乍業時,序列文件是首選格式B. FileInputFormat 中實現的getSplits() 可以把輸入數據劃分為分片,分片數目和大小任意定義C. 想完全禁止輸出,可以使用 NullOutputFormatD. 每個reduc

23、e需將它的輸出寫入自己的文件中,輸出無需分片答案：B知識點：分片數目在 numSplits中限定,分片大小必須大于 mapred.min.size個字節,但小于文件系統的塊22、Hadoop Streaming支持腳本語言編寫簡單 MapReduce®!序,以下是一個例bin/hadoop jar contrib/streaming/hadoop-0.20-streaming.jarinput input/filenameoutput outputmapper 'dosth.py 5 'file dosth.pyD mapred.reduce.tasks=123、以下

24、說法不正確的選項是A. Hadoop Streaming使用Unix中的流與程序交互B. Hadoop Streaming允許我們使用任何可執行腳本語言處理數據流C. 采用腳本語言時必須遵從 UNIX的標準輸入STDIN并輸出到STDOUTD. Reduce沒有設定,上述命令運行會出現問題答案：D知識點：沒有設定特殊的reducer ,默認使用IdentityReducer 24、在高階數據處理中,往往無法把整個流程寫在單個 MapReduc酢業中,以下關于鏈接MapReducd乍業的說法,不正確的選項是A. Job和JobControl類可以治理非線性作業之間的依賴B. ChainMapp

25、er和ChainReducer類可以用來簡化數據預處理和后處理的構成C.使用ChainReducer時,每個 mapper和reducer對象都有一個本地 JobConfD. ChainReducer.addMapper()方法中,一般對鍵/值對發送設置成值傳遞,性能好且平安性高答案：D知識點：ChainReducer.addMapper()方法中,值傳遞平安性高,引用傳遞性能高25、下面哪個程序負責HDFS數據存儲.答案C datanode標準文案實用文檔a)NameNode b)Jobtracker c)Datanode d)secondaryNameNode e)tasktracker

26、26. HDfS中的block默認保存幾份？答案A默認3分a3份b2份c1份d不確定27. 以下哪個程序通常與NameNode在一個節點啟動？答案 D a)SecondaryNameNodeb)DataNodec)TaskTrackerd)Jobtracker28. Hadoop 作者答案 C Doug cutting a)Martin Fowler b)Kent Beck c)Doug cutting29. HDFS 默認 Block Size 答案：Ba)32MBb)64MBc)128MB 30、以下哪項通常是集群的最主要瓶頸：答案： C磁盤aCPUb網絡c磁盤IOd內存31.關于Sec

27、ondaryNameNode哪項是正確的？答案 C a它是NameNode的熱備b它對內存沒有要求c它的目的是幫助NameNode合并編輯日志,減少 NameNode啟動時間標準文案實用文檔dSecondaryNameNode 應與 NameNode 部署到一個節點.多項選擇題：1,以下哪項可以作為集群的治理？答案： ABD aPuppetbPdshcCloudera ManagerdZookeeper2,配置機架感知的下面哪項正確：答案 ABCa如果一個機架出問題,不會影響數據讀寫b寫入數據的時候會寫到不同機架的 DataNode中cMapReduce會根據機架獲取離自己比擬近的網絡數據3. Client端上傳文件的時候以下哪項正確？答案 Ba數據經過NameNode傳遞給DataNodebClient 端將文件切分為Block ,依次上傳cClient只上傳數據到一臺DataNode,然后由NameNode負責Block復制工4,以下哪個是Hadoop運

人人文庫> 全部分類> 應用文書 > 作業報告

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
5. 人人文庫網僅提供信息存儲空間，僅對用戶上傳內容的表現方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

老太爷的乳妓h开裆裤,久久久久久精品国产三级非禁歌 ,久久久久久久99精品国产片,免费观看交性大片

Hadoop精彩試題題庫

文檔簡介

溫馨提示

最新文檔

評論

老太爷的乳妓h开裆裤,久久久久久精品国产三级非禁歌 ,久久久久久久99精品国产片,免费观看交性大片

Hadoop精彩試題題庫

文檔簡介

溫馨提示

最新文檔

評論

相關文檔