




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1.以下哪一項不屬于Hadoop可以運營的模式___C___。A.單機(本地)模式B.偽分布式模式C.互聯模式D.分布式模式2.Hadoop的作者是下面哪一位__B____。A.MartinFowlerB.DougcuttingC.KentBeckD.GraceHopper3.下列哪個程序通常與NameNode在同一個節點啟動__D___。A.TaskTrackerB.DataNodeC.SecondaryNameNodeD.Jobtracker4.HDFS默認BlockSize的大小是___B___。A.32MBB.64MBC.128MBD.256M5.下列哪項通常是集群的最重要瓶頸____C__。A.CPUB.網絡C.磁盤IOD.內存6.下列關于MapReduce說法不對的的是_____C_。A.MapReduce是一種計算框架B.MapReduce來源于google的學術論文C.MapReduce程序只能用java語言編寫D.MapReduce隱藏了并行計算的細節,方便使用8.HDFS是基于流數據模式訪問和解決超大文獻的需求而開發的,具有高容錯、高可靠性、高可擴展性、高吞吐率等特性,適合的讀寫任務是__D____。A.一次寫入,少次讀B.多次寫入,少次讀C.多次寫入,多次讀D.一次寫入,多次讀9.HBase依靠__A____存儲底層數據。A.HDFSB.HadoopC.MemoryD.MapReduce10.HBase依賴___D___提供強大的計算能力。A.ZookeeperB.ChubbyC.RPCD.MapReduce11.HBase依賴___A___提供消息通信機制A.ZookeeperB.ChubbyC.RPCD.Socket12.下面與HDFS類似的框架是___C____?A.NTFSB.FAT32C.GFSD.EXT313.關于SecondaryNameNode下面哪項是對的的___C___。A.它是NameNode的熱備B.它對內存沒有規定C.它的目的是幫助NameNode合并編輯日記,減少NameNode啟動時間D.SecondaryNameNode應與NameNode部署到一個節點14.大數據的特點不涉及下面哪一項___D___。A.巨大的數據量B.多結構化數據C.增長速度快D.價值密度高HBase測試題1.HBase來源于哪一項?CATheGoogleFileSystemBMapReduceCBigTableDChubby2.下面對HBase的描述哪些是對的的?B、C、DA不是開源的B是面向列的C是分布式的D是一種NoSQL數據庫3.HBase依靠()存儲底層數據AAHDFSBHadoopCMemoryDMapReduce4.HBase依賴()提供消息通信機制AAZookeeperBChubbyCRPCDSocket5.HBase依賴()提供強大的計算能力DAZookeeperBChubbyCRPCDMapReduce6.MapReduce與HBase的關系,哪些描述是對的的?B、CA兩者不可或缺,MapReduce是HBase可以正常運營的保證B兩者不是強關聯關系,沒有MapReduce,HBase可以正常運營CMapReduce可以直接訪問HBaseD它們之間沒有任何關系7.下面哪些選項對的描述了HBase的特性?A、B、C、DA高可靠性B高性能C面向列D可伸縮8.下面與Zookeeper類似的框架是?DAProtobufBJavaCKafkaDChubby9.下面與HDFS類似的框架是?CANTFSBFAT32CGFSDEXT310.下面哪些概念是HBase框架中使用的?A、CAHDFSBGridFSCZookeeperDEXT3第二部分:HBase核心知識點11.LSM含義是?AA日記結構合并樹B二叉樹C平衡二叉樹D基于日記結構的合并樹12.下面對LSM結構描述對的的是?A、CA順序存儲B直接寫硬盤C需要將數據Flush到磁盤D是一種搜索平衡樹13.LSM更能保證哪種操作的性能?BA讀B寫C隨機讀D合并14.LSM的讀操作和寫操作是獨立的?AA是。B否。CLSM并不區分讀和寫DLSM中讀寫是同一種操作15.LSM結構的數據一方面存儲在()。BA硬盤上B內存中C磁盤陣列中D閃存中16HFile數據格式中的Data字段用于()。AA存儲實際的KeyValue數據B存儲數據的起點C指定字段的長度D存儲數據塊的起點17HFile數據格式中的MetaIndex字段用于()。DAMeta塊的長度BMeta塊的結束點CMeta塊數據內容DMeta塊的起始點18HFile數據格式中的Magic字段用于()。AA存儲隨機數,防止數據損壞B存儲數據的起點C存儲數據塊的起點D指定字段的長度19HFile數據格式中的KeyValue數據格式,下列選項描述對的的是()。A、DA是byte[]數組B沒有固定的結構C數據的大小是定長的D有固定的結構20HFile數據格式中的KeyValue數據格式中Value部分是()。CA擁有復雜結構的字符串B字符串C二進制數據D壓縮數據第三部分:HBase高級應用介紹31HBase中的批量加載底層使用()實現。AAMapReduceBHiveCCoprocessorDBloomFilter32.HBase性能優化包含下面的哪些選項?A、B、C、DA讀優化B寫優化C配置優化DJVM優化33.Rowkey設計的原則,下列哪些選項的描述是對的的?A、B、CA盡量保證越短越好B可以使用漢字C可以使用字符串D自身是無序的34.HBase構建二級索引的實現方式有哪些?A、BAMapReduceBCoprocessorCBloomFilterDFilter35.關于HBase二級索引的描述,哪些是對的的?A、BA核心是倒排表B二級索引概念是相應Rowkey這個“一級”索引C二級索引使用平衡二叉樹D二級索引使用LSM結構36.下列關于BloomFilter的描述對的的是?A、CA是一個很長的二進制向量和一系列隨機映射函數B沒有誤算率C有一定的誤算率D可以在BloomFilter中刪除元素第四部分:HBase安裝、部署、啟動37.HBase官方版本可以安裝在什么操作系統上?A、B、CACentOSBUbuntuCRedHatDWindows38.HBase虛擬分布式模式需要()個節點?AA1B2C3D最少3個39.HBase分布式模式最佳需要()個節點?CA1B2C3D最少關于hadoop的選擇題1、DougCutting所創建的項目的名稱都受到其家人的啟發,以下項目不是由他創建的項目是A.HadoopB.NutchC.LuceneD.Solr答案:D2、配置Hadoop時,JAVA_HOME包含在哪一個配置文獻中A.hadoop-default.xmlB.hadoop-env.shC.hadoop-site.xmlD.configuration.xsl答案:B知識點:hadoop配置3、Hadoop配置文獻中,hadoop-site.xml顯示覆蓋hadoop-default.xml里的內容。在版本0.20中,hadoop-site.xml被分離成三個XML文獻,不涉及A.conf-site.xmlB.mapred-site.xmlC.core-site.xmlD.hdfs-site.xml答案:A知識點:hadoop配置4、HDFS默認的當前工作目錄是/user/$USER,fs.default.name的值需要在哪個配置文獻內說明A.mapred-site.xmlB.core-site.xmlC.hdfs-site.xmlD.以上均不是答案:B知識點:hadoop配置5、關于Hadoop單機模式和偽分布式模式的說法,對的的是A.兩者都起守護進程,且守護進程運營在一臺機器上B.單機模式不使用HDFS,但加載守護進程C.兩者都不與守護進程交互,避免復雜性D.后者比前者增長了HDFS輸入輸出以及可檢查內存使用情況答案:D知識點:hadoop配置6、下列關于HadoopAPI的說法錯誤的是A.Hadoop的文獻API不是通用的,只用于HDFS文獻系統B.Configuration類的默認實例化方法是以HDFS系統的資源配置為基礎的C.FileStatus對象存儲文獻和目錄的元數據D.FSDataInputStream是java.io.DataInputStream的子類答案:A//HDFS7、HDFS的NameNode負責管理文獻系統的命名空間,將所有的文獻和文獻夾的元數據保存在一個文獻系統樹中,這些信息也會在硬盤上保存成以下文獻:A.日記B.命名空間鏡像C.兩者都是答案:C知識點:8、HDFS的namenode保存了一個文獻涉及哪些數據塊,分布在哪些數據節點上,這些信息也存儲在硬盤上。A.對的B.錯誤答案:B知識點:在系統啟動的時候從數據節點收集而成的9、Secondarynamenode就是namenode出現問題時的備用節點A.對的B.錯誤答案:B知識點:它和元數據節點負責不同的事情。其重要功能就是周期性將元數據節點的命名空間鏡像文獻和修改日記合并,以防日記文獻過大。合并過后的命名空間鏡像文獻也在Secondarynamenode保存了一份,以防namenode失敗的時候,可以恢復。10、出現在datanode的VERSION文獻格式中但不出現在namenode的VERSION文獻格式中的是A.namespaceIDB.storageIDC.storageTypeD.layoutVersion答案:B知識點:其他三項是公有的。layoutVersion是一個負整數,保存了HDFS的連續化在硬盤上的數據結構的格式版本號;namespaceID是文獻系統的唯一標記符,是在文獻系統初次格式化時生成的;storageType表達此文獻夾中保存的是數據節點的類型11、Client在HDFS上進行文獻寫入時,namenode根據文獻大小和配置情況,返回部分datanode信息,誰負責將文獻劃分為多個Block,根據DataNode的地址信息,按順序寫入到每一個DataNode塊A.ClientB.NamenodeC.DatanodeD.Secondarynamenode答案:A知識點:HDFS文獻寫入12、HDFS的是基于流數據模式訪問和解決超大文獻的需求而開發的,默認的最基本的存儲單位是64M,具有高容錯、高可靠性、高可擴展性、高吞吐率等特性,適合的讀寫任務是A.一次寫入,少次讀寫B.多次寫入,少次讀寫C.一次寫入,多次讀寫D.多次寫入,多次讀寫答案:C知識點:HDFS特性13、HDFS無法高效存儲大量小文獻,想讓它能解決好小文獻,比較可行的改善策略不涉及A.運用SequenceFile、MapFile、Har等方式歸檔小文獻B.多Master設計C.Block大小適當調小D.調大namenode內存或將文獻系統元數據存到硬盤里答案:D知識點:HDFS特性14、關于HDFS的文獻寫入,對的的是A.支持多用戶對同一文獻的寫操作B.用戶可以在文獻任意位置進行修改C.默認將文獻塊復制成三份存放D.復制的文獻塊默認都存在同一機架上答案:C知識點:在HDFS的一個文獻中只有一個寫入者,并且寫操作只能在文獻末尾完畢,即只能執行追加操作。默認三份文獻塊兩塊在同一機架上,另一份存放在其他機架上。15、Hadoopfs中的-get和-put命令操作對象是A.文獻B.目錄C.兩者都是答案:C知識點:HDFS命令16、Namenode在啟動時自動進入安全模式,在安全模式階段,說法錯誤的是A.安全模式目的是在系統啟動時檢查各個DataNode上數據塊的有效性B.根據策略對數據塊進行必要的復制或刪除C.當數據塊最小比例數滿足的最小副本數條件時,會自動退出安全模式D.文獻系統允許有修改答案:D知識點:HDFS安全模式//MapReduce17、MapReduce框架提供了一種序列化鍵/值對的方法,支持這種序列化的類可以在Map和Reduce過程中充當鍵或值,以下說法錯誤的是A.實現Writable接口的類是值B.實現WritableComparable<T>接口的類可以是值或鍵C.Hadoop的基本類型Text并不實現WritableComparable<T>接口D.鍵和值的數據類型可以超過Hadoop自身支持的基本類型答案:C18、以下四個Hadoop預定義的Mapper實現類的描述錯誤的是A.IdentityMapper<K,V>實現Mapper<K,V,K,V>,將輸入直接映射到輸出B.InverseMapper<K,V>實現Mapper<K,V,K,V>,反轉鍵/值對C.RegexMapper<K>實現Mapper<K,Text,Text,LongWritable>,為每個常規表達式的匹配項生成一個(match,1)對D.TokenCountMapper<K>實現Mapper<K,Text,Text,LongWritable>,當輸入的值為分詞時,生成(taken,1)對答案:B知識點:InverseMapper<K,V>實現Mapper<K,V,V,K>19、下列關于HDFS為存儲MapReduce并行切分和解決的數據做的設計,錯誤的是A.FSDataInputStream擴展了DataInputStream以支持隨機讀B.為實現細粒度并行,輸入分片(InputSplit)應當越小越好C.一臺機器也許被指派從輸入文獻的任意位置開始解決一個分片D.輸入分片是一種記錄的邏輯劃分,而HDFS數據塊是對輸入數據的物理分割答案:B知識點:每個分片不能太小,否則啟動與停止各個分片解決所需的開銷將占很大一部分執行時間20、針對每行數據內容為”TimestampUrl”的數據文獻,在用JobConf對象conf設立conf.setInputFormat(WhichInputFormat.class)來讀取這個文獻時,WhichInputFormat應當為以下的A.TextInputFormatB.KeyValueTextInputFormatC.SequenceFileInputFormatD.NLineInputFormat答案:B知識點:四項重要的InputFormat類。KeyValueTextInputFormat以每行第一個分隔符為界,分隔符前為key,之后為value,默認制表符為\t21、有關MapReduce的輸入輸出,說法錯誤的是A.鏈接多個MapReduce作業時,序列文獻是首選格式B.FileInputFormat中實現的getSplits()可以把輸入數據劃分為分片,分片數目和大小任意定義C.想完全嚴禁輸出,可以使用NullOutputFormatD.每個reduce需將它的輸出寫入自己的文獻中,輸出無需分片答案:B知識點:分片數目在numSplits中限定,分片大小必須大于mapred.min.size個字節,但小于文獻系統的塊22、HadoopStreaming支持腳本語言編寫簡樸MapReduce程序,以下是一個例子:bin/hadoopjarcontrib/streaming/hadoop-0.20-streaming.jar—inputinput/filename—outputoutput—mapper‘dosth.py5’—filedosth.py—Dmapred.reduce.tasks=123、以下說法不對的的是A.HadoopStreaming使用Unix中的流與程序交互B.HadoopStreaming允許我們使用任何可執行腳本語言解決數據流C.采用腳本語言時必須遵從UNIX的標準輸入STDIN,并輸出到STDOUTD.Reduce沒有設定,上述命令運營會出現問題答案:D知識點:沒有設定特殊的reducer,默認使用IdentityReducer24、在高階數據解決中,往往無法把整個流程寫在單個MapReduce作業中,下列關于鏈接MapReduce作業的說法,不對的的是A.Job和JobControl類可以管理非線性作業之間的依賴B.ChainMapper和ChainReducer類可以用來簡化數據預解決和后解決的構成C.使用ChainReducer時,每個mapper和reducer對象都有一個本地JobConf對象D.ChainReducer.addMapper()方法中,一般對鍵/值對發送設立成值傳遞,性能好且安全性高答案:D知識點:ChainReducer.addMapper()方法中,值傳遞安全性高,引用傳遞性能高25、下面哪個程序負責HDFS數據存儲。答案Cdatanodea)NameNodeb)Jobtrackerc)Datanoded)secondaryNameNodee)tasktracker26.HDfS中的block默認保存幾份?答案A默認3分a)3份b)2份c)1份d)不擬定27.下列哪個程序通常與NameNode在一個節點啟動?答案Da)SecondaryNameNodeb)DataNodec)TaskTrackerd)Jobtracker28.Hadoop作者答案CDougcuttinga)MartinFowlerb)KentBeckc)Dougcutting29.HDFS默認BlockSize答案:Ba)32MBb)64MBc)128MB30、下列哪項通常是集群的最重要瓶頸:答案:C磁盤a)CPUb)網絡c)磁盤IOd)內存31.關于SecondaryNameNode哪項是對的的?答案Ca)它是NameNode的熱備b)它對內存沒有規定c)它的目的是幫助NameNode合并編輯日記,減少NameNode啟動時間d)SecondaryNameNode應與NameNode部署到一個節點。多選題:1.下列哪項可以作為集群的管理?答案:ABDa)Puppetb)Pdshc)ClouderaManagerd)Zookeeper2.配置機架感知的下面哪項對的:答案ABCa)假如一個機架出問題,不會影響數據讀寫b)寫入數據的時候會寫到不同機架的DataNode中c)MapReduce會根據機架獲取離自己比較近的網絡數據3.Client端上傳文獻的時候下列哪項對的?答案Ba)數據通過NameNode傳遞給DataNodeb)Client端將文獻切分為Block,依次上傳c)Client只上傳數據到一臺DataNode,然后由NameNode負責Block復制工作4.下列哪個是Hadoop運營的模式:答案ABCa)單機版b)偽分布式c)分布式5.Cloudera提供哪幾種安裝CDH
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- DB36/T 902-2016鑄鋼件可比單位綜合能耗限額
- 2025年教育行業數字化教材開發與互動式教學工具應用報告
- 2025年節能量審核報告樣本
- 2025年誘導風機項目提案報告模板
- 環氧樹脂-納米填料復合材料行業跨境出海項目商業計劃書
- 高精度水準儀設計企業制定與實施新質生產力項目商業計劃書
- 精密不銹鋼零件加工企業制定與實施新質生產力項目商業計劃書
- 影影約約社交APP商業計劃書1
- 年中國移動式液壓升降臺行業市場發展現狀及投資前景預測報告
- 二年級道德與法治上冊第四單元我們的朋友我喜愛的動植物
- 幼兒園大班科學《痕跡》
- 靜脈用藥安全輸注藥護專家指引
- DB61T1755-2023放心消費示范創建認定與管理規范
- 企業借款申請書
- 乙醇管施工方案
- 項目七 信息素養與社會責任
- 電氣施工安全技術交底記錄范本
- 說課稿【全國一等獎】
- 急性扁桃體炎臨床診療指南
- 第七講 社會主義現代化建設的教育科技人才戰略PPT習概論2023優化版教學課件
- 室間質評記錄表
評論
0/150
提交評論