




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
Hadoop平臺構建智慧樹知到期末考試答案+章節答案2024年上海思博職業技術學院zookeeper集群使用的協議()。
答案:ZAB協議在spark生態組件中,哪個產品可用于復雜的批量數據處理()。
答案:sparkcore下列通常是集群最主要的瓶頸是:()
答案:磁盤I/O在ps命令中什么參數是用來顯示所有用戶的進程的?()
答案:a在Hadoop集群中,負責海量數據的存儲和分析的組件是___B______。
答案:HBasessh服務端的進程名為()
答案:sshd以下哪項不屬于大數據思維的涵蓋內容():
答案:通過采樣的手段獲取目標群體的統計特性Hadoop的NameNode負責____A_____。
答案:管理HDFS的數據塊關于ZKFC故障轉移控制器,說法正確的是()。A.當集群啟動時,主備節點的概念是很模糊的,當ZKFC檢查到任意一個節點是健康狀態,直接將其設置為主節點。
答案:當zkfc檢查到兩個NN節點是健康狀態,發起投票機制選出一個主節點,一個備用節點,并修改主備節點的狀態。顯示一個文件最后幾行的命令是:()
答案:tailHDFS是Hadoop提供的_____A____。
答案:分布式文件系統如何在文件中查找顯示所有以"*"打頭的行?()
答案:grep‘^*’file下面哪條命令可以把f1.txt復制為f2.txt?()
答案:catf1.txt>f2.txt關于hadoopMapReduce分片(split)的概念,下列說法不正確的是()
答案:split是一個物理的存儲概念在Hadoop中,可以使用___C______進行流式數據處理。
答案:Flume在Hadoop中,可以使用_____C____執行高級數據查詢。
答案:YARNHBase默認使用什么作為其底層文件存儲系統?()
答案:HDFSZookeeper角色分配不包括()
答案:protecter在Hadoop中,可以使用____C_____進行消息傳遞。
答案:Flume在思維方式方面,不是大數據顯著影響的是()。
答案:存儲而非計算RDD可以從hadoop兼容的文件系統生成,生成之后通過調用RDD算子對RDD的數據進行部分更新。()
答案:錯在Hadoop集群中,HBase負責數據的增刪改查。()
答案:對Hbase的最小存儲單元不是Region而是一個Cell單元。()
答案:對假設HDFS在寫入數據是只存2份,那么在寫入過程中,HDFSClient先將數據寫入Datanode1,再將數據寫入Datanode2。()
答案:錯對高價值高度聚合的信息和知識的批次處理是大數據行業主要商業訴求.()
答案:錯Hadoop集群具體來說包含兩個集群:HDFS集群和YARN集群,兩者邏輯上分離,但物理上常在一起()
答案:對在Hadoop中,可以使用Kafka進行實時數據處理。()
答案:錯在HDFSNameNode中Fslmage中并沒有記錄具體的記錄塊在哪些數據節點上存儲的,是通過數據節點和名稱節點在運行時不斷通過溝通而實時維護這些信息的,而這些信息都是存儲到內存單中去了。()
答案:錯HBase中Compaction的目的是減少同一個Region,同一個ColumnFamily下的文件數目。()
答案:對Hadoop中的HDFS是用來處理非結構化數據的。()
答案:錯Hadoop的NameNode負責存儲HDFS的文件。()
答案:錯大數據不是萬能的,所以我們要將大數據方法結合傳統的推理預測方法,才得到一個更加精確的結果。()
答案:對HDFS系統不支持數據的修改。()
答案:對HDFS集群中的數據節點一般是一個節點運行一個數據節點進程,負責處理文件系統客戶端的讀/寫請求,在名稱節點的統一調度下進行數據塊的創建、刪除和復制等操作。()
答案:對一個Java源程序文件中只能定義一個public類。()
答案:錯spark是由C編程語言實現的。()
答案:錯Yarn-client和Yarn-cluster主要區是ApplicationMaster進程的區別.()
答案:對使用Shell命令insert對HBase中的一張表進行數據添加操作。()
答案:錯Spark是基于內存的計算,所有Spark程序運行過程中的數據只能存儲在內存中。()
答案:錯在Hadoop中,可以使用Flume進行消息傳遞。()
答案:對Hadoop是一種分布式計算平臺。()
答案:對對于大數據而言,最基本、最重要的要求就是減少錯誤、保證質量。因此,大數據收集的信息量要盡量精確。()
答案:錯MapReduce是分布式并行計算框架,其計算模式屬于流計算,實時性好。()
答案:錯因為HDFS有多個副本,所以NameNode是不存在單點問題的。()
答案:錯Flume傳輸數據過程中,sink取走數據并寫入目的地后,會將event從channe中刪除。()
答案:對HBase是Hadoop中的關系型數據庫。()
答案:對Hadoop集群中的任務調度和資源管理是由HBase完成的。()
答案:錯每個map槽就是一個線程。()
答案:錯Hadoop支持數據的隨機寫。()
答案:錯Hadoop是一種關系型數據庫。()
答案:錯配置Hadoop時,JAVA_HOME包含在()
答案:hadoop-env.sh基于Hadoop開源大數據平臺主要提供了針對數據分布式計算和存儲能力,如下屬于分布式存儲組件的有()。
答案:HDFS;HBaseHadoop自身具有嚴格的權限管理和安全措施保障集群正常運行。()
答案:錯Hadoop及其生態系統,可以部署在()。
答案:Linux;UNIXHadoop的三種安裝模式包括以下哪種()。
答案:完全分布式模式;單機模式;偽分布模式SparkStreaming計算基于DStream將流式計算分解成一系列短小的批處理作業。()
答案:錯spark的master和worker通過什么方式進行通信的()。
答案:AkkaSpark任務的每個stage可劃分為job,劃分的標記是shuffle。()
答案:錯Spark任務的Executor可以執行多個task。()
答案:錯Spark和Hadoop都不適用于迭代計算的場景。()
答案:錯下列不屬于非關系型數據庫的是()。
答案:Hive以下屬于HiveSQL中DDL數據定義語言的是()。
答案:建表;刪除表;修改表Hive是一種數據倉庫處理工具,使用類sql的HivesqlL語言實現數據查詢功能,所有Hive的數據都存儲在HDFS中。()
答案:錯Hive中的這條命令“LOADDATALOCAL
INPATH'/opt/college/person.csv'OVERWRITE
into
tableperson;”是個什么類型的操作(
)。
答案:從Linux本地文件person.csv導入;導入數據到表personHIVE的元數據可存儲在哪里()。
答案:mysql數據庫;derby數據庫Hive中的這條命令“droptableperson;”是什么含義(
)
答案:刪除表關于hive建表基本描述正確的是()。
答案:創建外部表需要制定external關鍵字加載數據到Hive表,哪種方式不正確()。
答案:Hive支持Insertinto單條記錄的方法,所以可以直接在命令行插入單條記錄對hive中表數據操作描述正確的是()。
答案:hive不可以修改特定行值、列值對于Hive中關于普通表和外部表描述不正確的是()。
答案:外部實質是將已存在于HDFS上的文件路徑跟表關聯起來Hadoop是當前大數據平臺的事實標準,下列對Hadoop的描述中正確的是()。
答案:Hadoop在當前衍生出一系列優秀的開源項目,包括Hbase、Hive、Pig等;Hadoop是一個由Apache基金會開發的分布式系統開源架構;Hadoop的初始設計思路來源于Google發布的學術論文;Hadoop的兩個核心部分是HDFS和MapReduce計算框架MapReduce與HBase的關系,()描述是正確的。
答案:兩者不是強關聯關系,沒有MapReduce,HBase可以正常運行;MapReduce可以直接訪問HBaseMapReduce程序對數據的處理主要分為下列哪些過程()。
答案:map;reduce;shuffleMapReduce的inputsplit一定是一個block。()
答案:錯Mapreduce過程中,以下屬于Shuffle機制的是()。
答案:Sort/Merge;combine;Copy;PartitionHBase依賴()技術框架提供消息通信機制。
答案:Zookeeper下列()選項是安裝HBase前所必須安裝的。
答案:操作系統;JDKHadoop的HBase主要特點有哪些()
答案:可伸縮;高可靠性;面向列;高性能HBase的數據文件HFile中一個Keyvalue格式包含哪些信息()。
答案:value;Key;TimeStamp;KeytypeHBase系統用于記錄Region相關信息的表,具體的表包含()。
答案:…META.;-ROOT-以下哪個不是HDFS的守護進程()。
答案:MrappMaster/YarnChild下列關于HDFS的描述正確的是()
答案:NameNode磁盤元數據不保存Block的位置信息HDfS中的block默認保存幾份()。
答案:3下列哪個屬性是hdfs-site.xml中的配置()。
答案:yarn.resourcemanager.addressHDFS是基于流數據模式訪問和處理超大文件的需求而開發的,具有高容錯、高可靠性、高可擴展性、高吞吐率等特征,適合的讀寫任務是()。
答案:一次寫入,多次讀Hadoop生態系統中,被作為ETL使用的軟件是()。
答案:SqoopHadoop作為分布式計算技術的杰出代表,其主要特征包括()。
答案:健壯性;簡單性;高效性;可靠性以下命令組成錯誤的是()。
答案:bin/hadoopfs-cat/hadoopdata/y/txt想要修改集群的備份數量,可以修改哪個()。
答案:hdfs-site.xml關于Hadoop單機模式和偽分布式模式的說法,正確的是()。
答案:后者比前者增加了HDFS輸入輸出以及可檢查內存使用情況()在許多情況下,能夠達到99.999%的可用性。
答案:集群解壓.tar.gz結尾的HBase壓縮包使用的Linux命令
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 農資公司前臺管理制度
- 小微金融公司管理制度
- 醫院新型門診管理制度
- 券商外包日常管理制度
- 學校項目落地管理制度
- 黨員練功基地管理制度
- 國企合同審核管理制度
- 寢室衛生消毒管理制度
- 華為銷售流程管理制度
- 小組婦女組長管理制度
- 2024年湖北省武漢市高考數學一調試卷
- 銀行業金融機構數據治理指引
- 護理質量安全與風險管理的信息技術支持
- 2021年高考化學試卷真題及答案(遼寧卷)(解析版)
- 血液透析充分性評估及處置課件
- 2022年幼兒識字:生字卡片-幼兒識字卡片大全
- 特種作業人員教育培訓方案
- 標準風機樣本參數表(多種型號)
- 光伏電站繼電保護運行規程
- 美容整形中的健康管理與風險防控
- 班組長能力提升人際交往與矛盾處理
評論
0/150
提交評論