2024年知識競賽-大數據智能辦公系統知識考試近5年真題附答案_第1頁
2024年知識競賽-大數據智能辦公系統知識考試近5年真題附答案_第2頁
2024年知識競賽-大數據智能辦公系統知識考試近5年真題附答案_第3頁
2024年知識競賽-大數據智能辦公系統知識考試近5年真題附答案_第4頁
2024年知識競賽-大數據智能辦公系統知識考試近5年真題附答案_第5頁
已閱讀5頁,還剩18頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

(圖片大小可自由調整)2024年知識競賽-大數據智能辦公系統知識考試近5年真題薈萃附答案第I卷一.參考題庫(共100題)1.在scala中的模式匹配可以匹配哪些類型()A、通配符匹配B、常量匹配C、變量匹配D、構造函數匹配等2.flume在讀取文本文件的時候,一個文本數據是一個?()A、agentB、eventC、sourceD、float3.下面哪個端口不是spark自帶服務的端口()A、8080B、8090C、18080D、40404.spark中的action算子的特性是()A、懶執行B、立即執行C、一致性D、冗余性5.Flume中配置一個Agent,需要配置的有哪些?()A、配置sourceB、配置sinkC、配置channelD、將source、channel、sink連接起來6.有關flume是什么說法正確的是()A、消息中間件B、日志收集系統C、緩沖組件D、以上都不對7.scala中的Object中通常在里面放一些靜態的()A、FieldB、MethodC、管理塊服務器D、Source8.maven項目是通過pom.xml文件來進行依賴jar包的加載的9.Set集合是無序不重復的集合10.reduceRight通過如下程序塊其輸出結果為varlist=List(1,2,99,4,100)varjs=list.reduceRight(_max_println(js)()A、$1B、100C、206D、以上答案都不對11.SparkStreaming有高吞吐量和容錯能力強等特點12.Scala關于變量定義、賦值,錯誤的是?()A、vala=3B、vala:String=3C、varb:Int=3;b=6D、varb="HelloWorld!";b="123"13.以下組件中和mesos相類似的組件是哪個()A、yarnB、hdfsC、mapreduceD、以上都不對14.spark切分完的partition的大小必須和block一致15.對于以下2個列表的操作,下面那些說法說法正確vart=List(1,2,3)vart2=List(4,5)()A、vart3=t++t2得到List(1,2,3,4,5)B、vart3=List.concat(t,t2)得到List(1,2,3,4,5)C、vart3=t:::t2得到List(1,2,3,4,5)D、vart3=t.:::(t2)得到List(4,5,1,2,3,)16.flatMap類似于map,但是每一個輸入元素可以被映射為0或多個輸出元素(所以func應該返回一個序列,而不是單一元素),所有元素會被壓癟17.Linux中重啟系統的指令有哪些()A、rebootB、haltC、shutdown-rD、shutdown-h18.spark架構中哪些架構可以相互轉化()A、sparkcoreB、sparksqlC、sparkstreamingD、sparkR19.函數在scala中的地位說法正確的有哪些選項()A、一等公民B、可以獨立定義C、不能獨立定義D、函數不能賦值給變量20.表達式for(iA、11;12;13;21;22;23;31;32;33B、11;13;21;23;31;33C、12;13;21;23;31;32D、11;12;21;22;31;3221.DataFrame也是一個分布式數據容器22.scala中的object描述下列那些正確()A、object是scala的關鍵字B、scala中的object和java中的object是一樣的C、object本身就是一個單例對象D、scala中的object是一個伴生對象23.不能夠遍歷Array的算子是哪個()A、foreachB、countC、collectD、flatmap24.standalone組件在spark中的角色是其自帶的()A、任務調度框架B、任務模式C、資源調度框架D、任務整合25.sparkSql可以訪問hive數據,并將其結果取回作為RDD使用26.spark的運行模式有哪些?()A、javaB、pythonC、scalaD、go27.spark框架中,機器學習庫的框架是哪個()A、hadoopB、spark?streamingC、mlbaseD、RDD28.SparkSQL是一個用來處理結構化數據的spark組件。它提供了一個叫做()的可編程抽象數據模型A、DataFramesB、TableC、DataSetD、RDD29.spark中map算子具有以下哪個特性()A、懶執行B、立即執行C、一致性D、冗余性30.Spark是基于內存計算的大數據并行計算框架。Spark基于內存計算,提高了在大數據環境下數據處理的實時性,同時保證了高容錯性和高可伸縮性31.以下對map函數說法錯誤的是()A、對傳入的每個元素都進行映射,返回一個處理后的元素B、對每個元素都處理,沒有返回值C、對傳入元素進行條件判斷,必須返回布爾值D、對傳入元素進行條件判斷,沒有返回值32.在scala中定義變量時,變量的類型可以不寫33.spark中persist算子是()的算子A、延遲執行B、立即執行C、等待執行D、陳列執行34.能夠在sparkSql中寫sql語句35.flume中用來緩存數據的組件是channe36.spark進行數據切分的時候,劃分完成的partition個數和hdfs中block個數一致37.Linux中查看一個文本文件的指令有哪些()A、結構化數據文件B、hive的表C、外部數據庫D、RDDs38.下面哪些系統可以和Kafka集成()A、FlumeB、StromC、SparkD、ElasticSearch39.伴生類和伴生對象說法正確?()A、單例對象與類同名時,這個單例對象被稱為這個類的伴生對象,而這個類被稱為這個單例對象的伴生類B、伴生類和伴生對象要在同一個源文件中定義C、伴生對象和伴生類可以互相訪問其私有成員D、不與伴生類同名的單例對象稱為孤立對象40.下面對于spark的特點描述正確的是()A、良好的容錯性:在分布式數據集計算時通過checkpoint來實現容錯,當某個運算環節失敗時,不需要從頭開始重新計算B、開發便捷性:spark通過scala,java,pythonapi及交互式shell提供豐富的使用方式C、不適合細粒度更新操作:Spark的運算是面向集合的,不適用于需要異步細粒度更新狀態的應用,例如web服務的DAO層或web爬蟲等D、以上答案都不符合其特性41.跟在類名后面的是主構造器42.關于Scala中的trait和Java中的Interface描述錯誤的是?()A、Scala特質和Java接口都可以包含抽象方法和具體實現。B、Scala和Java都不允許多重繼承,但可以疊加多個特質或接口。C、Java只能在類層面上添加接口的實現,而Scala可以在類和對象層面上“混入”特質。D、Trait可以寫方法的實現43.flume的配置文件不能給多個agent使用44.以下關于Scala中函數的描述錯誤的是?()A、函數是“頭等公民”,就和數字一樣。B、可以將函數賦值給變量,如valfun=scala.math.ceil。C、支持非具名函數,也即匿名函數。D、可以將函數作為參數,傳遞給其它函數。45.scala語言中var定義的變量,賦值后不能改變46.在flume中,以下屬于agent組件的成員是()A、sourceB、ChannelC、GridFSD、Sink47.sparkAPI支持哪種語言()A、masterB、workerC、applicationD、driver48.reduce求和輸出結果為varlist1=list1(1,2,3,4)varsum=list1.reduce(_+_)println(sum)()A、10B、1C、4D、以上答案都不對49.reverse會將所給的對象的順序反轉,請說出下列程序輸出結果為valarr=Array(1,2,3,4,5)//帶下標的for循環for(iA、54321B、43215C、32154D、1234550.關于高階函數描述錯誤的是:()A、在程序中應該首先被定義的函數B、將函數作為參數其他函數的參數使用C、執行時間長的函數D、函數的方法體比較長51.spark是基于()運行的計算框架A、內存B、磁盤C、內存加磁盤D、網絡52.以下組件哪個不是Flume的組成部分()A、sourceB、sinkC、channelD、topic53.kafka是一個關于什么的中間件()A、消息B、傳輸C、操作D、事物54.在scala中使用那個關鍵字定義方法()A、defB、mainC、objectD、class55.下面有關scala語言描述正確的是?()A、varval第一個是對scala中對變量的定義標志,其中var表示可變,val表示不可以變量B、content為變量的名字C、String表示是變量的類型,如果沒有寫,將來會自動推斷D、"helloworld"為變量的初始化56.flume在大數據生態圈中的作用是()A、監測收集數據B、處理數據C、計算數據D、存儲數據57.spark中cache算子和persist算子的關系()A、_useDiskB、_useMemoryC、_useOffHeapD、_useDes58.在scala中如果使用for循環,其格式必須如下for(vari=0;i<10;i++){}59.閉包是一個函數,返回值依賴于聲明在函數外部的一個或多個變量60.以下對于reduce操作說法嚴格一樣正確的是vart=List(1,2,3,4,5)println(t.reduce((a,b)=>a+b))()A、println(t.reduce(_+_))是用通配符代表前后2個元素相加,與題干一致B、println(t.reduceLeft(_+_))reduceLeft與reduce一致,通配符表示前后2個元素相加,與題干一致C、println(t.reduceRight((a,b)=>a+b))是用通配符代表前后2個元素相加,但是累加順序從右邊開始,與題干不一致D、println(t.reduceRight(_+_))是用通配符代表前后2個元素相加,但是累加順序從右邊開始,與題干不一致61.在scala中對于列表的操作,那些說法說法正確vart=List(1,2,3)vart2=List(4,5)()A、vart3=t++t2得到List(1,2,3,4,5)B、vart3=List.concat(t,t2)得到List(1,2,3,4,5)C、vart3=t:::t2得到List(1,2,3,4,5)D、vart3=t2.:::(t)得到List(1,2,3,4,5)62.Rdd不能夠轉換成DataFrame63.sparkSql不能使用jdbc讀取數據庫的數據64.對于以下代碼描述有誤的是?valdata=Map(1->"One",2->"Two")valres=for((k,v)1))yieldv()A、運行后res的結果為List("Two")。B、運行后res的結果為List("One","Two")。C、對映射data中的每一個(鍵,值)對,k被綁定對鍵,而v則被綁定到值。D、其中的if(k>1)是一個守衛表達式。65.DiscretizedStream是SparkStreaming的基礎抽象,代表持續性的數據流和經過各種Spark原語操作后的結果數據流66.以下關于Namenode的說法正確的是()A、協調客戶端對文件的訪問。B、記錄命名空間內的改動或者空間本*省屬性的改動。C、記錄?每個文件數據快在各個Datanode上的位置和副本信息。D、管理文件系統的命名空間。67.在scala中,AnyRef是String類的父類68.spark架構中的persist算子在源碼中最多有()備份A、2B、3C、4D、169.在scala中所有類型都繼承自Object70.該方法只能用于連接兩個List類型的集合71.spark中的程序必須有以下哪幾種算子構成()A、轉換算子,action算子B、轉換算子,控制算子C、轉換算子,tracform算子D、轉換算子72.以下哪個組件不是agent中包含的()A、sourceB、sinkC、channelD、broker73.在HBase框架中,下面哪些選項被使用()A、HDFSB、GridFSC、ZookeeperD、EXT374.SparkStreaming中的Dstream可以看作是在RDD上面又封了一層的數據結構75.sparkcore組件中的核心概念是()A、rddB、datasetC、dataframeD、data76.sparkSql不能夠訪問hive中的數據77.java中,關于數組的說法,哪幾個是正確的()A、數組的長度是固定的B、數組的長度是可變的C、數組可以存放不同的數據類型的數據D、數組只能存放單一的數據類型的數據78.下面算子中哪個是寬依賴的()A、mapB、flatmapC、reducebykeyD、sample79.以下關于特質的說法錯誤的是?()A、類可以實現任意數量的特質。B、特質可以要求實現它們的類具備特定的字段、方法或超類。C、與Java接口(Interface)相同,Scala特質也可以提供方法和字段的實現。D、當將多個特質疊加在一起時,順序很重要——其方法先被執行的特質排在更后面。80.基于maven的項目,有且必須有一個pom.xml文件81.與spark基于內存相比,mapreduce是基于()運行的計算框架A、內存B、磁盤C、內存加磁盤D、網絡82.DataFrame更像傳統數據庫的二維表格,除了數據以外,還記錄數據的結構信息,即()A、schemaB、表結構C、RowD、DataSet83.spark架構計算速度比mapreduce計算速度快單純因為內存84.spark架構在運行過程中是通過driver完成資源申請85.以下的計算結果選項中那個正確varlist=List(1,2,3,4,5)varjs=list.fold(100)(_+_)println(js)()A、115B、15C、5D、8586.內存計算下,Spark?比?Hadoop?快10倍87.zookeeper數據模型是帶有默認權限的88.下面輸出與其他不一致的是?()A、valw="World";println(s"Hello$w")B、valw="World";println("Hello$w")C、println("HelloWorld")D、valw="World";println("Hello"+w)89.Kafka是由哪個組織研的組件()A、googleB、apacheC、sunD、oracle90.sortByKey算子在一個(K,V)的RDD上調用,K必須實現Ordered接口,返回一個按照key進行排序的(K,V)的RDD91.日志收集系統Flume現在使用的是哪個版本?()A、NG版本B、OG版本C、DG版本D、MG版本92.sparkSql僅僅支持查詢原生的RDD,其他方式的查詢都不支持93.SparkStreaming中的Dstream和SparkSql中的DataFrame其實是一回事,沒有區別94.flume中的三大組件為source、channel、sinks95.在scala中,以下哪些屬于動作算子()A、foreachB、reduceC、countD、map96.創建rdd可以有如下幾種?()A、由外部存儲系統的數據集創建,包括本地的文件系統B、由一個已經存在的Scala集合創建C、比如所有Hadoop支持的數據集,比如HDFS、Cassandra、HbaseD、以上說法都不對97.spark架構中會出現控制算子的原因是以下哪個選項()A、spark備份的安全原因B、spark用戶的要求C、兼容hiveD、兼容hbase98.下列哪些語句關于Java內存回收的說明是正確的()A、程序員必須創建一個線程來釋放內存?B、內存回收程序可以在指定的時間釋放內存對象C、內存回收程序允許程序員直接釋放內存D、內存回收程序負責釋放無用內存99.變量聲明時不指定類型,編譯器會報錯誤,編譯不過去100.action算子在spark程序運行的過程中有什么作用()A、懶執行B、立即執行C、一致性D、冗余性第I卷參考答案一.參考題庫1.參考答案:A,B,C,D2.參考答案:B3.參考答案:B4.參考答案:B

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論