

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、21春學期(1709、1803、1809、1903、1909、2003、2009、2103)大數據開發技術(二)在線作業試卷總分:100 得分:100一、單選題 (共 25 道試題,共 50 分)1.Spark Streming中()函數可以合并兩個DStream,生成一個包含兩個DStream中所有元素的新DStream對象A.mapB.flatMapC.filterD.union答案:D2.請問RDD的()操作用于將相同鍵的數據聚合A.joinB.zipC.combineByKeyD.collect答案:C3.Dstream窗口操作中()方法基于滑動窗口對源DStream中的元素進行聚合操
2、作,得到一個新的DstreamA.windowB.countByWindowC.reduceByWindowD.reduceByKeyAndWindow答案:C4.Scala函數組合器可以接收一個可以處理嵌套列表的函數,然后把返回結果連接起來的方法是()A.mapB.foreachC.flattenD.flatmap答案:D5.GraphX中()方法可以查詢邊信息A.numVerticesB.numEdgesC.verticesD.edges答案:D6.Spark Streming中()函數可以對源DStream中的每一個元素應用func方法進行計算,如果func函數返回結果為true,則保留
3、該元素,否則丟棄該元素,返回一個新的DstreamA.mapB.flatMapC.filterD.union答案:C7.GraphX中()方法可以查詢頂點個數A.numVerticesB.numEdgesC.verticesD.edges答案:A8.PairRDD可以通過()獲得僅包含鍵的RDDA.keyB.keysC.valueD.values答案:B9.Spark GraphX中類Graph的mask方法可以()A.反轉圖中所有邊的方向B.按照設定條件取出子圖C.取兩個圖的公共頂點和邊作為新圖,并保持前一個圖頂點與邊的屬性D.合并邊相同的屬性答案:C10.var a=10; for(a&l
4、t;-1 until 20) println(a); 共循環了()次A.10B.11C.20D.19答案:D11.Scala中合并兩個數組的方法是()A.lineB.addC.appendD.concat答案:D12.Mllib中線性會館算法中的參數intercept表示()A.要運行的迭代次數B.梯度下降的步長C.是否給數據加干擾特征或者偏差特征D.Lasso 和ridge 的正規化參數答案:C13.以下哪個函數可以對RDD進行去重()A.sortByB.filterC.distinctD.intersection答案:C14.GraphX中()方法可以查詢度數A.degreesB.degr
5、eeC.verticesD.edges答案:A15.GraphX中()是存放著Edg對象的RDDA.RDDEdgeB.EdgeRDDC.RDD(VertexId,VD)D.VertexRDD答案:A16.Scala函數組合器可以過濾移除使得傳入的函數的返回值為false的元素的方法是()A.filterB.flattenC.groubyD.flatmap答案:A17.var a=10; do a+=1; while(a<20) 共循環了()次A.9B.10C.11D.12答案:B18.Spark GraphX中類Graph的joinVertices方法可以()A.收集鄰居頂點的頂點Id和
6、頂點屬性B.收集鄰居頂點的頂點IdC.向指定頂點發送信息并聚合信息D.將頂點信息更新到圖中答案:D19.Dstream輸出操作中()方法在Driver中打印出DStream中數據的前12個元素。A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles答案:C20.Scala函數組合器可以通過一個函數重新計算列表中所有元素,并且返回一個相同數目元素的新列表的方法是()A.mapB.foreachC.flattenD.flatmap答案:A21.spark-submit配置項中()表示啟動的executor數量A.-num-exe
7、cutors NUMB.-executor-memory MEMC.-total-executor-cores NUMD.-executor-coures NUM答案:A22.Spark中運行交互式SQL查詢的大規模并行查詢引擎是()A.Spark CoreB.Spark SQLC.BlinkDBD.Mllib答案:C23.以下哪個函數可以求兩個RDD的笛卡爾積()A.unionB.substractC.intersectionD.cartesian答案:D24.Scala源代碼被編譯成()字節碼,所以它可以運行于JVM之上A.SparkB.ScalaC.JavaD.JDK答案:C25.Spa
8、rk GraphX中類Graph的aggregateMessages方法可以()A.收集鄰居頂點的頂點Id和頂點屬性B.收集鄰居頂點的頂點IdC.向指定頂點發送信息并聚合信息D.將頂點信息更新到圖中答案:C二、多選題 (共 10 道試題,共 20 分)26.以下哪個方法可以創建RDD()A.parallelizeB.makeRDDC.textFileD.loadFile答案:ABC27.Spark DataFrame中()方法可以返回一個Array對象A.collectB.takeC.takeAsListD.collectAsList答案:AB28.PairRDD中()函數可以進行分組A.ma
9、pValuesB.groupByC.groupByKeyD.reduceByKey答案:BC29.MLBase包括()A.MllibB.MLIC.SparkRD.GraphX答案:AB30.決策樹是()的常用算法A.分類B.聚類C.降維D.回歸答案:AD31.Spark的RDD持久化操作有()方式A.cacheB.presistC.storageD.long答案:AB32.Scala中可以用()方法來連接兩個或多個列表A.:B.#:C.List.:()D.List.concat()答案:BCD33.Spark是一個()計算框架A.快速B.分布式C.可擴展D.容錯答案:ABCD34.Spark可
10、以從()分布式文件系統中讀取數據A.HDFSB.HbaseC.HiveD.Tachyon答案:ABCD35.Spark中DataFrame的()方法是查詢指定字段的數據信息A.selectB.selectExprC.colD.apply答案:ABCD三、判斷題 (共 15 道試題,共 30 分)36.Scala函數組合器中flatmap結合了map和flatten的功能,接收一個可以處理嵌套列表的函數,然后把返回結果連接起來答案:正確37.DataFrame是一個分布式的Row對象的數據集合答案:正確38.Scala列表中last返回一個列表,包含除了第一個元素之外的其他元素答案:錯誤39.S
11、park Streaming中時間片也可稱為批處理時間間隔(batch interval),時間片是人為地對數據進行定量的標準,作為拆分數據的依據,一個時間片的數據對應一個RDD 實例。答案:正確40.PairRDD中mapValues是針對鍵值對(Key,Value)類型的數據中的key和Value進行Map操作答案:錯誤41.RDD的subtract用于用于將前一個RDD 中在后一個RDD 出現的元素刪除答案:正確42.RDD中join操作最后只返回兩個RDD 都存在的鍵的連接結果。答案:正確43.RDD的filter函數返回一個存儲符合過濾條件的所有元素的新RDD答案:正確44.Scala中數組的第一個元素索引為1答案:錯誤45.RDD的行動操作是用于觸發轉換操作的操作,這個時候才會真正開始進行計算。答案:正確46.Spark中DataFrame 的查詢操作也是一個懶操作, 僅僅生成一個查詢計劃, 只有觸發Action
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 蕪湖小作坊管理制度
- 英語繪本館管理制度
- 草原屬書屋管理制度
- 膽固醇測定試劑盒分析性能評估資料
- 讓人舒服的溝通技巧
- 財務會計工作職責和內容感想總結范文15篇
- 財務會計業務知識題庫真題
- 試驗檢測師(公共基礎)考試歷年真題題庫(含答案)
- 江蘇省常州市前黃高級中學2025屆高三下學期攀登行動(一)地理試卷(含答案)
- 湖南省2025年中考地理真題(含答案)
- 《湖南省職工基本醫療保險門診慢特病基礎用藥指南(第一批)》
- 四川省南充市2023-2024學年高一下學期期末考試歷史題
- 2024年中考地理真題(帶答案)
- GB/T 718-2024鑄造用生鐵
- 人力資源管理體系設計全案
- 八年級地理會考復習知識點
- 屠戶吹狼閱讀答案
- GJB3206B-2022技術狀態管理
- SYT 6883-2021 輸氣管道工程過濾分離設備規范-PDF解密
- JTJ-248-2001港口工程灌注樁設計與施工規程-PDF解密
- 2024年4月自考00840第二外語(日語)試題
評論
0/150
提交評論