華為大數據練習(習題卷4)_第1頁
華為大數據練習(習題卷4)_第2頁
華為大數據練習(習題卷4)_第3頁
華為大數據練習(習題卷4)_第4頁
華為大數據練習(習題卷4)_第5頁
已閱讀5頁,還剩18頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

試卷科目:華為大數據練習華為大數據練習(習題卷4)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages華為大數據練習第1部分:單項選擇題,共47題,每題只有一個正確答案,多選或少選均不得分。[單選題]1.關于RDD,下列說法錯誤的是:()。A)RDD具有血統機制(Lineage)B)RDD默認存儲在磁盤C)RDD是一個只讀的,可分區的分布式數據集D)RDD是Spark對基礎數據的抽象答案:B解析:[單選題]2.Gremlin中查詢單個點的信息該用什么命令?()A)gV().hasLabel(?test?).values(?age?)B)gV().hasLabel(?test?).valueMap(?String_list?,?age?)C)gV().hasLabel(?test?)D)gV(13464736).valueMap()答案:D解析:[單選題]3.HDFS中的主備仲裁,是由:()組件控制的。A)ZookeeperFailoverControllerB)NodeManagerC)ResourceManagerD)HDFSClient答案:A解析:[單選題]4.HBase不支持哪些SQL操作?()A)HiveSQLB)SparkSQLC)MySQLD)PhoenixSQL答案:C解析:[單選題]5.在進行整庫遷移時源端數據源類型為Oracle,目的端數據類型不支持:()。A)RDSforMySQLB)MRS(Hive)C)CSSD)DWS答案:C解析:[單選題]6.網站在運營過程中,會有用戶訪問并產生行為數據,要想對這些數據進行處理挖掘,如果是離線批處理下的方案配置,描述不正確的是()A)數據導入導出,LoaderB)數據采集傳輸:F1umeC)數據計算,StormD)數據存儲.HDFS或MySql答案:C解析:[單選題]7.DAYU批量數據遷移(CloudDataMigration)提供()數據源之間批量數據遷移服務,幫助您實現數據自由流動。A)同構B)異構C)同構/異構D)架構答案:C解析:[單選題]8.CSN的推進和分配在()管理。A)GTMB)CNC)DND)CM_SERVER答案:A解析:[單選題]9.下列關于HBase的BloomFilter特性理解正確的是:()。A)用來過濾數據B)用來優化隨機讀取的性能C)會增加存儲的消耗D)可以準確判斷某條數據不存在答案:C解析:[單選題]10.Hadoop中MapReduce組件擅長處理()場景的計算任務。A)迭代計算B)離線計算C)實時交互計算D)流式計算答案:B解析:[單選題]11.存儲過程的調用有幾種方式()?A)3B)1C)4D)2答案:D解析:[單選題]12.Zookeeper的Scheme認證方式不包括:()。A)digestB)saslC)authD)world答案:B解析:[單選題]13.采集數據字典首先應該()。A)啟動extractorB)對數據庫用戶授權C)配置連接信息D)安裝驅動包答案:A解析:[單選題]14.某項目小組接到一個大數據實時分析項目,且對實時性要求很高。請問以下哪種大數據計算框架最合適?()A)MapReduceB)HRaseC)SparkD)Flink答案:D解析:[單選題]15.哪個產品適應于OLAP場景?()A)PostgresSQLB)SQLServerC)MySQLD)GaussDB200答案:D解析:[單選題]16.數據訂閱功能將數據庫中關鍵業務的數據變化信息緩存并提供統一的SDK接口,方便下游業務訂閱、獲取、并消費,關于數據訂閱服務開發環境使用的JAVA版本SDK版本,描述正確的是:()。A)JDK1.5以上版本B)JDK1.8以上版本C)JDK1.7以上版本D)JDK1.6以上版本答案:D解析:[單選題]17.如果需要由數據生產者決定數據發送給目標Blot的某一個確定的Task,應該選擇以下()消息發布策略。A)局部字段分組B)廣播分組C)直接分組D)全局分組答案:C解析:[單選題]18.關于GaussDB200的發展史,下列說法錯誤的是()?A)GaussDB200已經在華為云發布了云化產品。B)GaussDB200專注國內業務,不涉及海外。C)GaussDB200從-開始就支持ARM架構的部署。D)GaussDB200前身叫GaussDB,是GaussDB的子項目。答案:B解析:[單選題]19.下面哪個數據類型不是GaussDB200支持的數據類型()?A)JSON類型B)貨幣類型C)數值類型D)XML類型答案:D解析:[單選題]20.ume中的JDBCChannel內置數據庫是哪個?()A)MySqlB)SqlServerC)DerbyD)Oracle答案:C解析:[單選題]21.當ElasticSearch集群有節點加入或退出時,集群數據會發生什么動作?()A)數據重載B)數據重建C)數據重分布D)數據更新答案:C解析:[單選題]22.將數據塊存儲大小設置為128M,HDFS客戶端在寫文件時,當寫入一個100M大小的文件,實際占用儲存空間為:()。A)128MB)100MC)64MD)50M答案:B解析:[單選題]23.銀行進行客戶購買力分析,首先獲取客戶歷史賬單,確定其中各項商品的計算權重,得出每位客戶的購買力評分并存儲記錄。最后將結果以圖表顯示。請問該過程對應于以下哪個項目數據流程設計。()A)數據可視化->數據源->數據落地->數據處理B)數據源->數據落地→>數據處理->數據可視化C)數據源->數據處理->數據落地->數據可視化D)數據可視化->數據源->數據處理->數據落地答案:C解析:[單選題]24.SDK是消費者在調用API時,需要在請求Header頭中添加身份認證信息,而這個操作比較繁瑣,故我們為使用者提供了SDK,簡化用戶操作。目前華為SDK支持:()種語言的支持。A)7B)8C)9D)10答案:C解析:[單選題]25.Hive常被用來處理()場景。A)事務性處理B)批量計算C)實時性計算D)流計算答案:B解析:[單選題]26.GraphBase能夠處理海量數據的原因是什么?()A)基于Elasticsearch的索引機制B)基于HBase的分布式存儲機制C)基于Spark的分布式內存計算技術D)圖機制特性答案:B解析:[單選題]27.下列選項中適合MapReduce的場景有:()。A)實時交互計算B)迭代計算C)流式計算D)離線計算答案:D解析:[單選題]28.數據中臺功能架構中數據資產管理包含:()能力。A)安全管理B)數據開發C)數據資產目錄D)計量管理答案:C解析:[單選題]29.以下關于DataNode的描述不正確的是?()A)DataNode執行數據塊的讀/寫操作。B)DataNode管理數據塊元數據。C)DataNode的數量受數據規模影響。D)DataNode是用來存儲數據塊。答案:B解析:[單選題]30.有如下存儲過程,CREATEORREPLACEPROCEDUREprc_1(param1ININTEGERDEFAULT3,param2INOUTINTEGER)ASBEGINParam2:=paraml+param2;RETURN:END:調用如上存儲過程callprc_1(2,1),結果是()?A)1B)2C)4D)3答案:D解析:[單選題]31.以下關于數據收集工具的描述,不準確的是?()A)Loader是實現FusionInsightHD與關系型數據庫、文件系統之間交換數據和文件的數據加載工具。B)Loader提供了本集群內部HDFS和HBase之間的數據導入或導出。C)Saoop是一款開源的工具,主要用于在Hive與傳統的數據庫間進行數據的傳遞,可以將關系型數據庫中的數據導入到Hadoop的HDFS中,也可將HDFS的數據導出到關系型數據庫中。D)Kett1e是一款國外開源的ETL工具,純java編寫,目前僅可以在Linux上運行,數據抽取高效穩定。答案:D解析:[單選題]32.Elasticsearch采用的搜索方式是?()A)倒排索引B)快速索引C)正排索引D)慢索引答案:A解析:[單選題]33.以下()工具可以實現大量數據的快速導入和導出。A)gsqlB)GDSC)DataStudioD)DSC答案:B解析:[單選題]34.下面關于ACID解釋錯誤的是:()。A)A-atomictty原子性:事務的所有操作要么全部完成,要么全部不完成B)C-consistency一致性:事務始終保證系統處于一致性的狀態,不影響一致性C)I-Isolation隔離性:事務執行是隔離的,3個隔離級別D)D-Durability持久性:事務的結果是持久的答案:C解析:[單選題]35.關于Hive在FusionInsightHD中的架構描述錯誤的是:()。A)只要有一個HiveServer不可用,整個Hive集群便不可用B)MotaStore用于提供元數據服務,依賴于DBServiceC)在同一時間點、HiveServer只要一個處于Active狀態,另一個則處于Standby狀態D)HiveServer負責接收客戶端請求.解析.執行HQL命令并返回查詢結果答案:A解析:[單選題]36.GaussDB200在創建表時,需要注意以下哪些事項()?A)創建列存表之后,后續可以修改為行存表。B)創建列存表時壓縮級別默認為HIGH。C)如果指定表空間為普通表空間,創建表時默認是行式存儲。D)創建一個行存表之后,后續可以修改為列存表。答案:C解析:[單選題]37.如果要在某個模式下創建對象,該用戶對此模式應具有:()權限。A)EXECUTEB)SELECTC)CREATED)USAGE答案:C解析:[單選題]38.在Flink的運行過程中,負責申請資源的角色是:()。A)ResourceManagerB)JobManagerC)ClientD)TaskManager答案:B解析:[單選題]39.Kafka集群中,Kafka服務端的角色是:()。A)BrokerB)ConsumerC)ZookeeperD)Producer答案:A解析:[單選題]40.下列關于存儲過程的特點說法正確的是()A)編寫的SQL存儲在數據庫中,因此執行速度快。B)創建時編譯,執行時調用,因此開發效率高。C)用戶創建的存儲過程或自定義函數可以重復調用,因此數據傳輸量少。D)通過指定存儲過程的訪問權限,因此安全系數高。答案:D解析:[單選題]41.在FusionInsightLibrA中,下列()命令可以用于創建復制表。A)createtableregion1(ctid_valueint)distributebyreplicationB)createtableregion1(ctid_valueint);C)Createtableregion1(ctid_valueint)replication;D)以上都不正確;答案:A解析:[單選題]42.關于表連接算子的說法錯誤的是()?A)聚合操作如groupby會觸發NergeJoin.B)表連接算子主要有Nestloop、MergeJoin、MinorJoin、HashJoin.C)算子的選擇是SQL根據邏輯自行選擇的,與人為無關。D)默認情況下,執行效率來說HashJoin最高。答案:D解析:[單選題]43.以下關于HiveSQL基本操作描述正確的是:()。A)加載數據到Hive時數據必須是HDFS的一個路徑B)創建外部表必須要指定location信息C)創建外部表使用external關鍵字,創建普通表需要指定internal關鍵字D)創建表時可以指定列分隔符答案:D解析:[單選題]44.下列哪個選項可用于查詢E1asticSearch的索引?()A)cur1-XGET'http://ip:httpport/name/type/indexID?pretty'B)cur1-XPOST'tp://ip:httpport/name/type/indexID?pretty'-H'Content-Type:application/json'-d'{}?C)cur1-XGET'http://ip:httpport/cat/indices?vD)cur1-XGET?http://ip:httpport/_cluster/health?pretty?答案:C解析:[單選題]45.當一個MapReduce應用程序被執行時,如下()動作是map階段之前發生的。A)splitB)combineC)partitionD)sort答案:A解析:[單選題]46.Flink的哪種機制可以保證task運行失敗時,其狀態能夠恢復?()A)窗口B)有狀態處理C)事件時間D)檢查點答案:D解析:[單選題]47.關于Hive建表基本操作,描述正確的是:()。A)一旦表建好,不可再修改表名B)一旦表建好,不可再增加新列C)創建外表時需要指定external關鍵字D)一旦表建好,不可再修改列名答案:C解析:第2部分:多項選擇題,共31題,每題至少兩個正確答案,多選或少選均不得分。[多選題]48.在產品選型時,數據中臺邏輯架構中分析層要重點關注產品的特點包含:()方面。A)批量刪除能力B)強資源隔離能力C)高并發的查詢能力D)強大的OLTP能力答案:BC解析:[多選題]49.以下哪些是離線批處理的特點?()A)處理數據格式多樣B)支持SQL類作業和自定義作業C)處理數據量巨大D)處理時間要求高答案:ABC解析:[多選題]50.整庫遷移支持的源端數據源類型有:()。A)MySQLB)OracleC)HiveD)DWS答案:ABCD解析:[多選題]51.Kerberos安全認證必須有下列的哪些?()A)krb5.conf配置文件B)用戶名C)用戶的keytab文件D)Jaas.conf配置文件答案:ABC解析:(D)這個配置文件只有在訪問Zookeeper組件時才需要,而且在FusionInsightC60版本以后,樣例代碼中已經提供了統一認證工具類,通過這個類的API生成jaas對象,不需再要求提供jaas.conf配置文件了。[多選題]52.Loader提供了()方式或接口實現作業管理。A)WebUIB)Linux命令行C)Rest接口D)JavaAPI答案:ABCD解析:[多選題]53.Flume由哪三部分組成?()A)MasterB)SinkC)SourceD)Channel答案:BCD解析:[多選題]54.以下關于Redis中set數據類型srandmemberkey[count]命令的描述哪些是正確的?()A)如果count為負數,那么命令返回一個數組,數組中的元素可能會重復出現多次,而數組的長度為count的絕對值。B)如果count為正數,且小于集合基數,那么命令返回一個包含count個元素的數組,數組中的元素各不相同。C)如果count大于等于集合基數,那么返回整個集合。D)如果count為負數,那么命令返回一個數組,數組中的元素各不相同,且數組的長度小于count的絕對值。答案:ABC解析:[多選題]55.下面關于GaussDB200的邏輯集群說法正確的是()?A)一個物理節點對應一個邏輯集群。B)邏輯集群的意思就是通過物理服務器的隔離來達到數據的分離處理。C)邏輯集群的最終目的的是實現資源隔離及資源彈性能力。D)在邏輯集群上實現多租戶管理,達到CPU、內存等計算資源的控制隔離。答案:BCD解析:[多選題]56.以下哪些是HDFS的核心組件?()A)ClientB)NameNodeC)DataNodeD)Product答案:ABC解析:[多選題]57.以下關于Hbase文件存儲模塊描述正確的有:()。A)應用在FusionInsightHD的上層應用B)HFS封裝了Hbase與HDFS的接口C)為上層應用提供文件存儲、讀取、刪除等功能D)HFS是:Hbase的獨立模塊答案:ABCD解析:[多選題]58.FusionlnsightHD中,()屬于Oozie的MapReduceAction的配置項。A)name-nodeB)sourceC)mapred.mapper.classD)job-tracker答案:ACD解析:[多選題]59.下列關于無共享Master架構的特點描述正確的有:()。A)所有:節點對等B)可通過任意節點查詢或加載數據C)不存在單點性能瓶頸和單點風險D)無法保證數據一致性答案:ABC解析:[多選題]60.StructuredStreaming支持的數據源包括?()A)HDFSB)KafkaC)SocketD)RateStream答案:ABCD解析:[多選題]61.___加___的組合滿足了大部分的用戶實時查詢訴求?()A)MapReduceB)HBaseC)ElasticSearchD)Hive答案:BC解析:[多選題]62.創建數據庫可以指定兼容()參數。A)MySQLB)OraC)TDD)SQLServer答案:BC解析:[多選題]63.數據集成功能包括:()。A)表/文件/整庫遷移B)增量數據遷移C)事務模式遷移D)字段轉換答案:ABCD解析:[多選題]64.對于GaussDB200而言,字段的設計應該注意以下哪些事項()?A)在滿足業務精度的情況下,NUKREIC的優先級比浮點數高。B)盡量使用符合實際業務描述的字段。C)盡量使用高效率的字段類型.D)考慮數據美觀,盡量使用同一種數據類型,比如Text.答案:ABC解析:[多選題]65.對GaussDB200CUDesc機制描述正確的是?()A)CUDesc為列存表B)采用Min/Max稀疏索引C)列存表的輔助表D)每條記錄對應一個CU(60Krows)答案:BCD解析:[多選題]66.下列關于FusionInsightLibrA行存儲和列存儲的使用場景描述正確的有:()。A)列存儲適用于統計分析類查詢(group,join多的場景)B)行存儲適用于點查詢(返回記錄少,基于索引的簡單查詢)C)列存儲適用于點查詢(返回記錄少,基于索引的簡單查詢)D)行存儲適用于即席查詢(查詢條件列不確定,行存無法確定索引)答案:AB解析:[多選題]67.HBase表設計中的Rowkey設有哪些策略?()A)可枚舉屬性值少的放在前面B)訪問權重高的屬性值放在前面C)部分查詢頻繁字段做冗余存儲D)RowKey的長度越長越好答案:ABC解析:RowKey并不是長度越長越好,因為L(1)因為HBase是K-V模型,Rowkey過長必然會使數據量過度膨脹。L(2)RowKey過程會影響每次RPC的數據量,在一定程度上會影響查詢性能。[多選題]68.數據字典能修改的內容包括:()。A)數據字典的類型B)數據字典類型的子項C)數據字典名稱D)數據字典的層級答案:AB解析:[多選題]69.GaussDB200支持的語法包括()A)DQL(數據查詢語言)B)DDL(數據定義語言)C)DML(數據操作語言)D)DCL(數據控制語言)答案:BCD解析:[多選題]70.哪些方式能夠操作HBase的數據?()A)客戶端命令B)PhoenixSQLC)JavaAPID)HiveSQL答案:ABCD解析:[多選題]71.某開發團隊要使用ElasticSearch做檢索工具,下列哪些選項可以用E1asticSearch檢索?()A)向量化數據B)xml文檔C)圖片D)關系型數據庫數據答案:ABCD解析:[多選題]72.API網關是:華為云提供的一個API托管的應用服務,API網管包括的功能有:()。A)API全生命周期的管理B)權限控制C)訪問控制D)流量控制答案:ABCD解析:[多選題]73.對于HBaserowkey的設計原則,如下描述正確的是:()。A)訪問權重高的屬性值放在RowKey前面B)訪問權重高的屬性值放在Rowkey后半部分C)離散度好的屬性值放在Rowkey前半部分D)離散度好的屬性值放在Rowkey后半部分答案:AC解析:[多選題]74.關于Hbase存儲模型的描述正確的是:()。A)即使是:key值相同,qualifier也相同的多個KeyValue也可能有:多個,此時使用時間戳來區分B)同一個key值可以關聯多個valueC)keyvalue中期有:時間戳,類型等關鍵信息D)每一個keyvalue都有:一個qualifier標識答案:ABCD解析:[多選題]75.Kafka每個Partition在物理上對應的文件夾下存儲哪些文件?()A)索引文件B)用戶文件C)消息文件D)配置文件答案:AC解析:每個partition中有可以分為多個segmentfile。當生產者往partition中存儲數據時,內存中存不下了,就會往segmentfile里面存儲。kafka默認每個segmentfile的大小是500M,在存儲數據時,會先生成一個segmentfile,當這個segmentfile到500M之后,再生成第二個segmentfile以此類推。每個segmentfile對應兩個文件,分別是以.log結尾的數據文件和以.index結尾的索引文件。在服務器上,每個partition是一個文件夾,每個segment是一個文件。[多選題]76.對資產搜索結果,可以基于條件進行篩選,下列篩選條件中支持類別有:()。A)數據連接B)類型C)密級D)大小答案:ABC解析:[多選題]77.CDM支持對已創建的連接進行()操作。A)編輯B)測試連通性C)備份連接D)刪除連接答案:ABD解析:[多選題]78.afka中刪除消息的閾值有哪幾種?()A)分區總日志大小B)硬盤總空間大小C)數據產生的時間D)數據使用的頻率答案:AC解析:第3部分:判斷題,共10題,請判斷題目是否正確。[判斷題]79.Spark根據RDD的依賴關系來劃分stage,調度器從DAG圖末端出發,逆向遍歷整個依賴關系,遇到窄依賴就斷開,遇到寬依賴就將其加入當前stage。A)正確B)錯誤答案:錯解析:[判斷題]80.數據訂閱成功后,如果不及時進行消費,新產生的數據最多保留3天。A)正確B)錯誤答案:對解析:[判斷題]81.每個DRS備份遷移實例最多支持10個標簽配額。A)正確B)錯誤答案:對解析:[判斷題]82.Flume架構中,一個source可以連接多個Channel。A)正確B)錯誤答案:對解析:[判斷題]83.Kafka中Partitionreplication之間同步數據,從partition的leader復制數據到follower需要線程(replicationFetcherThread),Follower主動從Leader批量拉取消息的,極大地提高了吞吐量。A)正確B)錯誤答案:對解析:[判斷題]84.FusionlnsightHD的Hive中,用戶自定義的UDF可以和Hive內置的UDF重名,這種情況下,將使用用戶自定義的UDF。A)正確B)錯誤答案:錯解析:[判斷題]85.FULLJOIN和CROSSJOIN結果等同。A)正確B)錯誤答案:錯解析:[判斷題]86.為解決通過DB數據記錄采集適配器采集元數據,通過DB數據采集配置將DB記錄中記錄與元模型進行映射。A)正確B)錯誤答案:對解析:[判斷題]87.圖形化的健康巡檢工具FusionInsightTool由FusionCare和SysChecker兩部分組成。A)正確B)錯誤答案:對解析:[判斷題]88.Flume的數據流可以根據headers的信息發送到不同的Channel中。A)正確B)錯誤答案:對解析:第4部分:問答題,共12題,請

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論