大數據開發基礎(習題卷40)_第1頁
大數據開發基礎(習題卷40)_第2頁
大數據開發基礎(習題卷40)_第3頁
大數據開發基礎(習題卷40)_第4頁
大數據開發基礎(習題卷40)_第5頁
已閱讀5頁,還剩18頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

試卷科目:大數據開發基礎大數據開發基礎(習題卷40)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數據開發基礎第1部分:單項選擇題,共57題,每題只有一個正確答案,多選或少選均不得分。[單選題]1.在DIKW金字塔中屬于未來的是()。A)信息B)數據C)知識D)智慧答案:D解析:[單選題]2.因業務需要,確需向境外提供數據的,應當按照國家有關部門制定的辦法進行(),并經公司保密辦與業務主管部門審批,視情況向國家有關部門報備。A)安全評估B)規模評估C)質量鑒定D)分類處理答案:A解析:[單選題]3.以下對網絡空間的看法,對的是:()A)網絡空間是虛擬空間,不需要法律B)網絡空間雖然與現實空間不同,但同樣需要法律C)網絡空間是一個無國界的空間,不受一國法律約束D)網絡空間與現實空間分離,現實中的法律不適用于網絡空間答案:B解析:[單選題]4.執行一個job,如果這個job的輸出路徑已經存在,那么程序會()。A)覆蓋這個輸出路徑B)拋出警告,但是能夠繼續執行C)拋出一個異常,然后退出D)創建一個新的輸出路徑答案:C解析:[單選題]5.從數據到智慧的轉換依次遞進過程是()。A)數據、知識、信息、理解、智慧B)數據、信息、理解、知識、智慧C)數據、信息、知識、理解、智慧D)數據、理解、信息、知識、智慧答案:C解析:[單選題]6.Python中用()快捷鍵表示運行當前程序。A)Ctrl+F10B)Ctrl+Alt+F10C)Shift+F10D)Ctrl+Shift+F10答案:D解析:Python中表示運行當前程序的快捷鍵是Ctrl+Shift+F10。241[單選題]7.p尾法確定圖像分割的閾值,適用于(__)的情況。A)已知閾值范圍B)已知圖像灰度范圍C)已知目標所占全圖象百分比D)圖像類間方差最大化答案:C解析:[單選題]8.有如下存儲過程,CREATEORREPLACEPROCEDUREprc_1(paranllNINTEGERDEFAULT3,param2INOUTINTEGER)ASBEGINParam2:=paraml+param2;RETURN;END:調用如上存儲過程callprc_1(2,1).結果是(?A)1B)2C)4D)3答案:D解析:[單選題]9.執行以下代碼段classGraph():def__init__(self):self.a=10defaction(self):self.a//=4classMyGraph(Graph):def__init__(self):self.a=8self.b=4defaction(self):self.a+=7self.b**=2classLastGraph(MyGraph):passg1=MyGraph()g2=LastGraph()g1.action()g2.action()print(g1.a)print(g2.b)時,輸出為()。A)158B)1516C)1716D)916答案:B解析:[單選題]10.在模型評估與度量的方法中,(__)直接將數據集劃分為兩個互斥的集合,一個作為訓練集,另一個作為測試集。A)自助法B)留出法C)交叉驗證法D)錯誤率分析答案:B解析:[單選題]11.下列OLAP中,無需預先建模的是:()。A)HOLAPB)MOLAPC)ADSD)ROLAP答案:C解析:[單選題]12.人與人之間溝通信息.傳遞信息的技術,這指的是()。A)感測技術B)微電子技術C)計算機技術D)通信技術答案:D解析:[單選題]13.()常用于詞云圖的繪制,詞云是一種直觀展示數據頻率的圖表類型,可以對出現頻率較高的?關鍵詞?予以視覺上的突出,形成?關鍵詞云層?,從而過濾掉大量的文本信息,使瀏覽者只要一眼掃過文本就可以領略重點。A)文本圖B)熱力點圖C)面積圖D)雷達圖答案:A解析:[單選題]14.要從文件對象infile中讀取文件的余下行,我們使用()。A)infile.read(2)B)infile.read()C)infile.readline()D)infile.readlines()答案:D解析:[單選題]15.如果要回滾一個事務,則要使用()語句。A)committransactionB)begintransactionC)revokeD)rollbacktransaction答案:D解析:[單選題]16.下列關于決策樹的說法錯誤的是()。A)冗余屬性不會對決策樹的準確率造成不利的影響B)子樹可能在決策樹中重復多次C)決策樹算法對于噪聲的干擾非常敏感D)尋找最佳決策樹是NP完全問題答案:C解析:決策樹算法對于噪聲的干擾具有相當好的魯棒性。[單選題]17.Hadoop的HBase不適合哪些數據類型的應用場景A)大文件應用場景B)海量數據應用場景C)高吞吐率應用場景D)半結構化數據應用場景答案:A解析:[單選題]18.F1參數的大小反映了模型的(__)。A)準確度B)誤差C)穩定性D)偏差答案:C解析:[單選題]19.平均濾波對(__)的表現比較好。A)泊松噪聲B)高斯噪聲C)乘性噪聲D)椒鹽噪聲答案:B解析:[單選題]20.下列哪個不是Python的應用領域()。A)Web開發B)科學計算C)游戲開發D)操作系統管理答案:D解析:[單選題]21.以下關于不帶參數的函數的格式書寫正確的是()A)defcheckB)def1check()C)defcheck():D)defcheck()答案:C解析:[單選題]22.下列關于Logistic回歸和SVM的描述不正確的是()。A)Logistic回歸本質上是一種根據樣本對權值進行極大似然估計的方法,用先驗概率的乘積代替后驗概率B)Logistic回歸的輸出就是樣本屬于正類別的概率C)SVM的目標是找到使得訓練數據盡可能分開且分類間隔最大的超平面,屬于結構風險最小化D)SVM可以通過正則化系數控制模型的復雜度,避免過擬合答案:A解析:Logistic回歸目標函數是最小化后驗概率,Logistic回歸可以用于預測事件發生概率的大小,SVM目標是結構風險最小化,SVM可以有效避免模型過擬合。[單選題]23.數據倉庫的最終目的是()。A)收集業務需求B)建立數據倉庫邏輯模型C)為用戶和業務部門提供決策支持D)開發數據倉庫的應用分析答案:C解析:[單選題]24.下列有關KNN算法的流程順序,描述正確的是()①確定K的大小,和距離的計算方法②根據K個樣本的所屬類別,投票決定測試樣本的類別歸屬③計算訓練集樣本與測試樣本的距離,選出K個與測試樣本最相似的樣本A)、①②③B)、③②①C)、①③②D)、②①③答案:C解析:[單選題]25.Redis中String數據類型不含以下哪種操作?A)MgetB)sizeC)strlenD)append答案:B解析:[單選題]26.大數據整合要保證各個數據源之間的()。A)一致性、協調性B)差異性、協調性C)一致性、差異性D)一致性、相容性答案:D解析:[單選題]27.在HDFS中()是文件系統的工作節點。A)DataNodeB)ClientC)NameNodeD)Flume答案:A解析:[單選題]28.有關系S(S#,SNAME,SAGE),C(C#,CNAME),SC(S#,C#,GRADE)。其中S#是學生號,SNAME是學生姓名,SAGE是學生年齡,C#是課程號,CNAME是課程名稱。要查詢選修?ACCESS?課的年齡不小于20的全體學生姓名的SQL語句是SELECTSNAMEFROMS,C,SCWHERE子句。這里的WHERE子句的內容是()。A)SAGE>=20andCNAME=?ACCESS?B)S.S#=SC.S#andC.C#=SC.C#andSAGEin>=20andCNAMEin?ACCESS?C)SAGEin>=20andCNAMEin?ACCESS?D)S.S#=SC.S#andC.C#=SC.C#andSAGE>=20andCNAME=?ACCESS?答案:D解析:[單選題]29.LSTM與RNN相比可以解決()。A)梯度消失B)訓練結果發散C)需要激活函數D)無法處理長距離的依賴的問題答案:D解析:[單選題]30.下列哪項關于模型能力(modelcapacity)的描述是正確的?(指模型能近似復雜函數的能力)A)隱層層數增加,模型能力增加B)Dropout的比例增加,模型能力增加C)學習率增加,模型能力增加D)都不正確答案:A解析:[單選題]31.DRDS默認每個實例創建()數據庫。A)16個B)64個C)1個D)8個答案:D解析:[單選題]32.部署Hive時元數據信息通常存在哪個數據庫中A)SqlServerB)HBaseC)MySqlD)OracleRAC答案:C解析:[單選題]33.考慮這么一種情況:一個對象碰巧與另一個對象相對接近,但屬于不同的類,因為這兩個又餓一般不會共享許多近鄰,所以應該選擇()的相似度計算方法A)平方歐幾里德距離B)余弦距離C)直接相似皮D)共享最近鄰答案:D解析:[單選題]34.智能數據湖運營平臺指的是以下哪個選項?A)VAS(videoAnalysisService)B)ModelArtsC)cSSD)DAYU答案:D解析:[單選題]35.以下關于同步賦值語句描述錯誤的選項是:A)同步賦值能夠使得賦值過程變得更簡潔B)判斷多個單一賦值語句是否相關的方法是看其功能上是否相關或相同C)設x,y表示一個點的坐標,則x=a;y=b兩條語句可以用x,y=a,b一條語句來賦值D)多個無關的單一賦值語句組合成同步賦值語句,會提高程序可讀性答案:D解析:[單選題]36.L表示模糊分類器的特征關鍵詞,由T推導出模糊集F,以下哪個算法可以計算不同F之間的關聯度?()A)、SVMB)、EWC、C)、SRD)、EM答案:C解析:[單選題]37.在HBase中,查看表屬性的命令是()A)select'my_ns:my_table'B)show'my_ns:my_table'C)describe'my_ns:my_table'D)look'my_ns:my_table'答案:C解析:[單選題]38.下面除了哪一項外均能準確描述Hadoop()A)開源B)實時C)基于JavaD)分布式計算答案:B解析:[單選題]39.以下哪一項不是Spark框架可用的數據源?A)IndexFSB)HDFSC)S3D)Cassandra答案:A解析:[單選題]40.定義類如下:classA():defa():print(?a?)classB():defb():print(?b?)classC():defc():print(c)classD(A,C):defd():print(?d?)d=D()d.a()d.b()d.d()以下程序能執行的結果是A)a,b,dB)a,dC)d,aD)執行會報錯答案:D解析:[單選題]41.下面哪一項不屬于計算機集群中的節點?A)主節點(MasterNode)B)源節點(SourceNode)C)名稱結點(NameNode)D)從節點(SlaveNode)答案:B解析:[單選題]42.后剪枝是先從訓練集生成一顆完整的決策樹,然后()對非葉結點進行考察。A)自上而下B)在劃分前C)禁止分支展開D)自底向上答案:D解析:[單選題]43.下列聲明游標的語法格式中,正確的是()。--A)DECLAREcursor_nameCURSORFORselect_statementB)CURSORcursor_nameFORselect_statementC)DECLAREcursor_nameCURSOROFselect_statementD)CURSORcursor_nameOFselect_statement答案:A解析:[單選題]44.一件商品僅有一個分類,而一個分類可有多件商品,則商品與分類的關系是()。--A)1:1B)1:nC)n:1D)n:m答案:C解析:[單選題]45.(__)是將?現實生活中的問題?轉換為?數據世界中的問題?,然后采用數據科學的理念、原則、方法、技術、工具,通過將數據、尤其的大數據,轉換為知識和智慧。A)數據工程師B)數據碼農C)數據科學家D)科學家答案:C解析:[單選題]46.Spark的()組件用于支持實時計算需求。A)SparkSQLB)SparkStreamingC)SparkGraphXD)SparkMLLib答案:B解析:SparkStreaming用于實時處理。[單選題]47.Hbase的某張表的RowKey劃分Splitkey為9.E.a.z.請問表里面有()個Region。A)6B)5C)4D)3答案:B解析:[單選題]48.數據安全管理是通過制定和實施相關安全策略和措施,確保數據在收集、傳輸、存儲、處理、使用和()各環節的安全。A)歸檔B)發布C)推廣D)銷毀答案:D解析:[單選題]49.s=0n=int(input())foriinrange(1,n+1):a1=0forjinrange(1,i+1):a1+=ja=1.0/a1s+=aprint("s=%.1f"%s)當輸入的n為4時,輸出S=()。A)1.5B)1.4C)1.6D)1.7答案:C解析:[單選題]50.下列企業中,最有可能成為典型的數據資產運營商的是()A)物聯網企業B)互聯網企業C)云計算企業D)電信運營商答案:D解析:[單選題]51.selectget_json_object('{"name":"jack","score":"100"}','$.name')的結果是A)nameB)jackC)scoreD)100答案:B解析:[單選題]52.圖像中虛假輪廓的出現就其本質而言是()。A)圖像的灰度級數不夠多而造成的B)圖像的空間分辨率不夠高而造成的C)圖像的灰度級數過多而造成的D)圖像的空間分辨率過高而造成的答案:B解析:[單選題]53.推動多元化新興產業發展,重點發揮公司()企業優勢,聚集產業各方,構建多方參與、共商共建共贏的多元產業生態,A)聚集型B)共享型C)樞紐型D)計劃型答案:C解析:[單選題]54.執行以下代碼段t=(1,2)print(2*t)時,輸出為()。A)(1,2,1,2)B)[1,2,1,2]C)(1,1,2,2)D)[1,1,2,2]答案:A解析:第2部分:多項選擇題,共23題,每題至少兩個正確答案,多選或少選均不得分。[多選題]55.下列有關MapReduce計算框架的描述正確的是()。A)MapReduce可以計算任務的劃分和調度B)MapReduce可完成數據的分布存儲和劃分C)MapReduce可以實現處理系統節點出錯檢測和失效恢復D)MapReduce可實現處理數據與計算任務的同步答案:ABCD解析:[多選題]56.Hadoop的HBase主要特點有哪些?A)高可靠性B)高性能C)面向列D)可伸縮答案:ABCD解析:[多選題]57.(__)主要關注的是過去。A)描述性分析B)診斷性分析C)預測性分析D)規范性分析答案:AB解析:[多選題]58.屬于集合函數的的函數為()A)ArrayGetB)ArrayputC)ArrayRemoveD)MapRemove答案:ABCD解析:[多選題]59.正則表達式可以用非常靈活的方式來處理字符串,在大數據計算服務SQL中的正則函數支持POSIX格式,以下對正則表達式描述正確的有:()。A)[[:blank::]]匹配空格和TAB制表符B)$匹配行尾C)[[:alnum:]]匹配字母字符和數字字符D)[[:digint:]]匹配數字字符答案:ABCD解析:[多選題]60.相對于HadoopMapReduce,Spark的特點有()。A)通用性B)易用性C)速度快D)容錯性答案:ABC解析:[多選題]61.數據源來自于()A)課程文件B)文件夾C)關系數據庫D)FTP答案:ABCD解析:[多選題]62.WHERE可在以下()語句中實現條件判斷。--A)CREATEB)SHOWC)UPDATED)DELETE答案:CD解析:[多選題]63.華為FusionlnsightHD集群中,Spark服務可以從以下哪些服務讀取數據?A)YARNB)hdfsC)HiveD)HBase答案:BCD解析:[多選題]64.下列關于Worker答案:工作進程、Executor答案:線程、Task答案:任務說法正確的是?A)每個Executor答案:線程可以運行多個Task(任務)B)每個Worker可以運行多個Executor(線程)C)每個Worker只能為一個拓撲運行Executor(線程)D)每個Executor答案:線程可以運行不同組件答案:Spout或Bolt的Task(任務)答案:ABD解析:[多選題]65.云計算使得使用信息的存儲是一個()的方式,它會大大地節約網絡的成本,使得網絡將來越來越泛在、越來越普及,成本越來越低。A)分布式B)密集式C)共享式D)密閉式答案:AC解析:[多選題]66.全面消除配網設備同期負損,使()再上新臺階A)設備同期負損B)客戶服務質量C)企業經營績效D)清潔能源消納能力答案:ABCD解析:[多選題]67.在Hive中關于like和rlike謂詞操作符的描述正確的是()【選三項】A)like是正則,也是通配符,滿足標準SQL的標準B)rlike是正則,正則的寫法與java一樣C)RLIKE子句是Hive中查詢功能的一個擴展,其可以通過Java的正則表達式來指定匹配條件D)RLIKE的正則'\'需要寫成'\\'答案:BCD解析:[多選題]68.以下哪些學科和數據挖掘有密切聯系?A)統計B)計算機組成原理C)人工智能D)礦產挖掘答案:AC解析:[多選題]69.數據可視化狹義上與(__)概念平行,廣義上包含這些概念。A)信息可視化B)科學可視化C)可視分析學D)可視化理論答案:ABC解析:[多選題]70.主成分分析(PCA)是一種重要的降維技術,以下對于PCA的描述正確的是(___)。A)主成分分析是一種無監督方法B)主成分數量一定小于等于特征的數量C)各個主成分之間相互正交D)PCA擁有最近可分性和最大重構性等性質答案:ABC解析:[多選題]71.正則表達式中,重復元字符?*?表示()A)無匹配B)只匹配1個C)0個匹配D)多個匹配答案:CD解析:[多選題]72.集群機器無密鑰訪問設置,運行了ssh-keygen-trsa命令后,會生成(__)和(__)兩個文件。A)id_rsaB)secret_rsaC)secret_rsa.pubD)id_rsa.pub答案:AD解析:[多選題]73.下列Python文件模式中,文件會被覆蓋的是(___)。A)?r?B)?W?C)?a?D)?W+?答案:BD解析:[多選題]74.FusoninsightHD系統中使用Streaming客戶端Shell命令查看拓撲或者提交拓撲失敗,以下哪些定位手段是正確的?A)查看客戶端異常堆棧,判斷是否客戶端使用問題B)查看主Nimbus的運行日志,判斷是否Nimbus服務端異常C)查看Supervisor運行日志,判斷是否Supervisor異常D)查看Worker運行日志答案:AB解析:[多選題]75.HDFS特殊的設計,在實現優良特性的同時,也使得自身具有一些應用局限性,主要包括以下哪幾個方面?A)較差的跨平臺兼容性B)無法高效存儲大量小文件C)不支持多用戶寫入及任意修改文件D)不適合低延遲數據訪問答案:BCD解析:[多選題]76.下列哪些是傳統RDBMS的缺點()。A)表結構schema擴展不方便B)全文搜索功能較弱C)大數據場景下I/O較高D)存儲和處理復雜關系型數據功能較弱答案:ABCD解析:傳統RDBMS的缺點包括表結構schema擴展不方便、全文搜索功能較弱、大數據場景下I/O較高、存儲和處理復雜關系型數據功能較弱。[多選題]77.Spark的關鍵技術包括()。A)RDDB)SchedulerC)StorageD)Shuffie答案:ABCD解析:第3部分:判斷題,共16題,請判斷題目是否正確。[判斷題]78.在DataFrame中每列的數據都可以看做是一個Series對象。()A)正確B)錯誤答案:對解析:[判斷題]79.empty、any()、all()、bool()可以把數據匯總簡化至單個布爾值。A)正確B)錯誤答案:對解析:[判斷題]80.語句sorted([1,2,3],reverse=True)==reversed([1,2,3])執行結果為True。A)正確B)錯誤答案:錯解析:[判斷題]81.Hadoop環境變量中的HADOOP_HEAPSIZE用于設置所有Hadoop守護線程的內存。它默認是200GB。A)正確B)錯誤答案:錯解析:hadoop為各個守護進程(namenode,secondarynamenode,jobtracker,datanode,tasktracker)統一分配的內存在hadoop-env.sh中設置,參數為HADOOP_HEAPSIZE,默認為1000M。[判斷題]82.用戶可以跨項目空間讀未保護的項目空間數據。A)正確B)錯誤答案:對解析:[判斷題]83.大數據既能告訴我們?是什么?,也能告訴我們?為什么?A)正確B)錯誤答案:錯解析:[判斷題]84.MRS的SFlink不支持Kerberos等進行認證,但支持SSL加密傳輸。A)正確B)錯誤答案:錯解析:[判斷題]85.使用內置函數open()打開文件時,只要文件路徑正確就總是可以正確打開的A)正確B)錯誤答案:錯解析:[判斷題]86.表達式int('1'*64,2)與sum(2**iforiinrange(64))的計算結果是一樣的,但是前者更快一些。A)正確B)錯誤答案:對解析:[判斷題]87.虛擬化的主要目的是運行多個操作系統,提升技術能力。A)正確B)錯誤答案:錯解析:[判斷題]88.云計算就是軟件在云端無所不在、無限強大的計算。也叫網絡化計算或網格計算A)正確B)錯誤答案:對解析:[判斷題]89.僅僅知道

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論