大數據專項測試題有答案_第1頁
大數據專項測試題有答案_第2頁
大數據專項測試題有答案_第3頁
大數據專項測試題有答案_第4頁
大數據專項測試題有答案_第5頁
已閱讀5頁,還剩13頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

大數據專項測試題有答案單選題(總共40題)1.下列關于計算機存儲容量單位的說法錯誤的是()。(1分)A、1kB<1MB<2GBB、基本單位是字節(Byte)C、一個漢字需要一個字節的存儲空間D、一個字節能夠容納一個英文字符答案:C解析:

暫無解析2.下列去噪方法中能較好地保持圖像邊緣的是()(1分)A、中值濾波B、雙邊濾波C、均值濾波D、高斯濾波答案:A解析:

暫無解析3.下列代碼中最適合接受系統輸入是一個整數的是。(1分)A、num=input()B、num=input("6")$;$num=int(input)$;$num=?oat(input)C、num=int(input)D、num=?oat(input)答案:C解析:

暫無解析4.基于N-最短路徑分詞算法,其最后的粗分結果集合大小()N。(1分)A、大于B、不小于C、小于D、不大于答案:B解析:

暫無解析5.下列關于SOM神經網絡的描述錯誤的是()。(1分)A、一種競爭學習型的無監督神經網絡B、將高維輸入數據映射到低維空間,保持輸入數據在高維空間的拓撲結構C、SOM尋優目標為每個輸出神經元找到合適的權重D、輸出層神經元以矩陣方式排列在二維空間答案:C解析:

暫無解析6.變量的不確定性越大,相對應信息熵的變化是()。(1分)A、熵變小B、熵變大C、不變D、以上答案都不正確答案:B解析:

暫無解析7.在多元線性回歸模型中,若某個解釋變量對其余解釋變量的判定系數接近于2,則表明模型中存在()。(1分)A、異方差B、序列相關C、多重共線性D、高擬合優度答案:C解析:

暫無解析8.下列關于Python內存管理的說法錯誤的是?(1分)A、變量不必事先聲明B、變量無須先創建和賦值而直接使用C、變量無須指定類型D、可以使用del釋放資源答案:B解析:

暫無解析9.下列不屬于判別式模型的是()。(1分)A、決策樹B、BP神經網絡C、支持向量機D、貝葉斯答案:D解析:

暫無解析10.在一個線性回歸問題中,通常使用R平方(R-Squared)來判斷擬合度。此時,如果增加一個特征,模型不變,則下面說法正確的是()。(1分)A、如果R-Squared增加,則這個特征有意義B、如果R-Squared減小,則這個特征沒有意義C、僅看R-Squared單一變量,無法確定這個特征是否有意義D、以上說法都不對答案:C解析:

暫無解析11.邏輯回歸將輸出概率范圍限定為[0,1],()函數能起到這樣的作用。(1分)A、Sigmoid()函數B、tanh()函數C、ReLU()函數D、LeakyReLU()函數答案:A解析:

暫無解析12.下列不屬于數據科學項目主要角色的是()。(1分)A、項目發起人B、項目經理C、操作員D、驗收人員答案:D解析:

暫無解析13.下列不屬于Transformation操作的是()。(1分)A、mapB、?lterC、sampleD、count答案:D解析:

暫無解析14.機器學習和深度學習的關系是()。(1分)A、深度學習包含機器學習B、機器學習包含深度學習C、二者是獨立的D、二者相互促進答案:B解析:

暫無解析15.下列關于Python的說法不正確的是()(1分)A、Python是一門面向對象的解釋性程序設計語言B、Python程序可以在IDLE和pycharm里進行開發C、Python功能很強大,可以編寫網頁和游戲D、Python只能在Windows系統下編寫答案:D解析:

暫無解析16.在數據科學項目的活動流程中,主要用于回答“我們用什么方式記錄和展現數據結果”問題的是()。(1分)A、數據的獲得與管理B、模式/模型的驗證和優化C、結果的可視化與文檔化D、模式/模型的應用及維護答案:C解析:

暫無解析17.下列語句會無限循環下去的是()。(1分)A、forainrange(10):timesleep(10)B、whilei<10:timesleep(10)C、whileTrue:breakD、a=[3,-1,',']foriina[:]:ifnota:break答案:B解析:

暫無解析18.下列語句在Python中不合法的是。(1分)A、i="A"+2$;$i=True+2$;$x,y=y,x$;$x=y=z=2B、i=True+2C、x,y=y,xD、x=y=z=2答案:A解析:

暫無解析19.下列不屬于python特點的是?(1分)A、面向對象B、運行效率高C、可移植性D、免費和開源答案:B解析:

暫無解析20.下面程序段執行后的輸出結果是()n=1s=1whilen<5:s=s*nn=n+1print(s)(1分)A、24B、10C、120D、15答案:A解析:

暫無解析21.中文同義詞替換時,常用到Word2vec,則下列說法錯誤的是()。(1分)A、Word2vec基于概率統計B、Word2vec結果符合當前預料環境C、Word2vec得到的都是語義上的同義詞D、Word2vec受限于訓練語料的數量和質量答案:C解析:

暫無解析22.假設一個線性回歸模型完美適合訓練數據(訓練誤差為1),則下列說法正確的是()。(1分)A、測試集誤差一直為B、測試集誤差可能為C、測試集誤差不會為D、以上都不對答案:B解析:

暫無解析23.下列數據類型Hive不支持的是()。(1分)A、StructB、IntC、MapD、Long答案:D解析:

暫無解析24.下列關于組織機構的數據管理成熟度等級劃分中的已執行級的描述錯誤的是?(1分)A、在具體項目中,DMM關鍵過程域(KPA)中給出的關鍵過程已被執行,但隨意性和臨時性較大B、DMM關鍵過程的執行不僅僅局限于特定業務范疇,存在跨越不同業務領域的關鍵過程C、缺少針對DMM關鍵過程的反饋與優化D、雖然有可能在特定業務過程中進行了基礎性改進,但沒有進行持續跟進,也未拓展到整個組織機構答案:B解析:

暫無解析25.下列操作中MapReduce的Shuf?e階段最后做的是?(1分)A、溢寫B、分區C、排序D、合并答案:D解析:

暫無解析26.下列不屬于可視化視覺下的數據類型的是()(1分)A、定類數據B、定序數據C、定寬數據D、定比數據答案:C解析:

暫無解析27.下列不屬于數據科學開源工具的是?(1分)A、MapReduceB、ERPC、HadoopD、Spark答案:B解析:

暫無解析28.下列關于特征編碼的敘述不正確的是?(1分)A、特征編碼是將非數值型特征轉換成數值型特征的方法B、數字編碼與特征的排序無關C、One-Hot編碼中,原始特征有n種取值,轉換后就會產生n列新特征D、啞變量編碼解決了One-Hot編碼中存在線性關系的問題答案:B解析:

暫無解析29.()負責HDFS數據存儲。(1分)A、NameNodeB、JobTrackerC、DataNodeD、SecondaryNameNode答案:C解析:

暫無解析30.()主要提供內存計算框架。(1分)A、Spark核心層B、資源管理層C、服務層D、Spark層答案:A解析:

暫無解析31.邏輯回歸將輸出概率范圍限定為[0,2],()函數能起到這樣的作用。(1分)A、Sigmoid()函數B、tanh()函數C、ReLU()函數D、LeakyReLU()函數答案:A解析:

暫無解析32.將Python中的.py文件轉換為.pyc文件的組件為()。(1分)A、編輯器B、編譯器C、虛擬機D、解釋器答案:B解析:

暫無解析33.下列算法中不屬于基于深度學習的圖像分割算法的是()。(1分)A、FCNB、DeeplabC、Mask-RCNND、KNN答案:D解析:

暫無解析34.下列不屬于基于區域的圖像分割方法的是()(1分)A、區域生長法B、分水嶺算法C、大津算法D、基于圖論的分割算法答案:C解析:

暫無解析35.查看變量內存地址的Python內置函數是()。(1分)A、memery()B、id()C、localof()D、help()答案:B解析:

暫無解析36.下列函數能夠讓所有單詞的首字母變成大寫的是()。(1分)A、capitalize()B、title()C、upper()D、ijust()答案:B解析:

暫無解析37.()是一種著名的密度聚類算法,它基于一組鄰域參數來刻畫樣本的緊密程度。(1分)A、DBSCANB、原型聚類C、密度聚類D、層次聚類答案:A解析:

暫無解析38.下列關于ZooKeeper特點的描述錯誤的是。(1分)A、復雜性B、自我復制C、順序訪問D、高速讀取答案:A解析:

暫無解析39.下列關于詞袋模型的說法錯誤的是()。(1分)A、詞袋模型使用一個多重集對文本中出現的單詞進行編碼B、詞袋模型不考慮詞語原本在句子中的順序C、詞袋模型可以應用于文檔分類和檢索,同時受到編碼信息的限制D、詞袋模型產生的靈感來源于包含類似單詞的文檔經常有相似的含義答案:C解析:

暫無解析40.下列關于Python布爾值的描述正確的是()。(1分)A、整型的0不可以表示FalseB、浮點型的0不可以表示FalseC、0+0j可以表示FalseD、布爾值不可以進行算術運算答案:C解析:

暫無解析多選題(總共30題)1.Spark的關鍵技術包括()。(1分)A、RDDB、SchedulerC、StorageD、Shuf?e答案:ABCD解析:

暫無解析2.數據故事化描述應遵循的基本原則有()。(1分)A、忠于原始數據原則B、設定共同場景原則C、有效性利用原則D、3C精神原則答案:ABCD解析:

暫無解析3.Python變量命名規則包含()。(1分)A、變量名只能包含字母、數字和下劃線。變量名可以字母或下劃線開頭,但不能以數字開頭。例如,可將變量命名為message_1,但不能將其命名為1_messageB、變量名不能包含空格,但可使用下劃線來分隔其中的單詞。例如,變量名greeting_message可行,但變量名greetingmessage會引發錯誤C、不要將Python關鍵字和函數名用作變量名,即不要使用Python保留用于特殊用途的單詞,如printD、變量名應既簡短又具有描述性。例如,name比n好,student_name比s_n好,name_length比length_of_persons_name好答案:ABCD解析:

暫無解析4.在詞袋模型中使用單個的單詞來構建詞向量這樣的序列被稱為()。(1分)A、1元組(1-gram)B、單元組(unigram)模型C、列表D、字典答案:AB解析:

暫無解析5.數據科學基本原則中,“三世界”原則指的是()。(1分)A、精神世界B、數據世界C、物理世界D、數字世界答案:ABC解析:

暫無解析6.如果將A、B、C三個分類器的P-R曲線畫在一個圖中,其中A、B的P-R曲線可以完全包含住C的P-R曲線,A、B的P-R曲線有交點,A、B、C的平衡點分別為0.79、0.66、0.58,則下列說法中正確的有()。(1分)A、學習器A的性能優于學習器CB、學習器A的性能優于學習器BC、學習器B的性能優于學習器CD、學習器C的性能優于學習器B答案:ABC解析:

暫無解析7.常用的代價函數有()。(1分)A、均方誤差B、均方根誤差C、平均絕對誤差D、交叉熵答案:ABCD解析:

暫無解析8.變量名可以包含()。(1分)A、字母B、數字C、下劃線D、空格答案:ABC解析:

暫無解析9.區塊鏈是()等計算機技術的新型應用模式。(1分)A、分布式數據存儲B、點對點傳輸C、共識機制D、加密算法答案:ABCD解析:

暫無解析10.完整性約束通常包括()。.(1分)A、實體完整性B、域完整性C、參照完整性D、用戶定義完整性答案:ABCD解析:

暫無解析11.在Python中,下列導入模塊方式正確的有()。(1分)A、import模塊名B、import模塊名as模塊的別名C、from模塊名import函數名D、from模塊名import函數名A,函數名B答案:ABCD解析:

暫無解析12.空間域濾波是直接以圖像中的像素操作為基礎的濾波,空間濾波器有時也可稱為()。(1分)A、空間掩模B、核C、模板D、窗口答案:ABCD解析:

暫無解析13.圖像分割中常使用的鄰域有()。(1分)A、0鄰域B、4鄰域C、8鄰域D、24鄰域答案:BC解析:

暫無解析14.Hadoop框架的缺點有()。(1分)A、MapReduce編程框架的限制B、過多的磁盤操作,缺乏對分布式內存的支持C、無法高效支持迭代式計算D、不支持多用戶寫入和任意修改文件答案:ABCD解析:

暫無解析15.處理圖像平滑的濾波有()。(1分)A、盒式濾波B、均值濾波C、高斯濾波D、中值濾波答案:ABCD解析:

暫無解析16.Spark支持的計算模型有()。(1分)A、批處理B、實時計算C、機器學習模型D、交互式查詢答案:ABCD解析:

暫無解析17.RNN在NLP領域的應用包括()。(1分)A、語言模型與文本生成B、機器翻譯C、語音識別D、圖像描述生成答案:ABCD解析:

暫無解析18.數據安全不僅包括數據保密性,還包括()。(1分)A、完整性B、可用性C、不可否認性D、可審計性答案:ABCD解析:

暫無解析19.常用分詞方法包含()。(1分)A、基于Binarytree的分詞方法B、基于HMM的分詞方法C、基于CRF的分詞方法D、基于K-means的分詞方法答案:BC解析:

暫無解析20.Python的特點和優點有()。(1分)A、解釋性強B、使用動態特性C、面向對象D、語法簡潔答案:ABCD解析:

暫無解析21.數據挖掘的主要功能包括概念描述、趨勢分析、孤立點分析、()等方面。(1分)A、關聯分析B、分類和預測分析C、聚類分析D、偏差分析答案:ABCD解析:

暫無解析22.大數據偏見包括()。(1分)A、數據源的選擇偏見B、算法與模型偏見C、結果解讀方法的偏見D、數據呈現方式的偏見答案:ABCD解析:

暫無解析23.數據科學項目主要涉及的活動包括()。(1分)A、模式/模型的應用及維護B、模式/模型的洞見C、結果的可視化與文檔化D、模式/模型的驗證和優化答案:ABCD解析:

暫無解析24.Hadoop的優點包括()。(1分)A、可靠性B、高效性C、可伸縮性D、成本低答案:ABCD解析:

暫無解析25.情感分析的途徑有()。(1分)A、關鍵詞識別B、詞匯關聯C、統計方法D、概念級技術答案:ABCD解析:

暫無解析26.數據可視化是利用計算機圖形學和圖像處理技術,將數據轉換成()在屏幕上顯示出來,并進行交互處理的理論、方法和技術。(1分)A、文字B、圖形C、圖像D、視頻答案:BC解析:

暫無解析27.Python的優點有()。(1分)A、變量不用預定義類型B、數據結構功能強大C、語言可解釋性強D、變量類型固定答案:ABC解析:

暫無解析28.常用的爬蟲技巧有()。(1分)A、更改header,偽裝成瀏覽器進行爬取B、設置爬取的時間間隔C、應用神經網絡算法識別網站驗證碼D、通過代理服務器進行爬取答案:ABCD解析:

暫無解析29.Spark的部署模式包括()。(1分)A、本地模式B、Standalone模式C、SparkonYARN模式D、SparkonMesos模式答案:ABCD解析:

暫無解析30.Python中字典的內置方法包括()。(1分)A、radiansdictkeys()B、radiansdictsetdefault(key,default=None)C、radiansdictupdate(dict2)D、radiansdictvalues()答案:ABCD解析:

暫無解析判斷題(總共30題)1.為確定是否安裝了Python,執行命令python(請注意,其中的p是小寫的)。()(1分)A、正確B、錯誤答案:A解析:

暫無解析2.數據管理是指通過管理數據實現組織機構的某種業務目的。而數據治理則指的是如何確保數據管理的順利、科學、有效進行。()(1分)A、正確B、錯誤答案:A解析:

暫無解析3.HBase可以有列,可以沒有列簇.(1分)A、正確B、錯誤答案:B解析:

暫無解析4.MapReduce為海量的數據提供了存儲架構;()(1分)A、正確B、錯誤答案:B解析:

暫無解析5.Python中,<返回x是否小于y,這分別與特殊的變量True和False等價,需要注意這些變量名的大寫()(1分)A、正確B、錯誤答案:A解析:

暫無解析6.Linux系統是為編程而設計的,因此在大多數Linux計算機中,都默認安裝了Python;()(1分)A、正確B、錯誤答案:A解析:

暫無解析7.默認值參數就是在定義形參的時候,給函數默認賦一個值。()(1分)A、正確B、錯誤答案:A解析:

暫無解析8.eval(str)是計算在字符串中的有效Python表達式,并返回一個對象。()(1分)A、正確B、錯誤答案:A解析:

暫無解析9.沿負梯度下降的方向一定是最優的方向;()(1分)A、正確B、錯誤答案:B解析:

暫無解析10.文本挖掘又稱信息檢索,是從大量文本數據中提取以前未知的、有用的、可理解的、可操作的知識的過程()(1分)A、正確B、錯誤答案:B解析:

暫無解析11.SupportVectorMachine的目標是找到使得訓練數據盡可能分開且分類間隔最大的超平面,應該屬于結構風險最小化;()(1分)A、正確B、錯誤答案:A解析:

暫無解析12.相對路徑使用的特殊符號"./"代表目前所在的目錄(1分)A、正確B、錯誤答案:A解析:

暫無解析13.靜態方法不需要關鍵字self.()(1分)A、正確B、錯誤答案:A解析:

暫無解析14.數據挖掘的目的是發現數據集中的模式或規律,數據挖掘有監督學習和無監督學習兩種方式。()(1分)A、正確B、錯誤答案:A解析:

暫無解析15.在機器學習中,隨著樹中節點數變得太大,即使模型的訓練誤差還在繼續減低,但是檢驗誤差開始增大,這是出現了模型擬合不足的問題。()(1分)A、正確B、錯誤答案:B解析:

暫無解析16.如果僅僅是用于控制循環次數,那么使用foriinrange(20)和foriinrange(20,40)的作用是等價的。(1分)A、正確B、錯誤答案:A解析:

暫無解析17.數據產品開發涉及數據科學項目流程的部分活動()(1分)A、正確B、錯誤答案:B

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論