




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
試卷科目:大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷31)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)第1部分:?jiǎn)雾?xiàng)選擇題,共144題,每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.反演歸結(jié)(消解)證明定理時(shí),若當(dāng)前歸結(jié)式是()時(shí),則定理得證。A)永真式B)包孕式(subsumed)C)空子句[單選題]2.若變量x的值為987,則表達(dá)式x//10%10的值為?A)0B)9C)8D)7[單選題]3.關(guān)于FusionInsightHDStreaming的Supervisor描述正確的是?A)Supervisor是在Topology中接受數(shù)據(jù)然后執(zhí)行處理的組件B)Supervisor負(fù)責(zé)接受Nimbus分配的任務(wù),啟動(dòng)和停止屬于自己管理的Worker進(jìn)程C)Supervisor負(fù)責(zé)資源分配和任務(wù)調(diào)度D)Supervisor是運(yùn)行具體處理邏輯的過(guò)程[單選題]4.若arr=np.array([1,2,3]),且arr1=np.array([2,4,6])print(arrA)TRUEB)FALSEC)[Ture,Ture,Ture]D)([Ture,Ture,Ture])[單選題]5.下面哪個(gè)不屬于matplotlib基本圖表包含的元素A)坐標(biāo)軸B)刻度C)刻度標(biāo)簽D)參考區(qū)域[單選題]6.python語(yǔ)句?f=lambdax,y:x*y;f(12,34)?的程序運(yùn)行結(jié)果是。()A)12B)22C)56D)408[單選題]7.Kafka集群必須依賴于下列哪一個(gè)組件?A),HDFSB)YarnC)FlumeD)Zookeeper[單選題]8.如果想把一個(gè)字符串全部轉(zhuǎn)為小寫(xiě)使用字符串方法A)countB)replaceC)lowerD)upper[單選題]9.假設(shè)您已在數(shù)據(jù)集上擬合了一個(gè)復(fù)雜的回歸模型。現(xiàn)在,您正在使用Ridge回歸,并調(diào)整參數(shù)λ以減少其復(fù)雜性。下面的描述哪個(gè)表達(dá)了偏差和方差與λ的關(guān)系()。A)在λ非常小的情況下,偏差低,方差低B)在λ非常小的情況下,偏差低,方差高C)在λ非常小的情況下,偏差高,方差低D)在λ非常小的情況下,偏差低,方差低[單選題]10.如果在大型數(shù)據(jù)集上訓(xùn)練決策樹(shù)。為了花費(fèi)更少的時(shí)間來(lái)訓(xùn)練這個(gè)模型,下列哪種做法是正確的()A)增加樹(shù)的深度B)增加學(xué)習(xí)率C)減小樹(shù)的深度D)減少樹(shù)的數(shù)量[單選題]11.()不屬于C盯模型對(duì)于HMM和MEMM模型的優(yōu)勢(shì)A)特征靈活B)速度快C)可容納較多上下文信息D)全局最優(yōu)[單選題]12.以下現(xiàn)象不能直接通過(guò)低通濾波器解決的是()。A)低分辨率文本圖像中出現(xiàn)的字符斷裂問(wèn)題B)指紋圖像中的去污染問(wèn)題C)人臉圖像中需要?美容?的去皺紋問(wèn)題D)遙感圖像中的掃描線濾除問(wèn)題[單選題]13.在加強(qiáng)數(shù)據(jù)安全技術(shù)保護(hù)方面,要注意落實(shí)數(shù)據(jù)安全技術(shù)保護(hù)與信息系統(tǒng)的?三同步?原則,其中不包括()。A)同步規(guī)劃B)同步建設(shè)C)同步使用D)同步檢查[單選題]14.Oracle數(shù)據(jù)庫(kù)中,數(shù)據(jù)字典表和視圖存儲(chǔ)在()A)USERS表B)SYSTEM表空間C)TEMPORARY表空間D)ORACLE表空間[單選題]15.邏輯域構(gòu)建了協(xié)議、()、數(shù)據(jù)等組成的信息活動(dòng)域。A)附件B)網(wǎng)絡(luò)C)軟件D)硬件[單選題]16.開(kāi)發(fā)人員在使用大數(shù)據(jù)計(jì)算服務(wù)的圖計(jì)算時(shí),主要的輸入數(shù)據(jù)在表中,另外還有一些非結(jié)構(gòu)化的配置信息存在一個(gè)本地文件中,則可以采用()方式使得這些配置信息在圖計(jì)算過(guò)程中可用。A)將這個(gè)配置信息做為resource上傳到大數(shù)據(jù)計(jì)算服務(wù)中,在圖計(jì)算過(guò)程中可以讀取resource中的數(shù)據(jù)B)輸入輸出只能是Table,必須要把這部分?jǐn)?shù)據(jù)放到表中C)在group程序中直接讀取本地的文件信息D)輸入只能是一張表,因此無(wú)法滿足這個(gè)場(chǎng)景[單選題]17.下列關(guān)于HDFS的副本機(jī)制的說(shuō)法哪一個(gè)是不正確的?A)第一個(gè)副本放置在上傳文件的NameNode上;B)第二個(gè)副本放置在與第一個(gè)副本不同的機(jī)架的節(jié)點(diǎn)上;C)第三個(gè)副本放置在第二副本相同機(jī)架的不同節(jié)點(diǎn)上;D)默認(rèn)配置保存三個(gè)副本[單選題]18.SparkJob默認(rèn)的調(diào)度模式(___)A)隨機(jī)B)FAIRC)FIFOD)運(yùn)行時(shí)指定[單選題]19.接受者操作特征曲線簡(jiǎn)稱(__)。A)雙曲線B)ROC曲線C)科克曲線D)共軛曲線[單選題]20.我們建立一個(gè)5000個(gè)特征,100萬(wàn)數(shù)據(jù)的機(jī)器學(xué)習(xí)模型。我們?cè)趺从行У貞?yīng)對(duì)這樣的大數(shù)據(jù)訓(xùn)練()。A)我們隨機(jī)抽取一些樣本,在這些少量樣本之上訓(xùn)練B)我們可以試用在線機(jī)器學(xué)習(xí)算法C)我們應(yīng)用PCA算法降維,減少特征數(shù)D)以上答案都正確[單選題]21.隨機(jī)森林中的隨機(jī)是指(A)隨便構(gòu)建樹(shù)模B)隨機(jī)選擇一個(gè)樹(shù)模型C)隨機(jī)選擇多個(gè)樹(shù)模型D)在構(gòu)建每個(gè)樹(shù)模型時(shí)隨機(jī)選擇樣本和特征[單選題]22.OTS的單個(gè)表可以包括:()個(gè)屬性列。A)0-128個(gè)B)0-1024個(gè)C)無(wú)限制D)0-256個(gè)[單選題]23.下列選項(xiàng)中,關(guān)于duplicated()方法描述正確的是()。A)duplicate()方法用于刪除重復(fù)值B)duplicate()方法用于標(biāo)記重復(fù)值C)duplicate()方法會(huì)改變?cè)紨?shù)據(jù)D)duplicate()方法會(huì)將重復(fù)的數(shù)據(jù)標(biāo)記為False[單選題]24.某項(xiàng)目小組接到一個(gè)大數(shù)據(jù)實(shí)時(shí)分析項(xiàng)目,且對(duì)實(shí)時(shí)性要求很高。請(qǐng)問(wèn)以下哪種大數(shù)據(jù)計(jì)算框架最合適?A)FlinkB)MapReduceC)HBaseD)Spark[單選題]25.計(jì)數(shù)器是用來(lái)記錄()的執(zhí)行進(jìn)度和狀態(tài)的A)mapperB)reducerC)partitionerD)job[單選題]26.F1參數(shù)(),說(shuō)明模型越穩(wěn)定。A)越小B)越大C)越趨近于某一特定值D)F1參數(shù)和模型穩(wěn)定性沒(méi)有關(guān)系[單選題]27.執(zhí)行以下代碼段alien_1={'color':'green','points':5}alien_2={'color':'blue','points':1}print(alien_1<alien_2)時(shí),輸出為()。A)TrueB)FalseC)ErrorD)None[單選題]28.當(dāng)Mapper輸出的相同partition的kv數(shù)據(jù)到達(dá)一個(gè)Reducer后,會(huì)有一個(gè)聚合的過(guò)程,即將?相同?key的kv聚合到一起,其實(shí)質(zhì)是利用來(lái)對(duì)key進(jìn)行比較。A)GroupingComparatorB)ComparatorC)PartitionerD)GroupingPartitioner[單選題]29.下列關(guān)于數(shù)據(jù)倉(cāng)庫(kù)隨時(shí)間變化的描述不正確的是()。A)數(shù)據(jù)倉(cāng)庫(kù)隨時(shí)間的變化不斷增加新的數(shù)據(jù)內(nèi)容B)捕捉到的新數(shù)據(jù)會(huì)覆蓋原來(lái)的快照C)數(shù)據(jù)倉(cāng)庫(kù)隨時(shí)間變化不斷刪去舊的數(shù)據(jù)內(nèi)容D)數(shù)據(jù)倉(cāng)庫(kù)中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會(huì)隨著時(shí)間的變化不斷地進(jìn)行重新綜合[單選題]30.getPartition()的參數(shù)中numReduceTasks指的是設(shè)置的Reducer的任務(wù)數(shù)量,默認(rèn)值是()。A)0B)1C)2D)3[單選題]31.假設(shè)precision=TP/(TP+FP),recall=TP/(TP+FN),則在二分類問(wèn)題中,當(dāng)測(cè)試集的正例和負(fù)例數(shù)量不均衡時(shí),以下評(píng)價(jià)方案中()是相對(duì)不合理的。A)Accuracy:(TP+TN)/allB)F-value:2recallprecision/(recall+precision)C)G-mean:sqrt(precision*recall)D)AUC:曲線下面積[單選題]32.在某神經(jīng)網(wǎng)絡(luò)的隱層輸出中,包含-1.5,那么該神經(jīng)網(wǎng)絡(luò)采用的激活函數(shù)不可能是A)sigmoidB)tanhC)reluD)A,B,C[單選題]33.下列哪項(xiàng)關(guān)于模型能力(modelcapacity)的描述是正確的?(指模型能近似復(fù)雜函數(shù)的能力)A)隱層層數(shù)增加,模型能力增加B)Dropout的比例增加,模型能力增加C)學(xué)習(xí)率增加,模型能力增加D)都不正確[單選題]34.以下說(shuō)法中:①一個(gè)機(jī)器學(xué)習(xí)模型,如果有較高準(zhǔn)確率,總是說(shuō)明這個(gè)分類器是好的;②如果增加模型復(fù)雜度,那么模型的測(cè)試錯(cuò)誤率總是會(huì)降低;③如果增加模型復(fù)雜度,那么模型的訓(xùn)練錯(cuò)誤率總是會(huì)降低,正確的是()A)1B)2C)3D)1,3[單選題]35.閱讀下面的程序:li_one=[2,1,5,6]print(sorted(li_one[:2]))運(yùn)行程序,輸出結(jié)果是()。A)[1,2]B)[2,1]C)[1,2,5,6]D)[6,5,2,1][單選題]36.代碼print(0.1+0.2==0.3)的輸出結(jié)果是()。A)TrueB)FalseC)trueD)false[單選題]37.Spark核心層主要關(guān)注()問(wèn)題。A)存儲(chǔ)B)計(jì)算C)傳輸D)連接[單選題]38.以下代碼的結(jié)果是foriinrange(5,10,2):print(i)A)輸出5678910(換行)B)輸出57910(換行)C)輸出579(換行)D)輸出6810(換行)[單選題]39.IBMCloud為我們提供的是以下哪種服務(wù)?A)SaaSB)PaaSC)IaaSD)DaaS[單選題]40.什么是大數(shù)據(jù)使用的最可靠方法?A)大數(shù)據(jù)源B)樣本數(shù)據(jù)源C)規(guī)模大D)大數(shù)據(jù)與樣本數(shù)據(jù)結(jié)合[單選題]41.下面關(guān)于數(shù)據(jù)粒度的描述不正確的是:A)粒度是指數(shù)據(jù)倉(cāng)庫(kù)小數(shù)據(jù)單元的詳細(xì)程度和級(jí)別B)數(shù)據(jù)越詳細(xì),粒度就越小,級(jí)別也就越高C)數(shù)據(jù)綜合度越高,粒度也就越大,級(jí)別也就越高D)粒度的具體劃分將直接影響數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)量以及查詢質(zhì)量[單選題]42.將閔可夫斯基距離和(__)結(jié)合即可處理混合屬性。A)ValueDifferenceMectricB)k-meansC)k近鄰D)SVM[單選題]43.下面描述錯(cuò)誤的是:()A)數(shù)據(jù)挖掘的目標(biāo)明確,先做假設(shè),然后通過(guò)數(shù)據(jù)分析來(lái)驗(yàn)證假設(shè)是否正確,從而得到相應(yīng)的結(jié)論B)數(shù)據(jù)挖掘的重點(diǎn)在尋找未知的模式與規(guī)律C)數(shù)據(jù)分析一般都是得到一個(gè)指標(biāo)統(tǒng)計(jì)量結(jié)果,如總和、平均值等D)數(shù)據(jù)挖掘則是輸出模型或規(guī)則,并且可相應(yīng)得到模型得分或標(biāo)簽[單選題]44.()是指針對(duì)用戶非常明確的數(shù)據(jù)查詢和處理任務(wù),以高性能和高吞吐量的方式實(shí)現(xiàn)大眾化的服務(wù),是數(shù)據(jù)價(jià)值最重要也是最直接的發(fā)現(xiàn)方式。A)數(shù)據(jù)服務(wù)B)數(shù)據(jù)分析C)數(shù)據(jù)治理D)數(shù)據(jù)應(yīng)用[單選題]45.圖像中虛假輪廓的出現(xiàn)就其本質(zhì)而言是()。A)圖像的灰度級(jí)數(shù)不夠多而造成的B)圖像的空間分辨率不夠高而造成的C)圖像的灰度級(jí)數(shù)過(guò)多而造成的D)圖像的空間分辨率過(guò)高而造成的[單選題]46.以下可以創(chuàng)建外鍵約束的表是()。--A)MyISAM表B)InnoDB表C)MEMORY表D)以上答案全部正確[單選題]47.下面if語(yǔ)句統(tǒng)計(jì)?成績(jī)(score)優(yōu)秀的男生以及不及格的男生?的人數(shù),正確的語(yǔ)句為。()A)If(gender==?男?andscore=90):n+=1B)If(gender==?男?andscore=90):n+=1C)If(gender==?男?and(score=90)):n+=1D)If(gender==?男?orscore=90):n+=1[單選題]48.選項(xiàng)()可以令下面的代碼輸出結(jié)果為Truea=foo(2)b=foo(3)print(a<b)A)classfoo:def__init__(self,x):self.x=xdef__lt__(self,other):ifself.x<other.x:returnFalseelse:returnTrueB)classfoo:def__init__(self,x):self.x=xdef__less__(self,other):ifself.x>other.x:returnFalseelse:returnTrueC)classfoo:def__init__(self,x):self.x=xdef__lt__(self,other):ifself.x<other.x:returnTrueelse:returnFalseD)classfoo:def__init__(self,x):self.x=xdef__less__(self,other):ifself.x<other.x:returnFalseelse:returnTrue[單選題]49.OGG是一種基于日志的結(jié)構(gòu)化數(shù)據(jù)()軟件。A)存儲(chǔ)B)查詢C)復(fù)制D)更新[單選題]50.下列關(guān)于eval()函數(shù)的描述錯(cuò)誤的是()。A)eval()函數(shù)的作用是將輸入的字符串轉(zhuǎn)為Python語(yǔ)句,并執(zhí)行該語(yǔ)句B)如果用戶希望輸入一個(gè)數(shù)字,并用程序?qū)@個(gè)數(shù)字進(jìn)行計(jì)算,可以采用eval(input(<輸入提示字符串>))組合C)執(zhí)行eval("Hello")和執(zhí)行eval("'Hello'")得到相同的結(jié)果D)eval()函數(shù)的定義為:eval(source,globals=None,locals=None,/)249[單選題]51.當(dāng)使用的Hive是2.x之后的版本時(shí),那么就必須手動(dòng)初始化元數(shù)據(jù)庫(kù)。若是我們使用Hive默認(rèn)的dB、類型?derby?,那么我們應(yīng)該使用()命令進(jìn)行初始化。A)schematool‐dbTypederby‐initSchemaB)schematool‐Typederby‐initSchemaC)schema‐dbTypederby‐initSchemaD)schema‐Typederby‐initSchema[單選題]52.下面關(guān)于ID3算法中說(shuō)法錯(cuò)誤的是A)ID3算法要求特征必須離散化B)信息增益可以用熵,而不是GINI系數(shù)來(lái)計(jì)算C)選取信息增益最大的特征,作為樹(shù)的根節(jié)點(diǎn)D)ID3算法是一個(gè)二叉樹(shù)模型[單選題]53.不屬于數(shù)據(jù)脫敏的要求的是()。A)雙向性B)單向性C)無(wú)殘留D)易于實(shí)現(xiàn)[單選題]54.Numpy中使用不同類型的數(shù)組進(jìn)行操作時(shí),結(jié)果數(shù)組的類型會(huì)進(jìn)行()。A)向下轉(zhuǎn)換B)向上轉(zhuǎn)換C)不進(jìn)行轉(zhuǎn)換D)無(wú)法計(jì)算[單選題]55.執(zhí)行如下代碼:importtimeprint(time.time())以下選項(xiàng)中描述錯(cuò)誤的是A)time庫(kù)是Python的標(biāo)準(zhǔn)庫(kù)B)可使用time.ctime(),顯示為更可讀的形式C)time.sleep(5)推遲調(diào)用線程的運(yùn)行,單位為毫秒D)輸出自1970年1月1日00:00:00AM以來(lái)的秒數(shù)[單選題]56.下列選項(xiàng)中適合MapReduce的場(chǎng)景有?A)實(shí)時(shí)交互計(jì)算B)迭代計(jì)算C)流式計(jì)算D)離線計(jì)算[單選題]57.A為ADS中的普通表,a為A的分區(qū)列,類型為bigint,b為A中的普通列,類型為bigint,請(qǐng)判斷以下相關(guān)SQL中()語(yǔ)法是錯(cuò)誤的。A)SELECTaFROMAORDERBYaLIMIT100B)SELECTa+b,count(a)FROMAgroupbya+bORDERBYaC)SELECTa,bFROMAORDERBYa+bLIMIT100D)SELECTa,count(a)FROMAgroupbyaORDERBYa[單選題]58.np.full_like()的作用是(__)。A)創(chuàng)建形狀一樣但指定數(shù)值的矩陣B)創(chuàng)建全1矩陣C)創(chuàng)建對(duì)角矩陣D)復(fù)制矩陣[單選題]59.在其他條件不變的前提下,()容易引起機(jī)器學(xué)習(xí)中的過(guò)擬合問(wèn)題。A)增加訓(xùn)練集量B)減少神經(jīng)網(wǎng)絡(luò)隱藏層節(jié)點(diǎn)數(shù)C)刪除稀疏的特征D)SVM算法中使用高斯核/RBF核代替線性核[單選題]60.(__)中基學(xué)習(xí)器的多樣性不僅來(lái)自樣本擾動(dòng),還來(lái)自屬性擾動(dòng)。A)AdaBoostB)RFC)BaggingD)傳統(tǒng)決策樹(shù)[單選題]61.下列說(shuō)法中正確的是()A)對(duì)于大數(shù)據(jù)而言,最基本、最重要的要求是減少錯(cuò)誤、保障質(zhì)量。因此大數(shù)據(jù)的搜集要盡量精確。B)谷歌流感趨勢(shì)充分體現(xiàn)了數(shù)據(jù)重組和擴(kuò)展對(duì)數(shù)據(jù)價(jià)值的重要意義。C)大數(shù)據(jù)時(shí)代,數(shù)據(jù)就是一座金礦,而大數(shù)據(jù)思維是打開(kāi)這座礦山的鑰匙。D)大數(shù)據(jù)時(shí)代還是看重因果關(guān)系。[單選題]62.當(dāng)(__)過(guò)高,會(huì)出現(xiàn)過(guò)擬合現(xiàn)象A)偏差B)方差C)噪聲D)泛化誤差[單選題]63.推薦系統(tǒng)為客戶推薦商品,自動(dòng)完成個(gè)性化選擇商品的過(guò)程,滿足客戶的個(gè)性化需求,推薦基于網(wǎng)站最熱賣商品、客戶所處城市、(),推測(cè)客戶將來(lái)可能的購(gòu)買行為。A)客戶的朋友B)客戶的個(gè)人信息C)客戶的興趣愛(ài)好D)客戶過(guò)去的購(gòu)買行為和購(gòu)買記錄[單選題]64.后剪枝是先從訓(xùn)練集生成一顆完整的決策樹(shù),然后()對(duì)非葉結(jié)點(diǎn)進(jìn)行考察。A)自上而下B)在劃分前C)禁止分支展開(kāi)D)自底向上[單選題]65.SQL語(yǔ)法中內(nèi)部關(guān)聯(lián)的關(guān)鍵字是()A)INNERJOINB)LEFTJOINC)FULLJOIND)CROSSJOIN[單選題]66.首先根據(jù)需要設(shè)計(jì)一個(gè)調(diào)色板,進(jìn)而將灰度值作為調(diào)色板的索引值完成從灰度到彩色的映射。這種偽方法稱為A)基于灰級(jí)窗的偽彩色方法B)基于灰度調(diào)色板的偽彩色方法C)基于灰度變換的偽彩色方法D)基于區(qū)域分割的偽彩色方法[單選題]67.執(zhí)行以下代碼段requested_toppings=['mushrooms','greenpeppers','extracheese']forrequested_toppinginrequested_toppings:print("Adding"+requested_topping+".")時(shí),輸出為()。A)Addingmushrooms.Addinggreenpeppers.Addingextracheese.B)Addingmushrooms.C)Addinggreenpeppers.D)Addingextracheese.[單選題]68.使用Pig語(yǔ)句查詢一張名為tmp_table的表的前50行,下列語(yǔ)句正確的是()。A)SELECT*FROMtmp_tableLIMIT50;B)tmp_table_limit=LIMITtmp_table50;DUMPtmp_table_limit;C)DUMPtmp_tableLIMIT50D)DUMPtmp_tableLIMIT=50;[單選題]69.關(guān)于泛在電力物聯(lián)網(wǎng)特征的描述,不正確的選項(xiàng)是()。A)狀態(tài)全面感知B)信息高效處理C)應(yīng)用便捷靈活D)客戶多種多樣[單選題]70.基本元數(shù)據(jù)是指()。A)基本元數(shù)據(jù)是與數(shù)據(jù)源、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)集市和應(yīng)用程序等結(jié)構(gòu)相關(guān)的信息B)基本元數(shù)據(jù)包括與企業(yè)相關(guān)的管理方面的數(shù)據(jù)和信息C)基本元數(shù)據(jù)包括日志文件和簡(jiǎn)歷執(zhí)行處理的時(shí)序調(diào)度信息D)基本元數(shù)據(jù)包括關(guān)于裴載和更新處理、分析處理以及管理方面的信息[單選題]71.加強(qiáng)無(wú)線終端和移動(dòng)應(yīng)用數(shù)據(jù)安全保護(hù),保證無(wú)線終端的用戶信息安全,實(shí)現(xiàn)個(gè)人和公司業(yè)務(wù)(),重要業(yè)務(wù)數(shù)據(jù)存儲(chǔ)加密、傳輸加密等安全防護(hù)。A)數(shù)據(jù)共享B)數(shù)據(jù)隔離C)數(shù)據(jù)合并D)數(shù)據(jù)交換[單選題]72.()不僅可用于多層前饋神經(jīng)網(wǎng)絡(luò),還可用于其他類型的神經(jīng)網(wǎng)絡(luò)A)感知機(jī)B)神經(jīng)元C)神經(jīng)系統(tǒng)D)誤差逆?zhèn)鞑單選題]73.下面哪個(gè)屬于映射數(shù)據(jù)到新的空間的方法?A)傅立葉變換B)特征加權(quán)C)漸進(jìn)抽樣D)維歸約[單選題]74.關(guān)于HBase建表語(yǔ)句,以下描述中錯(cuò)誤的是哪一項(xiàng)?A)在華為云MRS提供的HBaseshel‖客戶端中建表時(shí),需指定至少一個(gè)列族名稱B)利用HBasef的)avaAPIE時(shí),需要用put語(yǔ)句完成建表C)在HBaseshell客戶端中可以通過(guò)create命令建表D)在建表時(shí)可以預(yù)先創(chuàng)建多個(gè)Region[單選題]75.SparkJob默認(rèn)的調(diào)度模式()A)FIFOB)FAIRC)無(wú)D)運(yùn)行時(shí)指定[單選題]76.可視化中的組件樣式不包括()A)標(biāo)題B)自適應(yīng)顯示C)標(biāo)簽D)軸線[單選題]77.HBase的主HMaster是:()選舉的。A)由RegionServer進(jìn)行裁決B)HMaster為雙主模式,不需要進(jìn)行裁決C)通過(guò)ZooKeeper進(jìn)行裁決D)隨機(jī)選舉[單選題]78.在模型評(píng)估與度量的方法中,(__)以自助采樣法為基礎(chǔ)。A)自助法B)留出法C)交叉驗(yàn)證法D)錯(cuò)誤率分析[單選題]79.()提供RESTHTTPAPI來(lái)讀寫(xiě)hdfs。A)AvroB)HttPFSBC)MahoutD)Snappy[單選題]80.在Hadoop中,()是默認(rèn)的InputFormat類型,它將每行內(nèi)容作為新值,而將字節(jié)偏移量作為key。A)FileInputFormatB)TextInputFormatC)KeyValueTextInputFormatD)CombineTextInputFormat[單選題]81.Maxcompute表T中某列C的數(shù)據(jù)類型為bigint,需要修改為double,以下()方式可以實(shí)現(xiàn)。A)將表T刪掉重建B)ALTERTABLETCOLUMNCRENAMETOCDOUBLE;C)ALTERTABLETDROPCOLUMNC;ALTERTABLETADDCDOUBLE;D)ALTERTABLETCHANGECOLUMNSCBIGINT[單選題]82.RDD操作包括轉(zhuǎn)換(Transformation)和動(dòng)作(Action)兩種類型,下列RDD操作屬于動(dòng)作(Action)類型的是()。A)joinB)mapC)collectD)groupBy[單選題]83.Hadoop平臺(tái)中,要查看YARN服務(wù)中一個(gè)application的信息,通常需要使用什么命令?A)containerB)jarC)application-attemptD)Application[單選題]84.HBase使用get方法讀取數(shù)據(jù)時(shí),下列哪個(gè)選項(xiàng)是需要的?A)Deletedelete=newDelete(rowkey)B)scan.setCaching(1000)C)bytellrowkey=Bytes.toBytes("012005000201")D)List<Put>]putS=newArraylist<Put>0[單選題]85.HBase中數(shù)據(jù)存儲(chǔ)的文件格式是下面哪-項(xiàng)?A)SequenceFileB)HfileC)TextFileD)HLog[單選題]86.下列關(guān)于數(shù)據(jù)轉(zhuǎn)換,正確的是()。A)Json內(nèi)的取值只能有統(tǒng)一格式B)PDF文件在不同平臺(tái)上打開(kāi)顯示不同C)可以通過(guò)Python將CSV文件轉(zhuǎn)換成Excel格式D)Excel存儲(chǔ)數(shù)據(jù)的量無(wú)限制[單選題]87.下列算法中屬于局部處理的是A)灰度線性變換B)二值化C)傅立葉變換D)中值濾波[單選題]88.以下聚合函數(shù)求平均數(shù)的是()A)COUNTB)MAXC)AVGD)SUM[單選題]89.通過(guò)()命令可以顯示當(dāng)前正在使用的數(shù)據(jù)庫(kù)名稱A)setmysql.cli.print.current.db=true;B)setmysql.cli.print.current.db=false;C)sethive.cli.print.current.db=true;D)sethive.cli.print.current.db=false;[單選題]90.用戶Region和RegionServer之間的路由信息,保存在哪個(gè)模塊中?A)MasterB)HDFSC)Meta表D)Zookeeper[單選題]91.按照維度將多個(gè)矩陣連接起來(lái)應(yīng)該用哪個(gè)函數(shù)?A)np.mulB)np.sumC)np.concatenatD)np.mat[單選題]92.數(shù)據(jù)庫(kù)設(shè)計(jì)中用關(guān)系模型表示實(shí)體和實(shí)體之間的聯(lián)系。關(guān)系模型的結(jié)構(gòu)是()。A)層次結(jié)構(gòu)B)網(wǎng)狀結(jié)構(gòu)C)封裝結(jié)構(gòu)D)二維表結(jié)構(gòu)[單選題]93.有如下程序:defC2F(c):returnc*9//5+13print(C2F(22))print(C2F(0))程序的輸出結(jié)果是()。A)5313B)5213C)3513D)5713[單選題]94.下列選項(xiàng)中適合MapReduce的場(chǎng)景有:()。A)實(shí)時(shí)交互計(jì)算B)迭代計(jì)算C)流式計(jì)算D)離線計(jì)算[單選題]95.現(xiàn)有的很多數(shù)據(jù)挖掘算法只能處理定量的屬性,因此定量的屬性數(shù)據(jù)是應(yīng)用這些算法的前提。請(qǐng)問(wèn)下面哪種工作流節(jié)點(diǎn)可以將一些不具體、模糊的定性數(shù)據(jù)數(shù)值化?(A)規(guī)則化B)量化C)標(biāo)準(zhǔn)化D)關(guān)聯(lián)[單選題]96.在抽樣估計(jì)中,隨著樣本容量的增大,樣本統(tǒng)計(jì)量接近總體參數(shù)的概率就越大,這一性質(zhì)稱為()A)無(wú)偏性B)有效性C)及時(shí)性D)一致性[單選題]97.以下()不是加載數(shù)據(jù)到Maxcompute的合理方法。A)dshipB)tunnelC)DTtaskD)mapreduce[單選題]98.HIVE是由哪家公司發(fā)明并貢獻(xiàn)到開(kāi)源社區(qū)的A)GoogleB)FacebookC)twitterD)Amazon[單選題]99.二維圖像可用二維函數(shù)表示,下列說(shuō)法正確地是()。A)表示點(diǎn)的灰度值B)對(duì)于模擬圖像來(lái)講,是離散函數(shù)C)x,y不是平面的二維坐標(biāo)D)以上說(shuō)法都不正確[單選題]100.下列對(duì)MapReduceVersion1的描述不正確的是()。A)JobTracker負(fù)載過(guò)重,存在單點(diǎn)故障B)資源管理和計(jì)算調(diào)度強(qiáng)耦合,其他計(jì)算框架難以復(fù)用其資源管理C)不同框架對(duì)濟(jì)源不能全局管理D)MapReduce1.0與MapReduce2.0在客戶端的應(yīng)用有很大的差別[單選題]101.大數(shù)據(jù)計(jì)算服務(wù)存儲(chǔ)到文件系統(tǒng)上時(shí),使用了()的文件格式,降低了無(wú)效的磁盤讀取操作。A)列存儲(chǔ)B)文檔存儲(chǔ)C)行存儲(chǔ)D)鍵值對(duì)存儲(chǔ)[單選題]102.讓學(xué)習(xí)器不依賴外界交互、自動(dòng)地利用未標(biāo)記樣本來(lái)提升學(xué)習(xí)性能,就是(__)。A)有監(jiān)督學(xué)習(xí)B)全監(jiān)督學(xué)習(xí)C)無(wú)監(jiān)督學(xué)習(xí)D)半監(jiān)督學(xué)習(xí)[單選題]103.業(yè)務(wù)系統(tǒng)功能設(shè)計(jì)需嚴(yán)格執(zhí)行公司信息化和數(shù)據(jù)資產(chǎn)標(biāo)準(zhǔn),數(shù)據(jù)應(yīng)按()準(zhǔn)確錄入和采集,關(guān)鍵數(shù)據(jù)應(yīng)進(jìn)行初審和復(fù)核,保證數(shù)據(jù)真實(shí),避免數(shù)據(jù)缺失A)規(guī)定的時(shí)間、頻度B)數(shù)據(jù)類型C)數(shù)據(jù)大小D)數(shù)據(jù)重要性[單選題]104.()用于將非線性引人神經(jīng)網(wǎng)絡(luò),它會(huì)將值縮小到較小的范圍內(nèi)A)損失函數(shù)B)優(yōu)化函數(shù)C)激活函數(shù)D)目標(biāo)函數(shù)[單選題]105.HBase是哪兩個(gè)單詞縮寫(xiě)A)HadoopDataBaseB)HadoopBasementC)HanaBasementD)HadoopDatastore[單選題]106.我們想在大數(shù)據(jù)集上訓(xùn)練決策樹(shù),為了使用較少時(shí)間,我們可以A)增加樹(shù)的深度B)增加學(xué)習(xí)率(learningrate)C)減少樹(shù)的深度D)減少樹(shù)的數(shù)量[單選題]107.全鏈路大數(shù)據(jù)分析流程包括六個(gè)步驟,這六個(gè)步驟的排列順序是()A)數(shù)據(jù)匯集à數(shù)據(jù)源à數(shù)據(jù)湖à分析挖掘à數(shù)據(jù)加工à數(shù)據(jù)可視化B)數(shù)據(jù)匯集à數(shù)據(jù)源à分析挖掘à數(shù)據(jù)湖à數(shù)據(jù)加工à數(shù)據(jù)可視化C)數(shù)據(jù)源à數(shù)據(jù)匯集à分析挖掘à數(shù)據(jù)湖à數(shù)據(jù)加工à數(shù)據(jù)可視化D)數(shù)據(jù)源à數(shù)據(jù)匯集à數(shù)據(jù)湖à數(shù)據(jù)加工à分析挖掘à數(shù)據(jù)可視化[單選題]108.執(zhí)行后可以查看Python的版本的是A)importsysprint(sys.Version)B)importsystemprint(system.version)C)importsystemprint(system.Version)D)importsysprint(sys.version)[單選題]109.在規(guī)劃FusionInsightHD集群時(shí),如果客戶用于功能測(cè)試,對(duì)性能沒(méi)有要求,節(jié)約成本的情況下可以采用管理節(jié)點(diǎn)、控制節(jié)點(diǎn)、數(shù)據(jù)節(jié)點(diǎn)合一部署,最少需要多少節(jié)點(diǎn)?A)2B)3C)6D)8[單選題]110.()肯定是寬依賴操作。A)mapB)flatMapC)reduceByKeyD)sample[單選題]111.下面不屬于詞袋模型的缺點(diǎn)的是?A)詞匯表的詞匯需要經(jīng)過(guò)精心設(shè)計(jì)B)表示具有稀疏性C)丟失詞序忽略了上下文D)模型復(fù)雜,不利于實(shí)施[單選題]112.TF-IDF模型中TF是指(__)。A)詞頻數(shù)B)逆文檔頻率C)詞頻率D)逆文檔頻數(shù)[單選題]113.type(1e6)的結(jié)果為()。A)<class'int'>B)<class'?oat'>C)<class'complex'>D)<class'bool'>[單選題]114.設(shè)置x軸的數(shù)值顯示范圍可以用(__)函數(shù)。A)plt.plot()B)plt.xlim()C)plt.xlabel()D)plt.show()[單選題]115.Yarn中設(shè)置隊(duì)里queueA的最大使用資源量,需要配置哪個(gè)參數(shù)A)yarn.scheduler.capacity.root.Queueuser-limit-factorB)yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percentC)yarn.scheduler.capacity.root.QueueA.stateD)yarn.scheduler.capacity.root.QueueA.maxmum-capacity[單選題]116.第三次信息化浪潮的發(fā)生標(biāo)志是以()技術(shù)的普及為標(biāo)志。A)互聯(lián)網(wǎng)B)CPUC)物聯(lián)網(wǎng)、云計(jì)算和大數(shù)據(jù)D)個(gè)人計(jì)算機(jī)[單選題]117.在分布式環(huán)境系統(tǒng)中,引入()可以防止內(nèi)存數(shù)據(jù)就會(huì)丟失A)HLogB)HRegionC)ZooKeeperD)Server[單選題]118.卷積神經(jīng)網(wǎng)絡(luò)能通過(guò)卷積以及池化等操作將不同種類的鳥(niǎo)歸為一類,下列關(guān)于卷積神經(jīng)網(wǎng)絡(luò)能達(dá)到該效果的原因的描述不正確的是()。A)同樣模式的內(nèi)容(如鳥(niǎo)嘴)在圖像不同位置可能出現(xiàn)B)池化之后的圖像主體內(nèi)容基本不變C)不同種類鳥(niǎo)的相同部位(如鳥(niǎo)嘴)形狀相似D)池化作用能使不同種類鳥(niǎo)變得相似[單選題]119.(__)是指為最小化總體風(fēng)險(xiǎn),只需在每個(gè)樣本上選擇能使特定條件風(fēng)險(xiǎn)最小的類別標(biāo)記。A)支持向量機(jī)B)間隔最大化C)線性分類器D)貝葉斯判定準(zhǔn)則[單選題]120.()的主要議題是如何實(shí)現(xiàn)和優(yōu)化機(jī)器的自我學(xué)習(xí)。A)機(jī)器學(xué)習(xí)B)人工智能C)深度學(xué)習(xí)D)人機(jī)共生[單選題]121.下列選項(xiàng)中,存放Hadoop配置文件的目錄是()A)includeB)binC)libexecD)etc[單選題]122.貝葉斯決策的最優(yōu)分類面是(__)。A)線性的B)非線性的C)不可構(gòu)造的D)不存在的[單選題]123.給出如下代碼:fname=input("請(qǐng)輸入要打開(kāi)的文件:")fo=open(fname,"r")forlineinfo.readlines():print(line)fo.close()關(guān)于上述代碼的描述,以下選項(xiàng)中錯(cuò)誤的是A)通過(guò)fo.readlines()方法將文件的全部?jī)?nèi)容讀入一個(gè)字典foB)通過(guò)fo.readlines()方法將文件的全部?jī)?nèi)容讀入一個(gè)列表foC)上述代碼可以優(yōu)化為:fname=input("請(qǐng)輸入要打開(kāi)的文件:")withopen(fname,'r')asf:forlineinf.readlines():print(line)D)用戶輸入文件路徑,以文本文件方式讀入文件內(nèi)容并逐行打印[單選題]124.()負(fù)責(zé)MapReduce任務(wù)調(diào)度。A)NameNodeB)JobtrackerC)TaskTrackerD)SecondaryNameNode[單選題]125.下面關(guān)于分析學(xué)習(xí)描述正確的是(__)。A)分析學(xué)習(xí)的缺陷在于不完美的領(lǐng)域理論B)分析學(xué)習(xí)的目標(biāo)是擬合數(shù)據(jù)假設(shè)C)分析學(xué)習(xí)通過(guò)演繹推理D)分析學(xué)習(xí)無(wú)需先驗(yàn)知識(shí)[單選題]126.在ZooKeeper中有三種角色,下列選項(xiàng)中不屬于ZooKeeper中的角色()A)ObserverB)LeaderC)ObeyerD)Follower[單選題]127.以下關(guān)于同步賦值語(yǔ)句描述錯(cuò)誤的選項(xiàng)是:A)同步賦值能夠使得賦值過(guò)程變得更簡(jiǎn)潔B)判斷多個(gè)單一賦值語(yǔ)句是否相關(guān)的方法是看其功能上是否相關(guān)或相同C)設(shè)x,y表示一個(gè)點(diǎn)的坐標(biāo),則x=a;y=b兩條語(yǔ)句可以用x,y=a,b一條語(yǔ)句來(lái)賦值D)多個(gè)無(wú)關(guān)的單一賦值語(yǔ)句組合成同步賦值語(yǔ)句,會(huì)提高程序可讀性[單選題]128.在MaxComputeSQL中,常量定義100BD表示的含義是:()。A)數(shù)值為100的DECIMALB)數(shù)值為100的BigintC)數(shù)值為100的StringD)數(shù)值為100的Double[單選題]129.當(dāng)訓(xùn)練樣本近似線性可分時(shí),通過(guò)(),學(xué)習(xí)一個(gè)()。A)硬間隔,最大化非線性支持向量機(jī)B)軟間隔,最大化線性支持向量機(jī)C)硬間隔,最大化線性支持向量機(jī)D)軟間隔,最大化非線性支持向量機(jī)[單選題]130.DLI支持以下()字符碼的數(shù)據(jù)。A)UTF-8B)ASCIIC)GB2312D)Base64[單選題]131.以下關(guān)于公共安全行業(yè)專題分析與查詢業(yè)務(wù)場(chǎng)景描述錯(cuò)誤的選項(xiàng)是()。A)臨時(shí)交互式查詢?nèi)蝿?wù)對(duì)數(shù)據(jù)進(jìn)行精確或者模湖查詢。B)適用標(biāo)準(zhǔn)SQL語(yǔ)句進(jìn)行查詢,根據(jù)查詢結(jié)果篩選目標(biāo)人群,偵動(dòng)案件。C)數(shù)據(jù)湖內(nèi)多個(gè)數(shù)據(jù)源只能單獨(dú)訪問(wèn)再呈現(xiàn)結(jié)果。D)原始數(shù)據(jù)經(jīng)過(guò)批處理后結(jié)果寫(xiě)入到指定的文件目錄,供交互時(shí)查詢。[單選題]132.假如我們使用Lasso回歸來(lái)擬合數(shù)據(jù)集,該數(shù)據(jù)集輸入特征有100個(gè)(X1,X2,…,X100)。現(xiàn)在,我們把其中一個(gè)特征值擴(kuò)大10倍(如特征X1),然后用相同的正則化參數(shù)對(duì)Lasso回歸進(jìn)行修正。那么,下列說(shuō)法正確的是()。A)特征X1很可能被排除在模型之外B)特征X1很可能還包含在模型之中C)無(wú)法確定特征X1是否被舍D)以上答案都不正確[單選題]133.下列方法中屬于映射數(shù)據(jù)到新的空間的是()。A)傅里葉變換B)特征加權(quán)C)漸進(jìn)抽樣D)維歸約[單選題]134.交叉表的橫縱軸區(qū)域中,除了行維度、列維度外,另外一個(gè)是()A)形狀B)風(fēng)格C)背景D)指標(biāo)[單選題]135.子集搜索中,逐漸增加相關(guān)特征的策略稱為()A)前向搜索B)后向搜索C)雙向搜索D)不定向搜索[單選題]136.以下關(guān)于EasticSearch緩存機(jī)制的理解不正確的是()。A)QueryCache:Shard級(jí)別的緩存,是對(duì)一個(gè)查詢中包含的過(guò)濾器執(zhí)行結(jié)果進(jìn)行緩存。B)RequestCache:Shard級(jí)別的緩存,是為了緩存?分片級(jí)?的本地結(jié)果集。C)FielddataCache專門針對(duì)分詞的字段在查詢期間的數(shù)據(jù)結(jié)構(gòu)的緩存。D)緩存主要分三種:QueryCache,FielddataCache,RequestCache。[單選題]137.Hadoop平臺(tái)中;要查看YARN服務(wù)中一個(gè)application的信息;通常需要使用什么命令A(yù))containerB)applicationattermptC)jarD)application[單選題]138.Kafka集群中,Kafka服務(wù)端的角色是?A)BrokerB)ConsumerC)ZooKeeperD)Producer[單選題]139.下面組件哪個(gè)是數(shù)據(jù)挖掘庫(kù):()A)ZookeeperB)MahoutC)MySQLD)HBase[單選題]140.關(guān)于MapReduce的描述錯(cuò)誤的是()A)MapReduce框架會(huì)先排序map任務(wù)的輸出B)通常,作業(yè)的輸入輸出都會(huì)被存儲(chǔ)在文件系統(tǒng)中C)通常計(jì)算節(jié)點(diǎn)和存儲(chǔ)節(jié)點(diǎn)是同一節(jié)點(diǎn)D)一個(gè)Task通常會(huì)把輸入集切分成若干獨(dú)立的數(shù)據(jù)塊[單選題]141.有關(guān)MapReduce,下面哪個(gè)說(shuō)法是正確的()A)它提供了資源管理能力B)它是開(kāi)源數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),用于查詢和分析存儲(chǔ)在Hadoop中的大型數(shù)據(jù)集C)它是Hadoop數(shù)據(jù)處理層D)它是一個(gè)理想的數(shù)據(jù)處理框架,難以實(shí)現(xiàn)[單選題]142.關(guān)于hive錯(cuò)誤的是A)數(shù)據(jù)存儲(chǔ)在HDFS中B)通過(guò)類SQL語(yǔ)句快速實(shí)現(xiàn)MapReduce統(tǒng)計(jì)C)Hive的設(shè)計(jì)目標(biāo)為適用于OLTP業(yè)務(wù)場(chǎng)景D)不提供行級(jí)數(shù)據(jù)更新操作[單選題]143.(__)是一類用圖來(lái)表達(dá)變量相關(guān)關(guān)系的概率模型。A)神經(jīng)元模型B)感知機(jī)模型C)概率圖模型D)SVM[單選題]144.(__)是指抽取情感文本中有價(jià)值的情感信息,其要判斷一個(gè)單詞或詞組在情感表達(dá)中扮演的角色,包括情感表達(dá)者識(shí)別,評(píng)價(jià)對(duì)象識(shí)別,情感觀點(diǎn)詞識(shí)別等任務(wù)。A)情感分類B)情感檢索C)情感抽取D)情感分析第2部分:多項(xiàng)選擇題,共63題,每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]145.DRDS則將整個(gè)擴(kuò)容的過(guò)程分為多個(gè)階段,包括:()步驟。A)切換數(shù)據(jù)庫(kù)B)增量同步C)全量遷移D)重啟實(shí)例[多選題]146.泛在電力物聯(lián)網(wǎng)從結(jié)構(gòu)上看,包括了():A)感知層B)網(wǎng)絡(luò)層C)平臺(tái)層D)應(yīng)用層[多選題]147.(__)是數(shù)據(jù)科學(xué)的主要理論基礎(chǔ)之一。A)機(jī)器學(xué)習(xí)B)統(tǒng)計(jì)學(xué)C)數(shù)據(jù)D)黑客精神與技能[多選題]148.傳統(tǒng)數(shù)據(jù)密集型行業(yè)積極探索和布局大數(shù)據(jù)應(yīng)用的表現(xiàn)是()A)投資入股互聯(lián)網(wǎng)電商行業(yè)B)打通多源跨域數(shù)據(jù)C)提高分析挖掘能力D)實(shí)現(xiàn)科學(xué)決策與運(yùn)營(yíng)[多選題]149.關(guān)于SparkSQL&Hive區(qū)別與聯(lián)系,下列說(shuō)法正確的是?A)SparkSQL依賴Hive的元數(shù)據(jù)B)SparkSQL的執(zhí)行引擎為Sparkcore,Hive默認(rèn)執(zhí)行引擎為MapReduceC)SparkSQL不可以使用Hive的自定義函數(shù)D)SparkSQL兼容絕大部分Hive的語(yǔ)法和函數(shù)[多選題]150.Hive的自定義函數(shù)包括?A)UDAFB)UDCEC)UDTFD)UDE[多選題]151.ETL包含的過(guò)程有()。A)數(shù)據(jù)抽取B)數(shù)據(jù)轉(zhuǎn)換C)數(shù)據(jù)加載D)數(shù)據(jù)展現(xiàn)[多選題]152.大數(shù)據(jù)技術(shù)在我們身邊應(yīng)用的越來(lái)越廣,以下場(chǎng)景中有哪些場(chǎng)景可以應(yīng)用大數(shù)據(jù)技術(shù)?A)游戲畫(huà)面實(shí)時(shí)刷新B)廣告精準(zhǔn)營(yíng)銷C)道路智能規(guī)劃D)人物國(guó)像[多選題]153.以下哪幾項(xiàng)屬于漢語(yǔ)未登錄詞的類型?()A)存在于詞典但出現(xiàn)頻率較少的詞B)新出現(xiàn)的普通詞匯C)專有名詞D)專業(yè)名詞和研究領(lǐng)域名稱[多選題]154.以下哪些選項(xiàng)屬子實(shí)時(shí)檢索的特點(diǎn)?A)處理時(shí)間要求不高B)查詢響應(yīng)要求較高C)高并發(fā)D)全文檢索功能[多選題]155.下列關(guān)于PCA說(shuō)法正確的是()?A)在使用PCA之前,我們必須標(biāo)準(zhǔn)化數(shù)據(jù)B)應(yīng)該選擇具有最大方差的主成分C)應(yīng)該選擇具有最小方差的主成分D)可以使用PCA在低維空間中可視化數(shù)據(jù)[多選題]156.Hadoop集群規(guī)模很大時(shí),數(shù)據(jù)的分布情況會(huì)非常關(guān)鍵,用戶需要根據(jù)數(shù)據(jù)分布情況,決定集群是否擴(kuò)容,數(shù)據(jù)是否需要做負(fù)載均衡等,fusionInsight資源分布監(jiān)控說(shuō)法正確的是?A)可以幫助用戶快速聚焦在最關(guān)鍵的資源消耗上。B)通過(guò)每個(gè)服務(wù)主業(yè)的資源分布查看界面,看到關(guān)鍵的資源分布情況。C)通過(guò)Dashboard界面,可以查看到主機(jī)資源分不清哪個(gè)礦,例如內(nèi)存占用率在50-75%的主機(jī)列表,并提供鏈接跳轉(zhuǎn)。D)幫助用戶迅速找到資源消耗最高的點(diǎn),采取適當(dāng)?shù)拇胧多選題]157.數(shù)據(jù)庫(kù)信息的運(yùn)行安全采取的主措施有()。A)備份與恢復(fù)B)應(yīng)急C)風(fēng)險(xiǎn)分析D)審計(jì)跟蹤[多選題]158.一家搜索引整公司需要7*24不間斷提供海量用戶的實(shí)時(shí)查詢請(qǐng)求,這最有可能使用到以下哪些大數(shù)據(jù)開(kāi)發(fā)組件的組合?A)MapReduceB)ElasticSearchC)HiveD)HBase[多選題]159.以下描述中屬于Analytics2.0的主要特點(diǎn)的是()。A)側(cè)重嵌入式分析B)重視非結(jié)構(gòu)化數(shù)據(jù)的分析C)以決策支持為主要目的D)注重解釋性分析和預(yù)測(cè)性分析[多選題]160.FusionInasightHD集群中包含了多種服務(wù),沒(méi)種服務(wù)又由若干個(gè)角色組成,下面哪些是服務(wù)的角色?*A)HDFSB)NameNodeC)DataNodeD)HBase[多選題]161.GraphBase數(shù)據(jù)底層可以存儲(chǔ)在哪里?A)HBaseB)MySQLC)HDFSD)ElasticSearch[多選題]162.可以創(chuàng)建一個(gè)全零矩陣的是(__)。A)np.zero(10)B)np.empty(10)C)np.zeros(10)D)np.array(10)[多選題]163.以下()場(chǎng)景可以使用MaxcomputeMR實(shí)現(xiàn)。A)Web訪問(wèn)日志分析:分析用戶訪問(wèn)行為,個(gè)性化推薦等B)搜索,比如pagerank、網(wǎng)頁(yè)爬取等C)機(jī)器學(xué)習(xí):監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)、分類算法等D)廣告推薦:用戶點(diǎn)擊購(gòu)買行為預(yù)測(cè)[多選題]164.FusionlnsightHD產(chǎn)品中,關(guān)于Kafka組件說(shuō)法正確的有?A)刪除Topic時(shí),必須確保Kafka的服務(wù)配置delete.topic.enable配置為trueB)Kafka安裝及運(yùn)行日志保存路徑為/srv/Bigdata/kafkaC)ZooKeeper服務(wù)不可用會(huì)導(dǎo)致Kafka服務(wù)不可用D)必須使用admin用戶或者kafkaadmin組用戶進(jìn)行創(chuàng)建Topic[多選題]165.scipy.optimize模塊可以實(shí)現(xiàn)(__)。A)bfgs優(yōu)化B)最小二乘優(yōu)化C)knnD)求根算法[多選題]166.下面關(guān)于Storm框架設(shè)計(jì)描述正確的是:()A)Storm運(yùn)行在分布式集群中,其運(yùn)行任務(wù)的方式與Hadoop類似B)在Hadoop上運(yùn)行的是MapReduce作業(yè),而在Storm上運(yùn)行的是?Topology?C)Storm集群采用P2P架構(gòu)D)Storm采用了Zookeeper來(lái)作為分布式協(xié)調(diào)組件[多選題]167.下列關(guān)于RNN、LSTM、GRU的說(shuō)法正確的有()。A)RNN引入了循環(huán)的概念B)LSTM可以防止梯度消失或者爆炸C)GRU是LSTM的變體D)RNN、LSTM、GRU是同一神經(jīng)網(wǎng)絡(luò)的不同說(shuō)法,沒(méi)有區(qū)別[多選題]168.實(shí)時(shí)檢索的解決方案中有哪些組件?A)HBaseB)HadoopC)ElasticSearchD)Hive[多選題]169.國(guó)網(wǎng)信通公司及各級(jí)網(wǎng)絡(luò)安全運(yùn)行單位負(fù)責(zé)做好承載重要數(shù)據(jù)業(yè)務(wù)系統(tǒng)的安全運(yùn)營(yíng),()。A)規(guī)范新媒體開(kāi)設(shè)(關(guān)停)的審批流程B)制定電力監(jiān)控系統(tǒng)數(shù)據(jù)安全保護(hù)方案C)加強(qiáng)技術(shù)監(jiān)控手段,強(qiáng)化對(duì)重要數(shù)據(jù)信息的監(jiān)測(cè)、預(yù)警、攔截、審計(jì)等技術(shù)措施D)編制數(shù)據(jù)安全相關(guān)應(yīng)急預(yù)案并定期演練[多選題]170.基于機(jī)器學(xué)習(xí)的情感分類方法有(__)。A)貝葉斯分類器B)支持向量機(jī)C)條件隨機(jī)場(chǎng)D)最大熵分類器[多選題]171.在數(shù)據(jù)科學(xué)中,計(jì)算模式發(fā)生了根本性的變化--從集中式計(jì)算、分布式計(jì)算、網(wǎng)格計(jì)算等傳統(tǒng)計(jì)算過(guò)渡至云計(jì)算,有一定的代表性的是Google云計(jì)算三大技術(shù),這三大技術(shù)包括()。A)HadoopYARN資源管理器B)GFS分布式存儲(chǔ)系統(tǒng)C)MapReduce分布式處理技術(shù)D)BigTable分布式數(shù)據(jù)庫(kù)[多選題]172.在詞袋模型中使用單個(gè)的單詞來(lái)構(gòu)建詞向量這樣的序列被稱為()。A)1元組(1-gram)B)單元組(unigram)模型C)列表D)字典[多選題]173.國(guó)家電網(wǎng)有限公司數(shù)據(jù)管理辦法要求將數(shù)據(jù)管理作為一項(xiàng)長(zhǎng)期的持續(xù)性工作,加強(qiáng)()等基礎(chǔ)工作,打造可靠的數(shù)據(jù)基礎(chǔ)。A)數(shù)據(jù)目錄B)數(shù)據(jù)盤點(diǎn)C)數(shù)據(jù)標(biāo)準(zhǔn)D)數(shù)據(jù)質(zhì)量[多選題]174.請(qǐng)問(wèn)以下哪些是導(dǎo)致數(shù)據(jù)重復(fù)的原因()A)數(shù)據(jù)重復(fù)寫(xiě)入B)數(shù)據(jù)集成C)數(shù)據(jù)加工過(guò)程中的關(guān)聯(lián)D)數(shù)據(jù)壓縮[多選題]175.數(shù)據(jù)科學(xué)基本原則中,蘭世界原則指的是()A)精神世界B)數(shù)據(jù)世界C)物理世界D)數(shù)字世界[多選題]176.Spark適用于以下哪些場(chǎng)景?A)交互式查詢B)實(shí)時(shí)流處理C)批處理D)圖計(jì)算[多選題]177.關(guān)于GBDT算法,下列說(shuō)法正確的是()?A)增加用于分割的最小樣本數(shù)量,有助于避免過(guò)擬合B)增加用于分割的最小樣本數(shù)量,容易造成過(guò)擬合C)減小每個(gè)基本樹(shù)的樣本比例,有助于減小方差D)減小每個(gè)基本樹(shù)的樣本比例,有助于減小偏差[多選題]178.Linux上Python的安裝包是()。A)Python-3.6.9.tar.xzB)Python-3.6.9.tgzC)python-3.7.4-amd64.exeD)python-3.7.4-macosx10.9.pkg[多選題]179.關(guān)于HadoopMapReduce,以下描述中正確的是()。A)reduce()函數(shù)的輸入是value集B)reduce()函數(shù)將最終結(jié)果寫(xiě)到HDFS系統(tǒng)中C)用戶可以自己定義reduce()函數(shù)D)reduce()函數(shù)的輸入數(shù)據(jù)是經(jīng)過(guò)map()函數(shù)處理之后的數(shù)據(jù)[多選題]180.Region分裂時(shí),下列哪些選項(xiàng)會(huì)參與?0A)MAsterB)RegionServerC)ZookeeperD)以上全不正確[多選題]181.如果請(qǐng)你在DEEP平臺(tái)中,根據(jù)既有數(shù)據(jù)進(jìn)行未來(lái)天氣的預(yù)測(cè),將會(huì)采用線性回歸模型,將會(huì)用到哪幾個(gè)數(shù)據(jù)轉(zhuǎn)換器?A)NumericCastB)NumAssembleC)ChoiceD)Predict[多選題]182.正則表達(dá)式可以用非常靈活的方式來(lái)處理字符串,在大數(shù)據(jù)計(jì)算服務(wù)SQL中的正則函數(shù)支持POSIX格式,以下對(duì)正則表達(dá)式描述正確的有:()。A)[[:blank::]]匹配空格和TAB制表符B)$匹配行尾C)[[:alnum:]]匹配字母字符和數(shù)字字符D)[[:digint:]]匹配數(shù)字字符[多選題]183.重復(fù)數(shù)據(jù)產(chǎn)生的原因有()A)人為多次提交B)數(shù)據(jù)集成時(shí)造成重復(fù)C)系統(tǒng)自身問(wèn)題導(dǎo)致重復(fù)寫(xiě)入D)數(shù)據(jù)加工過(guò)程中產(chǎn)生數(shù)據(jù)重復(fù)[多選題]184.觀察樣本次數(shù)如何影響過(guò)擬合()?注意:所有情況的參數(shù)都保持一致。A)觀察次數(shù)少,容易發(fā)生過(guò)擬合B)觀察次數(shù)少,不容易發(fā)生過(guò)擬合C)觀察次數(shù)多,容易發(fā)生過(guò)擬合D)觀察次數(shù)多,不容易發(fā)生過(guò)擬合[多選題]185.下面屬于數(shù)據(jù)加工的有(__)。A)數(shù)據(jù)審計(jì)B)數(shù)據(jù)清洗C)數(shù)據(jù)變換D)數(shù)據(jù)集成[多選題]186.以下關(guān)于數(shù)據(jù)中心、業(yè)務(wù)系統(tǒng)訪問(wèn)權(quán)限的說(shuō)法不正確的有()。A)數(shù)據(jù)中心、業(yè)務(wù)系統(tǒng)訪問(wèn)權(quán)限實(shí)行匿名制管理B)對(duì)數(shù)據(jù)中心、業(yè)務(wù)系統(tǒng)權(quán)限賬號(hào)的登錄時(shí)間、時(shí)長(zhǎng)等實(shí)行痕跡管理C)數(shù)據(jù)中心、業(yè)務(wù)系統(tǒng)權(quán)限賬號(hào)供責(zé)任人登錄使用,也可借與他人D)數(shù)據(jù)中心、業(yè)務(wù)系統(tǒng)權(quán)限賬號(hào)密碼不超過(guò)3天要更換一次[多選題]187.HFile是HBase存儲(chǔ)數(shù)據(jù)的文件組織形式,由六部分組成,除了數(shù)據(jù)塊、元數(shù)據(jù)塊、文件信息塊還包括()【選三項(xiàng)】A)文件尾塊B)數(shù)據(jù)索引塊C)元數(shù)據(jù)索引塊D)HFile文件尾[多選題]188.大數(shù)據(jù)離線批處理場(chǎng)景中常見(jiàn)的數(shù)據(jù)源包括?A)網(wǎng)頁(yè)日志流B)流式數(shù)據(jù)Socket流C)數(shù)據(jù)庫(kù)D)批量文件數(shù)據(jù)[多選題]189.主要面向或關(guān)注過(guò)去的數(shù)據(jù)分析過(guò)程有()。A)描述性分析B)診斷性分析C)預(yù)測(cè)性分析D)規(guī)范性分析[多選題]190.數(shù)據(jù)集成中需要注意的三個(gè)基本問(wèn)題是()A)數(shù)據(jù)清洗B)模式集成C)數(shù)據(jù)冗余D)沖突檢測(cè)與消除[多選題]191.商業(yè)銀行在選擇數(shù)據(jù)中心的地理位置時(shí),應(yīng)充分考慮的環(huán)境威脅包括是否接近()A)自然災(zāi)害多發(fā)B)危險(xiǎn)或有害設(shè)C)繁忙或主要公路D)風(fēng)景區(qū)[多選題]192.下列關(guān)于神經(jīng)網(wǎng)絡(luò)描述正確的是(__)。A)我們?cè)跈C(jī)器學(xué)習(xí)中談?wù)撋窠?jīng)網(wǎng)絡(luò)是指的是生物學(xué)意義上的神經(jīng)網(wǎng)絡(luò)B)神經(jīng)網(wǎng)絡(luò)中最基本的成分是神經(jīng)元模型C)在MP神經(jīng)元模型中,神經(jīng)元接受來(lái)自n個(gè)其他神經(jīng)元傳遞過(guò)來(lái)的信號(hào)D)神經(jīng)元接收到的總輸入值將與神經(jīng)元的閾值進(jìn)行比較,然后通過(guò)激活函數(shù)處理以產(chǎn)生神經(jīng)元的輸出。[多選題]193.對(duì)于大數(shù)據(jù)計(jì)算服務(wù)(MaxCompute,原ODPS)內(nèi)置絕對(duì)值函數(shù)abs描述正確的有:()。A)當(dāng)輸入?yún)?shù)是bigint時(shí),返回值是bigint類型B)當(dāng)輸入?yún)?shù)是string類型時(shí),一定會(huì)導(dǎo)致異常C)輸入類型是boolean則返回值是TrueD)當(dāng)輸入?yún)?shù)是double時(shí),返回值是double類型[多選題]194.在可視化的圖表類型中,柱狀圖包括()A)分區(qū)柱狀圖B)堆積柱狀圖C)多系列柱狀圖D)對(duì)比柱狀圖[多選題]195.下列關(guān)于負(fù)荷Python的模塊的說(shuō)法正確的有()。A)模塊能夠用來(lái)有邏輯地組織Python代碼段B)Python擁有豐富的模塊,不支持自定義模塊C)把相關(guān)的代碼分配到一個(gè)模塊里能讓代碼更好用、更易懂D)模塊能定義函數(shù)、類和變量,模塊里也能包含可執(zhí)行的代碼[多選題]196.()是關(guān)鍵詞提取的算法。A)TF-IDFB)TextRankC)LDAD)PCA[多選題]197.以下()屬于數(shù)據(jù)統(tǒng)計(jì)分析工具。A)WekaB)SASC)SPSSD)Matlab[多選題]198.常見(jiàn)的關(guān)聯(lián)規(guī)則挖掘算法包括:()A)MP-Growth算法B)FP-Growth算法C)Apriori算法D)Bpriori算法[多選題]199.Spark組件包含哪兩個(gè)算子()。A)MapB)ActionC)TransformationD)Reduce[多選題]200.以下關(guān)于Fink的窗口描述正確的是()。A)會(huì)話窗口是將數(shù)據(jù)聚合到會(huì)話窗口中,由非活躍的間隙分隔開(kāi)。B)我們可以每30秒計(jì)算一次最近一分鐘用戶購(gòu)買的商品總數(shù),這個(gè)就是時(shí)間滑動(dòng)窗口的應(yīng)用方式C)窗口可以是時(shí)間驅(qū)動(dòng)的也可以是數(shù)據(jù)驅(qū)動(dòng)的。D)Flink窗口按窗口行為劃分:TumblingWindow.SlidingWindow.SessionWindow。[多選題]201.數(shù)據(jù)安全不僅包括數(shù)據(jù)保密性,還包括()。A)完整性B)可用性C)不可否認(rèn)性D)可審計(jì)性[多選題]202.EDA(探索性數(shù)據(jù)分析)方法與傳統(tǒng)統(tǒng)討學(xué)的驗(yàn)證性分析方法的區(qū)別有()。A)EDA需要事先提出假設(shè),而驗(yàn)證性分析不需要B)EDA中采用的方法往往比驗(yàn)證性分析簡(jiǎn)單C)在一般數(shù)據(jù)科學(xué)項(xiàng)目中,探索性分析在先,驗(yàn)證性分析在后中D)EDA更為簡(jiǎn)單、易學(xué)和易用[多選題]203.相對(duì)于HadoopMapReduce,Spark的特點(diǎn)有()。A)通用性B)易用性C)速度快D)容錯(cuò)性[多選題]204.物聯(lián)網(wǎng)在物流領(lǐng)域的應(yīng)用,催生出了許多智能物流方面的應(yīng)用,以下哪幾項(xiàng)屬于其在智能物流方面的應(yīng)用A)智能海關(guān)B)智能郵政C)智能配送D)智能交通[多選題]205.下面隸屬CNN架構(gòu)的是:()A)Convolutionallayer+MaxPooling循環(huán)數(shù)次B)Convolutionallayer重復(fù)數(shù)次+MaxPooling重復(fù)數(shù)次C)FlattenD)FullyConnectedFeedforwardnetwork[多選題]206.數(shù)據(jù)再利用的意義在于()A)挖掘數(shù)據(jù)的潛在價(jià)值B)提高社會(huì)效益,優(yōu)化社會(huì)管理C)實(shí)現(xiàn)數(shù)據(jù)重組的創(chuàng)新價(jià)值D)優(yōu)化存儲(chǔ)設(shè)備,降低設(shè)備成本E)利用數(shù)據(jù)可拓展性拓寬.業(yè)務(wù)領(lǐng)域第3部分:判斷題,共42題,請(qǐng)判斷題目是否正確。[判斷題]207.MySQL支持多個(gè)字段分組并為每個(gè)分組排序。--A)正確B)錯(cuò)誤[判斷題]208.數(shù)據(jù)挖掘的主要任務(wù)是從數(shù)據(jù)中發(fā)現(xiàn)潛在的規(guī)則,從而能更好的完成描述數(shù)據(jù)、預(yù)測(cè)數(shù)據(jù)等任務(wù)A)正確B)錯(cuò)誤[判斷題]209.定義類時(shí)實(shí)現(xiàn)了__pow__()方法,該類對(duì)象即可支持運(yùn)算符**A)正確B)錯(cuò)誤[判斷題]210.GES的Edge都是單向邊,如果需要雙向邊,則通過(guò)兩條相反方向的單向邊組成。A)正確B)錯(cuò)誤[判斷題]211.本實(shí)驗(yàn)的數(shù)據(jù)源包含網(wǎng)站日志數(shù)據(jù)和數(shù)據(jù)庫(kù)業(yè)務(wù)數(shù)據(jù)。A)正確B)錯(cuò)誤[判斷題]212.HBase可以有列,可以沒(méi)有列簇。A)正確B)錯(cuò)誤[判斷題]213.已知函數(shù)定義defdemo(x,y,op):returneval(str(x)+op+str(y)),那么表達(dá)式demo(3,5,'+')的值為8。A)正確B)錯(cuò)誤[判斷題]214.表達(dá)式5if5>6else(6if3>2else5)的值為6。A)正確B)錯(cuò)誤[判斷題]215.大數(shù)據(jù)的價(jià)值重在挖掘,而挖掘就是分析。()A)正確B)錯(cuò)誤[判斷題]216.在HMM中,如果已知觀察序列和產(chǎn)生觀察序列的狀態(tài)序列,那么可以采用極大似然估計(jì)直接進(jìn)行參數(shù)估計(jì)。()A)正確B)錯(cuò)誤[判斷題]217.Series與DataFrame還支持eq、ne、lt、gt、le、ge等二進(jìn)制比較操作的方法,其中大于等于是gt。A)正確B)錯(cuò)誤[判斷題]218.Series和DataFrame是pandas包中的數(shù)據(jù)結(jié)構(gòu),Series像二維數(shù)組,DataFrame像表格A)正確B)錯(cuò)誤[判斷題]219.有監(jiān)督學(xué)習(xí)不需要進(jìn)行數(shù)據(jù)標(biāo)注。A)正確B)錯(cuò)誤[判斷題]220.分布式數(shù)據(jù)庫(kù)是指物理上分散在不同的地點(diǎn),但在邏輯上是統(tǒng)一的數(shù)據(jù)庫(kù)。因此,分布式數(shù)據(jù)庫(kù)具有物理上的獨(dú)立性、邏輯上的一體性、性能上的可擴(kuò)展性等特點(diǎn)。()A)正確B)錯(cuò)誤[判斷題]221.Dataworks中,調(diào)度任務(wù)每次運(yùn)行前都先將任務(wù)實(shí)例化,即生成實(shí)例,調(diào)度運(yùn)行時(shí)實(shí)際上在執(zhí)行相應(yīng)的實(shí)例。按天調(diào)度的周期性任務(wù)每天生成一個(gè)自動(dòng)調(diào)度實(shí)例;按00:00至23:59之間每隔一小時(shí)執(zhí)行一次的周期性任務(wù),每天生成24個(gè)自動(dòng)調(diào)度實(shí)例。A)正確B)錯(cuò)誤[判斷題]222.Python不允許使用關(guān)鍵字作為變量名,允許使用內(nèi)置函數(shù)名作為變量名,但這會(huì)改變函數(shù)名的含義。A)正確B)錯(cuò)誤[判斷題]223.一般而言,分布式數(shù)據(jù)庫(kù)是指物理上分散在不同地點(diǎn),但在邏輯上是統(tǒng)一的數(shù)據(jù)庫(kù)。因此分布式數(shù)據(jù)庫(kù)具有物理上的獨(dú)立性、邏輯上的一體性、性能上的可擴(kuò)展性等特點(diǎn)。A)正確B)錯(cuò)誤[判斷題]224.數(shù)據(jù)有多種表現(xiàn)形式,主要是數(shù)字化后存入計(jì)算機(jī)數(shù)字和文字,不包括圖形、圖像、聲音和語(yǔ)言等。A)正確B)錯(cuò)誤[判斷題]225.Graph擅長(zhǎng)完成學(xué)術(shù)論文、專利文獻(xiàn)的引用分析和統(tǒng)計(jì)。A)正確B)錯(cuò)誤[判斷題]226.由于Spark是基于內(nèi)存的計(jì)算引擎,因此,一個(gè)Spars應(yīng)用可以處理的數(shù)據(jù)量不能超過(guò)分給這個(gè)Spark應(yīng)用的內(nèi)存總和。A)正確B)錯(cuò)誤[判斷題]227.Combiner組件可以讓Map對(duì)Key進(jìn)行分區(qū),從而可以根據(jù)不同的key分發(fā)到不同的Reduce中去處理。A)正確B)錯(cuò)誤[判斷題]228.假設(shè)math標(biāo)準(zhǔn)庫(kù)已導(dǎo)入,那么表達(dá)式eval('mathA)正確B)錯(cuò)誤[判斷題]229.帶有else子句的異常處理結(jié)構(gòu),如果不發(fā)生異常則執(zhí)行else子句中的代碼。A)正確B)錯(cuò)誤[判斷題]230.HBase依賴于Zookeeper完成主備選舉,以及管理root表。A)正確B)錯(cuò)誤[判斷題]231.UPDATE語(yǔ)句屬于SQL的數(shù)據(jù)庫(kù)定義語(yǔ)言。--A)正確B)錯(cuò)誤[判斷題]232.分類和回歸都可用于預(yù)測(cè),分類的輸出是離散的類別值,而回歸的輸出是連續(xù)數(shù)值A(chǔ))正確B)錯(cuò)誤[判斷題]233.客戶通過(guò)網(wǎng)上大數(shù)據(jù)審貸未通過(guò)的,線下也一律不得辦理A)正確B)錯(cuò)誤[判斷題]234.HBase支持完整的事務(wù)機(jī)制。A)正確B)錯(cuò)誤[判斷題]235.實(shí)體是指客觀存在并可相互區(qū)分的事物。--A)正確B)錯(cuò)誤[判斷題]236.如果自變量X和因變量Y之間存在高度的非線性和復(fù)雜關(guān)系,那么樹(shù)模型很可能優(yōu)于經(jīng)典回歸方法A)正確B)錯(cuò)誤[判斷題]237.Redis默認(rèn)支持14個(gè)數(shù)據(jù)庫(kù)。A)正確B)錯(cuò)誤[判斷題]238.在函數(shù)內(nèi)部沒(méi)有辦法定義全局變量。A)正確B)錯(cuò)誤[判斷題]239.BI工具數(shù)據(jù)集支持添加、刪除字段操作()A)正確B)錯(cuò)誤[判斷題]240.擴(kuò)展庫(kù)os中的方法remove()可以刪除帶有只讀屬性的文件。A)正確B)錯(cuò)誤[判斷題]241.JSON數(shù)據(jù)類型可以保存一個(gè)SPU對(duì)應(yīng)的所有SKU信息。--A)正確B)錯(cuò)誤[判斷題]242.無(wú)法使用lambda表達(dá)式定義有名字的函數(shù)。A)正確B)錯(cuò)誤[判斷題]243.同時(shí)新增多個(gè)字段時(shí)不能指定字段的位置。--A)正確B)錯(cuò)誤[判斷題]244.Python中可以使用關(guān)鍵字作為變量名。()A)正確B)錯(cuò)誤[判斷題]245.在一個(gè)MapReduce應(yīng)用程序中,map函數(shù)的輸出經(jīng)由MapReduce框架處理后,發(fā)送到reduce函數(shù)。這個(gè)處理過(guò)程是基于鍵值對(duì)進(jìn)行排序和分組的。A)正確B)錯(cuò)誤[判斷題]246.只可以動(dòng)態(tài)為對(duì)象增加數(shù)據(jù)成員,而不能為對(duì)象動(dòng)態(tài)增加成員方法A)正確B)錯(cuò)誤[判斷題]247.時(shí)序預(yù)測(cè)回歸預(yù)測(cè)一樣,也是用已知的數(shù)據(jù)預(yù)測(cè)未來(lái)的值,但這些數(shù)據(jù)的區(qū)別是變量所處時(shí)間的不同A)正確B)錯(cuò)誤[判斷題]248.對(duì)文件進(jìn)行讀寫(xiě)操作之后必須顯式關(guān)閉文件以確保所有內(nèi)容都得到保存。A)正確B)錯(cuò)誤第4部分:?jiǎn)柎痤},共11題,請(qǐng)?jiān)诳瞻滋幪顚?xiě)正確答案。[問(wèn)答題]249.創(chuàng)建一個(gè)HDFS客戶端對(duì)象主要涉及Configuration類和()類。[問(wèn)答題]250.GES中用()表示邊的類型,用于表示現(xiàn)實(shí)世界中的關(guān)系類型。[問(wèn)答題]251.()的日的縮小數(shù)據(jù)的取值范圍,使其更適合于數(shù)據(jù)挖掘算法的需要,并且能夠得到和原始數(shù)據(jù)相同的分析結(jié)果。[問(wèn)答題]252.Solr可以對(duì)結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)建立索引,并提供全文檢索的能力。A)正確B)B錯(cuò)誤[問(wèn)答題]253.()用于維護(hù)文件系統(tǒng)名稱并管理客戶端對(duì)文件的訪問(wèn),()存儲(chǔ)真實(shí)的數(shù)據(jù)塊。[問(wèn)答題]254.Secondarynamenode就是namenode出現(xiàn)問(wèn)題時(shí)的備用節(jié)點(diǎn)A)正確B)錯(cuò)誤[問(wèn)答題]255.Channel的作用類似隊(duì)列,用于臨時(shí)緩存進(jìn)來(lái)的數(shù)據(jù),當(dāng)Sink成功地將數(shù)據(jù)發(fā)送到下一跳的Channel或最終目的,數(shù)據(jù)會(huì)從Channel移除A)TRUEB)FALSE[問(wèn)答題]256.iloc方法主要使用整數(shù)來(lái)索引數(shù)據(jù),而不能使用【】來(lái)索引數(shù)據(jù)。[問(wèn)答題]257.Flume架構(gòu)中,一個(gè)sink可以連接多個(gè)channel。A)TrueB)False[問(wèn)答題]258.Hadoop2、x版本中的HDFS是由()()()組成。[問(wèn)答題]259.是否可以自行搭建Hadoop集群?[多選題]260.以下關(guān)于集成學(xué)習(xí)的說(shuō)法,正確的是()A)隨機(jī)森林是減少模型的方差,而GBDT是減少模型的偏差B)組成隨機(jī)森林的樹(shù)可以并行生成,而GBDT是串行生成C)隨機(jī)森林的結(jié)果是多數(shù)表決表決的,而GBDT則是多棵樹(shù)累加之和1.答案:C解析:2.答案:C解析:3.答案:B解析:4.答案:C解析:5.答案:D解析:6.答案:D解析:7.答案:D解析:8.答案:C解析:9.答案:B解析:λ很小,則意味著模型比較復(fù)雜,在這種情況下,會(huì)產(chǎn)生偏差低且方差高的結(jié)果,模型會(huì)對(duì)數(shù)據(jù)過(guò)擬合。10.答案:C解析:決策樹(shù)深度越深,在訓(xùn)練集上誤差會(huì)越小,準(zhǔn)確率越高。但是容易造成過(guò)擬合,而且增加模型的訓(xùn)練時(shí)問(wèn)間。對(duì)決策樹(shù)進(jìn)行修剪,減小樹(shù)的深度,能夠提高模型的訓(xùn)練速度,有效避免過(guò)擬合。11.答案:B解析:12.答案:B解析:13.答案:D解析:14.答案:B解析:15.答案:C解析:16.答案:A解析:17.答案:A解析:18.答案:C解析:19.答案:B解析:20.答案:D解析:樣本數(shù)過(guò)多或者特征數(shù)過(guò)多,而不能單機(jī)完成訓(xùn)練,可以用小批量樣本訓(xùn)練,或者在線累計(jì)式訓(xùn)練,或者主成分PCA降維方式減少特征數(shù)量再進(jìn)行訓(xùn)練。21.答案:D解析:22.答案:C解析:23.答案:B解析:24.答案:A解析:25.答案:D解析:26.答案:B解析:27.答案:C解析:28.答案:A解析:29.答案:C解析:一旦某個(gè)數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)以后,一般情況下將被長(zhǎng)期保留,也就是數(shù)據(jù)倉(cāng)庫(kù)中一般有大量的查詢操作,但修改和刪除操作很少,通常只需要定期的加載、刷新。30.答案:B解析:31.答案:A解析:測(cè)試集正例和負(fù)例數(shù)量不均衡,那么假設(shè)正例數(shù)量很少占10%,負(fù)例數(shù)量占大部分90%。而且算法能正確識(shí)別所有負(fù)例,但正例只有一半能正確判別。那么TP=0.05×all,TN=0.9×all,Accuracy=95%。雖然Accuracy很高,precision是100%,但正例recall只有50%。32.答案:D解析:33.答案:A解析:34.答案:C解析:35.答案:A解析:36.答案:B解析:由于存在精度的關(guān)系,所以0.1+0.2得到的是一個(gè)無(wú)限接近0.3的數(shù)而不是0.3,故輸出False。37.答案:B解析:38.答案:C解析:39.答案:B解析:40.答案:D解析:41.答案:C解析:42.答案:A解析:43.答案:A解析:44.答案:A解析:45.答案:B解析:46.答案:B解析:47.答案:C解析:48.答案:C解析:49.答案:C解析:50.答案:C解析:eval()函數(shù)將去掉字符串的兩個(gè)引號(hào),將其解釋為一個(gè)變量,因此C應(yīng)該分別報(bào)錯(cuò)和輸出'Hello'。51.答案:A解析:52.答案:D解析:53.答案:A解析:54.答案:B解析:在Numpy中,當(dāng)使用不同類型的數(shù)組進(jìn)行操作時(shí),結(jié)果數(shù)組的類型對(duì)應(yīng)于更一般或更精確的數(shù)組,稱為向上轉(zhuǎn)換的行為。55.答案:C解析:56.答案:D解析:57.答案:B解析:58.答案:A解析:59.答案:D解析:神經(jīng)網(wǎng)絡(luò)減少隱藏層節(jié)點(diǎn),就是在減少參數(shù),只會(huì)將訓(xùn)練誤差變高,不會(huì)導(dǎo)致過(guò)擬合。D選項(xiàng)中SVM高斯核函數(shù)比線性核函數(shù)模型更復(fù)雜,容易過(guò)擬合。60.答案:B解析:61.答案:C解析:62.答案:B解析:63.答案:D解析:64.答案:D解析:65.答案:A解析:66.答案:B解析:67.答案:A解析:68.答案:B解析:69.答案:D解析:70.答案:D解析:71.答案:B解析:72.答案:D解析:73.答案:A解析:74.答案:B解析:75.答案:A解析:76.答案:C解析:可視化的組件樣式:標(biāo)題、圖例、軸線、橫向網(wǎng)格線、縱向網(wǎng)格線、背景、自適應(yīng)提示、交互屬性77.答案:C解析:78.答案:A解析:79.答案:B解析:80.答案:B解析:81.答案:A解析:82.答案:C解析:83.答案:D解析:84.答案:C解析:85.答案:B解析:86.答案:C解析:87.答案:D解析:88.答案:C解析:89.答案:C解析:90.答案:C解析:91.答案:C解析:92.答案:D解析:93.答案:B解析:94.答案:D解析:95.答案:B解析:96.答案:D解析:97.答案:C解析:98.答案:B解析:99.答案:A解析:100.答案:D解析:101.答案:A解析:102.答案:D解析:103.答案:A解析:104.答案:C解析:105.答案:A解析:106.答案:C解析:107.答案:D解析:108.答案:D解析:109.答案:B解析:110.答案:C解析:spark中常見(jiàn)的窄依賴操作包括map、filer、union、sample等,寬依賴操作包括reduceByKey、groupByKey、join等。111.答案:D解析:112.答案:C解析:113.答案:B解析:1e6為?oat類型。114.答案:B解析:115.答案:D解析:116.答案:C解析:117.答案:A解析:118.答案:D解析:特征維數(shù)的減少并不會(huì)讓之前的特征丟失。119.答案:D解析:120.答案:A解析:121.答案:D解析:122.答案:A解析:123.答案:A解析:124.答案:B解析:125.答案:A解析:126.答案:C解析:127.答案:D解析:128.答案:A解析:129.答案:B解析:130.答案:A解析:131.答案:C解析:132.答案:B解析:將特征X1數(shù)值擴(kuò)大10倍,它對(duì)應(yīng)的回歸系數(shù)將相應(yīng)會(huì)減小,但不為0,仍然滿足β的正則化約束,因此可能還包含在模型之中。133.答案:A解析:傅里葉變換是將時(shí)間域映射到頻率域。134.答案:D解析:135.答案:A解析:136.答案:A解析:137.答
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 起重機(jī)械企業(yè)管理與創(chuàng)新考核試卷
- 施工機(jī)械安全技術(shù)操作規(guī)程考核試卷
- 藝術(shù)陶瓷的設(shè)計(jì)思維與方法考核試卷
- 大數(shù)據(jù)對(duì)數(shù)據(jù)庫(kù)影響分析試題及答案
- 嵌入式存儲(chǔ)設(shè)備管理試題及答案
- 嵌入式設(shè)計(jì)中的測(cè)試技術(shù)試題及答案
- 解析2025年網(wǎng)絡(luò)技術(shù)考試中的問(wèn)題類型試題及答案
- 復(fù)習(xí)資料三級(jí)數(shù)據(jù)庫(kù)考試試題及答案
- 理解大數(shù)據(jù)背景下的數(shù)據(jù)庫(kù)創(chuàng)新試題及答案
- 行政組織理論相關(guān)試題及答案指導(dǎo)
- 統(tǒng)借統(tǒng)還資金分撥合同
- 地鐵運(yùn)營(yíng)施工負(fù)責(zé)人考試題庫(kù)
- GB/T 708-2006冷軋鋼板和鋼帶的尺寸、外形、重量及允許偏差
- 故宮的資料簡(jiǎn)介(標(biāo)準(zhǔn)版)
- 全國(guó)高中語(yǔ)文優(yōu)質(zhì)課一等獎(jiǎng)《雷雨》 課件
- 2022秋國(guó)開(kāi)法律文書(shū)形考任務(wù)1-5試題及答案
- 固定資產(chǎn)和無(wú)形資產(chǎn)培訓(xùn)課程課件
- 工程結(jié)算審計(jì)管理辦法
- 重大事項(xiàng)和重要工作備案登記表
- 北京版二年級(jí)英語(yǔ)下冊(cè)(全套)課件
- 檢驗(yàn)科生化SOP文件
評(píng)論
0/150
提交評(píng)論