




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
試卷科目:大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷1)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)第1部分:?jiǎn)雾?xiàng)選擇題,共57題,每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.以下哪一項(xiàng)不屬于Hadoop可以運(yùn)行的模式______。A)單機(jī)(本地)模式B)偽分布式模式C)互聯(lián)模式D)分布式模式答案:C解析:Hadoop的三種運(yùn)行模式:?jiǎn)螜C(jī)(本地)模式、偽分布式模式和分布式模式。/qiulinsama/article/details/86216394[單選題]2.SQL語(yǔ)言是()的語(yǔ)言,輕易學(xué)習(xí)。A)導(dǎo)航式B)過(guò)程化C)格式化D)非過(guò)程化答案:D解析:[單選題]3.Spark中的Storage模塊存取的最小單位是A)ByteB)WordC)BlockD)Page答案:C解析:[單選題]4.企業(yè)數(shù)據(jù)分析平臺(tái)在根據(jù)不同的業(yè)務(wù)場(chǎng)景需求,搭建不同的大數(shù)據(jù)分析平臺(tái),如適應(yīng)離線批處理的Hadoop平臺(tái);適應(yīng)實(shí)時(shí)處理的流計(jì)算平臺(tái)等,這種架構(gòu)屬于哪種類(lèi)型的架構(gòu)?A)分離架構(gòu)B)單一架構(gòu)C)融合架構(gòu)D)多維架構(gòu)答案:B解析:[單選題]5.HDfS中的block默認(rèn)保存幾份?A)3B)2C)1D)不確定答案:A解析:[單選題]6.以數(shù)據(jù)為中心的思考解決問(wèn)題的方式優(yōu)勢(shì)逐漸得到體現(xiàn)的原因不包括()A)各個(gè)領(lǐng)域的數(shù)據(jù)不斷擴(kuò)展B)各個(gè)領(lǐng)域的數(shù)據(jù)交叉編制成網(wǎng)C)數(shù)據(jù)之間的關(guān)聯(lián)性大大增強(qiáng)D)人是數(shù)據(jù)的中心答案:D解析:[單選題]7.Hive的數(shù)據(jù)最終存儲(chǔ)在()。A)HDFSB)HBaseC)RDBMSD)MetaStore答案:A解析:[單選題]8.以下哪項(xiàng)用來(lái)分組()A)ORDERBYB)ORDEREDBYC)GROUPBYD)GROUPEDBY答案:C解析:[單選題]9.plt.plot()函數(shù)的功能是(__)。A)展現(xiàn)變量的趨勢(shì)變化B)尋找變量之間的關(guān)系C)設(shè)置x軸的數(shù)值顯示范圍D)設(shè)置x軸的標(biāo)簽文本答案:A解析:[單選題]10.在線性回歸問(wèn)題中,我們用R方來(lái)衡量擬合的好壞在線性回歸模型中增加特征值并再訓(xùn)練同一模型下列說(shuō)法正確的是()A)如果R方上升,則該變量是顯著的B)如果R方下降,則該變量不顯著C)羊羊R方不能反映變量重要性,不能就此得出正確結(jié)論D)以上答案都不正確答案:C解析:[單選題]11.HBase交互模式中,查看當(dāng)前版本的命令是()A)versionB)versionsC)showsD)show答案:A解析:[單選題]12.Numpy中創(chuàng)建全為1的矩陣使用什么?A)np.zeros()B)np.ones()C)np.empty()D)np.arange()答案:B解析:[單選題]13.下列關(guān)于python的類(lèi)的說(shuō)法錯(cuò)誤的是()。A)類(lèi)的實(shí)例方法必須創(chuàng)建對(duì)象后才可以調(diào)用B)類(lèi)的實(shí)例方法必須創(chuàng)建對(duì)象前才可以調(diào)用C)類(lèi)的類(lèi)方法可以用對(duì)象和類(lèi)名來(lái)調(diào)用D)類(lèi)的靜態(tài)屬性可以用類(lèi)名和對(duì)象來(lái)調(diào)用答案:B解析:類(lèi)的實(shí)例方法必須創(chuàng)建對(duì)象后才可以調(diào)用。[單選題]14.HFile數(shù)據(jù)格式中的MetaIndex字段用于()。A)Meta塊的長(zhǎng)度B)Meta塊的結(jié)束點(diǎn)C)Meta塊數(shù)據(jù)內(nèi)容D)Meta塊的起始點(diǎn)答案:D解析:index索引地址的意思就是起始點(diǎn)。[單選題]15.大數(shù)據(jù)時(shí)代的一大特征是萬(wàn)物互聯(lián)與融合,下列說(shuō)法錯(cuò)誤的是()。A)人均入網(wǎng)設(shè)備增加B)融入各個(gè)領(lǐng)域行業(yè)C)個(gè)人信息安全問(wèn)題凸顯D)信息安全領(lǐng)域影響不大答案:D解析:[單選題]16.()數(shù)據(jù)庫(kù)將結(jié)構(gòu)化、半結(jié)構(gòu)化的文檔以特定格式存儲(chǔ)。A)列存儲(chǔ)B)文檔型C)圖形D)key-value答案:B解析:[單選題]17.某學(xué)生正在學(xué)習(xí)ElasticSearch,請(qǐng)你幫他分析下,下列代碼的作用是什么?VX:HWRZKSTKA)插入數(shù)據(jù),更新素引B)插入數(shù)據(jù),創(chuàng)建素引C)更新索引D)創(chuàng)建數(shù)據(jù)答案:B解析:[單選題]18.以下不屬于高維數(shù)據(jù)可視化類(lèi)別的是()。A)平行坐標(biāo)圖B)降維投影圖C)散點(diǎn)圖矩陣D)河流圖答案:D解析:[單選題]19.關(guān)于HIVE的描述不正確的是?A)Hive最佳使用場(chǎng)景是大數(shù)據(jù)集的批處理作業(yè)B)Hive可以實(shí)現(xiàn)在大規(guī)模數(shù)據(jù)集上實(shí)現(xiàn)低延遲快速的查詢(xún)、C)ive構(gòu)建在基于靜態(tài)批量處理的Hadoop之上,Hadoop通常有較高的延遲并且在作業(yè)提交和調(diào)度的時(shí)候需要大量的開(kāi)銷(xiāo)D)Hive查詢(xún)操作過(guò)程嚴(yán)格遵循HadoopMapReduce的作用執(zhí)行模型,Hive將用戶(hù)的HiveQL語(yǔ)句通過(guò)解釋器轉(zhuǎn)換為MapReduceHadoop集群上答案:B解析:[單選題]20.下列哪些選項(xiàng)不是HBase為nul1的列不占用存儲(chǔ)空間的原因?A)Region分裂B)列存儲(chǔ)C)行存儲(chǔ)D)Key-Value結(jié)構(gòu)答案:D解析:[單選題]21.以下關(guān)于關(guān)聯(lián)分析的敘述,錯(cuò)誤的是:A)關(guān)聯(lián)規(guī)則的強(qiáng)度可以用它的支持度和置信度度量B)Apriori算法是第一個(gè)關(guān)聯(lián)規(guī)則挖掘算法C)關(guān)聯(lián)規(guī)則是形如X->Y的蘊(yùn)含表達(dá)式,其中X和Y是不相交的項(xiàng)集D)Apriori算法使用了基于置信度的剪枝技術(shù)答案:D解析:[單選題]22.下列不屬于聚類(lèi)性能度量外部指標(biāo)的是(__)。A)Jaccard系數(shù)B)FM系數(shù)C)Rand指數(shù)D)DB指數(shù)答案:D解析:[單選題]23.下列不屬于大數(shù)據(jù)在社會(huì)活動(dòng)中的典型應(yīng)用的是()。A)美團(tuán)實(shí)現(xiàn)了快速精準(zhǔn)的送餐服務(wù)B)共享單車(chē)、滴滴打車(chē)方便了人們的日常出行C)快遞實(shí)現(xiàn)了訂單的實(shí)時(shí)跟蹤D)供電公司提供電費(fèi)賬單查詢(xún)答案:D解析:電費(fèi)賬單查詢(xún)屬于簡(jiǎn)單報(bào)表查詢(xún),用電情況分析、竊電行為分析、基于交易大數(shù)據(jù)分析用戶(hù)的購(gòu)買(mǎi)習(xí)慣、基于傳感器感知的海量數(shù)據(jù)分析自然災(zāi)害的危害程度、基于搜索引擎的搜索關(guān)鍵詞分析社會(huì)熱點(diǎn)等屬于大數(shù)據(jù)應(yīng)用。[單選題]24.以下哪一個(gè)不是長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)三個(gè)門(mén)中中的一個(gè)門(mén)?()A)輸入門(mén)B)輸出門(mén)C)遺忘門(mén)D)進(jìn)化門(mén)答案:D解析:[單選題]25.下面關(guān)于對(duì)Zookeeper的stat命令描述正確的是()。A)輸出服務(wù)器的統(tǒng)計(jì)信息B)重置服務(wù)器的統(tǒng)計(jì)信息C)輸出服務(wù)器的配置信息D)輸出服務(wù)器的統(tǒng)計(jì)信息和已連接的客戶(hù)端答案:D解析:[單選題]26.以下不屬于馬爾可夫隨機(jī)場(chǎng)模型與條件隨機(jī)場(chǎng)模型的差別的是()。A)馬爾可夫隨機(jī)場(chǎng)與條件隨機(jī)場(chǎng)都是無(wú)向圖模型B)馬爾可夫隨機(jī)場(chǎng)是生成式模型,條件隨機(jī)場(chǎng)是判別式模型C)馬爾可夫隨機(jī)場(chǎng)處理?xiàng)l件概率,條件隨機(jī)場(chǎng)處理聯(lián)合概率D)馬爾可夫隨機(jī)場(chǎng)處理聯(lián)合概率,條件隨機(jī)場(chǎng)處理?xiàng)l件概率答案:C解析:[單選題]27.在數(shù)據(jù)庫(kù)建模的過(guò)程中,E-R圖屬于()的產(chǎn)物。--A)物理模型B)邏輯模型C)概念模型D)以上答案都不正確答案:C解析:[單選題]28.設(shè)計(jì)坐出租車(chē)收費(fèi)程序,3公里內(nèi)按10元收取,超3公里不超10公里按每公里1.5元收取,超過(guò)10公里按每公里1.3元收取,請(qǐng)問(wèn)根據(jù)以上情況用什么語(yǔ)句合適A)ifB)if…elif…elseC)whileD)以上都不對(duì)答案:B解析:[單選題]29.業(yè)務(wù)系統(tǒng)功能設(shè)計(jì)需嚴(yán)格執(zhí)行公司信息化和數(shù)據(jù)資產(chǎn)標(biāo)準(zhǔn),數(shù)據(jù)應(yīng)按()準(zhǔn)確錄入和采集,關(guān)鍵數(shù)據(jù)應(yīng)進(jìn)行初審和復(fù)核,保證數(shù)據(jù)真實(shí),避免數(shù)據(jù)缺失A)規(guī)定的時(shí)間、頻度B)數(shù)據(jù)類(lèi)型C)數(shù)據(jù)大小D)數(shù)據(jù)重要性答案:A解析:[單選題]30.在抽樣方法中,當(dāng)合適的樣本容量很難確定時(shí),可以使用的抽樣方法是()。A)有放回的簡(jiǎn)單隨機(jī)抽樣B)無(wú)放回的簡(jiǎn)單隨機(jī)抽樣C)分層抽樣D)漸進(jìn)抽樣答案:D解析:略。[單選題]31.本行()負(fù)責(zé)牽頭開(kāi)展數(shù)據(jù)治理風(fēng)險(xiǎn)管理工作,規(guī)范數(shù)據(jù)風(fēng)險(xiǎn)管理A)風(fēng)險(xiǎn)管理部B)內(nèi)審監(jiān)督部C)科技部D)數(shù)據(jù)運(yùn)管部答案:A解析:[單選題]32.ADS一個(gè)普通表組最多可以包含:()個(gè)表。A)256個(gè)B)1000個(gè)C)無(wú)限制D)128個(gè)答案:A解析:[單選題]33.大型會(huì)員制連鎖超市S使用OTS來(lái)存儲(chǔ)消費(fèi)記錄表,里面包含了客戶(hù)的vip卡號(hào)、訂單標(biāo)識(shí),超市分店標(biāo)識(shí),商品標(biāo)識(shí),購(gòu)買(mǎi)時(shí)間等,業(yè)務(wù)邏輯遵循以下規(guī)則:每個(gè)vip卡號(hào)對(duì)應(yīng)一個(gè)客戶(hù),同時(shí)一個(gè)客戶(hù)職能擁有一個(gè)vip卡號(hào);該連鎖超市的不同分店都擁有唯一的分店標(biāo)識(shí);訂單標(biāo)識(shí)按照時(shí)間順序產(chǎn)生;為了讓數(shù)據(jù)分布和訪問(wèn)了的分布盡可能均勻,一下備注主鍵中()最合適。A)購(gòu)買(mǎi)時(shí)間,vip卡號(hào)B)vip卡號(hào),購(gòu)買(mǎi)時(shí)間C)vip卡號(hào)D)訂單標(biāo)識(shí),vip卡號(hào)答案:B解析:[單選題]34.關(guān)系數(shù)據(jù)庫(kù)中存儲(chǔ)、計(jì)算和管理的數(shù)據(jù)是()。A)結(jié)構(gòu)化數(shù)據(jù)B)海量數(shù)據(jù)C)半結(jié)構(gòu)化數(shù)據(jù)D)非結(jié)構(gòu)化數(shù)據(jù)答案:A解析:通常,結(jié)構(gòu)化數(shù)據(jù)是指直接可以用傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)存儲(chǔ)、計(jì)算和管理的數(shù)據(jù)。A)辛普森悖論B)大數(shù)據(jù)悖論C)大數(shù)據(jù)偏見(jiàn)D)幸存者偏差正確答案A辛普森悖論是概率和統(tǒng)計(jì)學(xué)中的一種現(xiàn)象,即幾組不同的數(shù)據(jù)中均存在一種趨勢(shì),41但當(dāng)這些數(shù)據(jù)組組合在一起后,這種趨勢(shì)將消失或反轉(zhuǎn)。例如,在腎結(jié)石治療數(shù)據(jù)分析中,比較兩種腎結(jié)石治療的成功率。[單選題]35.MapJoin適用于()的連接情況。A)有一份數(shù)據(jù)比較小B)兩份數(shù)據(jù)都比較小C)兩份數(shù)據(jù)都比較大D)沒(méi)有嚴(yán)格的規(guī)定答案:A解析:[單選題]36.RDD操作包括轉(zhuǎn)換(Transformation)和動(dòng)作(Action)兩種類(lèi)型,下列RDD操作屬于動(dòng)作(Action)類(lèi)型的是()。A)joinB)mapC)collectD)groupBy答案:C解析:[單選題]37.以下關(guān)于Python的控制結(jié)構(gòu),錯(cuò)誤的是:A)每個(gè)if條件后要使用冒號(hào)(:)B)在Python中,沒(méi)有switch-case語(yǔ)句C)Python中的pass是空語(yǔ)句,一般用作占位語(yǔ)句D)elif可以單獨(dú)使用答案:D解析:[單選題]38.構(gòu)造方法的作用是()。A)一般成員方法B)類(lèi)的初始化C)對(duì)象的初始化D)對(duì)象的建立答案:C解析:構(gòu)造方法的作用初始化對(duì)象。[單選題]39.BP神經(jīng)網(wǎng)絡(luò)經(jīng)常遭遇(),其訓(xùn)練誤差持續(xù)降低,但測(cè)試誤差卻可能上升A)欠擬合B)誤差過(guò)大C)誤差過(guò)小D)過(guò)擬合答案:D解析:[單選題]40.下列說(shuō)法錯(cuò)誤的是()A)MapReduce中maperconbinerreducer缺一不可B)在JobConf中InputFormat參數(shù)可以不設(shè)C)在JobConf中MapperClass參數(shù)可以不設(shè)D)在JobConf中OutputKeyComparator參數(shù)可以不設(shè)答案:A解析:有可能缺少combiner,例如如果在wordcount中不用combiner,那么所有的結(jié)果都是reduce完成,也只是效率會(huì)相對(duì)低下/2015/12/19/hadoop-MapReduce-Combiner/[單選題]41.下列Python文件模式中,(___)表示創(chuàng)建一個(gè)新文件。如果文件已經(jīng)存在,則操作失敗。A)?r?B)?W?C)?x?D)?+?答案:C解析:[單選題]42.下面符合數(shù)據(jù)產(chǎn)品鏈的有(__):1.數(shù)據(jù),2.元數(shù)據(jù),3.數(shù)據(jù)對(duì)象,4.輔助服務(wù),5.集成應(yīng)用,6.軟件系統(tǒng),7.增值服務(wù),8.基礎(chǔ)設(shè)施,9.硬件系統(tǒng)A)23657B)234C)135D)238497答案:A解析:[單選題]43.()能反映出X和Y之間的強(qiáng)相關(guān)性。A)相關(guān)系數(shù)為0.9B)對(duì)于無(wú)效假設(shè),β=0的p值為0.0001C)對(duì)于無(wú)效假設(shè),β=0的t值為30D)以上說(shuō)法都不對(duì)答案:A解析:相關(guān)系數(shù)反映了不同變量之間線性相關(guān)程度,取值范圍為[-1,1],值越大表示相關(guān)程度越高。因此,A選項(xiàng)中r=0.9,表示X和Y之間有較強(qiáng)的相關(guān)性。p和t的數(shù)值大小沒(méi)有統(tǒng)計(jì)意義,只是將其與某一個(gè)閾值進(jìn)行比對(duì),以得到二選一的結(jié)論。[單選題]44.下列有關(guān)數(shù)據(jù)基本單位換算錯(cuò)誤的是()A)1Byte=8bitB)1KB=1024BytesC)1MB=1024GBD)1GB=1024MB答案:C解析:[單選題]45.下列方法中,可以將元組轉(zhuǎn)換為MultiIndex對(duì)象的是()A)from_tuples()B)from_arrays()C)from_product()D)from_list()答案:A解析:[單選題]46.在Shuffle的整個(gè)處理過(guò)程中,一部分處理過(guò)程是在Map端,另一部分的處理過(guò)程是在()端。A)CombinerB)PartitionC)ReduceD)Split答案:C解析:[單選題]47.執(zhí)行以下代碼段classGraph():def__init__(self):self.a=10defaction(self):self.a//=4classMyGraph(Graph):def__init__(self):self.a=8self.b=4defaction(self):self.a+=7*2self.b//=2classLastGraph(MyGraph):passg2=LastGraph()g2.action()print(g2.a)時(shí),輸出為()。A)22B)84C)16D)34答案:A解析:[單選題]48.在MapReduce中,下列組件中用戶(hù)不指定也不會(huì)有默認(rèn)的是()。A)CombinerB)OutputFormatC)PartitionerD)InputFormat答案:A解析:在MapReduce編程模型中,Combiner是可有可無(wú)的組件,它的作用是給MapTask的結(jié)果數(shù)據(jù)做局部合并以減少ReduceTask接收的數(shù)據(jù)量,以減少網(wǎng)絡(luò)數(shù)據(jù)傳輸;OutputFormat的默認(rèn)組件是TextOutputFormat;InputFormat的默認(rèn)組件是TextInputFormat;Partitioner的默認(rèn)實(shí)現(xiàn)是HashPartitioner。[單選題]49.在使用Formatdate轉(zhuǎn)換器對(duì)于日期2020-9-28的最佳格式是()A)yymmddB)yyyymmddC)yyyy-MM-ddD)yyyy-mm-dd答案:C解析:[單選題]50.人工智能是一門(mén)()A)數(shù)學(xué)與生理學(xué)B)心理學(xué)與生理學(xué)C)語(yǔ)言學(xué)D)綜合性的交叉學(xué)科與邊緣學(xué)科答案:D解析:[單選題]51.以下符合大數(shù)據(jù)問(wèn)題處理范疇的是:()。A)1KB數(shù)據(jù),1小時(shí)內(nèi)提交結(jié)果B)1MB數(shù)據(jù),2小時(shí)內(nèi)提交結(jié)果C)1GB數(shù)據(jù),3小時(shí)內(nèi)提交結(jié)果D)1TB數(shù)據(jù),0.5小時(shí)內(nèi)提交結(jié)果答案:D解析:[單選題]52.下面組件哪個(gè)是負(fù)責(zé)分布式資源調(diào)度與管理的:()A)YARNB)FlumeC)ZookeeperD)Kafka答案:A解析:[單選題]53.當(dāng)數(shù)據(jù)出現(xiàn)較多缺失值時(shí),下面哪些處理方法不不夠合理?A)把NaN直接作為一個(gè)特征,把變量映射到高維空間B)用均值、中值、分位數(shù)、眾數(shù)、隨機(jī)值填充C)用插值法填充D)把具有缺失值的樣本刪除掉答案:D解析:[單選題]54.下列關(guān)于氣泡圖的說(shuō)法中,錯(cuò)誤的是()A)氣泡圖中氣泡的顏色是系統(tǒng)統(tǒng)一設(shè)置的,無(wú)法人為調(diào)整B)氣泡大小的不同意味著所代表的的數(shù)值的不同C)氣泡圖中的圖形形狀不一定是圓形D)可以為每個(gè)氣泡打上標(biāo)簽使其展示的數(shù)值更加直觀化答案:A解析:第2部分:多項(xiàng)選擇題,共23題,每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]55.行存表相比于列存表的區(qū)別是(?A)同樣的教據(jù),采用行存表存儲(chǔ)比列存儲(chǔ)所耗的時(shí)間更少。B)行存表適合數(shù)據(jù)更新,列存表適合做數(shù)據(jù)聚合。C)行存表面向百萬(wàn)級(jí)以下數(shù)據(jù)量,列存表面向千萬(wàn)級(jí)以上數(shù)據(jù)量D)行存表按行存儲(chǔ)數(shù)據(jù),列存表按列存儲(chǔ)教據(jù)答案:ABD解析:[多選題]56.強(qiáng)化學(xué)習(xí)中的?策略?就相當(dāng)于監(jiān)督學(xué)習(xí)中(__)或(__)。A)分類(lèi)器B)決策樹(shù)C)隨機(jī)森林D)回歸器答案:AD解析:[多選題]57.HBase中HMaster主要負(fù)責(zé)()。A)表的增冊(cè)刪改查B)Regionservert負(fù)載均衡C)用戶(hù)數(shù)據(jù)讀寫(xiě)回D)Region分布調(diào)整答案:ABD解析:[多選題]58.以下哪些是Spark服務(wù)的常駐進(jìn)程A)JobHistoryB)JDBCServerC)SparkResourceD)NodeManger答案:AB解析:[多選題]59.以下哪些選項(xiàng)屬于集群資源規(guī)劃設(shè)計(jì)?A)數(shù)據(jù)質(zhì)量B)數(shù)據(jù)總規(guī)模C)容量預(yù)留D)單條數(shù)據(jù)大小答案:BC解析:[多選題]60.ADS創(chuàng)建普通表的時(shí)候限制有:()。A)一張普通表至少有一級(jí)Hash分區(qū)并且分區(qū)數(shù)不能小于8個(gè)B)一個(gè)普通表組最多可以創(chuàng)建256個(gè)普通表C)一個(gè)普通表最多不能超過(guò)1024列D)一張普通表至少有一級(jí)Hash分區(qū)并且分區(qū)數(shù)不能多于1000個(gè)答案:ABC解析:[多選題]61.下列關(guān)于字典的遍歷的描述正確的有()。A)forin變量i,字典:使用i遍歷所有的鍵,有鍵就可以通過(guò)變量訪問(wèn)其值B)for變量iin字典:使用i遍歷所有的鍵,有鍵就可以通過(guò)變量訪問(wèn)其值C)for變量i,變量jin字典items):使用變量i遍歷所有鍵,通過(guò)變量j遍歷所有值D)forin變量i,變量j字典items):使用變量i遍歷所有鍵,通過(guò)變量j遍歷所有值答案:BC解析:item默認(rèn)迭代所有字典的鍵值。[多選題]62.所謂的大數(shù)據(jù)技術(shù)融合主要指哪些方面?A)數(shù)據(jù)融合B)算力融合C)計(jì)算融合D)批-流融合答案:ABCD解析:[多選題]63.ZKFC進(jìn)程部署在hdfs中的以下那個(gè)節(jié)點(diǎn)上?A)activenamenodeB)standbynamenodeC)datanodeD)以上全部不對(duì)答案:AB解析:[多選題]64.關(guān)于SparkSQL&Hive區(qū)別與聯(lián)系,下列說(shuō)法正確的是?A)SparkSQL依賴(lài)Hive的元數(shù)據(jù)B)SparkSQL的執(zhí)行引擎為Sparkcore,Hive默認(rèn)執(zhí)行引擎為MapReduceC)SparkSQL不可以使用Hive的自定義函數(shù)D)SparkSQL兼容絕大部分Hive的語(yǔ)法和函數(shù)答案:BCD解析:[多選題]65.以下可以作為數(shù)據(jù)倉(cāng)庫(kù)業(yè)務(wù)系統(tǒng)中的數(shù)據(jù)來(lái)源的選項(xiàng)有()【選三項(xiàng)】A)Oracle、MySQL和SQLServer等關(guān)系數(shù)據(jù)庫(kù)里的結(jié)果化數(shù)據(jù)B)視頻、音頻文件C)HTML、XML等自描敘的半結(jié)構(gòu)化數(shù)據(jù)D)Word或Excel文檔中的非結(jié)構(gòu)化數(shù)據(jù)答案:ACD解析:[多選題]66.下列屬于樸素貝葉斯分類(lèi)器的特點(diǎn)的是(__)。A)算法邏輯簡(jiǎn)單,易于實(shí)現(xiàn)B)算法邏輯復(fù)雜,不易于實(shí)現(xiàn)C)分類(lèi)過(guò)程中時(shí)空開(kāi)銷(xiāo)小D)分類(lèi)過(guò)程中時(shí)空開(kāi)銷(xiāo)大答案:AC解析:[多選題]67.下列屬于數(shù)值優(yōu)化算法的是()。A)梯度下降法B)牛頓法C)極大似然法D)邏輯回歸答案:AB解析:在機(jī)器學(xué)習(xí)的優(yōu)化問(wèn)題中,梯度下降法和牛頓法是常用的兩種凸函數(shù)求極值的方法,他們都是為了求得目標(biāo)函數(shù)的近似解。極大似然法是一種應(yīng)用非常廣泛的參數(shù)估計(jì)方法。邏輯回歸是一種廣義的線性回歸分析模型,常用于分類(lèi)問(wèn)題。[多選題]68.以下關(guān)于Fink的窗口描述正確的是()。A)會(huì)話窗口是將數(shù)據(jù)聚合到會(huì)話窗口中,由非活躍的間隙分隔開(kāi)。B)我們可以每30秒計(jì)算一次最近一分鐘用戶(hù)購(gòu)買(mǎi)的商品總數(shù),這個(gè)就是時(shí)間滑動(dòng)窗口的應(yīng)用方式C)窗口可以是時(shí)間驅(qū)動(dòng)的也可以是數(shù)據(jù)驅(qū)動(dòng)的。D)Flink窗口按窗口行為劃分:TumblingWindow.SlidingWindow.SessionWindow。答案:ABCD解析:[多選題]69.常用的代價(jià)函數(shù)有()。A)均方誤差B)均方根誤差C)平均絕對(duì)誤差D)交叉熵答案:ABCD解析:[多選題]70.關(guān)于關(guān)聯(lián)分析說(shuō)法正確的是()A)支持度表示A和B同時(shí)出現(xiàn)的概率占A出現(xiàn)概率的比值B)置信度表示A和B同時(shí)出現(xiàn)的概率C)Apriori算法是種挖掘關(guān)聯(lián)規(guī)則的頻繁項(xiàng)集算法D)該算法的基本思想是:首先找出所有的頻集,這些項(xiàng)集出現(xiàn)的頻繁性至少和預(yù)定義的最小支持度一樣。答案:CD解析:[多選題]71.ApacheFlume主要解決的是日志數(shù)據(jù)的收集和處理問(wèn)題,Flume的主要設(shè)計(jì)目的和特征是()。A)高可靠性B)可擴(kuò)展性C)管理復(fù)雜D)不支持用戶(hù)自定義答案:AB解析:Flume的主要設(shè)計(jì)目的和特征包括高可靠性、可擴(kuò)展性、支持方便管理、支持用戶(hù)自定義。[多選題]72.某池塘有1400條鯉魚(yú),300只蝦,300只鱉。現(xiàn)在以捕鯉魚(yú)為目的。撒一大網(wǎng),逮著了700條鯉魚(yú),200只蝦,100只鱉。那么,下列指標(biāo)正確的是(___)。A)F值40%B)查全率50%C)查準(zhǔn)率70%D)F值65%答案:BC解析:[多選題]73.Spark中的Scheduler模塊可以分為以下哪幾個(gè)部分?A)DAGSchedulerB)ResourceSchedulerC)TaskSchedulerD)JobScheduler答案:AC解析:[多選題]74.下面與數(shù)據(jù)科學(xué)相關(guān)的正確描述有(__)。A)數(shù)據(jù)科學(xué)中的?數(shù)據(jù)?并不僅僅是?數(shù)值?也不等同?數(shù)值?B)數(shù)據(jù)科學(xué)中?計(jì)算?包括查詢(xún)、洞見(jiàn)、可視化等C)數(shù)據(jù)科學(xué)關(guān)注的是?單一學(xué)科?D)數(shù)據(jù)科學(xué)并不僅僅是?理論研究?也不是?領(lǐng)域務(wù)實(shí)知識(shí)?答案:ABD解析:[多選題]75.下列屬于聚類(lèi)性能度量?jī)?nèi)部指標(biāo)的是(__)。A)DB指數(shù)B)Dunn指數(shù)C)Jaccard系數(shù)D)FM系數(shù)答案:AB解析:[多選題]76.電信大數(shù)據(jù)PaaS平臺(tái)產(chǎn)品基本包包含以下哪幾類(lèi)服務(wù):()A)數(shù)據(jù)存儲(chǔ)服務(wù)B)離線分析服務(wù)C)應(yīng)用開(kāi)發(fā)環(huán)境及框架服務(wù)D)數(shù)據(jù)挖掘服務(wù)、MPPDB服務(wù)答案:ABC解析:[多選題]77.下列關(guān)于范數(shù)規(guī)則化的描述正確的有()。A)L0是指向量中0的元素的個(gè)數(shù)B)L1范數(shù)是指向量中各個(gè)元素絕對(duì)值之和C)L2范數(shù)向量元素絕對(duì)值的平方和再開(kāi)平方D)L0是指向量中非0的元素的個(gè)數(shù)153答案:BCD解析:L0是指向量中非0的元素的個(gè)數(shù),L1范數(shù)是指向量中各個(gè)元素絕對(duì)值之和,L2范數(shù)向量元素絕對(duì)值的平方和再開(kāi)平方。第3部分:判斷題,共16題,請(qǐng)判斷題目是否正確。[判斷題]78.在HBase表中,通過(guò)行、列族和列限定符確定一個(gè)單元格(cell),且表中存儲(chǔ)的數(shù)據(jù)需要嚴(yán)格定義好數(shù)據(jù)類(lèi)型,比如Name列需定義為string類(lèi)型,且定義之后就不能修改。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]79.Set集合中的元素不能重復(fù)。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]80.在連接云數(shù)據(jù)時(shí),無(wú)需輸入文件路徑,即可連接并抽取數(shù)據(jù)。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]81.對(duì)于生成器對(duì)象x=(3foriinrange(5)),連續(xù)兩次執(zhí)行l(wèi)ist(x)的結(jié)果是一樣的。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]82.華為云GES圖搜索引擎服務(wù)可以為知識(shí)圖譜技術(shù)提供數(shù)據(jù)存儲(chǔ)和查詢(xún)功能。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]83.Python通過(guò)類(lèi)可以創(chuàng)建對(duì)象,有且只有一個(gè)對(duì)象。()A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]84.()所創(chuàng)建的數(shù)據(jù)庫(kù)和表的名字,都可以使用中文。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]85.Hive構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)時(shí)通常需要進(jìn)行分層。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]86.本行數(shù)據(jù)質(zhì)量管理的目標(biāo)是提升數(shù)據(jù)質(zhì)量,發(fā)揮數(shù)據(jù)應(yīng)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年體檢行業(yè)市場(chǎng)競(jìng)爭(zhēng)格局與服務(wù)質(zhì)量?jī)?yōu)化策略報(bào)告
- 藥品購(gòu)銷(xiāo)合同管理制度
- 藥學(xué)志愿服務(wù)管理制度
- 藥店員工工具管理制度
- 藥店管理貨物管理制度
- 菜鳥(niǎo)公司員工管理制度
- 設(shè)備倉(cāng)庫(kù)門(mén)禁管理制度
- 設(shè)備備件分級(jí)管理制度
- 設(shè)備建設(shè)安全管理制度
- 設(shè)備校準(zhǔn)標(biāo)簽管理制度
- (正式版)CB∕T 4548-2024 船舶行業(yè)企業(yè)相關(guān)方安全管理要求
- 北師大版中考數(shù)學(xué)考試大綱
- 大學(xué)俄語(yǔ)一級(jí)課程考試試卷 (A 卷)
- 升降樁施工合同
- 物業(yè)管理與體育場(chǎng)館
- 2023-2024學(xué)年成都市金牛區(qū)八年級(jí)下英語(yǔ)期末考試題(含答案)
- 廣東省珠海市香洲區(qū)2022-2023學(xué)年四年級(jí)下學(xué)期期末英語(yǔ)試題
- JT-T-760-2009浮標(biāo)技術(shù)條件
- JT-T-795-2011事故汽車(chē)修復(fù)技術(shù)規(guī)范
- JBT 10437-2024 電線電纜用可交聯(lián)聚乙烯絕緣料(正式版)
- 初中數(shù)學(xué)教育教學(xué)案例(3篇模板)
評(píng)論
0/150
提交評(píng)論