




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第一單元測試題1.(填空)大數據的發展歷程總體上可以劃分為4個重要階段。它們分別是?答案:萌芽期、突破期、成熟期和大規模應用期2.(填空)按數據結構的不同,數據分為?答案:結構化數據、非結構化數據、半結構化數據3.(填空)按照數據開發應用深入程度不同,可將大數據應用分為?答案:描述性分析應用、預測性分析應用和指導性分析應用4.(填空)決策的5大特性包括?答案:目的性、選擇性、滿意性、過程性、動5.(填空)決策過程的4個階段為?答案:情報、設計、選擇、執行6.(判斷)按決策影響范圍和重要程度不同,管理決策分為戰略決策、戰術決策和業務決策A.√B.×答案:A7.(判斷)常見的定性決策方法有:頭腦風暴法、專家會議法、后悔值決策法、波士頓矩陣A.√B.×答案:B8.(判斷)大數據對決策思維的影響主要體現在:全樣而非抽樣、精確而非高效,因果性而非相關性。A.√B.×答案:B9.(判斷)大數據應用已成熟,目前多應用于決策指導性分析。A.√B.×答案:B10.(判斷)從業務角度出發,大數據的核心價值主要有:數據輔助決策、數據驅動業務、數據對外變現。A.√B.×答案:A11.(多選)根據大數據從來源到應用的流程,下列屬于大數據技術架構的是:A.數據采集層B.數據抽取層C.數據分析層
D.數據應用層答案:ACD12.(多選)大數據時代,現代企業的管理和發展面臨哪些挑戰?A.更多的數據被收集B.數據更加復雜C.決策自動化
D.實時決策需求突出答案:ABCD13.(多選)下列屬于大數據“5V”特征的是:A.數據容量大B.數據類型多樣C.數據價值密度高
D.數據流轉速度快答案:ABD14.(多選)按照載體不同,下列不屬于文本數據的是:A.txt文本B.照片C.excel電子表格
D.錄像答案:BD15.(多選)下列關于數據、信息、知識的描述正確的是:A.信息是有意義、有用途的數據B.數據源于信息,是信息的表現形式和載體C.知識是更加系統化、理論化的信息
D.從信息到數據再到知識,是螺旋式上升的過程答案:AC16.(判斷)決策的基本流程包含發現并界定問題、確定決策目標、擬定備選方案、評價備選方案、選擇方案和回饋評估方案六大步。A.√B.×答案:A17.(多選)以下哪些方法屬于定性決策方法?A.頭腦風暴法B.專家會議法C.樂觀決策法
D.波士頓矩陣法答案:ABD18.(填空)大數據的五大特征包括?答案:1.數據容量大;2.數據類型多樣;3.數據價值密度低;4.數據流轉速度快;5.對數據真實性要求高
第二單元測試題1.(單選)數據采集與處理工作不包括A.數據治理B數據獲取C數據預處理D數據存儲答案:A2.(單選)以下哪項不屬于大數據分析的范疇A.描述性分析B診斷分析C預測分析D聚類分析答案:D3.(單選)大數據建模的步驟為A.模型建立-模型評估-模型訓練-模型應用B模型建立-模型優化-模型訓練-模型應用C模型建立-模型訓練-模型評估-模型應用D模型建立-模型訓練-模型優化-模型應用答案:C4.(單選)決策數據可視化技術不包括A.海量數據可視化B文本數據可視化C網絡可視化D多維數據可視化答案:A5.(單選)大數據處理的核心環節是A.數據分析與挖掘B數據采集與處理C結果展示D數據應用答案:A6.(判斷)大數據決策是以信息技術、云計算技術、大數據技術等為支撐,以海量數據為主要驅動,通過大數據分析提出問題、確立目標、設計和選擇方案的過程。A.√B.×答案:A7.(判斷)在數據狀態上,大數據分析多使用存量數據,而大數據挖掘多使用動態增量數據或存量數據。A.√B.×8.(判斷)常見的決策數據采集技術包括網絡數據采集、系統日志采集、感知設備采集、數據庫采集四種。A.√B.×答案:A9.(判斷)針對結構化和非結構化混合數據一般采用數據庫集群的方式進行存儲A.√B.×答案:B10.(判斷)Hadoop是一個分布式的、容錯的實時計算系統,能夠對實時動態的多源異構數據進行實時計算,獲得有價值的信息。A.√B.×答案:B11.(判斷)數據分析與挖掘是大數據處理的核心環節,指通過數據標簽服務、文本處理和影像組學分析等應用支撐,進行大數據的探索分析、模型擬合、模型訓練及評估。A.√B.×答案:A
第三單元測試題1.(多選)MapReduce體系結構主要由哪幾個部分組成A.ClientB.JobTrackerC.TaskTrackerD.Task答案:ABCD2.(單選)以下名詞解釋不正確的是A.HBase:提供高可靠性、高性能、分布式的行式數據庫,是谷歌BigTable的開源實現B.HDFS:分布式文件系統,是Hadoop項目的兩大核心之一,是谷歌GFS的開源實現C.Zookeeper:針對谷歌Chubby的一個開源實現,是高效可靠的協同工作系統D.Hive:一個基于Hadoop的數據倉庫工具,用于對Hadoop文件中的數據集進行數據整理、特殊查詢和分析存儲答案:A3.(單選)HDFSFederation設計不能解決“單名稱節點”存在的哪個問題A.單點故障問題B.良好的隔離性C.性能更高效D.HDFS集群擴展性答案:A4.(單選)下列說法正確的是A.第二名稱節點無法解決單點故障問題B.HDFSHA提供高可用性,可以實現可擴展性、系統性能和隔離性C.第二名稱節點是熱備份D.HDFSHA可用性不好答案:A5.(多選)對新一代資源管理調度框架YARN的理解正確的是A.YARN的體系結構包含三個組件:ResourceManager,NodeManager,ApplicationMasterB.YARN可以實現“一個集群多個框架”,即在一個集群上部署一個統一的資源調度管理框架C.MapReduce2.0是運行在YARN之上的計算框架,由YARN來為MapReduce提供資源管理調度服務D.YARN既是資源管理調度框架,也是一個計算框架答案:ABC6.(判斷)Hadoop支持數據的隨機寫。A.√B.×答案:B7.(判斷)Hadoop是Java開發的,所以Hadoop只支持Java語言編寫。A.√B.×答案:B8.(判斷)Hadoop1.0和2.0都具有完善的HDFSHA策略。A.√B.×答案:B9.(判斷)因為Hadoop有多個副本,所以NameNode不存在單點問題。A.√B.×答案:B10.(判斷)PIG是腳本語言,它與MapReduce無關。A.√B.×答案:B11.(單選)關于SecondaryNameNode哪項是正確的?A.它的目的是幫助NameNode合并編輯日志,減少NameNode的啟動時間B.它是NameNode的熱備份C.它對內存沒有要求D.SecondaryNameNode應與NameNode部署到一個節點答案:A12.(填空)YARN的體系結構包括哪些組件?答案:ResourceManager
、ApplicationMaster、NodeManager13.(單選)下面哪個程序負責HDFS數據存儲。A.Datanode
B.NameNode
C.JobtrackerD.SecondaryNameNode答案:A14.(單選)HBase是分布式列式存儲系統,記錄按什么集中存放。A.列族
B.列C.行D.不確定答案:A15.(填空)哪個進程負責MapReduce任務調度。答案:Jobtracker
第四單元測試題1.(單選)分布式文件系統HDFS采用了主從結構模型,由計算機集群中的多個節點構成的,這些節點分為兩類,一類存儲元數據叫(),另一類存儲具體數據叫()A.數據節點,名稱節點B.名稱節點,主節點C.從節點,主節點D.名稱節點,數據節點答案:D2.(單選)下列Amazon的云數據庫屬于關系數據庫的是()A.AmazonDynamoDBB.AmazonRedshiftC.AmazonRDSD.AmazonSimpleDB答案:C3.(單選)下列關于NoSQL數據庫和關系型數據庫的比較,不正確的是()A.NoSQL數據庫缺乏統一的查詢語言,而關系型數據庫有標準化查詢語言B.NoSQL數據庫很容易實現數據完整性,關系型數據庫很難實現數據完整性C.NoSQL數據庫的可擴展性比傳統的關系型數據庫更好D.NoSQL數據庫具有弱一致性,關系型數據庫具有強一致性答案:B4.(多選)下列對HBase的理解正確的是()A.HBase是一個行式分布式數據庫,是Hadoop生態系統中的一個組件B.HBase是針對谷歌BigTable的開源實現C.HBase是一種關系型數據庫,現成功應用于互聯網服務領域D.HBase多用于存儲非結構化和半結構化的松散數據答案:BD5.(單選)HBase是一種()數據庫A.行式數據庫B.關系數據庫C.文檔數據庫D.列式數據庫答案:D6.(單選)下列數據庫屬于文檔數據庫的是A.HBaseB.MongoDBC.MySQLD.MongoDB答案:D7.(單選)NoSQL數據庫的三大理論基石不包括A.CAPB.最終一致性C.BASED.ACID答案:D8.(多選)HDFS只設置唯一一個名稱節點帶來的局限性包括。A.命名空間的限制B.集群的可用性C.隔離問題D.性能的瓶頸答案:ABCD9.(判斷)目前,NoSQL的含義是“NotonlySQL”,而不是“NoSQL”。A.√B.×答案:B10.(判斷)一個數據庫事務具有ACID是指:原子性,一致性,持久性,隔離性。A.√B.×答案:A
第五單元測試題1.(單選)下列哪些不是數據來源()A.商業教據B.互聯網教據C.物聯網教據D.人工收集教據答案:D2.(單選)下列不是數據采集的主要渠道是()A.傳統信息系統B.大數據系統C.物聯網系統D.Web系統答案:B3.(單選)下列數據質量的評估標準,不正確的是()A.完整性B.可替代性C.一致性D.及時性答案:B4.(多選)下列關于數據質量的影響因素理解正確的是()A.信息因素B.人為因素C.信息因素D.流程因素答案:ABD5.(單選)下列不是大數據采集方法的是()A.系統日志采集B.網絡數據采集C.數據庫采集D.手動采集答案:D6.(多選)下列屬于大數據預處理的方法的是()A.數據清洗B.數據集成C.數據變換D.數據歸約答案:ABCD7.(多選)處理噪聲數據的方法包括()A.分箱B.平滑處理C.聚類D.清洗答案:ABC8.(判斷)忽略元組的方法可以使用該元組的剩余屬性值A.√B.×答案:B9.(判斷)大數據預處理技術就是對已接收數據的辨析抽取和清洗A.√B.×答案:A10.(判斷)大數據的數據采集是指通過傳感器、攝像頭、RFID射頻數據以及互聯網等方式獲取的各種結構化、半結構化和非結構化的教據。A.√B.×答案:A
第六單元測試題一、單選1.(單選)MapReduce的基本架構不包括下列哪個部分()AClientBJobTrackerCTaskTrackerDSparkCore答案:D2.(單選)大型主機的特點不包括下列哪個()A高可靠性B高可用性C高服務性D高激活性答案:D3.(單選)下列哪項不是Storm的主要特點()A可伸縮性高B容錯性不好C語言無關性D適用場景廣泛答案:B4.(單選)下列哪項不是SAPHANA的特點()A充分并行編程B把數據全部放入內存中存儲C圖模型系統優化D最小化數據傳輸答案:C二、多選1.(多選)MapReduce的主要特點有()A易于編程B良好的擴展性C高容錯性D適合PB級以上海量數據的離線處理答案:ABCD2.(多選)Spark的主要特點有()A快速高效B快速高效C全棧式數據處理D兼容性高答案:ABCD3.(多選)超級計算機可應用的領域有()A氣象預報領域B醫藥領域C交通領域D防震減災領域答案:ABCD4.(多選)圖計算主要分為以下哪三類()A基于分布式環境的大規模圖計算系統B基于軟件加速器的大規模圖計算系統C基于單機的大規模圖計算系統D基于硬件加速器的大規模圖計算系統答案:ACD5.(多選)流式計算系統的特征主要包括以下哪幾個方面()A有序性B實時性C突發性D易失性答案:BCD三、判斷1.(判斷)MapReduce集群中使用了大量的低端服務器,因此,節點硬件失效和軟件出錯是常態。A.√B.×答案:A2.(判斷)大型主機雖然在性能和穩定性方面表現卓越,但并不代表其永遠不會出故障。A.√B.×3.(判斷)分布式架構中的計算機有明顯的主/從之分,所有計算機節點都是不對等的。A.√B.×答案:B4.(判斷)集中式架構設計,天然就有多個節點,很容易通過主備、冗余、哈希(Hash)等手段實現計算和存儲冗余備份,從而實現高可用。A.√B.×答案:B5.(判斷)批處理系統自動化程度比較高,系統吞吐量大,資源利用率高,系統開銷小,但各作業周轉時間長,不提供用戶與系統的交互手段,適合大的成熟的作業。A.√B.×答案:B四、填空1.(填空)大數據處理從海量的原始數據中抽取出有價值的信息,將數據轉換成信息,其中是基礎、是支撐、是核心、是根本。答案:數據資源處理平臺分析算法應用效益2.(填空)MapReduce框架把計算節點和存儲節點放在一起運行,將復雜的、運行于大規模集群上的并行計算過程高度地抽象到兩個函數:和,從而減少了節點間的數據移動開銷。答案:MappingReducing3.(填空)Spark生態系統主要包含了、、、、和等組件。答案:SparkCore、SparkSQL、SparkStreaming、MLlib、GraphX4.(填空)分布式架構設計的核心理念是“”,即按照一定維度將系統進行拆分,系統各部分松耦合并行運行,并建立起較為完善的橫向擴展與容錯恢復機制。答案:并行拆分與橫向擴展5.(填空)Pregel是一種基于模型實現的并行圖處理系統,搭建了一套可擴展的、有容錯機制的平臺,提供了一套非常靈活的,可以描述各種各樣的圖計算,主要用于、、等。答案:BSPAPI圖遍歷最短路徑PageRank計算
第七單元測試題1.(單選)大數據時代下企業管理的特點是()A.企業用于分析的數據量十分龐大B.數據的精確性要求有所降低提高C.建立事物之間的相關性D.處理能力提升答案:A2.(單選)下列不屬于大數據在企業管理中的作用及價值是()A.大數據幫助企業優化資源配置B.大數據幫助企業推動產品創新C.大數據幫助企業實現精準營銷D.大數據幫助企業改善外部管理答案:D3.(單選)下列屬于大數據分析流程有()A.跨行業數據挖掘標準流程CRISP-DMB.業務理解 C.模型部署D.數據取樣答案:A4.(單選)SEMMA是由SAS公司提出的一套行之有效的數據挖掘方法論,下列不屬于數據挖掘的核心過程有()A.抽樣B.探索C.評估D.部署答案:D5.(多選)大數據分析關鍵技術有()A.可視化分析B.數據挖掘算法C.預測性分析D.數據降噪答案:ABC6.(多選)大數據分析是利用數據獲得洞察力,幫助人們更好地做決策的學科集合,下列屬于大數據分析有()A.可視化分析B.基本數據分析C.診斷型數據分析D.描述型數據分析答案:CD7.(判斷)模型評估指從業務角度和統計角度進行模型結論的評估,評估決定了當前模型的命運,沒通過評估只能面臨返工。A.√B.×答案:A8.(判斷)數據分析方法主要對機器學習算法進行分類介紹,機器學習算法包括監督式學習和非監督式學習A.√B.×答案:A9.(填空)跨行業數據挖掘標準流程CRISP-DM(cross-industrystandardprocessfordatamining)是一種業界認可的用于指導數據挖掘工作的方法,為數據庫知識發現工程(KnowledgeDiscoveryinDatabase,KDD)或數據挖掘項目提供了一個完整的過程描述。CRISP-DM把這個過程劃分為六個階段,分別是、、、、和。答案:業務理解、數據理解、數據準備、建立模型、模型評估、模型部署10.(判斷)特征工程是機器學習應用的基礎,指的是利用領域知識從原始數據中提取用于后續機器學習及數據挖掘應用的特征(向量)的過程。整個過程并不涉及諸如特征表示、特征提取、屬性約減、特征選擇等內容。A.√B.×答案:B
第八單元測試題1.(單選)可視化基本類型不包括以下哪一項?A.圖形可視化B.科學可視化C.信息可視化D.可視分析學
答案:A2.(單選)科學可視化主要關注的是()A.三維現象的可視化B.二維現象的可視化C.多維現象的可視化D.圖形的可視化答案:A3.(單選)GoogleChartAPI屬于那種可視化工具?A.信息圖表工具B.入門級工具C.地圖工具D.時間線工具答案:A4.(單選)下面那一項不屬于可視化工具中的高級分析工具A.R語言B.TimelineJSC.WekaD.Gephi答案:B5.(單選)下面哪一項不屬于視覺通道的內容A.飽和度B.色調C.色彩D.面積答案:C6.(單選)以下不屬于時間線工具的是A.TimelineJSB.TimetoastC.XtimelineD.R語言答案:D7.(多選)以下屬于地圖工具的有A.LeafletB.ModestMapsC.GoogleFusionTablesD.excel答案:ABC8.(多選)可視化評估可以分為哪兩種類型A.定性評估B.定量評估C.半定性評估D.半定量評估答案:AB9.(判斷)數據中的離群點,即不同于數據集中其他大部分數據對象特征的數據對象。A.√B.×答案:A10.(判斷)內部數據收集的具體目的包括:獲取競品的數據、獲取官方機構官網公布的一些行業數據等。A.√B.×答案:B11.(填空)整群抽樣又稱()。是將總體中各單位歸并成若干個互不交叉、互不重復的集合,稱之為群;然后以群為取樣單位抽取樣本的一種抽樣方式。答案:聚類抽樣12.(填空)典型的訪談包括()、()和半結構型訪談等答案:開放型訪談、結構型訪談13.(判斷)數據可視化的工具,主要有入門級工具、信息圖表工具、地圖工具、時間線工具、高級分析工具。A.√B.×答案:A14.(判斷)開始創建一個可視化項目時,第一步是收集數據A.√B.×答案:B15.(多選)以下屬于主觀評估方法的有A.專家評估B.啟發式評估C.抽樣問卷調查D.焦點小組訪談答案:ABCD
第九單元測試題??1.(多選)?制約大數據治理的主要因素有:()A.制度與規范缺失B.數據防護意識薄弱C.成本效益比較低D.技術不成熟答案:ABCD2.?(多選)下列屬于大數據治理的實施路徑的是:()A.產生數據B.數據資產梳理C.構建機構內部大數據治理體系D.大數據治理評估與審計答案:ABCD3.(填空)?數據資產包括:答案:企業內部數據、企業外部數據、企業購買數據4.(填空)?大數據治理的五個核心要素包括:答案:明確數據治理責任,建立數據治理組織、管理出成效,制度是保障、確保數據規范、數據治理要理論結合實踐、數據治理軟件
第十單元測試題1.(多選)大數據技術的應用為組織財務管理注入了新鮮血液的方式有()A.拓寬籌資渠道B.增強財務控制能力C.提高投資回報率D.數據資源整合共享答案:ABCD2.(單選)大數據平臺可為物流管理提供()A.海量數據的收集B.儲存數據C.分析數據D.整合數據答案:A3.(多選)大數據在零售決策中的應用()A.利用大數據分析關聯購買行為B.智能推薦系統C.大范圍營銷D.主持產品定價答案:AB4.(單選)下列不屬于大數據在政府決策中的應用()A.智慧政府B.社會治理C.公共服務D.調整組織結構答案:D5.(多選)大數據在研發設計中的應用()A.產品協同設計B.設計仿真C.替代工藝流程D.優化工藝流程答案:ABD6.(多選)下列不屬于大數據在供應鏈中的應用()A.供應鏈管理戰略決策B.供應鏈管理風險預測C.供應鏈管理敏捷性D.供應鏈協同管理答案:ABCD7.(判斷)大數據與智能制造之間的關系包括將制造中存在的問題轉換為定性、定量的數據內容,然后從中找到相應的解決方法。A.√B.×答案:A8.(判斷)大數據技術在供應鏈管理方面的應用集中在供應鏈管理戰略決策、風險預測、提升供應鏈管理敏捷性及協同管理方面。A.√B.×答案:A9.(填空)大數據技術在生產制造環節的應用有助于更快、更好地推進智能制造,其主要應用包括、和制等答案:智能生產、生產流程優化、個性化定制10.(填空)大數據在醫療衛生管理與臨床服務中的應用包括:、、、答案:醫療質量管理、醫療績效管理、醫療設備管理、醫保管理
第十一單元測試題1.(單選)下列說法正確的是()A.當今社會,互聯網以及各種智能設備的普遍
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 觸控錄音筆的多模態交互設計-洞察闡釋
- 鄉鎮-工作總結及今后五年工作計劃
- 公司廣播播音管理制度
- 公司職工租房管理制度
- 河南省安陽市2024~2025學年 高三下冊3月檢測數學試卷附解析
- 安徽省六安市2024-2025學年高二下冊B班3月月考數學試卷附解析
- 互動式文案設計研究-洞察闡釋
- 云浮羅定市招聘醫療衛生人才筆試真題2024
- 2025年護理技能競賽試題
- 臨床支氣管囊腫與肺大泡鑒別
- 少兒脊柱健康課件
- 高純氮化硅行業跨境出海戰略研究報告
- 2024年四川內江中考滿分作文《我也有自己的光芒》8
- 強制執行申請書電子版
- 遙測信號抗干擾-深度研究
- 2024春形勢與政策-鑄牢中華民族共同體意識課件
- 金融科技概論 章習題及答案 第1-8章
- 低壓電氣基礎知識培訓電工-電氣工程師
- 2021-2022學年北京市朝陽區人教版三年級下冊期末考試數學試卷及答案
- 2025年江蘇鹽城市海興集團有限公司招聘筆試參考題庫含答案解析
- DB35-T 2208-2024 面向視頻圖像識別的AI邊緣計算系統應用技術要求
評論
0/150
提交評論