CPDA考試真題與答案-2_第1頁
CPDA考試真題與答案-2_第2頁
CPDA考試真題與答案-2_第3頁
免費預覽已結束,剩余1頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1. 一、判斷題數據根據計量尺度不同可以分為分類數據和數值型數據。2. 正確答案:X多次拋一枚硬幣,正面朝上的頻率是1/2。3. 正確答案:X歸納法是一種從個別到一般的推理方法。4. 正確答案:Vdatahoop中輸入的數據必須是數值型的。5. 正確答案:x置信水平是假設檢驗中犯第一類錯誤的概率。6. 正確答案:X當兩種產品為互補品時,其交叉彈性小于零。7. 正確答案:V時間序列分解法可以有乘法模型和加法模型兩種表示方式,其中乘法模型都是相對值來表示預測值的,加法模型都是用絕對值來表示預測值的。8. 正確答案:X需求定價法的核心思想是力求在需求高漲時收取較低價格,而當需求低落時則收取較高價格。

2、9. 正確答案:X盈虧平衡分析是靜態分析,不考慮資金的時間價值和項目壽命周期內的現金流量的變化。10. 正確答案:V決策樹算法易于理解好實現,且對缺失值、異常值和共線性都不敏感,是做分類預測的首選算法。11. 隨機森林中的每棵樹都不進行剪枝,因此過擬合的風險很高。12. 正確答案:X當倒傳遞神經網絡BP神經網絡無隱藏層,輸出層個數只有一個的時候,也可以看做是邏輯回歸模型。13. 正確答案:V維規約即事先規定所取模型的維數,可以認為是降維的一種。14. 正確答案:x標準差越小,表示離散程度越小,風險越大;反之離散程度越大,風險越小。15. 正確答案:X離群點是一個實際觀測值,它與其他觀測值的差異

3、如此之大,以至于疑心它是由不同的機制產生的。正確答案:V二、單項選擇題1.SQL語言中,刪除一個表中所有數據,但保留表結構的命令是A、DELETEB、DROPC、CLEARD、REMORE正確答案:A數據庫系統是由組成的A、數據庫、數據庫管理系統和用戶B、數據文件、命令文件和報表C、數據庫文件結構和數據D、常量、變量和函數正確答案:A假設學生考試成績以“優”.“良”.“及格”和“不及格”來記錄,為了說明全班同學考試成績的水平高低,其集中趨勢的測度2. A、可以采用算術平均數B、可以采用眾數或中位數C、只能采用眾數D、只能采用四分位數正確答案:C以下哪個變量可以反映客戶的忠誠度?A、購買頻次B、

4、購買金額C、最后一次購買時間D、購買金額波動率正確答案:A以下哪個類型的變量在作預測客戶流失的模型中最有解釋力度?3. A、人口基本數據,比方年齡和性別B、基本社會狀態數據,比方收入和職業C、業務數據,比方消費頻次D、業務數據的衍生變量,比方最近3個月消費頻次的變化情況正確答案:D下面關于聚類分析說法錯誤的選項是A、一定存在一個最優的分類B、聚類分析是無監督學習C、聚類分析可以用于判斷異常值D、聚類分析即:物以類聚,人以群分正確答案:A某小區60%居民訂晚報,45%訂青年報,30%兩報均訂,隨機抽一戶。則至少訂一種報的概率為A、0.82B、0.85C、0.80D、0.75在Excel工作表中,

5、在某單元格內輸入數值123,不正確的輸入形式是A、123B、=123C、+123D、*123正確答案:D在對歷史數據集進行分區之前進行數據清洗缺失值填補等的缺點是什么A、違反了建模的假設條件B、加大了處理的難度C、無法針對分區后各個數據集的特征分別做數據清洗D、無法對不同數據清理的方法進行比較,以選擇最優方法正確答案:D當一個連續變量的缺失值占比在85%左右時,以下哪種方式最合理A、直接使用該變量B、根據是否缺失,生成指示變量,僅使用指示變量作為解釋變量C、使用多重插補的方法進行缺失值填補D、直接刪除該變量正確答案:BNaiveBayes是屬于數據挖掘中的什么方法?A、聚類B、分類C、時間序列

6、D、關聯規則正確答案:B有一條關聯規則為AB,此規則的信心水平(confidence)為60%則代表A、買B商品的顧客中,有60%勺顧客會同時購買AB、同時購買A,B兩商品的顧客,占所有顧客的60%C、買A商品的顧客中,有60%勺顧客會同時購買BD、兩商品A,B在交易數據庫中同時被購買的機率為60%4. 企業要建立預測模型,需準備建模數據集,以下四條描述建模數據集正確的選項是A、數據越多越好B、盡可能多的適合的數據C、數據越少越好D、以上三條都不正確正確答案:B在有指導的數據挖掘中,有關測試集的說法錯誤的選項是A、測試集和訓練集是相互聯系的B、測試集是用以測試模型的數據集C、通常測試集大約占總

7、樣本的三分之一D、K-次交叉驗證中,測試集只有1個,訓練集有K-1個正確答案:A用簡單隨機重復抽樣方法抽取樣本單位,如果要使抽樣平均誤差降低50%則樣本容量需要擴大到原來的A、2倍B、3倍C、4倍D、5倍正確答案:C回歸分析的第一-步是A、確定解釋量和被解釋變量B、確定回歸模型C、建立回歸方程D、進行檢驗正確答案:A關于主成分數目的選取,正確的選項是A、保留多少個主成分取決于累計方差在方差總和中所占百分比B、一般選擇50%上C、選擇前兩個就可以D、選擇的數目和變量的個數一致正確答案:A以下四項中,不屬于數據庫特點的是A、數據共享B、數據完整性C、數據冗余很高D、數據獨立性高正確答案:C將復雜的

8、地址簡化成北、中、南、東四區,是在進行?5. A、數據正規化B、數據一般化C、數據離散化D、數據整合正確答案:B以下哪個指標不能用于線性回歸中的模型比較A、R方B、調整R方C、AICD、BIC正確答案:ARFM方法中的F說明客戶的A、興趣度B、粘性C、當前價值D、未來價值正確答案:A數據挖掘技術包括三個主要的部分A、數據、模型、技術B、算法、技術、領域知識C、數據、建模能力、算法與技術D、建模能力、算法與技術、領域知識正確答案:C下面關于因子分析的說法正確的選項是A、因子分析就是主成分分析B、因子之間可相關也可不相關C、因子受量綱的影響D、可以對因子進行旋轉,使其意義更明顯正確答案:D以下表達

9、正確的選項是A、極差較少受異常值的影響B、四分位差較少受異常值的影響C、方差較少受異常值的影響D、標準差較少受異常值的影響正確答案:B以下關于人工神經網絡ANN的描述錯誤的有A、神經網絡對訓練數據中的噪聲非常魯棒B、可以處理冗余特征C、訓練ANN是一個很耗時的過程D、至少含有一個隱藏層的多層神經網絡正確答案:A當時間序列的環比增長速度大體相同時,適宜擬合A、指數曲線B、拋物線C、直線D、對數曲線正確答案:A某家長為了使孩子在第3-6年上大學的4年中,每年年初得到10000元助學基金,他應在2年前在銀行存入多少錢?年利率按5咐算A、33771B、30291C、32163D、45256正確答案:A

10、蘋果公司對IPHONE的降價行為屬于A、地域性差異定價B、時間性差異定價C、非線性定價或數量折扣定價D、其他形式的定價正確答案:B設X=1,2,3是頻繁項集,則可由X可產生個關聯規則。1. A、3B、4C、5D、6正確答案:D以下哪些分類方法可以較好地防止樣本的不平衡問題?A、KNNB、SVMC、BayesD、神經網絡正確答案:A三、多項選擇題以下哪個聚類分析的方法是利用統計學定義的距離進行度量A、層次聚類法B、快速聚類法K-MeansC、基于密度的聚類法D、基于網格的聚類法正確答案:AB以下那種操作不應該進天貓分析人員希望通過聚類方法定位代商家刷信用級別的違規者,行()A、對變量進行標準化B

11、、對變量進行百分位秩或Turkey正態性轉換C、對變量進行因子分析或聚類分析D、對變量進行分箱處理正確答案:BD如下表student中,如何篩選type為包含數學或語文的記錄IDtypescoreA01數學78A02語文76A03英語90A04數學68A05英語84”數學”andtype=”語文”數學typeOT"語文”數學”,”語文”)2. A、select*fromstudentwheretype=B、select*fromstudentwheretype=C、select*fromstudentwheretypein(D、select*fromstudentwheretypei

12、n(?""y')正確答案:BC以下哪個分布是右偏分布A、均勻分布B、卡方分布C、F分布D、對數正態分布正確答案:BCD在假設檢驗中,當我們做出拒絕原假設而接受備擇假設的結論時,表示()A、有充足的理由否認原假設B、原假設必定是錯誤的C、犯錯誤的概率不大于aD、犯錯誤的概率不大于bE、在H。成立的情況下發生了小概率事件正確答案:ACE假設檢驗統計量F近似等于1,說明A、組間方差中不包含系統因素的影響B、組內方差中不包含系統因素的影響C、組間方差中包含系統因素的影響D、方差分析中不應拒絕原假設正確答案:AD以下何種算法可以幫助我們做數值的預測(Prediction)?3

13、. A、AprioriB、DecisionTreeC、NaiveBayesD、LinearRegression正確答案:BD某種產品的生產總費用2003年為50萬元,比2002年多2萬元,而單位產品成本2003年比2002年降低5%則A、生產費用總指數為104.17%B、生產費用指數為108.56%C、單位成本指數為95%D、產量指數為109.65%E、由于成本降低而節約的生產費用為2.63萬元正確答案:ACDE配合一元線性回歸方程須具備以下前提條件A、現象間確實存在數量上的相互依存關系B、現象間的關系是直線關系,這種直線關系可用散點圖來表示C、具備一組自變量與因變量的對應資料,且能明確哪個是

14、自變量,哪個是因變量D、兩個變量之間不是對等關系正確答案:ABCD回歸變差或回歸平方和是指A、被解釋變量的實際值與平均值的離差平方和B、被解釋變量的回歸值與平均值的離差平方和C、被解釋變量的總變差與剩余變差之差D、解釋變量變動所引起的被解釋變量的變差正確答案:BCD產品成本費用按其與產量變化的關系分為A、可變成本B、固定成本C、付現成本D、沉沒成本正確答案:AB統計決策的基本原則是)A、可行性B、發展性C、合理性D、經濟性正確答案:ACD隨機抽樣方法有A、等距隨機抽樣B、綜合隨機抽樣C、簡單隨機抽樣D、分群隨機抽樣正確答案:ACD完全競爭性的市場具有等特點。4. A、任一企業無法操縱市場B、少數企業可以影響交易數量C、多個競爭企業同時存在D、企業必須采取隨行就市定價法正確答案:ACD在全面調查和抽樣調查中都存在的誤差是A、系統誤差B、登記性誤差C、責任心誤差D、技術性誤差正確答案:BCD在作邏輯回歸時,如果區域這個變量,當Region=A時Y取值均為1,無法確定是否出現的是哪個問題?5. A、共線性B、異常值C、擬完全別離Quasi-completeseparationD、缺失值正確答案:ABD下面給出的t檢驗的結果,說明接受原假設,顯著性水平為0

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論