




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
PAGEPAGE1數據分析師(中級)認定考試復習題庫-下(多選、判斷題匯總)多選題1.個人集市的模型分為____A、緩沖層B、中間層C、應用層D、基礎層答案:ABC2.按照農業銀行數據安全管理的有關規定(《數據安全管理辦法》(試行)),本行員工對其使用數據負有保護義務和保密責任,包括___。A、使用數據前,應事先確認數據主體,并征得主體的明示同意B、對履行職責中知悉的個人信息、隱私和商業秘密必須嚴格保密,未經有權人審批或授權,不得泄露、出售或者私自向知悉范圍以外的單位和個人提供C、妥善保管本人信息系統密碼,不得向任何人出借D、數據處理使用完畢后,及時歸檔、清理和銷毀答案:BCD3.常見的半結構化數據有____。A、XMLB、JSONC、音頻D、文檔答案:AB4.下列屬于無監督學習的算法有____A、聚類B、關聯規則C、GBDTD、邏輯回歸答案:AB5.以下常用的離散分布有____A、0-1分布B、泊松分布C、指數分布D、正態分布答案:AB6.常見的特征衍生方式有哪些?A、特征擴展B、自動衍生C、合成特征D、特征組合答案:ABCD7.知識圖譜可以應用的領域包括A、反欺詐B、大數據風控C、推薦系統D、聊天機器人答案:ABCD8.下列哪幾項是個人數據集市的上層應用?A、CMMB、DCRMC、經營管理平臺D、PSCV答案:BCD9.下列哪些機器學習算法使用了Boosting學習方法思想?A、隨機森林B、AdaboostC、GBDTD、XGBoost答案:BCD10.客戶的資產信息主要包括哪些?A、月日均存款B、季日均AUMC、年日均AUMD、存款在AUM的占比答案:ABCD11.在Woody開展數據分析項目的過程中,可以通過下列哪些方式查詢數據表信息?A、Woody的放大鏡B、數據資產視圖C、showcreatetable命令D、數據服務目錄答案:ABCD12.E-R圖提供了表示實體型、屬性和聯系的方法,分別用什么形狀表示?A、圓形B、矩形C、橢圓形D、菱形答案:BCD13.BP神經網絡包含哪些層____A、輸入層B、隱藏層C、輸出層D、卷積層答案:ABC14.以下哪些屬于numpy中的聚合函數?A、leftB、minC、maxD、mean答案:BCD15.MLlib可以實現哪些數據分析操作?A、分類B、回歸C、聚類D、降維答案:ABCD16.我行向借款人發放的,用于借款人購買住房的貸款,具有什么特點?A、期限長B、額度高C、利率優惠D、還款方式多樣答案:ABCD17.SQL語句,以下語句不會導致全表掃描的是.A、selectidfromtwheresubstring(name,1,3)='cif'B、selectidfromtwherenamelike'cif%'C、selectidfromtable_1wherenum=10ornum=20D、selectidfromtwherecreatedate>='2005-11-30'andcreatedate答案:BD18.以下哪些是我行的線上信貸產品?A、網捷貸B、隨薪貸C、助業快e貸D、房抵貸答案:AC19.以下哪些是數據可視化的方法?A、概率密度圖B、箱形圖C、餅圖D、散點圖答案:ABCD20.SQL語句,以下語句會導致全表掃描的是.A、selectidfromtwheresubstring(name,1,3)='abc'B、selectidfromtwherenamelike'abc%'C、selectidfromtwherenum/2=100D、selectidfromtwherenum=100*2答案:AC21.數據項技術屬性描述數據與信息技術實現相關聯的特性,是數據項在信息系統項目實現時統一的技術方面定義,包括____A、數據大小B、數據類型C、數據格式D、數據字段答案:BD22.在精準營銷模型建模過程中,通常會使用以下哪些特征?A、客戶賬號B、客戶信用卡數量C、客戶AUMD、客戶身份證號答案:BC23.Python中,a="hello",b="python",下列選項中屬于正確字符串運算的是____。A、[1:4]B、a*2C、"h"inaD、a+b答案:ABCD24.如果一位老師的年紀是30歲,那么他可能會被下列那些語句篩選出來?A、select*fromteacherwheretagebetween30and40B、select*fromteacherwheretage>=30andtageC、select*fromteacherwheretagein('30','40')D、select*formteacherwheretage>30andtage<40答案:ABC25.商業銀行向中央銀行借款有哪兩種途徑?A、貼現B、貸款C、再貼現D、再貸款答案:CD26.可以用來描述散布的度量有____A、極差B、四分位差C、方差D、標準差答案:ABCD解析:散布度量:極差、方差、標準差、四分位數。27.以下哪些屬于報表的要素?A、報表編碼B、報表名稱C、報表頻度D、加工規則答案:ABCD28.計數數據可以無限度地快速增加。處理這類數據時,分析師常用的操作有哪些?A、二值化B、區間量化(分箱)C、多值化D、區間排序分類答案:AB29.數據集常將多個數據源中的數據結合成、存放在一個一致的數據存儲,需要考慮可能產生問題?A、過擬合問題B、冗余問題C、數據排序D、數據值的沖突答案:BD解析:數據集成將多個數據源中的數據結合成、存放在一個一致的數據存儲,如數據倉庫中,存在冗余,數據值的沖突屬性。30.哪些是大數據平臺典型的數據類型____A、拉鏈表B、明細表C、拼接表D、切片表答案:ABD解析:拼接表不是大數據平臺典型的數據類型31.在CNN中,池化層的作用主要有A、降低數據的尺寸B、減小參數數量C、擴大感受視野D、增大參數數量答案:ABC32.電子銀行的渠道包括____。A、網上銀行B、電話銀行C、手機銀行D、柜臺答案:ABC解析:電子銀行渠道主要包括:網上銀行(利用計算機和互聯網)、電話銀行(利用電話等聲訊設備和電信網絡)、手機銀行(利用移動電話和移動通信網絡)、自動終端(多媒體自動終端、自助上網機等)。33.Woody工具中以下哪些操作會運行jupyter文件的單元格____A、選中單元格,按Ctrl+Enter鍵B、點擊工具欄的“Run”按鈕C、選擇菜單欄Cell->RunCellsD、選中單元格,按Shift+Enter鍵答案:ABCD解析:Woody工具中以下操作會運行jupyter文件的單元格選中單元格,按Ctrl+Enter鍵、點擊工具欄的“Run”按鈕、選擇菜單欄Cell->RunCells、選中單元格,按Shift+Enter鍵34.在圖計算中,可用于社區發現的方法包括____。A、Girvan-Newman算法B、派系過濾CPM算法C、標簽傳播算法(LPA)D、最短路徑算法(Dijkstra)答案:ABC35.在以下場景中,哪些場景會產生數據質量問題?A、前臺工作人員為了省事,將所有用戶年紀都輸入為30歲B、在采集數據時,客戶不愿意告知某些數據項,導致該數據項缺失C、客戶填寫家庭住址時使用虛假地址D、由于時效性,系統中的手機號客戶已不再使用答案:ABCD36.《客戶數據安全分級規范》規定了數據安全級別有____。A、關鍵敏感級B、敏感級C、內部級D、公開級答案:ABCD37.分類問題的主要評價指標有____A、準確率B、精確率C、召回率D、F1值答案:ABCD38.連續數據的另一組常用的統計描述是散布度量,以下是散布度量有____。A、極差B、方差C、標準差D、四分位數答案:ABCD39.以下那些屬于數據預處理操作____。A、數據清洗B、數據變換C、數據標準化D、特征工程答案:ABC40.以下哪些是分布式計算框架?A、MapReduceB、SparkC、PythonD、R答案:AB41.數據分析類項目項目根據應用場景主要分為____等。A、精準營銷類B、支持決策類C、案防風控類D、指標加工類答案:ABC42.信用評分模型按照信貸整個生命周期,可分為哪三種類型A、申請評分B、行為評分C、催收評分D、交易評分答案:ABC43.在Python中,循環語句有____和____,允許我們多次執行一個語句或語句組A、thenB、forC、whileD、when答案:BC44.以下哪些屬于numpy中的聚合函數?A、sumB、minC、maxD、mean答案:ABCD45.下列關于我行的數據管理原則的說法正確的有____A、數據誰使用、安全誰負責、責任誰承擔B、最小化授權C、沒有明確要求D、數據申請得越多越好答案:AB解析:我行的數據管理原則遵循“數據誰使用、安全誰負責、責任誰承擔”的原則,以此確保數據使用全過程的安全。按照機構層級,我行數據管理遵循“最小化授權”原則實施分層級管理,用戶僅能使用所在機構及下轄機構數據,不能越級或跨機構使用數據。按照敏感程度,平臺數據分為普通數據和敏感數據。敏感數據的使用須經主管業務數據的業務審批部門和歸口管理部門聯合審批。46.以下哪些不是分布式計算框架?A、MapReduceB、SparkC、HDFSD、MLlib答案:CD47.數據分析挖掘流程包括哪些?A、明確分析目的和思路B、數據收集C、構建模型和模型評估D、數據應用和報告撰寫答案:ABCD48.卷積神經網絡一般包含哪些層____A、輸入層B、池化層C、輸出層D、卷積層答案:ABCD解析:CNN卷積神經網絡一般包括輸入層、卷積層、池化層、全連接層、輸出層等49.多個屬性數據間常用的統計量有____A、協方差B、相關系數C、均值D、標準差答案:AB50.假設x=array([0,1,2,3,4,5]),獲取子數組[0,1,2]的正確方法是?A、x[:3]B、x[0:3]C、x[:2]D、x[1:3]答案:AB51.以下關于IPython說法正確的有____A、是一個加強版的Python解釋器B、支持變量補全C、支持語法高亮D、支持“bashshell”命令答案:ABCD解析:Python是一個加強版的Python解釋器、支持變量補全、支持語法高亮、支持“bashshell”命令52.在數據分析挖掘平臺Woody中,啟動終端(Terminal)模式后可以成功執行以下哪些命令?A、pythonB、ipythonC、%sqlselect1+1D、ls答案:ABD53.商業銀行不可以從事下列哪些業務____A、代理收付款項及代理保險業務B、房地產投資C、證券經營D、汽車租賃答案:BCD54.下列選項中不屬于回歸算法的是______。A、線性回歸B、邏輯回歸C、隨機森林D、支持向量機答案:BCD解析:本題考查機器學習算法中分類和回歸的概念。線性回歸屬于回歸算法,邏輯回歸、隨機森林和支持向量機都屬于分類算法。55.大數據平臺數據入庫驅動方式包括____。A、應用驅動B、數據驅動C、源頭驅動D、技術驅動答案:AB56.數據分析挖掘平臺Woody目前支持用戶執行的語言有____A、PythonB、RC、SQLD、C#答案:ABC57.個人客戶營銷與管理系統包括以下哪幾項?A、BMPSB、OCRMC、ACRMD、PSCV答案:ABCD解析:答案存疑58.標簽板塊不包括:____。A、零售B、對公C、賬戶D、商戶答案:ABD解析:本題考查標簽板塊的內容。按照標簽領域,標簽分為個人標簽、對公標簽、商戶標簽等。59.在平臺建設方面,總行部署了,實現全行主要業務數據的集中存儲和管理。A、大數據平臺B、數據湖C、數據倉庫D、數據集市答案:AD60.商業銀行的性質包括____A、以追求利潤為目標B、以金融資產和負債為對象C、綜合性、多功能D、金融企業答案:ABCD61.在mole中,以下何種節點可以對兩個數據集進行聯接?A、reduceB、joinC、leftjoinD、map答案:BC62.EDA的特點有三個:____A、讓數據說話B、分析方法靈活C、簡單直觀D、需要前提假設答案:ABC63.特征選擇的目的什么?A、減少特征數量B、使模型泛化能力更強C、減少過擬合D、增加特征數量答案:ABC64.下列哪些Woody內建魔術命令可以執行sql語句?A、%%sqlB、%sqlC、%sqlstrD、%magic答案:ABC65.標簽中心的功能架構主要分為____。A、數據源層B、標簽數據層C、標簽服務層D、應用層答案:ABCD66.下列哪些選項不是pandas索引器?A、locB、ilocC、olumnsD、values答案:CD67.下面關于邏輯運算符的優先級,哪一個說法是正確的?A、邏輯運算符AND和OR可以用來連接多個查詢條件B、AND的優先級低于ORC、小括號()可以改變優先級D、多個邏輯運算符,優先級從左至右依次增高答案:AC解析:B選項是AND的優先級高于OR;D選項邏輯運算符本身具有不同的優先級,不能按照順序來判定優先級高低。68.智能報表提供___、___、___三種服務方式。A、固定行列報表B、機構緯度定列不定行報表C、固定機構報表D、行列都不定報表答案:ABC69.GBASE表級組合壓縮方式為____A、(0,0)B、(1,0)C、(1,3)D、(5,5)答案:ACD70.數據預處理階段不包括____A、模型調參B、特征重要性排序C、異常值處理D、缺失值處理答案:AB解析:數據預處理主要包括特征初篩、異常值處理、空值處理。71.數據分析挖掘平臺包含哪些工具?A、WoodyB、MoleC、SASD、Linux答案:AB72.SQL語句,刪除t0表中所有的數據的語句可以是A、truncatetablet0;B、deletefromt0;C、truncatefromt0;D、eletetablet0;答案:AB73.下面____選項屬于樹類算法?A、ID3B、C4.5C、ART決策樹D、隨機森林答案:ABCD74.一個常用指標通常由____、____和____三部分組成。A、業務維度B、單位C、度量D、通用維度(公共條件)答案:ACD75.下列選項中屬于Python繪圖工具的有哪些?A、scikit-learnB、matplotlibC、NumPyD、seaborn答案:BD76.在二分類任務中,根據真實類別與分類模型預測類別的組合,可以將預測結果分為______。A、真正例B、假正例C、真負例D、假負例答案:ABCD解析:根據真實類別與分類模型預測類別的組合,可以分為真正例(TruePositive,TP)、假正例(FalsePositive,FP)、假負例(FalseNegative,FN)、真負例(TrueNegative,TN)。其中TP是將正類預測為正類數,FP是將負類預測為正類數,FN是將正類預測為負類數,TN是將負類預測為負類數。77.在數據分析挖掘平臺Woody的筆記本(Notebook)中,若使用Python,以下哪些命令可以將數據或文件導入數據庫?A、%loadB、%tableC、%df2dbD、%excel2db答案:CD78.數據分析挖掘流程不包括哪些?A、基層調查B、數據收集C、構建模型和模型評估D、分析師培養答案:AD79.在精準營銷模型建模過程中,通常會使用以下哪些特征?A、所屬網點B、理財余額C、國債持有情況D、當月消費筆數答案:ABCD80.pip提供了對Python包的哪些管理功能?A、列出已安裝的包B、查找指定的包C、安裝指定的包D、卸載指定的包答案:ABCD解析:pip提供了對Python包的列出已安裝的包、查找指定的包、安裝指定的包、卸載指定的包管理功能81.個人客戶營銷與管理系統的主要功能包括A、工作平臺B、客戶畫像C、營銷管理D、客戶管理答案:ABCD解析:個人客戶營銷與管理系統的主要功能包括:工作平臺、客戶畫像、營銷管理、客戶管理、業績管理、管理報表、系統管理等。82.根據農業銀行員工行為守則,關于勤勉盡職的要求有____A、員工應具備崗位任職資格或能力,熟練掌握業務技能并樹立終身學習理念,與時俱進,提升素質。B、員工應恪守制度要求和辦事程序,勤奮努力,嚴謹審慎,精益求精,盡職盡責。C、員工應科學管理時間,提高工作效率。D、員工崗位變動或離職,應按規定妥善交接工作,遵守脫密和競業限制約定,不得擅自帶走所在機構的財物、工作資料和客戶資源。答案:ABCD83.以下哪些不屬于數據分析模型場景范疇?A、應對內外部審計場景B、監管檢查場景C、司法檢查場景D、日常業務經營管理報表需求答案:ABCD解析:我行數據分析模型不包括為應對內外部審計、監管檢查、司法檢查等進行的臨時性數據提取需求以及日常業務經營管理報表和指標加工需求。84.在自然語言處理中,常用關鍵詞提取算法有____。A、TF-IDFB、RNNC、LDAD、CNN答案:AC85.常見的文本預處理包括:_____。A、去除停用詞B、去除高頻詞C、去除罕見詞D、詞干提取答案:ABCD解析:常見的文本預處理包括:去除停用詞、基于頻率過濾和詞干提取。其中基于頻率過濾又包括去除高頻詞和罕見詞。86.在Woody中,常用的內建魔術命令正確的有____A、%sql執行多行sql語句B、%%sql執行單行sql語句C、%df2dbDataFrame導入數據庫D、%excel2dbexcel文件導入數據庫答案:CD87.在mole中,若當前節點的狀態為running,則節點的下一狀態可能為____A、finishedB、dirtyC、startD、error答案:AD88.公共集市數據需求填寫需要明確____。A、最晚投產時間B、數據字段C、加工頻率D、加工規則答案:BCD解析:填寫《公共集市數據需求》,明確對公共集市的數據接口需求,主要寫明應用系統需要的數據字段、加工頻率、加工規則,保證數據集市數據加工的規范性和準確性。89.描述性數據挖掘包括哪些方法?A、數據總結B、時間序列C、聚類D、關聯分析答案:ACD90.下列選項中,屬于Python關鍵字的是____A、importB、reakC、returnD、and答案:ABCD91.下列選項中用于NumPy數組排序的是?A、np.sort()B、np.argsort()C、np.sorted()D、np.argsorted()答案:AB92.以下關于概率質量函數的說法錯誤的是?A、描述離散型隨機變量B、在定義域內有限個點上的取值可以為負C、不一定是單調的D、在定義域上的求和必須小于1答案:BD93.以下哪些問題適合使用深度學習模型?A、圖片識別B、語音識別C、計算機視覺D、機器翻譯答案:ABCD94.根據輸入數據樣本是否帶有標記,機器學習任務可分為______。A、有監督學習B、無監督學習C、半監督學習D、全監督學習答案:ABC95.C3總體架構已經建成兩大基礎平臺,兩大平臺相輔相成、互為補充。A、全球信貸管理平臺B、全球信貸支持平臺C、全行信貸管理平臺D、全行信貸支持平臺答案:AB96.E-R模型是用E-R圖來描述現實世界的概念模型。E-R圖的組成元素有____A、關系B、實體C、屬性D、視圖答案:ABC97.處理個人信息的,應當遵循合法、正當、必要原則,不得過度處理,并符合下列條件____A、征得該自然人或者其監護人同意,但是法律、行政規另有規定的除外B、公開處理信息的規則C、明示處理信息的目的、方式和范圍D、不違反法律、行政法規的規定和雙方的約定答案:ABCD98.數據分析挖掘平臺可以提供____。A、豐富的分析挖掘工具B、集成的算法庫C、共享的數據分析知識庫D、支撐計算與存儲資源的統一管理與分配答案:ABCD99.在數據分析挖掘平臺Woody的筆記本(Notebook)中,對于代碼單元格的輸出域(Output),以下說法a的是____A、可以隱藏輸出B、無法清除輸出C、可以展開輸出D、可以折疊輸出答案:ACD100.SQL進行組合查詢時,下列關于UNION說法正確的是____。A、使用UNION很簡單,所要做的只是給出每條SELECT語句,在各條語句之間放上關鍵字UNIONB、UNION幾乎總是完成與多個WHERE條件相同的工作C、UNION從查詢結果集中自動去除了重復的行D、如果想返回不去重的所有匹配行,應使用UNION而不是UNIONALL答案:ABC101.下面____選項屬于boosting算法?A、GBDTB、XGBoostC、LightGBMD、RandomForest答案:ABC102.分析報告的工作步驟包括明確報告目的、報告框架、____、報告校稿及交付等步驟。A、數據分析B、報告初稿C、迭代完善D、報告圖形化展示答案:ABCD103.關于元數據,以下說法正確的是____。A、是描述其他數據的數據B、是對數據及信息資源的描述性信息C、是指源系統采集到的數據D、是第一手的數據,最原始的業務交易數據答案:AB104.顯示t2表中a字段去重后的結果,以下SQL語法正確的有____A、SELECTaFROMt2;B、SELECTDISTINCTaFROMt2;C、SELECTa,count(*)FROMt2groupbya;D、SELECTa,b,count(*)FROMt2groupbya,b;答案:BC105.在Python中,以下語句正確的是______。A、frompandasimportxgboostB、fromnumpyimportsvmC、fromsklearnimportsvmD、importxgboostasxgb答案:CD106.SQL包括____功能A、DCLB、DMLC、DDLD、TL答案:ABC107.對于需要落地部署的數據分析模型,項目統籌管理部門組織____進行評審,明確模型部署方案、部署時間計劃、評估部署風險并提出應對建議。A、項目申請部門B、項目實施部門C、技術支持部門D、以上都不對答案:ABC108.以下是我行數據標準體系構建策略內容的有________A、長短規劃結合B、剛柔實施配套C、通過實踐檢查D、適時處置提高答案:ABCD109.數據分析類項目實施管理包括。A、數據準備B、數據探查C、數據建模D、模型驗證答案:ABCD110.大數據服務目錄主要包含了哪些方面的內容:A、基礎數據目錄B、指標報表目錄C、挖掘模型目錄D、IT系統服務目錄答案:ABC111.對公集市的模型分為____A、緩沖層B、中間層C、應用層D、基礎層答案:ABC112.數據分析類項目實施管理除了數據準備和模型應用,還包括哪些活動____A、數據探查B、特征工程C、數據建模D、模型驗證答案:ABCD113.下列選項中屬于Pandas基本數據結構的是?A、NumPyB、seriesC、DataFrameD、index答案:BCD114.在機器學習中需要劃分數據集,常用的劃分測試集和訓練集的劃分方法有哪些______。A、留出法B、交叉驗證法C、自助法D、評分法答案:ABC解析:本題考查機器學習的概念。常用的劃分測試集和訓練集的劃分方法包括留出法、交叉驗證法和自助法。115.數據集市可以分為兩種類型,分別為__數據集市和__數據集市。A、獨立型B、從屬型C、關系型D、非關系型答案:AB116.SQL以下是比較操作符的是A、選項A是:!B、選項B是:!=C、選項C是:>=D、選項D是:==答案:BCD117.以下是DML語句的有A、insertB、updateC、deleteD、select答案:ABCD解析:insert、update、delete、select都為數據操縱語言。DML118.在神經網絡中,如果模型欠擬合,可嘗試的方法包括____。A、增加模型隱藏層數B、增加隱藏層神經元的個數C、DropoutD、批規范化(BN)答案:AB解析:本題考查神經網絡的概念。在神經網絡中,處理欠擬合的方法包括增加模型隱藏層數和增加隱藏層神經元的個數。119.監督學習基本等價于數據挖掘的預測任務,以下哪些數據監督學習?A、分類B、回歸C、聚類D、數據統計答案:AB120.以下哪些方法用于處理數據缺失問題?A、統計法填充B、模型填充C、真值轉換法D、專家補全答案:ABCD121.下列屬于python的比較運算符的有____A、==B、>=C、!=D、=答案:ABC122.以下哪些屬于大數據分析挖掘的過程?A、數據準備B、建立模型C、模型評估D、模型發布答案:ABCD解析:數據分析流程主要包括6個既相對獨立又互有聯系的階段。它們是:明確分析目的和思路、數據收集、數據處理、構建模型、模型評估、數據應用和報告撰寫。123.數據管理框架包含的內容有:A、數據域B、管理域C、服務域D、管理流程和機制域答案:ABCD124.集成學習包括哪兩種學習方法?A、BaggingB、oostingC、LSTMD、SVM答案:AB125.個人集市應用數據區從加工層次看分為三層:__層、__層、__層。A、緩沖B、中間C、應用D、貼源答案:ABC解析:應用數據區從加工層次看分為三層:緩沖數據層、中間數據層、應用數據層。126.以下哪些屬于numpy中的聚合函數?A、varB、minC、maxD、mean答案:ABCD127.操作數據區(ODS),采用標準化的流程和規則,對源系統數據進行哪些操作?A、加載B、清洗C、轉換D、匯總答案:ABC128.以下哪個選項是我行數據分析師的必備技能?A、熟悉銀行業務B、熟悉銀行數據C、熟悉機器學習D、熟悉CSS答案:ABC129.關于GROUPBY子句,以下說法正確的是:A、HAVING子句中的每一個元素不必出現在SELECT列表中。HAVING子句限制的是分組,而不是行,因此可以使用聚合函數。B、GROUPBY子句中列出的每一列都必須是檢索列或有效的表達式(但不能是聚集函數)C、GROUPBY子句必須出現在WHERE子句與ORDERBY子句之后D、如果分組列中包含具有NULL值的行,則NULL將作為一個分組返回。如果列中有多行NULL值,它們將分為一組。答案:ABD130.IFAR會計期間是根據會計制度的規定和管理核算的需要,對經濟業務活動的會計核算、分期結算賬目和編制財務會計報告一個周期的規定。包括標準____。A、月B、季度C、半年D、年度答案:ABCD131.下列關于協方差的說法中正確的有____A、如果兩個變量相互獨立,那么它們的協方差為零。B、如果兩個變量的協方差不為零,那么它們一定是相關的。C、如果兩個變量協方差為零,它們之間一定沒有線性關系。D、雖然兩個變量不相互獨立,但是協方差有可能是零。答案:ABCD132.數據中臺的匯聚整合能力,可以一定程度上解決導致數據孤島的問題;提純加工能力,可以加深對數據的理解,通過統一的數據標準和質量體系,形成標準數據資產體系;服務可視化能力,可以支持數據資產場景化能力的快速輸出,以響應客戶的動態需求。A、數據匯聚整合B、數據提純加工C、數據服務可視化D、數據價值變現答案:ABC解析:本題考查數據中臺的核心能力內容,數據中臺需要具備數據匯聚整合、數據提純加工、數據服務可視化、數據價值變現4個核心能力,讓企業員工、客戶、伙伴能夠方便地應用數據。133.以下哪些屬于商業銀行的中間業務A、擔保業務B、貸款業務C、承諾業務D、借款業務答案:AC134.在woody平臺中,以下SQL使用正確的是____。A、%sql多行語句B、%%sql單行語句C、%sql單行語句D、%%sql多行語句答案:CD135.下列關于農業銀行員工行為守則的說法,正確的有____A、員工應自覺維護國家利益和金融安全B、員工應把個人職業生涯和農業銀行發展有機結合起來C、員工應維護農業銀行的形象和利益D、員工應踐行愛國、敬業、誠信、友善的核心價值觀答案:ABCD136.對商業銀行來說,數據分析挖掘可應用于哪些方面?A、風險管理B、產品創新C、決策支持D、客戶管理答案:ABCD解析:本題考查的是數據分析挖掘的應用范圍,主要有產品營銷、風險管理、客戶管理、決策支持、產品創新等。137.以下可以進行特征排序的算法有哪些?A、決策樹B、CNNC、XGBoostD、RNN答案:AC138.以下哪些領域是NLP經典應用領域?A、機器翻譯B、情感分析C、文本分類D、智能問答答案:ABCD解析:本題考查NLP的應用領域,包括機器翻譯,情感分析,文本分類,智能問答等領域。139.以下哪些是理財精準營銷模型中可以加工的特征?A、客戶的基本信息B、資產余額信息C、持有理財信息D、客戶行為信息答案:ABCD解析:客戶的基本信息、資產信息、理財信息、持有產品信息、行為信息、交易信息等信息均可以作為理財精準營銷模型的特征140.XGBoost模型在通常待調的參數有____。A、學習輪數B、樹的深度C、正則項系數D、學習率答案:ABCD141.數據清理中,處理缺失值的方法是______。A、估算B、整例刪除C、變量刪除D、成對刪除答案:ABCD142.總行數據分析師應在數據應用過程中發現____等數據問題,推動各領域數據治理。A、數據缺失B、數據不準確C、數據不一致D、數據不整合答案:ABCD143.公共集市需求交付研發中心需提供以下材料()。A、大數據服務目錄B、業務需求說明書C、XX項目數據需求D、模型說明書答案:BC144.下列選項中,屬于Python合法標識符的是____A、gb123B、_nameC、2BD、break答案:AB145.線上信貸產品的主要特征是____A、普惠化B、移動化C、智能化D、場景化答案:ABCD146.____屬于非結構化數據。A、文檔B、圖片C、視頻D、數據庫表格答案:ABC解析:非結構化數據是沒有固定結構的數據,各種文檔、圖片、視頻/音頻等都屬于非結構化數據。147.業務數據資產包括:A、指標B、報表C、模型D、標簽答案:ABCD148.以下常用的連續分布有____A、二項分布B、指數分布C、正態分布D、泊松分布答案:BC149.在數據分析挖掘平臺Woody項目列表頁面,非項目管理員的項目成員可以執行哪些操作____A、打開項目B、查看項目成員C、管理項目成員D、項目清單篩選和排序答案:ABD150.以下哪些選項不是數據分析類項目的主要應用場景?A、信用卡分期精準營銷B、應急提數C、IT系統投產前數據測試D、反欺詐關系圖譜答案:BC151.數據分析挖掘是非常有價值的,它在銀行業的應用體現在哪些方面?A、信用卡的審批額度B、識別貸款業務中潛藏的操作風險C、貴賓客戶的流失預測D、掌銀對消費者的產品推薦答案:ABCD152.以下屬于圖的基本概念的是A、度B、路徑C、連通D、詞袋答案:ABC153.數據挖掘平臺目前提供的分析工具有____A、WoodyB、MoleC、SASD、Tableau答案:ABC154.在GBase中,計算時會默認忽略列值為NULL的行的函數有:A、VGB、SUMC、MAXD、MIN答案:ABCD155.XGBoost工具包能夠實現的任務包括______。A、降維B、分類C、回歸D、聚類答案:BC156.SQL是一種專門用來與數據庫溝通的語言,集功能于一體。A、數據建模B、數據操縱C、數據定義D、數據控制答案:BCD157.業務部門可按需申請數據分析挖掘平臺的數據使用權限,并對其獲取數據的哪些數據處理行為承擔安全保密責任?A、查詢B、使用C、下載D、傳輸及銷毀答案:ABCD158.商業銀行的信用創造職能是在____和____職能的基礎上產生的。A、信用創造B、信用中介C、支付中介D、金融服務答案:BC解析:答案存疑159.通常可以使用以下那些量來計算多個聯系型特征之間的關系?A、協方差B、相關系數C、方差D、四分位數答案:AB160.整的公共集市數據服務需求研制流程,包含以下____環節。A、需求意向B、需求研制C、需求評審D、需求交付答案:ABCD161.對公數據區數據資產按技術架構分類,包括______數據。A、緩沖層B、中間層C、應用層D、基礎層答案:ABC162.下列關于數據安全面臨的挑戰的說法中,正確的有:A、數據量爆發式增長加大了數據泄露風險B、數據應用越來越靈活提升了事故發生概率C、大數據技術帶來新的安全威脅,大數據分析使黑客的攻擊更加精準D、數據安全保密的法律和政策日益嚴格答案:ABCD163.對于數據分析挖掘平臺的使用,以下做法正確的是____A、自己的用戶可以給領導使用B、編寫分析語句要考慮執行效率C、使用平臺要有安全保密意識D、權限允許范圍內合規使用數據答案:BCD解析:平臺用戶對該用戶的系統及數據操作承擔責任,在權限允許范圍內合規使用數據,并對用戶名及密碼嚴格保密,嚴禁將用戶賬號提供他人使用。平臺使用中出現違規違紀行為的,按照《中國農業銀行員工違規行為處理辦法》等有關規定對相關責任人進行處理。164.數據資產視圖匯集的數據資產有____A、技術數據資產(系統、表、字段)B、業務數據資產(指標、報表、模型、標簽)C、管理數據資產(各系統服務目錄、主數據)D、流程數據(數據治理流程中產出的數據等)答案:ABCD165.數據庫系統的組成部分包括哪些A、數據庫B、數據庫管理系統C、應用程序D、數據庫管理員答案:ABCD解析:數據庫系統是由數據庫、數據庫管理系統(及其應用開發工具)、應用程序和數據庫管理員(DataBaseAdministrator,DBA)組成的存儲、管理、處理和維護數據的系統。166.數據分析過程中,以下選項哪些可以用于畫圖____A、EchartsB、MatplotlibC、SeabornD、NumPy答案:ABC167.會計主體是IFAR系統各項賬務數據、報告數據組織的基本單位。目前系統中設置會計主體分別為。A、境內核算主體、境外核算主體B、境內并賬主體、境外并賬主體C、境內合并主體、境外合并主體D、匯總單元答案:ABCD168.Python函數的組成部分有____A、函數名B、形參列表C、函數體D、返回值答案:ABCD169.在數據探查的過程中,主要針對____等情況進行探查。A、數據分布B、數據準確性C、數據相關性D、數據缺失答案:ABCD170.下列哪幾項屬于“繁星計劃”大數據分析人才培養方式?A、培訓考試B、知識分享C、跟班學習D、技能競賽答案:ABCD171.GBase中,SQL使用____函數可將字符串轉換為大寫。A、SOUNDEX()B、UPPER()C、UCASE()D、CONVERT()答案:BC172.在Woody中,不能實現的操作是____A、New→TextFileB、New→FolderC、New→XmlD、New→Html答案:CD173.個人客戶數據集市的上層應用包括如下哪些系統?A、DCRMB、DC、PSCVD、ACRM答案:ABCD174.分類問題的評分指標有______。A、準確率B、召回率C、精確率D、F1分數答案:ABCD175.在GBase中,下列關于COUNT函數的說法正確的有:A、使用COUNT(*)對表中行的數目進行計數,不管表列中包含的是空值(NULL)還是非空值。B、使用COUNT(column)對特定列中具有值的行進行計數,忽略NULL值。C、使用COUNT(DISTINCTcolumn)則會取消該列中的重復值。D、使用COUNT(column)默認不會取消該列中的重復值。答案:ABCD176.在客戶營銷管理領域,鑒于對公客戶及個人客戶兩方面在數量級別、管理方式、營銷策略以及客戶拓展方面有較大的不同,分別建設了__數據集市和__數據集市。A、運營B、監管C、個人D、對公答案:CD177.SQL關于子查詢,以下說法正確的是____。A、一般來說,表連接都可以用子查詢替換B、一般來說,子查詢都可以用表連接替換C、相對于表連接,子查詢適合于作為查詢的篩選條件D、相對于表連接,子查詢適合于查看多表的數據答案:AC178.在數據分析挖掘平臺Woody的筆記本(Notebook)中,單元格的輸出(Output)可以是選項中的哪些____A、數字B、文本C、表格D、圖片答案:ABCD179.在Python中,標識符的命令規則包括A、可以以數字開頭B、可以下劃線開頭C、除了開頭,其他部分可以由字母、數字或下劃線組成D、可以字母開頭答案:BCD180.下列關于統計學知識的表述中正確的有:A、在統計學中,用概率分布(probabilitydistribution)來描述隨機變量或一簇隨機變量在每一個可能取到的狀態的可能性大小。B、在統計學中,我們描述概率分布(probabilitydistribution)的方式取決于隨機變量是連續的還是離散的。C、在統計學中,我們用概率密度函數(probabilitydensityfunction或pdf)描述連續型隨機變量在每一個可能取到的狀態的可能性大小。D、在統計學中,我們用概率質量函數(probabilitymassfunction或pmf)可以描述離散型隨機變量在每一個可能取到的狀態的可能性大小。答案:ABCD181.以下的操作,會過濾空值的是A、count(cid)B、count(distinctcid)C、ount(name)D、count(*)答案:ABC182.以下SQL語句正確的有____A、SELECTcust_idFROMOrdersWHEREorder_numIN(SELECTcust_idFROMOrderItemsWHEREprod_id='RGAN01');B、SELECTcust_idFROMOrdersWHEREorder_numIN(SELECTorder_numFROMOrderItemsWHEREprod_id='RGAN01');C、SELECT*FROMOrdersWHEREcust_idIN(SELECTcust_idFROMOrderItemsWHEREprod_id='RGAN01');D、SELECT*FROMOrdersWHEREcust_idIN(SELECTorder_numFROMOrderItemsWHEREprod_id='RGAN01');答案:BC183.以下那些屬于特征衍生的操作?A、將特征進行one-hot編碼B、特征間進行加減乘除C、補充特征缺失值D、將特征進行標準化答案:AB解析:將特征進行one-hot編碼、特征間進行加減乘除屬于特征衍生的操作。184.在Pandas中,可以用于剔除和填充缺失值的有____A、isnull()B、notnull()C、dropna()D、fillna()答案:CD185.以下哪些是數據預處理的常見技術?A、數據清洗B、數據展示C、數據變換D、數據存儲答案:AC186.以下敘述正確的是____。A、目標變量(標簽)是離散值,稱為分類任務B、目標變量(標簽)是連續值,稱為回歸任務C、垃圾郵件識別屬于回歸任務D、預測房屋價格屬于回歸任務答案:ABD187.下列哪些選項屬于機器學習建模流程的操作?A、數據清洗B、特征縮放/歸一化C、訓練模型D、交叉驗證答案:ABCD188.我行的數據安全管理包括____A、敏感數據脫敏B、數據使用授權C、結果數據導出D、過期數據清理答案:ABCD189.明細表記錄某一時間發生的業務信息,數據持續積累,新的數據不會影響以前的記錄,以下哪些數據一般使用明細表存儲?A、簽約信息B、交易流水C、登錄記錄D、操作日志答案:BCD190.以下哪些不是數據分析類項目的主要應用場景?A、為實現特定業務目標對數據進行分析挖掘B、應對外部審計提數C、為司法監察進行提數D、經營管理報表加工指標答案:BCD191.在mole的隨機森林模型中,在分類問題中的輸出采用以下何種方式來得到?A、簡單多數投票法B、單顆樹輸出結果的簡單平均C、后一棵樹將前一顆樹的殘差作為輸入D、利用模型的負梯度值進行多輪迭代答案:AB192.GBASE支持的字符型為____A、CHARB、VARCHARC、TEXTD、STRING答案:ABC193.下列那些指標可以用來衡量算法預測誤差。A、平均絕對誤差B、加權平均絕對誤差C、平均絕對百分誤差D、均方根誤差答案:ABCD194.在Gbase中,以下數據類型是數值型的有A、INTB、FLOATC、DECIMALD、OUBLE答案:ABCD195.下列哪幾項和“繁星計劃”相關?A、大數據分析集中培訓班B、跟班學習C、成果經驗交流D、同業交流答案:ABCD解析:總行啟動“繁星計劃”,加快數據分析師培訓工作,包括面向全行組織多期大數據分析集中培訓班、組織分行專職數據分析師到總行信息管理部數據分析核心團隊跟班學習、同時不定期舉行數據分析工作成果經驗及與先進同業、互聯網公司等的交流學習等,推進數據分析師隊伍建設。196.數據質量管理的目標包括____。A、持續提升數據質量B、確保信息數據合法合規C、促進數據應用價值的充分發揮D、直接創造利潤答案:ABCD197.在關系數據庫中,如果一列是主鍵,那么該列A、任意兩行的值都不同B、該列的值不允許修改或更新C、該列沒有NULL值D、count(主鍵列名)效率優于count(*)答案:ABC解析:答案存疑198.IFAR會計期間分為。A、正常會計期間B、附屬會計期間C、主會計期間D、副會計期間答案:AB199.下列不屬于集成學習方法的有______。A、線性回歸B、邏輯回歸C、XGBoostD、LightGBM答案:AB200.對于敏感數據數據需求,業務部門填寫《關于申請使用數據分析挖掘平臺數據的函》,通過部室商辦簽報向哪兩個部門提交申請?A、業務審批部門B、人資資源部門C、歸口管理部門D、檔案管理部門答案:AC201.在Python中邏輯運算符的關鍵字包括____A、ndB、ifC、orD、not答案:ACD202.數據中臺是一種______。A、技術方案B、戰略選擇C、組織形式D、方法論答案:ABCD203.以下哪類存款在存入時約定存期?A、整存整取B、零存整取C、定活兩便D、活期存款答案:AB解析:整存整取定期儲蓄存款是存款時約定存期,一次存入本金,全部或部分支取本金和利息的業務。零存整取定期儲蓄存款是存款時約定存期,按月定額存儲,到期一次支取本息的業務。204.在數據分析挖掘平臺Woody項目中,可以新建選項中的哪些____A、Python筆記本(Notebook)B、文本文件(TextFile)C、文件夾(Folder)D、R筆記本(Notebook)答案:ABCD205.根據《中國農業銀行數據分析挖掘平臺應用管理細則》,數據管理包括。A、數據分級管理B、敏感數據脫敏C、數據使用授權D、結果數據導出答案:ABCD206.調整超參數的方法有那些。A、手動調參B、網格搜索C、隨機搜索D、自動超參數優化方法答案:ABCD解析:調整超參數的方法包括:手動調整超參數、自動超參數優化方法、網格搜索、隨機搜索。207.SQL語句,tB表中查詢a字段在D0和50之間的記錄(包含D0和50),以下正確的是____A、SELECT*FROMtBWHEREaBETWEEND0AND50B、SELECT*FROMtBWHEREa>D0anda<50C、SELECT*FROMtBWHEREa>=D0andaD、SELECT*FROMtBWHEREain(D0,50)答案:AC208.總行的項目管理員由總行管理員根據項目需求設定,一般由歸口管理部門數據分析師擔任,負責哪些工作?A、指定平臺管理員B、所負責的數據分析項目的用戶管理C、所負責的數據分析項目數據授權的實施D、負責平臺用戶、項目、數據、模型、知識、資源等管理工作答案:BC209.對于信用評分而言,主要檢驗模型對好壞賬戶排隊區分效果的是?A、交換曲線B、K-S指標C、擬合度曲線D、區分度曲線答案:AB解析:對于信用評分而言,主要檢驗模型對好壞賬戶排隊區分效果的是交換曲線、K-S指標。210.常見的數據降維方法包括:____。A、SVDB、ICAC、PCAD、FA答案:ABCD解析:答案存疑211.下列選項中,屬于Python合法標識符的是____A、breakB、123_yearC、_age_30D、Year_123答案:CD解析:本題考查Python標識符的命名規則。在Python中,標識符的命令規則如下:①以字母、下劃線開頭;②其他部分由字母、數字或下劃線組成;③不能使用關鍵字命名;④常量一般全部是大寫;⑤命名要有意義,不宜過長。212.我行引入外部數據的總體思路是____。A、統籌組織B、嚴控增量C、部門協同D、總分聯動答案:ACD213.數據分析挖掘平臺敏感數據的使用須經____和____聯合審批。A、主管業務數據的審批部門B、平臺歸口管理部門C、科技部門D、各一級分行答案:AB解析:數據分析挖掘平臺敏感數據的使用須經主管業務數據的審批部門和平臺歸口管理部門聯合審批。214.標簽中心數據標簽根據加工邏輯的不同,分為:____。A、基礎標簽B、公共標簽C、模型標簽D、衍生標簽答案:ACD215.對于必要的數據出行,應依據行內數據安全保密相關制度,對數據內容的____和____進行評估審查。A、敏感性B、連續性C、重要性D、技術特性答案:AC216.在mole中,以下哪些節點的父節點必須為特征和標簽選擇節點A、數據拆分B、樸素貝葉斯C、邏輯回歸D、oneHot編碼答案:BC217.以下屬于社區發現的算法的是A、標簽傳播法B、Girvan-Newman算法C、kNN算法D、派系過濾CPM算法答案:ABD218.數據預處理主要包括____A、模型發布B、特征重要性排序C、異常值處理D、缺失值處理答案:CD219.數據挖掘吸納了____等技術。A、統計學B、機器學習C、數據倉庫D、分布式計算答案:ABCD解析:數據挖掘吸納了統計學、機器學習、數據倉庫、分布式計算等技術。220.對于XGBoost模型來說,____。A、不允許特征中存在缺失值B、缺失值比例過高會使得特征解釋能力較弱C、允許特征中存在缺失值D、缺失值會引發報錯答案:BC解析:答案存疑221.下列屬于集成學習方法的有____A、線性回歸B、邏輯回歸C、XGBoostD、LightGBM答案:CD222.分類變量是用來表示類別或標記的。分類變量的編碼方式有____A、one-hot編碼B、虛擬編碼C、效果編碼D、以上都不對答案:ABC223.以下哪些不是聚類算法?A、GBDTB、K-meansC、AprioriD、RandomForest答案:ACD224.可以在數據分析挖掘平臺進行的工作有?A、擅自下載數據集到本地B、擅自查詢特定客戶的信息,并泄露至行外C、以html格式導出筆記本文件D、分析我行資產質量情況答案:CD225.經營管理信息平臺的通用性報表需求,需要滿足以下哪些要求?A、由總行業務主管部門作為需求方提出B、需提出明確的定義、業務規則、度量、頻度、機構等關鍵屬性C、通常數據應用周期不少于一年D、符合技術實施原則答案:ABCD226.以下哪些屬于商業銀行的中間業務____A、擔保業務B、貸款業務C、承諾業務D、借款業務答案:AC227.以下屬于我行數據服務體系中夯實的三項基礎的是。A、數據分析服務B、數據標準體系C、數據質量管控D、數據安全保護答案:BCD228.常用的數據可視化方法有____圖、____圖、____圖、____圖等。A、概率密度圖B、箱形圖C、餅圖D、散點圖答案:ABCD229.指標規范內容包含指標的_______A、基本信息B、統計信息C、口徑信息D、管理信息答案:ABCD230.大數據平臺數據應用方式包括____。A、各類數據集市B、注冊用戶查詢C、分析挖掘平臺D、數據臨時提取答案:ACD231.以下哪些屬于數據分析師需要熟悉的計算機技術?A、操作系統B、實時流計算C、開發語言D、數據分析與機器學習框架答案:ABCD解析:本題考查的是大數據分析相關的計算機技術,包括:操作系統(Linux、Shell等)、實時流計算(Spark、Storm)、海量數據處理(Hadoop、Hbase、Hive)、開發語言(C、++、Java、Scala等)、數據分析與機器學習框架(R、Python、TensorFlow、Mahout等)。232.在數據分析挖掘平臺的管理中,下列是總行信息管理部的職責的是____。A、制定平臺建設規劃,牽頭平臺建設需求研制與統籌B、制定平臺管理制度,明確工作流程和職責C、制定數據安全策略,負責平臺數據安全和合規管理D、負責組織平臺的應用推廣工作答案:ABCD233.為提升SQL腳本效率,使用借記卡活期交易明細表時可從____字段進行過濾。A、省市代碼B、交易日期C、交易代碼D、交易渠道答案:ABCD234.公共集市需求意向階段,可能涉及的部門包括____。A、大數據主庫業務部門B、公共集市業務部門C、大數據主庫技術部門D、公共集市技術部門答案:ABCD解析:答案存疑235.我行大數據平臺整體架構體系包括____。A、數據交換層B、數據應用層C、數據架構層D、數據展現層答案:ABD236.在數據分析挖掘平臺Woody項目中,假設已經寫好一個Python腳本文件hello.py,哪些方式可以運行該腳本?A、在筆記本(Notebook)中執行%runhello.pyB、在筆記本(Notebook)中執行hello.pyC、在終端(terminal)中執行pythonhello.pyD、在終端(terminal)中執行hello.py答案:AC237.下列關于分析報告的說法,正確的有。A、報告的目的就是揭示問題,不要回避“不良結論”B、報告要回避“不良結論”C、數據分析報告盡量使用反映變化規律的圖形化展示,提升報告可讀性D、數據分析報告應該多使用文字,少使用圖表答案:AC238.機器學習主要包含以下幾類模式____A、監督學習B、無監督學習C、半監督學習D、強化學習答案:ABCD239.下列選項中屬于決策樹算法的有哪些?A、ID3算法B、C4.5算法C、ART算法D、Kmeans算法答案:ABC解析:本題考查決策樹相關算法應用。典型應用包括ID3算法,C4.5算法,CART算法。240.以下選項中python探索性數據分析繪圖工具包有____A、MatplotlibB、SeabornC、numpyD、sk-learn答案:AB241.下面哪些是文本處理函數?A、LEFT(str,len)B、RIGHT(str,len)C、UPPER(str)D、LOWER(str)答案:ABCD242.數據分析挖掘平臺Woody的項目成員對其項目數據庫中的表具備哪些SQL操作權限?A、讀(select)B、更新(update)C、刪除(delete)D、清空(truncate)答案:ABCD解析:數據分析挖掘平臺Woody的項目成員對其項目數據庫中的表具備讀(select)、更新(update)、刪除(delete)、清空(truncate)SQL操作權限243.以下關于概率密度函數的說法錯誤的是?A、必須是單調遞增的B、在定義域上的求和必須為1C、描述連續型隨機變量D、取值必須為正答案:ABD244.按照我行相關管理要求,下列哪些文件、資料,復制時必須經過審批____。A、明確標注“依申請公開”的監管工作文件、資料B、標注“內部信息注意保密”的我行資料C、明確標注“不予公開”的監管工作文件、資料D、明確標注“內部”或“不予公開”屬性的監管工作文件、資料答案:BCD解析:答案存疑245.下列關于農業銀行信息化概況的說法中正確的有____A、農業銀行的信息化建設從無到有、從弱到強,一直堅定不移的走自主創新之路。B、我行信息技術基礎設施已具規模,形成了全國集中的數據網絡C、信息科技工作已經成為農業銀行快速發展的重要驅動力和核心競爭力。D、近年來,農業銀行牢牢把握金融科技創新發展動向,以科技創新助力全面助力數字化轉型。答案:ABCD246.完整的公共集市數據服務需求研制流程,包含以下____環節。A、需求意向B、需求研制C、需求評審D、需求交付答案:ABCD解析:公共集市數據服務需求研制流程可支持業務主管部門、指標需求部門、標簽需求部門及數據需求部門進行數據服務。相應業務需求部門有數據需求時,可參照以下流程展開數據的需求研制,提出需求意向、開展需求討論會進行需求研制、應用ITA系統進行需求評審,最終交付實施。247.在CNN中,隱藏層通常包括哪些結構____。A、卷積層B、池化層C、全連接層D、輸入層答案:ABC248.碳金融是指為滿足低碳發展需求,在碳交易體系下,利用、優化、創建金融工具進行碳資產交易活動,主要分為____三大類。A、碳市場支持工具B、碳市場創新工具C、碳市場融資工具D、碳市場交易工具答案:ACD解析:答案存疑249.數據分析報告最重要的是明確報告目的,其中需要明確的兩項內容包括:A、如何發現問題B、解決什么問題C、如何解決問題D、向誰匯報答案:BD解析:本題依據:案例--管理決策第一節“管理決策分析報告工作步驟”-明確報告目的。分析報告首先要明確報告目的,即需要解決什么業務問題,并明確報告匯報對象。250.決策樹特征(劃分)選擇的準則主要包括?A、信息增益B、信息準確率C、增益率D、基尼系數答案:ACD251.在數據分析挖掘平臺Woody的筆記本(Notebook)中,使用Markdown單元格可以實現哪些功能____A、定義目錄級別B、編輯超鏈接C、編輯LaTeX數學公式D、執行Python代碼答案:ABC解析:在數據分析挖掘平臺Woody的筆記本(Notebook)中,使用Markdown單元格可以實現定義目錄級別、編輯超鏈接、編輯LaTeX數學公式功能252.以下哪些是我國商業銀行債券投資的對象?A、國債B、地方政府債券C、金融債券D、企業債券和公司債券答案:ABCD解析:商業銀行債券投資的對象,與債券市場的發展密切相關。我國商業銀行債券投資的對象主要包括國債、地方政府債券、金融債券、中央銀行票據、資產支持證券、企業債券和公司債券等。253.在數據分析挖掘平臺Woody中,可以啟用哪些插件____A、目錄(TableofContents)B、標題折疊(CollapsibleHeadings)C、代碼折疊(Codefolding)D、高亮匹配(Highlightselectedword)答案:ABCD解析:在數據分析挖掘平臺Woody中,可以啟用目錄(TableofContents)、標題折疊(CollapsibleHeadings)、代碼折疊(Codefolding)、高亮匹配(Highlightselectedword)插件判斷題1.函數pd.merge()和pd.concat()合并DataFrame的規則是一樣的。A、正確B、錯誤答案:B解析:答案存疑2.Pandas用read_excel函數來讀取excel文件A、正確B、錯誤答案:A3.SQL語句,使用like進行模糊查詢時,select*fromtablewhereusernamelike‘%yue%’會導致全表掃描A、正確B、錯誤答案:A解析:由于yue前面用到了“%”,因此該查詢必然進行全表掃描,除非必要,否則盡量避免在關鍵詞前加“%”4.特征工程是機器學習流程中一個極其關鍵的環節,因為正確的特征可以減輕構建模型的難度,從而使機器學習流程輸出更高質量的結果。A、正確B、錯誤答案:A5.個人集市提供基礎數據、共性指標等數據服務,滿足個人客戶信息服務、個人客戶營銷管理、客戶數據分析挖掘等數據需求。A、正確B、錯誤答案:A解析:提供基礎數據、共性指標、共性分析模型等數據服務,滿足個人客戶信息服務、個人客戶營銷管理、客戶數據分析挖掘、營銷渠道分析、產品業務分析等數據需求。6.現階段,我行仍按照“集中為主,統分結合”的建設模式,持續完善“1+N”數據分析師隊伍。其中,1是指總行信息管理部數據分析師核心團隊。A、正確B、錯誤答案:A解析:“1+N”數據分析師隊伍。其中,1是指總行信息管理部數據分析師核心團隊,N是指總行各部門(除數據分析師核心團隊)、各分行數據分析師團隊。7.數據分析挖掘平臺放大鏡是一個查詢元數據的快捷入口。A、正確B、錯誤答案:A8.CMM是對公客戶數據區的上層應用。A、正確B、錯誤答案:A解析:本題考查對公集市下游系統。9.將未簽字后的申請憑證上傳,并點擊提交用戶申請,由總行管理員審批后可開通權限。A、正確B、錯誤答案:B10.select*fromtable_1whereusernamelike'yue%';會進行全表掃描。A、正確B、錯誤答案:B解析:select*fromtable_1whereusernamelike‘%yue%’關鍵詞%yue%,由于yue前面用到了“%”,因此該查詢必然進行全表掃描,除非必要,否則盡量避免在關鍵詞前加“%”11.統一指標庫不支持下發至分行進行本地化應用。A、正確B、錯誤答案:B12.衍生標簽指基于基礎標簽,按照一定的業務規則經過邏輯運算生成的數據標簽。A、正確B、錯誤答案:A13.個人集市構建全方位個人客戶統一視圖,滿足個人客戶信息服務、營銷管理等數據需求。A、正確B、錯誤答案:A解析:個人數據區即個人客戶數據集市(簡稱個人集市)是以個人客戶數據為基礎,目標是構建我行個人存款、貸款、理財及信用卡等全體個人客戶的產品、合約、交易、渠道、營銷、服務及行外數據的全方位個人客戶統一視圖,提供基礎數據、共性指標、共性分析模型等數據服務,滿足個人客戶信息服務、個人客戶營銷管理、客戶數據分析挖掘、營銷渠道分析、產品業務分析等數據需求。14.拉鏈表的起始日期startdate代表生效時點。A、正確B、錯誤答案:A15.數據主體,是指通過數據可以識別或者關聯的機構。A、正確B、錯誤答案:B解析:數據主體,是指通過數據可以識別或者關聯的組織和個人。16.數據分析挖掘平臺Woody項目中的項目管理員可以把其他用戶加入本項目。A、正確B、錯誤答案:A解析:數據分析挖掘平臺Woody項目中的項目管理員可以把其他用戶加入本項目。17.標簽庫構建了涵蓋自然、交易、行為、資產、產品合約、風險、負債、價值、營銷服務、社交商圈等十大一級主題的數據標簽體系。A、正確B、錯誤答案:A18.在決策引擎開展A/B實驗時,如果用戶開展了100%的單組營銷實驗,則無法判斷這個營銷組的營銷效果是否比其他組更好A、正確B、錯誤答案:A解析:本題考查A/B實驗基本知識,如果用戶開展了100%的單組營銷實驗,則因為沒有任何對照組,所以無法判斷這個單獨的營銷組,營銷效果是否比其他組更好、更顯著,因為沒有設置對照組。19.數據資產管理平臺是元數據的查詢服務系統。A、正確B、錯誤答案:A解析:數據資產管理平臺的系統定位。數據資產管理平臺系統是數據表結構、字典、數據中臺指標、數據中臺標簽等元數據的查詢服務系統20.指標編號是指標的唯一識別碼,在指標生命周期內不可更改,不可重復。A、正確B、錯誤答案:A解析:指標編號是指標的唯一識別碼,在指標生命周期內不可更改,不可重復。21.對于數組x,x[:5]是指獲取前5個元素。A、正確B、錯誤答案:A解析:本題考查NumPy數組函數22.在NumPy一維數組中通過中括號指定索引獲取第i個值。A、正確B、錯誤答案:A23.數據分析挖掘平臺由單點登錄系統驗證用戶信息。A、正確B、錯誤答案:A解析:數據分析挖掘平臺由單點登錄系統驗證用戶信息。24.我行數據集市采用范式建模的方式。A、正確B、錯誤答案:B解析:在公共數據集市建設過程中,經過了深入分析維度模型、范式模型的優缺點,借鑒了同業已建設的范式模型設計方式在實際應用中的情況,結合我行數據量、業務特色,制定了符合我行特色的維度建模和范式建模相結合的建模方式。25.管理決策類分析項目的工作成果一般是分析報告,為各級經營管理人員提供決策參考。A、正確B、錯誤答案:A解析:本題依據:案例--管理決策本章綜述。管理決策類分析項目的工作成果一般是分析報告,報告目的是為各級經營管理人員提供決策參考。26.數據資產管理平臺包括:大數據平臺和集市基礎數據資產;數據中臺指標、挖掘模型、挖掘特征、標簽等數據資產。A、正確B、錯誤答案:A解析:按照數據服務產品線設置,以能夠直接被用戶使用的大數據產品為核心管理對象,對應進行了視圖設計。包括:大數據平臺和集市基礎數據資產;數據中臺指標、挖掘模型、挖掘特征、標簽等數據資產。27.對于大數據平臺數據應用于系統建設的場景,涉及使用敏感數據的,無需征得任何業務管理部門的同意。A、正確B、錯誤答案:B解析:對于應用系統建設的數據應用場景,其中涉及使用敏感數據的,須征得源頭數據業務管理部門和大數據平臺業務管理部門的同意。28.決策樹是機器學習中一種用于分類的算法,不能用于回歸。A、正確B、錯誤答案:B解析:答案存疑29.關鍵敏感級和敏感級數據統稱為敏感數據。A、正確B、錯誤答案:A解析:本行將數據安全級別劃分為關鍵敏感級、敏感級、內部級、公開級四個級別。其中,關鍵敏感級和敏感級數據統稱為敏感數據。30.ROC曲線越靠近左上角性能越好。A、正確B、錯誤答案:A解析:ROC曲線越靠近左上角性能越好,左上角坐標為(0,1),即FPR=0,TPR=1,根據FPR和TPR公式可以得知,此時FN=0,FP=0,模型對所有樣本分類正確。31.分析報告編制是個不斷迭代完善的過程,需要結合數據情況、業務趨勢變化、工作建議等情況不斷迭代報告框架、數據分析、報告完善三個步驟,直至完成報告。A、正確B、錯誤答案:A解析:本題依據:案例--管理決策第一節“管理決策分析報告工作步驟”-迭代完善。報告初稿提交團隊討論,結合數據情況、業務趨勢變化、工作建議等情況不斷迭代報告框架、數據分析、報告完善三個步驟,直至基本定稿。32.在知識圖譜中,可以同時定義多種類型的節點以及它們之間的關系。A、正確B、錯誤答案:A解析:本題考查知識圖譜的概念。知識圖譜就是把所有不同種類的信息連接在一起而得到的一個關系網絡,可以包含多種類型的節點和多種類型的邊。33.可以通過Pandas的read_excel或read_csv函數將文件中的數據導入DataFrme,再通過魔術命令%df2db將數據導入數據庫A、正確B、錯誤答案:A解析:可以通過Pandas的read_excel或read_csv函數將文件中的數據導入DataFrme,再通過魔術命令%df2db將數據導入數據庫34.不能擅自向第三方提供數據,如有必要,需與第三方有真實業務關系,并且取得外部數據提供方及相關數據主體的明示同意。A、正確B、錯誤答案:A35.常見的區分度指標有KS和Gini系數A、正確B、錯誤答案:A解析:答案存疑36.內外聯合建模是指外部數據提供方利用他們的數據優勢、建模優勢,與行內業務部門合作,聯合開展數據分析建模,促進我行創新業務產品,優化業務模型。A、正確B、錯誤答案:A37.Q/ABC10845《產品編號》由六位編碼構成。A、正確B、錯誤答案:A38.信息管理部是主管業務數據的業務審批部門和數據分析項目的需求申請部門。A、正確B、錯誤答案:B解析:項目申請部門是主管業務數據的業務審批部門和數據分析項目的需求申請部門。39.通常而言,訓練集越多,得到的模型效果越好;測試集越多,得到的結論越可信。A、正確B、錯誤答案:A解析:答案存疑40.探索性數據分析簡單、易懂,很早就成為了數據分析的分析框架之一。A、正確B、錯誤答案:A41.決策引擎平臺不支持對已投放實驗的回收數據進行分析與可視化展示A、正確B、錯誤答案:B解析:本題考查決策引擎的數據回收與后評價管理,決策引擎平臺支持對已投放實驗的回收數據進行分析與可視化展示,利用后評價頁面的趨勢分析圖,平臺用戶能夠對于通過決策引擎發送、并已開展營銷推送的目標客群進行效果跟蹤評價。42.預測性數據挖掘包括分類、回歸及時間序列等。A、正確B、錯誤答案:A43.數據分析挖掘平臺用戶離職或變更的,原用戶申請部門應及時通知歸口管理部門注銷用戶。A、正確B、錯誤答案:A解析:用戶所屬機構負責對其轄內數據分析挖掘平臺用戶的操作行為和安全保密等進行監督與約束。平臺用戶離職或變更的,原用戶申請部門應及時通知歸口管理部門注銷用戶。44.稅務、公積金等分布在省市縣一級政府部門的數據,總行各條線應根據自身對外工作關系積極開展數據合作。A、正確B、錯誤答案:B45.業務部門可按需申請數據分析挖掘平臺的數據使用權限,并對其獲取數據的查詢、使用、下載、傳輸及銷毀等數據處理行為承擔安全保密責任。A、正確B、錯誤答案:A46.在選擇理財精準營銷模型時,由于前期產品剛上市,未積累購買產品的客戶樣本,可以先基于業務規則模型篩選潛在客戶,后期基于積累樣本使用機器學習模型,進一步篩選高潛力精準客群,提高營銷轉化率。A、正確B、錯誤答案:A47.分析報告框架要清晰,好的分析報告要架構清晰,主次分明,有基礎有層次,利于閱讀。A、正確B、錯誤答案:A48.在GBase中,AVG函數在計算時會默認忽略列值為NULL的行。A、正確B、錯誤答案:A49.數據分析挖掘平臺用戶可以將自己的賬號提供給他人使用。A、正確B、錯誤答案:B50.數據分析項目實施管理包括數據準
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 玩具市場趨勢預測與分析考核試卷
- 游戲虛擬現實技術與應用考核試卷
- 紡織鞋材防水透氣性能研究考核試卷
- 淀粉酶在淀粉加工中的應用考核試卷
- 篷布行業技術創新策略考核試卷
- 2025年中考歷史二模試卷(河南卷)含答案解析
- 2025授權財務合同書
- 2025年商用辦公室租賃合同范本
- 2025典當的借款合同
- 二零二五版房屋出租合同書范例租賃合同書
- 2025-2030車聯網行業市場發展分析及發展趨勢前景預測報告
- 2025年西班牙語DELE考試真題卷:西班牙語語音與發音訓練試題
- 2025河北地質大學招聘工作人員48人筆試備考題庫及答案解析
- 2025-2030醫用超聲儀器市場投資前景分析及供需格局研究研究報告
- 2025-2030兒童智能手表行業市場現狀供需分析及重點企業投資評估規劃分析研究報告
- 2025年03月四川天府新區“蓉漂人才薈”事業單位(13人)筆試歷年典型考題(歷年真題考點)解題思路附帶答案詳解
- 2025年高考物理壓軸題專項訓練:用力學三大觀點處理多過程運動問題(原卷版)
- 育種學 課件 第9章 林木抗逆性育種學習資料
- 2025年江蘇南通蘇北七市高三二模高考生物試卷(含答案詳解)
- 電氣自動化基礎知識
- 超爾星雅學習形勢與政策(2025春)課程作業參考答案
評論
0/150
提交評論