



付費下載
VIP免費下載
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
2023下醫學大數據分析與決策學習通超星期末考試章節答案2024年2.20某排球隊6名場上隊員的身高(單位:cm)是:180,184,188,190,192,194。現用一名身高為186cm的隊員換下場上身高192cm的隊員,與換人前相比,場上隊員的身高(
)
答案:平均數變小,方差變小2.18我國發現的首例甲型H1N1流感確診病例在某醫院隔離觀察,要掌握他在一周內的體溫是否穩定,則醫生需了解這位病人7天體溫的(
)
答案:方差2.17有一-組數據7、11、12、7、7、8、11,下列說法錯誤的是(
)
答案:中位數是72.16采用默認算法計算出的序列12,3,4,56,78,18,46,78,100的第一個四分位數是(
)
答案:122.15一組數據按從小到大排列為1,2,4,x,6,9,這組數據中的中位數為5,那么這組數據的眾數為(
)。
答案:62.13關于眾數,以下說法正確的是(
)
答案:眾數在一組數中會有好幾個2.12na.rm=TRUE,序列3.1,2,5,NA,6.2,4,7的中位數是(
)
答案:4.52.11序列3.1,2,5,3.8,6.2,4,7的中位數是(
)
答案:42.10以下不是數據離散趨勢度量的是(
)
答案:眾數2.9以下不是數據集中趨勢度量的是(
)
答案:方差2.6屬性對應二維表中的(
)。
答案:列2.5數據對象也稱實體,用(
)來描述。
答案:屬性2.4數據表中第1條記錄為“JohnDoe|john.doe@|123MainStreet”,第5條記錄為“JohnDoe|john.doe@|123MainSt.”,說明數據中存在(
)問題
答案:重復性2.3患者性別輸入時,有的輸入值為F、M,有的輸入值為0、1,這是典型的(
)問題。
答案:數據不一致2.2數據中存在“年齡=-100”的情況,這說明數據中存在(
)問題。
答案:噪聲2.1數據預處理占數據分析過程(
)工作量。
答案:60%以上1.20關于PIC數據庫,以下說法錯誤的是(
)。
答案:PIC數據庫注冊后就可免費下載。1.19以下不是組學大數據資源的是(
)
答案:MIMIC數據庫1.18app數據獲取方法,不正確的是(
)。
答案:通過SQL語句獲取1.17以下不是結構化大數據采集工具的是(
)
答案:飛機采集器1.16以下不屬于直接導出結構化數據的是(
)
答案:API程序接口1.15醫學倫理審查,免除審查的情況有(
)。
答案:使用公開獲取的數據庫且受試者的身份不會被直接或間接地識別1.14以下不屬于倫理審查方式的是(
)
答案:普通審查1.13個性化醫療的基礎是(
)。
答案:基于基因分析的精準用藥。1.12醫學大數據用于藥物研發,以下說法不正確的是(
)。
答案:利用藥品研發大數據,可以提高臨床診療質量。1.11對醫學大數據進行指導性分析,以下說法正確的是(
)。
答案:結合數據、分析模型和領域知識,確定最優解決方案。1.10對醫學大數據進行預測性分析,以下說法正確的是(
)。
答案:利用各種可變數據對疾病或健康狀況進行預測。1.9對醫學大數據進行診斷性分析,以下說法正確的是(
)。
答案:根據結果去分析產生結果的原因。1.8對醫學大數據進行描述性分析,以下說法正確的是()。
答案:可以分析患者使用的某種藥物以及治療的效果。1.7大數據分析與傳統統計分析的區別是(
)。
答案:大數據分析的數據質量不高,很多“臟”數據。1.6以下不是醫學大數據的特征的是(
)。
答案:變異性1.5大數據的value特性是指(
)。
答案:數據價值高,價值密度低;1.4大數據的5V特征是在傳統的4V特征上增加了(
)。
答案:Veracity真實性1.3醫學大數據的種類不包括以下哪項?(
)
答案:自動駕駛研發數據1.2最早提出“bigdata”的是(
)。
答案:BillInmon1.1通常所說的大數據的數據規模級別是(
)。
答案:PB級別/star3/origin/a8ae8eb350c60cc837724f6093ed73b5.jpg
答案:45度4.19
當特征值大致相等時(
)
答案:PCA將表現不佳4.18
R中實現lasso算法的包有(
)①lars包
②cv.lars包
③glmnet包
④cv.glmnet包
答案:①③4.17
特征選擇模型的評價方法有(
)①交叉驗證法
②CP統計量
③F統計量
④t統計量
答案:①②4.16關于lasso算法的描述,正確的是(
)①lasso算法是一種變量選擇技術
②lasso算法用于數據降維③lasso算法只適用于線性情況
④lasso算法只適用于非線性情況
答案:①②4.15
R中畫碎石圖的函數為(
)
答案:screenplot()4.14PCA中,主成分選擇的方法有(
)①計算累計貢獻率,達到85%以上為主成分
②畫碎石圖,從圖中找出主成分③計算貢獻率,達到85%以上為主成分
④畫相關系數圖,從圖中找出主成分
答案:①②4.13PCA中,相關系數矩陣的特征值和特征向量,以下說法正確的是(
)
答案:eigen()函數用于求矩陣的特征值和特征向量4.12以下關于相關系數矩陣和協方差矩陣的描述,正確的是(
)
答案:標準化后的矩陣,其相關系數矩陣和協方差矩陣是相同的4.11R中實現主成分分析的函數為(
)
答案:princomp()4.8以下關于主成分分析PCA的說法,正確的是(
)①進行主成分分析之前要對數據進行中心化
②要選出方差最大的作為主成分③要選出方差最小的作為主成分
④主成分分析主要用于指標綜合評價
答案:①②④4.5數據降維的應用包括(
)①監督學習中訓練數據的降維
②圖像處理中的特征降維③生物技術中致病基因的發現
④監督學習中測試數據的降維
答案:①②③4.4數據降維的意義包括(
)①便于計算
②便于可視化
③提取有效信息
④防止過擬合
答案:①②③④4.3數據降維的本質是學習一個映射函數,該映射函數(
)
答案:可以是線性的或非線性的4.1有關維的概念,以下說法正確的是(
)①維通常被稱作字段或屬性
②維通常被稱作特征
③維通常被稱作列④維通常被稱作變量
⑤維通常被稱作記錄
⑥維通常被稱作對象⑦維通常被稱作行
⑧維通常被稱作樣本
答案:①②③④3.20在畫兩個變量的散點圖時,下列哪個敘述是正確的(
)
答案:自變量在x軸上,因變量在y軸上3.19在回歸分析中,代表了數據點和它在回歸直線上相對應的差異的是(
)
答案:殘差平方和3.18兩個變量y與x的回歸模型中,分別選擇了4個不同模型,它們的決定系數R2如下,其中擬合效果最好的模型是(
)
答案:模型1的決定系數R2為0.983.17兩個變量y與x的回歸模型中,通常用R2來刻畫回歸的效果,則正確的敘述是(
)
答案:R2越小,殘差平方和大3.16一位母親記錄了兒子3-9歲的身高,由此建立的身高與年齡的回歸直線方程為y=7.19X+73.93,據此可以預測這個孩子10歲時的身高,則正確的敘述是(
)
答案:身高在145.83cm左右3.14對于以下回歸分析的結論,正確的有(
)個(1)在回歸分析中,可用決定系數R2的值判斷模型的擬合效果,R2越大,模型的擬合效果越好;(2)在回歸分析中,可用殘差平方和判斷模型的擬合效果,殘差平方和越大,模型的擬合效果越好;(3)在回歸分析中,可用相關系數的值判斷模型的擬合效果,r越小,模型的擬合效果越好;(4)在回歸分析中,可用殘差圖判斷模型的擬合效果,殘差點比較均勻地落在水平的帶狀區域中,說明這樣的模型比較合適,帶狀區域的寬度越窄,說明模型的擬合精度越高;
答案:23.13下列說法中正確的是(
)
答案:人的知識與其年齡具有相關關系3.12
對兩個變量x,y進行線性回歸分析時,回歸步驟順序正確的是(
)①對所求出的回歸直線方程作出解釋②收集數據(X,Y)③求線性回歸方程④求未知參數⑤根據所收集的數據繪制散點圖
答案:②⑤④③①3.11非線性回歸的方法有(
)
答案:以上都是3.10
R語言中自動選擇最優回歸模型的函數是(
)
答案:step()3.9關于校正決定系數,以下說法錯誤的是(
)
答案:校正決定系數越大,模型越差3.6
以下關于決定系數的描述,正確的是(
)
答案:決定系數越大,回歸模型的擬合效果越好3.5
以下不是線性回歸的假設檢驗內容的是(
)
答案:差分檢驗/star3/origin/3d908a58872f3564e7f524c1c0d8f356.png
答案:截距3.2因變量為二分類變量時,選擇(
)。
答案:logistic回歸3.1關于回歸,以下說法,不正確的是(
)
答案:回歸用于描述變量間的確定性關系5.19
R中實現apriori算法需要用到(
)
答案:arules包5.18
(
)描述了關聯規則的最低重要程度
答案:最小支持度5.17
Apriori算法結束的條件是(
)
答案:候選k-項集為空5.16
FP-growth算法主要步驟有(
)①構建FP樹
②產生頻繁項集候選集③從FP樹中挖掘頻繁項集
④對頻繁項集進行剪枝
答案:①③5.15
關于A=>B關聯規則提升度lift,以下說法正確的是(
)
答案:如果lift>1,則A、B的出現是正相關的5.14
FP-Growth算法和Apriori算法最大的不同是(
)
答案:FP-Growth算法不產生候選集5.13
Apriori算法中k項頻繁項集連接的條件是(
)
答案:前k-1項相同,第k項不同5.12
Apriori算法產生k項頻繁項集候選集的方法是(
)
答案:將k-1項頻繁項集進行連接操作5.11
A=>B為強關聯規則的條件是(
)
答案:關聯規則的支持度大于等于最小支持度并且關聯規則的置信度大于等于最小置信度5.9
以下關于關聯規則(A=>B)支持度的描述,錯誤的是(
)
答案:支持度是指事務集中同時包含A和B的事務數與所有包含A的事務數之比5.8
數據庫是(
)的集合。
答案:事務5.6
上題中,若將支持度改為3,則購物籃能夠提取的頻繁1-項集包括的項目為(
)
答案:牛奶,尿布5.5
設支持度為2,下面購物籃能夠提取的頻繁1-項集包括的項目為(
)ID購買項1牛奶,啤酒,尿布2面包,黃油,牛奶3牛奶,尿布,餅干4啤酒,餅干,尿布
答案:牛奶,啤酒,尿布,餅干5.4考慮下面的頻繁3-項集的集合:{1,2,3},{1,2,4},{1,3,4},{1,3,5},{2,3,4},{2,3,5},采用連接策略,產生候選4-項集不包含(
)
答案:{1,2,3,5}5.3設X={1,2,3}是頻繁項集,則可由X產生(
)個關聯規則。
答案:65.2Apriori算法的計算復雜度受(
)影響。
答案:ABC三項的影響5.1
某超市研究銷售紀錄數據后發現,買啤酒的人很大概率也會購買尿布,這種屬于數據挖掘的(
)問題
答案:關聯規則發現7.20
貝葉斯分類所使用的包為(
)
答案:e10717.19
應用樸素貝葉斯進行分類的條件是(
)
答案:被分類對象各屬性間相互獨立7.18
關于集成學習,以下說法不正確的是(
)
答案:決策樹集成一定能提升性能7.17
CART算法選擇(
)的屬性作為分裂屬性
答案:Gini指數最小7.16
C4.5算法選擇(
)的屬性作為分裂屬性
答案:信息增益率最大7.15
ID3算法選擇(
)的屬性作為分裂屬性
答案:信息增益最大7.14
ID3算法的主要步驟包括構建決策樹、剪枝和預測,其對應的函數分別為(
)
答案:rpart()、prune()、predict()7.13
R中rpart.plot包提供的功能有(
)
答案:決策樹的可視化7.12
以下防止決策樹過擬合的方法是(
)
答案:剪枝7.11
一棵含2個決策節點,5個葉子節點的決策樹,能生成(
)個分類規則
答案:57.10信息熵越大,表示(
)
答案:信息越不確定7.9
二分類問題中,如果所有數據均屬于同一類時,則信息熵為(
)
答案:07.8
二分類問題中,如果兩類中數據記錄個數相同,則信息熵為(
)
答案:17.7
(
)用來衡量信息量的大小
答案:信息熵7.6
以下不是基于信息論的決策樹算法的是(
)
答案:CART算法7.5
決策樹中間節點的特征是(
)
答案:有進邊,有出邊,進邊一條,出邊多條7.2分類模型準確率的定義為(
)
答案:正確被模型分類的測試樣本與總的測試樣本的百分比7.1
應用分類算法的步驟為(
)①使用類別未知的訓練集創建模型
②使用類別已經確定的訓練集創建模型③用創建的模型預測未來
④計算模型準確率
答案:②④③9.20
k-中心點聚類算法的時間復雜度為(
)(n為樣本數)
答案:0(n2)9.19
K-means算法的不足之處不包括以下(
)項
答案:計算開銷比k中心點算法大9.18
對含n個樣本的數據集進行K均值聚類,則該聚類算法的時間復雜度為(
)
答案:0(n)9.17
能終止K均值聚類過程的有(
)
答案:以上都對9.16
以下不是類間距離度量方法的是(
)
答案:平均值點距離9.15
R中實現距離度量的函數為(
)
答案:dist()9.13
當不知道數據所屬類別時,可以使用(
)技術促使類別相同的數據與其他類別的數據相分離。
答案:聚類9.11
下列算法中,不屬于層次聚類算法的是(
)
答案:SVM算法9.10
下列算法中,不屬于劃分聚類算法的是(
)
答案:決策樹算法9.9
下列不屬于常用聚類方法的是(
)
答案:線性方法9.8
下列選項中說法不正確的是(
)
答案:聚類需要有類別確定的分類屬性9.7
下列度量方式中,不屬于距離度量的是(
)
答案:海明距離9.6
機器學習方式有多種,聚類屬于(
)
答案:無監督學習/ananas/latex/p/5789291
答案:歐幾里德距離/ananas/latex/p/5789291
答案:曼哈頓距離9.3
相異度矩陣的元素aij表示(
)
答案:第i個對象和第j個對象之間的距離9.2
包含n個對象p個屬性的數據矩陣,其相異度矩陣為(
)的矩陣
答案:n行n列9.1
一個好的聚類結果,應該是(
)
答案:組內數據對象高度似度,組間數據對象不相似11.10
對文本進行分析處理,一般需要對語料庫創立(
)
答案:詞條-文檔關系矩陣11.9
以下關于語料庫的描述,錯誤的是(
)
答案:語料庫都保存在外存中11.8
文本特征提取的步驟是(
)①提取關鍵詞集
②計算詞頻TF
③計算逆文檔頻率IDF④計算詞的權重
⑤提取特征
答案:①②③④⑤11.7
對change,changing,changes,changer,changed進行詞形還原后的結果為(
)
答案:change11.6
對change,changing,changes,changer,changed進行詞干提取后的結果為(
)
答案:chang11.5
關于英文數據分析中的標準化,以下說法錯誤的是(
)
答案:標準化就是將所有文本減去其平均值再除以其標準差11.3
常用的分詞工具包有(
)
答案:jiebaR11.2
文本分析的一般流程為(
)①讀取文本
②標準
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025中小企業貸款合同
- 2025橋梁建設工程機械租賃合同樣本
- 廣東省惠州市2024-2025學年高二下冊3月月考數學試卷(B卷)附解析
- 神秘傳承的傳承者基礎知識點歸納
- 產業落定可行性研究報告
- 南陽理工學院招聘筆試真題2024
- 石大學前兒童保育學課件2-4抓住生長發育的關期科學育兒
- 造紙與印刷企業經營管理方案
- 高校與行業企業協同創新的管理機制
- 2025至2030年中國玻璃茶幾彎鋼爐行業投資前景及策略咨詢報告
- 礦山作業考試試題及答案
- 湖南省全科助理醫師規培考試試題
- 酒店禁毒工作管理制度
- 食品運輸交付管理制度
- 中國電建集團華東勘測設計研究院限公司誠聘89人易考易錯模擬試題(共500題)試卷后附參考答案
- 白內障培訓課件
- 二級計量師考試歷年真題題庫和答案2024
- 法制教育考試試題及答案
- 工程驗收單模板
- 2023年安寧市城鄉小學教師選調考試真題及答案
- 年產xxx水泥粉助磨劑項目實施方案(項目申請參考)
評論
0/150
提交評論