多元分析復習題及答案_第1頁
多元分析復習題及答案_第2頁
多元分析復習題及答案_第3頁
多元分析復習題及答案_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1. 什么是單變量(一元)分析?什么是多元分析?對多變量資料為什么不能用一元分析代替多元分析?答案:應變量(因變量/反應變量)即分析指標僅一個時:稱一元分析或單變量分析。應變量(因變量/反應變量)即分析指標有多個時:稱多元分析/多變量分析。u 對多變量資料分別進行單變量分析,可能導致 增大犯第類錯誤的概率 當單變量分析結果不一致時,很難得到一個綜合的結論 忽略變量間的相互關系。u 因此,多元分析與一元分析在使用時是相輔相成的。u 多元統計分析具有概括和全面考慮的綜合能力和特點u 一元分析(單指標) 容易分析各指標各組間的關系和差異u 兩種結合起來所得結論更豐富2.某研究者對當地40歲以上人群進

2、行調查,收集性別、ECG、年齡與患冠狀動脈疾病數據,并進行回歸分析,數據的編碼及SPSS軟件分析結果如下,寫出回歸模型的一般形式,并解釋各回歸系數(結合or值)。因素賦值說明性別1=男性,0=女性ECG1= ST段壓低<0.1mV,2= ST段壓低范圍在0.10.2mV3= ST段壓低范圍0.2mV年齡(歲)冠狀動脈疾病Y是=1 否=0SPSS軟件分析結果因素回歸系數標準誤Wald 卡方P值OR值常數項-20.2074.56218.6660.000性別 0.2630.636 0.1710.6790.072ECG 1.6340.682 5.7440.0175.124年齡 0.0850.03

3、6 5.5210.0191.089答案:=-20.207+0.263性別+1.634EGG+0.085年齡根據spss軟件結果可知,影響冠狀動脈疾病患病的因素有ECG和年齡;偏回歸系數解釋實際是對OR的解釋:ECG的OR值為5.124,即ECG每增加一個等級,患冠狀動脈疾病的風險增加4.124倍(5.124-1)并且ECG的影響大于年齡的影響;年齡OR值1.089,年齡增大一歲患冠狀動脈疾病的風險是原來的1.089倍。3、測定n例糖尿病人的血糖(Y,mmol/L),胰島素 (X1,mu/L)以及生長素(X2, g/L)的數值,均為定量資料。并建立了血糖對于胰島素及生長素的多重線性回歸方程,X1

4、 +0.0977X2. 假定 經過檢驗方程有意義,且兩個偏回歸系數都有統計學意義,請回答:1)多重線性回歸對應變量和自變量有哪些要求?答案:Y(應變量)變量服從正態分布的連續性隨機變量;自變量x大多數應為連續性變量,可以有少部分的分類變量(兩分類、無序多分類和有許多分類)2)請解釋兩個偏回歸系數的含義。b1 為-0.4059,在其他自變量(生長素不變)不變的情況下,胰島素每增加1 mu/L,血糖下降0.4059 mmol/L。b1 為0.0977,在其他自變量(胰島素水平不變)不變的情況下,生長素每增加1g/L,血糖增加0.0977 mmol/L。3)若評價此多重線性回歸方程優劣程度應選取什么

5、指標?剩余標準差或調整決定系數。4. 為研究惡性腸道梗阻住院患者生存時間的影響因素,在1995年至2000年間,收集了三所醫院95例住院患者的資料,各變量的賦值說明見表16-3。表16-3 95例惡性腸道梗阻住院患者資料各變量賦值說明變量說明賦值ID編號time生存時間(天)status生存狀態0=刪失,1=死亡group支架類型1=金屬支架,2=塑料內涵管gender性別1=男,2=女complica并發癥0=無,1=有obstruct梗阻段1=上段,2=中段,3=下段stage分期1=期,2=期,3=期,4=期size腫瘤體積(cm3)duration住院天數 表16-10 Cox回歸分析

6、參數估計及假設檢驗結果變量偏回歸系數標準誤WaldP值OR值OR值95%置信區間下限上限group1.1550.4327.1510.0073.1751.3617.403gender0.0230.4210.0030.9570.9780.4292.230duration0.0120.0073.4060.0651.0120.9991.026complica0.2340.38603670.5451.2630.5932.689obstruct0.3270.1773.3960.0650.7210.5091.021size0.0180.0069.4890.0021.0191.0071.031stage0.7

7、550.2449.5720.0022.1291.3193.4351)對生存狀況有影響的自變量有哪些?答案:group,size,stage2) 哪些是保護因素,哪些是危險因素?答案:size為保護因素,group、stage危險因素。3)如何解釋有意義自變量的影響程度?(此解釋與前述第二題解釋相似。)5.生存資料的特點、生存分析的目的。 蘊涵有結局和時間兩個方面的信息; 結局為兩分類互斥事件; 一般是通過隨訪收集得到,隨訪觀察往往是從某統一時間點(如確診、入院或實施手術等某種處理措施后)開始,觀察到某規定時間點截止; 常因失訪等原因造成某些研究對象的生存時間數據不完整;數據分完全數據和刪失數據

8、。 生存時間不服從正態分布,需用生存分析 描述生存過程 比較生存過程 生存過程的影響因素分析6.主成分分析與因子分析有何異同?1.區別: (1) 研究目的不同主成分分析,降維和消除多重共線性;因子分析:尋找內在結構,解釋事物間的關聯。(2) 應用條件不同:因子分析的條件更嚴格,樣本量足夠大,變量間存在相關性(Bratletts 球形檢驗P<0.05) ;KMO統計量>0.7左右。(3) 模型不同 主成分分析:主成分為原變量的線性組合;因子分析模型:原變量為主因子和特殊因子的線性組合聯系:因子分析采用主成分法,不進行因子旋轉的分析結果與主成分分析結果一致。7.聚類分析和判別分析有什么

9、異同點?聚類分析可以對樣品進行分類,也可以對指標進行分類;判別分析只能對樣品進行分類聚類分析事先不知道事物的類別,也不知道應該分幾類;判別分析必須事先知道事物的類別,也知道分幾類聚類分析不需要分類的歷史資料,能直接對樣品進行分類;判別分析需要分類歷史資料(訓練樣品)去建立判別函數,然后才對樣品進行分類。8. 簡述簡單相關、復相關、偏相關以及典型相關分析有何區別?簡單相關:兩個連續型定量變量相關分析,說明相關關系的方向和密切程度;復相關分析:說明一個定量變量與另一組定量變量間的相互關系;偏相關:扣除其他變量的影響,分析兩個定量變量間的相關關系;典型相關分析:一組定量變量和另一組定量變量間的相互關系。9.什么是多重共線性?如何識別?當發生共線性如何處理?答案:自變量之間存在著較強的線性關系,此現象稱為自變量間的多重共線性(collinearity)。識別:Ø1)回歸系數的符號與由專業知識不符Ø 2)變量的重要性與專業不符Ø 3)整個方程有意義或決定系數R2高,但各自變量對應回歸系數均沒有統計學意義

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論