




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、中醫藥統計學與軟件應用中醫藥統計學與軟件應用 曹治清曹治清成都中醫藥大學管理學院成都中醫藥大學管理學院 數學與統計教研室數學與統計教研室 2第第10講講 非參數檢驗非參數檢驗 o概述概述o多重線性回歸的應用以及注意事項多重線性回歸的應用以及注意事項o多重線性回歸的電腦實驗多重線性回歸的電腦實驗3第第11講講 多重線性回歸多重線性回歸引言引言o在醫藥研究中,應變量的變化往往受到多個因素的影響,此時就需要用多重線性回歸(Multiple Linear Regression),多重線性回歸是直線回歸的擴展。例如,人的體重與身高、胸圍有關;人的心率與年齡、體重、肺活量有關。因此,采用兩個或多個影響因素
2、作為自變量(Xi)來解釋應變量(Y)的變化,建立最優組合模型來預測或估計因變量,比只用一個自變量進行預測或估計更有效,更符合實際。4第一節第一節 多重線性回歸多重線性回歸 一、一、多重線性回歸模型多重線性回歸模型 Y01X12X2mXme 二、多二、多重重線性回歸的基本條件線性回歸的基本條件 o多重線性回歸模型的應用條件同直線回歸,即線性多重線性回歸模型的應用條件同直線回歸,即線性(linearitylinearity)、獨立性()、獨立性(indepen-dencyindepen-dency)、正態性和方差)、正態性和方差齊性(齊性(normal distribution and equal
3、 variancenormal distribution and equal variance)等條件,)等條件,簡記簡記LINELINE。還要注意個自變量間不能存在多重共線性。還要注意個自變量間不能存在多重共線性。mmXbXbXbbY.221105三、多重線性回歸分析的步驟6四、多重共線性問題四、多重共線性問題 如果一些自變量之間存在較強的線性關系,稱如果一些自變量之間存在較強的線性關系,稱多重共線性。判斷多重共線有相關系數、容忍度、多重共線性。判斷多重共線有相關系數、容忍度、方差膨脹因子等指標。方差膨脹因子等指標。 一般來說,相關系數一般來說,相關系數r0.8的變量可能存在共線的變量可能存
4、在共線問題,問題,r0.9的變量存在共線。的變量存在共線。 容忍度容忍度=1R2,愈小說明共線問題愈嚴重,如,愈小說明共線問題愈嚴重,如果某個自變量的容忍度果某個自變量的容忍度0.1,共線問題嚴重。,共線問題嚴重。 方差膨脹因子方差膨脹因子 = 容忍度的倒數,愈大說明共線容忍度的倒數,愈大說明共線問題愈嚴重。問題愈嚴重。 消除多重共線性的方法有多種,如嶺回歸、主消除多重共線性的方法有多種,如嶺回歸、主成分回歸等。成分回歸等。7五、多重回歸的樣本含量五、多重回歸的樣本含量 只要例數只要例數n多于自變量個數多于自變量個數m即可,一般要求即可,一般要求n為為m的的5倍以上。倍以上。 六、多重回歸的檢
5、驗六、多重回歸的檢驗 多元線性回歸方程的假設檢驗:對整個方程多元線性回歸方程的假設檢驗:對整個方程的綜合檢驗,即對回歸方程的線性假設檢驗;對的綜合檢驗,即對回歸方程的線性假設檢驗;對每一個自變量的檢驗,即對每個偏回歸系數的假設每一個自變量的檢驗,即對每個偏回歸系數的假設檢驗。檢驗。 8 回歸方程的方差分析回歸方程的方差分析剩回剩回剩回SSmSSmnmnSSmSSMSMSF) 1() 1/(/112mnSSsmY剩剩余標準差剩余標準差 剩余標準差的平方是殘差的方差,又稱均方誤剩余標準差的平方是殘差的方差,又稱均方誤差,記為差,記為MSE,其值越小越好,其值越小越好 (2) 偏回歸系數的假設檢驗偏
6、回歸系數的假設檢驗 分別考察每一個自變量分別考察每一個自變量 xi 與應變量與應變量 Y 是否都有是否都有直線回歸關系直線回歸關系 9R2SS回回 /SS總總 校正決定系數是衡量方校正決定系數是衡量方程好壞的常用指標之一程好壞的常用指標之一 總剩MSMSRad12YYiiiillbb/七、決定系數七、決定系數八、標準化偏回歸系數八、標準化偏回歸系數 10九、殘差分析九、殘差分析 1112o資料不滿足其條件時,常用的處理方法有:修改模型或者采用曲線擬合;變量變換,常用的變量變換有對數變換、平方根變換、倒數變換等。變量變換對自變量或(和)應變量均適宜;如果方差不齊,可采用加權最小二乘法估計偏回歸系
7、數。 13 (1)分析因素的相對重要性,找出對因變量最)分析因素的相對重要性,找出對因變量最大的關鍵因素。大的關鍵因素。 (2)同時調整多個混雜因素的作用(類似多元)同時調整多個混雜因素的作用(類似多元協方差分析調整多個混雜因素的作用)。協方差分析調整多個混雜因素的作用)。 (3)估計與預測,用較易測量的多個自變量來)估計與預測,用較易測量的多個自變量來估計難以測得應變量總體均數估計難以測得應變量總體均數Y或預測個體或預測個體Y值。值。 (4)多重回歸分析是進一步學習)多重回歸分析是進一步學習logistic回歸、回歸、判別分析、判別分析、 主成分分析、主成分分析、 因子分析等多元統計分析因子
8、分析等多元統計分析方法的基礎。方法的基礎。 十一、十一、篩篩選自變量方法選自變量方法十、多元回歸分析的應用十、多元回歸分析的應用 14 (1)全局擇優法:)全局擇優法:m 個自變量的不同組合共有個自變量的不同組合共有 2m-1 種,分別建立回歸方程進行比較后擇優。擇優種,分別建立回歸方程進行比較后擇優。擇優的準則有多種,準則不同,的準則有多種,準則不同,篩篩選的結果可能不同。選的結果可能不同。如果用最大校正決定系數準則,則挑選校正決定系如果用最大校正決定系數準則,則挑選校正決定系數數R2a最大者來獲得最大者來獲得“最優子集最優子集”的回歸方程。的回歸方程。SPSS為為Enter法。法。 (2)
9、逐步逐步選擇選擇法法: 備選自變量較多時,全局擇備選自變量較多時,全局擇優的計算量非常大,優的計算量非常大, 用用逐步逐步回歸回歸法法選擇可減少計算選擇可減少計算量。常用逐步(量。常用逐步(Stepwise)、向前()、向前(Forward)、向)、向后(后(Backward)法。向后法考慮了自變量的組合作)法。向后法考慮了自變量的組合作用,但變量數不能太多。用,但變量數不能太多。3種逐步回歸方法選中的自種逐步回歸方法選中的自變量不一定相同。變量不一定相同。 逐步回歸得到只是局部最優逐步回歸得到只是局部最優,不,不一定是全局最優回歸方程。一定是全局最優回歸方程。 15 將自變量的交互項引入方程
10、進行檢驗分析。將自變量的交互項引入方程進行檢驗分析。 十二、自變量間交互作用的分析十二、自變量間交互作用的分析 【例例17-1】 大白鼠作受試對象,分析烏頭堿不大白鼠作受試對象,分析烏頭堿不同注射速度同注射速度x1、常咯啉的不同劑量、常咯啉的不同劑量x2,大鼠體重,大鼠體重 x3與應變量延緩心律失常發生的時間與應變量延緩心律失常發生的時間Y的關系。的關系。編編號號123456789101112131415X14.85.67.14.92.66.65.25.54.76.85.42.94.03.13.1X20.080.070.010.070.110.110.070.110.030.010.020.2
11、10.010.110.10X3230260252229220247233222206244222226234212212Y19.115.714.919.020.917.519.221.820.514.518.623.216.822.721.916 【SPSS操作操作】 以以X1、X2、X3、Y為變量名建立數據文件為變量名建立數據文件L17-1.SAV。 Data ViewVariable View17AnalyzeRegressionLinear.Y選選Dependent框、框、X1、X2、X3選選Independent框框。 Method框選框選Stepwise。18Model Summar
12、yModel Summary.820a.673.6481.6533.986b.972.968.5019Model12RR SquareAdjustedR SquareStd. Error ofthe EstimatePredictors: (Constant), 大鼠體重a. Predictors: (Constant), 大鼠體重, 常咯啉劑量b. 校正決校正決定系數定系數R2a= 0.968,擬,擬合效果好。合效果好。 A AN NO OV VA Ac c73.041173.04126.720.000a35.536132.734108.57714105.555252.777209.539.
13、000b3.02212.252108.57714RegressionResidualTotalRegressionResidualTotalModel12Sum ofSquaresdfMean SquareFSig.Predictors: (Constant), 大鼠體重a. Predictors: (Constant), 大鼠體重, 常咯啉劑量b. Dependent Variable: 延緩心律失常時間c. 第第2步回歸的步回歸的F=209.539,P=0.000,故,故線性回歸模線性回歸模型有統計學型有統計學意義。意義。19C Co oe ef ff fi ic ci ie en nt
14、ts sa a52.9736.5698.064.00038.78167.165-.147.029-.820-5.169.000-.209-.0861.0001.00045.1102.11121.371.00040.51049.709-.123.009-.682-13.729.000-.142-.103.9401.06428.8442.539.56411.362.00023.31234.375.9401.064(Constant)大鼠體重(Constant)大鼠體重常咯啉劑量Model12BStd. ErrorUnstandardizedCoefficientsBetaStandardizedC
15、oefficientstSig.Lower BoundUpper Bound95% Confidence Interval for BToleranceVIFCollinearity StatisticsDependent Variable: 延緩心律失常時間a. 共線性診斷大鼠體重和常咯啉劑量的容忍度都為共線性診斷大鼠體重和常咯啉劑量的容忍度都為0.940, 方差膨脹因子都為方差膨脹因子都為1.064, 可認為不存在共線可認為不存在共線問題。建立線性回歸方程為問題。建立線性回歸方程為 Y=45.110+28.844常咯啉劑量常咯啉劑量0.123大鼠體重大鼠體重 大鼠體重、常咯啉劑量的標準回歸
16、系數分別為大鼠體重、常咯啉劑量的標準回歸系數分別為 -0.682、0.564。可見對延緩心律失常時間影響的重。可見對延緩心律失常時間影響的重要性大鼠體重大于常咯啉劑量。要性大鼠體重大于常咯啉劑量。 20因主要考察因素因主要考察因素x1未進入方程,分析未進入方程,分析自變量間的交互作自變量間的交互作用,用, Transform Compute,計算,計算X12、X13、X23。將將X1,*,X2送送Numeric Expression,X12送送Target Variable21Transform Compute,計算,計算X12、X13、X23。22用原變量連用原變量連同交互作用同交互作用變量
17、建立回變量建立回歸方程歸方程: X12、X13、X23送送IndependentMethod選選EnterOK233個變量個變量3個交互作用變量共個交互作用變量共6個自變量,不同組合個自變量,不同組合有有26-1=63種,種,Method框選框選Ente,建立的,建立的63個回歸方個回歸方程中,程中,R2a= 0.980最大最大M Mo od de el l S Su um mm ma ar ry y.990a.980.964.5274Model1RR SquareAdjusted RSquareStd. Error ofthe EstimatePredictors: (Constant),
18、X23, 大鼠體重, 烏頭堿注射速度, X12, X13, 常咯啉劑量a. A AN NO OV VA Ab b106.352617.72563.724.000a2.2258.278108.57714RegressionResidualTotalModel1Sum ofSquaresdfMean SquareFSig.Predictors: (Constant), X23, 大鼠體重, 烏頭堿注射速度, X12, X13, 常咯啉劑量a. Dependent Variable: 延緩心律失常時間b. 方差分析方差分析F值值63.724,方程有統計學意義方程有統計學意義24C Co oe ef
19、ff fi ic ci ie en nt ts sa a28.79314.7151.957.0861.7952.373.928.756.471130.89177.3942.5611.691.129-.048.065-.266-.740.4803.1882.353.2421.355.212-.009.010-1.207-.848.421-.502.358-2.213-1.400.199(Constant)烏頭堿注射速度常咯啉劑量大鼠體重X12X13X23Model1BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientst
20、Sig.Dependent Variable: 延緩心律失常時間a. 最優方程:最優方程:Y=28.793+1.795x1+130.891x2-0.048x3+3.188 x12-0.009 x13-0.502x23。x2標化系數標化系數=2.561 最大,常咯啉劑量對延緩心律失常發生時間最大,常咯啉劑量對延緩心律失常發生時間作用最大。作用最大。x23標化偏回歸系數標化偏回歸系數=-2.213絕對值第二大絕對值第二大,常咯啉劑量與大鼠體重的交互效應對延緩心律失,常咯啉劑量與大鼠體重的交互效應對延緩心律失常發生時間產生負面影響不可勿視。常發生時間產生負面影響不可勿視。25 (1)二分類自變量二分
21、類自變量常采用常采用0、1賦值賦值方法。如,方法。如,用用X代表性別:代表性別:X=0為女,為女,X=1為男,或者用為男,或者用X=1為為女,女,X=0為男。為男。 十三、分類變量賦值方法十三、分類變量賦值方法 (2)指標為無序)指標為無序 k類,類,定義定義k-1個二分類啞變量個二分類啞變量。例。例如,如, 中醫治崩漏,分腎虛、中醫治崩漏,分腎虛、肝虛、肝郁、血虛肝虛、肝郁、血虛4型,只型,只要用要用 3 個個二分類變量二分類變量X1,X2,X3就能標記這就能標記這4個類別。個類別。 崩漏分型崩漏分型X1X2X3腎腎虛型虛型100肝虛型肝虛型010肝郁型肝郁型001血虛型血虛型00026,
22、其它腎虛型011X其它肝虛型012X其它肝郁型013X(3)有序分類變量數量化方法:)有序分類變量數量化方法:對等級根據級對等級根據級別別大小進行量化大小進行量化后按連續變量處理后按連續變量處理。例如,用。例如,用X1,2,3分別為表示病情分別為表示病情輕輕,中中,重重。用無序多分用無序多分類變量設置類變量設置啞啞變量的方法變量的方法。采用哪種方法更好要視。采用哪種方法更好要視具體情況而定。具體情況而定。 第二節第二節 多元相關分析多元相關分析 一、多元相關分析的統計量一、多元相關分析的統計量 271. 簡單相關系數簡單相關系數 rij,簡記為,簡記為r 2. 偏相關系數偏相關系數偏相關系數偏
23、相關系數rij表示其他變量固定不變條件下,變表示其他變量固定不變條件下,變量量Xi與與Xj之間相關程度與方向的真實情況之間相關程度與方向的真實情況 3. 復相關系數復相關系數復相關系數復相關系數R是多個自變量共同對因變量直線相關是多個自變量共同對因變量直線相關程度的統計指標,是相關與回歸聯系起來的統計量程度的統計指標,是相關與回歸聯系起來的統計量 28二、多元相關的假設檢驗二、多元相關的假設檢驗 【例例17-2】 用表用表17-1資料計算烏頭堿注射速度資料計算烏頭堿注射速度x1、常咯啉劑量常咯啉劑量x2、大鼠體重、大鼠體重x3對延緩心律失常發生時對延緩心律失常發生時間間Y的影響的影響4個變量的
24、簡單相關系數、偏相關系數,個變量的簡單相關系數、偏相關系數,并作假設檢驗。并作假設檢驗。 【SPSS操作操作】文件文件L17-1.sav Analyze CorrelatePartial,29x1、Y選入選入Variables框,框,x2、x3選入選入Controlling for框框,Options, 選選 Zero-order correlations,Continue,OK。30CorrelationsCorrelations1.000-.779-.555.684.001.032.0050131313-.7791.000.731-.820.001.002.0001301313-.555.
25、7311.000-.245.032.002.3791313013.684-.820-.2451.000.005.000.379.13131301.000.010.975011.0101.000.975.110CorrelationSignificance (2-tailed)dfCorrelationSignificance (2-tailed)dfCorrelationSignificance (2-tailed)dfCorrelationSignificance (2-tailed)dfCorrelationSignificance (2-tailed)dfCorrelationSignificance (2-tailed)df烏頭堿注射速度延緩心律失常時間常咯啉劑量大鼠體重烏頭堿注射速度延緩心律失常時間Control Variables-none-a常咯啉劑
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年小微企業創業扶持資金申請申報指南與政策解讀報告
- 2025年生物制藥資金申請報告
- 公司章程及經營管理制度
- lng運輸救援管理制度
- 家具公司無合同管理制度
- 東莞大朗藥品店管理制度
- mdr感染手術管理制度
- 公司精細化財務管理制度
- 公司檔案室安全管理制度
- 監理部上墻安全管理制度
- 太極拳教學合同協議
- 家校社協同勞動教育實施現狀與對策研究
- 國家開放大學《農村經濟管理》形考任務1-4參考答案
- 鐵絲圍擋施工方案
- 石家莊事業單位綜合類崗位筆試真題2024
- 2024慢性鼻竇炎診斷和治療指南解讀課件
- 大國工匠精神課件
- 超星爾雅學習通《大學生創業基礎(清華大學)》2025章節測試附答案
- 路燈安全培訓
- 《宴會國際禮儀》課件
- 【博觀研究院】2025年跨境進口保健品市場分析報告
評論
0/150
提交評論