一般線性模型的幾種常見形式及應用_第1頁
一般線性模型的幾種常見形式及應用_第2頁
一般線性模型的幾種常見形式及應用_第3頁
一般線性模型的幾種常見形式及應用_第4頁
一般線性模型的幾種常見形式及應用_第5頁
已閱讀5頁,還剩2頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、一般線性模型的幾種常見形式及其合理選用中國衛生統計 1999年第5期第16卷 論著作者:胡良平單位:軍事醫學科學院醫學統計教研室(100850)關鍵詞:一般線性模型;設計矩陣;協方差矩陣;多水平模型【提要】目的展示一般線性模型(GLM)的常見形式及其特點,便于人們合理選用。方法通過改變設計矩陣X和誤差的協方差矩陣的結構以及分析設計矩陣X的變量性質,將GLM演繹成一個個簡單明了的具體表達式。結果將GLM簡化成適用于回歸分析、方差和協方差分析、多水平模型等具體的統計模型。結論合理選用統計模型的關鍵在于弄清資料所取自的設計類型,影響因素和反應變量的性質,有無協變量以及各種統計模型的適用范圍。Comm

2、on Patterns and Rational Applications of the General Linear ModelHu Liangping,Department of Medical Statistics,Academy of Military Medical Sciences(100850),Beijng【Abstract】ObjectivePresenting the common patterns and their characteristics of the general linear model(GLM)for the convenient and rationa

3、l application.MethodsBy changing the structures of design matrix(X)and covariance matrix of error() and analyzing the characters of variables in the design matrix(X),some concise and concrete expressions are deduced from GLM respectively.ResultsTo simplify GLM into several particular statistical mod

4、els which are suitable for regression analysis,analysis of variance and covariance,and multilevel modelling.ConclusionThe key to the rational selection of statistical models lies in clarifying the design types of data,the characters of affecting factors and response variables,the availability of cov

5、ariates,and the applicability of various statistical models.【Key words】General linear modelDesign matrixCovariate matrixMultilevel model一般線性模型概述統計分析的對象是統計資料,如果資料中包含著自變量X和連續變化的反應變量Y時,為了用最簡便的方式描述反應變量與自變量之間的依存關系,人們首選一般線性模型(GLM),見式(1)。Y=X+e(1)模型(1)中,Y為反應變量的觀測值向量,X為由自變量構造的設計矩陣,為回歸參數向量,e為正態獨立隨機誤差向量,并假定其均值

6、E(e)=0,協方差矩陣為=Cov(e)。當由模型(1)定義的GLM具有各種不同結構的設計矩陣X和誤差的協方差矩陣時,GLM就會有各種不同的變形。例如:當=2In時,模型(1)被稱為經典(或標準)線性回歸模型;如果可將X剖分成X=(X1,X2),其中X1與固定效應有關,X2與隨機效應有關,同時,具有式(2)的形式:=X2VX2+(2)式(2)中V和是協方差矩陣,則模型(1)就變成一般線性混合模型(GLMM);如果對X與作其他一些假定,模型(1)可分別轉變成MANOVA模型(即多元方差分析模型)和GMANOVA模型(即廣義多元方差分析模型)等模型1。從構成設計矩陣X的變量性質來分類,模型(1)又

7、有許多不同的變形。例如:當X分別由固定效應、隨機效應和固定與隨機兩種效應的定性影響因素構造而成時,模型(1)就分別簡化為固定效應、隨機效應和混合效應的方差分析模型;當X全部由定量的影響因素(包括啞變量)構造而成時,模型(1)就簡化為回歸分析模型;當X同時由定性和定量兩種影響因素構造而成時,需分以下三種情形來討論:情形一,當定性的影響因素是固定效應時,模型(1)就變成了協方差分析模型;情形二,當定性的影響因素是隨機效應時,模型(1)就變成了多水平回歸模型(亦稱隨機系數模型或分層模型)13;情形三,當定性的影響因素包括固定和隨機兩種效應時,若固定效應的定性變量未用啞變量技術處理,模型(1)就變成了

8、具有協方差分析結構的多水平模型;反之,模型(1)仍舊是多水平回歸模型。GLM常見的簡化形式1.方差分析模型(1)固定效應方差分析模型及F統計量由于多因素實驗設計類型很多,今以兩因素析因設計為例(下同)。設固定效應因素A、B分別有a、b個水平,共有a×b種水平組合,各組合下均重復k(k2)次實驗,Y為定量的反應變量,則與這個兩因素析因設計對應的方差分析模型由式(3)給出:yijk=+i+j+( )ij+eijk(3)i=1,2,a;j=1,2,b;k=1,2,n。模型(3)中,是總平均效應,i是因素A第i個水平的效應(即i=Ai-),j是因素B第j個水平的效應(即j=Bj-,()ij是

9、A與B分別在第i水平與第j水平組合條件下的交互作用的效應,eijk是隨機誤差分量,且進行方差分析時,需要構造出F統計量,其方法是推導出因素A、B及交互作用A×B的期望均方,詳見文獻4。依據三個期望均方的表達式,構造出檢驗“H0:i=0,H0:j=0,H0:()ij=0對一切i,j”的三個F統計量,見式(4)。FA=MSA/MSE、FB=MSB/MSE、FAB=MSAB/MSE(4)式(4)中,FAFa-1,ab(n-1)分布,FBFb-1,ab(n-1)分布,FABF(a-1)(b-1),ab(n-1)分布。(2)隨機效應方差分析模型及F統計量如果某因素的水平是從較大的總體中隨機選取

10、的,那么,關于該因素的推斷將會對所研究的總體的全部水平都有效,稱這種因素為隨機效應因素。現仍以兩因素析因設計為例,來研究隨機效應方差分析模型。在上述關于模型(3)的“假設條件”中,將固定效應因素A、B改為隨機效應因素,其他條件不變,此時,處理資料的模型見式(5)。yijk=+i+j+( )ij+eijk(5)i=1,2,,a;j=1,2,b;k=1,2,n。模型(5)中,是總平均效應,i,j,( )ij以及eijk都是隨機變量。特別地,假定iNID(0,2),jNID(0,2)、( )ijNID(0,2)、eijkNID(0,2)。于是,任一觀察值的方差是:V(yijk)=2+222(6)式(

11、6)中等號右邊四項叫做方差分量,故模型(5)又稱為方差分量模型。對于方差分量模型,構造F統計量的方法仍是推導出A、B及A×B的期望均方,詳見文獻4。依據三個期望均方的表達式,構造出檢驗“H02=0;H02=0;H02=0”的三個F統計量(因為對隨機效應因素來說,檢驗關于各個處理效應的假設是沒有意義的),見式(7)。FA=MSA/MSABFB=MSB/MSABFAB=MSAB/MSE(7)式(7)中,FAFa-1,(a-1)(b-1)分布,FBFb-1,(a-1)(b-1)分布,FABF(a-1)(b-1),ab(n-1)分布。(3)混合效應方差分析模型及F統計量當因素A為固定效應、因

12、素B為隨機效應因素時,分析這種兩因素析因設計資料的模型稱為混合效應方差分析模型,見式(8)yijk=+i+j+( )ij+eijk(8)i=1,2,a;j=1,2,b;k=1,2,n。模型(8)中,i是固定效應,j是隨機效應,并且假定( )ij也是隨機效應,而eijk是隨機誤差。還假定i使得ai=1i=0、jNID(NULL,2)、()?ijN(0,2)、eijkNID(NULL,2)。( )ij的獨立性并不總能成立,因為ai=1( )ij=().j=0,j=1,2,,b。這意味著,固定因素的不同水平上的某些交互作用元素不是獨立的。且基于模型(8)的方差分析,仍需借助期望均方來導出F統計量,關

13、于A、B、A×B期望均方表達式,詳見文獻4。對于固定效應的檢驗假設為H0i=0,對于隨機效應的檢驗假設為H02=0;H02=0。此時,恰當的F統計量如式(9)所示。FA=MSA/MSABFB=MSB/MSEFAB=MSAB/MSE(9)式(9)中,FAFa-1,(a-1)(b-1)分布,FBFb-1,ab(n-1)分布,FABF(a-1)(b-1),ab(n-1)分布。2.回歸分析模型當模型(1)中設計矩陣X全由定量的影響因素(允許有啞變量)構造而成時,它就簡化成單純的回歸分析模型(10)。yi=0+1X1+2X2+mXm+ei(10)i=1,2,n。模型(10)的參數估計、假設檢驗

14、等內容在普通統計學教科書中都寫得很詳細,此處不再贅述。3.單因素協方差分析模型與二水平模型(1)單因素協方差分析模型4在評價飼料營養價值的試驗中,如果飼料的種類(設為因素A)是有限的a種,每個受試對象的平均進食量(X)對其平均體重增加量(Y)必有影響。這里A是固定效應的影響因素,X是定量的影響因素,Y是定量的觀測結果,當全部受試對象被完全隨機地分配進入a種飼料組中去接受試驗后,所收集到的資料可用下面的含一個協變量的單因素協方差分析模型(11)來處理。yij=+i+(xij-x.)+eij(11)i=1,2,,a;j=1,2,n。模型(11)中yij是第i種飼料組取得的反應變量的第j個觀察值,x

15、ij是對應于yij的平均進食量,x.是全部xij的樣本均值,是與yij對應的總平均值,i是第i種飼料的效應,是回歸系數,eijNID(NULL,2)是隨機誤差分量。于是,檢驗H0i=0的F統計量見式(12)。FA=(SSE-SSE)/(a-1)/SSE/a(n-1)-1(12)式(12)中,FAFa-1,a(n-1)-1分布,SSE=1yy-(1xy)2/1xx,SSE=Eyy-(Exy)2/Exx,此外,1xx,1yy,1xy分別為x,y,x與y的總離均差平方和及離均差積之和;Exx,Eyy,Exy分別為x,y,x與y的組內離均差平方和及離均差積之和。(2)二水平模型23在前述評價飼料營養價值的試驗中,如果可供選用的飼料有成百上千種,今從此總體中隨機地選取a種來做前述的試驗研究,其他情況不變。此時,研究的目的是由a種飼料的試驗信息去推測上千種飼料所構成的總體中y隨x變化的依存關系。如果忽略飼料間變異對結果的影響,模型(1)一下簡化成簡單直線回歸模型,但當模型在飼料間的變異是不可忽略的情況下

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論