商務數(shù)據(jù)分析與統(tǒng)計建模:chap4.2 廣義線性模型_第1頁
商務數(shù)據(jù)分析與統(tǒng)計建模:chap4.2 廣義線性模型_第2頁
商務數(shù)據(jù)分析與統(tǒng)計建模:chap4.2 廣義線性模型_第3頁
商務數(shù)據(jù)分析與統(tǒng)計建模:chap4.2 廣義線性模型_第4頁
商務數(shù)據(jù)分析與統(tǒng)計建模:chap4.2 廣義線性模型_第5頁
已閱讀5頁,還剩16頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、2022/7/181第4章 廣義線性模型4.1 廣義線性模型概述4.2 Logistic模型4.3 對數(shù)線性模型1 廣義線性模型概述之前我們研究了多元線性模型,該模型的一個重要假定是因變量是連續(xù)型的變量(通常假定服從正態(tài)分布),但在許多情況下,這種假定并不合理,例如下面這兩種情況.(1)結果變量可能是類型變量.二值分類變量和多分類變量.(比如:是/否,差/一般/良好/優(yōu)秀等)顯然都不是連續(xù)型變量.2022/7/1831 廣義線性模型概述(2) 結果變量可能是計數(shù)型變量(比如:一周交通事故的數(shù)目)這類變量都是非負的有限值,而且它們的均值和方差通常是相關的(一般線性模型假定因變量是正態(tài)變量,而且相

2、互獨立).普通線性回歸模型(2.3)假定因變量y服從正態(tài)分布,其均值滿足關系式:=X,這表明因變量的條件均值是自變量的線性組合.本章介紹兩種常見的廣義線性模型:Logistic模型與對數(shù)線性模型.2022/7/1841 廣義線性模型概述1.廣義線性模型的定義:(1)隨機成分:設y1,y2,yn是來自于指數(shù)分布族的隨機樣本,即yi的密度函數(shù)為其中ai(.) ,b(.),ci(.) 是已知函數(shù),參數(shù)i是典則參數(shù),是散度參數(shù).2022/7/1851.廣義線性模型的定義:(2)聯(lián)結函數(shù):設yi的均值為i而函數(shù)m(.)是單調可微的聯(lián)接函數(shù),使得其中 是協(xié)變量, 是未知參數(shù)向量.指數(shù)分布族正態(tài)分布二項分布

3、泊松分布2022/7/1862022/7/1872.正態(tài)線性回歸模型正態(tài)分布屬于指數(shù)分布族,其密度函數(shù)為與(1)對照可知2. 正態(tài)線性回歸模型只要取聯(lián)結函數(shù)為 ,則正態(tài)線性回歸模型滿足廣義線性模型的定義. 類似的,容易驗證,二項分布和泊松分布都屬于指數(shù)分布族.下面介紹實際中應用廣泛的兩種廣義線性模型:Logistic模型和對數(shù)線性模型.3.2 Logistic模型1.模型定義設yi服從參數(shù)為pi的二項分布,則i =E(yi)=pi 采用邏輯聯(lián)結函數(shù),即這個廣義線性模型稱為Logistic模型.2022/7/1810例1(數(shù)據(jù)文件為eg3.1)表3.1 某地區(qū)45個家庭的調查數(shù)據(jù)2022/7/1

4、8112. 模型的參數(shù)估計和檢驗采用R軟件中的廣義線性模型過程glm( )可以完成回歸系數(shù)的估計,以及模型回歸系數(shù)的顯著性檢驗.程序如下:#eg3.1廣義線性模型:Logistic模型#打開數(shù)據(jù)文件eg3.1.xls,選取A1:B46區(qū)域,然后復制data3.1-read.table(clipboard,header=T) #將eg3.1.xls數(shù)據(jù)讀入到data3.1中glm.logit-glm(yx,family=binomial,data=data3.1) #建立y關于x的logistic回歸#模型,數(shù)據(jù)為data3.1summary(glm.logit) #模型匯總,給出模型回歸系數(shù)的

5、估計和顯著性檢驗等yp-predict(glm.logit,data.frame(x=15) p.fit|z|) (Intercept) -21.2802 10.5203 -2.023 0.0431 *x 1.6429 0.8331 1.972 0.0486 *Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 (Dispersion parameter for binomial family taken to be 1)Null deviance: 62.3610 on 44 degrees of freedomResidual deviance:

6、6.1486 on 43 degrees of freedomAIC: 10.149Number of Fisher Scoring iterations: 92. 模型的參數(shù)估計和檢驗 yp p.fit-exp(yp)/(1+exp(yp);p.fit #估計x=15時y=1的概率 1 0.9665418容易看出:回歸模型的回歸系數(shù)在5%水平上顯著,于是得回歸模型為當x=15時,估計y=1的概率約為0.97,即年收入為15萬元的家庭有私家車的可能性約為97%.2022/7/18143.3 對數(shù)線性模型1.模型的定義設y服從參數(shù)為的泊松分布,則=E(y)=,采用對數(shù)聯(lián)結函數(shù),即這個廣義線性模型

7、稱為泊松對數(shù)線性模型.2022/7/1815例3.2(數(shù)據(jù)文件為eg3.2)表3.4 Breslow癲癇數(shù)據(jù)2022/7/1816例3.2(數(shù)據(jù)文件為eg3.2)這個數(shù)據(jù)是robust包中的Breslow癲癇數(shù)據(jù)(Breslow,1993).我們討論在治療初期的八周內,癲癇藥物對癲癇發(fā)病數(shù)的影響,響應變量為八周內癲癇發(fā)病數(shù)(y) ,預測變量為前八周內的基礎發(fā)病次數(shù)(x1),年齡(x2)和治療條件(x3),其中治療條件是二值變量, x3=0表示服用安慰劑, x3=1表示服用藥物. 根據(jù)這個數(shù)據(jù)建立泊松對數(shù)線性模型并對模型的系數(shù)進行顯著性檢驗.表3.2 Breslow癲癇數(shù)據(jù)Nox1x2x3yNo

8、x1x2x3y1113101431192017211300143210301133625011331918119483601334242411156622055353130174284722053581336102976181425912371103038321282022/7/18172022/7/18182. 模型的參數(shù)估計和檢驗采用R軟件中的廣義線性模型過程glm( )來建立泊松對數(shù)線性模型并對模型的系數(shù)進行顯著性檢驗.程序如下:#eg3.2 廣義線性模型: 泊松對數(shù)線性模型#打開數(shù)據(jù)文件eg3.2.xls,選取A1:E60區(qū)域,然后復制data3.2-read.table(“clipboard”,header=T) #將eg3.2.xls數(shù)據(jù)讀入到data3.2中glm.ln|z|) (Intercept) 1.9488259

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論