回歸分析中回歸截距的實際意義_第1頁
回歸分析中回歸截距的實際意義_第2頁
回歸分析中回歸截距的實際意義_第3頁
回歸分析中回歸截距的實際意義_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、歸分析中回歸截距的實際意義在回歸方程中,回歸系數的意義比較明顯,表示解釋變量X每變動一單 位,因變量y平均將變動的數量。回歸截距很多時候并無實際意義,因此回歸 分析中分析者往往僅關注回歸系數。本文通過兩個例題,探討回歸截足距所反映 的信息。1-解釋變量為分類數據下表是一個不同性別的音量高低的試驗數據,性別為離散型解釋變量,分 為男、女兩類,相應變量voice表示音量,單位是hz。subjectsexvoice1female2332female2043female2424male1305male1126male142將voice對sex進行回歸分析,其線性模型可表示為:voicesex+。R代

2、碼如下:voice=c(233,204,242,130,112,142)sex=c(rep(female,3),rep(male,3)my.df=data.frame(sex,voice)lm.fit=lm(voicesex,data=my.df)summary(lm.fit)$coefvoice=cf )sey=c(female dn f 3)my.df=data.Tame(rvoice)In. it=lni (voice-sexf data=ir.y. df)suninary (If.J coeEstirr.ate 5td. Error t vs 1 -j.e Pr | 11 ) (Int

3、ercept) 226.33333 10.13441 22.223505 2 .42 G?52e-D5 sexiT.alE-98.33333 14.402 93 -6.327314 2 . 4C-6S32 e-D3運行結果可知,回歸截距Intercept為226.3333,回歸系數sexmale為- 98.3333?;貧w系數的名稱為何是sexmale而不是sex呢?解釋變量sex中的 female去哪兒了?先計算sex中的兩個分類female和male對應的voice的平均值。 tapply (mv. df$voicemy.Lfenale nr.ale計算結果表明,female的voice平均

4、值為226.3333,正好與截距Intercept 相等。male的voice平均值為128 , male的均值減去female的均值128- 2226.3333=-98.3333,正好等于回歸系數 sexmale。這不是巧合,對于離散型的解釋變量,回歸截距和回歸系數的意義就在于 此。用圖示直觀表示如下:因為解釋變量為分類變量,進行回歸時,默認female與male之間的距離 為1個單位,這一個單位造成的voice的差異-98.333就是斜率。同時,分類變 量的取值范圍理論上就是數據設定的取值(“female”和“male”),因此回 歸直線無法擴展到其他情況,y軸與直線的交叉點,其實并無實際

5、意義。當解釋變量為連續變量時,由于解釋變量的取值范圍默認為(-8,+8),因 此回歸直線理論上可以擴展到(-8,+8)的任意取值。則其回歸截距就是回歸直 線與y軸的交叉點。2.解釋變量為連續數據下表是一個不同年齡的音量高低的試驗數據,年齡為連續型解釋變量,響 應變量voice表示音量,單位是hz。subjectagevoice114252223244335240448233552212667204將voice對age進行回歸分析,其線性模型可表示為:voiceage+。R代 碼如下:age=c(14,23,35,48,52,67)voice =c(252,244,240,233,212,204

6、)my.df=data.frame(age, voice)lm.fit1=lm(voiceage, my.df)summary(lm.fit1)$coef jammary (Lit. coefIEstiir.ate Std. Error t valae Pr 11 ) (Intercept) 2 67.0754640 6.3521342 3-S.2.5SB356e-06己頃已-0. 303.5634 0.1563771 -5.733555 .39969e-03運行結果可知,回歸系數age為-0.9099,表示年齡每增加1歲,音量會減 少-0.9909Hz。回歸截距Intercept為267.0

7、765,表示當年齡為0時的音量。此時的回歸方程為voice=-0.9909*age+267.0765。當age取平均值時, mean( age)=39.8333,其對應的 voice_pre=230.8333,可用如下代碼實 現:new=data.frame(age=mean(age)predict(lm.fit1,new)#not run回歸擬合直線如下圖所示: IIIII0204D60BOAge (yers)導-L然而,對于個人來說,年齡不可能為0歲,故此時的截距沒有實際意義。 若將年齡age減去age的平均數,即將年齡中心化,賦值給變量age_1,對模 型voiceage_1進行回歸分析,R代碼如下:age_1=age-mean(age)my.df=data.frame(age_1,voice)lm.fit2=lm(voiceage_1, my.df)summary(lm.fit2)$coef(Im. fIEstiir.ste Std. Etioi t 亨己Im匕 Pr ( | 11 ) (Intercept) 230.8333333 252 .10 9353 1.315716e-07 age_l-0.9095694 0.2.55771 - . 7 9 9-5-S-5 4.394969

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論