(07)第7章 相關與回歸分析(龐皓)_第1頁
(07)第7章 相關與回歸分析(龐皓)_第2頁
(07)第7章 相關與回歸分析(龐皓)_第3頁
(07)第7章 相關與回歸分析(龐皓)_第4頁
(07)第7章 相關與回歸分析(龐皓)_第5頁
已閱讀5頁,還剩63頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 據世界衛生組織統計,全球肥胖癥患者達據世界衛生組織統計,全球肥胖癥患者達3 3億人,其中兒童占億人,其中兒童占22002200萬人,萬人,1111億人體重過重。億人體重過重。肥胖癥和體重超常早已不是發達國家的肥胖癥和體重超常早已不是發達國家的“專利專利”,已遍及五大洲。目前,全球因已遍及五大洲。目前,全球因”吃吃”致病乃至死致病乃至死亡的人數已高于因饑餓死亡的人數。亡的人數已高于因饑餓死亡的人數。 (引自引自光明日報光明日報劉軍劉軍/文)文)問題問題: : 肥胖癥和體重超常與死亡人數真有顯著的肥胖癥和體重超常與死亡人數真有顯著的數量關系嗎數量關系嗎? ?這些類型的問題可以運用相關分析與回歸分

2、析的這些類型的問題可以運用相關分析與回歸分析的方法去解決。方法去解決。實例實例2:2:全球吃死的人比餓死的人多全球吃死的人比餓死的人多? ?一、變量間的相互關系一、變量間的相互關系二、相關關系的類型二、相關關系的類型三、簡單線性相關系數及其檢驗三、簡單線性相關系數及其檢驗)var()var(),cov(YXYXXYrXYr_22()()()()iiXYiiXX YYrXXYY221(2)tr nrtn一、相關系數及檢驗回歸一、相關系數及檢驗回歸二、總體回歸函數與樣本回歸函數二、總體回歸函數與樣本回歸函數三、回歸系數的估計三、回歸系數的估計四、擬合優度的度量四、擬合優度的度量估計因變估計因變量平

3、均值量平均值()iiE Y XXiiiYXu(常用)(常用)iiiYXeiiYXiY2.3.iYiY22()iiiiiiNX YX YNXX_2()()()iiiXX YYXXYX()E()E()E()E2()iVarx2()iSEx22()iiXVarNx22()iiXSENx22(,)iNx22( ,)iiXNNx 222ien_222()()()iiiiYYYYYY222()()iiYYrYY222()1()iiiYYrYY K為回為回歸系數歸系數的個數的個數YXiXYiYYYiiiYY YYi222()()iiYYrYY2rr 2222()()()()iiiiXXYYrXXYY其中:其

4、中:2()iSEx22( )iiXSENx2 (2)()tt nSE (2)()tt nSE)(,) (*SEtSEt*0()P tt HP=)2/()/() 1/(nSSESSRknSSEkSSRF199119913149.483149.4821826.221826.2199219923483.373483.3726937.2826937.28199319934348.954348.9535260.0235260.02199419945218.15218.148108.4648108.46199519956242.26242.259810.5359810.53199619967407.997

5、407.9970142.4970142.49199719978651.138651.1378060.8378060.83199819989875.959875.9583024.2883024.281999199911444.0811444.0888479.1588479.152000200013395.2313395.2398000.4598000.452001200116386.0416386.04108068.2108068.22002200218903.6418903.64119095.7119095.72003200321715.2521715.25135174135174200420

6、0426396.4726396.47159586.7159586.72005200531649.2931649.29184739.1184739.12006200638760.238760.2211808211808年份年份財政收入財政收入GDPGDP197819781132.261132.263645.2173645.217197919791146.381146.384062.5794062.579198019801159.931159.934545.6244545.624198119811175.791175.794889.4614889.461198219821212.331212.33

7、5330.4515330.451198319831366.951366.955985.5525985.552198419841642.861642.867243.7527243.752198519852004.822004.829040.7379040.737198619862122.012122.0110274.3810274.38198719872199.352199.3512050.6212050.62198819882357.242357.2415036.8215036.82198919892664.92664.917000.9217000.92199019902937.12937.1

8、18718.3218718.32)0(612.767,965.0,966.0)000.0()136.0()706.27()538.1(165.0371.74922pFRRptxy)7033. 1)27(,0518. 2)27(05. 0025. 0tt)21. 4)27, 1 (,63. 5)27, 1 (05. 0025. 0FF 試在顯著性水平為試在顯著性水平為=0.05下,對回歸系數和回歸方下,對回歸系數和回歸方程進行檢驗。程進行檢驗。fYffYX_222()11fffiXXYYtnx_FXX_2()FXX_X_2()FXXY越大,預測區間越寬越大,預測區間越寬當當=0,,一、多元線性回

9、歸模型及假定一、多元線性回歸模型及假定二、多元線性回歸模型的估計二、多元線性回歸模型的估計三、多元線性回歸模型的檢驗三、多元線性回歸模型的檢驗12233iiikkiiYXXXu23(,)iikiE Y XXX12233iikkiXXX(二)多元線性樣本回歸函數:(二)多元線性樣本回歸函數: 一般形式:一般形式:12233iiikkiYXXX12233iiikkiiYXXXe或或 Y=X + e 偏回歸系數:偏回歸系數:多元線性回歸模型中,回歸系數表示當控多元線性回歸模型中,回歸系數表示當控制其它自變量不變的條件下,第制其它自變量不變的條件下,第j j個自變量的單位變動對因個自變量的單位變動對因

10、變量均值的影響,這樣的回歸系數稱為偏回歸系數。變量均值的影響,這樣的回歸系數稱為偏回歸系數。121311112223222223111kknnnknknYXXXuYXXXuYXXXu 1.與一元線性回歸模型與一元線性回歸模型相同的假定相同的假定: : 零均值、同方差、零均值、同方差、無自相關、隨機擾動項與自變量不相關、無自相關、隨機擾動項與自變量不相關、U U正態性正態性2.增加的假定:增加的假定:各自變量之間不存在線性關系,即無各自變量之間不存在線性關系,即無多重共線性。多重共線性。 在此條件下,自變量觀測值矩陣在此條件下,自變量觀測值矩陣X X列滿秩列滿秩 Rank( X ) = k方陣方

11、陣X X 滿秩滿秩 Rank()= k 意義:意義:-1(X X)存在存在 X X X X 可逆,可逆,212233()iiikkiYXXX2ie 2()01,2,ijejk正規方程組:正規方程組: 122ikkiinXXY2122222iikikiiiXXX XX Y2122kiikikkikiiXX XXX Y(XX)XY-1(XX)存在存在 參數向量參數向量的最小二乘估計為的最小二乘估計為1(X X) X Y參數最小二乘估計的性質參數最小二乘估計的性質可以證明:多元線性回歸的最小二乘估計也是最佳線性無可以證明:多元線性回歸的最小二乘估計也是最佳線性無偏估計偏估計(BLUE)??梢宰C明可以

12、證明, 是隨機擾動項方差是隨機擾動項方差 的無偏估計。的無偏估計。 2knXYYYkneeknei22變差變差 222()()()iiiiYYYYYY SST = SSE + SSR ( (總離差平方和總離差平方和) () (殘差平方和殘差平方和) () (回歸平方和回歸平方和) )自由度自由度 n-1 = n-k + k-12、多重可決系數:、多重可決系數: 22222)(1)() (11yyeyyyySSTSSESSTSSRRiii(3)相互關系)相互關系:2211 (1)nRRnk 22222()111()(1)()iiiienkenRYYnnkYY (2)計算公式)計算公式()jjE2

13、()jjjVarc 其中:其中:jjc是矩陣是矩陣1(XX)第第 j j 行第行第 j j 列的元素。列的元素。因為因為2未知,故未知,故()jVar也未知。現用也未知。現用2代替代替 2 2, ,可構造統計量可構造統計量 ()jjjjtt nkC :0:0jH(1,2)jk對原假設對原假設分別作分別作 t 檢驗檢驗012:0kH不全為零不全為零方方差差分分析析表表1:(1,2, )jHjk2)(YYSSTi2)(YYSSRi2)(iiYYSSEF(k-1,n-k)0HF F檢驗方法:檢驗方法:成立的條件下,統計量成立的條件下,統計量若若F FF( (k-1k-1,n-k),n-k),則拒絕,

14、則拒絕 H H0 0: :1 1= =2 2=k k= 0= 0 ,說明說明回歸方程中所有自變量聯合起來對因變量有顯著影響回歸方程中所有自變量聯合起來對因變量有顯著影響若若F FF F ( (k-1k-1,n-k) ,n-k) ,則接受則接受 H H0 0: : 1 1= = 2 2= = = = k k= 0= 0 ,說明回歸方說明回歸方程中所有自變量聯合起來對因變量影響不顯著程中所有自變量聯合起來對因變量影響不顯著)/() 1/(knSSEkSSRFF(k-1,n-k)6991. 1)29(,0452. 2)29(05. 0025. 0tt)33. 3)29, 2(,20. 4)29, 2

15、(05. 0025. 0FF試在顯著性水平為試在顯著性水平為=0.05下,對回歸系數和回歸方下,對回歸系數和回歸方程進行檢驗。程進行檢驗。)000. 0(919.126,894. 0,901. 0)000. 0()000. 0()001. 0()961. 3()337.12()754. 3(116.21066. 0491.3692232pFRRptxxy例:例:中國各省財政中國各省財政收入(收入(y)與各?。┡c各省GDP(x2)及第一)及第一產業就業比重(產業就業比重(x3)額關系如下:額關系如下:_22()()() ()iiXYiiXX YYrXXYY23(,)iikiE Y XXX12233iikkiXXX12233iiikkiiYXXXu12233iikkiXXXiY 12233iiikkiiY

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論