相關與回歸ppt課件_第1頁
相關與回歸ppt課件_第2頁
相關與回歸ppt課件_第3頁
相關與回歸ppt課件_第4頁
相關與回歸ppt課件_第5頁
已閱讀5頁,還剩59頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1相關與回歸相關與回歸兩變量間的相關分析與回歸分析兩變量間的相關分析與回歸分析2;. 相關關系與確定性關系的比較相關關系與確定性關系的比較兩變量間的相關分析兩變量間的相關分析直線相關分析直線相關分析3;. 直線直線相關分析的基本概念相關分析的基本概念相關分析是研究變量或變量集合之間數量協同變化關系密切程度和方向的統計方法。相關分析是研究變量或變量集合之間數量協同變化關系密切程度和方向的統計方法。當兩個數值變量之間出現如下情況:當一個變量增大,另一個也隨之增大當兩個數值變量之間出現如下情況:當一個變量增大,另一個也隨之增大( (或減少或減少) ),我們稱,我們稱這種現象為共變,也就是有相關關系。

2、這種現象為共變,也就是有相關關系。若兩個變量同時增加或減少,變化趨勢是同向的,則兩變量之間的關系為正相關若兩個變量同時增加或減少,變化趨勢是同向的,則兩變量之間的關系為正相關(positive (positive correlation)correlation);若一個變量增加時,另一個變量減少,變化趨勢是反向的,則稱為負相關;若一個變量增加時,另一個變量減少,變化趨勢是反向的,則稱為負相關(negative correlation)(negative correlation)。 相關的方向相關的方向兩變量間的相關分析兩變量間的相關分析直線相關分析直線相關分析4;. 兩個兩個相關關系的圖示(散

3、點圖)相關關系的圖示(散點圖)yx兩變量間的相關分析兩變量間的相關分析直線相關分析直線相關分析5;. 直線直線相關分析的資料要求相關分析的資料要求兩變量間的相關分析兩變量間的相關分析直線相關分析直線相關分析6;. 相關系數(直線相關關系的測度)相關系數(直線相關關系的測度)用以說明具有直線關系的兩個變量間相關關系的密切程度和相關方向的指標,稱為相關系數(用以說明具有直線關系的兩個變量間相關關系的密切程度和相關方向的指標,稱為相關系數(correlation coefficient),又稱為積差相關系數(),又稱為積差相關系數(coefficient of product-moment corr

4、elation),),Pearson相關系數相關系數 。兩變量間的相關分析兩變量間的相關分析直線相關分析直線相關分析7;. 相關系數(直線相關關系的測度)相關系數(直線相關關系的測度)YYXXXYlllYYXXYYXXr22)()()()(2222nYYnXXnYXXYr兩變量間的相關分析兩變量間的相關分析直線相關分析直線相關分析8;.YYXXXXlllYYXXYYXXr22相關系數沒有量綱相關系數沒有量綱, 且且-1 r 1。當。當r0,且,且H0(=0)被拒絕時,認為兩變量之間呈正相關關系)被拒絕時,認為兩變量之間呈正相關關系;當;當r0: 回歸線與縱軸交點在原點上方。a 0: 回歸線與縱

5、軸交點在原點下方。a =0: 回歸線通過原點。o統計學意義a 表示自變量X取值為0時相應Y條件均數的估計值。oa的單位與Y值相同o當X可能取0時,a才有實際意義。 線性回歸模型中參數的幾何意義線性回歸模型中參數的幾何意義截距截距a:兩變量間的回歸分析兩變量間的回歸分析直線相關分析直線相關分析360YabXb0YabX bXY0YabXb回歸系數:回歸系數: 線性回歸模型中參數的幾何意義線性回歸模型中參數的幾何意義兩變量間的回歸分析兩變量間的回歸分析直線回歸分析直線回歸分析b b表示自變量表示自變量X X變化一個單位時應變量變化一個單位時應變量Y Y的平均改變量。的平均改變量。b越大,表示越大,

6、表示Y隨隨X變化越快,直線越陡峭變化越快,直線越陡峭37o 等方差(equal variance)或標準差相等:標準差相等:對于任何X值,隨機變量Y的標準 差 Y|X相等;隱含著不論x取何值,y都具有相同的方差(對于所有的自變量x,殘差 的條件方差為 ,且為常數)。 o 獨立獨立 INDEPENDENCE 每一觀察值之間彼此獨立(在給定自變量x的條件下,殘差的條件期望值為零,本假設又稱零均值假設);該條件實際上隱含著:各隨機誤差項互不相關;隨機誤差項與相應的自變量x不相關。 o線性線性 LINEARITY: 反應變量均數 與X間呈直線關系 o 給定X時,Y正態分布(normal): 對于任何給

7、定的 X, Y 服從正態分布,均數為 Y|X,標準差為 Y|X,該條件實際隱含著誤差項服從正態分布(隨機誤差,即殘差服從均值為零,方差為的正態分布)。 線性回歸模型的建模假設線性回歸模型的建模假設兩變量間的回歸分析兩變量間的回歸分析直線回歸分析直線回歸分析i 直線回歸分析的步驟直線回歸分析的步驟例題例題1:某克山病區:某克山病區10名健康兒童頭發與全血中的硒含量名健康兒童頭發與全血中的硒含量1000ppm(百萬分之一)如下,試建(百萬分之一)如下,試建立發硒(立發硒(x)與血硒()與血硒(y)之間的回歸模型?)之間的回歸模型?兩變量間的回歸分析兩變量間的回歸分析直線回歸分析直線回歸分析38;.

8、 直線回歸分析的步驟直線回歸分析的步驟兩變量間的回歸分析兩變量間的回歸分析直線回歸分析直線回歸分析1 繪制散點圖:同相關分析,即在直繪制散點圖:同相關分析,即在直角坐標系內繪制散點圖。角坐標系內繪制散點圖。若散點圖呈直線趨勢時,建立直線若散點圖呈直線趨勢時,建立直線回歸方程;回歸方程;若散點圖呈曲線趨勢,進行曲線擬若散點圖呈曲線趨勢,進行曲線擬合;合;若散點圖顯示無任何趨勢,則不必若散點圖顯示無任何趨勢,則不必進行分析。進行分析。本例,散點圖呈直線趨勢時,可建立本例,散點圖呈直線趨勢時,可建立直線回歸方程。直線回歸方程。39;. 直線回歸分析的步驟直線回歸分析的步驟兩變量間的回歸分析兩變量間的

9、回歸分析直線回歸分析直線回歸分析2 2 建立直線回歸方程建立直線回歸方程實際上是求出回歸方程中的回歸系數實際上是求出回歸方程中的回歸系數b和截距和截距a:bxay求回歸系數求回歸系數b b和截距和截距a a的方法有最小二乘法、高斯牛頓法、麥夸特法、牛頓法、梯度法、正的方法有最小二乘法、高斯牛頓法、麥夸特法、牛頓法、梯度法、正割法等等。這里重點給大家介紹最小二乘法。割法等等。這里重點給大家介紹最小二乘法。40;.41 從上圖得知,要使從上圖得知,要使 能夠最好地代表能夠最好地代表y y和和x x在數量上的互變關系,必須在數量上的互變關系,必須使使yx0bxayxiyiiy ( yi- )實際觀察

10、值與估計值之差iy bxay為最小nyyQ12) (最小nbxayQ12)(兩變量間的回歸分析兩變量間的回歸分析直線回歸分析直線回歸分析 直線回歸分析的步驟直線回歸分析的步驟2 2 建立直線回歸方程建立直線回歸方程最小二乘法的基本原理:最小二乘法的基本原理:42.)() (22MinbxayyyQ分別對上式的a和b求偏導:20)(20)(2xbxaxyxbnaybxayxbQbxayaQ兩變量間的回歸分析兩變量間的回歸分析直線回歸分析直線回歸分析 直線回歸分析的步驟直線回歸分析的步驟2 2 建立直線回歸方程建立直線回歸方程用最小二乘法求回歸方程:用最小二乘法求回歸方程:xbyaLxxLxyxx

11、yyxxxnxyxnxyb222)()()(1)( )(1解方程組,得到回歸系數解方程組,得到回歸系數b和截距和截距a: 直線回歸分析的步驟直線回歸分析的步驟兩變量間的回歸分析兩變量間的回歸分析直線回歸分析直線回歸分析2 2 建立直線回歸方程建立直線回歸方程本例:本例:XXXYllnXXnYXXYb/22XbYa43;. 直線回歸分析的步驟直線回歸分析的步驟兩變量間的回歸分析兩變量間的回歸分析直線回歸分析直線回歸分析3 3 繪制回歸線繪制回歸線 本例:本例:44;.45XYXY/bxay以樣本統計量估計總體參數以樣本統計量估計總體參數斜率(回歸系數)斜率(回歸系數)截距截距對于直線回歸分析,回

12、歸系數的假設檢驗,也是直線回歸方程的假設檢驗。由于抽樣誤差的存對于直線回歸分析,回歸系數的假設檢驗,也是直線回歸方程的假設檢驗。由于抽樣誤差的存在,回歸系數在,回歸系數b往往不等于總體回歸系數往往不等于總體回歸系數 ,要判斷是否來自,要判斷是否來自 0的總體,也必須進行假設檢驗。的總體,也必須進行假設檢驗。常用的回歸系數的假設檢驗有方差分析和常用的回歸系數的假設檢驗有方差分析和 t 檢驗。檢驗。兩變量間的回歸分析兩變量間的回歸分析直線回歸分析直線回歸分析 直線回歸分析的步驟直線回歸分析的步驟4 4 回歸系數的假設檢驗回歸系數的假設檢驗 46總體總體0總體總體 0樣本樣本b0兩變量有直線關系兩變

13、量無直線關系?兩變量間的回歸分析兩變量間的回歸分析直線回歸分析直線回歸分析 直線回歸分析的步驟直線回歸分析的步驟4 4 回歸系數的假設檢驗回歸系數的假設檢驗 XYXY/bxay47兩變量間的回歸分析兩變量間的回歸分析直線回歸分析直線回歸分析 直線回歸分析的步驟直線回歸分析的步驟4 4 回歸系數的假設檢驗回歸系數的假設檢驗方差分析法方差分析法 Y總變異的分解總變異的分解(1)建立假設,確定)建立假設,確定 H0: =0,即兩變量無直線關系,即兩變量無直線關系H1:0,即兩變量有直線關系,即兩變量有直線關系 =0.05(2)求統計量)求統計量F48yy yyyyyy2)(yySST2) (yySS

14、E2) (yySSR剩余剩余(誤差誤差)平方和平方和回歸回歸平方和平方和總離差平方和總離差平方和49兩變量間的回歸分析兩變量間的回歸分析直線回歸分析直線回歸分析 直線回歸分析的步驟直線回歸分析的步驟4 4 回歸系數的假設檢驗回歸系數的假設檢驗方差分析法方差分析法 (2)求統計量)求統計量F222()()()()()()YYYYYYYYYYYYSSSSSS總?;乜偸;乜捎袛祵W證明得到:即同樣有:剩余剩余回歸回歸剩余回歸/SSSSMSMSF50兩變量間的回歸分析兩變量間的回歸分析直線回歸分析直線回歸分析 直線回歸分析的步驟直線回歸分析的步驟4 4 回歸系數的假設檢驗回歸系數的假設檢驗方差分析法方差

15、分析法 (2)求統計量)求統計量F三個平方和的意義:三個平方和的意義: 51兩變量間的回歸分析兩變量間的回歸分析直線回歸分析直線回歸分析 直線回歸分析的步驟直線回歸分析的步驟4 4 回歸系數的假設檢驗回歸系數的假設檢驗方差分析法方差分析法 (2)求統計量)求統計量F本例:本例:(3)確定)確定P值,做出結論值,做出結論52兩變量間的回歸分析兩變量間的回歸分析直線回歸分析直線回歸分析 直線回歸分析的步驟直線回歸分析的步驟4 4 回歸系數的假設檢驗回歸系數的假設檢驗t t 檢驗法檢驗法 (2)求統計量)求統計量t0 2bbbtns,.2 2Y XbXXY XsslYYsn53兩變量間的回歸分析兩變

16、量間的回歸分析直線回歸分析直線回歸分析 直線回歸分析的步驟直線回歸分析的步驟4 4 回歸系數的假設檢驗回歸系數的假設檢驗t t 檢驗法檢驗法 (2)求統計量)求統計量t0 2bbbtns,.2 2Y XbXXY XsslYYsn本例:本例:02. 50470. 02358. 04 .1360/32358. 0/.剩余xxxxxybblMSblsbsbt(3)確定)確定P值,做出結論值,做出結論查t界值表,得到P0.05兩種方法的等價性:兩種方法的等價性:54兩變量間的回歸分析兩變量間的回歸分析直線回歸分析直線回歸分析 直線回歸分析的步驟直線回歸分析的步驟5 5 直線回歸方程直線回歸方程擬合效果

17、評價擬合效果評價本例:本例:R2=0.7595本例:調整本例:調整R2=0.729555兩變量間的回歸分析兩變量間的回歸分析直線回歸分析直線回歸分析 直線回歸分析的步驟直線回歸分析的步驟6 6 直線回歸方程的區間估計直線回歸方程的區間估計56兩變量間的回歸分析兩變量間的回歸分析直線回歸分析直線回歸分析 直線回歸分析的步驟直線回歸分析的步驟6 6 直線回歸方程的區間估計直線回歸方程的區間估計(1) 總體回歸系數和總體截距的可信區間估計總體回歸系數和總體截距的可信區間估計本例:本例:總體回歸系數的總體回歸系數的95%的可信區間為(的可信區間為(0.1276, 0.3440)本例:本例:總體截距的總

18、體截距的95%的可信區間為(的可信區間為(-15.2341, 1.2735)57兩變量間的回歸分析兩變量間的回歸分析直線回歸分析直線回歸分析 直線回歸分析的步驟直線回歸分析的步驟6 6 直線回歸方程的區間估計直線回歸方程的區間估計(2) 總體均數總體均數 的可信區間估計的可信區間估計 XY58兩變量間的回歸分析兩變量間的回歸分析直線回歸分析直線回歸分析 直線回歸分析的步驟直線回歸分析的步驟6 6 直線回歸方程的區間估計直線回歸方程的區間估計(2) 總體均數總體均數 的可信區間估計的可信區間估計 XY59兩變量間的回歸分析兩變量間的回歸分析直線回歸分析直線回歸分析 直線回歸分析的步驟直線回歸分析的步驟6 6 直線回歸方程的區間估計直線回歸方程的區間估計(3) 個體個體Y值的預測區間值的預測區間 60兩變量間的回歸分析兩變量間的回歸分析直線回歸分析直線回歸分析 直線回歸分析的步驟

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論