南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)課件_第1頁(yè)
南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)課件_第2頁(yè)
南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)課件_第3頁(yè)
南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)課件_第4頁(yè)
南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)課件_第5頁(yè)
已閱讀5頁(yè),還剩51頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)雙變量直線回歸與相關(guān)雙變量直線回歸與相關(guān)(2 (2學(xué)時(shí))學(xué)時(shí))南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān) 在大量的醫(yī)學(xué)科研與實(shí)踐中,經(jīng)常會(huì)遇到對(duì)在大量的醫(yī)學(xué)科研與實(shí)踐中,經(jīng)常會(huì)遇到對(duì)兩個(gè)變量之間關(guān)系的研究,例如糖尿病人的血糖兩個(gè)變量之間關(guān)系的研究,例如糖尿病人的血糖與其胰島素水平的關(guān)系如何;某人群年齡的變化與其胰島素水平的關(guān)系如何;某人群年齡的變化與其收縮壓的關(guān)系怎樣等;此時(shí)常用回歸與相關(guān)與其收縮壓的關(guān)系怎樣等;此時(shí)常用回歸與相關(guān)分析。分析。1.直線相關(guān)直線相關(guān)(簡(jiǎn)單相關(guān)簡(jiǎn)單相關(guān)): 是研究事物或現(xiàn)象之間有是研究事物或現(xiàn)象之間有無(wú)關(guān)系以及關(guān)系的

2、方向和密切程度。無(wú)關(guān)系以及關(guān)系的方向和密切程度。2.直線回歸直線回歸(簡(jiǎn)單回歸簡(jiǎn)單回歸): 是研究事物或現(xiàn)象之間的是研究事物或現(xiàn)象之間的數(shù)量依存關(guān)系。數(shù)量依存關(guān)系。南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)設(shè)兩個(gè)連續(xù)性變量分別為:設(shè)兩個(gè)連續(xù)性變量分別為:x yx -為自變量。為自變量。要求為隨機(jī)正態(tài)變量或?yàn)榫_控制的變量要求為隨機(jī)正態(tài)變量或?yàn)榫_控制的變量y為依賴于為依賴于x的變量,稱作因變量的變量,稱作因變量(反應(yīng)變量反應(yīng)變量)。要求為隨要求為隨機(jī)正態(tài)變量。機(jī)正態(tài)變量。 若若x為精確控制的變量,為精確控制的變量,y為隨機(jī)正態(tài)變量。只能作回為隨機(jī)正態(tài)變量。只能作回歸分析,即由歸分析,即由x

3、的大小來(lái)推算的大小來(lái)推算y的大小。的大小。 若若x與與y均為隨機(jī)正態(tài)變量。既可作相關(guān)分析,也可作均為隨機(jī)正態(tài)變量。既可作相關(guān)分析,也可作回歸分析。回歸分析。 由由x的大小來(lái)推算的大小來(lái)推算y的大小的大小型回歸型回歸 由由 y的大小來(lái)推算的的大小來(lái)推算的x大小大小型回歸型回歸 。南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)一、直線回歸的概念一、直線回歸的概念 以某市以某市汽車流量與大氣中二氧化氮濃汽車流量與大氣中二氧化氮濃度的數(shù)據(jù)度的數(shù)據(jù)( (見(jiàn)例見(jiàn)例12-1)12-1)在坐標(biāo)紙上描點(diǎn),得在坐標(biāo)紙上描點(diǎn),得到圖所示散點(diǎn)圖。到圖所示散點(diǎn)圖。第一節(jié)第一節(jié) 直線回歸直線回歸南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)

4、雙變量直線回歸與相關(guān) 汽車流量汽車流量(輛輛/小時(shí)小時(shí))NO2(mg/l)汽車流量汽車流量(輛輛/小時(shí)小時(shí)) NO2(mg/l)13000.06615000.12014440.07614760.12916520.17018200.13517560.15610600.02912000.040汽車流量與大氣中二氧化汽車流量與大氣中二氧化氮氮濃度的關(guān)系濃度的關(guān)系南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)圖圖 汽車流量與大氣中二氧化汽車流量與大氣中二氧化氮氮濃度的關(guān)系濃度的關(guān)系汽車流量( 輛/ 小時(shí) )200018001600140012001000二氧化氮濃度( m g / l ).18.16.

5、14.12.10.08.06.04.02南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)設(shè)兩個(gè)連續(xù)性變量分別為:設(shè)兩個(gè)連續(xù)性變量分別為:x yx y 汽車流量為自變量汽車流量為自變量x x,大氣中二氧化氮濃度,大氣中二氧化氮濃度為因變量為因變量y y。從圖中可以看出,兩個(gè)變量之間有。從圖中可以看出,兩個(gè)變量之間有一定的數(shù)量關(guān)系,但并非一一對(duì)應(yīng)的函數(shù)關(guān)系。一定的數(shù)量關(guān)系,但并非一一對(duì)應(yīng)的函數(shù)關(guān)系。這種關(guān)系被稱為回歸關(guān)系。這種關(guān)系被稱為回歸關(guān)系。 直線回歸分析的主要任務(wù)是找出最合適的一直線回歸分析的主要任務(wù)是找出最合適的一條直線回歸方程,以確定一條最接近各實(shí)測(cè)點(diǎn)的條直線回歸方程,以確定一條最接近各實(shí)

6、測(cè)點(diǎn)的直線來(lái)描述兩個(gè)變量之間的線性回歸關(guān)系。直線來(lái)描述兩個(gè)變量之間的線性回歸關(guān)系。南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)設(shè)直線回歸方程為設(shè)直線回歸方程為: : y=a+by=a+bx a為回歸直線在為回歸直線在y軸上的截距,軸上的截距,其統(tǒng)計(jì)意義其統(tǒng)計(jì)意義是當(dāng)是當(dāng)X X取值為取值為0 0時(shí)相應(yīng)時(shí)相應(yīng)y y的均數(shù)估計(jì)值;的均數(shù)估計(jì)值; a0, 交點(diǎn)在原點(diǎn)之上交點(diǎn)在原點(diǎn)之上 a0b0時(shí)直線從左下方走向右上方,時(shí)直線從左下方走向右上方,y y隨隨x x的增大的增大而增大;而增大; b0b0時(shí)直線從左上方走向右下方,時(shí)直線從左上方走向右下方,y y隨隨x x的增大的增大而減小;而減小; b=0

7、b=0時(shí)直線與時(shí)直線與x x軸平行,軸平行,y y與與X X無(wú)直線關(guān)系。無(wú)直線關(guān)系。 南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)二二 直線回歸方程的求法直線回歸方程的求法 如果能夠從樣本數(shù)據(jù)中求得如果能夠從樣本數(shù)據(jù)中求得a、b的數(shù)值,回歸的數(shù)值,回歸方程即可唯一確定。從散點(diǎn)圖中來(lái)看,求解方程即可唯一確定。從散點(diǎn)圖中來(lái)看,求解a、b實(shí)實(shí)際上就是怎樣際上就是怎樣“合理地合理地”找到一條能最好地代表數(shù)找到一條能最好地代表數(shù)據(jù)點(diǎn)分布趨勢(shì)的直線。據(jù)點(diǎn)分布趨勢(shì)的直線。 將實(shí)測(cè)值將實(shí)測(cè)值y與假定回歸線上的估計(jì)值與假定回歸線上的估計(jì)值 y 的縱向的縱向距離距離(y- y) , 稱為殘差或剩余值稱為殘差或剩

8、余值 南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān) 各點(diǎn)殘差要盡可能的小。由于考慮所有點(diǎn)之各點(diǎn)殘差要盡可能的小。由于考慮所有點(diǎn)之殘差有正有負(fù),所以通常取各點(diǎn)殘差平方和最小殘差有正有負(fù),所以通常取各點(diǎn)殘差平方和最小的直線為所求,這就是所謂的直線為所求,這就是所謂“最小二乘最小二乘” 原則原則。在一定假設(shè)條件下,如此得到的回歸系數(shù)最為理在一定假設(shè)條件下,如此得到的回歸系數(shù)最為理想。按照這一原則,數(shù)學(xué)上可以容易地得到想。按照這一原則,數(shù)學(xué)上可以容易地得到a、b的計(jì)算公式為的計(jì)算公式為: 南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān) l lxyxy, ,為為x x與與y y的離均差乘積和,簡(jiǎn)稱的離

9、均差乘積和,簡(jiǎn)稱離均差積和離均差積和b=l lxyxy=(x- x)(y- y)=xy-xy/nl lxxxx(x- x)2x2-(x)2/na= y-b x南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān) 可以在散點(diǎn)圖上繪制出樣本回歸直線作為可以在散點(diǎn)圖上繪制出樣本回歸直線作為一種直觀的統(tǒng)計(jì)描述補(bǔ)充形式,此直線必然通過(guò)一種直觀的統(tǒng)計(jì)描述補(bǔ)充形式,此直線必然通過(guò)點(diǎn)點(diǎn)( ( X X, , Y Y) )且與縱坐標(biāo)軸相交于截距且與縱坐標(biāo)軸相交于截距a a。 如果散點(diǎn)圖沒(méi)有從坐標(biāo)系原點(diǎn)開(kāi)始,可在自如果散點(diǎn)圖沒(méi)有從坐標(biāo)系原點(diǎn)開(kāi)始,可在自變量實(shí)測(cè)范圍內(nèi)遠(yuǎn)端取易于讀數(shù)的變量實(shí)測(cè)范圍內(nèi)遠(yuǎn)端取易于讀數(shù)的X X值代

10、人回歸值代人回歸方程得到一個(gè)點(diǎn)的坐標(biāo),連接此點(diǎn)與點(diǎn)方程得到一個(gè)點(diǎn)的坐標(biāo),連接此點(diǎn)與點(diǎn)( ( X,X, Y Y) )也可繪出回歸直線。也可繪出回歸直線。南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)1.繪制散點(diǎn)圖繪制散點(diǎn)圖2.計(jì)算基本數(shù)據(jù)計(jì)算基本數(shù)據(jù) x=13208, x2=19892352, y=0.921, y2=0.115075, xy=1445.164, x=1467, y=0.1023lxx= (x- x)2= x2 -( x)2/n=19892352-132082/9=508878.223lyy= (y- y)2= y2 -( y)2/n=0.115075-0.9212/9=0.02

11、0826lxy= (x- x)(y- y)= xy-( x)( y)/n=1445.164-13208 0.921/9=93.545南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān).計(jì)算計(jì)算a、b的大小的大小b= lxy/lxx=93.545/508878.223=0.0001838a=0.1023-0.0001838 1467.56=-0.1674.建立回歸方程建立回歸方程y = -0.1674+0.0001838x5.直線回歸的圖示法直線回歸的圖示法回歸線回歸線 根據(jù)已求得的直線回歸方程,可在自變量實(shí)測(cè)范圍內(nèi)根據(jù)已求得的直線回歸方程,可在自變量實(shí)測(cè)范圍內(nèi)遠(yuǎn)端取易于讀數(shù)的遠(yuǎn)端取易于讀數(shù)的X X

12、值代人回歸方程得到一個(gè)點(diǎn)的坐標(biāo),值代人回歸方程得到一個(gè)點(diǎn)的坐標(biāo),連接此點(diǎn)與點(diǎn)連接此點(diǎn)與點(diǎn)( ( X, Y) )也可繪出回歸直線也可繪出回歸直線南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān) 三三 直線回歸中的統(tǒng)計(jì)推斷:直線回歸中的統(tǒng)計(jì)推斷:即回歸方程的假設(shè)檢驗(yàn)即回歸方程的假設(shè)檢驗(yàn) 建立樣本直線回歸方程,還必須回答它所來(lái)自總建立樣本直線回歸方程,還必須回答它所來(lái)自總體的直線回歸關(guān)系是否確實(shí)存在,即是否對(duì)總體有體的直線回歸關(guān)系是否確實(shí)存在,即是否對(duì)總體有0? 0? 若無(wú)論若無(wú)論X X如何取值,如何取值,y y的總體均數(shù)的總體均數(shù) y.xy.x總在一條水平總在一條水平線上,即線上,即 =0=0,總體

13、直線回歸方程并不成立,總體直線回歸方程并不成立,Y Y與與X X無(wú)直無(wú)直線關(guān)系。線關(guān)系。 然而在一次隨機(jī)抽樣中,則會(huì)得到一個(gè)并不等于然而在一次隨機(jī)抽樣中,則會(huì)得到一個(gè)并不等于0 0的樣本回歸系數(shù)的樣本回歸系數(shù)b b。b b與與0 0相差到多大可以認(rèn)為具有統(tǒng)計(jì)相差到多大可以認(rèn)為具有統(tǒng)計(jì)學(xué)意義學(xué)意義? ?可用方差分析或與其等價(jià)的可用方差分析或與其等價(jià)的t t檢驗(yàn)。檢驗(yàn)。南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān) t t檢驗(yàn):檢驗(yàn):檢驗(yàn)檢驗(yàn) 0 0? Sy.x =(y- y)y)2 2 (y-y )2lyyyy-b-blxy xy = = (y - y)2- (x- x)(y- y) S Sy.

14、xy.x為回歸的剩余標(biāo)準(zhǔn)差,為回歸的剩余標(biāo)準(zhǔn)差,S Sb b為樣本回歸系數(shù)標(biāo)準(zhǔn)誤。為樣本回歸系數(shù)標(biāo)準(zhǔn)誤。擴(kuò)大自變量的取值范圍可減小擴(kuò)大自變量的取值范圍可減小S Sb b,使得回歸系數(shù)的估計(jì)更,使得回歸系數(shù)的估計(jì)更穩(wěn)定。穩(wěn)定。 (x- x)2tb=bSbSb=Sy.x=Sy.x(x- x)x)2 2lxxn-2南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)H H0 0: =0=0,即大氣中二氧化氮濃度與汽車流量之間無(wú)直線關(guān)系,即大氣中二氧化氮濃度與汽車流量之間無(wú)直線關(guān)系H H1 1:0 0,即大氣中二氧化氮濃度與汽車流量之間有直線關(guān)系,即大氣中二氧化氮濃度與汽車流量之間有直線關(guān)系 =0.05=0

15、.05 (y-y )2lyy-blxy=0.020826-93.5452/508878.223=0.00363Sy.x= 0.00363 = 0.022772Sb= 0.0227720.022772 = 0.00003192tb= 0.0001838 = 5.769-2 508878.2230.00003192 查查t t界值表,得界值表,得P0.01P0: r0: 為正表示正相關(guān),為正表示正相關(guān), r0: r0: 為負(fù)表示負(fù)相關(guān),為負(fù)表示負(fù)相關(guān), r=0: r=0: 為零相關(guān)為零相關(guān) r=r=1: 1: 為完全相關(guān)為完全相關(guān) 在生物界由于影響因素眾多,很少在生物界由于影響因素眾多,很少完全相

16、關(guān)。完全相關(guān)。南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)注意:注意: (1)r(1)r實(shí)際上是就總體相關(guān)系數(shù)實(shí)際上是就總體相關(guān)系數(shù) 來(lái)說(shuō)的,來(lái)說(shuō)的,r r是是 的估計(jì)值。的估計(jì)值。 (2)(2)有相關(guān)并不一定表示一個(gè)變量的改變是有相關(guān)并不一定表示一個(gè)變量的改變是另一個(gè)變量變化的原因,有可能同受另一個(gè)因素另一個(gè)變量變化的原因,有可能同受另一個(gè)因素的影響。因此,的影響。因此,相關(guān)關(guān)系并不一定是因果關(guān)系。相關(guān)關(guān)系并不一定是因果關(guān)系。南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)計(jì)算相關(guān)系數(shù)計(jì)算相關(guān)系數(shù)1.繪制散點(diǎn)圖繪制散點(diǎn)圖2.計(jì)算基本數(shù)據(jù)計(jì)算基本數(shù)據(jù) x=100.8, x2=641.5648,

17、 y=554.34, y2=19804.6540, xy=3543.9281,r = xy-(xy-( x)(x)( y)/ny)/n= 3543.9281-(100.8)(554.34)/163543.9281-(100.8)(554.34)/16 = 0.8304 x2-( x)2/n y2-( y)2/n 641.5648-100.82/1619804.6540-554.342/16南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)三、相關(guān)系數(shù)的統(tǒng)計(jì)推斷三、相關(guān)系數(shù)的統(tǒng)計(jì)推斷 從同一總體抽出的不同樣本會(huì)得到不同從同一總體抽出的不同樣本會(huì)得到不同的樣本相關(guān)系數(shù),所以要判斷的樣本相關(guān)系數(shù),所以要

18、判斷x x、y y間是否確間是否確有相關(guān)關(guān)系,就要檢驗(yàn)有相關(guān)關(guān)系,就要檢驗(yàn)r r是否來(lái)自是否來(lái)自0 0的總體。的總體。 因?yàn)榧词箯囊驗(yàn)榧词箯?=0=0的總體作隨機(jī)抽樣,由于的總體作隨機(jī)抽樣,由于抽樣誤差的影響,所得抽樣誤差的影響,所得r r值也常不等于零。故值也常不等于零。故當(dāng)計(jì)算出當(dāng)計(jì)算出r r值后,接著做值后,接著做 =0=0的假設(shè)檢驗(yàn)。的假設(shè)檢驗(yàn)。南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)1.t1.t檢驗(yàn)檢驗(yàn) t tr r= = r rn n-2-2 式中分母為相關(guān)系數(shù)的標(biāo)準(zhǔn)誤。式中分母為相關(guān)系數(shù)的標(biāo)準(zhǔn)誤。求得求得t t值后查值后查t t界值表得界值表得P P值,按所值,按所取檢驗(yàn)水

19、準(zhǔn)做出推斷結(jié)論;取檢驗(yàn)水準(zhǔn)做出推斷結(jié)論;1-r2南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)例例9-6 9-6 對(duì)例對(duì)例12-212-2所得所得r r值,檢驗(yàn)值,檢驗(yàn)學(xué)生的言語(yǔ)測(cè)驗(yàn)得分和母學(xué)生的言語(yǔ)測(cè)驗(yàn)得分和母親的教育水平親的教育水平是否有直線相關(guān)關(guān)系是否有直線相關(guān)關(guān)系? ?H H0 0: =0=0,即,即學(xué)生的言語(yǔ)測(cè)驗(yàn)得分和母親的教育水平學(xué)生的言語(yǔ)測(cè)驗(yàn)得分和母親的教育水平之間之間無(wú)直線相關(guān)關(guān)系無(wú)直線相關(guān)關(guān)系H H1 1:0 0,即,即學(xué)生的言語(yǔ)測(cè)驗(yàn)得分和母親的教育水平學(xué)生的言語(yǔ)測(cè)驗(yàn)得分和母親的教育水平之間之間有直線相關(guān)關(guān)系有直線相關(guān)關(guān)系 =0.05=0.05本例本例n=16n=16,r=0

20、.8304,t tr r=r=r n-2n-2 =0.8304 =0.8304 16 - 216 - 2 = 5.58 = 5.58查查t t界值表,得界值表,得P0.01Prrr0.01,14 0.01,14 , P0.01, P0.01 按按 =0.05=0.05水準(zhǔn)拒絕水準(zhǔn)拒絕H H0 0, ,接受接受H H1 1,可以認(rèn)為,可以認(rèn)為學(xué)生的言語(yǔ)測(cè)驗(yàn)得分和母親的教育水平學(xué)生的言語(yǔ)測(cè)驗(yàn)得分和母親的教育水平之間之間有直線關(guān)系有直線關(guān)系南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)注意:對(duì)同一份數(shù)據(jù),對(duì)總體相關(guān)系數(shù)作假注意:對(duì)同一份數(shù)據(jù),對(duì)總體相關(guān)系數(shù)作假設(shè)檢驗(yàn)的設(shè)檢驗(yàn)的t t值與前述對(duì)總體回歸

21、系數(shù)作假設(shè)檢值與前述對(duì)總體回歸系數(shù)作假設(shè)檢驗(yàn)的驗(yàn)的t t值相等。即值相等。即t tb b=t=tr r 對(duì)既可以作回歸又可以作相關(guān)的同一樣對(duì)既可以作回歸又可以作相關(guān)的同一樣本,理論上二者的假設(shè)檢驗(yàn)等價(jià)。本,理論上二者的假設(shè)檢驗(yàn)等價(jià)。 實(shí)際應(yīng)用中通過(guò)查附表實(shí)際應(yīng)用中通過(guò)查附表12-412-4的的r r界值表代界值表代替對(duì)替對(duì) 的假設(shè)檢驗(yàn)的假設(shè)檢驗(yàn)。南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)第三節(jié)第三節(jié) 秩相關(guān)秩相關(guān)一、一、秩相關(guān)的概念秩相關(guān)的概念 秩相關(guān)秩相關(guān)(rank correlation)或稱等級(jí)相或稱等級(jí)相關(guān)是用雙變量等級(jí)數(shù)據(jù)作直線相關(guān)分析,關(guān)是用雙變量等級(jí)數(shù)據(jù)作直線相關(guān)分析,這類方

22、法由于對(duì)原變量分布不作要求,故這類方法由于對(duì)原變量分布不作要求,故而屬于非參數(shù)統(tǒng)計(jì)方而屬于非參數(shù)統(tǒng)計(jì)方南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)適用于下列資料:適用于下列資料:不服從雙變量正態(tài)分布不服從雙變量正態(tài)分布而不宜作積差相關(guān)分而不宜作積差相關(guān)分析,這一點(diǎn)從原始數(shù)據(jù)的基本統(tǒng)計(jì)描述或直觀析,這一點(diǎn)從原始數(shù)據(jù)的基本統(tǒng)計(jì)描述或直觀的散點(diǎn)圖中可以看出;的散點(diǎn)圖中可以看出;總體分布型未知總體分布型未知,例如限于儀器測(cè)量精度個(gè),例如限于儀器測(cè)量精度個(gè)別樣品的具體數(shù)值無(wú)法讀出而出現(xiàn)別樣品的具體數(shù)值無(wú)法讀出而出現(xiàn)“超限值超限值 時(shí)時(shí)( (如如X0.001)X50n50時(shí),按下式計(jì)算檢驗(yàn)統(tǒng)計(jì)量時(shí),按下

23、式計(jì)算檢驗(yàn)統(tǒng)計(jì)量u u,查查u u界值表確定界值表確定P P值。值。u = rsn-1南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)例例12-3 某醫(yī)師研究高中生心理素質(zhì)與個(gè)人身體某醫(yī)師研究高中生心理素質(zhì)與個(gè)人身體健康狀況之間的關(guān)系,心理素質(zhì)與個(gè)人身體健健康狀況之間的關(guān)系,心理素質(zhì)與個(gè)人身體健康狀況均按康狀況均按5個(gè)等級(jí)記分個(gè)等級(jí)記分(記為記為1,2,3,4,5;5為最好為最好),見(jiàn)表,見(jiàn)表12-3。用。用Spearman等級(jí)相關(guān)分等級(jí)相關(guān)分析二者之間的關(guān)系。析二者之間的關(guān)系。南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)編編號(hào)號(hào)(1) 身體健康狀身體健康狀況自我評(píng)分況自我評(píng)分x(2)心理素質(zhì)

24、心理素質(zhì)自我評(píng)分自我評(píng)分y(3)x的秩次的秩次(4)y的秩次的秩次(5)的秩次的秩次差值差值d(6)d2(7)12121112324.522.56.2534374.52.56.254334.54.50052324.5-2.56.2562324.5-2.56.257549.572.56.2584579-249559.590.50.25104579-24高中生心理素質(zhì)與個(gè)人身體健康狀況之間的高中生心理素質(zhì)與個(gè)人身體健康狀況之間的Spearman等級(jí)相關(guān)分析等級(jí)相關(guān)分析d2 =40.5南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)計(jì)算等級(jí)相關(guān)系數(shù)的步驟計(jì)算等級(jí)相關(guān)系數(shù)的步驟:1.將每個(gè)變量的觀察值分

25、別由小到大排列等級(jí)將每個(gè)變量的觀察值分別由小到大排列等級(jí)2.求每對(duì)觀察值等級(jí)的差值求每對(duì)觀察值等級(jí)的差值d及差值的平方及差值的平方d2、及、及平方和平方和d2 3.求等級(jí)相關(guān)系數(shù)求等級(jí)相關(guān)系數(shù)4.秩相關(guān)秩相關(guān)系數(shù)系數(shù)假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)rs=1-6d2n(n2-1)=1-640.5=0.75510(102-1)南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)查表法:查表法: H H0 0: s s=0=0, H H1 1: s s 0 0, =0.05=0.05 按按n n和和 查附表查附表12-5 r12-5 rs s界值表,界值表, r rs(0.05,10)s(0.05,10)=0.648,

26、r=0.648, rs srrs(0.05,10)s(0.05,10), P0.05, P0.05 按按 =0.05=0.05水準(zhǔn)拒絕水準(zhǔn)拒絕H H0 0, ,接受接受H H1 1,可以認(rèn)為,可以認(rèn)為高中生心高中生心理素質(zhì)與個(gè)人身體健康狀況之間有理素質(zhì)與個(gè)人身體健康狀況之間有Spearman等級(jí)相等級(jí)相關(guān)關(guān)關(guān)系關(guān)系南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)第四節(jié)第四節(jié) 直線回歸與相關(guān)應(yīng)用直線回歸與相關(guān)應(yīng)用的注意事項(xiàng)的注意事項(xiàng)南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)1.1.根據(jù)分析目的選擇變量及統(tǒng)計(jì)方法根據(jù)分析目的選擇變量及統(tǒng)計(jì)方法 直線相關(guān):直線相關(guān):用于說(shuō)明兩變量之間直線關(guān)系的方用

27、于說(shuō)明兩變量之間直線關(guān)系的方向和密切程度。向和密切程度。x x與與y y沒(méi)有主次之分;沒(méi)有主次之分; 直線回歸:直線回歸:更進(jìn)一步地用于定量刻畫(huà)應(yīng)變量更進(jìn)一步地用于定量刻畫(huà)應(yīng)變量y y對(duì)對(duì)自變量自變量x x在數(shù)值上的依存關(guān)系。其中哪一個(gè)作為應(yīng)變?cè)跀?shù)值上的依存關(guān)系。其中哪一個(gè)作為應(yīng)變量主要是根據(jù)專業(yè)上的要求而定,可以考慮把易于量主要是根據(jù)專業(yè)上的要求而定,可以考慮把易于精確測(cè)量的變量作為精確測(cè)量的變量作為x x,另一個(gè)隨機(jī)變量作,另一個(gè)隨機(jī)變量作y y。例如。例如用身高估計(jì)體表面積。用身高估計(jì)體表面積。 兩個(gè)變量的選擇一定要結(jié)合專業(yè)背景,不能把兩個(gè)變量的選擇一定要結(jié)合專業(yè)背景,不能把毫無(wú)關(guān)聯(lián)的兩

28、種現(xiàn)象勉強(qiáng)作回歸或相關(guān)分析。毫無(wú)關(guān)聯(lián)的兩種現(xiàn)象勉強(qiáng)作回歸或相關(guān)分析。南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān)例如例如: :當(dāng)樣本足夠大時(shí),身高當(dāng)樣本足夠大時(shí),身高y y與家庭中的每月用與家庭中的每月用電量電量X X的線性回歸關(guān)系具有統(tǒng)計(jì)學(xué)意義的線性回歸關(guān)系具有統(tǒng)計(jì)學(xué)意義( (回歸系數(shù)回歸系數(shù)的假設(shè)檢驗(yàn)的假設(shè)檢驗(yàn)P0.05)P0.05),但這種結(jié)果很難說(shuō)有什么,但這種結(jié)果很難說(shuō)有什么專業(yè)上可解釋的實(shí)際意義。專業(yè)上可解釋的實(shí)際意義。同理,相關(guān)系數(shù)的假設(shè)檢驗(yàn)只是在冒一定風(fēng)險(xiǎn)情同理,相關(guān)系數(shù)的假設(shè)檢驗(yàn)只是在冒一定風(fēng)險(xiǎn)情況下說(shuō)明況下說(shuō)明0 0,總體中可能是,總體中可能是 =0.01=0.01, =

29、0.04=0.04等,等,這種相關(guān)并不一定在專業(yè)上有意義。這種相關(guān)并不一定在專業(yè)上有意義。r r應(yīng)達(dá)到應(yīng)達(dá)到0.400.40以上。以上。南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān) 2.2.進(jìn)行相關(guān)、回歸分析前應(yīng)繪制散點(diǎn)圖進(jìn)行相關(guān)、回歸分析前應(yīng)繪制散點(diǎn)圖 兩變量之間兩變量之間可能的關(guān)系除了從專業(yè)角度考慮,對(duì)現(xiàn)有數(shù)據(jù)來(lái)說(shuō)散可能的關(guān)系除了從專業(yè)角度考慮,對(duì)現(xiàn)有數(shù)據(jù)來(lái)說(shuō)散點(diǎn)圖是很重要的提示。回歸或相關(guān)分析的點(diǎn)圖是很重要的提示。回歸或相關(guān)分析的第一步就是第一步就是繪制散點(diǎn)圖繪制散點(diǎn)圖。直線相關(guān)分析:直線相關(guān)分析:要求要求x x與與y y服從雙變量正態(tài)分布服從雙變量正態(tài)分布直線回歸要求:直線回歸要求:至少對(duì)于每個(gè)至少對(duì)于每個(gè)x x相應(yīng)的相應(yīng)的y y要服從正態(tài)分要服從正態(tài)分布,布,x x可以是服從正態(tài)分布的隨機(jī)變量也可以是能精確可以是服從正態(tài)分布的隨機(jī)變量也可以是能精確測(cè)量和嚴(yán)格控制的非隨機(jī)變量測(cè)量和嚴(yán)格控制的非隨機(jī)變量(x(x也正態(tài)分布時(shí),根據(jù)也正態(tài)分布時(shí),根據(jù)研究目的可選擇由研究目的可選擇由x x估計(jì)估計(jì)y y或者由或者由y y估計(jì)估計(jì)x x,但一般隋況,但一般隋況下兩個(gè)回歸方程并不相同下兩個(gè)回歸方程并不相同) )。南華大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生學(xué)雙變量直線回歸與相關(guān) 散點(diǎn)圖是考察數(shù)據(jù)是

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論