醫(yī)學(xué)統(tǒng)計學(xué)雙變量回歸與相關(guān)課件_第1頁
醫(yī)學(xué)統(tǒng)計學(xué)雙變量回歸與相關(guān)課件_第2頁
醫(yī)學(xué)統(tǒng)計學(xué)雙變量回歸與相關(guān)課件_第3頁
醫(yī)學(xué)統(tǒng)計學(xué)雙變量回歸與相關(guān)課件_第4頁
醫(yī)學(xué)統(tǒng)計學(xué)雙變量回歸與相關(guān)課件_第5頁
已閱讀5頁,還剩191頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)1

雙變量回歸與相關(guān)BivariateRegression&Correlation第二軍醫(yī)大學(xué)衛(wèi)生統(tǒng)計學(xué)教研室張羅漫第9章2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)1Bivariate2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)2

講課內(nèi)容:

第一節(jié)直線回歸(重點)

第二節(jié)直線相關(guān)(重點)

第三節(jié)秩相關(guān)第六節(jié)兩條回歸直線的比較第七節(jié)曲線擬合2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)2講課內(nèi)容:2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)3

第2、第3、第4章介紹了計量資料單變量的統(tǒng)計描述與統(tǒng)計推斷:P.13

例2-1:計算101名成年女子血清總膽固醇的平均指標(biāo)與變異指標(biāo)。P.51

例3-7:比較阿卡波糖膠囊(試驗組)與拜糖蘋膠囊(對照組)降低糖尿病人的空腹血糖值

有無差別。P.73例4-2:比較安慰劑組、降血脂新藥2.4g

組、降血脂新藥4.8g組、降血脂新藥7.2g組降低患者的低密度脂蛋白含量有無差別。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)3第2、第3、第4章介2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)4在醫(yī)學(xué)研究中常要分析兩變量間或多變量間的關(guān)系:年齡與血壓藥物劑量與動物死亡率肺活量與身高、體重、胸圍和肩寬等...2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)4在醫(yī)學(xué)研究中常要分析兩變量間2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)5事物間的相關(guān)關(guān)系確定性關(guān)系兩變量間的函數(shù)表達(dá)式

圓的周長與半徑的關(guān)系:C=2R

路程與速度、時間的關(guān)系:L=ST

數(shù)學(xué)中X與Y的直線函數(shù)關(guān)系:Y=a+bX

非確定性關(guān)系

兩變量間存在關(guān)系,但未精確到可以用函數(shù)表達(dá)式來描述。

年齡與血脂的關(guān)系;身高與體重的關(guān)系;體重與體表面積的關(guān)系。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)5事物間的相關(guān)關(guān)系2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)6第一節(jié)直線回歸LinearRegression2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)6第一節(jié)直線回歸Line2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)7一、直線回歸的概念“回歸”是一個借用已久因而相沿成習(xí)的統(tǒng)計學(xué)術(shù)語。直線回歸是分析成對觀測數(shù)據(jù)中兩變量間線性依存關(guān)系的方法。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)7一、直線回歸的概念2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)8生物遺傳學(xué)上的“回歸”

PearsonK(英,1857~1936)1903年搜集了1078個家庭人員的身高、前臂長等指標(biāo)的記錄,發(fā)現(xiàn)兒子身高(Y,英寸)與父親身高間(X,英寸)存在線性依存關(guān)系:

=33.73+0.516X

但不少身材高的父親的兒子成年后身高比其父親矮,不少身材矮的父親的兒子成年后身高比其父親高。GaltonF(英,1822~1911)將這種現(xiàn)象稱之為子一代身高向人群平均身高的“回歸”。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)8生物遺傳學(xué)上的“回歸”2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)9Regression釋義210=10242022/11/10醫(yī)學(xué)統(tǒng)計學(xué)9Regression釋義22022/11/11醫(yī)學(xué)統(tǒng)計學(xué)10FrancisGaltonFrancisGalton爵士(英,1822~1911)是達(dá)爾文(CharlesDarwin)的表弟。他對統(tǒng)計學(xué)的主要貢獻(xiàn)是提出“相關(guān)”與“回歸”的概念,用統(tǒng)計方法對進(jìn)化論中的變異進(jìn)行研究,開創(chuàng)了生物統(tǒng)計學(xué)。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)10FrancisGalto2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)11KarlPearsonKarlPearson(英,1857~1936)是FrancisGalton的得意門生,他開創(chuàng)了統(tǒng)計方法學(xué)。他對統(tǒng)計學(xué)的主要貢獻(xiàn):變異數(shù)據(jù)的處理、分布曲線的選配、卡方檢驗的提出、回歸與相關(guān)的發(fā)展。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)11KarlPearsonK2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)12天文學(xué)上的“回歸”地球繞太陽公轉(zhuǎn),在公轉(zhuǎn)的同時本身還自轉(zhuǎn),在本身自轉(zhuǎn)的同時地球的假設(shè)軸心還來回擺動。由于地球軸心的來回擺動,太陽光垂直照射到地球上就有南、北兩個極限位置(南、北緯23027’),分別稱南、北回歸線,太陽光對赤道“回歸”垂直照射到南、北回歸線的時間分別為我國農(nóng)歷的冬至與夏至。

2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)12天文學(xué)上的“回歸”2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)13日常生活中的“回歸”現(xiàn)象

1歲姜二狗,7歲姜二狗同學(xué),20歲小姜同志,30歲姜科長,40歲姜處長,50歲姜局長,60歲姜老,70歲老姜,80歲姜二狗。

目前“回歸”已成為表示變量之間數(shù)量依存關(guān)系的統(tǒng)計術(shù)語,并且衍生出“回歸方程”、“回歸系數(shù)”等統(tǒng)計學(xué)概念。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)13日常生活中的“回歸”現(xiàn)象2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)14例某地方病研究所調(diào)查了8名正常兒童的尿肌酐含量(mmol/24h),試估計尿肌酐含量(Y)對其年齡(X)的回歸方程。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)14例某地方病研究所調(diào)查了2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)15年齡(歲)X尿肌酐含量Y(mmol/24h)hat2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)15年齡(歲)X尿肌酐含量Y(2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)16各散點呈直線趨勢但并非均在一條直線上根據(jù)原始數(shù)據(jù)擬合的直線方程與數(shù)理上二元一次函數(shù)方程在內(nèi)涵上有區(qū)別,稱為直線回歸方程。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)16各散點呈直線趨勢2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)17二、直線回歸方程的求法最小二乘法在所有直線中最小2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)17二、直線回歸方程的求法最小2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)182022/11/10醫(yī)學(xué)統(tǒng)計學(xué)18CASIOfx-3600PV計算器計算a、b與r步驟

鍵盤

說明

1MODE2

進(jìn)入線性回歸模式

LR2SHIFTKAC

清除以前儲存數(shù)據(jù)

313XDYD3.54DATA

數(shù)據(jù)輸入

11XDYD3.01DATA9XDYD3.09DATA4SHIFTr

顯示相關(guān)系數(shù)

0.88185SHIFTa

顯示截距

1.66176SHIFTb

顯示回歸系數(shù)

0.1392

SHIFTDEL刪除輸錯的一對數(shù)據(jù)CASIOfx-3600PV計算器計算a、b與r步驟2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)20年齡(歲)X尿肌酐含量Y(mmol/24h)(8,2.8)(12,3.3)2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)20年齡(歲)X尿肌酐含量Y(2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)21b的意義斜率(slope)

年齡每增加1歲,尿肌酐含量平均增加0.1392(mmol/24h)b的單位為(Y的單位/X的單位)2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)21b的意義斜率(slop2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)22a截距(intercept,constant)X=0時,Y的估計值a的單位與Y值相同當(dāng)X可能取0時,a才有實際意義。a的意義2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)22a截距(interce2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)23回歸直線的有關(guān)性質(zhì)直線通過均點各點到該回歸線縱向距離平方和較到其它任何直線者為小。

為來自的一個樣本對于X各個取值,相應(yīng)Y的總體均數(shù)2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)23回歸直線的有關(guān)性質(zhì)直線通過2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)24XY2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)24XY2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)25三、直線回歸方程中的統(tǒng)計推斷(一)回歸方程的假設(shè)檢驗1.方差分析(1)建立檢驗假設(shè)并確定檢驗水準(zhǔn)

H0:β=0H1:β≠0α=0.05的分解重點2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)25三、直線回歸方程中的統(tǒng)計推2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)26因變量Y總變異的分解X

Y

Y2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)26因變量Y總變異2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)27SS總=SS回+SS殘2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)27SS總=SS回+SS殘2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)28未引進(jìn)回歸時的總變異:

(sumofsquaresofdeviationfrommean)引進(jìn)回歸以后的剩余變異:

(sumofsquaresofresiduals)回歸的貢獻(xiàn),回歸平方和:

(sumofsquaresduetoregression)Y的總變異分解2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)28未引進(jìn)回歸時的總變異:Y的2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)29

(3)計算檢驗統(tǒng)計量F值SS總=lYY=1.0462

SS回=blXY=l2XY/lXX=5.8452/42=0.8134SS殘=SS總-SS回=1.0462-0.8134=0.2328v總=v回+v剩v總=n-1,v回=1,v殘=n-22022/11/10醫(yī)學(xué)統(tǒng)計學(xué)29(3)計算檢驗統(tǒng)計量F值2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)30F0.01(1,6)=13.742022/11/10醫(yī)學(xué)統(tǒng)計學(xué)30F0.01(1,6)=132022/11/11醫(yī)學(xué)統(tǒng)計學(xué)312.t檢驗回歸的剩余標(biāo)準(zhǔn)差扣除了X的影響后Y方面的變異;引進(jìn)回歸方程后,Y方面的變異。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)312.t檢驗回歸的剩余標(biāo)2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)32(2)計算檢驗統(tǒng)計量t值(1)建立檢驗假設(shè)并確定檢驗水準(zhǔn)(3)確定P值下結(jié)論

2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)32(2)計算檢驗統(tǒng)計量t2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)33

(二)總體回歸系數(shù)的可信區(qū)間此區(qū)間不包括β=0,結(jié)論為b有統(tǒng)計學(xué)意義。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)33(二)總體回歸系數(shù)的可2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)34

SPSS結(jié)果2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)34SPSS結(jié)果2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)35

(三)利用回歸方程進(jìn)行估計與預(yù)測1.總體均數(shù)的可信區(qū)間:給定X后對應(yīng)Y的總體均數(shù)給定X后對應(yīng)Y的樣本均數(shù)2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)35(三)利用回歸方程進(jìn)行估2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)362.個體Y值的容許區(qū)間

給定X后對應(yīng)個體Y值波動范圍2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)362.個體Y值的容許區(qū)間給2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)37

XY(體重,kg)(體表面積,103cm2) 11.0 5.283 11.8 5.299 12.0 5.358 12.3 5.292 13.1 5.602 13.7 6.014 14.4 5.830 14.9 6.102 15.2 6.075 16.0 6.411例某地10名三歲兒童體重與體表面積2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)37X2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)381112131415164.55.05.56.06.57.0可信區(qū)間與容許區(qū)間示意

(confidenceband&toleranceband)X體重Y體表面積2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)3811121314151642022/11/11醫(yī)學(xué)統(tǒng)計學(xué)39第二節(jié)直線相關(guān)LinearCorrelation2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)39第二節(jié)直線相關(guān)Lin2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)40生物遺傳學(xué)上的“相關(guān)”在回歸分析中,有理由認(rèn)為父親身高決定兒子身高,故把父親身高作為自變量X,兒子身高作為應(yīng)變量Y。PearsonK(英,1857~1936)在對同一家庭中兄弟與姐妹身高間關(guān)系進(jìn)行分析時,發(fā)現(xiàn)兩者難以象父親與兒子身高間關(guān)系那樣區(qū)別自變量X與應(yīng)變量Y,也不必計算回歸方程。GaltonF(英,1822~1911)將這種現(xiàn)象稱之為“相關(guān)”。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)40生物遺傳學(xué)上的“相關(guān)”2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)41

當(dāng)一個變量增大,另一個也隨之增大(或減少),我們稱這種現(xiàn)象為共變,或相關(guān)。兩個變量有共變現(xiàn)象,稱為有相關(guān)關(guān)系。相關(guān)關(guān)系不一定是因果關(guān)系。一、直線相關(guān)的概念2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)41當(dāng)一個變量增大,另一個也2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)42r=0(h)r=0(f)r=-1(d)r=1(b)0<r<1(a)-1<r<0(c)r0(e)r

0(g)零相關(guān)正相關(guān)負(fù)相關(guān)完全正相關(guān)完全負(fù)相關(guān)零相關(guān)零相關(guān)零相關(guān)相互關(guān)系示意圖2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)42r=0r=0r=-2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)43相關(guān)系數(shù)的性質(zhì)兩變量間的線性關(guān)系密切程度與相關(guān)方向用直線相關(guān)系數(shù)r表示。-1≤r≤1r>0為正相關(guān)r<0為負(fù)相關(guān)r=0為零相關(guān)或無相關(guān)2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)43相關(guān)系數(shù)的性質(zhì)兩變量間的線2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)44二、相關(guān)系數(shù)的意義與計算

Pearson相關(guān)系數(shù)標(biāo)準(zhǔn)化后的協(xié)方差2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)44二、相關(guān)系數(shù)的意義與計算2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)452022/11/10醫(yī)學(xué)統(tǒng)計學(xué)452022/11/11醫(yī)學(xué)統(tǒng)計學(xué)46SPSS結(jié)果2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)46SPSS結(jié)果2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)47三、相關(guān)系數(shù)的統(tǒng)計推斷(一)相關(guān)系數(shù)的假設(shè)檢驗?zāi)蚣◆颗c年齡之間無直線相關(guān)關(guān)系2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)47三、相關(guān)系數(shù)的統(tǒng)計推斷(一2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)48附表2附表132022/11/10醫(yī)學(xué)統(tǒng)計學(xué)48附表2附表132022/11/11醫(yī)學(xué)統(tǒng)計學(xué)49(二)總體相關(guān)系數(shù)的可信區(qū)間相關(guān)系數(shù)的抽樣分布在≠0時呈偏態(tài)分布Z的1-α可信區(qū)間:變換后r的1-α可信區(qū)間:Z變換后服從正態(tài)分布2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)49(二)總體相關(guān)系數(shù)的可信區(qū)2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)50相關(guān)系數(shù)的抽樣分布

(||=0.8,n=100,1000次抽樣)-0.8-0.6-0.4-0.20.00100200300-1.0

00.20.40.60.81.00100200300=-0.8=0.82022/11/10醫(yī)學(xué)統(tǒng)計學(xué)50相關(guān)系數(shù)的抽樣分布

(|2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)51R.A.Fisher(1921)的z變換

z近似服從均數(shù)為,標(biāo)準(zhǔn)差為的正態(tài)分布。

2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)51R.A.Fisher(12022/11/11醫(yī)學(xué)統(tǒng)計學(xué)52相關(guān)系數(shù)的z變換值的抽樣分布(=-0.8)00.51.01.52.0050100150200-0.8-0.6-0.4-0.20.00100200300-1.0變換前變換后2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)52相關(guān)系數(shù)的z變換值的抽樣分2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)53

01234050100150200

00.20.40.60.81.00100200300相關(guān)系數(shù)的z變換值的抽樣分布(=0.8)變換前變換后2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)530123405010012022/11/11醫(yī)學(xué)統(tǒng)計學(xué)54相關(guān)系數(shù)的可信區(qū)間估計1.將r變換為z。2.根據(jù)z服從正態(tài)分布,估計z的可信區(qū)間。3.再將z變換回r。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)54相關(guān)系數(shù)的可信區(qū)間估計1.2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)55求得8名健康成人血清總膽固醇與低密度脂蛋白膽固醇含量間的r=0.974,試求總體相關(guān)系數(shù)ρ的95%可信區(qū)間。z的95%可信區(qū)間:

總體相關(guān)系數(shù)ρ的95%可信區(qū)間:

(0.85870.9954)2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)55求得8名健康成人血清總膽固2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)56四、決定系數(shù)0﹤R2﹤1

Y的總變異中回歸關(guān)系所能解釋的百分比年齡可解釋尿肌酐含量變異性的77.75%2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)56四、決定系數(shù)0﹤R22022/11/11醫(yī)學(xué)統(tǒng)計學(xué)57五、直線回歸與直線相關(guān)的區(qū)別與聯(lián)系

區(qū)別

r沒有單位,b有單位;相關(guān)表示相互關(guān)系,沒有依存關(guān)系;回歸有依存關(guān)系;對資料的要求不同:

當(dāng)X和Y都是隨機(jī)的,可以進(jìn)行相關(guān)和回歸分析;

當(dāng)Y是隨機(jī)變量,X是控制變量時,理論上只能作回歸而不能作相關(guān)分析;2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)57五、直線回歸與直線相關(guān)的區(qū)2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)58

區(qū)別

I型回歸:Y是隨機(jī)變量,X是控制變量;

II型回歸:Y與X均是隨機(jī)變量。同一資料中由X推算Y與由Y推算X的回歸方程不同:2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)58區(qū)別2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)59

聯(lián)系均表示線性關(guān)系符號相同:共變方向一致假設(shè)檢驗結(jié)果相同:tr=tb

可以互相換算:

2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)59聯(lián)系假設(shè)檢驗結(jié)果相同:t2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)60六、直線回歸與相關(guān)應(yīng)用的注意事項相關(guān):X與Y沒有主次,為雙向。回歸:Y依X變化而變化,為單向。自變量的選擇:原因、容易測量、變異小要有實際意義。1.根據(jù)分析目的選擇變量及統(tǒng)計方法2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)60六、直線回歸與相關(guān)應(yīng)用的注2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)61孩子的身高與小樹的高度間顯示出顯著的相關(guān)性2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)61孩子的身高與小樹2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)62有無異常點,謹(jǐn)慎剔除。2.進(jìn)行相關(guān)、回歸分析前要繪制散點圖,進(jìn)行判斷2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)62有無異常點,謹(jǐn)慎剔除。2.2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)63離群值對相關(guān)的影響2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)63離群值對相關(guān)的影響2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)64樣本的間雜性對相關(guān)性的誤導(dǎo)2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)64樣本的間雜性對相關(guān)性的誤導(dǎo)2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)653.用殘差圖考察數(shù)據(jù)是否符合模型假設(shè)條件Y與X為線形關(guān)系誤差服從均數(shù)為0的正態(tài)分布方差相等各觀察單位獨立回歸模型應(yīng)用前提條件:2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)653.用殘差圖考察數(shù)據(jù)是否符2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)66e02022/11/10醫(yī)學(xué)統(tǒng)計學(xué)66e02022/11/11醫(yī)學(xué)統(tǒng)計學(xué)670000eeee2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)670000eeee2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)68P值越小越有理由認(rèn)為變量間直線關(guān)系存在,不能說關(guān)系越密切。直線回歸關(guān)系可以內(nèi)插,不宜外延。當(dāng)樣本含量較大時,統(tǒng)計學(xué)檢驗的作用減弱。r0.05/2,100=0.1954.結(jié)果的解釋及正確應(yīng)用2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)68P值越小越有理由認(rèn)為變量間2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)69第三節(jié)秩相關(guān)RankCorrelation一、Spearman秩相關(guān)2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)69第三節(jié)秩相關(guān)Ran2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)70應(yīng)用條件:1.不服從雙變量正態(tài)分布而不宜作積差相關(guān)分析;2.總體分布類型未知;3.原始數(shù)據(jù)用等級表示。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)70應(yīng)用條件:2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)71workyearsofpotentiallifelost2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)71workyearsof2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)722022/11/10醫(yī)學(xué)統(tǒng)計學(xué)722022/11/11醫(yī)學(xué)統(tǒng)計學(xué)73或用秩Pi、Qi直接計算積差相關(guān)系數(shù)r附表14(n≤50)2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)73或用秩Pi、Qi直接計算積2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)74SPSS結(jié)果2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)74SPSS結(jié)果2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)75第六節(jié)兩條回歸直線的比較

一、兩個回歸系數(shù)的比較二、兩個截距的比較2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)75第六節(jié)兩條回歸直線2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)762022/11/10醫(yī)學(xué)統(tǒng)計學(xué)762022/11/11醫(yī)學(xué)統(tǒng)計學(xué)77YXbcb2b1bc02022/11/10醫(yī)學(xué)統(tǒng)計學(xué)77YXbcb2b1bc02022/11/11醫(yī)學(xué)統(tǒng)計學(xué)78第七節(jié)曲線擬合

2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)78第七節(jié)曲線擬合2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)79一、曲線擬合的一般步驟

1.依據(jù)分析目的確定X與Y,根據(jù)兩變量散點圖、結(jié)合專業(yè)知識選擇曲線類型。

2.求回歸方程:曲線直線化。

3.擬合優(yōu)度:R2。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)79一、曲線擬合的一般步驟2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)80CRF:促腎上腺皮質(zhì)激素釋放因子ACTH:腎上腺皮質(zhì)激素例9-132022/11/10醫(yī)學(xué)統(tǒng)計學(xué)80CRF:促腎上腺皮質(zhì)激素釋2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)81

例9-13數(shù)據(jù)散點圖CRF(nmol/L)XYACTH(pmol/L)2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)81例9-13數(shù)據(jù)散點2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)822022/11/10醫(yī)學(xué)統(tǒng)計學(xué)822022/11/11醫(yī)學(xué)統(tǒng)計學(xué)83

例9-13數(shù)據(jù)對X作對數(shù)變換散點圖YACTH(pmol/L)lg[CRF(nmol/L)]X’2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)83例9-13數(shù)據(jù)對X作對2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)84例9-142022/11/10醫(yī)學(xué)統(tǒng)計學(xué)84例9-142022/11/11醫(yī)學(xué)統(tǒng)計學(xué)85

例9-14數(shù)據(jù)散點圖病人住院天數(shù)(天)XY預(yù)后指數(shù)2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)85例9-2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)86lnY預(yù)后指數(shù)

例9-14數(shù)據(jù)對Y作對數(shù)變換散點圖病人住院天數(shù)(天)X2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)86lnY預(yù)后指數(shù)例9-12022/11/11醫(yī)學(xué)統(tǒng)計學(xué)87用最小二乘估計只能保證最小不能保證將變換值方程回代后得到的最小。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)87用最小二乘估計只能保證2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)88

二、曲線擬合的用途

1.定量刻畫X與Y的關(guān)系。

2.用決定系數(shù)R2反應(yīng)兩變量曲線關(guān)系的密切程度。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)88二、曲線擬合的用途2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)89YX0三、常見的幾種曲線對數(shù)曲線2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)89YX0三、常見的幾種曲線對2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)90YX0指數(shù)曲線2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)90YX0指數(shù)曲線2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)91YX0Y=b0+b1X+b2X2

拋物線2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)91YX0Y=b0+b2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)92YXY=b0+b1X+b2X2+b3X3

03次多項式曲線2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)92YXY=b0+b12022/11/11醫(yī)學(xué)統(tǒng)計學(xué)93SPSS中曲線模型2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)93SPSS中曲線模型2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)942022/11/10醫(yī)學(xué)統(tǒng)計學(xué)94例9-13例9-13例9-14例9-142022/11/11醫(yī)學(xué)統(tǒng)計學(xué)97

講課內(nèi)容:

第一節(jié)直線回歸(重點)

第二節(jié)直線相關(guān)(重點)

第三節(jié)秩相關(guān)第六節(jié)兩條回歸直線的比較第七節(jié)曲線擬合2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)97講課內(nèi)容:2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)98Thankyou!2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)98Thankyou!2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)99

雙變量回歸與相關(guān)BivariateRegression&Correlation第二軍醫(yī)大學(xué)衛(wèi)生統(tǒng)計學(xué)教研室張羅漫第9章2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)1Bivariate2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)100

講課內(nèi)容:

第一節(jié)直線回歸(重點)

第二節(jié)直線相關(guān)(重點)

第三節(jié)秩相關(guān)第六節(jié)兩條回歸直線的比較第七節(jié)曲線擬合2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)2講課內(nèi)容:2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)101

第2、第3、第4章介紹了計量資料單變量的統(tǒng)計描述與統(tǒng)計推斷:P.13

例2-1:計算101名成年女子血清總膽固醇的平均指標(biāo)與變異指標(biāo)。P.51

例3-7:比較阿卡波糖膠囊(試驗組)與拜糖蘋膠囊(對照組)降低糖尿病人的空腹血糖值

有無差別。P.73例4-2:比較安慰劑組、降血脂新藥2.4g

組、降血脂新藥4.8g組、降血脂新藥7.2g組降低患者的低密度脂蛋白含量有無差別。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)3第2、第3、第4章介2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)102在醫(yī)學(xué)研究中常要分析兩變量間或多變量間的關(guān)系:年齡與血壓藥物劑量與動物死亡率肺活量與身高、體重、胸圍和肩寬等...2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)4在醫(yī)學(xué)研究中常要分析兩變量間2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)103事物間的相關(guān)關(guān)系確定性關(guān)系兩變量間的函數(shù)表達(dá)式

圓的周長與半徑的關(guān)系:C=2R

路程與速度、時間的關(guān)系:L=ST

數(shù)學(xué)中X與Y的直線函數(shù)關(guān)系:Y=a+bX

非確定性關(guān)系

兩變量間存在關(guān)系,但未精確到可以用函數(shù)表達(dá)式來描述。

年齡與血脂的關(guān)系;身高與體重的關(guān)系;體重與體表面積的關(guān)系。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)5事物間的相關(guān)關(guān)系2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)104第一節(jié)直線回歸LinearRegression2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)6第一節(jié)直線回歸Line2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)105一、直線回歸的概念“回歸”是一個借用已久因而相沿成習(xí)的統(tǒng)計學(xué)術(shù)語。直線回歸是分析成對觀測數(shù)據(jù)中兩變量間線性依存關(guān)系的方法。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)7一、直線回歸的概念2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)106生物遺傳學(xué)上的“回歸”

PearsonK(英,1857~1936)1903年搜集了1078個家庭人員的身高、前臂長等指標(biāo)的記錄,發(fā)現(xiàn)兒子身高(Y,英寸)與父親身高間(X,英寸)存在線性依存關(guān)系:

=33.73+0.516X

但不少身材高的父親的兒子成年后身高比其父親矮,不少身材矮的父親的兒子成年后身高比其父親高。GaltonF(英,1822~1911)將這種現(xiàn)象稱之為子一代身高向人群平均身高的“回歸”。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)8生物遺傳學(xué)上的“回歸”2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)107Regression釋義210=10242022/11/10醫(yī)學(xué)統(tǒng)計學(xué)9Regression釋義22022/11/11醫(yī)學(xué)統(tǒng)計學(xué)108FrancisGaltonFrancisGalton爵士(英,1822~1911)是達(dá)爾文(CharlesDarwin)的表弟。他對統(tǒng)計學(xué)的主要貢獻(xiàn)是提出“相關(guān)”與“回歸”的概念,用統(tǒng)計方法對進(jìn)化論中的變異進(jìn)行研究,開創(chuàng)了生物統(tǒng)計學(xué)。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)10FrancisGalto2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)109KarlPearsonKarlPearson(英,1857~1936)是FrancisGalton的得意門生,他開創(chuàng)了統(tǒng)計方法學(xué)。他對統(tǒng)計學(xué)的主要貢獻(xiàn):變異數(shù)據(jù)的處理、分布曲線的選配、卡方檢驗的提出、回歸與相關(guān)的發(fā)展。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)11KarlPearsonK2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)110天文學(xué)上的“回歸”地球繞太陽公轉(zhuǎn),在公轉(zhuǎn)的同時本身還自轉(zhuǎn),在本身自轉(zhuǎn)的同時地球的假設(shè)軸心還來回擺動。由于地球軸心的來回擺動,太陽光垂直照射到地球上就有南、北兩個極限位置(南、北緯23027’),分別稱南、北回歸線,太陽光對赤道“回歸”垂直照射到南、北回歸線的時間分別為我國農(nóng)歷的冬至與夏至。

2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)12天文學(xué)上的“回歸”2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)111日常生活中的“回歸”現(xiàn)象

1歲姜二狗,7歲姜二狗同學(xué),20歲小姜同志,30歲姜科長,40歲姜處長,50歲姜局長,60歲姜老,70歲老姜,80歲姜二狗。

目前“回歸”已成為表示變量之間數(shù)量依存關(guān)系的統(tǒng)計術(shù)語,并且衍生出“回歸方程”、“回歸系數(shù)”等統(tǒng)計學(xué)概念。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)13日常生活中的“回歸”現(xiàn)象2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)112例某地方病研究所調(diào)查了8名正常兒童的尿肌酐含量(mmol/24h),試估計尿肌酐含量(Y)對其年齡(X)的回歸方程。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)14例某地方病研究所調(diào)查了2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)113年齡(歲)X尿肌酐含量Y(mmol/24h)hat2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)15年齡(歲)X尿肌酐含量Y(2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)114各散點呈直線趨勢但并非均在一條直線上根據(jù)原始數(shù)據(jù)擬合的直線方程與數(shù)理上二元一次函數(shù)方程在內(nèi)涵上有區(qū)別,稱為直線回歸方程。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)16各散點呈直線趨勢2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)115二、直線回歸方程的求法最小二乘法在所有直線中最小2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)17二、直線回歸方程的求法最小2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)1162022/11/10醫(yī)學(xué)統(tǒng)計學(xué)18CASIOfx-3600PV計算器計算a、b與r步驟

鍵盤

說明

1MODE2

進(jìn)入線性回歸模式

LR2SHIFTKAC

清除以前儲存數(shù)據(jù)

313XDYD3.54DATA

數(shù)據(jù)輸入

11XDYD3.01DATA9XDYD3.09DATA4SHIFTr

顯示相關(guān)系數(shù)

0.88185SHIFTa

顯示截距

1.66176SHIFTb

顯示回歸系數(shù)

0.1392

SHIFTDEL刪除輸錯的一對數(shù)據(jù)CASIOfx-3600PV計算器計算a、b與r步驟2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)118年齡(歲)X尿肌酐含量Y(mmol/24h)(8,2.8)(12,3.3)2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)20年齡(歲)X尿肌酐含量Y(2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)119b的意義斜率(slope)

年齡每增加1歲,尿肌酐含量平均增加0.1392(mmol/24h)b的單位為(Y的單位/X的單位)2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)21b的意義斜率(slop2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)120a截距(intercept,constant)X=0時,Y的估計值a的單位與Y值相同當(dāng)X可能取0時,a才有實際意義。a的意義2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)22a截距(interce2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)121回歸直線的有關(guān)性質(zhì)直線通過均點各點到該回歸線縱向距離平方和較到其它任何直線者為小。

為來自的一個樣本對于X各個取值,相應(yīng)Y的總體均數(shù)2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)23回歸直線的有關(guān)性質(zhì)直線通過2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)122XY2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)24XY2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)123三、直線回歸方程中的統(tǒng)計推斷(一)回歸方程的假設(shè)檢驗1.方差分析(1)建立檢驗假設(shè)并確定檢驗水準(zhǔn)

H0:β=0H1:β≠0α=0.05的分解重點2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)25三、直線回歸方程中的統(tǒng)計推2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)124因變量Y總變異的分解X

Y

Y2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)26因變量Y總變異2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)125SS總=SS回+SS殘2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)27SS總=SS回+SS殘2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)126未引進(jìn)回歸時的總變異:

(sumofsquaresofdeviationfrommean)引進(jìn)回歸以后的剩余變異:

(sumofsquaresofresiduals)回歸的貢獻(xiàn),回歸平方和:

(sumofsquaresduetoregression)Y的總變異分解2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)28未引進(jìn)回歸時的總變異:Y的2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)127

(3)計算檢驗統(tǒng)計量F值SS總=lYY=1.0462

SS回=blXY=l2XY/lXX=5.8452/42=0.8134SS殘=SS總-SS回=1.0462-0.8134=0.2328v總=v回+v剩v總=n-1,v回=1,v殘=n-22022/11/10醫(yī)學(xué)統(tǒng)計學(xué)29(3)計算檢驗統(tǒng)計量F值2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)128F0.01(1,6)=13.742022/11/10醫(yī)學(xué)統(tǒng)計學(xué)30F0.01(1,6)=132022/11/11醫(yī)學(xué)統(tǒng)計學(xué)1292.t檢驗回歸的剩余標(biāo)準(zhǔn)差扣除了X的影響后Y方面的變異;引進(jìn)回歸方程后,Y方面的變異。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)312.t檢驗回歸的剩余標(biāo)2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)130(2)計算檢驗統(tǒng)計量t值(1)建立檢驗假設(shè)并確定檢驗水準(zhǔn)(3)確定P值下結(jié)論

2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)32(2)計算檢驗統(tǒng)計量t2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)131

(二)總體回歸系數(shù)的可信區(qū)間此區(qū)間不包括β=0,結(jié)論為b有統(tǒng)計學(xué)意義。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)33(二)總體回歸系數(shù)的可2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)132

SPSS結(jié)果2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)34SPSS結(jié)果2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)133

(三)利用回歸方程進(jìn)行估計與預(yù)測1.總體均數(shù)的可信區(qū)間:給定X后對應(yīng)Y的總體均數(shù)給定X后對應(yīng)Y的樣本均數(shù)2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)35(三)利用回歸方程進(jìn)行估2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)1342.個體Y值的容許區(qū)間

給定X后對應(yīng)個體Y值波動范圍2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)362.個體Y值的容許區(qū)間給2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)135

XY(體重,kg)(體表面積,103cm2) 11.0 5.283 11.8 5.299 12.0 5.358 12.3 5.292 13.1 5.602 13.7 6.014 14.4 5.830 14.9 6.102 15.2 6.075 16.0 6.411例某地10名三歲兒童體重與體表面積2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)37X2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)1361112131415164.55.05.56.06.57.0可信區(qū)間與容許區(qū)間示意

(confidenceband&toleranceband)X體重Y體表面積2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)3811121314151642022/11/11醫(yī)學(xué)統(tǒng)計學(xué)137第二節(jié)直線相關(guān)LinearCorrelation2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)39第二節(jié)直線相關(guān)Lin2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)138生物遺傳學(xué)上的“相關(guān)”在回歸分析中,有理由認(rèn)為父親身高決定兒子身高,故把父親身高作為自變量X,兒子身高作為應(yīng)變量Y。PearsonK(英,1857~1936)在對同一家庭中兄弟與姐妹身高間關(guān)系進(jìn)行分析時,發(fā)現(xiàn)兩者難以象父親與兒子身高間關(guān)系那樣區(qū)別自變量X與應(yīng)變量Y,也不必計算回歸方程。GaltonF(英,1822~1911)將這種現(xiàn)象稱之為“相關(guān)”。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)40生物遺傳學(xué)上的“相關(guān)”2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)139

當(dāng)一個變量增大,另一個也隨之增大(或減少),我們稱這種現(xiàn)象為共變,或相關(guān)。兩個變量有共變現(xiàn)象,稱為有相關(guān)關(guān)系。相關(guān)關(guān)系不一定是因果關(guān)系。一、直線相關(guān)的概念2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)41當(dāng)一個變量增大,另一個也2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)140r=0(h)r=0(f)r=-1(d)r=1(b)0<r<1(a)-1<r<0(c)r0(e)r

0(g)零相關(guān)正相關(guān)負(fù)相關(guān)完全正相關(guān)完全負(fù)相關(guān)零相關(guān)零相關(guān)零相關(guān)相互關(guān)系示意圖2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)42r=0r=0r=-2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)141相關(guān)系數(shù)的性質(zhì)兩變量間的線性關(guān)系密切程度與相關(guān)方向用直線相關(guān)系數(shù)r表示。-1≤r≤1r>0為正相關(guān)r<0為負(fù)相關(guān)r=0為零相關(guān)或無相關(guān)2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)43相關(guān)系數(shù)的性質(zhì)兩變量間的線2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)142二、相關(guān)系數(shù)的意義與計算

Pearson相關(guān)系數(shù)標(biāo)準(zhǔn)化后的協(xié)方差2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)44二、相關(guān)系數(shù)的意義與計算2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)1432022/11/10醫(yī)學(xué)統(tǒng)計學(xué)452022/11/11醫(yī)學(xué)統(tǒng)計學(xué)144SPSS結(jié)果2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)46SPSS結(jié)果2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)145三、相關(guān)系數(shù)的統(tǒng)計推斷(一)相關(guān)系數(shù)的假設(shè)檢驗?zāi)蚣◆颗c年齡之間無直線相關(guān)關(guān)系2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)47三、相關(guān)系數(shù)的統(tǒng)計推斷(一2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)146附表2附表132022/11/10醫(yī)學(xué)統(tǒng)計學(xué)48附表2附表132022/11/11醫(yī)學(xué)統(tǒng)計學(xué)147(二)總體相關(guān)系數(shù)的可信區(qū)間相關(guān)系數(shù)的抽樣分布在≠0時呈偏態(tài)分布Z的1-α可信區(qū)間:變換后r的1-α可信區(qū)間:Z變換后服從正態(tài)分布2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)49(二)總體相關(guān)系數(shù)的可信區(qū)2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)148相關(guān)系數(shù)的抽樣分布

(||=0.8,n=100,1000次抽樣)-0.8-0.6-0.4-0.20.00100200300-1.0

00.20.40.60.81.00100200300=-0.8=0.82022/11/10醫(yī)學(xué)統(tǒng)計學(xué)50相關(guān)系數(shù)的抽樣分布

(|2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)149R.A.Fisher(1921)的z變換

z近似服從均數(shù)為,標(biāo)準(zhǔn)差為的正態(tài)分布。

2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)51R.A.Fisher(12022/11/11醫(yī)學(xué)統(tǒng)計學(xué)150相關(guān)系數(shù)的z變換值的抽樣分布(=-0.8)00.51.01.52.0050100150200-0.8-0.6-0.4-0.20.00100200300-1.0變換前變換后2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)52相關(guān)系數(shù)的z變換值的抽樣分2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)151

01234050100150200

00.20.40.60.81.00100200300相關(guān)系數(shù)的z變換值的抽樣分布(=0.8)變換前變換后2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)530123405010012022/11/11醫(yī)學(xué)統(tǒng)計學(xué)152相關(guān)系數(shù)的可信區(qū)間估計1.將r變換為z。2.根據(jù)z服從正態(tài)分布,估計z的可信區(qū)間。3.再將z變換回r。2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)54相關(guān)系數(shù)的可信區(qū)間估計1.2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)153求得8名健康成人血清總膽固醇與低密度脂蛋白膽固醇含量間的r=0.974,試求總體相關(guān)系數(shù)ρ的95%可信區(qū)間。z的95%可信區(qū)間:

總體相關(guān)系數(shù)ρ的95%可信區(qū)間:

(0.85870.9954)2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)55求得8名健康成人血清總膽固2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)154四、決定系數(shù)0﹤R2﹤1

Y的總變異中回歸關(guān)系所能解釋的百分比年齡可解釋尿肌酐含量變異性的77.75%2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)56四、決定系數(shù)0﹤R22022/11/11醫(yī)學(xué)統(tǒng)計學(xué)155五、直線回歸與直線相關(guān)的區(qū)別與聯(lián)系

區(qū)別

r沒有單位,b有單位;相關(guān)表示相互關(guān)系,沒有依存關(guān)系;回歸有依存關(guān)系;對資料的要求不同:

當(dāng)X和Y都是隨機(jī)的,可以進(jìn)行相關(guān)和回歸分析;

當(dāng)Y是隨機(jī)變量,X是控制變量時,理論上只能作回歸而不能作相關(guān)分析;2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)57五、直線回歸與直線相關(guān)的區(qū)2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)156

區(qū)別

I型回歸:Y是隨機(jī)變量,X是控制變量;

II型回歸:Y與X均是隨機(jī)變量。同一資料中由X推算Y與由Y推算X的回歸方程不同:2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)58區(qū)別2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)157

聯(lián)系均表示線性關(guān)系符號相同:共變方向一致假設(shè)檢驗結(jié)果相同:tr=tb

可以互相換算:

2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)59聯(lián)系假設(shè)檢驗結(jié)果相同:t2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)158六、直線回歸與相關(guān)應(yīng)用的注意事項相關(guān):X與Y沒有主次,為雙向。回歸:Y依X變化而變化,為單向。自變量的選擇:原因、容易測量、變異小要有實際意義。1.根據(jù)分析目的選擇變量及統(tǒng)計方法2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)60六、直線回歸與相關(guān)應(yīng)用的注2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)159孩子的身高與小樹的高度間顯示出顯著的相關(guān)性2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)61孩子的身高與小樹2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)160有無異常點,謹(jǐn)慎剔除。2.進(jìn)行相關(guān)、回歸分析前要繪制散點圖,進(jìn)行判斷2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)62有無異常點,謹(jǐn)慎剔除。2.2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)161離群值對相關(guān)的影響2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)63離群值對相關(guān)的影響2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)162樣本的間雜性對相關(guān)性的誤導(dǎo)2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)64樣本的間雜性對相關(guān)性的誤導(dǎo)2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)1633.用殘差圖考察數(shù)據(jù)是否符合模型假設(shè)條件Y與X為線形關(guān)系誤差服從均數(shù)為0的正態(tài)分布方差相等各觀察單位獨立回歸模型應(yīng)用前提條件:2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)653.用殘差圖考察數(shù)據(jù)是否符2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)164e02022/11/10醫(yī)學(xué)統(tǒng)計學(xué)66e02022/11/11醫(yī)學(xué)統(tǒng)計學(xué)1650000eeee2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)670000eeee2022/11/11醫(yī)學(xué)統(tǒng)計學(xué)166P值越小越有理由認(rèn)為變量間直線關(guān)系存在,不能說關(guān)系越密切。直線回歸關(guān)系可以內(nèi)插,不宜外延。當(dāng)樣本含量較大時,統(tǒng)計學(xué)檢驗的作用減弱。r0.05/2,100=0.1954.結(jié)果的解釋及正確應(yīng)用2022/11/10醫(yī)學(xué)統(tǒng)計學(xué)68P值越小越有理由認(rèn)為變量間

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論