曲線回歸專題培訓(xùn)市公開課金獎市賽課一等獎?wù)n件_第1頁
曲線回歸專題培訓(xùn)市公開課金獎市賽課一等獎?wù)n件_第2頁
曲線回歸專題培訓(xùn)市公開課金獎市賽課一等獎?wù)n件_第3頁
曲線回歸專題培訓(xùn)市公開課金獎市賽課一等獎?wù)n件_第4頁
曲線回歸專題培訓(xùn)市公開課金獎市賽課一等獎?wù)n件_第5頁
已閱讀5頁,還剩60頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

曲線回歸吳庫生汕頭大學(xué)醫(yī)學(xué)院預(yù)防醫(yī)學(xué)教研室第1頁第1頁回歸分析概念尋求相關(guān)聯(lián)(相關(guān))變量之間關(guān)系主要內(nèi)容:從一組樣本數(shù)據(jù)出發(fā),擬定這些變量間定量關(guān)系式對這些關(guān)系式可信度進行各種統(tǒng)計檢查從影響某一變量諸多變量中,判斷哪些變量影響明顯,哪些不明顯利用求得關(guān)系式進行預(yù)測和控制第2頁第2頁回歸分析模型按是否線性分:線性回歸模型和非線性回歸模型按自變量個數(shù)分:簡樸一元回歸,多元回歸第3頁第3頁常見回歸分析模型在回歸種類中包括:Liner:線性回歸CurveEstimation:曲線預(yù)計BinaryLogistic:二分變量邏輯回歸MultinomialLogistic:多分變量邏輯回歸Ordinal序回歸Probit:概率單位回歸Nonlinear:非線性回歸WeightEstimation:加權(quán)預(yù)計2-StageLeastsquares:二段最小平辦法OptimalScaling最優(yōu)編碼回歸第4頁第4頁一、曲線擬合Curvefitting第5頁第5頁

醫(yī)學(xué)研究中,X與Y兩變量數(shù)量關(guān)系并非總是線性,如毒物劑量——動物死亡率年齡——身高時間——血藥物濃度可用曲線直線化預(yù)計(Curveestimation)或非線性回歸(Nonlinearregression)辦法進行統(tǒng)計學(xué)分析。第6頁第6頁曲線預(yù)計(CurveEstimation)對于一元回歸,若散點圖趨勢不呈線性分布,能夠利用曲線預(yù)計方式以便地進行各種方程擬合,如:指數(shù)擬合(Exponential)、二次擬合(Quadratic)、三次擬合(Cubic)等。采用哪種擬合方式更合理主要取決于各種擬合模型對數(shù)據(jù)充足描述(看校正AdjustedR2→1)第7頁第7頁不同樣模型表示模型名稱回歸方程相應(yīng)線性回歸方程Linear(線性)Y=b0+b1xQuadratic(二次)Y=b0+b1x+b2x2Compound(復(fù)合)Y=b0(b1x)Ln(Y)=ln(b0)+ln(b1)xGrowth(生長)Y=eb0+b1xLn(Y)=b0+b1xLogarithmic(對數(shù))Y=b0+b1ln(x)第8頁第8頁模型名稱回歸方程相應(yīng)線性回歸方程Cubic(三次)Y=b0+b1x+b2x2+b3x3SY=eb0+b1/xLn(Y)=b0+b1/

xExponential(指數(shù))Y=b0*

eb1*xLn(Y)=ln(b0)+b1xInverse(逆)Y=b0+b1/xPower(冪)Y=b0(xb1)Ln(Y)=ln(b0)+b1ln(x)Logistic(邏輯)Y=1/(1/u+b0b1x)Ln(1/Y-1/u)=ln(b0+ln(b1)x)第9頁第9頁選擇曲線基本辦法依據(jù)專業(yè)知識和過去經(jīng)驗(或文獻)選擇曲線類型利用算術(shù)格紙、半對數(shù)格紙等,將實測數(shù)據(jù)繪制散點圖。依據(jù)散點圖特點選擇曲線類型先在普通格紙上繪制散點圖,再依據(jù)各點分布趨勢用試配法來選擇曲線類型。第10頁第10頁曲線擬合方式曲線直線化預(yù)計曲線直接擬合第11頁第11頁

繪制散點圖,依據(jù)圖形和專業(yè)知識選取曲線類型(可同時選取幾類)按曲線類型,作曲線直線化變換建立變換數(shù)據(jù)間直線回歸方程(假設(shè)檢查,計算決定系數(shù))比較決定系數(shù)選取“最佳”方程寫出曲線方程曲線直線化預(yù)計環(huán)節(jié)第12頁第12頁YX0二、常見幾種曲線對數(shù)曲線b>0b<0第13頁第13頁YX0指數(shù)曲線b>0b<0及其變換形式第14頁第14頁YX0Y=b0+b1X+b2X2

拋物線b2<0b2>0第15頁第15頁YXY=b0+b1X+b2X2+b3X3

03次多項式曲線第16頁第16頁SPSS中曲線模型第17頁第17頁SPSS中曲線模型第18頁第18頁第19頁第19頁

第20頁第20頁SPSS回歸分析過程基本環(huán)節(jié):利用SPSS得到模型關(guān)系式,是否是我們所要,要看回歸方程明顯性檢查(F檢查)和回歸系數(shù)b明顯性檢查(t檢查),還要看擬合程度R2(相關(guān)系數(shù)平方,一元回歸用RSquare,多元回歸用AdjustedRSquare)第21頁第21頁常見曲線回歸方程②對數(shù):①冪函數(shù):或

③指數(shù)函數(shù):④多項式:

⑤logistic:或

第22頁第22頁利用線性回歸擬合曲線(例1)例上海醫(yī)科大學(xué)微生物學(xué)教研室以已知濃度X免疫球蛋白A(IgA,μg/ml)作火箭電泳,測得火箭高度Y(mm)如表1所表示。試擬合Y關(guān)于X非線性回歸方程。編號XYX'=lnX

10.27.6-1.609420.412.3-0.916330.615.7-0.510840.818.2-0.223151.018.7061.221.40.182371.422.60.336581.623.80.4700累計140.3-2.2708第23頁第23頁(一)繪制散點圖,決定曲線類型

(二)曲線直線化變換

=a+blnX

第24頁第24頁(三)建立直線回歸方程XYX'=lnX

(lnX)2Y2(lnX)Y

殘差平方0.27.6-1.60940.412.3-0.91630.615.7-0.51080.818.2-0.22311.018.701.221.40.18231.422.60.33651.623.80.4700累計140.3-2.27082.590257.76-12.23140.8396151.29-11.27050.2609246.49-8.01960.0498331.24-4.06040.0000349.690.00000.0332457.963.90120.1132510.767.60490.2209566.4411.18604.10782671.63-12.8898

7.2312.6215.7718.0119.7521.1622.3623.40

0.13800.10170.00530.03611.09210.05630.05660.15971.6458第25頁第25頁(四)比較決定系數(shù),擬定“最佳”方程

第26頁第26頁SPSS實現(xiàn)過程第27頁第27頁第28頁第28頁第29頁第29頁第30頁第30頁第31頁第31頁第32頁第32頁15名重傷病人住院天數(shù)X與預(yù)后指數(shù)Y編號123456789101112131415X257101419263134384552536065Y54504537352520161813811846利用線性回歸擬合曲線(例2)第33頁第33頁(一)繪制散點圖,決定曲線類型

第34頁第34頁(二)曲線直線化變換

第35頁第35頁(三)建立線性回歸方程

回歸方程為:4.037-0.038X方差分析有統(tǒng)計學(xué)意義,P=0.0000,F(xiàn)=276.38,表明回歸方程有奉獻。擬定系數(shù)為0.9551,表明回歸擬合原資料較好。轉(zhuǎn)換為原方程另一個形式:

第36頁第36頁第37頁第37頁第38頁第38頁比較兩個回歸方程可見,對同一份樣本采取不同預(yù)計方法得到結(jié)果并不相同。主要因為曲線直線化以后回歸只對變換后Y*(=lnY)負(fù)責(zé),得到線性方程可使Y*與其預(yù)計值之間殘差平方和最小,并不確保原變量Y與其預(yù)計值之間殘差平方和也是最小。曲線直線化非線性最小二乘法第39頁第39頁問題:前一個例子只對自變量作對數(shù)變換對數(shù)曲線擬合,能否確保原變量Y與其預(yù)計值之間殘差平方和也是最???冪函數(shù)曲線擬合呢?第40頁第40頁問題:如何判斷哪個曲線擬合方程更佳?對于前例,幾種常見曲線擬合得到?jīng)Q定系數(shù)R2下列(曲線直線化):線性(直線)R2:0.8856(y=46.4604-0.7525x)冪曲線R2:0.8293(y=159.9297x-0.7191)對數(shù)曲線R2:0.9654(y=72.2829-15.9662Ln(x)

)指數(shù)曲線R2:

0.9551(y=56.6651e-0.0380x)二項式曲線R2:0.9812(y=55.8221-1.7103x+0.0148x2

)第41頁第41頁問題:如何判斷那個曲線擬合方程更佳?對于例2,幾種常見曲線擬合得到?jīng)Q定系數(shù)R2下列(非線性回歸——迭代法):線性(直線)R2:0.8856(y=46.4604-0.7525x)冪曲線R2:0.8413(y=88.7890x-0.4662)對數(shù)曲線R2:0.9654(y=72.2829-15.9662Ln(x)

)指數(shù)曲線R2:0.9875(y=58.6066e-0.0396x)二項式曲線R2:0.9812(y=55.8221-1.7103x+0.0148x2

)第42頁第42頁散點圖辨析

第43頁第43頁

假如條件允許最好采用非線性回歸(NonlinearRegression)擬合冪函數(shù)曲線與指數(shù)函數(shù)曲線注意繪制散點圖,并結(jié)合專業(yè)知識解釋第44頁第44頁非線性回歸方程

非線性回歸與普通線性回歸求解方法不同在于:需要給定參數(shù)(a、b)初始值采取迭代方法,不停更新預(yù)計參數(shù),直至穩(wěn)定在某一值為止。優(yōu)點:在需要變換Y時,結(jié)果更可靠。缺點:a.計算復(fù)雜;b.初始值不適當(dāng)初,預(yù)計不準(zhǔn)確.第45頁第45頁采用SPSS進行曲線擬合曲線直線化AnalyzeRegressionCurveEstimation…可選Power、Logarithmic、Exponential、Quadratic、Cubic等非線性回歸AnalyzeRegressionNonlinear…設(shè)置模型:ModelExpression參數(shù)賦初值:Parameters…第46頁第46頁SPSS曲線擬合實例一只紅鈴蟲產(chǎn)卵數(shù)與溫度相關(guān),下面是相關(guān)數(shù)據(jù):溫度21232527293235產(chǎn)卵數(shù)711212466115325試找出一個較佳經(jīng)驗回歸函數(shù)?第47頁第47頁第48頁第48頁第49頁第49頁第50頁第50頁第51頁第51頁全選擬合曲線圖方差分析表第52頁第52頁Exponential……第53頁第53頁第54頁第54頁系統(tǒng)給出了所有模型最優(yōu)擬合結(jié)果,能夠通過比較相關(guān)系數(shù)平方值(Rsq)來比較各模型優(yōu)劣。R2越大,則模型越好。此例給出模型中,復(fù)合模型、生長模型、指數(shù)模型和邏輯模型相應(yīng)最大,達到0.985,因此采用這4種模型進行擬合是最適當(dāng)。第55頁第55頁注意:擬合結(jié)果要結(jié)合專業(yè)知識進行判斷,對于有背實際規(guī)律模型,盡管擬合程度也許很高,也要放棄使用。第56頁第56頁最小二乘預(yù)計1.選擇最正確擬合曲線標(biāo)準(zhǔn)從幾何意義上說,樣本回歸曲線應(yīng)盡也許靠近樣本數(shù)據(jù)點。選擇最正確擬合曲線標(biāo)準(zhǔn)能夠確定為:使總擬合誤差(即總殘差)達到最小。用最小二乘法描述就是:所選擇回歸模型應(yīng)該使全部觀

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論