




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、2.2.線性回歸線性回歸 b=regress(y,X) b,bint,r,rint,s=regress(y,X,alpha)輸入輸入: y因變量因變量(列向量列向量), X1與自變量組成的矩陣,與自變量組成的矩陣,Alpha顯著性水平顯著性水平 (缺省時設(shè)定為(缺省時設(shè)定為0.05)s: 3個統(tǒng)計量:個統(tǒng)計量:決定系數(shù)決定系數(shù)R2,F(xiàn)值值, F(1,n-2)分布大于分布大于F值的概率值的概率p,p 時時回歸回歸模型有效模型有效輸出輸出:b=(),),bint: b的的置信區(qū)間置信區(qū)間,r:殘差殘差(列向量列向量),rint: r的的置信區(qū)間置信區(qū)間,10rcoplot(r,rint)殘差殘差及
2、其及其置信區(qū)間作圖置信區(qū)間作圖回歸回歸模型模型 例例3: 血壓與年齡、體重指數(shù)、吸煙習慣血壓與年齡、體重指數(shù)、吸煙習慣 序序號號 血血壓壓年年齡齡體重體重指數(shù)指數(shù)吸煙吸煙習慣習慣 序序號號 血血壓壓年年齡齡體重體重指數(shù)指數(shù)吸煙吸煙習慣習慣11443924.20211363625.0022154731.11221425026.2131384522.60231203923.50101545619.30301756927.41體重指數(shù)體重指數(shù) = 體重(體重(kg)/身高(身高(m)的平方)的平方 吸煙習慣吸煙習慣: 0表示不吸煙,表示不吸煙,1表示吸煙表示吸煙 建立血壓與年齡、體重指數(shù)、吸煙習慣之
3、間的回歸模型建立血壓與年齡、體重指數(shù)、吸煙習慣之間的回歸模型模型建立模型建立血壓血壓y,年齡,年齡x1,體重指數(shù),體重指數(shù)x2,吸煙習慣,吸煙習慣x3 3322110 xxxyy與與x1的散點圖的散點圖y與與x2的散點圖的散點圖線性回歸模型線性回歸模型回歸系數(shù)回歸系數(shù) 0, 1, 2, 3 由數(shù)據(jù)估計由數(shù)據(jù)估計, 是隨機誤差是隨機誤差 n=30;m=3;y=144 215138145162142170124158154 162 150140110128130135114116124 136 142120120160158144130125175;x1=39 474547654667426756
4、 64565934424845182019 36503921445363292569;x2=24.2 31.1 22.6 24.0 25.9 25.1 29.5 19.7 27.2 19.3 28.0 25.8 27.3 20.1 21.7 22.2 27.4 18.8 22.6 21.5 25.0 26.2 23.5 20.3 27.1 28.6 28.3 22.0 25.3 27.4; x3=0 1 0 1 1 0 1 0 1 0 1 0 0 0 0 1 0 0 0 .0 0 1 0 0 1 1 0 1 0 1;X=ones(n,1), x1,x2,x3;b,bint,r,rint,s=r
5、egress(y,X);s2=sum(r.2)/(n-m-1);b,bint,s,s2rcoplot(r,rint)回歸系數(shù)回歸系數(shù)回歸系數(shù)回歸系數(shù)估計值估計值回歸系數(shù)回歸系數(shù)置信區(qū)間置信區(qū)間 045.36363.5537 87.1736 10.3604-0.0758 0.7965 23.09061.0530 5.1281 311.8246-0.1482 23.7973R2= 0.6855 F= 18.8906 p0.0001 s2 =169.7917模型模型求解求解回歸系數(shù)回歸系數(shù)回歸系數(shù)回歸系數(shù)估計值估計值 回歸系數(shù)回歸系數(shù)置信區(qū)間置信區(qū)間 058.510129.9064 87.1138
6、10.43030.1273 0.7332 22.34490.8509 3.8389 310.30653.3878 17.2253R2= 0.8462 F= 44.0087 p0.0001 s2 =53.6604剔除異常點剔除異常點(第第2點和第點和第10點點)后后xueya01.m3213065.103449. 24303. 05101.58xxxy 此時可見第二與第十二個點是異常點,于是刪除此時可見第二與第十二個點是異常點,于是刪除上述兩點,再次進行回歸得到改進后的回歸模型的系上述兩點,再次進行回歸得到改進后的回歸模型的系數(shù)、數(shù)、系數(shù)系數(shù)置信區(qū)間與統(tǒng)計量置信區(qū)間與統(tǒng)計量回歸系數(shù)回歸系數(shù)回歸系
7、數(shù)回歸系數(shù)估計值估計值回歸系數(shù)回歸系數(shù)置信區(qū)間置信區(qū)間 058.510129.9064 87.1138 10.43030.1273 0.7332 22.34490.8509 3.8389 310.30653.3878 17.2253R2= 0.8462 F= 44.0087 p0.0001 s2 =53.6604這時置信區(qū)間不包含零點,這時置信區(qū)間不包含零點,F(xiàn)統(tǒng)計量增大,可決系統(tǒng)計量增大,可決系數(shù)從數(shù)從0.6855增大到增大到0.8462 ,我們得到回歸模型為:,我們得到回歸模型為:3213065.103449. 24303. 05101.58xxxy 通常,進行多元線性回歸的步驟如下:通常
8、,進行多元線性回歸的步驟如下:(1)做自變量與因變量的散點圖,根據(jù)散點圖的形)做自變量與因變量的散點圖,根據(jù)散點圖的形狀決定是否可以進行線性回歸;狀決定是否可以進行線性回歸;(2)輸入自變量與因變量;)輸入自變量與因變量;(3)利用命令:)利用命令:b,bint,r,rint,s=regress(y,X,alpha),rcoplot(r,rint)得到回歸模型的系數(shù)以及異常點的情況;得到回歸模型的系數(shù)以及異常點的情況;(4)對回歸模型進行檢驗)對回歸模型進行檢驗首先進行殘差的正態(tài)性檢驗:首先進行殘差的正態(tài)性檢驗:jbtest,ttest其次進行殘差的異方差檢驗其次進行殘差的異方差檢驗: 戈德菲
9、爾德一匡特戈德菲爾德一匡特(GoldfeldQuandt)檢驗檢驗戈德菲爾德檢驗,簡稱為戈德菲爾德檢驗,簡稱為GQ檢驗檢驗.為了檢驗異方差為了檢驗異方差性,將樣本按解釋變量排序后分成兩部分,再利用樣性,將樣本按解釋變量排序后分成兩部分,再利用樣本本1和樣本和樣本2分別建立回歸模型,并求出各自的殘差平分別建立回歸模型,并求出各自的殘差平方和方和RSSl和和RSS2。如果誤差項的離散程度相同。如果誤差項的離散程度相同(即為即為同方差的同方差的),則,則RSSl和和RSS2的值應(yīng)該大致相同;若兩的值應(yīng)該大致相同;若兩者之間存在顯著差異,則表明存在異方差者之間存在顯著差異,則表明存在異方差. 檢驗過程
10、檢驗過程中為了中為了“夸大夸大”殘差的差異性,一般先在樣本中部去殘差的差異性,一般先在樣本中部去掉掉C個數(shù)據(jù)個數(shù)據(jù)(通常取通常取cn4),再利用,再利用F統(tǒng)計量判斷差統(tǒng)計量判斷差異的顯著性:異的顯著性:) 12/ )( , 12/ )() 12/ )/() 12/ )/(1212kcnkcnFRSSRSSkcnRSSkcnRSSF其中,其中,n為樣本容量,為樣本容量,k為自變量個數(shù)為自變量個數(shù).然后對殘差進行自相關(guān)性的檢驗,通常我們利用然后對殘差進行自相關(guān)性的檢驗,通常我們利用DW檢檢驗進行殘差序列自相關(guān)性的檢驗。該檢驗的統(tǒng)計量為:驗進行殘差序列自相關(guān)性的檢驗。該檢驗的統(tǒng)計量為:nttnttt
11、eeeDW12221/)(其中其中 為殘差序列,對于計算出的結(jié)果通過查為殘差序列,對于計算出的結(jié)果通過查表決定是否存在自相關(guān)性。表決定是否存在自相關(guān)性。te若若 duDW4-du,則不存在自相關(guān)性;則不存在自相關(guān)性;若若 DW4-dl,則存在一階負相關(guān);,則存在一階負相關(guān);若若 dlDWdu 或或4-duDW4-dl ,則無法判斷,則無法判斷下面我們對模型進行檢驗:下面我們對模型進行檢驗:(1)殘差的正態(tài)檢驗:)殘差的正態(tài)檢驗:由由jbtest檢驗,檢驗,h=0表明殘差服從正態(tài)分布,進而由表明殘差服從正態(tài)分布,進而由t檢檢驗可知驗可知h=0,p=1,故殘差服從均值為零的正態(tài)分布;,故殘差服從均值為零的正態(tài)分布;(2)殘差的異方差檢驗:)殘差的異方差檢驗:我們將我們將28個數(shù)據(jù)從小到大排列,去掉中間的個數(shù)據(jù)從小到大排列,去掉中間的6個數(shù)據(jù),個數(shù)據(jù),得到得到F統(tǒng)計量的觀測值為:統(tǒng)計量的觀測值為:f =1.909
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣東大灣區(qū)一模數(shù)學試卷
- 高考為什么沒有數(shù)學試卷
- 高三高一數(shù)學試卷
- 鄂州高考數(shù)學試卷
- 肝病的識別和治療
- 2025年04月四川樂山市人民醫(yī)院臨床醫(yī)技類招聘60人筆試歷年專業(yè)考點(難、易錯點)附帶答案詳解
- 馬云新人培訓課件
- 2024年11月浙江浙商銀行總行授信評審部社會招考(1117)筆試歷年參考題庫附帶答案詳解
- 2024年重慶大學物理學院招聘筆試真題
- 2025至2030不銹鋼日用品行業(yè)發(fā)展趨勢分析與未來投資戰(zhàn)略咨詢研究報告
- 雙輪銑攪拌樁施工方案
- DG-TJ 08-2398-2022 纖維增強復合材料筋混凝土結(jié)構(gòu)技術(shù)標準
- 《公頃和平方千米》(課件)人教版四年級數(shù)學上冊
- NBT 35095-2017 水電工程小流域水文計算規(guī)范
- 煙葉道路運輸服務(wù)方案
- 胎膜早破護理查房完整版
- 急性左心衰護理查房課件
- 用于生態(tài)修復的粉煤灰
- 精餾塔設(shè)計方案及流程
- (正式版)JBT 2603-2024 電動懸掛起重機
- (多應(yīng)用場合版)光伏組件外貿(mào)購銷合同-2024
評論
0/150
提交評論