




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、第十章 相關與回歸分析10.1概述 一、回歸預測的含義回歸 (Regression) 一詞是由生物學相關概念引申而來,它是英國生物學家高爾頓 (F.Galton 用來描述遺傳變異現(xiàn)象的術語。1889年他在普用回歸定律一文中指出:每個人的特點和他的親屬有相似之處,但平均地說在程度上有一定的差異。他的朋友皮爾遜后來對 1078 個家庭進行了調(diào)查,發(fā)現(xiàn)個子高的父母比矮的父母趨向于生育個子高的子女,但是從平均數(shù)看,父母高 , 他們的子女不一定像父母那樣高 , 反之也不像 其父母那樣矮。這種現(xiàn)象便稱之為回歸。后來這個名詞被廣泛用來表示變量間的數(shù)量 關系。v回歸分析:就是研究某一個隨機變量 (因變量) 與
2、其他一或幾個變量 (自變量 ) 之間的數(shù)量變動關系,由回歸分析求出的關系式通常稱為回歸模型。v回歸分析預測法:就是從各種經(jīng)濟現(xiàn)象之間的相互關系出發(fā),通過對與預測對象有聯(lián)系的現(xiàn)象變動趨勢的分析,推算預測對象未來狀態(tài)數(shù)量表現(xiàn)的一種預測法。 二、回歸預測的分類兩個變量之間就其關系變化來說,可以表現(xiàn)為兩種數(shù)學模型形式,即函數(shù)型關系和統(tǒng)計型關系.如果用 x 表示自變量 ,y 表示因變量,同時 x 和 y 的關系在一定條件下是完全確定的,那就是函數(shù)關系。反之,則是統(tǒng)計型關系。 在社會經(jīng)濟現(xiàn)象中,一個變量 和另一變量盡管有密切的關系,但是由于受到眾多的難以控制的因素的影響,實際觀察得到的數(shù)據(jù)并不能構(gòu)成函數(shù)關
3、系。例如,企業(yè)的年銷售額 y 與變量 x( 人均收入、利率 的變化、產(chǎn)品的市場競爭狀況、季節(jié)的變化及原材料的供應等 ) 對應的關系會形成一個統(tǒng)計分布。隨自變量 x 的變化,因變量也隨之有一個隨機變化結(jié)果。其變化的結(jié)果所對應的曲線模型有正線性關系、負線性關系、元數(shù)量關系、向下拋物線關系、上升指數(shù)曲 線關系及下降指數(shù)曲線關系等。 在回歸分析中,如果研究的因果關系涉及兩個變量就叫做一元回歸分析或單回歸分析;如果涉及兩個以上的變量,則叫做多元回歸分析或復回歸分析。如果變量之間的相關關系呈線性變化,則叫線性回歸;如果變量之間的相關關系呈非線性變化,則叫非線性回歸。 三、回歸預測的一般程序v 確立相關因素
4、:相關因素又稱相關變量,它是回歸分析的基礎。相關變量選擇得準確與否會直接影響回歸預測結(jié)果的準確性。v 建立數(shù)學模型:根據(jù)已知的數(shù)據(jù)資料,找出變量之間相關關系的類型,選擇與其最為吻合的數(shù)學模型,代入已知數(shù)據(jù)并經(jīng)過數(shù)學運算,求得有關系數(shù)或參數(shù),從而建立預測的數(shù)學模型。v 檢驗和評價數(shù)學模型:建立的數(shù)學模型是否正確,必須用一套數(shù)理統(tǒng)計方法來加以檢驗,并測量其誤差大小和精確 (或近似)程度。v 運用模型進行預測:數(shù)學模型經(jīng)檢驗后如果正確,即用所建的數(shù)學模型進行預測和控制。10.2一元線性回歸方程一、一元線性回歸預測方程如果影響預測對象的主要因素只有一個,并且它們之間呈線性關系,那么可采用簡單回歸分析法
5、預測。由于這種方法只涉及一個自變量,故其又稱為一元線性回歸分析法。設一元線性回歸方程為 :y yi i= =a+ba+bx xi i+e+ei i(i=1,2, (i=1,2, , n) , n)式中 ,n 為樣本容量;為回歸常數(shù);b 為回歸系數(shù) , 即回歸直線的斜率; ei 為殘差值 , 又稱回歸余項 , ei 的平均值為零 , 其中每個ei的分布方差相同,它是用a+bxi估計因變量yi 的數(shù)值所造成的,它是估計值與實際數(shù)值之間的離差 , 即 eiei= y= yi i i i 。 實際預測時,殘差項的是無法預測的 , 其目的只是借助a+bxi得到預測對象 yi 的估計值 , 所以預測模型為
6、 : i i = =a+ba+bx xi i式中,i為預測值( 又稱為估計值 )a為回歸常數(shù);b為回歸系數(shù)。 二、最小二乘法 (式)(式)用上述方程在預測前,還得先知道自變量的取值。如該地 2004 年人均收入的預測值為 560 元 , 則該地區(qū) 2002年耐用消費品銷售額的預測值為: i i 20042004= =0.2568+2.9303 0.2568+2.9303 5.6 5.6 166.7( 166.7( 萬元萬元 ) )這里得到的 166.7 萬元是一個點預測值,實際上的數(shù)值也許高于它,也許比它低。因此在進行回歸預測時,總是在點預測為中心的基礎上,在一定的可能性( 即概率 )下,給一
7、個預測區(qū)間 ( 又稱為置信區(qū)間 )。若要計算點預測的置信區(qū)間,就要計算點預測值誤差的標準差。三、一元線性回歸預測的置信區(qū)間在回歸分析中 由于總體關系有一定程度的變異 , 從實際觀察值所求得的回歸線只是樣本回歸線。 a 和 b 就只能看做是總體回歸系數(shù) A 和 B 的估計值,不同的抽樣就會有不同的 和 b, 也就是說有不同的樣本回歸線隨機因素的存在表明,給定任何一個x值就可能有許多 y 的觀察值。 進行回歸分析時對于 y 的變異性是有前提假定的,這些假定是 : y 是一個隨機變量 , 亦即 e 是隨機變量 ; 給定一個x值時 ,y 分布是正態(tài)的 ,影響 y 的其他因素的作用一般趨于互相抵消 ,
8、因此 ,E(e)=O ,y 的平均值就在給定 x 值的回歸線上; 在任何x值上,y 分布的方差 ( 及標準差 ) 相等。一元線性回歸標準差計算公式如下 :(式)置信區(qū)間 一元線性回歸的置信概率可查t分布的雙側(cè)檢驗表,取置信概率為 95%時, t0.05=2.365 則預測區(qū)間為: 土土t t0.050.05S = 16.67S = 16.67土土2.3652.3650.6590.659 = = 151.11-182.28151.11-182.28 即預測2004年耐用商品銷售額在 151.11 萬元至 182.28 萬元的概率為 95% 。 預測 區(qū)間的大小與置信概率的大小為同向關系 , 概率
9、取得越高,預測區(qū)間就越大。但是如果預測區(qū)間過寬,就會使預測結(jié)果失去意義。 一、二元線性回歸 設某國每年小麥出口量的增長率和該年小麥產(chǎn)量的增長率及出口稅率有線性關系 , 其 1994-2003 年的樣本數(shù)據(jù)如圖表所示。利用圖表 144 的數(shù)據(jù) , 求樣本回歸方程:解:為了確定回歸系數(shù)要求先求回歸方程,為此,需要用1994-2003年小麥出口量年增長率與產(chǎn)量年增長率及出口稅率回歸分析計算表:10.4回歸模型的統(tǒng)計檢驗一.簡單相關檢驗 變量與之間是否存在線性相關的問題,可以通過散點圖用目測的方法解決,但既不精確也不方便。現(xiàn)在用一種量化指標,來較精確地描述兩變量間的線性相關的密切程度,這個指標稱為簡單
10、相關系數(shù)r,其計算公式是:二、 F 檢驗要判定回歸方程在整體上是否顯著成立,即用所配合的回歸方程來解釋因變量的變化是否有效,此時可用 F 檢驗法。F 檢驗法的步驟如下: 1. 計算剩余平方和S余: S余 =(yi i )式中 , yi 為觀察值 , i為擬合值 2計算回歸平方和 S回: S回(yi yi )3. 計算統(tǒng)計量 F 的值 : F= S回m/ S余/ (n-m-1)式中 m 為回歸方程中自變量個數(shù)。4. 查表檢驗顯著性 :按顯著性水平查 F 分布表,得到臨界值F , 如果 F F , 則認為回歸效果顯著 , 否則即認為回歸效果不顯著。 對上例的回歸方程做 F 檢驗1.計算剩余平方和:
11、S余 = (yi i)=2.04152.計算回歸平方和: S回(yi yi )=112.49355 3.計算 F 值(因為是一元線性回歸 , 只有一個自變量 , 所以 m = 1) F= S回m/ S余/ (n-m-1) = 112.4935/2.0415/7=385.724.查表檢驗顯著性 :取顯著性水平 =0.05;m=1, 第二自由度 n-m-1=7 。查 F 分布表得臨界值 F0.05=5.59 因為 F=385.725.59, 所以回歸效果顯著。 四、t 檢驗 判定回歸方程中系數(shù) ( 參數(shù) ) 的作用是否顯著 ,可用 t 檢驗法。在多元回歸中,如果某個自變量X對因變量 y 的作用不顯著,則該前的系數(shù)就可視為0。但需要注意,回歸系數(shù)同0的差異是否顯著,不能根據(jù)系數(shù)絕對值的大小來判斷,而要根據(jù)統(tǒng)計假設檢驗的理論進行檢驗,因為系數(shù)值的大小要受變量計量單位的影響。如上例中得到的回歸方程 , 自變量x前的系數(shù)是2.9303, 倘若把x的單位由百元改為
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年水利設施開發(fā)管理服務項目資金申請報告代可行性研究報告
- 世衛(wèi)組織接觸者追蹤指南 2024.12
- Brand KPIs for health insurance:KKH Kaufm?nnische Krankenkasse in Germany-英文培訓課件2025.4
- 基于影像組學和深度學習鑒別膠質(zhì)母細胞瘤與孤立性腦轉(zhuǎn)移瘤的研究
- 汽車傳感器與檢測技術電子教案:電控柴油發(fā)動機冷卻液溫度傳感器
- 倉儲公司營銷策劃方案
- 仙居橫溪非遺活動方案
- 代辦祭祖活動方案
- 代理職務活動方案
- 代賬公司博覽會策劃方案
- 柔性接口鎮(zhèn)墩計算
- 腳手架高支模構(gòu)造要求
- GB/T 5599-2019機車車輛動力學性能評定及試驗鑒定規(guī)范
- 裝飾裝修工程質(zhì)量通病及其防治措施(PPT)
- 數(shù)學七年級下:浙教版七年級下學期數(shù)學期末試卷(答案)
- 2023年版義務教育音樂課程標準(標準版)
- 特選2023年成人高考專升本政治考試真題及參考答案
- 古埃及神話課件
- 投標人聯(lián)系表
- DB13-T2330-2016濱海鹽土鹽地堿蓬種植技術規(guī)程
- 大學公務用車租賃審批單
評論
0/150
提交評論