




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
中級經濟師
《經濟基礎知識:經濟學基礎》
第23章相關與回歸分析12023/2/3一、相關關系的概念(一)函數關系與相關關系1.函數關系
函數關系指變量之間具有的嚴格的確定性的依存關系。當一個或幾個變量取一定的值時,另一個變量有確定值與之相對應。函數關系的例子某種商品的銷售額(y)與銷售量(x)之間的關系可表示為
y=p
x(p為單價)圓的面積(S)與半徑R之間的關系可表示為S=R2
企業的原材料消耗額(y)與產量(x1)
、單位產量消耗(x2)
、原材料價格(x3)之間的關系可表示為y=x1x2x3
2023/2/3xy(1)變量之間數值是一一對應的確定關系,可用一個數學表達式表示。(2)設有兩個變量x和y,變量y隨變量x一起變化,并完全依賴于x,當變量x取某個數值時,y依確定的關系取相應的值,則稱y是x的函數,記為y=f(x),其中x稱為自變量,y稱為因變量;(3)各觀測點落在一條線上。函數關系的特點:2023/2/32.相關關系
指客觀現象之間確實存在的但數量上不是嚴格對應的依存關系。即變量間關系不能用函數關系精確表達,當變量x取某個值時,變量y的取值可能有幾個。相關關系的例子商品的消費量(y)與居民收入(x)之間的關系商品銷售額(y)與廣告費支出(x)之間的關系糧食畝產量(y)與施肥量(x1)、降雨量(x2)、溫度(x3)之間的關系收入水平(y)與受教育程度(x)之間的關系2023/2/3相關關系的特點:xy(1)變量間關系不能用函數關系精確表達;(2)一個變量的取值不能由另一個變量唯一確定;(3)當變量x取某個值時,變量y的取值可能有幾個;(4)各觀測點分布在直線附近。2023/2/3函數關系與相關關系的聯系函數關系往往通過相關關系表現出來。把影響因變量變動的因素全部納入方程,這時的相關關系就有可能轉化為函數關系。相關關系經常可以用一定的函數形式去近似地描述。2023/2/3例:有數據顯示世界各國平均每人擁有電視機數x及居民預期壽命y之間有很強的正相關,可否認為電視機很多的國家,居民預期壽命比較長?有人測試出火災現場的消防員人數和該場火災造成的損害之間有很強的正相關,可否認為派出的消防員越多造成的損害越大?(二)相關關系與因果關系因果關系∈相關關系;現象之間是因果關系同時是相關關系,但是相關關系不一定是因果關系。統計只能說明現象間有無數量上的關系,不能說明誰因誰果。確定因果關系的方法——定性分析。2023/2/3自變量:是引起某種結果變化的原因,它是可以控制、給定的值,常用x表示;因變量:是自變量變化的引起結果量,它是不確定的值,常用y表示。它們的表現形式有:一種原因引起一種結果;多種原因引起一種結果;還有變量之間是互為因果的關系。相關分析時,一般不區分原因和結果。自變量與因變量2023/2/3二、相關關系的種類
1.按相關的程度分完全相關:當一個變量的變化完全由另一個變量所決定時,稱變量間的這種關系為為完全相關關系,這種嚴格的依存關系實際上就是函數關系。不相關:當兩個變量的變化相互獨立、互不影響時,稱這兩個變量不相關(或零相關)。不完全相關:當變量之間存在不嚴格的依存關系時,稱為不完全相關。不完全相關關系是現實當中相關關系的主要表現形式,是相關分析的主要研究對象。2023/2/32.按相關的方向正相關:當一個變量隨著另一個變量的增加(減少)而增加(減少),即兩者同向變化時,稱為正相關。如家庭收入與家庭支出之間的關系。負相關:當一個變量隨著另一個變量的增加(減少)而減少(增加),即兩者反向變化時,稱為負相關。如產品產量與單位成本之間的關系,單位成本會隨著產量的增加而減少。2023/2/33、
按相關的形式線性相關:當變量之間的依存關系大致呈現為線性形式,即當一個變量變動一個單位時,另一個變量也按一個大致固定的增(減)量變動,就稱為線性相關。非線性相關:當變量間的關系不按固定比例變化時,就稱之為非線性相關。2023/2/34.按研究變量的多少單相關:兩個變量之間的相關,稱為單相關。復相關:一個變量與兩個或兩個以上其他變量之間的相關,稱為復相關。偏相關:在復相關的研究中,假定其他變量不變,專門研究其中兩個變量之間的相關關系時稱其為偏相關。注意:并非所有的變量之間都存在相關關系,因此需要用相關分析方法來識別和判斷。一、變量之間的相關關系
13分類標準類別內含相關的程度完全相關一個變量的取值變化完全由另一個變量的取值變化所確定。稱這兩個變量完全相關。如價格不變的條件下,某種商品的銷售總額由其銷售量決定。不完全相關介于完全相關和不相關之間。大部分相關現象均屬于不完全相關。不相關兩個變量的取值變化彼此互不影響。如股票的價格與氣溫的高低。相關的方向正相關一個變量的取值由小變大,另一個變量的取值也相應的由小變大。(兩個變量同方向變化)。負相關一個變量的取值由小變大,另一個變量的取值由大變小(兩個變量反方向變化)相關的形式線性相關兩個相關變量之間的關系大致呈現為線性關系。非線性相關兩個相關變量之間的關系不表現直線的關系,而近似于某種曲線方程的關系。2023/2/3相關分析的主要內容1.確定現象之間有無關系?2.有什么樣的關系?3.關系的強弱?5.是否偽關系?4.總體也有這種關系嗎?2023/2/3定性分析是依據研究者的理論知識和實踐經驗,對客觀現象之間是否存在相關關系,以及何種關系作出判斷。定量分析在定性分析的基礎上,通過編制相關表、繪制相關圖、計算相關系數等方法,來判斷現象之間相關的方向、形態及密切程度。相關分析的方法2023/2/3(一)相關表相關表是一種反映變量之間相關關系的統計表。對于兩個基本變量x和y,通過觀察和實驗,我們可以得到關于x和y的若干組數據,記為(,)(i=1,2,…,n)。將這些數據按的值由小到大(或由大到小)以序列表表示,即構成相關表。舉例:某地區居民人均收入水平(x)與食品支出占生活費支出的比重(y)之間具有相關關系,編制相關表如下表:人均收入水平
(x)/元
2803403905306506707908809101050食品支出占生活費支出的比重
(y)/%68.367.566.264.956.760.254.449.050.543.62023/2/3用直角坐標系的橫軸代表變量x,縱軸代表變量y,將兩個變量間相對應的變量值用坐標點的形式描繪出來,用以表明相關點分布狀況的圖形。根據上例資料繪制的相關圖(二)散點圖(相關圖)2023/2/3(a)正相關\直線相關(b)負相關\直線相關(c)正相關\曲線相關x與y關系散點圖的主要類型2023/2/3(d)負相關\曲線關系(e)負相關直線相關(相關程度較小)(f)不相關2023/2/3(三)相關系數(相關關系的測度)相關系數的意義:(1)對變量之間關系密切程度的度量;(2)若相關系數是根據總體全部數據計算的,稱為總體相關系數,記為;若是根據樣本數據計算的,則稱為樣本相關系數,記為r;(3)對兩個變量之間線性相關程度的度量稱為簡單相關系數;(4)將反映兩變量間曲線相關關系的統計指標稱為非線性相關系數、非線性判定系數;將反映多元線性相關關系的統計指標稱為復相關系數、復判定系數等。2023/2/31、由未分組資料計算相關系數公式:積差法以兩個變量與各自均值的離差為基礎,通過兩個離差相乘來反映變量之間相關程度。基本公式:
其中,x和y的協方差x的標準差y的標準差相關系數的計算:2023/2/3上述公式還可以變換為其它形式,如:2023/2/32、由變量數列資料計算相關系數公式:2023/2/3-1.0+1.00-0.5+0.5無線性相關負相關程度增加r正相關程度增加完全負相關完全正相關3、相關系數取值及其意義相關系數的值介于–1與+1之間,即–1≤r≤+1。2023/2/3(1)當r>0時,表示兩變量正相關,r<0時,兩變量為負相關;(2)當|r|=1時,表示兩變量為完全線性相關,即為函數關系;(3)當r=0時,表示兩變量間無線性相關關系,它并不意味著X與Y之間不存在其他類型的關系;(4)當0<|r|<1時,表示兩變量存在一定程度的線性相關。且|r|越接近1,兩變量間線性關系越密切;|r|越接近于0,表示兩變量的線性相關越弱;(5)通常判斷的標準是:|r|<0.3為微弱相關;0.3≤|r|<0.5為低度相關;0.5≤|r|<0.8稱為顯著相關;
0.8≤|r|<1稱為高度相關或強相關。2023/2/34、相關系數取正值或是負值,與分子有直接的關系.它可能出現以下情況:1)所有相關點都為正相關,則>0,說明兩變量之間正線性相關;2)所有相關點都為負相關,則<0,說明兩變量之間負線性相關;3)在全部相關點中,既有正相關、又有負相關和零相關,這時計算協方差時就會出現正負抵消。抵消的結果為正數,為正相關;為負數就是負相關。2023/2/3【例】根據上述資料,計算人均消費與人均國內生產總值的直線相關系數。2023/2/3將上表計算結果代入公式為:相關系數較大,這說明人均消費額與人均國內生產總值高度相關。2023/2/3四、相關分析中應注意的問題
(一)相關系數是說明變量之間線性聯系程度的,相關系數很小的變量間可能存在非線性聯系。(二)相關系數不能解釋兩變量間的因果關系,警惕虛假相關導致的錯誤結論。(三)不要在相關關系據以成立的數據范圍以外,推論這種相關關系仍然保持。第二節回歸分析
【本節考點】回歸分析的概念一元線性回歸模型30
相關分析與回歸分析的聯系●共同的研究對象:都是對變量間相關關系的分析●只有當變量間存在相關關系時,用回歸分析去尋求相關的具體數學形式才有實際意義●相關分析只表明變量間相關關系的性質和程度,要確定變量間相關的具體數學形式依賴于回歸分析●相關分析中相關系數的確定建立在回歸分析的基礎上相關分析與回歸分析回歸的古典意義:
高爾頓遺傳學的回歸概念
父母身高與子女身高的關系:
無論高個子或低個子的子女都有向人的平均身高回歸的趨勢一、回歸分析的含義什么是回歸分析回歸分析是對具有相關關系的變量擬合數學方程,通過一個或一些變量的變化解釋另一變量變化的方法。一、回歸分析的含義什么是回歸回歸是由英國著名統計學家FrancisGalton在19世紀末期研究孩子及其父母的身高時提出來的。Galton發現身材高的父母,他們的孩子也高。但這些孩子平均起來并不像他們父母那樣高。比較矮的父母情形也類似:他們的孩子比較矮,但這些孩子的平均身高要比他們父母的平均身高高。Galton把這種孩子的身高向中間值靠近的趨勢稱之為一種回歸效應,而他發展的研究兩個數值變量之間數量關系的方法稱為回歸分析。回歸的現代意義一個因變量對若干解釋變量依存關系的研究回歸的目的(實質):
由固定的自變量去估計因變量的平均值樣本總體自變量固定值估計因變量平均值回歸分析的內容和步驟根據理論和對問題的分析判斷,區分自變量(即解釋變量)和因變量(即被解釋變量);從一組樣本數據出發,設法確定合適的數學方程式(即回歸模型regressionmodel)描述變量間的關系;對數學方程式(回歸模型)的可信程度進行統計檢驗,并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著;利用數學方程式(回歸模型),根據一個或幾個自變量的取值來估計或預測因變量的取值,并給出這種估計或預測的精確程度。回歸分析與相關分析的區別相關分析中,變量x
與y處于平等地位;回歸分析中具有相關關系的變量之間地位是非對等的,變量y稱為因變量,處在被解釋的地位,x稱為自變量,用于預測因變量的變化相關分析中所涉及的變量x和y都是隨機變量;回歸分析中,因變量y是隨機變量,自變量x
可以是隨機變量,也可以是非隨機的確定變量相關分析主要描述變量之間相關關系的密切程度;回歸分析不僅可以揭示變量x對變量y的影響大小,還可以由回歸方程進行估計和預測回歸模型的類型按涉及變量多少分為:一元回歸和多元回歸按變量相關的形式分:線性回歸和非線性回歸(本節僅討論一元回歸分析問題)一個自變量兩個及以上自變量回歸模型多元回歸一元回歸線性回歸非線性回歸線性回歸非線性回歸回歸分析與相關分析的關系(一)聯系1.它們具有共同的研究對象。2.在具體應用時,常常必須互相補充。相關分析需要依靠回歸分析來表明現象數量相關的具體形式,而回歸分析則需要依靠相關分析來表明現象數量變化的相關程度。只有高度相關時,進行回歸分析尋求其相關的具體形式才是有意義的。39回歸分析與相關分析的關系(二)區別相關分析與回歸分析在研究目的和方法上具有明顯的區別1、相關分析研究變量之間相關的方向和相關的程度。2、回歸分析是研究變量之間相關關系的具體形式,它對具有相關關系的變量之間的數量聯系進行測定,確定相關的數學方程式,根據這個數學方程式可以從已知量來推測未知量,從而為估算和預測提供了一個重要方法。40二、一元線性回歸模型
1、一元線性回歸模型一元線性回歸模型,是研究兩個變量之間相關關系的最簡單的回歸模型。為模型的參數;即誤差項,是一個隨機變量。X為自變量。一元線性回歸只涉及一個自變量。描述因變量如何依賴自變量和誤差項的方程稱為回歸模型。在現實中,模型的參數
都是未知的,需要利用樣本數據去估計,采用的估計方法是最小二乘法。最小二乘法就是使得因變量的觀測值與估計值之間的離差平方和最小來估計
的方法。41二、一元線性回歸模型
2、回歸模型的擬合效果分析一般情況下,使用估計的回歸方程之前,需要對模型進行檢驗,其內容包括:(1)結合經濟理論和經驗分析回歸系數的經濟含義是否合理;(2)對模型進行假設檢驗。42二、一元線性回歸模型
(3)分析估計的模型對數據的擬合效果如何(用決定系數來測度)決定系數,也稱為R2,可以測度回歸直線對樣本數據的擬合程度。決定系數的取值在0到1之間,大體說明了回歸模型所能解釋的因變量變化占因變量總變化的比例。決定系數越接近1,回歸直線的擬合效果越好。R2=1,說明回歸直線可以解釋因變量的所有變化。R2=0,說明回歸直線無法解釋因變量的變化,因變量的變化與自變量無關。43二、一元線性回歸模型及其參數的估計
㈠一元線性回歸模型的設定對于只涉及一個自變量的回歸分析,若因變量y與自變量x之間為線性關系,可以用一個線性方程來表示二者之間的關系,此方程為一元線性回歸模型。通常先要收集若干(n)組樣本數據(xi,yi,i=1,2,…,n),然后將數據繪制散點圖,若圖中顯示x和y之間大致呈線性關系,就可以用一元線性回歸方程來描述這種關系。一元線性回歸模型(理論模型)一元線性回歸模型可表示為
y=b0+b1x+e此模型將變量y與x間的關系用兩部分描述。一部分是由x的變化引起y線性變化的部分,即:另一部分是由其他隨機因素引起y線性變化的部分,記為ε。該回歸模型表達了變量x與y之間密切相關、但還沒有到y由x唯一確定的密切程度的關系。模型中,一般稱y為被解釋變量(因變量),x為解釋變量(自變量)。β0和β1為模型的參數,又稱回歸系數。ε為隨機誤差項,又稱隨機干擾項,表示除能用x和y之間線性關系解釋的因素外的其他隨機因素對y的影響。一元線性回歸模型(理論模型的基本假定)誤差項ε是一個不可觀測的且期望值為0的隨機變量,即E(ε)=0。對一個給定的x值,y的期望值為E(y)=0+
1x對于所有的x值,ε的方差σ2都相同。誤差項ε是一個服從正態分布的隨機變量,且相互獨立,即ε~N(0,σ2)獨立性意味著對于一個特定的x值,它所對應的ε與其他x值所對應的ε不相關對于一個特定的x值,它所對應的y值與其他x所對應的y值也不相關一元線性回歸模型(應用模型)
由于ε為隨機因素不可觀測,其期望值為0,所以通常用y的數學期望E(y)
作為y的估計,即
E(y)=0+1x由于總體回歸參數0和1是未知的,必須利用樣本數據估計,所以用樣本統計量和代替回歸方程中的未知參數0和1,就得到了應用的估計一元線性回歸方程式中:是y的估計值,表示對于一個給定的x值,估計的y的期望值,是估計的回歸直線在y軸上的截距,是當x=0時y的期望值
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論