統計學:第八章相關與回歸分析_第1頁
統計學:第八章相關與回歸分析_第2頁
統計學:第八章相關與回歸分析_第3頁
統計學:第八章相關與回歸分析_第4頁
統計學:第八章相關與回歸分析_第5頁
已閱讀5頁,還剩68頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、2022-2-12河北工程大學經濟管理學院1統計學統計學2022-2-12河北工程大學經濟管理學院2 第八章第八章 相關與回歸分析相關與回歸分析 本章內容:理解相關關系概念、分類,相關分析與回歸分析的區別聯系;掌握一元線性回歸分析,學掌握一元線性回歸分析,學會用最小二乘法估計回歸參數,會用最小二乘法估計回歸參數,學會計算估計標準誤差、可決系學會計算估計標準誤差、可決系數;掌握單相關關系分析,學會數;掌握單相關關系分析,學會相關系數的計算。相關系數的計算。2022-2-12河北工程大學經濟管理學院3 第八章第八章 相關與回歸分析相關與回歸分析 本章分三節: 第一節 相關與回歸分析的基本概念 第二

2、節 一元線性回歸分析 第三節 相關分析 2022-2-12河北工程大學經濟管理學院4第一節第一節 相關與回歸分析的相關與回歸分析的基本概念基本概念 本節需要把握四個問題: 一、函數關系與相關關系; 二、相關關系的種類; 三、相關分析與回歸分析; 四、相關表和相關圖。2022-2-12河北工程大學經濟管理學院5一、函數關系與相關關系一、函數關系與相關關系 客觀現象總是普遍聯系和相互依存的,客觀現象間的數量聯系存在兩種不同類型:函數關系和相關關系。 把握三個問題: 1、函數關系; 2、相關關系; 3、二者關系。2022-2-12河北工程大學經濟管理學院6 1、函數關系函數關系是指變量之間存在著嚴格

3、確定的依存關系,在這種關系中,當一個或幾個變量取一定量的值時,另一變量有確定值與之相對應,并且這種關系可以用一個數學表達式反映出來。例如:某種產品的總成本S與該產品的產量Q以及該產品的單位成本P之間的關系可用S=PQ表達,這就是一種函數關系。通常把作為影響因素的變量稱為自變量,把發生相應變化的變量稱為因變量。在本例中,S是因變量,P與Q則是自變量。 2022-2-12河北工程大學經濟管理學院7 2、相關關系 相關關系是指變量之間存在一定的相依關系,但又不是確定的和嚴格依存的。這類關系中,當一個或幾個相互聯系的變量取一定數值時,與之相對應的變量就會有若干個數值與之相對應,從而表現出一定的波動性。

4、例如商品流轉規模與流通費用的關系,家庭收入與消費支出的關系,工業勞動生產率與產品成本的關系等都屬于相關關系。在統計中所研究的就是這種相關關系。 2022-2-12河北工程大學經濟管理學院8 上述函數關系和相關關系之間并不存在嚴格的界限,一定條件下可以轉化。由于有測量誤差等原因,函數關系在實際中往往通過相關關系表現出來;反之當對現象之間的內在聯系和規律性了解得更清楚深刻的時候,相關關系也可能轉化為函數關系。因此,相關關系通常可以用一定的函數關系表達式去近似地描述。 3、二者關系2022-2-12河北工程大學經濟管理學院9二、相關關系的種類把握以下問題:1、按相關程度劃分;2、按相關方向劃分;3、

5、按相關形式劃分;4、按變量多少劃分;5、按相關性質劃分。2022-2-12河北工程大學經濟管理學院10 1、按相關程度劃分可分為完全相關、不完全相關和不相關(1)完全相關:當一種現象的數量變化完全由另一個現象的數量變化所確定時,稱這兩種現象之間的關系為完全相關,例如圓的周長L決定于它的半徑R,即L=2R。在這種情況下,相關關系即為函數關系,也可以說函數關系是相關關系的一種特例。2022-2-12河北工程大學經濟管理學院111、按相關程度劃分(2)不相關:當兩個現象彼此互不影響,其數量變化各自獨立時,稱這兩個現象之間的關系為不相關或零相關。例如:學生的學習成績與其身高一般認為是不相關的。(3)不

6、完全相關:若兩個現象之間的關系介于完全相關和不相關之間,就稱為不完全相關,一般的相關現象都是指這種不完全相關,這是相關分析的研究對象。2022-2-12河北工程大學經濟管理學院12可分為正相關和負相關:(1)兩個相關現象間,當一個變量的數值增加(或減少)時,另一個變量的數值也隨之增加(或減少),這種相關稱為正相關。例如家庭消費支出隨著收入的增加而增加等。(2)當一個變量的數值增加(或減少)時,而另一個變量的數值相反地呈減少(或增加)趨勢變化,稱為負相關。例如勞動生產率愈高,單位產品成本愈低。 2、按相關方向劃分2022-2-12河北工程大學經濟管理學院13 3、按相關形式劃分 可以分為線性相關

7、和非線性相關: (1)當一個變量發生變動,另一個變量隨之發生大致均等的變動(增加或減少),從圖形上看,其觀測點的分布近似地表現為直線形式,就是線性相關。 (2)而當一個變量發生變動,另一個變量也隨之發生變動(增加或減少),但是這種變動不是均等的,從圖形上看,其觀察點的分布表現為各種不同的曲線形式,這種相關關系稱為非線性相關。2022-2-12河北工程大學經濟管理學院14 4、按變量多少劃分分為單相關、復相關和偏相關:(1)單相關又稱一元相關,是指兩個變量之間的相關關系,即僅限于一個變量與另一個變量之間的依存關系。(2)復相關又稱多元相關,是指三個或三個以上變量之間的相關關系。例如家庭的消費支出

8、與家庭收入水平及市場價格水平之間的關系便是一種復相關。2022-2-12河北工程大學經濟管理學院154、按變量多少劃分(3)在某一變量與多個變量相關時,當假定其他變量不變,其中兩個變量的相關關系稱為偏相關。例如在假定家庭收入水平不變的條件下,市場價格水平與家庭的消費支出的關系就是一種偏相關。2022-2-12河北工程大學經濟管理學院165、按相關性質劃分分為“真實相關”和“虛假相關”:(1)當兩種現象間的相關確實具有內在的聯系時,稱之為“真實相關”。例如消費與收入的相關關系等。(2)當兩種現象間的相關只是表面存在,實質沒有內在聯系時,稱之為“虛假相關”。判斷依據是實質性科學提供的知識。2022

9、-2-12河北工程大學經濟管理學院17三、相關分析與回歸分析三、相關分析與回歸分析把握以下問題:1、相關分析與回歸分析的概念;2、二者的聯系;3、二者的區別;4、應用中注意局限性。2022-2-12河北工程大學經濟管理學院18 1、相關分析與回歸分析的概念 二者是研究現象尖相關關系的基本方法。 (1)相關分析(狹義)指用一個指標表明現象間相互依存關系的密切程度。 (2)回歸分析:根據相關關系的具體形態,選擇一個合適的數學模型來近似表達變量間的平均變化關系。2022-2-12河北工程大學經濟管理學院19 2、二者的聯系 二者有著密切的聯系,它們具有共同的研究對象,在具體運用時需要互相補充。具體:

10、 (1)相關分析需要依靠回歸分析表明現象數量相關的具體形式; (2)回歸分析需要依靠相關分析來表明現象數量變化的相關程度,只有變量之間存在著高度相關時,進行回歸分析尋求其相關的具體形式才有意義。因此,在一些統計學的相關書籍中,回歸分析和相關分析也合并稱為相關關系分析或廣義的相關分析。2022-2-12河北工程大學經濟管理學院203、二者的區別在研究目的和具體的研究方法上是有明顯區別的,兩者的主要區別在于: (1)相關分析研究變量間相關方向、程度,不能指出變量間相互關系的具體形式,也無法從一個變量的變化推測另一個變量的變化情況;而回歸分析能確切地指出變量之間相互關系的具體形式,它可根據回歸模型從

11、已知量估計和預測未知量。 2022-2-12河北工程大學經濟管理學院21 3、二者的區別 (2)在相關分析中,不必確定自變量和因變量;而在回歸分析中,必須事先確定哪個為自變量,哪個為因變量,而且只能從自變量去推測因變量,而不能從因變量去推斷自變量。 (3)相關分析所涉及的變量一般都是隨機變量;而回歸分析中因變量是隨機的,自變量則作為研究時給定的非隨機變量。 2022-2-12河北工程大學經濟管理學院22 4、應用中注意局限性 相關和回歸分析是對現象間相關關系進行分析的有效的科學方法,但是它們有一定的局限性。在確定應用相關和回歸分析之前,必須進行定性分析,運用足夠的理論知識、專業知識和必要的經驗

12、來判斷現象之間是否具有真正的相關,是具有實質性的內在聯系還是表面上的聯系,還是一種偶然的巧合。 因此在應用相關和回歸分析對客面現象進行研究時,一定要注意把定性分析和定量分析結合起來,在定性分析基礎上開展相關和回歸的定量分析。 2022-2-12河北工程大學經濟管理學院23四、相關表和相關圖相關分析中,通過繪制相關圖和相關表,可以對現象之間存在的相關關系的方向、形式和密切程度作直觀的、大致的判斷。把握以下問題:1、相關表;2、相關圖。2022-2-12河北工程大學經濟管理學院241、相關表 (1)相關表是一種反映變量見相關關系的統計表。 研究現象之間的依存關系,首先要通過實際調查取得一系列成對的

13、數據,作為相關分析的原始資料。將某一變量按其數值的大小順序排列,然后再將與其相關的另一變量的對應值平行排列,便可得到簡單的相關表。 2022-2-12河北工程大學經濟管理學院25 1、相關表 (2)例如假設對10戶居民家庭的月可支配收入和消費指出進行調查,得到原始資料如表 表8-1 居民收入和消費的原始資料 單位:百元 根據原始資料,將消費支出從小到大排序,得到表居民家庭編號 1 2 3 4 5 6 7 8 9 10 消費支出 20 15 40 30 42 60 65 70 53 78可支配收入 25 18 60 45 62 88 92 99 75 982022-2-12河北工程大學經濟管理學

14、院26 1、相關表 (2)表8-2 居民消費和收入的相關表 單位:百元 從表中看出,隨著可支配收入的提高,居民的消費支出也有相應提高的趨勢,二者存在明顯的正相關關系。消費支出 15 20 30 40 42 53 60 65 70 78可支配收入 18 25 45 60 62 75 88 92 99 982022-2-12河北工程大學經濟管理學院272、相關圖相關圖又稱散點圖或散布圖,是以直角坐標系的橫軸代表變量X,縱軸代表變量Y,將兩變量相對應的成對的數據用坐標點的形式描繪出來,用于反映兩變量之間相關關系的圖形。由表8-2的資料繪制的相關圖如圖8-1所示。2022-2-12河北工程大學經濟管理

15、學院28圖8-1圖8 -1 居 民消費和收入的相關圖0102030405060708090020406080100120可支配收入消費支出z從圖看出,居民的消費支出與可支配收入之間呈現正線性相關關系2022-2-12河北工程大學經濟管理學院29 第二節 一元線性回歸分析 把握以下問題: 一、標準的一元線性回歸模型; 二、一元線性回歸模型的估計; 三、一元線性回歸模型擬合程度評價。2022-2-12河北工程大學經濟管理學院30一、標準的一元線性回歸模型 把握以下問題: 1、總體回歸函數; 2、樣本回歸函數; 3、樣本回歸函數與總體回歸函數的區別; 4、誤差項的標準假定。2022-2-12河北工程

16、大學經濟管理學院31 1、總體回歸函數 (1)一元線性回歸模型指只有一個因變量和一個自變量的線性回歸模型,又稱簡單線性回歸模型。 假定因變量Y主要受自變量X的影響,二者間存在近似的線性函數關系有 該式被稱為總體回歸函數,式中 是未知的參數,又叫回歸系數。Yt和Xt分別是Y和X的第t次觀測值。 是隨機誤差項,又叫隨機干擾項,它是一個特殊的隨機變量,反映未列入方程式的其他各種因素對Y的影響。) 1 . 8(21tttXY21,t2022-2-12河北工程大學經濟管理學院32 1、總體回歸函數 (2)舉例說明:消費函數 式中Yt表示消費支出, Xt表示可支配收入。 為基礎消費水平的支出,不受可支配收

17、入的影響, 為邊際消費傾向,表明可支配收入每增加一個單位,消費支出增加的數量。此處,可支配收入是決定消費支出的主要因素,圖中可表示為一條直線,但現實中確定型的消費函數很難成立,原因是除收入外還有各種因素影響消費支出。ttXY21212022-2-12河北工程大學經濟管理學院33 1、總體回歸函數 (3)實際中,只能平均看來消費支出與可支配收入的關系能用直線反映,用數學形式表示為: 上式表明:在X的值給定下, Y的期望值是嚴密的線性函數,這條直線被稱為回歸直線。 Y的實際值不一定在該直線上,只是散布在直線的周圍。我們把實際觀測點與總體回歸線垂直方向的間隔稱為隨機誤差項,即) 3 . 8()(21

18、ttXYEttttttttXYEYYEY21)()4 . 8)(則2022-2-12河北工程大學經濟管理學院342、樣本回歸函數 (1)總體回歸函數事實是未知的,用樣本信息進行估計。 根據樣本數據擬合的直線稱為樣本回歸直線,如果是擬合的是曲線,則稱為樣本回歸曲線。其函數形式與總體回歸線的形式相同,表示為: 式中 是樣本回歸線上與Xt相對應的Y值,可視為E(Yt)的估計; 是樣本回歸函數的截距系數, 是樣本回歸函數的斜率系數,它們是對總體回歸系數 的估計。121,tY2)5 .8(21ttXY2022-2-12河北工程大學經濟管理學院35 2、樣本回歸函數(2)實際觀測的Yt不完全等于 ,如果e

19、t表示二者之差( et = Yt - ),則有:上式稱為樣本回歸函數。式中et稱為殘差,et與 相互對應;n為樣本的容量。tYtY)6 .8.(,2, 1,21nteXYtttt2022-2-12河北工程大學經濟管理學院36 3、樣本回歸函數與總體回歸函數的區別 (1)總體回歸函數未知,它只有一條。樣本回歸線是根據樣本數據擬合的,每抽取一組樣本,可以擬合一條樣本回歸線; (2)總體回歸函數中的 是未知的參數,表現為常數,樣本回歸函數中的 和 是隨機變量,其具體數值隨抽取的樣本觀測值不同而變動; (3)總體回歸函數中的 是Yt與未知的總體回歸線間的縱向距離,它不可直接觀測,而樣本回歸函數中et是

20、Yt與樣本回歸線間的縱向距離,可以計算et具體數值。21,12t2022-2-12河北工程大學經濟管理學院37 4、誤差項的標準假定隨機誤差項 是無法直接觀測的。為了進行回歸分析,對其概率分布提出假定:(1)誤差項的期望值為0,即(2)誤差項的方差為常數,即(3)誤差項之間不存在序列相關關系,其協方差為0,即當ts時有:(4)自變量是給定的變量,與隨機誤差項線性無關。t0)(tE22)()(ttEVar0)()(ststECov2022-2-12河北工程大學經濟管理學院38 4、誤差項的標準假定 (5)隨機誤差項服從正態分布。 以上假定是德國數學家高斯最早提出,又稱高斯假定。 滿足以上標準假定

21、的一元線性回歸模型,稱為標準的一元線性回歸模型。2022-2-12河北工程大學經濟管理學院39二、一元線性回歸模型的估計 把握以下問題: 1、回歸系數的估計; 2、總體方差的估計; 3、最小二乘估計量的性質。2022-2-12河北工程大學經濟管理學院40 1、回歸系數的估計 (1)根據樣本資料確定樣本回歸方程時,一般希望Y的估計值盡可能接近其真實值,即et的總量越小越好,但有正負,代數和為0( et =0),通常用 et2作為衡量總偏差的尺度。所謂最小二乘法根據這一思路,使殘差平方和最小來估計回歸系數。 (2)設 為使Q最小,對 求偏導數,令其為0,得:22122)()(tttttXYYYeQ

22、122022-2-12河北工程大學經濟管理學院411、回歸系數的估計(2)整理后有:稱為標準方程組,n為樣本容量,解方程組得:00)(200)(2212211tttttttteXXYXQeXYQ即即22121ttttttXXYXXnY_2_2122222/)(11)(XYnXnYXnXYXnYXXXnYXYXntttttttttttttt2022-2-12河北工程大學經濟管理學院421、回歸系數的估計 (3)可以證明: 證明: 設 得到:222_)(1)(tttXnXXX222222_22_22_22_)(1)()()(2)(2)(tttttttttXnXnXnXXnXXnXnXXXnXXXX

23、XttttttxytttyytttxxYXnYXYYXXLYnYYYLXnXXXL1)()(1)()(1)(_222_222_xxxyLL22022-2-12河北工程大學經濟管理學院43例8-1 根據15個居民家庭的人均月食品支出與人均月收入水平的數據,估計食品支出的恩格爾函數。 解:最簡單的恩格爾函數假定在商品價格不變的條件下,實際的食品支出Y與實際的收入水平X間的關系可以用一元線性回歸模型反映。根據Y和X的數據計算有關統計量,列在表8-3中(表略),將有關合計數代入公式得:9878.91515161802.0154231802.0151616365415423151644632151222

24、022-2-12河北工程大學經濟管理學院44例8-1 解:該例中 得到 同樣 樣本回歸方程為:ttXY1802.099.980.1880423151615144632140.38242315112311)(193.10436151615163654)(1222222ttttxyttyyttxxYXnYXLYnYLXnXL1802.093.1043680.18802xxxyLL9878.912022-2-12河北工程大學經濟管理學院45例8-1 解:上式中:0.1802表示收入每增加1元,食品支出會增加0.1802元;9.9878表示即使在收入為0的情況下,食品支出也需要9.99元。根據該式計算

25、的食品支出在總收入中平均所占比重為: 上式中 即所謂恩格爾系數,本例中,恩格爾系數隨著Xt的增加而遞減,與恩格爾定律一致。1802.0/99.9/tttXXYttXY /2022-2-12河北工程大學經濟管理學院46 2、總體方差的估計 (1)在一元線性回歸模型中還包括另一個參數,即總體隨機誤差項的方差( ),它可以反映模型誤差的大小,本身不能直接測得,用最小二乘殘差et代替隨機誤差項 來估計 。 的無偏估計S2由下式給出: S2= et2/n-2,式中分子是殘差平方和,分母是自由度,n是樣本觀測值的個數,2是一元線性回歸方程中回歸系數的個數。模型中殘差滿足兩個約束條件: 因而失去兩個自由度,

26、所以自由度為n-22)(tVart220,0ttteXe2022-2-12河北工程大學經濟管理學院47 2、總體方差的估計 (2) S2的正平方根又叫做回歸估計的標準誤差。S越小表明實際觀測點與所擬合的樣本回歸線的離差程度越小,即回歸線具有較強的代表性;反之,S越大表明實際觀測點與所擬合的樣本線的離差程度越大,即回歸線的代表性較差。 (3)一般計算S2時,殘差平方和用下式計算:tttttYXYYe21222022-2-12河北工程大學經濟管理學院48例8-2 根據例8-1中的有關數據計算食品支出恩格爾函數的總體方差S2和回歸估計標準誤差S。 解:已知 將有關數據代入公式得: 又得到: S2=

27、43.47/(15-2)=3.3438 有S =1.828644632,423,123112ttttYXYY27.43446321802. 04239878. 9123112te2022-2-12河北工程大學經濟管理學院49 3、最小二乘估計量的性質 (1) 用最小二乘法求得的 值是樣本觀測值的函數,通常稱之為最小二乘估計量,它們的形式不變,但因樣本不同而不同,是一種隨機變量。可以證明在標準假定滿足下,回歸系數的最小二乘估計量的期望值等于其真值,即 其方差為:1222)(E11)(E2_222_21)()()(1()(XXVarXXXnVartt2022-2-12河北工程大學經濟管理學院50

28、3、最小二乘估計量的性質(2)最小二乘估計量是總體回歸系數的線性無偏估計量,還可以證明,其方差最小,同時隨著樣本容量的增大,其方差不斷縮小,也就是說,回歸系數的最小二乘估計量是最優線性無偏估計量和一致估計量。 這由數學家高斯和馬爾可夫提出并證明,被稱為高斯-馬爾可夫定理,表明在標準假定下,最小二乘估計量是一種最佳的估計方式。2022-2-12河北工程大學經濟管理學院51三、一元線性回歸模型擬合程度評價 把握以下問題: 1、回歸模型檢驗的種類; 2、擬合程度的概念; 3、總離差平方和的分解; 4、可決系數及其性質。2022-2-12河北工程大學經濟管理學院52 1、回歸模型檢驗的種類 包括理論意

29、義檢驗、一級檢驗和二級檢驗。 (1)理論意義檢驗涉及參數估計值符號和取值區間,檢驗是否與實質性科學的理論及人們的實踐經驗相符。 (2)一級檢驗又稱統計學檢驗,利用統計學中的抽樣理論來檢驗樣本回歸方程的可靠性,具體又分為擬合程度評價和顯著性檢驗。 (3)二級檢驗又稱經濟計量學檢驗,是對標準線性回歸模型的假定條件能否得到滿足進行檢驗,包括序列相關檢驗、異方差檢驗。2022-2-12河北工程大學經濟管理學院53 2、擬合程度的概念 擬合程度是指樣本觀測值聚集在樣本回歸線周圍的緊密程度。 判斷回歸模型擬合程度優劣最常用的數量指標是 可決系數(又稱決定系數)。該指標建立在對總離差平方和分解的基礎上。20

30、22-2-12河北工程大學經濟管理學院543、總離差平方和的分解 (1)因變量的實際觀測值與其樣本平均數之間的離差稱作總離差,即: 可以分解為兩部分:一是因變量的理論回歸值與其樣本均值的離差 ,表示能用回歸直線解釋的部分,稱為可解釋離差;二是實際觀測值與理論回歸值的離差 它是不能由回歸直線解釋的殘差et。對任一實際觀測值總有:_YYt_YYtttYYtttttteYYYYYYYY)()()()(_2022-2-12河北工程大學經濟管理學院55 3、總離差平方和的分解 (2)用圖表示: XY0_YYtttYY_YYt_YttXY21tY2022-2-12河北工程大學經濟管理學院563、總離差平方

31、和的分解 (3)將總離差式子左右平方求和,得 證明: 從而有)(2)()()()()(_22_2_2_ttttttttttYYYYYYYYYYYYYY0)(2_tttYYYY0)()()()()()(22_2_22_2_221_2121_xxxxxyxyttttttttttttLLLLXXYYXXXXYYXXXYXXYYYY22_2_)()()(ttttYYYYYY2022-2-12河北工程大學經濟管理學院57 3、總離差平方和的分解 (4)由上得:SST=SSR+SSE 式中SST是總的離差平方和;SSR是回歸直線可以解釋的離差平方和,稱為回歸平方和;SSE是回歸直線無法解釋的離差平方和,稱

32、為剩余殘差平方和,又稱殘差平方和。 又有 則 估計標準誤差SSTYYLtyy2_)(SSEYYettt22)(xyxxxxxytttLLLLXXXXYYSSR222_222_21212_)()()(xyyytLLeSSE222222nLLneSxyyyt2022-2-12河北工程大學經濟管理學院584、可決系數及其性質 (1)由 SST=SSR+SSE得 1= SSR/ SST+ SSE /SST,可見各樣本觀測點與樣本回歸線靠得越近, SSR在SST所占比例越大,將其定義為可決系數,即 r2= SSR/ SST=1- SSE /SST= 它是對回歸模型擬合程度的綜合度量,可決系數越大,模型擬

33、合越高。可決系數越小,則模型對樣本的擬合程度越差。yyxyLL22022-2-12河北工程大學經濟管理學院594、可決系數及其性質 (2)性質:A、具有非負性; B、取值范圍0 r2 1,當所有觀測值在回歸線上時, SSE=0, r2 =1,說明總離差完全可以由樣本直線解釋,當觀測值不全在樣本線上時, SSE0, r21 ,當回歸直線沒有解釋任何離差,總離差平方和等于殘差平方和,則r2=0; C、它是樣本觀測值的函數,也是統計量。2022-2-12河北工程大學經濟管理學院60例8-3 利用例8-2中計算的殘差平方和,計算例8-1擬合的樣本回歸系數的可決系數。 解:r2= SSR/ SST=1-

34、 SSE /SST=0.8863 還可以利用公式r2 = =0.18021880.80/382.40=0.8863 此外例8-2中的估計標準誤差yyxyLL28288. 1134798.4321580.18801802. 040.3822222nLLneSxyyyt2022-2-12河北工程大學經濟管理學院61 第三節 相關分析 把握以下問題: 一、相關系數概念; 二、相關系數與可決系數; 三、例8-102022-2-12河北工程大學經濟管理學院62一、相關系數概念 把握以下問題: 1、相關系數的定義; 2、總體相關系數的定義式; 3、樣本相關系數的定義公式。2022-2-12河北工程大學經濟

35、管理學院631、相關系數的定義 單相關分析是對兩個變量間的相關程度進行分析。單相關分析所用的指標稱為單相關系數簡稱相關系數。 通常用 表示總體的相關系數,以r表示樣本的相關系數。2022-2-12河北工程大學經濟管理學院642、總體相關系數的定義式 式中,Cov(X,Y)是變量X和Y的協方差;Var(X)、Var(Y)分別為變量X和Y的方差。 總體相關系數是反映兩變量之間線性相關程度的一種特征值,表現為一個常數。)81. 8()()(),(YVarXVarYXCov2022-2-12河北工程大學經濟管理學院65 3、樣本相關系數的定義公式 (1) 樣本相關系數是根據樣本觀測值計算的,抽取的樣本不同,其具體數值有差異,它是總體相關系數的一致估計量。)82. 8 ()()()(2_2_yyxxxyttttLLLYYXXY

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論