




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、會計學1統計學相關與回歸分析統計學相關與回歸分析(fnx)白含檢驗白含檢驗第一頁,共77頁。第2頁/共77頁第二頁,共77頁。第3頁/共77頁第三頁,共77頁。第4頁/共77頁第四頁,共77頁。一、變量間的相互關系(gun x)二、相關關系(gun x)的類型三、相關分析與回歸分析第5頁/共77頁第五頁,共77頁。 一、變量間的相互一、變量間的相互(xingh)(xingh)關系關系 確定性的函數關系 Y=f (X)不確定性的統計關系相關關系 相關關系是指變量之間存在一定的相依關系,但又不是確定的和嚴格依存的。 Y= f(X,u) (u為隨機變量(su j bin lin)如廣告費用( X )
2、與銷售收入( Y )之間的關系,居民的可支配收入( X )與居民的消費支出( Y )之間的關系沒有關系 變量間關系的圖形描述: 坐標圖(散點圖) 第6頁/共77頁第六頁,共77頁。第7頁/共77頁第七頁,共77頁。 相關關系的例子相關關系的例子商品的消費量商品的消費量(y)與居民收入與居民收入(x)之間的關系之間的關系商品的消費量商品的消費量(y)與物價與物價(x)之間的關系之間的關系商品銷售額商品銷售額(y)與廣告費支出與廣告費支出(x)之間的關系之間的關系糧食糧食(ling shi)畝產量畝產量(y)與施肥量與施肥量(x1) 、降雨量、降雨量(x2) 、溫度、溫度(x3)之間的關系之間的關
3、系收入水平收入水平(y)與受教育程度與受教育程度(x)之間的關系之間的關系第8頁/共77頁第八頁,共77頁。第9頁/共77頁第九頁,共77頁。(binhu)(3)不相關)不相關兩個變量的變化兩個變量的變化(binhu)相互之間相互之間完全沒有關系完全沒有關系第10頁/共77頁第十頁,共77頁。) 1 () 2() 3 () 4(1234圖中()()為線性相關,()()為非線性相關。第11頁/共77頁第十一頁,共77頁。第12頁/共77頁第十二頁,共77頁。第13頁/共77頁第十三頁,共77頁。第14頁/共77頁第十四頁,共77頁。定性分析定性分析(dngxngfnx)定量分析定量分析(dngl
4、ingfnx)四、相關關系的判斷四、相關關系的判斷第15頁/共77頁第十五頁,共77頁。第16頁/共77頁第十六頁,共77頁。整理整理(zhngl)后后有有第17頁/共77頁第十七頁,共77頁。第18頁/共77頁第十八頁,共77頁。銷售收入與廣告費相關銷售收入與廣告費相關(xinggun)圖圖第19頁/共77頁第十九頁,共77頁。五、相關分析五、相關分析(fnx)與回歸分析與回歸分析(fnx) 回歸的古典(gdin)意義: 高爾頓遺傳學的回歸概念 父母身高與子女身高的關系: 無論高個子或低個子的子女 都有向人的平均身高回歸的 趨勢第20頁/共77頁第二十頁,共77頁。回歸的現代回歸的現代(xi
5、ndi)意義意義一個因變量對若干解釋變量依存關系的研究回歸的目的(實質): 由固定(gdng)的自變量去估計因變量的平均值估計因變量平均值估計因變量平均值第21頁/共77頁第二十一頁,共77頁。第22頁/共77頁第二十二頁,共77頁。第23頁/共77頁第二十三頁,共77頁。回歸模型回歸模型多元回歸多元回歸一元回歸一元回歸線性線性回歸回歸非線性非線性回歸回歸線性回線性回歸歸非線性非線性回歸回歸第24頁/共77頁第二十四頁,共77頁。一、簡單一、簡單(ji(jindndn)n)線性相關系數及檢驗線性相關系數及檢驗二、總體回歸函數與樣本回歸函數二、總體回歸函數與樣本回歸函數三、回歸系數的估計三、回歸
6、系數的估計四、簡單四、簡單(ji(jindndn)n)線性回歸模型的檢驗線性回歸模型的檢驗 五、簡單五、簡單(ji(jindndn)n)線性回歸模型預測線性回歸模型預測第25頁/共77頁第二十五頁,共77頁。一、簡單線性相關系數一、簡單線性相關系數(xsh)及檢驗及檢驗(一)相關系數(一)相關系數(xsh)的定義的定義 單相關分析是對兩個變量之間的線性相關程度進行分析。線性相關程度可用總體相關系數 特點(tdin):對于特定的總體來說,總體相關系數是客觀存在的特定數值,表現為一個常數。 (,)(,)()()()()Cov X YCov X YVar X Var YXYVar XVar YXY是
7、變 量和協 方 差 ,和是 變 量和方 差第26頁/共77頁第二十六頁,共77頁。 樣本(yngbn)相關系數樣本(yngbn)相關系數通常用 表示 特點:樣本(yngbn)相關系數是根據從總體中抽取的隨機樣本(yngbn) 的觀測值計算出來的,是對總體相關系數的估 計,它是個隨機變量。 XYrXYrXYr_ _ _ _ _22_ _ _()()()()xyiiX Yiixxyyrxxyyxy式 中 , 和分 別 是和的 樣 本 平 均 數 。第27頁/共77頁第二十七頁,共77頁。(二)相關系數的特點(tdin): o相關系數的取值在-1與1之間。o當r=0時,表明X與Y沒有線性相關關系,但
8、可能(knng)存在其他類型關系。o當 時,表明X與Y存在一定的線性相關關系:o o o o 若 表明X與Y 為正相關o 若 表明X與Y 為負相關。o當 時,表明X與Y完全線性相關:o 若r=1, 稱X與Y完全正相關;o 若r=-1, 稱X與Y完全負相關。01r0r 0r 1r 0.3,0.30.5,0.50.8,0.81rrrr微弱相關低度相關顯著相關高度相關第28頁/共77頁第二十八頁,共77頁。2222,()()iixyiiiinxyxyrnxxnyy 具體計算樣本相關系數時 按以下公式: 第29頁/共77頁第二十九頁,共77頁。序號序號能源消耗量(十萬能源消耗量(十萬噸)噸)x工業總產
9、值(億工業總產值(億元)元)yx2y2xy1234567891011121314151635384042495254596264656869717276242524283231374041404750495148581225144416001764240127042916348138444096422546244761504151845776576625576784102496113691600168116002209250024012601230433648409509601176156816121998236025422560305534003381362134564408合計合計9166
10、25550862617537887第30頁/共77頁第三十頁,共77頁。9520.09757.09757.0625261751691655086166259163788716)(26175,55086,37887,625,916,162222222222 ryynxxnyxxynryxxyyxn解:已知結論:工業總產值與能源消耗量之間存在高度結論:工業總產值與能源消耗量之間存在高度(god)的正相關關系,能源消耗量的正相關關系,能源消耗量x的變化能夠解的變化能夠解釋工業總產值釋工業總產值y變化的變化的95.2。第31頁/共77頁第三十一頁,共77頁。(四)使用(shyng)相關系數的注意事項:
11、X和Y 都是相互(xingh)對稱的隨機變量,所以相關系數只反映變量間的線性相關程度,不 能說明非線性相關關系。相關系數不能確定變量的因果關系,也不能 說明相關關系具體接近于哪條直線。xyyx第32頁/共77頁第三十二頁,共77頁。(五)相關系數的檢驗(jinyn) 1. 1.為什么要檢驗?為什么要檢驗? 樣本樣本(yngbn)(yngbn)相關系數是隨抽樣而變動的隨機變量相關系數是隨抽樣而變動的隨機變量, ,相關相關系數的統計顯著性還有待檢驗。系數的統計顯著性還有待檢驗。2. 2.檢驗的依據:檢驗的依據: 如果如果X X和和Y Y都服從正態分布,在總體相關系都服從正態分布,在總體相關系數數
12、的假設下,可采用的假設下,可采用t t檢驗來確定變量之間相關關系的顯檢驗來確定變量之間相關關系的顯著性。著性。與樣本與樣本(yngbn)(yngbn)相關系數相關系數 r r 有關的有關的 t t統計量服從自由度為統計量服從自由度為n-n-2 2的的 t t 分布:分布: 0221(2)tr nrtn第33頁/共77頁第三十三頁,共77頁。2t2tt0002(2)ttn012H :=0 H :021(2)tr nrtn第一步提出假設 第二步計算檢驗統計量第34頁/共77頁第三十四頁,共77頁。20.025200.9757 16210.975716.661616.66162142.1448ttt
13、ntH有:拒絕,表示總體的兩變量間線性相關性顯著。00:H0116,0.9757,0.05,:0:0nrHH解:已知則提出假設:當當 成立時,則統計量成立時,則統計量221(2)trnrt n第35頁/共77頁第三十五頁,共77頁。 二、一元二、一元(y yun)線性回歸模型線性回歸模型 若干(rugn)基本概念 Y的條件分布: Y在X取某固定值條件下的分布。 對于X的每一個取值,都有Y的條件期望與之對應,在坐標圖上 Y的條件期望的點隨X而變化的軌跡所形成的直線或曲線,稱為回歸線。 如果把Y的條件期望 表示為X的某種函數: ,這個函數稱為回歸函數。 如果其函數形式是只有一個自變量的線性函數,如
14、 稱為簡單線性回歸函數。 ()iE Y X()iE Yf X)(iE YX)第36頁/共77頁第三十六頁,共77頁。(一)總體(zngt)回歸函數(PRF) n概念(ginin):將總體因變量Y的條件均值表現為自變量X的某種函數,這個函數稱為總體回歸函數(簡記為PRF)。n表現形式:n(1)總體回歸直線i( /=X,XYXiE Y X )式中是未知參數,又叫回歸系數該式表示在 的值給定的條件下, 的期望值是 的嚴密的線性函數,此直線稱為總體回歸直線。第37頁/共77頁第三十七頁,共77頁。iii,Y.(YXYXY(YiiiiiiiYXuuEXuYE ii總體線性回歸模型:式中 是隨機誤差項又稱
15、隨即干擾項,反映未列入方程式的其它各種因素對 的影響總體回歸直線 /x)表示在 的值給定的條件下,的期望值是 的嚴密的線性函數。 的實際觀察值并不一定位于該直線上,只是分散在該直線的周圍。實際觀察點與總體回歸線垂直方向的間隔,就是隨機誤差項。/X)第38頁/共77頁第三十八頁,共77頁。 (3)簡單線性回歸的基本(jbn)假定o假定假定(jidng)1(jidng)1:誤差項:誤差項u u是一個期望值為是一個期望值為0 0的隨即變量,即的隨即變量,即o假定假定(jidng)2(jidng)2:對于所有的:對于所有的X X值,誤差項值,誤差項ui ui的方差為常的方差為常數數 。o 假定假定(j
16、idng)3(jidng)3:自變量是給定的變量,與隨機誤差項線:自變量是給定的變量,與隨機誤差項線性無關性無關o 假定假定(jidng)4(jidng)4:無自相關假定:無自相關假定(jidng)(jidng)。隨機誤差項。隨機誤差項u u的逐的逐次值互不相關次值互不相關o假定假定(jidng)5(jidng)5:正態性假定:正態性假定(jidng)(jidng)。( )0E u 22(0,)iuN 隨機誤差項ui是無法直接觀測,為進行回歸分析,需對其概率分布進行假設。滿足這些假設的模型稱為(chn wi)標準的一元線性回歸模型。( ,)0ijCov u u( ,)0iiCov u X第39
17、頁/共77頁第三十九頁,共77頁。(二)樣本回歸(hugu)函數(SRF)u概念:概念:u 總體回歸函數實際上是未知的,需要總體回歸函數實際上是未知的,需要(xyo)用樣本的信息對其進行估計,根據樣本數據擬合的用樣本的信息對其進行估計,根據樣本數據擬合的直線,稱為樣本回歸直線。其相應的函數稱為樣本直線,稱為樣本回歸直線。其相應的函數稱為樣本回歸函數回歸函數 (簡記為(簡記為SRF)。)。u表現形式:線性樣本回歸函數可表示為表現形式:線性樣本回歸函數可表示為u iixyEyxyiiiyxy,式中是樣本回歸線上與相對應的 值,可視為 ()的估計值; 是樣本回歸直線的截距, 是樣回歸直線的斜率,他們
18、是對總體回歸系數的估計。也是自變量 每變動一個單位時,因變量 的平均變動值。第40頁/共77頁第四十頁,共77頁。iuniiiiiyxeee此式稱為樣本回歸方程,式中 稱為殘差,在概念上,殘差 與總體誤差項 相互對應;i=1,2,n, 是樣本容量。第41頁/共77頁第四十一頁,共77頁。(四)樣本回歸函數與總體回歸函數的關系 (1)相互(xingh)聯系 樣本回歸函數的函數形式應與設定的總體回歸函數的函數形式一致 。 和 是對總體回歸函數參數的估計。 是對總體條件期望 的估計 殘差 e 在概念上類似(li s)總體回歸函數中的隨機誤差u。回歸分析的目的: 用樣本回歸函數去估計總體回歸函數。 i
19、y(YE)第42頁/共77頁第四十二頁,共77頁。樣本(yngbn)回歸函數與總體回歸函數的關系 (2)相互區別 總體回歸函數雖然未知,但它是確定的; 樣本回歸線隨抽樣波動而變化,可以有許多條。 樣本回歸線還不是總體回歸線,至多只是未知總體 回歸線的近似表現。 總體回歸函數的參數雖未知,但是確定的常數; 樣本回歸函數的參數可估計,但是隨抽樣而變化的隨機變量。 總體回歸函數中的 是不可直接觀測(gunc)的; 而樣本回歸函數中的 是只要估計出樣本回歸的參數就可以計算的數值。 iuie第43頁/共77頁第四十三頁,共77頁。 三、回歸系數的最小二乘估計三、回歸系數的最小二乘估計(gj)基本思想:回
20、歸分析主要任務是建立能夠(nnggu)反映真實總體回歸函數的樣本回歸函數。在用樣本資料確定樣本回歸方程時,希望估計值 偏離實際觀測值 的殘差 越小越好。可以取殘差平方和 作為衡量 與 偏離程度的標準最小二乘準則 iYiYie2ieiyiYiyie第44頁/共77頁第四十四頁,共77頁。iiYX(xn , yn)(x1 , y1)(x2 , y2)(xi , yi)ei = yi-yi2211( ,)()nniiiiQyye 最小值 第45頁/共77頁第四十五頁,共77頁。22ii11( ,)()nniiiQyyyx () =最小值ii2(y)0Qxiii2()0Qx yx iinxy i2ii
21、iyxxx和第46頁/共77頁第四十六頁,共77頁。 解方程組可得求解解方程組可得求解 的標準的標準(biozhn)方程如方程如下:下:和第47頁/共77頁第四十七頁,共77頁。20.9757,0.9520rr216,916,625,37887,55086,nxyxyx由計算表知 yx第48頁/共77頁第四十八頁,共77頁。22216378879166250.796116550869166259160.79616.51421616nxyxynxxyx 6.51420.7961yx 第49頁/共77頁第四十九頁,共77頁。 (二)最小二乘估計(二)最小二乘估計(gj)的概率分布性的概率分布性質質
22、o 和和 都是服從都是服從(fcng)正態分布的隨機正態分布的隨機變量,其期望為變量,其期望為o概率分布為概率分布為()E()E(,N2211( ,)()niixNnxx 2211()niixx第50頁/共77頁第五十頁,共77頁。(三)總體(zngt)方差 的無偏估計總體隨機誤差項的方差 可以反映理論(lln)模型誤差的大小,是檢驗模型時必須利用的一個重要參數。可以證明 的無偏估計為: 222222iienen,自由度 表示一元回歸方程中回歸系數的個數,稱為回歸估計的標準差越小表明實際觀測值與所擬合的樣本回歸線的離差越小,回歸線代表性越強。222第51頁/共77頁第五十一頁,共77頁。 四、
23、一元線性回歸四、一元線性回歸(hugu)模型模型的檢驗的檢驗 第52頁/共77頁第五十二頁,共77頁。第53頁/共77頁第五十三頁,共77頁。y離差分解圖離差分解圖第54頁/共77頁第五十四頁,共77頁。SST = SSR + SSE總變差平方和總變差平方和(SST)回歸平方回歸平方和和(SSR)殘差平方和殘差平方和(SSE)第55頁/共77頁第五十五頁,共77頁。5.殘差平方和殘差平方和(SSE)6.反映除反映除 x 以外的其他因素對以外的其他因素對 y 取取值的影響,也稱為不可解釋的平值的影響,也稱為不可解釋的平方和或剩余平方和。方和或剩余平方和。第56頁/共77頁第五十六頁,共77頁。(
24、2)反映回歸)反映回歸(hugu)直線的擬合程度直線的擬合程度(3)取值范圍在)取值范圍在 0 , 1 之間之間(4) R2 1,說明回歸,說明回歸(hugu)方程擬合的越好方程擬合的越好;R20,說明回歸,說明回歸(hugu)方程擬合的越差方程擬合的越差(5)判定系數等于相關系數的平方,即)判定系數等于相關系數的平方,即R2(r)2第57頁/共77頁第五十七頁,共77頁。 (二)回歸系數顯著性的(二)回歸系數顯著性的 t 檢驗檢驗(jinyn)o對回歸模型的統計檢驗,除了對模型擬合程度的檢驗外,還包括各回歸系數的顯著性檢驗和對回歸方程的總顯著檢驗。在一元線性回歸中,由于只有一個自變量,對各回
25、歸系數的顯著性檢驗與 對回歸方程的總顯著性檢驗實際是等價的,故這里只討論(toln)對回歸系數的顯著性檢驗。o檢驗目的是評價兩個變量之間是否有關系,即變量X是否對變量Y有影響。第58頁/共77頁第五十八頁,共77頁。222221()()()niiSESExx,是回歸系數 估計的樣本標準差2211( )( )()niixSESEnxx,是 回 歸 系 數 估 計 的 樣 本 標 準 差第59頁/共77頁第五十九頁,共77頁。 (2)()tt nSE (2)()tt nSE第60頁/共77頁第六十頁,共77頁。 回歸系數顯著性回歸系數顯著性 t 檢驗檢驗(jinyn)的方法的方法(1) 提出假設一
26、般假設:常用假設:(2) 計算統計量(3)給定顯著性水平,確定臨界值 (4) 檢驗結果判斷 若 則拒絕(jju)原假設,而接受備擇假設 若 則接受原假設 , 拒絕(jju)備擇假設0:*H*1:H*0:0H1:0H2(2)tn*2(2)ttn*2(2)ttn*()()ttS ES E或第61頁/共77頁第六十一頁,共77頁。回歸系數顯著性的回歸系數顯著性的P P值檢驗值檢驗(jinyn)(jinyn)PP值的意義值的意義 P值的意義: 在既定原假設下計算回歸系數的t統計量 ,可求得統計量 t 大于 的概率 : 這里(zhl)的 是 t 統計量大于 值的概率,是尚不能拒絕原假設 最大顯著水平,稱
27、為所估計的回歸系數的P值。*t*0()P tt H*02:0H*t*t*t第62頁/共77頁第六十二頁,共77頁。02:0H02:0H第63頁/共77頁第六十三頁,共77頁。五、簡單五、簡單(jindn)線性回歸模型線性回歸模型預測預測 如果所擬合的樣本回歸方程經過(jnggu)檢驗,被認為具有經濟意義,同時具有較高的擬合度,就可利用其進行預測。即用自變量X的取值估計或預測因變量Y的取值。 (1)點預測 ffffYXXY,是自變量預期的數值, 因變量的預測值第64頁/共77頁第六十四頁,共77頁。_222()11fffiXXYYtnxfY第65頁/共77頁第六十五頁,共77頁。于0,此時個別值的預測誤差只決定(judn
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 采光井工程設計與施工安全協議
- 二手房按揭買賣合同范本含稅費及維修責任
- 專業廚師團隊承包合同協議
- 車輛租賃共享經濟合作協議范本
- 股東退股與公司未來發展權約定協議
- 催收服務提供商保密協議及合規管理規范
- 教育資源整合部分股權轉讓與教育項目合作框架協議
- 變電運行缺陷管理制度
- 古代錢財歸誰管理制度
- 固定資產購置管理制度
- 幼兒園醫學安全教育
- 綜合執法考試試題及答案
- 2025年社區工作者必考試題庫及答案
- 臨床藥理學課件抗腫瘤
- 醫療行業會議會務工作流程指南
- 2025年全國導游資格考試大綱科目一至四
- 《上海主要花壇花卉產品質量等級》
- 《氧艙維護保養實際操作技能考試規范》(TGDASE0026-2021)
- 華僑港澳臺生2025年入學考試模擬歷史試卷試題(含答案詳解)
- 《美麗的海洋世界》課件
- 【MOOC】《大學生計算與信息化素養》(北京林業大學)章節作業中國大學慕課MOOC答案
評論
0/150
提交評論