




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、相關分析線性回歸分析提綱相關分析偏相關分析回歸分析曲線估計4321一、相關分析一. 變量相關的概念二. 相關系數及其計算變量間的關系函數關系1. 是一一對應的確定關系 設有兩個變量 x 和 y ,變量 y 隨變量 x 一起變化,并完全依賴于 x ,當變量 x 取某個數值時, y 依確定的關系取相應的值,則稱 y 是 x 的函數,記為 y = f (x),其中 x 稱為自變量,y 稱為因變量2. 各觀測點落在一條線上 xy 函數關系的例子某種商品的銷售額(y)與銷售量(x)之間的關系可表示為 y = p x (p 為單價)圓的面積(S)與半徑之間的關系可表示為 S = R2 企業的原材料消耗額(
2、y)與產量(x1) 、單位產量消耗(x2) 、原材料價格(x3)之間的關系可表示為y = x1 x2 x3 相關關系的例子商品的消費量(y)與居民收入(x)之間的關系商品銷售額(y)與廣告費支出(x)之間的關系糧食畝產量(y)與施肥量(x1) 、降雨量(x2) 、溫度(x3)之間的關系收入水平(y)與受教育程度(x)之間的關系父親身高(y)與子女身高(x)之間的關系變量間的關系相關關系 1.變量間關系不能用函數關系精確表達 2.一個變量的取值不能由另一個變量唯一確定 3.當變量 x 取某個值時,變量 y 的取值可能有幾個4.各觀測點分布在直線周圍 xy相關關系和函數關系的聯系函數關系在實際中往
3、往通過相關關系表現出來相關關系常常要使用函數關系的形式來表現,以便找到相關關系的一般數量表現形式相關關系的類型相關關系非線性相關線性相關正相關正相關負相關負相關完全相關不相關相關關系的圖示不相關負線性相關正線性相關非線性相關完全負線性相關完全正線性相關相關關系的測度相關系數1.對變量之間關系密切程度的度量2.對兩個變量之間線性相關程度的度量稱為簡單相關系數3.若相關系數是根據總體全部數據計算的,稱為總體相關系數,記為4.若是根據樣本數據計算的,則稱為樣本相關系數,記為 r 相關系數的計算 樣本相關系數的計算公式或化簡為相關系數取值及其意義1. r 的取值范圍是 -1,12. |r|=1,為完全
4、相關r =1,為完全正相關r =-1,為完全負正相關3. r = 0,不存在線性相關關系4. -1r0,為負相關5. 0t,拒絕H0 若tt(13-2)=2.201,拒絕H0,人均消費金額與人均國民收入之間的相關關系顯著相關分析SPSS操作案例為研究高等院校人文社會科學研究中立項課題數受哪些因素的影響,收集到某年31個省市自治區部分高校有關社科研究方面的數據,研究立項課題數(當年)與投入的具有高級職稱的人年數(上年)、發表的論文數(上年)之間是否具有較強的線性關系。思路1、繪制散點圖,直觀展現變量之間的統計關系圖形舊對話框散點矩陣分布選取相應變量到“矩陣變量”中2、計算相關系數,以數值的方式反
5、映變量間線性相關的強弱程度分析相關雙變量選擇參加相關系數的變量到“變量”中選擇計算哪種相關系數練習1利用SPSS軟件完成【例8.1】二、偏相關分析1、分析相關偏相關2、選擇參與分析的變量3、選擇一個或多個控制變量偏相關分析也稱凈相關分析,在控制其他變量的線性影響的條件下分析兩變量間的線性相關,所采用的工具是偏相關系數(凈相關系數)。三、回歸分析線性回歸模型回歸參數的最小二乘估計回歸方程的擬合優度檢驗回歸方程的顯著性檢驗回歸系數的顯著性檢驗知識點回顧什么是回歸分析?1. 從一組樣本數據出發,確定變量之間的數學關系式2. 對這些關系式的可信程度進行各種統計檢驗,并從影響某一特定變量的諸多變量中找出
6、哪些變量的影響顯著,哪些不顯著3. 利用所求的關系式,根據一個或幾個變量的取值來預測或控制另一個特定變量的取值,并給出這種預測或控制的精確程度回歸分析與相關分析的區別1. 相關分析中,變量 x 變量 y 處于平等的地位;回歸分析中,變量 y 稱為因變量,處在被解釋的地位,x 稱為自變量,用于預測因變量的變化2. 相關分析中所涉及的變量 x 和 y 都是隨機變量;回歸分析中,因變量 y 是隨機變量,自變量 x 可以是隨機變量,也可以是非隨機的確定變量3. 相關分析主要是描述兩個變量之間線性關系的密切程度;回歸分析不僅可以揭示變量 x 對變量 y 的影響大小,還可以由回歸方程進行預測和控制 回歸模
7、型與回歸方程回歸模型1. 回答“變量之間是什么樣的關系?”2. 方程中運用因變量(響應變量)被預測的變量自變量 (解釋變量)用于預測的變量3.主要用于預測和估計回歸模型的類型一個自變量兩個及兩個以上自變量回歸模型多元回歸一元回歸線性回歸非線性回歸線性回歸非線性回歸一元線性回歸模型1. 當只涉及一個自變量時稱為一元回歸,若因變量 y 與自變量 x 之間為線性關系時稱為一元線性回歸2. 對于具有線性關系的兩個變量,可以用一個線性方程來表示它們之間的關系3. 描述因變量 y 如何依賴于自變量 x 和誤差項 的方程稱為回歸模型一元線性回歸模型 對于只涉及一個自變量的簡單線性回歸模型可表示為 y = b
8、0 + b1 x + e模型中,y 是 x 的線性函數加上誤差項線性部分反映了由于 x 的變化而引起的 y 的變化誤差項 是隨機變量反映了除 x 和 y 之間的線性關系之外的隨機因素對 y 的影響是不能由 x 和 y 之間的線性關系所解釋的變異性0 和 1 稱為模型的參數基本假定1. 誤差項是一個期望值為0的隨機變量,即E()=0。對于一個給定的 x 值,y 的期望值為 E ( y ) = 0+ 1 x2. 對于所有的 x 值,的方差2 都相同3. 誤差項是一個服從正態分布的隨機變量,且相互獨立。即N( 0 ,2 )獨立性意味著對于一個特定的 x 值,它所對應的與其他 x 值所對應的不相關對于
9、一個特定的 x 值,它所對應的 y 值與其他 x 所對應的 y 值也不相關回歸方程1. 描述 y 的平均值或期望值如何依賴于 x 的方程稱為回歸方程2. 簡單線性回歸方程的形式如下 E( y ) = 0+ 1 x方程的圖示是一條直線,因此也稱為直線回歸方程0是回歸直線在 y 軸上的截距,是當 x=0 時 y 的期望值1是直線的斜率,稱為回歸系數,表示當 x 每變動一個單位時,y 的平均變動值估計(經驗)的回歸方程簡單線性回歸中估計的回歸方程為其中: 是估計的回歸直線在 y 軸上的截距, 是直線的斜率,它表示對于一個給定的 x 的值,是 y 的估計值,也表示 x 每變動一個單位時, y 的平均變
10、動值 用樣本統計量 和 代替回歸方程中的未知參數 和 ,就得到了估計的回歸方程總體回歸參數 和 是未知的,必需利用樣本數據去估計參數 0 和 1 的最小二乘估計最小二乘法圖例xy(xn , yn)(x1 , y1)(x2 , y2)(xi , yi)ei = yi-yi最小二乘法使因變量的觀察值與估計值之間的離差平方和達到最小來求得 和 的方法。即用最小二乘法擬合的直線來代表x與y之間的關系與實際數據的誤差比其他任何直線都小 和 的計算公式 根據最小二乘法的要求,可得求解 和 的標準方程如下估計方程的求法實例 【例】根據例8.1中的數據,配合人均消費金額對人均國民收入的回歸方程 根據 和 的求
11、解公式得 人均消費金額對人均國民收入的回歸方程為y = 54.22286 + 0.52638 x回歸方程的顯著性檢驗1、擬合優度的檢驗2、線性關系的檢驗3、回歸系數的檢驗離差平方和的分解1. 因變量 y 的取值是不同的,y 取值的這種波動稱為變差。變差來源于兩個方面由于自變量 x 的取值不同造成的除 x 以外的其他因素(如x對y的非線性影響、測量誤差等)的影響2. 對一個具體的觀測值來說,變差的大小可以通過該實際觀測值與其均值之差 來表示圖示xyy離差分解圖三個平方和的關系2. 兩端平方后求和有從圖上看有SST = SSR + SSE總變差平方和(SST)回歸平方和(SSR)殘差平方和(SSE
12、)三個平方和的意義1. 總平方和(SST)反映因變量的 n 個觀察值與其均值的總離差2. 回歸平方和(SSR)反映自變量 x 的變化對因變量 y 取值變化的影響,或者說,是由于 x 與 y 之間的線性關系引起的 y 的取值變化,也稱為可解釋的平方和3. 殘差平方和(SSE)反映除 x 以外的其他因素對 y 取值的影響,也稱為不可解釋的平方和或剩余平方和圖示xyy離差分解圖擬合優度檢驗判定系數 r2 1. 回歸平方和占總離差平方和的比例2. 反映回歸直線的擬合程度3. 取值范圍在 0 , 1 之間4. r2 1,說明回歸方程擬合的越好;r20,說明回歸方程擬合的越差5. 判定系數等于相關系數的平
13、方,即r2(r)2擬合優度檢驗估計標準誤差 Sy1. 實際觀察值與回歸估計值離差平方和的均方根2. 反映實際觀察值在回歸直線周圍的分散狀況3. 從另一個角度說明了回歸直線的擬合程度4. 計算公式為注:上例的計算結果為14.949678線性關系的檢驗1. 檢驗自變量和因變量之間的線性關系是否顯著2. 具體方法是將回歸離差平方和(SSR)同剩余離差平方和(SSE)加以比較,應用F檢驗來分析二者之間的差別是否顯著如果是顯著的,兩個變量之間存在線性關系如果不顯著,兩個變量之間不存在線性關系檢驗的步驟1. 提出假設H0:線性關系不顯著2. 計算檢驗統計量F確定顯著性水平,并根據分子自由度1和分母自由度n
14、-2找出臨界值F 作出決策:若FF ,拒絕H0;若Ft,拒絕H0; tt=2.201,拒絕H0,表明人均收入與人均消費之間有線性關系對前例的回歸系數進行顯著性檢驗(0.05)1、一元線性回歸分析案例現有1997-2013年某地區全社會固定資產投資總額NINV和國內生產總值GDP兩個指標的年度數據。試研究NINV和GDP的數量關系,并建立全社會NINV和GDP的線性回歸方程。思路和主要步驟繪制散點圖計算相關系數線性回歸分析1、分析回歸線性2、選擇被解釋變量(因變量)3、選擇解釋變量(自變量)練習1完成上例,并對輸出結果進行解釋2、多元線性回歸分析案例利用“高校科研研究”數據,分析立項課題數(X5)與投入人年數(X2)、投入高級職稱的人年數(X3)、投入科研事業費(X4)、專著數(X6)、論文數(X7)、獲獎數(X8)之間的線性關系主要步驟1、分析回歸線性2、選擇被解釋變量(因變量)3、選擇解釋變量(自變量)4、選擇回歸分析中解釋變量的篩選策略5、練習2完成上例,盡量解釋輸出結果四、曲線估計1、SPSS中的本質線性模型1、SPSS中的本質線性模型1、SPSS中的本質線性模型2、案例:教育支出分析根據1988-2012年全國人均消費性
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 安全注射單選試題及答案
- 基于區塊鏈技術的2025年互聯網+政務服務安全與可信度提升與實踐報告001
- 2025年直播電商主播影響力測評與定制化營銷策略研究報告
- 南京網絡課件師培訓
- 顧問式營銷培訓課件
- 制圖基本技術課件
- 腫瘤重點專科建設成果匯報
- 脂肪瘤護理診斷
- 中國入境旅游課件下載
- 中國兒童文學史課件
- 大氣污染控制工程課程設計_某工廠布袋除塵器的設計
- 第二講:黔東南州優勢礦產資源
- 康復醫院的設計要點精選
- 10kv高壓架空電線防護方案概述
- 空調維保方案及報價(共3頁)
- 石油化工管道施工方案
- 四川SG-008技術、經濟簽證核定單(共2頁)
- 崗位分析及崗位職責富士康公司組織架構及部門職責
- 商品房銷售代理合同
- 智能化建筑工程檢驗批質量驗收記錄文本表(共69頁)
- GB∕T 40740-2021 堆焊工藝評定試驗
評論
0/150
提交評論