




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
相關與回歸分析相關與回歸分析第一節
相關分析的意義和種類第二節
相關關系的測定方法第三節
回歸分析第一節
相關分析的意義和種類
一、相關分析的概念相關分析(Correlationanalysis)是研究兩個或兩個以上變量之間相關程度大小以及用一定函數來表達現象相互關系的方法。現象之間的數量關系,存在著兩種不同的類型,一是函數關系,另一種是相關關系。(1)函數關系:它反映著現象之間存在著嚴密的依存關系,在這種關系中對于某一變量的一個數量值,都有另一變量的確定值與之對應。(2)相關關系:它是指現象之間確實存在的,但關系值不固定的相互依存關系。二、回歸分析與相關分析的作用1、確定特定變量之間是否存在相關關系,并根據觀察資料建立比較合適的回歸方程,從而分析變量之間相互關系的密切程度。2、根據一個或幾個變量的數值預測或控制另一個變量的數值,并且了解這種預測或控制的精確度。3、對共同影響一個變量的許多的變量之間,找出哪些是重要因素,哪些是次要因素。三、相關分析的種類和特點(一)相關關系的種類1、按相關程度劃分完全相關:Y的變化完全由X的變化確定;不相關:Y與X不相互影響,各自獨立變化;不完全相關:Y與X之間有一定程度的相互影響。2、按相關方向劃分正相關:X與Y同時變大或變小;負相關:X變大,Y變小或X變小,Y變大。3、按相關形式劃分線性相關:Y與X的關系呈現出線性關系;非線性相關:Y與X的關系呈現出非線性關系。4、按變量多少劃分單相關:指兩個變量間的相關關系;復相關:指三個以上變量間的相關關系;偏相關:指多個變量情形下,固定其他變量,只
考慮其中兩個變量間的相關關系。(二)相關分析的特點1、兩變量是對等的關系。2、相關分析中,只能計算出一個相關系數,相關系數的絕對值在0和1之間,其值大小反映兩變量間相關的密切程度。3、相關系數有正有負之分。4、相關系數計算的資料要求是:相關的兩變量必須是隨機的,這也是對等關系的反映。四、相關分析的主要目的和內容(一)主要目的相關分析的主要目的,就是對現象間相關關系的密切程度和變化規律進行分析,找出相互關系的模式,以便進行統計預測和推算,為制定計劃、決策提供統計資料。(二)內容1、確定現象之間有無相關關系。2、確定相關關系的表現形式。3、判定相關關系的方向和密切程度。4、為達到一定密切程度的相關關系建立適當的數學模型(通常稱為回歸方程),以確定自變量與因變量之間數量變化的規律性。5、測定數學模型代表性大小,并根據自變量的數值,對因變量的數量變化做出具有一定概率保證度的推算和預測。第二節
相關關系的測定方法一、相關表根據資料是否分組,相關表可分為簡單相關表和分組相關表。(一)簡單相關表對于比較少的資料,可以不加分組,只將某一變量的變量值按從小到大的順序,并將與它可能具有相關關系的變量的變量值與之一一對應,按其相應的變量值順序排列,即可編制成簡單相關表。【例】某廠某產品產量與單位成本相關表
年
份
產量(千件)單位成本(元)19946521995850199695119971148199812491999144820001546200117442002194120032040(二)分組相關表當原始資料很多時,可將原始資料進行分組,編制成分組相關表。1、單變量分組相關表在原始資料中有兩個變量,只對其中的一個變量分組,對另一個變量不分組,并且對于分組變量計算各組相應的次數,對于不分組的變量計算平均數。這樣編制的相關表,稱為單變量分組相關表。(1)單項式分組相關表【例】(2)組距式分組相關表【例】某紡織廠118名工人看管機器數與勞動生產率相關關系表按看管機器數分組(臺)工人人數(人)勞動生產率(米/小時)5—710148—9141710—11212212—13302513—15333216—17323718—192142∑118—2、雙變量分組相關表雙變量分組,就是對所研究的兩個變量都加以分組。【例】某公司200名職工的工齡和時工資等級相關關系表
按工齡分組(年)按時工資級別分組(元)合計1231—56—1011—1516—2021及以上2040241600102426000128202050605020∑1006040200二、相關圖相關圖又稱散點圖,是以直角坐標系的橫軸代表變量x,縱軸代表變量y,將兩個變量相對應的成對數據用坐標點的形式描繪出來,用于反映兩變量之間的相關關系的圖形。相關關系的圖示:
不相關
負線性相關
正線性相關
非線性相關
完全負線性相關完全正線性相關
三、相關系數測定變量之間相關密切程度的比較完善的指標是相關系數。(一)相關系數的計算【例】某市1998年—2005年的工資性現金支出與城鎮儲蓄存款余額的資料如下表:序號年份x(萬元)y(萬元)11998500120-310-15596100240254805021999540140-270-13572900182253645032000620150-190-12536100156252375042001730200-80-75640056256000520029002809058100254506200397035016075256005625120007200410504502401755760030625420008200511705103602351296005522584600合計64802200--432400155000253300計算結果表明:該市工資性現金支出與城鎮儲蓄存款余額之間存在著高度正相關。2、協方差
xy2的意義它是積差平均數,是度量x,y關系的一重要指標。其作用在于:(1)顯示x與y是正相關還是負相關。(2)協方差顯示x與y相關程度的大小。3、標準差
x和
y的作用(1)x,y協方差是有名數,不同現象的變異情況不同,相關程度不能直接以協方差大小加以比較。標準化結果協方差化為無名數,就可以比較不同現象相關程度的高低。(2)x,y協方差數值可無限增多或減少,將變量離差標準化的結果使相關系數的絕對值不超過1,即相關系數在-1與+1之間變動,就便于說明問題:當相關系數為±1時,表明x與y完全線性相關;當相關系數為0時,表示x與y不相關;相關系數的絕對值越接近于1,表明x,y的相關程度越高。(二)相關系數的性質相關系數相關等級|r|=10.8≤|r|<10.5≤|r|<0.80.3≤|r|<0.50<|r|<0.3r=0完全線性相關高度線性相關顯著線性相關低度線性相關微弱線性相關不存在線性相關(三)相關系數的簡捷計算方法1、資料未分組的計算公式:2、資料分組的計算公式:第三節
回歸分析一、一元線性回歸分析的概念和特點(一)回歸分析的概念回歸分析就是對具有相關關系的兩個變量之間數量變化的一般關系進行測定,確定一個與之相對應的數學表達式,以便進行估計或預測的統計方法。(二)回歸的分類1、按自變量的個數分為:一元回歸和多元回歸。2、按照回歸線的形狀分為:線性回歸和非線性回歸。(二)一元線性回歸分析的特點1、兩變量中,一個是自變量,一個是因變量。2、回歸方程不是抽象的數字模型,而是用自變量數值推算因變量數值的根據,必須反映變量之間關系的一般變動情況。3、對于沒有明顯因果關系的兩個變量,可以確定兩個不能互相替代的回歸方程,一是以x為自變量,以y為因變量的回歸直線方程;另一是以x為因變量,以y為自變量的回歸直線方程,這兩條回歸直線方程斜率不同,意義不同。4、直線回歸方程系數即斜率有正有負。5、計算回歸方程的資料要求是,因變量為隨機的,而自變量是給定的數值,求出回歸方程后,也是給定自變量值,代入方程中,推算出因變量的一般值或平均數值。二、一元線性回歸模型的建立及應用(一)一元線性回歸模型的概念一元線性回歸模型又稱簡單直線回歸模型,它是根據成對的兩個變量的數據而配合的直線方程。(二)一元線性回歸模型的建立yc=a+bx式中:yc—直線的估計值;a—直線的起點值(數學意義上的直線縱軸上
的截距),表示當x=0時,y的估計值;b—回歸系數(數學意義上的直線的斜率),
表示當x增加或減少一個單位時,y平均增
加或減少的數量。
a、b的確定:
在簡單直線回歸方程中,a、b為待定系數,常用最小平方法來確定,即∑(y-yc)2=最小值。
【例】為研究收入與食品支出的關系,隨機抽取了10戶家庭的樣本(百元),請擬合樣本回歸方程。解:通過散點圖可近似看出收入與食品支出之間呈線性關系,故設兩者有關系
經濟意義:當收入為0時,亦須有217.26元的食品支出;收入每增加100元,食品支出平均增加20.23元。三、一元線性回歸的相關分析與方差分析(一)離差平方和的分解xyy{}}
離差分解圖SST=SSR+SSE總平方和(SST){回歸平方和(SSR)殘差平方和(SSE){{從圖中可將總變差分解(1)總平方和(SST)反映因變量的n個觀察值與其均值的總離差。(2)回歸平方和(SSR)反映由于x與y之間的線性關系引起的y的取值變化,也稱可解釋的平方和。說明自變量
x的變化對因變量y取值變化的影響。(3)殘差平方和(SSE)反映除x以外的其他因素對y取值的影響,也稱為不可解釋的平方和或剩余平方和。(二)決定系數(r2)決定系數是回歸平方和占總離差平方和的比例。決定系數接近于1,說明所有相關點都接近回歸直線方程,相關程度就很高。當決定系數等于1時,相關點就落在回歸直線上,即為完全相關。四、一元線性回歸估計標準誤差(一)估計標準誤差的概念估計標準誤差是因變量實際值與理論值的平均離差,是用來說明回歸方程代表性大小的統計分析指標,簡稱為估計標準差。若估計標準差小,表明回歸方程準確性高,代表性大;反之,若估計標準誤差大,則表明回歸直線代表性小,用它進行回歸預測準確性低。(二)估計標準誤差的計算方法1、根據因變量實際值和估計值的離差計算由于實際運用時變量值資料很多,所以計算公式中自由度一般可以忽略,因而估計標準誤差的計算公式可寫成:2、利用參數a、b的已知值計算五、曲線回歸分析(一)曲線回歸分析的意義在研究現象的相關關系時,并不完全呈直線關系,還會反映出某種非線性的曲線關系,因此,就應配合適當的曲線形式,為兩個變量擬合一條相應的曲線作為回歸線,進行曲線回歸分析。(二)曲線回歸方程形式的確定在對實際的客觀現象進行定量分析時,選擇回歸方程的具體形式應遵循以下原則:方程形式應與經濟學的基本理論相一致。方程有較高的擬合程度。方程的數學形式要盡可能簡單。(三)曲線回歸方程的求解1、二次曲線回歸方程及其線性化回歸方程為:yc=a+bx+cx2其線性化的方法是:設x1=x,x2=x2,則二次曲線方程變化為二元一次直線方程:yc=a+bx1+cx2,用二元一次方程求出回歸參數a、b、c后,再代轉去,還原為二次曲線方程。2、指數曲線回歸方程及其線性化回歸方程為:yc=abx它的線性化用取對數的方法化為:令lgyc=yc′,lga=a′,lgb=b′,則得:yc′=a′+b′x。用此直線方程求出a′、b′之后,再取反對數還原為指數曲線方程。3、生產函數曲線回歸方程及其線性化回歸
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 租賃店鋪的殘疾人士服務考核試卷
- 鑄造過程中的質量管理方法創新與實踐案例分析考核試卷
- 銀礦市場動態監測與投資決策分析考核試卷
- 過敏性休克病人急救護理
- 呼吸道疾病預防及措施
- 院前急救的常見護理技術
- 機場應急救援淺析課件
- 影像學呼吸系統概述
- 外科手部護理標準流程
- 感染控制管理規范實施框架
- 常州保安證考試題及答案
- 《化工和危險化學品生產經營單位重大生產安全事故隱患判定標準》解讀與培訓
- 《合理用藥安全教育》課件
- 優化能源消耗的綠色IT部署戰略規劃
- 2025年上半年內蒙古包頭市市直事業單位招考易考易錯模擬試題(共500題)試卷后附參考答案
- 2025年度人工智能產業投資基金入股協議4篇
- 4.2.2光柵傳感器測量位移
- 2025年華遠陸港集團所屬華遠陸港網絡貨運(山西)限公司招聘(72人)管理單位筆試遴選500模擬題附帶答案詳解
- T-CCIASD 10012-2024 ISO 標準集裝箱用水性涂料
- 國家開放大學《金融學》機考題庫
- 證據法學復習資料
評論
0/150
提交評論