現代統計方法-回歸分析1教材課程_第1頁
現代統計方法-回歸分析1教材課程_第2頁
現代統計方法-回歸分析1教材課程_第3頁
現代統計方法-回歸分析1教材課程_第4頁
現代統計方法-回歸分析1教材課程_第5頁
已閱讀5頁,還剩114頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

現代統計方法前言ξ????統計學的幾個問題1、自1969年設立諾貝爾經濟學獎以來,已有42名學者獲獎,而其中有2/3的人是統計學家、計量經濟學家、數學家。2、目前的研究趨勢是:從一般的邏輯推理發展到重視實證研究;從理論論述發展到數量研究。3、碩士和博士的學位論文,如果沒有數量模型和分析,其文章的水平會有問題。統計學的幾個問題李懷祖在《管理學研究方法論》中提到大量的統計研究方法:描述統計推斷統計結構方程建模評估研究現代統計方法的種類一、分類分析方法:

1、聚類分析

2、判別分析

3、定性資料分析二、結構簡化方法:

1、回歸選元法

2、聚類分析

3、主成分分析

4、因子分析

5、對應分析現代統計方法的種類三、相關分析方法1、定性資料分析2、回歸分析3、典型相關分析4、主成分分析5、因子分析6、對應分析現代統計方法的種類四、預測決策方法:1、回歸分析2、判別分析3、定性資料分析4、聚類分析統計分析方法應用流程現實經濟問題提煉具體問題確定欲達目標根據定性理論設計指標變量

搜集整理統計數據

選擇統計方法構造理論模型

進行統計計算估計模型參數

修改NOYES應用分類研究結構簡化研究相關分析研究預測決策研究教材統計軟件簡介SPSSSASS-PLUSMINITABTSPEVIEW關于SPSSSPSS(StatisticalPackagefortheSocialScience)即“社會科學統計軟件包”,是世界著名的統計分析軟件。1968年,3位斯坦福大學的學生開發了最早的SPSS統計軟件系統,并基于這一系統于1975年在芝加哥合伙成立了SPSS公司,1984年開發出世界第一個統計分析軟件的微機版本。。關于SPSS于2000年正式將英文全稱更改為StatisticalProductandServiceSolutions,意為“統計產品與服務解決方案”,標志著SPSS的戰略方向正在做出重大調整。目前全球擁有25萬用戶,分布于通信、醫療、銀行、證券、保險、制造、商業、市場研究、科研教育等領域。是世界上應用最廣泛的專業統計軟件關于SASSAS系統全稱為StatisticsAnalysisSystem,最早由北卡羅來納大學的兩位生物統計學研究生編制,并于1976年成立了SAS軟件研究所,正式推出了SAS軟件。SAS是用于決策支持的大型集成信息系統,但該軟件系統最早的功能限于統計分析,至今,統計分析功能也仍是它的重要組成部分和核心功能。

關于SAS經過多年的發展,SAS已被全世界120多個國家和地區的近三萬家機構所采用,直接用戶則超過三百萬人,遍及金融、醫藥衛生、生產、運輸、通訊、政府和教育科研等領域。在數據處理和統計分析領域,SAS系統被譽為國際上的標準軟件系統,并在96~97年度被評選為建立數據庫的首選產品。堪稱統計軟件界的巨無霸。關于SASSAS系統是一個組合軟件系統,它由多個功能模塊組合而成它們是:BASESASSAS/STAT(統計分析模塊)SAS/GRAPH(繪圖模塊)SAS/QC(質量控制模塊)SAS/ETS(經濟計量學和時間序列分析模)SAS/OR(運籌學模塊)SAS/IML(交互式矩陣程序設計語言模塊SAS/FSP(快速數據處理的交互式菜單系統模塊)SAS/AF(交互式全屏幕軟件應用系統模塊)

關于SAS由于SAS系統是從大型機上的系統發展而來,在設計上也是完全針對專業用戶進行設計,因此其操作至今仍以編程為主,人機對話界面不太友好,并且在編程操作時需要用戶最好對所使用的統計方法有較清楚的了解,非統計專業人員掌握起來較為困難。而且,SAS極為高昂的價格和只租不賣的銷售策略使得實力不足的個人和機構只能對他望而卻步。關于S-PLUSS,S-PLUS,R,S語言是由AT&T貝爾實驗室開發的一種用來進行數據探索、統計分析、作圖的解釋型語言。它的豐富的數據類型(向量、數組、列表、對象等)特別有利于實現新的統計算法,其交互式運行方式及強大的圖形及交互圖形功能使得我們可以方便的探索數據。目前S語言的實現版本主要就是S-PLUS。

關于S-PLUSS-PLUS基于S語言,并由MathSoft公司的統計科學部進一步完善。作為統計學家及一般研究人員的通用方法工具箱,S-PLUS強調演示圖形、探索性數據分析、統計方法、開發新統計工具的計算方法,以及可擴展性。S-plus有微機版本和工作站版本,它是一個商業軟件,可以直接用來進行標準的統計分析得到所需結果,但是它的主要的特點是它可以交互地從各個方面去發現數據中的信息,并可以很容易地實現一個新的統計方法。

關于S-PLUS另外Auckland大學的RobertGentleman和

RossIhaka及其他志愿人員開發了一個R系統,其語法形式與S語言基本相同,但實現不同,兩種語言的程序有一定的兼容性。R是一個GPL自由軟件,現在的版本是1.00版,它比S-PLUS還少許多功能,但已經具有了很強的實用性

關于MINITABMinitab,Minitab同樣是國際上流行的一個統計軟件包,其特點是簡單易懂,在國外大學統計學系開設的統計軟件課程中,Minitab與SAS、BMDP并列,根據沒有SPSS的份,甚至有的學術研究機構專門教授Minitab之概念及其使用。MiniTabforWindows統計軟件比SAS、SPSS等小得多,但其功能并不弱,特別是它的試驗設計及質量控制等功能。關于MINITABMiniTab目前的最高版本為V14.1,它提供了對存儲在二維工作表中的數據進行分析的多種功能,包括:基本統計分析、回歸分析、方差分析、多元分析、非參數分析、時間序列分析、試驗設計、質量控制、模擬、繪制高質量三維圖形等,從功能來看,Minitab除各種統計模型外,還具有許多統計軟件不具備的功能--矩陣運算關于EViewsEViews,EViews是美國GMS公司1981年發行第1版的MicroTSP的Windows版本,通常稱為計量經濟學軟件包。EViews是EconometricsViews的縮寫,它的本意是對社會經濟關系與經濟活動的數量規律,采用計量經濟學方法與技術進行“觀察”。計量經濟學研究的核心是設計模型、收集資料、估計模型、檢驗模型、運用模型進行預測、求解模型和運用模型。EViews是完成上述任務得力的必不可少的工具

關于EViews正是由于EViews等計量經濟學軟件包的出現,使計量經濟學取得了長足的進步,發展成為實用與嚴謹的經濟學科。使用

EViews軟件包可以對時間序列和非時間序列的數據進行分析,建立序列(變量)間的統計關系式,并用該關系式進行預測、模擬等等

關于EViewsEViews。雖然

EViews是由經濟學家開發的,并且大多數被用于經濟學領域,但并意味著必須限制該軟件包僅只用于處理經濟方面的時間序列。EViews處理非時間序列數據照樣得心應手。實際上,相當大型的非時間序列(截面數據)的項目也能在

EViews中進行處理關于TSPTSPTM是一種用于經濟模型估算和模擬的完整語言。它是一個用于經濟估算的世界標準。雖然TSP主要由經濟學家開發并發展,但它的設計并沒僅把它限制在經濟領域。任何由相同變量的重復觀測得到的數據,都可用TSP分析

線性回歸分析1回歸分析第一節回歸分析的背景第二節一元線性回歸分析第三節多元線性回歸分析第三節逐步回歸分析第四節回歸診斷回歸分析的相關背景1、回歸分析的由來:英國統計學家F.GALTON(1822-1911)和其學生K.Pearson(1856-1936)觀察了1078對夫婦,以每對夫婦的平均身高為X,而取他們成年的兒子的身高為Y,得到如下經驗方程:

Y=33.73+0.516X回歸分析的相關背景2、自1969年設立諾貝爾經濟學獎以來,已有42名學者獲獎,而其中有2/3的人是統計學家、計量經濟學家、數學家。由獲獎者克萊因發起的國際連接系統使用了7447個方程和3368個外生變量。英國劍橋大學的多部門動態模型有2759個方程和7484個變量。回歸分析的相關背景3、回歸分析的幾個發展方向:1)、統計學的重要方法與回歸的關系密切時間序列分析(BOX-JINKINS)、判別分析、主成分分析、因子分析、典型相關分析2)、回歸分析自身的完善和發展自變量選擇、穩健回歸、回歸診斷、投影尋蹤、非參數回歸回歸分析的相關背景3)、新的研究方法為回歸分析提供了方法論非參數統計、自助法、刀切法、經驗貝葉斯估計4)、各種有偏估計出現:嶺估計、壓縮估計、主成分估計、STEN

估計、特征根估計、偏最小二乘估計。一元線性回歸分析1、一元線性回歸模型2、回歸模型的參數估計3、OLSE估計的性質4、回歸方程的顯著性檢驗5、回歸方程的擬合優度6、殘差分析7、回歸系數的區間估計一元線性回歸分析模型1、回歸模型建模的實踐背景2、一元線性回歸模型的數學形式:

1)、理論模型:

一元線性回歸模型的數學形式2)、樣本回歸模型對于n組觀測值有:一元線性回歸模型的數學形式3)、模型的矩陣表達:

回歸分析的參數估計(OLSE)OrdinaryLeastSquareEstimation:對于已知n組觀測值有:回歸分析的參數估計(OLSE)回歸分析的參數估計(OLSE)由此得回歸方程:

關于?系數的幾種表達方式關于回歸方程估計的幾個說明1、回歸方程通過樣本的中心點2、殘差具有如下性質:

回歸方程的極大似然估計回歸方程的極大似然估計OLSE的性質1、線性:

OLSE的性質2、無偏性OLSE的性質3、參數的方差:上面的公式表明,參數的準確性除受總體的差異外,還受X值的范圍影響,X取值范圍越大,參數就越穩定OLSE的性質Gauss-Markov條件:如果參數的下列條件成立:

回歸方程的檢驗在得到回歸方程后,必須運用統計檢驗方法分析該方程是否真正描述了Y與X之間的統計規律之后,才能進行分析預測等各種運用,檢驗的基本假設前提是:T檢驗T檢驗主要用于檢驗回歸系數有效性的統計檢驗方法1、設置假設:

T檢驗2、構造檢驗統計量:

T檢驗3、檢驗過程:在給定顯著性水平,雙側檢驗臨界值為,當,拒絕原假設,反之,接受原假設,即回歸方程不成立,T檢驗4、P值檢驗法:

P值又稱P-Value,基本的檢驗關系是:

P()=P值其中t為檢驗統計量,服從t(n-2)的分布判別的標準是:用P值代替t值的優越性1、直接對比P值與的水平,不用查表2、用P值檢驗可比性較好。3、P值的意義明確,就是犯拒鎮真錯誤的概率。F檢驗1、回歸方程平方和分解;見分解圖YXF檢驗由上圖有:SST---SumofsquaresforTotalSSE---SumofsquaresforerrorSSR---SumofsquaresforRegression

F檢驗2、回歸方程顯著性檢驗1)、設置假設:2)、構造統計量:

F檢驗3)、檢驗標準:

F檢驗方差來源自由度平方和均方F值P值回歸1SSRSSR/1對比P與殘差n-2SSESSE/n-2總和n-1SST三種檢驗的關系可以證明,就一元回歸方程而言,回歸系數檢驗、相關系數檢驗和F檢驗是完全等價的。基本關系是:

回歸方程的擬合優度檢驗1、檢驗公式:2、基本意義:表現回歸方程總平方和中能夠為回歸平方和解釋部分的比重,該值越大則擬合優度越好。

但是,當觀測值很大時,高度顯著的檢驗結果可能對應較低的決定系數,產生這種結果的原因有:X與Y存在的關系不是線性關系而是非線性的。X與Y的線性相關關系確立,但是誤差項方差太大,導致樣本決定系數很小。回歸方程的擬合優度檢驗回歸系數的區間估計在實際運用中,經常考慮回歸系數的區間估計,由公式:1、區間估計的統計量:

回歸系數的區間估計2、概率度公式:回歸系數的區間估計3、區間估計:回歸方程預測與控制1、單值預測:回歸方程預測與控制2、區間預測:1)、因變量新值的區間估計:回歸方程預測與控制2)、因變量新值的平均值的區間估計一元線性回歸模型的估計某地區月人均收入與月食品支出的資料恩格爾函數計算示例回歸方程誤差的估計總體回歸方程的誤差與樣本誤差的關系為:根據回歸直線得到:

回歸均方誤差與標準誤差回歸方程誤差的估計最小二乘法估計量的性質最小二乘法估計量的性質一元線性回歸模型的檢驗回歸方程必須通過檢驗才能實際應用檢驗內容:

1、統計學檢驗:擬合程度評價-----可決系數評價顯著性檢驗--------T檢驗,F檢驗

2、計量經濟學檢驗----DW,等級相關檢驗可決系數的含義1、回歸方程平方和分解;見分解圖YX可決系數的含義由上圖有:SST---SumofsquaresforTotalSSE---SumofsquaresforerrorSSR---SumofsquaresforRegression

可決系數的含義由上面的公式有:可決系數的含義可決系數定義為:很顯然,可決系數越大,方程的擬合度就越高。可決系數的應用可決系數的應用可決系數的特性:1、具有非負性2、取值范圍為:3、可決系數是樣本觀測值的函數T檢驗T檢驗主要用于檢驗回歸系數有效性的統計檢驗方法1、設置假設:

T檢驗2、構造檢驗統計量:

T檢驗T檢驗T檢驗T檢驗3、檢驗過程:在給定顯著性水平,雙側檢驗臨界值為,當,拒絕原假設,反之,接受原假設,即回歸方程不成立,T檢驗T檢驗T檢驗4、P值檢驗法:

P值又稱P-Value,基本的檢驗關系是:

P()=P值其中t為檢驗統計量,服從t(n-2)的分布判別的標準是:用P值代替t值的優越性1、直接對比P值與的水平,不用查表2、用P值檢驗可比性較好。3、P值的意義明確,就是犯拒鎮真錯誤的概率。回歸方程預測與控制1、單值預測:示例假定某地區居民家庭的人均收入為200元,根據回歸方程,有月食品支出預測值:

y=9.99+0.1802xy=9.99+0.1802×200=46.03元回歸方程預測與控制2、區間預測:因變量新值的區間估計:回歸方程預測與控制因變量預測值的估計區間回歸方程預測與控制由上例有:回歸方程預測與控制一元線性回歸分析1、一元線性回歸模型(理論模型與經驗模型)2、回歸模型的參數估計(OLS估計與殘差計算)3、回歸方程的顯著性檢驗(t回歸系數的t檢驗)4、回歸方程的擬合優度(可決系數,F檢驗)5、殘差分析(回歸診斷)6、回歸系數的區間估計(單值預測與區間估計)第三節相關分析相關系數的定義相關系數與可決系數單相關系數的檢驗相關系數的定義1、相關系數:是在直線相關的前提下,用以測量兩個變量之間相關關系的密切程度的統計分析工具。

2、相關系數的含義解釋:

1)、相關系數測定的原始公式:

積差法公式:

積差法公式的幾何解釋積差法公式的幾何解釋相關系數的測算公式:

樣本相關系數的計算一元線性回歸模型的估計某地區月人均收入與月食品支出的資料計算示例(P177)0.3----0.5低度相關,0.6---

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論