




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、.數理統計 課程論文 題目:運用spss軟件對我國人均食品支出的影響因素的統計分析學號姓名貢獻成績 指導教師陳彩霞日期精品.運用spss對我國人均食品支出的影響因素的分析摘要 隨著21世紀世界的逐步發展,中國的國力日益強大,人民的生活水品也逐步提高,而人均食品支出也越來越大。這是什么原因造成的結果呢?因此我們選取了2002年到2012年這十年的數據,對居民消費價格指數(cpi)、人均收入、農產品價格指數對人均食品支出的影響以及恩格爾系數作出了回歸分析。從數據上,我們可以發現人均食品支出、人均收入在逐年增長,且增長的幅度較大,居民消費價格指數與農產品價格指數也在增長,但增長的較慢,而恩格爾系數則
2、幾乎沒有什么波動。我們根據所選取的數據做出來相對應的模型,并對這些模型進行驗證,通過cpi、人均收入、農產品價格指數的變動對人均食品支出的不同影響程度,從而發現這些因素對人均食品支出的實際情況,并利用這些數據對今后人均食品支出作出預測。回歸模型1:運用多元回歸分析,由于自變量之間存在共線性,因此得出農產品價格指數對人均食品支出影響不顯著。 (1)回歸模型2:運用多元回歸的逐步分析法,剔除回歸系數未通過0.05的顯著檢驗,保留通過的,得到“最優”回歸方程。 (2)關鍵字:回歸分析 逐步回歸 人均食品支出 人均收入 cpi 農產品價格指數 精品.1、 引言 人均食品支出可以反映人民的消費狀況,反映
3、人民的生活水品以及人們對滿足生存、發展、享受和需要所達到的程度,更能反映一段時期一個國家的消費水平和發展水品。本問題要求通過收集整理數據,掌握對城鎮人均消費支出的影響因素,利用spss軟件進行多元回歸分析,求出回歸方程,進行統計檢驗(包括回歸方程的顯著性檢驗,回歸系數的顯著性檢驗)以及殘差的檢驗;然后進行估計和預測。2、 多元線性回歸理論基礎2.1 多元線性回歸的概念 設自變量的觀測值及因變量對應的觀測值滿足關系式 (3) 式中,是相互獨立且都服從正態分布的隨機變量。根據最小二乘法,由n個觀測值確定參數的估計值后,得到公式的估計值稱為多元線性回歸方程。建立多元線性回歸方程的過程以及對回歸方程與
4、回歸數所做的顯著性檢驗,稱為多元線性回歸分析或多元線性回歸。如果將帶入多元線性回歸方程,記,則與之間的偏差平方和,由 可得到多元線性回歸的正規方程組。通過解正規方程組,即可以算出求出回歸方程。精品.2.2 回歸方程的顯著性檢驗與一元線性回歸方程相類似,多元線性回歸方程的總平方和sst也可以分解為剩余平方和sse和回歸平方和ssr,即sst=ssr+sse (4) 式中, 而,因此 如果ssr的數值較大,sse的數值便比較小,說明回歸的效果好。如果ssr的數值較小,sse的數值便比較大,說明回歸的效果差。理論上已經證明:當原假設為,并且成立時,且ssr與sse相互獨立, (5) (6)為的無偏估
5、計。因此,給出顯著性水平,即可進行回歸方程的顯著性檢驗。2.3 回歸系數的顯著性檢驗 一個多元線性回歸方程顯著,并不表示方程中的每一個自變量精品.對因變量的影響都是重要的。因此為了對的重要程度作出比較與檢驗,有必要找出一個與有關的統計量。由于是隨機變量的線性函數,各都服從正態分布,所以式中,是正規方程組的系數矩陣的逆矩陣中第行第列的元素。還可以證明,與sse相互獨立。當原假設為并且成立時,由服從分布,推出 (7) 因此,給出顯著性水平,即可進行回歸常數與回歸系數的顯著性檢驗,得到各個是否顯著的結論。2.4 多元線性回歸的估計與預測 與一元線性回歸方程類似,多元線性回歸方程的應用也包括點預測和區
6、間預測等內容。當,且統計量,為為正規方程組的逆矩陣中第k行第j列的元素,因此,當n比較大,與與比較接近時,的方差比較小,用預測的效果比較好。精品.作區間預測時,統計量 (8)式中,mse=,由置信水平求出p|t|=中的臨界值后,若記 (9)則p=,便是時的預測區間,而為區間的半徑。當n比較大,比較接近時, (10)3、 數據來源及符號說明3.1 數據來源 所有的數據均來自中國統計年鑒2002-2012年十年的數據,如下:年份人均食品支出人均收入cpi折合的cpi(以2001年=100)農產品生產價格指數折合的農產品價格指數恩格爾系數20022271.84 8177.40 99.299.299.
7、799.737.720032416.92 9061.22 101.2100.39104.4104.937.120042709.60 10128.51 103.9104.31113.1117.7237.720052914.39 11320.77 101.8106.18101.4119.3736.720063111.92 12719.19 101.5107.78101.2120.835.820073628.03 14908.61 104.8112.95118.5143.1536.320084259.81 17067.78 105.9119.61114.1163.3437.920094478.54
8、18858.09 99.3118.7897.6159.4236.5精品.20104804.71 21033.42 103.3122.7110.9176.7935.720115506.33 23979.20 105.4129.32116.5205.9636.320126040.85 26958.99 102.6132.68102.7211.5236.23.2 符號說明.表示人均食品支出.表示人均收入.表示居民消費價格指數(cpi).表示農產品價格指數.恩格爾系數恩格爾系數表示是食品支出總額占個人消費支出總額的比重。4、 回歸方程的建立及檢驗4.1 多元回歸分析直接進入法 以人均收入、居民消費價格
9、指數、農產品價格指數,恩格爾系數為方程的自變量,人均食品支出為因變量,利用spss做回歸分析,得到回歸系數等表,比較sig.與0.05的大小關系,得出自變量與因變量的關系是否顯著,而則可以看出回歸方程所擬合的效果是否好。4.1.1 spss所產生的結果 表1模型匯總b模型rr 方調整 r 方標準 估計的誤差11.000a1.0001.00023.48677a. 預測變量: (常量), x4, x3, x1, x2。b. 因變量: y 上面所定義模型表示:確定系數的平方根()為1.000,確定系數精品.()為1.000,調整后的確定系數為1.000,標準誤差為23.48677。值越大所反映的自變
10、量與因變量的共變量比率越高,模型與數據的擬合程度越好。 表2anovab模型平方和df均方fsig.1回歸16324741.62344081185.4067398.434.000a殘差3309.7706551.628總計16328051.39210a. 預測變量: (常量), x4, x3, x1, x2。b. 因變量: y 方差分析表:列出了變異源,自由度,均方,f值及對f的顯著性檢驗。回歸平方和為16324741.623,殘差平方和3309.770,f統計量的值為7398.434,sig(顯著性水平),則拒絕原假設,認為所有回歸系數同時與0有顯著差異,自變量與因變量之間存在顯著的線性關系,
11、自變量的變化確實能反映因變量的線性變化,回歸方程顯著,若f,所以回歸。(2) 回歸系數的顯著性檢驗(t檢驗): 表5系數a模型非標準化系數標準系數tsig.共線性統計量b標準 誤差試用版容差vif1(常量)-4937.552771.548-6.400.001x1.160.013.79012.140.000.008125.344x236.3688.210.3264.430.004.006160.407x3-3.0702.303-.094-1.333.231.007146.829x469.03414.973.0424.610.004.4092.445a. 因變量: y回歸系數的顯著性檢驗是檢驗各個
12、自變量對因變量y的影響是否顯著,從而找出哪些自變量對y的影響是重要的,哪些是不重要的。假設為:。若令假設成立,說明對因變量y具有顯著的影響。采用t檢驗。若|t|或者pa,拒絕原假設,認為該回歸系數與0有顯著差異,該自變量與因變量之間存在顯著的線性關系,它的變化確實能較好地反映因變量的線性變化,應該保留在回歸方程中。若|t|a,接受原假設,認為該回歸系數與0無顯著差異,該自變量與因變量之間不存在顯著的線性關系,它的變化無法反映因變量的線性變化,應該剔除出回歸方程中,所以后續應采用逐步回歸分析,得出最優的回歸方程。在此回歸系數表中,t為回歸系數檢驗統計量,sig為相伴概率值p,p(常量)=0.00
13、10.05,p()=0.0000.05,p()=0.0040.05,p()=0.004,所以回歸方程是顯著的。4.2.3回歸方程系數的檢驗: 在以上系數表中,t為回歸系數檢驗統計量,sig為相伴概率值p,p(常量)=0.0000.05,p()=0.0000.05,p()=0.0030.05, p()=0.0040.05,說明系數都顯著。4.3 殘差檢驗 前面我們已經就方程擬合好壞、回歸方程的線性性以及參數的顯著性進行了建模分析。在回歸分析中還有一項很重要的檢驗需要進行,這就是下面要介紹的殘差分析。在回歸分析中,測定值與按回歸方程預測的值之差即為殘差,以表示。殘差遵從正態分布n(0,)。(-殘差
14、的均值)/殘差的標準差,稱為標準化殘差,以表示。遵從標準正態分布n(0,1)。實驗點的標準化殘差落在(-2,2)區間以外的概率0.05。若某一實驗點的標準化殘差落在(-2,2)區間以外,可在95%置信度將其判為異常實驗點,不參與回歸直線擬合。顯然,有多少對數據,就有多少個殘差。殘差分析就是通過殘差所提供的信息,分析出數據的可靠性、周期性或其它干擾。精品. 圖1殘差向量如則學生化殘差如果樣本回歸模型對數據擬合是良好的話,那么.4.3.1 殘差的正態性檢驗 圖2精品. 圖3由以上分別為殘差的直方圖和累積概率圖(p-p圖),其中直方圖的分布為正太分布,而累積概率圖可以看出點存在于直線的周圍,構成線性
15、的關系,這是對殘差的正態性檢驗,可以由圖像得到殘差是具有正態性的。4.3.2 殘差的獨立性檢驗用durbin-watson檢驗,其參數稱為dw或d。d的取值范圍是0d4。其統計學意義為:d2,殘差與自變量相互獨立;d2,殘差與自變量負相關。 表11模型匯總b模型rr 方調整 r 方標準 估計的誤差durbin-watson11.000a1.0001.00023.486773.069a. 預測變量: (常量), x4, x3, x1, x2。b. 因變量: y由表可知dw=3.069,在d的取值范圍中,且大于2,所以殘差具有獨立性,并殘差與自變量負相關。精品.4.3.3 殘差的方差齊性檢驗 圖4
16、 圖5精品. 圖6 圖7精品. 圖8 我們看到這就是需要的散點圖,縱坐標是標準化的參差值,橫坐標是估計值,如果散點圖擬合的直線平行于橫坐標,那么就可以認為殘差是齊性的。 利用殘差所提供的信息,我們可以得到模型的假設是合理的以及及數據是可靠的,也證明了回歸模型能夠很好的解釋數據。五、結論 本文意在通過統計軟件spss對多因素影響下的人均食品消費的多元統計回歸分析,來幫助人們了解影響人均食品消費的因素,在本文中首先根據實際情況猜想可能對因變量人均食品消費的幾個自變量因素,人均收入,cpi,農產品價格指數,恩格爾系數等存在線性關系,并作出散點圖,回歸分析表,方差分析表等數據得出初步多元回歸模型精品. (15)由于自變量之間存在相關性,對因變量產生了相互干擾的影響,所以做進一步逐步回歸分析
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 跨境電商平臺合作協議條款修訂書
- 企業級信息安全管理體系認證服務協議
- 跨境科技園區合作開發合同
- 委托擔保合同模板
- 合同范本之附條件房屋買賣合同模板
- 簡單門面裝修合同
- 車輛抵押擔保保險合同模板
- TD/T 1031.5-2011土地復墾方案編制規程第5部分:石油天然氣(含煤層氣)項目
- JJF(紡織)108-2023口罩防護效果測試儀校準規范
- JJF(紡織)055-2023標準光源箱校準規范
- DB37-T 4825.5-2025 藥品、醫療器械、化妝品企業日常監督檢查管理規范 第5部分:數據管理
- 2025年江蘇省常州市新北區外國語學校八下英語期末學業水平測試模擬試題含答案
- 2025年下半年廣東汕尾市委組織部招聘政府聘員擬聘用人員易考易錯模擬試題(共500題)試卷后附參考答案
- 關于Photoshop圖像處理的試題及答案分享
- 2025-2030年中國運動輪椅行業市場現狀供需分析及投資評估規劃分析研究報告
- 2025年社會調查與統計分析考試題及答案
- 陪跑企業協議書
- 醫學研究生課題研究中期進展報告
- 景區商戶安全協議書
- 2024-2030全球超高壓HPP滅菌設備行業調研及趨勢分析報告
- 2025年軍事理論課程考試試卷及答案
評論
0/150
提交評論