




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
十闞石曲力CH[NAUNIVERSITYOFPETROLEUM《數據分析與統計軟件》課程論文題目:我國城鎮居民人均生活消費支出的統計分析研究學生姓名:xxxxxx學號:1309xxxxxx專業班級:數學自動回復功能保自動回復功能自自動回復功能保存+文檔1自動回復功能保存+文檔1自動回復功能保存+文檔1動回復功能保存+文檔1文檔1存+文檔1用數學1301指導教師:丁永臻2015年十闞石曲力CH[NAUNIVERSITYOFPETROLEUM我國城鎮居民人均生活消費支出的統計分析研究摘要近年來中國經濟發生了翻天覆地的變化,人民的生活水平得到了很大的提高。而消費水平是衡量人民生活水平的重要方面。但是,由于我國各省市的經濟背景、社會背景和環境背景等都存在著這樣或那樣的差異,從而導致了生活消費水平也參差不齊。為了客觀的了解我國城鎮居民人均生活消費支出,正確認識和評價居民消費水平,本文以主成分分析和聚類分析為出發點,研究分析了我國31個地區城市城鎮居民生活消費水平的差異,并且通過R軟件對我國農村居民的人均消費情況進行科學的分析。關鍵詞主成分分析聚類分析居民人均消費水平一、引言近年來,我國國民經濟得到了迅速發展,人民生活水平進一步提高,物質文明建設達到了前所未有的水平。但由于我國各地區經濟發展水平不均衡,加之各地人口、資源、政策等各方面存在的差異,使各地區居民人均消費水平參差不齊,不同的地區具有不同的特點。在這一背景下,研究我國各地區城鎮居民人均消費性支出情況,明確各類地區城鎮居民人均消費性支出的差異與特點,有利于決策部門從宏觀上把握我國各地區的消費情況,協調各地區的發展,切實落實“出口、投資和消費共同發展”的經濟政策,推動我國經濟再上一個新臺階。其次,消費結構可以反映居民的生活質量和經濟發展水平。一般來說,經濟越發達的地區,其消費結構就越趨向于追求安逸享受的消費結構。在這樣的消費結構中,奢侈品支出如住房、服務性支出所占的比例就會較大。反之,在經濟較不發達的地區中,生活必需品消費支出所占的比例就會較大。隨著社會主義市場經濟體制的逐步完善,我國的社會生產力不斷日益加快發展,經濟總量和綜合實力迅速上升,城鎮居民的生活水平顯著提高。相對過去而言,居民食品方面的消費支出比重在逐漸下降,而在交通通訊、文化娛樂等方面的消費支出比重越來越大。消費結構的變化,反映居民需求的變化。研究我國城鎮居民消費性支出情況及其影響因素,對建立合理的消費結構,擴大內需,搞活社會主義市場經濟,制定產業政策,促進國民經濟的發展都有著極其重要的意義。二、主成分分析的原理及步驟2.1主成分分析的原理在實際問題的研究中,往往會涉及眾多變量。但變量太多不但會增加計算復雜性,也給合理地分析問題帶來困難,一般情況下,變量間有一定的相關性,提供的信息在一定程度上有所重疊。主成分分析是一種把多個變量化為少數幾個主成分的統計分析方法。是在保證數據信息丟失最少的情況下,對高維空間進行降維已達到簡化分析的目的。這
些主成分通常表示為原始變量的某種線形組合。在本身作為目標的主成分分析中,首先應該保證所提取的前幾個主成分的累積貢獻率達到一個較高的水平(即變量降維后的信息量必須保持在一個較高水平上),其次對這些被提取的主成分都必須能夠給出符合實際背景和有意義的解釋(否則主成分將有空余信息量則無實際含義)。2.1主成分分析的步驟對原始數據標準化。計算相關系數矩陣。計算特征值與特征向量。得各主成分得分三、引入變量建立主成分分析模型3.1數據來源本文數據為各地區域城鎮居民家庭平均每人全年消費性支出(1999年),來自《2000年中國統計年鑒》,具體表格見附錄。表1列出了1999年全國31個省、直轄市和自治區(港、澳、臺不在其中)的城鎮居民家庭平均每人全年消費性支出的八個主要變量數據。這八個變量是氣:食品支出%:交通和通訊X2氣:食品支出X2:衣著支出氣:娛樂教育文化服務x3:家庭設備用品及服務x4x4:醫療保健x8:雜項商品和服務表1各地區域城鎮居民家庭平均每人全年消費性支出(1999年)地區x1x2x3x4x5x6x7x8北京2959.19730.79749.41513.34467.871141.82478.42457.64天津2459.77495.47697.33302.87284.19735.97570.84305.08河北1495.63515.90362.37285.32272.95540.58364.91188.63山西1406.33477.77290.15208.57201.50414.72281.84212.10內蒙古1303.97524.29254.83192.17249.81463.09287.87192.96
遼寧1730.84553.90246.91279.81239.18445.20330.24163.86吉林1561.86492.42200.49218.36220.69459.62360.48147.76黑龍江1410.11510.71211.88277.11224.65376.82317.61152.85上海3712.31550.74893.37346.93527.001034.98720.33462.03江蘇2207.58449.37572.40211.92302.09585.23429.77252.54浙江2629.16557.32689.73435.69514.66795.87575.76323.36安徽1844.78430.29271.28126.33250.56513.18314.00151.39福建2709.46428.11334.12160.77405.14461.67535.13232.29江西1563.78303.65233.81107.90209.70393.99509.39160.12山東1675.75613.32550.71219.79272.59599.43371.62211.84河南1427.65431.79288.55208.14217.00337.76421.31165.32湖北1783.43511.88282.84201.01237.60617.74523.52182.52湖南1942.23512.27401.39206.06321.29697.22492.60226.45廣東3055.17353.23564.56356.27811.88873.061082.82420.81廣西2033.87300.82338.65157.78329.06621.74587.02218.27海南2057.86186.44202.72171.79329.65477.17312.93279.19重慶2303.29589.99516.21236.55403.92730.05438.41225.80四川1974.28507.76344.79203.21240.24575.10430.36223.46貴州1673.82437.75461.61153.32254.66445.59346.11191.48云南2194.25537.01369.07249.54290.84561.91407.70330.95西藏2646.61839.70204.44209.11379.30371.04269.59389.33陜西1472.95390.89447.95259.51230.61490.90469.10191.34甘肅1525.57472.98328.90219.86206.65449.69249.66228.19青海1654.69437.77258.78303.00244.93479.53288.56236.51寧夏1375.46480.89273.84317.32251.08424.75228.73195.93新疆1608.82536.05432.46235.82250.28541.30344.85214.40資料來源:2000年《中國統計年鑒》3.2主成分分析(1)計算樣本相關系數陣由于多個變量使用的量綱可能各不相同或者變量間的數值大小相差很大,因此,首先要將初始變量標準化。把全國31個省市作為樣本,將食品支出(x1),衣著支出(x2),家庭設備及服務支出(x3),醫療保健支出(x4),交通通訊(x5),教育文化娛樂支出(x6),居住支出(x7),其他商品及服務支出(x8)八項支出作為變量。這樣就得到了原始數據,計算出相關系數陣(單位化正交化的特征向量,即各主成分對應的系數)為:
Import.己nc匚□fcomponents:Comp.1Comp.2Comp.3Comp.AComp.5Standarddeviation2.257-30871.16286920.7551053S0.63740958D.5303471Pinportion□fVaTian.ce0.63721250.16903310.D71-340470.0507-5642D.0351S5SCumulativeProportion0.637^1250.30624560.373056030.323372ElD.3640310Comp.6Corap.門Comp-.3Standarddeviation0.34555100.3044301"0.255505505Pxaportion0.0090396^3Pro^oxtion0.57331560?330300331.QOOOQQOOOLoadings:Coiop.1Comp.2Camp,3Camp.Camp,5Camp.Carup.Camp.己xl-Q.4Q10.^150.209-Q.2210.75Qvl2-Q.132Q.7^90.3320.1520.529xS-Q.375-Q.^20.5^70.553-0.151-0.105-0.3200.3^5-0.^75-0.6530.303k5-0.355-0.2320.279-0.3660.21^0.103-O.673-0.273k6-0.406-0.3100.233-0.506-0.163kt-0.326-0.4960.5500.545點-0.3360.345-0.107-0.5290.435-0.476Comp.1Comp.2Comp.3Comp.4Comp.5匚:日陽.后Ctunp.7Ctrnp.355loadings1.0001.0001.0001.0001.0001.0001.0001.000Proportion.VarO.12S0.12S0.1250.1250.125Q.12SQ.12SQ.12SCuimilativeVarQ.12S0.2S00.37S0.SOO0.6250.7500.3751.000從輸出結果可以看出:前三個主成分的累計方差貢獻率已達到87.81%以上,所以決定用三個新變量代替原來的八個變量,前三個主成分為:Y1=-0.401x1-0.132x2-0.375x3-0.320x4-0.388x5-0.406x6-0.326x7-0.396x8Y2=0.749x2+0.345x4-0.232x5-0.496x7Y3=0.415x1+0.332x2-0.442x3-0.478x4+0.279x5-0.310x6-+0.345x8從程序結果可以看出,前兩個和前三個主成分的累計貢獻率分別達到80.62%和87.81%,第一主成分j在所有變量(除在七上的載荷稍偏小外)上都有近似相等的負載荷,反映了綜合消費性存款余額的水平,因此第一主成分可稱為綜合消費性支出成分。(單位正交化特征向量可能差一個負號)第二主成分j2在變量七上有很高的正載荷,在變量”上有中等的正載荷,而在其余變量上有負載荷或很小的正載荷。可以認為這個主成4分度量了受地區氣候影響的消費性支出(主要是衣著支出x2,其次是居住x7),在所有消費性支出中占的比重(也可理解為一種消費傾向),第二主成分可稱為消費傾向成分。第三主成分很難給出明顯的解釋,因此我們只取前面兩個主成分。
prinlsecnaLU^VComp.3Comp.5Comp.7Comp.1圖1碎石圖prinlsecnaLU^VComp.3Comp.5Comp.7碎石圖可以幫助我們確定主成分合適個數的有用的視覺工具,在碎石圖上選取一個轉折點(m,Am),此轉折點之后的特征值全部較小且彼此差不多,m就作為主成分的個數。從下圖可以明顯得出:第三個轉折點之后的特征值全部較小而且彼此差不多,因此我們選取前三個主成分代替原來的八個變量,這與由累計方差貢獻率得到的結果一致。-6-4-20244202-4-6北京x24202-4-6北京x2西藏x7廣西海南江西4020OO29492DmQU-0.4-0.20.0Comp.10.20.4圖2雙圖廣東雙圖(biplot)生成了以第一主成分為橫軸,第二主成分為縱軸,各省、市、自治區的成分圖,雙圖上面距離越近的省市各項指標差異越小。從圖2中可以看出,上海、廣東和北京在最右邊,城鎮居民綜合消費性支出是最高的;其次是浙江和天津;江西在散點圖的最左邊,表明綜合消費性支出是最低的;北京和西藏在散點圖的最上邊,說明受地區氣候影響的消費性支出占的比重最高;廣東在最底部,表明受地區氣候影響的消費性支出占的比重最低。TOC\o"1-5"\h\z如果我們只是要根據x,x,…,x來比較各地區城鎮居民消費性支出的總水平,則消費128性總支出xo=28x,無疑是最合適的,它的含義確切且富有很好的實際意義。但如果我們i=1要比較的不是總水平而是整體水平,則使用單個變量xo就有其不足之處,它的信息量不夠足,未能較充分地提取x,x,…,x中的有用信息。本案例所進行的主成分分析卻能彌128補此種不足,(從R出發的)前兩個主成分j和j合在一起能夠包含有x,x,…,x的較多12128信息,除了J能在某種意義上反映消費性支出總水平外,j2還能進一步反映對各地區消費性支出差異起較重要作用的某種消費傾向。
北京天津河北山西內參古-3.5834891-1.5397045北京天津河北山西內參古-3.5834891-1.53970450.62732261.43522451.45756111黑死江上海浙江安徵1.523474"—W.60406551.2505750f山東河屯湖北湖南「東一。.芝035?T.計31網-0重慶四川貴州云南-Q.7323^33-Q.1^^5562青海寧夏新馳江寧.1233340福建.3036735y<-ez_ce^(cor(stdL.x)JyL<-ySvaLj.e3:二]y2<-ySvaLj.e3y3<-ySvaLj.e3:3[3corea<-(vL^pre].二]-y2*pz:e:,空]-yj^pre;f5;)/(yL-y2-yi)scopes0.5250E072.23533550.6114291西F■西亦rs^吉林1.3D821S1江西1."559516海南0.51^2=13M甫1.Z36Q^35這是把31個地區分別按第一主成分得分從小到大重新排序后的結果。可以看出,東部地區的第一主成分得分普遍較高,中部地區一般,而西部地區則普遍較低。利用全國31個省市城鎮居民家庭消費支出的八個指標作為研究對象,用R軟件進行主成分分析,將八個指標降維到三個主成分,更有效、準確的對地區綜合消費水平進行評價。四、聚類分析的原理及步驟4.1聚類分析原理聚類分析就是將未知數據按相似程度分到不同的類或簇的過程。其實質就是尋找一種能客觀反映元素之間親疏關系的統計量,然后根據這種統計量把元素分成若干類。常用的聚類統計量有距離系數和相似系數兩類。聚類分析的基本思想是在樣品之間定義距離,在變量之間定義相似系數,距離或相似系數代表樣品之間的相似程度。按相似程度的大小將樣品逐一歸類,直到所有樣品都聚類完畢,形成一個表示親疏關系的譜系圖,依次按照某些要求對樣品進行分類。4.2基本步驟選擇描述事物對象的變量(指標)。建立樣品數據資料矩陣。確定數據是否要標準化。
確定表示對象距離或相似程度的統計量。選擇適當的聚類方法,進行聚類。五、引入變量建立聚類分析模型5.1引入變量由于多個變量使用的量綱可能各不相同或者變量間的數值大小相差很大,因此,首先要將初始變量標準化。把全國31個省市作為樣本,將食品支出(x1),衣著支出(x2),家庭設備及服務支出(x3),醫療保健支出(x4),交通通訊(x5),教育文化娛樂支出(x6),居住支出(x7),其他商品及服務支出(x8)八項支出作為變量5.2建立模型5.2.1離差平方文檔1和法在聚類之前先對各變量作了標準化變換,這就使得各變量在聚類中所起的作用相同。使用離差平方和法的聚類樹形圖的R輸出分別如下:1ClusterDendrogram50EE哪1ClusterDendrogram50EE哪E|!?hclust(*,"ward.D")離差平方和法的分三類結果為:第I類:北京、浙江、上海和廣東。
第II類:天津、江蘇、云南、重慶、河北、新疆、山東、湖北、四川、湖南、廣西、海南和西藏。第III類:山西、甘肅、內蒙古、遼寧、黑龍江、吉林、青海、寧夏、安徽、福建、貴州、河南、陜西和江西。這樣的聚類有較好的經濟意義。第I類都是我國經濟最發達、城鎮居民消費水平最高的沿海地區;第II類基本是在我國屬于經濟發展水平和城鎮居民消費水平中等的地區。第III類是在我國基本上屬于經濟較落后地區,城鎮居民的消費水平也是較低的。5.2.2K均值法K-msansclusteringwitaK-msansclusteringwita3clusters□fsizes19,己Clatterir.eanBiTOC\o"1-5"\h\z妃妃z3對-0.6032593-0.3<4<963-C.£233666-O.3143123-0.5123673-0.43696101.3B343640.4&93612l.E2^5J151.95357412.192057323.4B35226O.5m34D94C.S319274-O.22D13670.16703200.12^6503k?xE-。.3”宥弓叫-Q.550S3121.533303331.S636-5650510^4170.326350fClatteringvector:鹽京天津河北山?西內蒙古吉林黑龍江上海江蘇浙江23111113安徵福建江商山苯河南朔北湖南廣苯重慶1331132113四川5/+I云甬西藏陜西3雨青海寧夏新騷113311111WithinclustersunofBq'JiareBbycluster:[1]35.3321526,牝(bstween_55/tcrtal_55=tl.l%)Avsildtlecomponents:[1:"cl'iSLe?"^centeis""tQtSS""wi-'ninss"[礦"~0~.wit'ninss"^betweensB"n3izennitETn[3:"ifault">sort(kni?c_.;5ter)河北山西內蒙古遼寧吉林黑龍江安徽江西河南湖北廣西11111111111海南四川貴州陜西m肅青海寧夏新疆北京上海浙江11111111廣東天津江蘇福建止東湖南重慶云南曲臧33333333K均值聚類法的分三類結果為:第I類:北京、浙江、上海和廣東。(標號為2)第II類:天
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 保密培訓教材
- 預防痢疾的班會課件
- 愛心 傳遞溫暖的主題班會課件
- 防汛抗旱知識教育
- 項目安全生產培訓課件
- 乳腺超聲分級標準解析
- 醫院保潔安全培訓
- 2025年爆破設備挖掘機械合作協議書
- 城鎮污水管網建設工程招商引資報告
- xx河流排水防澇設施建設項目投資計劃書
- 一例人工耳蝸植入術護理查房
- 2025年一級建造師《市政實務》四色筆記
- 風電施工安全培訓課件
- 磚砌圍墻工程施工方案
- 人力資源管理試題及答案
- 四川省成都市2024-2025學年高一(上)期末調研化學試卷【含答案】
- 2025-2030中國L4自動駕駛行業市場現狀供需分析及投資評估規劃分析研究報告
- 2025年駕駛三力測試題及答案
- 2025年法律常識題庫及答案【典優】
- 暴雨天氣的應急措施
- 光伏電站安全培訓課件
評論
0/150
提交評論