手把手教你怎么用SPSS分析數(shù)據(jù)_第1頁
手把手教你怎么用SPSS分析數(shù)據(jù)_第2頁
手把手教你怎么用SPSS分析數(shù)據(jù)_第3頁
手把手教你怎么用SPSS分析數(shù)據(jù)_第4頁
手把手教你怎么用SPSS分析數(shù)據(jù)_第5頁
已閱讀5頁,還剩8頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、使用SPSS軟件進(jìn)行數(shù)據(jù)分析文檔通過自己論證屬實(shí)。【例子】 以全國31個(gè)省市的8項(xiàng)經(jīng)濟(jì)指標(biāo)為例,進(jìn)行主成分分析 第一步:錄入或調(diào)入數(shù)據(jù)(圖1)。省份國內(nèi)生產(chǎn)居民消費(fèi)固定資產(chǎn)職工工資貨物周轉(zhuǎn)消費(fèi)價(jià)格商品等隹工業(yè)產(chǎn)值1北京1394.092505.00519.018144.00373.901V.30112.60043.432天津920.112720.00345.4B6501342.S0115.201110.605S2.5I32049.521259.00704.674939. OCT2033 30115.20115.801234.954山西1092.461250.00290.90i|721.00717

2、.30116.901115.60637.25n內(nèi)蒙632.361387.00260.234134.00761 70117.5011G.60419.3962793.372397.003S7.99的1,001371 7011G.10114 001640.557吉林1129.201072.00320.454430.00497 4D115.20114.20762 47E黑龍丁2014532334 00435.734146,00324.8D116.10114.3Q124D.379上海24G2.575343.009*39279.00207.40118.70113.C01642.9510江蘇5155.251

3、926.001434.955943.001025.50115.B0114.302026.6411浙江3524.752249.001006.396619.754 40116.601113.50916.9312安徽2003.561254.00474.004609.0090B.3Q114.B0112.70624.141321B0.522320.00663 976857 00609.30115.20114 40433.6714江西1205.1111S2 0026234<211.00411 70116.90115.90571 Sd15山東5002.341527W1229.555145.001196

4、 60117.60114 202207.E916F南3002.741034.00670.3543J4.DQ1574 4D116.50114.901367.9217湖北2391 421527.00671.684695.00849.00120 00116.601220 7219湖南2195 7C140B.00422.614797. D01011 9011S.Q0115.50843.8319J東5381.722699.001639.63S250.D085S.50114.00111.601396.3520廣西1606.151314.00392.595105.00556 11日.40116.40554.

5、9721海南3B4.171914.0019B.355340.00232.10113.50111.3064.3322Eli3534.001261 00822.5446 板 00902 30116.50117.001431.91231EFFI630.079妃00150 94“7500301 1。121.40117.20324 7224云南1206.661261.00334.0051 瞻.003W40121.3011S 10716.552555.981110 0017.077302.004.20117.301114.905572E1000.031208.00300.274396.00500.9011

6、9.DG117 J060D.9627553.351007.00114.615493.00aoz.oa119.B0116.50468 79165.311445.0047.7B5753.0061 60118.001116.30105.0029寧夏109.751355.0061.98507S.D0121.80117.10115.30114.4030新蓊334.571469.00375.955340.D0339.0D119.7011B.7042B.76圖1原始數(shù)據(jù)(未經(jīng)標(biāo)準(zhǔn)化)第二步:打開“因子分析”對(duì)話框。沿著主菜單的"Analyze一 Data Reduction一Factor -”的路

7、徑(圖2)打開因子分析 選項(xiàng)框(圖3)。國全國30個(gè)省市區(qū)箸濟(jì)發(fā)展的8攻指標(biāo)-SSPSS Data EditorFile Edit View Data TransformAnalyzeGraphs Ubilties Window HelpS舊僵|國| Jg叫|ReportsDescriptive Statistics Compare MeansGeneral Linear Model 31破|恁省份國西生另匚I職工工資|1北京1394.ELOrrelalCeRegressionClassify18144.002天津920J66501.003河北28J9.EData Reduction 1Fac

8、tor. I4山西1092.21ScaleU421 UU5F蒙832.ENonparametric Tests ,31134.00E.遼寧2793.3Multipie Response 94911 同圖3因子分析選項(xiàng)框圖2打開因子分析對(duì)話框的路徑Variables:Selection Variable:Extraction.Options,.Descriptives,.產(chǎn)費(fèi)產(chǎn)資轉(zhuǎn)格售值 生消史工周價(jià)零產(chǎn) 份內(nèi)民定工物費(fèi)品業(yè) 省國居固職貨消商T 出食»秒驢»驢令易R(shí)otation.第三步:選項(xiàng)設(shè)置。首先,在源變量框中選中需要進(jìn)行分析的變量,點(diǎn)擊右邊的箭頭符號(hào),將需要的變 量調(diào)

9、入變量(Variables)欄中(圖3)。在本例中,全部8個(gè)變量都要用上,故全部調(diào)入 (圖4)。因無特殊需要,故不必理會(huì)" Value”欄。下面逐項(xiàng)設(shè)置。Variables:產(chǎn)費(fèi)產(chǎn)資轉(zhuǎn)格售值 生消資工周價(jià)零產(chǎn) 內(nèi)民定工物費(fèi)品業(yè) 國居固職貨消商工 砂衫砂衫秒當(dāng)13Selection Variable:Descrip*ivesJExtraction. IRotationScores. 1Options. I圖4將變量移到變量欄以后Value.1.設(shè)置 Descriptives 選項(xiàng)。單擊Descriptives按鈕(圖4),彈出Descriptives對(duì)話框(圖5)。圖5描述選項(xiàng)框在St

10、atistics欄中選中Univariate descriptives復(fù)選項(xiàng),則輸出結(jié)果中將會(huì)給出原始數(shù) 據(jù)的抽樣均值、方差和樣本數(shù)目(這一欄結(jié)果可供檢驗(yàn)參考);選中Initial solution復(fù)選項(xiàng),則會(huì)給出主成分載荷的公因子方差(這一欄數(shù)據(jù)分析時(shí)有用)。在Correlation Matrix欄中,選中 Coefficients復(fù)選項(xiàng),則會(huì)給出原始變量的相關(guān)系 數(shù)矩陣(分析時(shí)可參考);選中Determinant復(fù)選項(xiàng),則會(huì)給出相關(guān)系數(shù)矩陣的行列式, 如果希望在Excel中對(duì)某些計(jì)算過程進(jìn)行了解,可選此項(xiàng),否則用途不大。其它復(fù)選項(xiàng) 一般不用,但在特殊情況下可以用到(本例不選) 。設(shè)置完成以

11、后,單擊 Continue按鈕完成設(shè)置(圖5)。2.設(shè)置 Extraction 選項(xiàng)。打開Extraction對(duì)話框(圖6)。因子提取方法主要有 7種,在Method欄中可以看 到,系統(tǒng)默認(rèn)的提取方法是 主成分(rPi/了c&o安g ),因此對(duì)此欄不作變動(dòng), 就是認(rèn)可了主成分分析方法。在Analyze欄中,選中Correlation matirx復(fù)選項(xiàng),則因子分析基于數(shù)據(jù)的相關(guān)系數(shù) 矩陣進(jìn)行分析;如果選中 Covariance matrix復(fù)選項(xiàng),則因子分析基于數(shù)據(jù)的協(xié)方差矩陣 進(jìn)行分析。對(duì)于主成分分析而言,由于數(shù)據(jù)標(biāo)準(zhǔn)化了,這兩個(gè)結(jié)果沒有分別,因此任選 其一即可。在Display欄中

12、,選中Unrotated factor solution (非旋轉(zhuǎn)因子解)復(fù)選項(xiàng),則在分析 結(jié)果中給出未經(jīng)旋轉(zhuǎn)的因子提取結(jié)果。對(duì)于主成分分析而言,這一項(xiàng)選擇與否都一樣; 對(duì)于旋轉(zhuǎn)因子分析,選擇此項(xiàng),可將旋轉(zhuǎn)前后的結(jié)果同時(shí)給出,以便對(duì)比。選中Scree Plot C山麓”圖),則在分析結(jié)果中給出特征根按大小分布的折線圖(形如山麓截面,故得名),以便我們直觀地判定因子的提取數(shù)量是否準(zhǔn)確。在Extract欄中,有兩種方法可以決定提取主成分(因子)的數(shù)目。一是根據(jù)特征根(Eigenvalues)的數(shù)值,系統(tǒng)默認(rèn)的是 知=1。我們知道,在主成分分析中,主成分得分的方差就是對(duì)應(yīng)的特征根數(shù)值。如果默認(rèn),-c

13、 = 1,則所有方差大于等于1的主成分將被保留,其余舍棄。如果覺得最后選取的主成分?jǐn)?shù)量不足,可以將舄c值降低,例如取境=0.9 ;如果認(rèn)為最后的提取的主成分?jǐn)?shù)量偏多,則可以提高、值,例如取K =1.1。主成分?jǐn)?shù)目是否合適,要在進(jìn)行一輪分析以后才能肯定。因此,特征根數(shù)值 的設(shè)定,要在反復(fù)試驗(yàn)以后才能決定。一般而言,在初次分析時(shí),最好降低特征根的臨界值(如取及=0.8 ),這樣提取的主成分將會(huì)偏多,根據(jù)初次分析的結(jié)果,在第二 輪分析過程中可以調(diào)整特征根的大小。第二種方法是直接指定主成分的數(shù)目即因子數(shù)目,這要選中Number of factors復(fù)選項(xiàng)。主成分的數(shù)目選多少合適?開始我們并不十分清楚。

14、因此,首次不房將數(shù)值設(shè)大一 些,但不能超過變量數(shù)目。本例有 8個(gè)變量,因此,最大的主成分提取數(shù)目為8,不得超過此數(shù)。在我們第一輪分析中,采用系統(tǒng)默認(rèn)的方法提取主成分。圖6提取對(duì)話框需要注意的是:主成分計(jì)算是利用迭代(Iterations)方法,系統(tǒng)默認(rèn)的迭代次數(shù)是 25次。但是,當(dāng)數(shù)據(jù)量較大時(shí),25次迭代是不夠的,需要改為 50次、100次乃至更多 對(duì)于本例而言,變量較少,25次迭代足夠,故無需改動(dòng)。設(shè)置完成以后,單擊 Continue按鈕完成設(shè)置(圖6)。3.設(shè)置Scores設(shè)置。選中Save as variables欄,則分析結(jié)果中給出標(biāo)準(zhǔn)化的主成分得分(在數(shù)據(jù)表的后 面)。至于方法復(fù)選項(xiàng)

15、,對(duì)主成分分析而言,三種方法沒有分別,采用系統(tǒng)默認(rèn)的“回 歸"(Regression)法即可。圖7因子得分對(duì)話框選中Display factor score coefficient matrix ,則在分析結(jié)果中給出因子得分系數(shù)矩陣 及其相關(guān)矩陣。設(shè)置完成以后,單擊 Continue按鈕完成設(shè)置(圖7 )。4.其它。對(duì)于主成分分析而言,旋轉(zhuǎn)項(xiàng)( Rotation)可以不必設(shè)置;對(duì)于數(shù)據(jù)沒有缺失的情 況下,Option項(xiàng)可以不必理會(huì)。全部設(shè)置完成以后,點(diǎn)擊OK確定,SPSS很快給出計(jì)算結(jié)果(圖8)。"73Factor AnalysisDescriptive Stad$tfi&

16、#163;£Meanstd. DeviationAnaly$i$ N國匹主尸1霽 LD931474.3060330居民消費(fèi)1745.933051.6419330固定資產(chǎn)511=5083432,0054830職工工暨545由31310.2180530貨物周轉(zhuǎn)北弗湖三30117.29672.0253130商品零售114.9D671.0980830工業(yè)產(chǎn)值862.9930534.5672&3DCorrelation Matrix*居民陶費(fèi)固戲產(chǎn)職工工覺隋物周特消費(fèi)僑格商品零罟產(chǎn)值Correlator)國 PD生產(chǎn)1.000.267.951.191.617-.273-.264J74居

17、炭消費(fèi)&71.Q0D426.71B-451-.235-<999.363固定遂產(chǎn).951.4261.D00,00.-131-.280-.35S.792職工I資.191.7101.000-.356-.539104魅物周轉(zhuǎn)C17-.151-431-.3561.000-253皿-699帶牌價(jià)咯-.235-.260-.135.2531.000崩3-.125商品零售-.264-.593-3S9.539.0221.000.192工皈唯.874.363,792.104.659-.125-.1921.000a. Determinant 1.133E-CH圖8主成分分析的結(jié)果第四步,結(jié)果解讀。在因子

18、分析結(jié)果(Output)中,首先給出的Descriptive Statistics,第一列 Mean對(duì)應(yīng)的變量的算術(shù)平均值,計(jì)算公式為Xj =賓 xjn i a第二列Std. Deviation對(duì)應(yīng)的是樣本標(biāo)準(zhǔn)差,計(jì)算公式為呵=土! (Xj -Xj)21/2n -1 id第三列Analysis N對(duì)應(yīng)是樣本數(shù)目。這一組數(shù)據(jù)在分析過程中可作參考。Descriptive StatisticsMeanStd. DeviationAnaly sis N國內(nèi)生產(chǎn)1921.0931474.8060330居民消費(fèi)1745.933861.6419330固定資產(chǎn)511.5083402.8854830職工工資54

19、57.6331310.2180530貨物周轉(zhuǎn)666.1400459.9669930消費(fèi)價(jià)格117.28672.0253130商品零售114.90671.8980830工業(yè)產(chǎn)值862.9980584.5872630接下來是CorrelationMatrix(相關(guān)系數(shù)矩陣),一般而言,相關(guān)系數(shù)高的變量,大Correlation Matrix多會(huì)進(jìn)入同一個(gè)主成分,但不盡然,除了相關(guān)系數(shù)外,決定變量在主成分中分布地位的 因素還有數(shù)據(jù)的結(jié)構(gòu)。相關(guān)系數(shù)矩陣對(duì)主成分分析具有參考價(jià)值,畢竟主成分分析是從 計(jì)算相關(guān)系數(shù)矩陣的特征根開始的。相關(guān)系數(shù)陣下面的Determinant=1.133E-0.4是相關(guān) 矩陣的

20、行列式值,根據(jù)關(guān)系式det(AI - R) = 0可知,det(入)=det( R),從而 Determinant=1.133E-0.4= 討* ?3* '* ?5*舄*石*萬。這一點(diǎn)在后面將會(huì)得到驗(yàn)證。國內(nèi)生產(chǎn)居民消費(fèi)固定資產(chǎn)職工工資貨物周轉(zhuǎn)消費(fèi)價(jià)格商品零售工業(yè)產(chǎn)值國內(nèi)生產(chǎn)1.000.267.951.191.617-.273-.264.874居民消費(fèi).2671.000.426.718-.151-.235-.593.363固定資產(chǎn).951.4261.000.400.431-.280-.359.792職工工資.191.718.4001.000-.356-.135-.539.104貨物周轉(zhuǎn)

21、.617-.151.431-.3561.000-.253.022.659消費(fèi)價(jià)格-.273-.235-.280-.135-.2531.000.763-.125商品零售-.264-.593-.359-.539.022.7631.000-.192工業(yè)產(chǎn)值.874.363.792.104.659-.125-.1921.000a. Determinant = 1.133E-04a在Communalities(公因子方差)中,給出了因子載荷陣的 初始公因子方差(Initial)和提取公因子方差(Extraction ),后面將會(huì)看到它們的含義。CommunalitiesInitialExtraction

22、國內(nèi)生產(chǎn)1.000.945居民消費(fèi)1.000.800固定資產(chǎn)1.000.902職工工資1.000.875貨物周轉(zhuǎn)1.000.857消費(fèi)價(jià)格1.000.957商品零售1.000.929工業(yè)產(chǎn)值1.000.903Extraction Method: Principal Component Analysis.在Total Variance Explained(全部解釋方差)表的 Initial Eigenvalues(初始特征根)中,給出了按順序排列的主成分得分的方差(Total),在數(shù)值上等于相關(guān)系數(shù)矩陣的各個(gè)特征根 入,因此可以直接根據(jù)特征根計(jì)算每一個(gè)主成分的方差百分比(% ofVariance

23、)。由于全部特征根的總和等于變量數(shù)目,即有m=習(xí)'=8,故第一個(gè)特征根的方差百分比為4/m=3.755/8=46.939 ,第二個(gè)特征根的百分比為 為/m=2.197/8= 27.459,其余依此類推。然后可以算出方差累計(jì)值(Cumulative %)。在ExtractionSums of Squared Loadings,給出了從左邊欄目中提取的三個(gè)主成分及有關(guān)參數(shù),提取的 原則是滿足41,這一點(diǎn)我們?cè)?圖6所示的對(duì)話框中進(jìn)行了限定。Total Variance ExplainedComponentInitial EigenvaluesExtraction Sums of Squar

24、ed LoadingsTotal% of VarianceCumulative%Total% of VarianceCumulative%13.75546.93946.9393.75546.93946.93922.19727.45974.3982.19727.45974.39831.21515.18689.5841.21515.18689.5844.4025.03194.6155.2132.66097.2756.1381.72498.99976.5E-02.81899.81781.5E-02.183100.000Extraction Method: Principal Component An

25、alysis.Scree PlotepavneguComponent Number圖8特征根數(shù)值衰減折線圖(山麓圖)主成分的數(shù)目可以根據(jù)相關(guān)系數(shù)矩陣的特征根來判定,如前所說,相關(guān)系數(shù)矩陣的特征根剛好等于主成分的方差,而方差是變量數(shù)據(jù)蘊(yùn)涵信息的重要判據(jù)之一。根據(jù)能決定主 成分?jǐn)?shù)目的準(zhǔn)則有三:i只取A1的特征根對(duì)應(yīng)的主成分從Total Variance Explained表中可見,第一、第二和第三個(gè)主成分對(duì)應(yīng)的膻都大于1,這意味著這三個(gè)主成分得分的方差都大于1。本例正是根據(jù)這條準(zhǔn)則提取主成分的。ii累計(jì)百分比達(dá)到80%85%以上的 膻對(duì)應(yīng)的主成分在Total Variance Explained表

26、可以看出,前三個(gè)主成分對(duì)應(yīng)的游累計(jì)百分比達(dá)到89.584%,這暗示只要選取三個(gè)主成分,信息量就夠了。iii根據(jù)特征根變化的突變點(diǎn)決定主成分的數(shù)量從特征根分布的折線圖(Scree Plot)上可以看到,第4個(gè)膻是一個(gè)明顯的折點(diǎn),這 暗示選取的主成分?jǐn)?shù)目應(yīng)有 p< 4 (圖8)。那么,究竟是3個(gè)還是4個(gè)呢?根據(jù)前面兩條 準(zhǔn)則,選3個(gè)大致合適(但小有問題)。在Component Matrix (成分矩陣)中,給出了主成分載荷矩陣,每一列載荷值都顯 示了各個(gè)變量與有關(guān)主成分的相關(guān)系數(shù)。以第一列為例,0.885實(shí)際上是國內(nèi)生產(chǎn)總值(GDP)與第一個(gè)主成分的相關(guān)系數(shù)。 將標(biāo)準(zhǔn)化的GDP數(shù)據(jù)與第一主成

27、分得分進(jìn)行回歸, 決定系數(shù)R2=0.783 (圖9),容易算出R=0.885,這正是GDP在第一個(gè)主成分上的載荷。Component MatrixComponent123國內(nèi)生產(chǎn).885.384.121居民消費(fèi).607-.598.271固定資產(chǎn).912.161.212職工工資.466-.722.368貨物周轉(zhuǎn).486.738-.275消費(fèi)價(jià)格-.509.252.797商品零售-.620.594.438工業(yè)產(chǎn)值.823.427.211Extraction Method: Principal C omponent A nalysis. a. 3 components extracted.下面將主成

28、分載荷矩陣拷貝到 Excel上面作進(jìn)一步的處理:計(jì)算公因子方差和方差 貢獻(xiàn)。首先求行平方和,例如,第一行的平方和為2.2.2 一 .2 一 一h12=0.88492+0.38362+0.12092=0.9449這是公因子方差。然后求列平方和,例如,第一列的平方和為 2222si =0.8849 +0.6067 +, +0.8227 =3.7551這便是方差貢獻(xiàn)(圖10)。在Excel中有一個(gè)計(jì)算平方和的命令 sumsq,可以方便地算出 一組數(shù)據(jù)的平方和。顯然,列平方和即方差貢獻(xiàn)。事實(shí)上,有如下關(guān)系成立: 相關(guān)系數(shù)矩陣的特征根=方差貢獻(xiàn)=主成分得分的方差至于行平方和,顯然與前面 公因子方差(Co

29、mmunalities )表中的Extraction列對(duì)應(yīng)的數(shù) 據(jù)一樣。如果我們將8個(gè)主成分全部提取,則主成分載荷的行平方和都等于1 (圖11),即有hi=1, s=冰。到此可以明白:在 Communalities中,Initial對(duì)應(yīng)的是初始公因子方差, 實(shí)際上是全部主成分的公因子方差; Extraction對(duì)應(yīng)的是提取的主成分的公因子方差 ,我 們提取了 3個(gè)主成分,故計(jì)算公因子方差時(shí)只考慮 3個(gè)主成分。第一主成分=-zzR-Sqare=0.783017 +0.00國生產(chǎn)總值國內(nèi)生產(chǎn)總值圖9國內(nèi)生產(chǎn)總值(GDP的與第一主成分的相關(guān)關(guān)系(標(biāo)準(zhǔn)化數(shù)據(jù))|_ ABCD| E5第一主成分第二主成分

30、第二主成分公因子方差6國內(nèi)生產(chǎn)0. 8049000. 3836190. 1208S60. 9448247居民消費(fèi)0. 606719-0. 5981770, 271313(X 7995348固定資產(chǎn)0. 9116870.1611060, 2119970. 9020719職工工資0. 4:66222-0. 7224100, 3679380. 87461710貨物周轉(zhuǎn)0. 4858310. 738275-0. 2752520. 85684511消費(fèi)價(jià)格-0. 5085630. 2519090, 7966330. 95671812商品零售-0. 61958?0. 5943750, 4375550.92

31、862713工業(yè)產(chǎn)值0. 8227290. 4267370, 2109700.90349614方差貢獻(xiàn)3.7551332.1967041.2148957.16673315特征根3. 7551332.1967041. 2148957,166733圖10主成分方差與方差貢獻(xiàn)Component Matrix aComponent12345678國內(nèi)生產(chǎn).885.384.121-.203-6.87E-021.143E-022.420E-029.192E-02居民消費(fèi).607-.598.271.409-7.61E-02.1575.525E-021.317E-02固定資產(chǎn).912.161.212-.270

32、-7.71E-028.271E-028.113E-02-7.36E-02職工工資.466-.722.368-.164.304-1.64E-02-7.62E-023.949E-03貨物周轉(zhuǎn).486.738-.275.212.3052.254E-026.855E-02-6.02E-03消費(fèi)價(jià)格-.509.252.797.0722.716E-02-.161.1072.435E-03商品零售-.620.594.438-.0273.531E-02.247-9.23E-021.634E-03工業(yè)產(chǎn)值.823.427.211.209-9.38E-02-.137-.157-2.30E-02Extraction

33、 Method: Principal Component Analysis.a. 8 components extracted.ABCDEFGHIJ112345678公因子方差2國內(nèi)生產(chǎn)0. 88490.38360. 1209 -0. 2032-0. 06870.01140. 024:20. 091913居民消費(fèi)0. 6067-0.5980. 27130.408S-0, 07610.15680. 0552013214固定資產(chǎn)0.9117'L1G110. 212 -0. 2705-0. 07710.0S2T0. 0811-0. 0741 .5職工工資0. 4&62-0.7220.

34、 3679 -0.163530421-0.01S-0. 0760.003916貨物周轉(zhuǎn)0. 48580.7383-0, 2750.211S40.305020,02250. 0685-0. 00617消費(fèi)價(jià)格-0. 5090. 25190, 796600也花02716-0.1610, 10710. 00241 1S商品零售-0* 620.59440. 4376 -0. 02670.035310.246S-0. 0920.001619工業(yè)產(chǎn)值0. 82270. 426?0. 2110.20888-Q. 0938-0,137-0. 157-0. 023110方差更獻(xiàn)3. 75512.19671.21

35、49 0. 402440,21280.1380. 06540.01468 111特征根& 75512.19671. 21490.40244_0. 2128_0.13S0. 06540.01461 133E-04圖11全部主成分的公因子方差和方差貢獻(xiàn)提取主成分的原則上要求公因子方差的各個(gè)數(shù)值盡可能接近,亦即要求它們的方差極小,當(dāng)公因子方差完全相等時(shí),它們的方差為0,這就達(dá)到完美狀態(tài)。實(shí)際應(yīng)用中,只要公因子方差數(shù)值彼此接近(不相差太遠(yuǎn))就行了。從上面給出的結(jié)果可以看出:提 取3個(gè)主成分的時(shí)候,居民消費(fèi)的公因子方差偏小,這暗示提取3個(gè)主成分,居民消費(fèi)方面的信息可能有較多的損失。至于方差貢獻(xiàn),

36、反映對(duì)應(yīng)主成分的重要程度,這一點(diǎn)從方 差的統(tǒng)計(jì)學(xué)意義可以得到理解。在圖11中,將最后一行的特征根全部乘到一起,得 0.0001133 ,這正是相關(guān)系數(shù)矩 陣的行列式數(shù)值(在Excel中,求一組數(shù)據(jù)的乘積之和的命令是product )。最后說明 Componentscore Coefficient Matrix (成分得分系數(shù)矩陣)和 Component Score Covariance Matrix(成分得分協(xié)方差矩陣),前者是主成分得分系數(shù),后者是主成分得分的協(xié)方差即相關(guān)系數(shù)。從Component Score Covariance Matrix可以看出,標(biāo)準(zhǔn)化主成分得分之間的協(xié)方差即相關(guān)系數(shù)

37、為0 (j豐k)或1 (j=k),這意味著主成分之間彼此正交即垂直。初學(xué)者常將Component Score Coefficient Matrix表中的數(shù)據(jù)當(dāng)成主成分得分或因子得分,這是誤會(huì)。成分得分系數(shù)矩陣的數(shù)值是主成分載荷除以相應(yīng)的特征根得到的結(jié) 果。在Component Matrix表中,將第一列數(shù)據(jù)分別除以為=3.755,第二列數(shù)值分別除以為=2.197, 立即得到 ComponentScore Coefficient ;反過來,如果將 Component Score Coefficient Matrix表中的各列數(shù)據(jù)分別乘以方=3.755 , *=2.197,則可將其還原為主成分載荷

38、即Component Matrix中的數(shù)據(jù)。Component Score Coefficient MatrixComponent123國內(nèi)生產(chǎn).236.175.100居民消費(fèi).162-.272.223固定資產(chǎn).243.073.174職工工資.124-.329.303貨物周轉(zhuǎn).129.336-.227消費(fèi)價(jià)格-.135.115.656商品零售-.165.271.360工業(yè)產(chǎn)值.219.194.174Extraction Method: Principal C omponent A nalysis. Component Scores.Component Score Covariance Matr

39、ixComponent12311.000.000.0002.0001.000.0003.000.0001.000Extraction Method: Principal Component A naly sis.Component Scores.實(shí)際上,主成分得分在原始數(shù)據(jù)所在的 SPS對(duì)前數(shù)據(jù)欄中給出,不過給出的都是標(biāo) 準(zhǔn)化的主成分得分(圖12a);將各個(gè)主成分乘以相應(yīng)的/ 波叫寺征根的二次方根可以將其 還原為未經(jīng)標(biāo)準(zhǔn)化的主成分得分。得分1 |得分2得分3.42743-1.52320.49020.33935-1 78001-1.06264700551.58632-1.19211-5102B.

40、26259-51833-03667.48824- 34594.85022.66619-.56565-19958-28604-1 09746.27330.22055-642881 64990-2.211322.615631 84235,05093.34924.97196- 32761.20459.22957.08007*1.68897.21602-.62016-.59561-71726.20176-.479531 54S011.39467.49539.527421,44744-.85361-.14599.977271.03843-.21177.7167323108j-.67419.08630-.

41、59311.25733.33602)-.29055-1.54444-2.18402.293711.33351.77269-1.44632.396411.10800-1.04217.48771171494-1.040231.36153.01475-.91716.47657.41703-1.09189.11265.62990)-1 21110-.72568.23914-1.11530-.67162-44176- 88905-.02915.92508a.標(biāo)準(zhǔn)化的主成分得分b.得分一得分二得分三.64250-2.29500.54B70.66940-2.68230-1 193101 381302.39050-1 33560-1 OOEOO.39

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論