

下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、最新精品資料整理推薦.更新于二O二 O 年十二月十八口 2020年12月18日星期五19:36:31 址新資料推薦 一、主成分分析基本原理 概念:主成分分析是把原來多個變量劃為少數兒個綜合指標的一種統計分 析方法。從數學角度來看,這是一種降維處理技術。 思路:一個研究對象,往往是多要素的復雜系統。變量太多無疑會增加分 析問題的難度和復雜性,利用原變量之間的相關關系,用較少的新變量代替原 來較多的變量,并使這些少數變量盡可能多的保留原來較多的變量所反應的信 息,這樣問題就簡單化了。 原理:假定有 n個樣本,每個樣本共有 p 個變量,構成一個 nXp 階的數據 矩陣, 記原變量指標為X1, X,x
2、”設它們降維處理后的綜合指標,即新變量 為 Zi,z:, z3,,Za(mWp),貝|J 勺=厶 1 州+厶 2%2 hpXp z2=l2lx+l22x2+-+l2pxp =厶內+4勺+仏理 系數 U的確定原則: Zi與 Z5 (iHj; i, j二 1, 2,,m)相互無關; N 是X1,比,対的一切線性組合中方差最大者,n 是與 Z不相關的, X2,,Xp 的所有線性組合中方差最大者; Zn是與 Zl, Z2, . , ZH-1 都不相 關的 X” x2,心,的所有線性組合中方差最大者。 新變量指標 S,N,Z=分別稱為原變量指標亞,氐,Xp 的第 1,第 2, ,第 m主成分。 從以上的
3、分析可以看出,主成分分析的實質就是確定原來變量 X, (j二 1, 2 ,,p)在諸主成分 Zi (i二 1, 2,,m)上的荷載 g ( i二 1, 2,, m: j=l, 2 ,,p) o 址新資料推薦 最新精品資料整理推薦.更新于二O二 O 年十二月十八口 2020年12月18日星期五19:36:31 從數學上可以證明,它們分別是相關矩陣 m個較大的特征值所對應的特征 向量。 二、主成分分析的計算步驟 1、 計算相關系數矩陣 入“2ri/ R= 也 % rp2 g J(,盧 1, 2,,p)為原變量 k 與占的相關系數,兀尸巧其計算公 式為 ” % = _ 挖Ei-耳)空(S-耳)2 A
4、-l A-1 2、 計算特征值與特征向量 解特征方程,常用雅可比法(Jacobi)求出特征值,并使其按大 小順序排列人兒、兒丫 ; 分別求出對應于特征值人的特征向量 M,2,L,p),要求甌|二 1,即家 =1 其中表示向量耳的第丿個分量。 3、 計算主成分貢獻率及累計貢獻率 (心 l,2,L,p) 貝獻率: 才九 A-I 累計貢獻率: V Q = l,2,L,p) 盅1 一般取累計貢獻率達 85%-95%的特征值,人,仏丄,人所對應的第 1、第 2、第 m C/np)個主成分。 4、 計算主成分載荷 lij = P( (Zi ,Xj) = J入 Sj (ij = 1,2, L,p) 5、 各
5、主成分得分最新資料推薦 最新精品資料整理推薦.更新于二O二 O 年十二月十八日2020年12月18日星期五19:36:31 11 召2 % z = 22 “2 乙嘰 三、主成分分析法在 SPSS中的操作 1、指標數據選取、收集與錄入(表 1) 1沿海10個省帀經濟數據 地區 GDP 人均GDP 農業 伽值 工業 增加值 第三產業 增加值 固定資 產投資 堪本建 設投資 社自消費品 宅書總額 海關出 口總瀕 地方財 政收入 遼寧 5458.2 13000 14883.3 13762 2258.4 1315.9 529.0 2258.4 123.7 399.7 山東 10550.0 11643 1
6、390.0 3502.5 3851.0 2288.7 1070.7 3181.9 211.1 610.2 河北 6076.6 9047 950.2 1406.7 2092.6 1161.6 597.1 1968.3 45.9 302.3 天津 2022.6 22068 83.9 822.8 960.0 703.7 361.9 941.4 115.7 171.8 江蘇 10636.0 14397 1122.6 3536.3 3967.2 2320.0 1141.3 3215.8 384.7 643.7 上海 5408.8 40627 86.2 2196.2 2755.8 1970.2 779.3
7、 2035.2 320.5 709.0 浙江 7670.0 16570 6S0.0 2356.5 3065.0 2296.6 1180.6 2877.5 294.2 566.9 4682.0 13510 663.0 1047.1 1859.0 964.5 397.9 1663.3 173.7 272.9 廣東 11770.0 15030 1023.9 4224.6 4793.6 3022.9 1275.5 5013.6 1843.7 1202.0 廣西 2437.2 5062 591.4 367.0 995.7 542.2 352.7 1025.5 15.1 186.7 2、Analyze D
8、ata Reduction Factor Analysis, 彈出 Factor Analysis 對話框: S 2 Factor Analyze 對話框與 Descriptives 子對話框 3 把指標數據選入 Variables 框,Descriptives: Correlation Matrix 框組 中選中 Coefficients,然后點擊 Continue,返回 Factor Analysis 對話框,單 擊 0K。 注意:SPSS在凋用Factor Analyze過程進行分析時,SPSS會自動對原始數據進行標Vafiables r GDRlf $ 人均GDP|X2| 農業增加值|
9、X3) 參工業増加BM) 砂篇三產業増加值 .萩E1證產投資旌 砂基本題設投資1X7 必1+仝法審品垂隹門 SeteslwnViaWe: a$te . Statsbc$ 環 Reset jUmvariate descriptive Caroel Cancel Hdp v Iniial solution Help . txtracbon.; Sigriftcancefevefc Reproduced gelermncfi Anli-imge KMO arxlBatetl: test of sphericily OK Couelatcn Mabix & odfaentej Irr/erxe
10、 Rojatcn. : $co:es. 最新資料推薦 最新精品資料整理推薦.更新于二O二 O 年十二月十八日2020年12月18日星期五19:36:31 準化處理 ,所以在得到計算結果后的變量都是指經過標準化處理后的變量,但SPSS并不直接給 出標準化后的數據,如需要得到標準化數據,則需調用Descriptives過程進行計算。 表3 相關系數矩殊 Ca lation Matrix GDP 人均 GDP 農業 增加值 工業 增加值 第三 產業 増加值 苗總額 海關 出口 總額 地方 財政 收入 GDP 1 000 -0 094 0 052 0.967 0.979 0.923 0.922 0.9
11、41 0.637 0.826 人均GDP 0 094 1.000 0 171 0.113 0.074 0214 0093 -0 043 0 081 0273 農業增加值 -0 052 -0.171 1.000 -0.132 0.050 0 098 0.176 0.013 0.125 086 工業増加值 0.967 0.113 -0.132 1.000 0985 0963 0939 0.935 0 705 0 898 第三產業增加值 0979 0.074 0 050 0.985 1.000 0.973 0.940 0.962 0.714 0.913 固定鋌產投還 0923 0.214 -0 09
12、8 0.963 0.973 1.000 0.971 0.937 0.717 0.934 基本if設投資 0 922 0 093 0 176 0.939 0 940 0971 1 000 0.897 0.624 848 社會消龍品零豊總額 0 941 0 043 0.013 0.935 0.962 0937 0 897 1.000 0.836 0 929 附關出口總頷 0637 0.0S1 0 125 0.705 0.714 0717 0 624 0.836 1.000 0 882 地方財畋收入 0 826 0.273 -0 086 0.898 0.913 0.934 0.848 0.929 0
13、.882 1.000 我4 方芒分解主成分提取分析農 從表 3可知 GDP 與工業增加值,第三產業增加值、固定資產投資、基本建 設投資、社會消費品零售總額、地方財政收入這兒個指標存在著極其顯著的關 系,與海關出口總額存在著顯著關系。可見許多變量之間直接的相關性比較強, 證明他們存在信息上的重疊。 主成分個數提取原則為主成分對應的特征值大于 1的詢 m個主成分。特征值 在某種程度上可以被看成是表示主成分影響力度大小的指標,如果特征值小于 1, 說明該主成分的解釋力度還不如直接引入一個原變量的平均解釋力度大,因此 一般可以用特征值大于1 作為納入標準。通過表 4(方差分解主成分提取分析)Ccupo
14、nent Initial EixnvahiM Extraction Slims of Skmared Lnadincs Total %ofVanance Qinulatn % Total % c Variance Qinwlatix % 1 7.220 72.205 72.205 7.220 72.205 72.205 2 1.235 12.346 84.551 1.235 12346 84 551 3 0.877 8 769 93 319 4 0.547 5 466 98.786 5 0.085 0.854 99 640 6 0.021 0.211 99.850 7 0.012 0.119
15、99.970 8 0.002 0.018 99.988 9 0.001 0012 100 000 10 0.000 0 000 100 000 Ccwpooeut 1 2 GDP 0 949 0.195 人均GOT 0.112 0.824 農業tfl加值 0.109 0.677 工業堆加值 0.978 -0.005 第三產業增如值 0 986 0.070 固此遂產投資 0.983 -0.068 星本建設投資 0.947 -0024 社會消費品寧吿總額 0977 0.176 海關出1總額 0 800 0 051 地方財政收入 0954 0.128 Total Variance Explained
16、 Extraction Kfethod- Pnnapal Component Analysis Conqoncnt Matrix* Exiractioa Nfeebd: Piincipal Caiwiienr Aoahsis. a 2 caipooents extracted 最新精品資料整理推薦.更新于二O二 O 年十二月十八口 2020年12月18日星期五19:36:31 址新資料推薦 可知,提取 2個主成分,即呼 2,從表 5(初始因子載荷矩陣)可知 GDP、工業增 加值、第三產業增加值、固定資產投資、基本建設投資、社會消費品零售總 額、海關出口總額、地方財政收入在第一主成分上有較高載荷
17、 ,說明笫一主成分基本反映了這些指標的信息;人均 GDP 和農業增加值指 標在第二主成分上有較高載荷,說明第二主成分基本反映了人均 GDP 和農業增 加值兩個指標的信息。所以提取兩個主成分是可以基本反映全部指標的信息, 所以決定用兩個新變量來代替原來的十個變量。但這兩個新變量的表達還不能 從輸出窗口中直接得到,因為Component Matrixn是指初始因子載荷矩陣, 每一個載荷量表示主成分與對應變量的相關系數。 用表 5(主成分載荷矩陣)中的數據除以主成分相對應的特征值開平方根便 得到兩個主成分中每個指標所對應的系數。 將初始因子載荷矩陣中的兩列數據 輸入 (可用復制粘貼的方法) 到數據編
18、輯窗口 (為變量 Bl、B2),然后利用 Transform-Compute Variable”,在 Compute Variable對話框中輸入 “Al 二 B1/SQR(7.22)” 注:第二主成分 SQR 后的括號中填 1. 235,即可得到特征 向量 A(見表 6)。同理,可得到特征向量比。將得到的特征向量與標準化后的數 據相乘,然后就可以得出主成分表達式注:因本例只是為了說明如何在 SPSS 進行主成分分析,故在此不對提取的主成分進行命名,有興趣的讀者可自行命 名。 F】=0.3532X1 -H).042ZX2 -0.041ZXS 403642兀 + 0.367ZX,刊.366級 +
19、0.352ZX:弋.364強 +0.298ZXp + O.355ZX10 F2 n).175ZX -0.741ZX, +0.609卒 -0.004ZX, + 0063ZX,0.061ZX6 0.022ZX7 -Hj.SZXg 0.046ZX. 0.115ZX。最新資料推薦 最新精品資料整理推薦.更新于二O二 O 年十二月十八日2020年12月18日星期五19:36:31 表 6 Compute Variable 對話框 ( I . 丿. *W- a?p TaroetVandbte: UpeSLbH . EZJ |) 二tr.dQ Zi SjLl? fuxtm: I_J 一i 亠二!勺亙&
20、; P茹而詼廣 .* iAKMiettvaJ-re.vje. .I J8! JjXJJ ;zS|N(aufreKpi) /: L | o I !AfiTAH:nurroxpri ZOFNCWM iJ QI Ookge_ ;CDF.BERN0ULU(q,p, !L. ! Q Pwle | Rc說 Caned , Hdp 標準化:通過 AnalyzeDescriptive StatisticsDescriptives 對話框 來實現:彈出Descriptives 對話框后,把 XiXio選入 Variables 框,在 Save standardized values as variables 前的方框打上鉤,點擊OK”,經標準化 的數據會自動填入數據窗口中,并以 Z開頭命名。 表 7 Descriptives 對話框 二3曲心頭壬/韻紳 ; - - :: - dJ J/afiabWw _ I i. GDP JX1) _人均GDP旳 d衣業増加OB仁3 t 工業增加 M i疵:算三產業増崩S: q SB定次嚴嚴. V Sdrvc* il/v r|Qfed Vsi*ue aa v cfiaL) )fes 以每個主成分所對應的特征值占所
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 高中思想政治議題式教學課堂評價設計
- 挫折與逆境心理健康課件
- 睡眠障礙的護理課件
- 2024年數控刃磨床資金籌措計劃書代可行性研究報告
- 睡眠心理健康活動課件
- 2025年企業可持續發展目標(SDGs)下的綠色創新案例集
- 10古詩三首石灰吟教學設計20242025學年語文六年級下冊統編版
- 2025年農業生物技術在農業生物抗逆性材料種業創新中的應用:基因編輯與耐旱性突破報告
- 上海海事大學工程熱力學課件第13章 濕空氣
- 山建大鍋爐原理教學大綱
- 辦學許可證續期申請書
- 道路運輸車輛的安全檢查和隱患排查
- 機械設備安裝程序、安裝分類、固定方式及安裝新技術應用
- 大樓維修改造工程投標方案(完整技術標)
- 取力器的設計畢業設計
- 二年級下學期語文無紙化測試題例
- 國際貿易實務案例分析題(附答案)2
- 初二地理會考答題卡模板
- 軌道交通信號基礎智慧樹知到答案章節測試2023年同濟大學
- 農村公路建設標準
- 2015-2022年深圳職業技術學院高職單招語文/數學/英語筆試參考題庫含答案解析
評論
0/150
提交評論