主成分的計算步驟_第1頁
主成分的計算步驟_第2頁
主成分的計算步驟_第3頁
主成分的計算步驟_第4頁
主成分的計算步驟_第5頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、主成分的計算步驟數據的標準化處理設有n只待樣本單位,每只單位有p個指標,則有矩陣其中x表示第i單位的第-指標值。矩陣X表示如下:ijX(x)ijnpx-11121px21-22-2p(Xxn1-n2-npX,XX)12p對上述數據進行標準化處理,標準化處理的計算公式如下:xxz乙ijxj其中-是X的算數平均數,jj準化之后的數據矩陣。(ij,ij1,2,p)Xj是Xj的標準差。并記Z(z)為標jnp計算標準化數據的協方差矩陣變量Z(z,z,z)中變兩兩的相關系數的計算公式是12p1nrzzijn1ikkjk1由于Z中的變量已是標準化的變量(i,j1,2,p)此時Z的列變量的協方差矩陣就是相關系

2、數矩陣。r11R21rp1r12r22rp2r1pr2prPP計算R的特征根和特征向量相關矩陣R的特征方程為:利用特征方程可以求出矩陣RI0,TOC o 1-5 h zR的特征根.(j,2,.,p)。將特征根從小到大進行排列,j12p再由特征多項式Ruu,u(u,u,u)求出相應的特征向量iiiii1i2ip(,.,),以特征向量的分量值為權數,將標準化的指標進行加ii1i2ip權就得到第i個主成分。Yzzzii11i22ipp(i1,2,p)計算主成分的方差貢獻率及累計方差貢獻率相關矩陣R的特征根就等于對應的主成分的方差,其大小反映了第i個主成分所包含原始數據全部信息的比重,也反映了各主成分

3、貢獻的大小。定義第i個主成分的方差貢獻率為/,累計方差貢獻率k/piIik/,方差貢獻率越大表明第主成分綜合變量!iHl,X(X,X,X)信息的能力越強,也就是由YuX的差異來解釋變量l2piiX(X,X,X)的差異的能力越強,累計貢獻率越大表明前k個主成分l2p包含原始信息越多。選取主成分的個數主成分分析的目的之一是為了減少變量的個數,即把最初的p個變量轉化為少數的幾個綜合變量,而且這幾個少數的綜合變量還要盡可能的保留原屬數據的信息,從而減少分析的工作量。所以在選取主成分的個數時,一般不會選取全部的p個主成分,而是取mp個主成分,m取多少比較合適,這是一個很實際的問題,一方面m盡量取的大些,

4、以使選取的主成分能夠盡量多的包含原來變量的信息,另一方面m又不能太大,m越大表明主成分的個數越多,不能做到簡化分析的目的。m的取值可以兼顧變量的個數和累計貢獻率兩個方面,一般是以所取的m使得累計貢獻率達到85%以上為宜。對主成分進行經濟分析確定了m個主成分之后,要對主成分進行經濟分析。經濟分析是確定主成分的經濟含義。在主成分丫zz.z的表達式中,取ii11i22ipp值大的系數表明這個主成分包含對應變量的信息就越多,主成分的經濟含義就是在主成分表達式中系數大的變量含義的綜合,因此可以根據這個原則來確定主成分的經濟解釋。計算主成分得分將標準化的數據(z,z,z)帶入到主成分的表達式中,得到第i個12p主成分的得分,根據主成分得分的大小就可以分析各個樣本單位在各個主成分方面的表現。進行綜合排序每一個主成分表示了分析對象在某一方面的表現。選取的m個主成分代表了分析對象的絕大部分信息,對主成分進行綜合分析就是相當于對分析對象的全部進行綜合分析。以m個主成分各自的方差貢獻率(特征根)為權數,將m個主成分進行加權平均,加權平均的公式為:F(YYY)/()1122mm12m或F(YYY)/()1122mm12m求得主成分的綜合得分F

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論