




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、主成分分析在系統評價中的應用principal component analysis基本數學思想設原始數據表中的變量為 。主成分分析過程實質上是對原坐標系進行平移和旋轉變換,使得新坐標的原點與數據群點的重心重合,新坐標系的第一軸與數據變異的最大方向對應,新坐標系的第二軸與第一軸標準正交,并且對應于數據變異的第二大方向依此類推。這些新軸分別被稱為第一主軸 ,第二主軸 。若經舍棄少量變量信息后,主軸變量集合能夠十分有效地表示原數據的變異情況,則原來的p維空間就被降至m維。生成的空間被稱為m維主超平面。主成分分析的本意是簡化!系統評價學-劉新建2主成分分析的算法準則對于一個高維變量空間系統,要討論對
2、它進行簡化的方法,首先要回答的問題是:簡化的標準是什么?設原變量空間是新變量空間是主成分分析就是尋找合適的矩陣A,使得,m p那么,什么是合適的呢?系統評價學-劉新建31.數據變異最大方向之原則由主成分分析的數學思想得知:主成分集合是解釋原數據集合差異性最好的變量集合。若以一個變量y1代表原變量集合,則應使得:若以 代表原變量集合,則應使得:系統評價學-劉新建42.最小二乘原則設有一個原樣本點ei,其在新空間中的映像是當原像與映像的距離最小時,我們認為兩個點最相似,對于一個樣本,共有n個樣本店,則最小二乘原則即是要求:式中pi是第i個點的權重。(可以認為是同點的個數比例)從幾何的觀點看最小二乘
3、原則:由于原樣本點與其在主超平面上投影的距離平方總和達到最小,因此,可以說,m維主超平面是最接近原樣本群點的m維超平面。系統評價學-劉新建54.對原變量系統的最佳綜合表現力原則還可以證明,對于原數據表p個變量,如果想以一個綜合變量來代表原來所有的原始變量,則第一主成分就是最好的選擇,用統計語言描述就是,第一主成分與所有的原始變量相關性最強,即如果以m個主成分代表原變量空間,則 系統評價學-劉新建7主成分分析的算法步驟假定原變量的數據都經過了標準化處理.1.求協方差陣R2.求矩陣V的前m個特征值以及對應的特征向量,這些特征向量是標準正交的。m個特征值滿足: 設對應的m個主特征向量是:系統評價學-
4、劉新建8主成分定義系統評價學-劉新建10系統評價學-劉新建11系統評價學-劉新建127.6主成分分析在系統評價中應用問題本節將分析主成分分析的評價準則信息量概念,進一步討論主成分變量空間與原變量空間的關系、權重與多重相關的關系等問題,并重新考慮了綜合指標的合成模式。為了下面討論方便,這里首先給出主成分分析基本模型:對于一組標準化變量 ,R是它們的相關系數矩陣, (從大到小排列) 是R的特征根, 是對應的列特征向量,令 (1)稱 是 的第 k 主成分,且 (2)首先,信息量的概念來源于不確定性,不確定性的大小是用概率來衡量的,而方差的大小與概率分布沒有直接關系。其次,信息的含義有多種,比如有語義
5、信息和不確定性信息。再次,在主成分分析方程的推導中使用了約束條件(2),其中 是協方差陣或相關系數陣的特征向量。這個約束條件實際上具有任意性,比如可以令 ,實質上,對于一個總體,個體間在某些變量上存在差異確實表現出了某種信息,但是,沒有差異同樣也是信息,只不過是另一種信息。從評價的功效角度看,增大方差有助于顯著區分各樣本點,所以是有意義的。但方差大小絕不等同于信息量大小。7.6.1方差大小不等于信息量大小7.6.2主成分變量空間是對原變量空間的重構如果在 之間不存在完全相關,那么 是個互異特征根,而 是一組正交向量,從而由(1),x 與 y 之間是可逆的。若在 之間存在完全相關的變量組,那么一
6、些變量可以用其它變量完全表示,把這些變量剔除以后,可以在剩余變量組和新的主成分之間建立可逆變換。所以,我們認為,變量組 y 可以完全代替變量組 x ,y 的空間是 x 的空間的重構。7.6.3加權與多重相關性問題通過上面的分析我們知道,雖然主成分分析中似乎沒有因變量,但真要達到建立該方法時的初衷降低維度,還是需要一個隱藏的因變量G,這時才能談信息量的大小即自變量 對 G 的變異性的解釋能力大小。綜合評價問題正好能滿足這一要求。一個比較好的評價方案通常要求指標體系應具有獨立性和全面性 。如果原指標之間不存在完全相關性,那么,變換后的主成分要全面反映原指標體系就必須與原空間是同維的。對于綜合評價,進行主成分分析的最根本收獲就是獲得了一組相互獨立的評價指標。對于新獲得的評價指標集,合成處理的模式依賴于評價的目的和指標本身的含義,即:要具體考慮 與 G 的相關狀態。為了消除多重相關性對權重的干擾,可以將每個 的方差都規范成1或其它相同常數,然后再實行加權,其中的權在 G 非直接可測的情況下,只能是主觀權。這時,方差最大化不再是一個準則,而僅僅成為我們求取一組相互獨立評價指標的手段,其實可直接應用 R 的特征方程。系統評價學-劉新建19通過以上分析,我們所獲得的基本結論是:1.方差大小不反映信息量的大小,要應用信息量概念,宜考慮一個因變量。2.主成分分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 安全生產夏季四防工作要點
- 學前班教師個人工作總結模版
- 倒睫的臨床護理
- 2025年高中老師工作總結模版
- 北師大版六年級上冊數學知識點總結模版
- 企業管理培訓教程
- 2025年農產品買賣合同的注意事項
- 體育和家庭教育家長會心得體會模版
- 《腦室系統解析》課件
- 2025年個體雇傭專職司機合同范本
- 臨床醫學同等學力申碩《內科學》考試題庫大全(含真題、典型題等)
- 機車檢測與監測技術 課件 項目4 機車車載安全防護系統(6A系統)
- 比較思想政治教育智慧樹知到期末考試答案章節答案2024年西南大學
- 供應商改善計劃表
- DLT 5285-2018 輸變電工程架空導線(800mm以下)及地線液壓壓接工藝規程
- 10以上20以內加減法
- 五年級家長會數學老師講話課件
- 急產分娩應急演練方案
- 2024中國充電基礎設施服務質量發展報告-車百智庫+小桔充電
- 消防維修期間無水應急預案
- (完整word版)體檢報告單模版
評論
0/150
提交評論