




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、計劃學(xué)時: 4學(xué)時 教學(xué)課型: 理論課 教學(xué)目的與要求:理解主成分的概念,掌握主成分分析 的基本方法 教學(xué)重點:主成分分析的方法 教學(xué)難點:主成分分析的方法 教學(xué)方法、手段與媒介:根據(jù)教材用多媒體課件課堂講授 教學(xué)過程與內(nèi)容:,主成分概念首先由 Karl Parson在1901年引進(jìn),當(dāng)時只對非隨機變量來討論的。1933年Hotelling將這個概念推廣到隨機變量。,第七章 主成分分析,(Principal component analysis),7.1 引 言,在多數(shù)實際問題中,不同指標(biāo)之間是有一定相關(guān)性。由于指標(biāo)較多及指標(biāo)間有一定的相關(guān)性,勢必增加分析問題的復(fù)雜性。,主成分分析就是設(shè)法將原
2、來指標(biāo)重新組合成 一組新的互相無關(guān)的幾個綜合指標(biāo)來代替原來指 標(biāo)。同時根據(jù)實際需要從中可取幾個較少的綜合 指標(biāo)盡可能多地反映原來的指標(biāo)的信息。,主成分分析是考察多個數(shù)值變量間相關(guān)性的一種多元統(tǒng)計方法,它是研究如何通過少數(shù)幾個主成分來解釋多變量的方差協(xié)方差結(jié)構(gòu)。 導(dǎo)出幾個主成分,使它們盡可能多地保留原始變量的信息,且彼此間不相關(guān)。,一、主成分分析的基本思想,將原來眾多具有一定相關(guān)性的指標(biāo)重新組合成一組新的相互無關(guān)的綜合指標(biāo)來代替原來指標(biāo)。 以兩個指標(biāo)為例,信息總量以總方差表示:,Principal component in 2d,二、幾何解釋,y1,y2,旋轉(zhuǎn)變換的目的是為了使得n個樣本點在y1
3、軸方向上的離散程度最大,即y1的方差最大,變量y1代表了原始數(shù)據(jù)的絕大部分信息,在研究某經(jīng)濟問題時,即使不考慮變量y2也損失不多的信息。,y1與y2除起了濃縮作用外,還具有不相 關(guān)性。,y1稱為第一主成分,y2稱為第二主成分。,推廣開來,對于p維總體 ,尋求正交變 換 ,使得,在所有正交變換中,所選正交矩陣U,使 最大; 與 不相關(guān);并且在所有與 不相關(guān)的變量中 最大; 與 、 不相關(guān),同時在所有與 、 不相關(guān)的變量中 最大;依次類推。,為總體 的主成分, 為第一主成分, 為第 二主成分,三、主成分分析的數(shù)學(xué)原理,對原有變量作坐標(biāo)變換,,要求滿足:,如果z1=u1x滿足,則稱z1為第一主成分.
4、,如果z2=u2x滿足,則稱z2為第二主成分.,7.2 總體的主成分,設(shè) 為一p維隨機向量,其二階矩存在, 記 為 的特征值, 為相應(yīng)的單位特征向量,且相互正交。,則yi為第i個主成分。,一、主成分的導(dǎo)出,二、主成分的性質(zhì),1、主成分的均值與協(xié)方差,記,2、主成分的總方差,3、原始變量 與主成分 的相關(guān)系數(shù),4、m個主成分對原始變量的貢獻(xiàn)率,其特征值為,相應(yīng)的特征向量為,Proc iml; X=1 -2 0, -2 5 0, 0 0 2; Val=eigval(x); Vec=eigvec(x); D=1:2; B=(val)d,1; c=(vec),d; F1=(sqrt(inv(diag(
5、X)*vec*sqrt(diag(val),d; F2=(f1#f1),1; F=diag(c*diag(b)*t(c)*inv(diag(x)*j(3,1); Print val vec b c f1 f2 f;,VAL VEC B C 5.8284271 -0.382683 0 0.9238795 5.8284271 -0.382683 0 2 0.9238795 0 0.3826834 2 0.9238795 0 0.1715729 0 1 0 0 1 F1 F2 F -0.92388 0 0.8535534 0.8535534 0.9974842 0 0.9949747 0.99497
6、47 0 1 0 1,Data w(type=cov); Input x1 x2 x3; Cards; 1 -2 0 -2 5 0 0 0 2 ; Proc princomp cov; Run;,The PRINCOMP Procedure Observations 10000 Variables 3 Total Variance 8 Eigenvalues of the Covariance Matrix Eigenvalue Difference Proportion Cumulative 1 5.82842712 3.82842712 0.7286 0.7286 2 2.00000000
7、 1.82842712 0.2500 0.9786 3 0.17157288 0.0214 1.0000 Eigenvectors Prin1 Prin2 Prin3 x1 -.382683 0.00000 0.923880 x2 0.923880 0.00000 0.382683 x3 0.000000 1.00000 0.000000,主成分分析在經(jīng)濟指標(biāo)綜合評價中的應(yīng)用,核心:通過主成分分析,選擇m個主成分y1,y2,ym,以每個主成分yi的方差貢獻(xiàn)率i作為權(quán)數(shù),構(gòu)造綜合評價函數(shù),,其中 為第i個主成分的得分(求出主成分的表達(dá)式后,將標(biāo)準(zhǔn)化后的數(shù)據(jù)再代入yi中),當(dāng)把m個主成分得分代入F
8、函數(shù)后,即可得到每個樣本的綜合評價函數(shù)得分,以得分的大小排序,可排列出每個樣本的經(jīng)濟效益的名次。,5、原始變量對主成分的影響,分析:y1主要由x3控制,y2主要由x1控制,,y3主要由x2 控制,Y1的貢獻(xiàn)率為:109.793/117=0.938,x1 ,x2 ,x3之間的線性關(guān)系,Data w(type=cov); Input x1 x2 x3; Cards; 16 2 30 2 1 4 30 4 100 ; Proc princomp cov; Run;,三、從相關(guān)矩陣出發(fā)求主成分,性質(zhì):,例7.2.3 在例7.2.2中,x的相關(guān)矩陣,相應(yīng)的主成分為:,7.3 樣本的主成分,設(shè)數(shù)據(jù)矩陣為,
9、樣本協(xié)方差矩陣為,樣本相關(guān)矩陣為,例7.3.1 在制定服裝標(biāo)準(zhǔn)的過程中,對128名成年男子的身材進(jìn)行了測量,每人測得的指標(biāo)中含有:身高(x1)、坐高(x2)、胸圍(x3)、手臂長(x4)、肋圍(x5)和腰圍(x6)。所的樣本相關(guān)矩陣如下:,表7.3.1 男子身材六項指標(biāo)的樣本相關(guān)矩陣,SAS程序,data examp731(type=corr); input x1-x6; cards; 1.00 . . . . . 0.79 1.00 . . . . 0.36 0.31 1.00 . . . 0.76 0.55 0.35 1.00 . . 0.25 0.17 0.64 0.16 1.00 .
10、0.51 0.35 0.58 0.38 0.63 1.00 ; proc princomp ; Run;,The SAS System 08:44 Wednesday, November 24, 2006 1 The PRINCOMP Procedure Observations 10000 Variables 6 Eigenvalues of the Correlation Matrix Eigenvalue Difference Proportion Cumulative 1 3.28720078 1.88096073 0.5479 0.5479 2 1.40624004 0.947144
11、96 0.2344 0.7822 3 0.45909508 0.03275335 0.0765 0.8588 4 0.42634173 0.13154160 0.0711 0.9298 5 0.29480013 0.16847790 0.0491 0.9789 6 0.12632223 0.0211 1.0000 Eigenvectors Prin1 Prin2 Prin3 Prin4 Prin5 Prin6 x1 0.468906 -.364756 0.092208 -.122427 0.079696 -.785645 x2 0.403726 -.396606 0.613011 0.3264
12、44 -.027035 0.443430 x3 0.393570 0.396800 -.278870 0.655713 -.405232 -.125342 x4 0.407640 -.364842 -.704801 -.107829 0.234585 0.370564 x5 0.337472 0.569214 0.164251 -.019297 0.730502 0.033531 x6 0.426822 0.308369 0.119265 -.660671 -.489941 0.178828,例7.3.3 測得八項男子徑賽運動紀(jì)錄,樣本相關(guān)矩陣如下:,data examp733(type=co
13、rr); input x1-x8; cards; 1.000 . . . . . . . 0.923 1.000 . . . . . . 0.841 0.851 1.000 . . . . . 0.756 0.807 0.870 1.000 . . . . 0.700 0.775 0.835 0.918 1.000 . . . 0.619 0.695 0.779 0.864 0.928 1.000 . . 0.633 0.697 0.787 0.869 0.935 0.975 1.000 . 0.520 0.596 0.705 0.806 0.866 0.932 0.943 1.000 ; proc princomp ; Run;,五、若干補充及應(yīng)用中需注意的問題,1.關(guān)于時間序列數(shù)據(jù) 2.主成分用于聚類分析 3.關(guān)于不同時期的主成分分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 吉林省四平市鐵西區(qū)2024-2025學(xué)年七年級下學(xué)期期末練習(xí)生物試卷(含答案)
- 財務(wù)會計專員崗位職責(zé)要求
- 幼兒園常見傳染病預(yù)防控制課件
- 財務(wù)會計年終工作總結(jié)范文(10篇)
- 土地復(fù)墾措施及其規(guī)劃設(shè)計教學(xué)課件
- 道德與法治(海南卷)(考試版A3)
- 2025年android音視頻開發(fā)面試!這么香的技術(shù)還不快點學(xué)起來Android篇-andoid視頻秒開面試
- 2025年Android事件分發(fā)機制:面試官你坐啊
- 2024-2025學(xué)年下學(xué)期高一生物滬科版期末必刷??碱}之生物進(jìn)化論在不斷發(fā)展
- 部編版五年級上冊第一單元《白鷺》教案
- 2025年涼山昭覺縣委社會工作部選聘社區(qū)工作者題庫帶答案分析
- 2024北京高考一分一段表
- 公寓中介渠道管理制度
- 出租房合同責(zé)任免除協(xié)議書
- 中國科技課件
- 2025年希臘語A2等級考試官方試卷
- 地理-2025年中考終極押題猜想(全國卷)
- 2024年廣東省新會市事業(yè)單位公開招聘輔警考試題帶答案分析
- 廣安2025年上半年廣安市岳池縣“小平故里英才”引進(jìn)急需緊缺專業(yè)人才筆試歷年參考題庫附帶答案詳解
- 派特靈用于女性下生殖道人乳頭瘤病毒感染及相關(guān)疾病專家共識(2025年版)解讀
- 數(shù)字化轉(zhuǎn)型背景下制造業(yè)產(chǎn)業(yè)鏈協(xié)同創(chuàng)新機制研究
評論
0/150
提交評論