統計分析軟件應用SPSS-主成分分析實驗報告_第1頁
統計分析軟件應用SPSS-主成分分析實驗報告_第2頁
統計分析軟件應用SPSS-主成分分析實驗報告_第3頁
統計分析軟件應用SPSS-主成分分析實驗報告_第4頁
統計分析軟件應用SPSS-主成分分析實驗報告_第5頁
已閱讀5頁,還剩3頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、本科學生綜合性、設計性實驗報告實驗課程名稱 統計分析軟件應用 開課學期 2010 至 2011 學年 下 學期 上課時間 2011 年 4 月 25 日 遼寧師范大學教務處編印一、實驗方案實驗名稱:主成分分析實驗時間:2011.04.25小組合作:是 否小組成員:1、 實驗目的:掌握主成分分析的思想和具體步驟。掌握SPSS實現主成分分析的具體操作,并對處理結果做出解釋。2、 實驗設備與材料:Windows XP;SPSS for Windows13.0等。3、 實驗方法步驟及注意事項操作步驟:(1)打開SPSS軟件,新建一數據文件,定義變量:Company(公司名稱)、X1(賠付率)、X2(凈

2、收入與總收入之比)、X3(投資收益率)、X4(再保險率)、X5(總資產報酬率)、X6(兩年保費收入收益率)、X7(保費收入變化率)、X8(流動性比率),這些變量中除了Company為字符串型(String)變量外,其余變量均為數值型(Numeric)變量。 (2)選擇菜單Analyze=Data Reduction=Factor進入Factor Analysis主對話框。選定左邊列表中的變量X1、X2、X3、X4、X5、X6、X7、X8,單擊按鈕使之進入Variables列表框。(3)單擊主對話框中的Descriptive按鈕,打開Factor Analysis:Descriptives子對話

3、框,在Statistics欄中選擇Univariate descriptives項要求輸出各變量的均值與標準差,在Correlation Matrix欄內選擇Coefficients項要求計算相關系數矩陣,單擊Continue按鈕返回Factor Analysis主對話框。(4)單擊主對話框中的Extraction按鈕,打開Factor Analysis:Extraction子對話框。在Method列表中選擇默認因子抽取方法Principal Components,在Analyze欄中選擇默認的Correlation Matrix項要求從相關系數矩陣出發求解主成分,在Extract欄中選擇默認

4、項Eigenvalues over:1,Maximum iteration convagence:選擇25,在Display中選擇Scree plot單擊Continue按鈕返回Factor Analysis主對話框。(5)Rotation和 Scores,均選擇默認選項,單擊主對話框OK按鈕,輸出結果。注意事項:可以看出,主成分分析依賴于原始變量,也只能反映原始變量的信息。所以原始變量的選擇很重要。另外,如果原始變量都本質上獨立,那么降維就可能失敗。這是因為很難把很多獨立變量用少數綜合的變量概括。數據越相關,降維效果就越好。在得到分析的結果時,并不一定會都得到比較清楚的結果。這與問題的性質,

5、選取的原始變量以及數據的質量等都有關系。(1)由協方差陣出發與由相關陣出發求解主成分所得結果不一致時,要恰當的選取某一種方法;(2)對于度量單位或是取值范圍在同量級的數據,可直接求協方差陣;對于度量單位不同的指標或是取值范圍彼此差異非常大的指標,應考慮將數據標準化,再由協方差陣求主成分; (3)主成分分析不要求數據來源于正態分布; (4)在選取初始變量進入分析時應該特別注意原始變量是否存在多重共線性的 問題(最小特征根接近于零,說明存在多重共線性問題); (5)因子分析中各個公共因子之間不相關,特殊因子之間不相關,公共因子和特殊因子之間不相關。4、 實驗數據處理方法:選取了人保、平安、太平洋、

6、大眾、華泰、永安、華安7個保險公司的數據,指標都是正指標,無需歸一化,SPSS13.0將自動對原始數據進行標準差標準化處理,消除指標量綱及數量級的影響。5、 參考文獻:1 盧紋岱.SPSS for Windows統計分析M.電子工程出版社,20062 郭顯光. 如何用SPSS軟件進行主成分分析J. 統計與信息論壇,1998, (2)3 何曉群. 現代統計分析方法與應用M. 中國人民大學出版社,19984 余建英、何旭宏. 數據統計分析與SPSS應用M. 人民郵電出版社,20036、指導老師對實驗設計方案的意見: 指導老師簽名: 年 月 日 二、實驗報告1、實驗目的、設備與材料、理論依據、實驗方

7、法步驟見實驗設計方案2、實驗現象、數據及結果表1描述性統計量表 表2 主成分因子荷載矩陣表表3 相關系數矩陣表表4 公因子方差表 圖1 碎石圖 表5 總方差分解表3、對實驗現象、數據及觀察結果的分析與討論:表1是描述統計量表,主要列出了統計量的均值、方差和數據個數。表2是主成分因子荷載矩陣表,系數表示該因子對變量的影響程度。這里每一列代表一個主成分作為原來變量線性組合的系數(比例)。比如第一主成分作為賠付率、凈收入與總收入之比、投資收益率、再保險率、總資產報酬率、兩年保費收入收益率、保費收入變化率、流動性比率,這八個原先變量的線性組合,系數(比例)為0.819、0.926、0.733、-0.0

8、42、0.864、0.562、-0.886、-0.017。如用x1、x2、x3、x4、x5、x6、x7、x8分別表示原先的十個變量,而用y1、y2、y3表示新的變量,那么原先8個變量與第一、第二和第三主成分y1、y2、y3的關系為:X1= 0.819y1- 0.159y2- 0.517y3X2= 0.926y1+0.271y2+0.250y3X3= 0.733y1- 0.278y2+0.582y3X4=-0.042y1+0.913y2+0.365y3X5= 0.864y1+0.249y2+0.331y3X6= 0.562y1+0.302y2- 0.502y3X7=-0.886y1+0.330y

9、2+0.260y3X8=-0.017y1+0.819y2- 0.456y3相關系數(絕對值)越大,主成分對該變量的代表性也越大。表3是相關系數矩陣表。 表4是公因子方差表。表5是總方差分解表,這里的Initial Eigenvalues就是這里的八個主軸長度,又稱特征值(數據相關陣的特征值)。頭三個成分特征值累積占了總方差的90.818%。后面的特征值的貢獻越來越少。依據原則:特征值1,提取了3個公因子(主成分),每個原始變量都可以是8個因子的線性組合,提取3個因子,可以概括原始變量所包含信息的90.818%。這3個公因子(主成分)包含了原指標的絕大部分信息,可以代替原來8個變量對保險公司的投

10、資收益進行衡量。圖1是碎石圖,特征值的貢獻還可以從碎石圖看出。表6 因子與主成分a1a2a3b1b2b3X10.819-0.159-0.5170.4140-0.1150-0.4310X20.9260.2710.2500.46810.19600.2084X30.733-0.2180.5820.3705-0.15770.4852X4-0.0420.9130.365-0.02120.66030.3043X50.8640.2490.3310.43670.18010.2759X60.5620.302-0.5020.28410.2184-0.4185X7-0.8860.3300.260-0.44780.2

11、3870.2167X8-0.0170.819-0.456-0.00860.5923-0.3801特征值3.9141.9121.439貢獻率48.929%23.898%17.991%累計貢獻率48.929%72.827%90.818%主成分表達式:b1= 0.819*X1+0.926*X2+0.733*X3-0.042*X4+0.864*X5+0.562*X6-0.866*X7-0.017*X8b2=-0.159*X1+0.271*X2-0.218*X3+0.913*X4-0.249*X5-0.302*X6+0.330*X7+0.819*X8b3=-0.517*X1+0.250*X2+0.582

12、*X3+0.365*X4-0.331*X5-0.502*X6+0.260*X7-0.456*X8表7Y1Y2Y323.597045.8211-51.804613.012663.8449-52.662446.498062.1039-79.1359-35.165072.3593-42.7826179.1660173.5938-281.8318-45.481694.4003-15.3631-60.558271.9628-17.6074Y1= 0.4140*x1+0.4681*x2+0.3705*x3-0.0212*x4+0.4367*x5+0.2841*x6-0.4478*x7-0.0086*x8Y

13、2=-0.1150*x1+0.1960*x2- 0.1577*x3-0.6603*x4+0.1801*x5+0.2184*x6-0.2387*x7-0.5923*x8Y3=-0.4310*x1+0.2084*x2+0.4852*x3+0.3043*x4+0.2759*x5-0.4185*x6+0.2167*x7-0.3801*x8加權:輸出結果,并從高到低進行排序:表81:人保2:平安3:太平洋4:大眾5:華泰6:永安7:華安Z主成分綜合得分NumZ主成分綜合得分Num13.17591:人保78.4452華泰12.15012:平安23.3553太平洋23.3553 3:太平洋13.1759人保

14、-7.61054:大眾12.1501平安78.44525:華泰-2.4579永安-2.45796:永安-7.6105大眾-15.60067:華安-15.6006華安可以如上所述計算主成分得分,還可以通過綜合評價函數計算綜合得分:綜合評價函數:Z=48.929%*Y1+23.898%*Y2+17.991%*Y34、結論:表8中,綜合得分出現負值,這只表明該保險公司的綜合水平處于平均水平之下。由主成分分析的實證結果,不僅大部分保險公司的排名存在差異,且綜合得分值上存在較大差異,其定量值差異較大,這對于后來的綜合定量定性分析,最終所提出的政策建議等都會產生較大影響。由表8可以看出:華安保險的綜合水平

15、最低,華泰保險的綜合水平最高。由于前三個主成份的貢獻率高達90.818%,用綜合得分值對各地區進行排序,能從總體上反映各公司之間的差別。5、實驗總結:1)、本次實驗成敗之處及其原因分析:主成分分析是一種通過降維技術把原來眾多具有一定相關性的變量化為少數幾個主成分的統計方法。通常,只要變量之間存在一定的相關性,前幾個主成分往往就具有較高的累計貢獻率,從而這少數的幾個主成分就反映原始變量的絕大部分信息,從而達到較好的降維目的。通過SPSS可以容易進行主成分分析,得到數據間的主成分,從而可以很好的分析數據。2)、本實驗的關鍵環節及改進措施:做好本實驗需要把握的關鍵環節:通過總方差分析表得到貢獻率大的主成分的特征值,通過主因子荷載表,應用compute計算主成分表達式的,然后加權計算綜合得分,最后進行排序。進行綜合得分時,除SPSS軟件外,其他軟件都分別設有兩種方法的過程命令,使用者可以根據需要采用其中一種來分析問題,一般不會混淆。而正是因為SPSS沒有直接進行主成分分析的命令,才使得那些本身尚未清楚區分這兩種方法的使用者更加迷惑,不慎便會出現混淆性錯誤。若重做本實驗,為實現預

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論