主成份分析與因子分析實例_第1頁
主成份分析與因子分析實例_第2頁
主成份分析與因子分析實例_第3頁
主成份分析與因子分析實例_第4頁
主成份分析與因子分析實例_第5頁
已閱讀5頁,還剩58頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、關于主成份分析和因子分析實例第一張,PPT共六十三頁,創作于2022年6月各個主成分分析是原始指標的線性組合第二張,PPT共六十三頁,創作于2022年6月滿足如下的條件:主成分之間相互獨立,即無重疊的信息。即主成分的方差依次遞減,重要性依次遞減,即每個主成分的系數平方和為1。即第三張,PPT共六十三頁,創作于2022年6月 設X的協方差陣為, 1, 2, p為的特征根,不妨假設1 2 p ,可以證明:第一主成份的方差為1,線性組合的系數為1所對應的特征單位向量。進一步可以證明為各個特征根所對應的標準正交向量所組成的矩陣第四張,PPT共六十三頁,創作于2022年6月因子分析的基本思想因子分析也是

2、一種數據簡化的方法。它通過研究眾多變量之間的內部依賴關系,探求觀測數據中的基本結構,并用少數幾個不可觀測變量來多個變量的相關關系。這幾個不可觀測變量能夠反映原來眾多變量的主要信息,這些不可觀測的潛在變量稱為因子。第五張,PPT共六十三頁,創作于2022年6月基本的因子分析模型:第六張,PPT共六十三頁,創作于2022年6月 稱 為公共因子,是不可觀測的變量,系數稱為因子載荷。 是特殊因子,是不能被前m個公共因子包含的部分。并且滿足:即不相關;即 互不相關,方差為1。即 互不相關,方差不一定相等第七張,PPT共六十三頁,創作于2022年6月AnalyzeDataReductionFctor進入因

3、子分析和主成份分析對話框13例1:利用2007年全國31省市自治區經濟發展情況的八項指標做主成份分析。第八張,PPT共六十三頁,創作于2022年6月 Descriptive框:選擇描述性統計量。第九張,PPT共六十三頁,創作于2022年6月Statistics: Univariate descriptives 輸出原始變量的均值、標準差等單變量的描述統計量。 Initial solution 給出因子提取前,分析變量的公因子方差。對于主成份分析來說,這些值是分析變量的相關(協方差)矩陣對角線的元素。Correlation Matrix 相關矩陣欄 Coefficients 給出原始分析變量間的

4、相關系數矩陣。 Significance levels給出每個相關系數相對于0的單尾假設檢驗的顯著性水平。 Determinant 給出相關系數矩陣的行列式值。第十張,PPT共六十三頁,創作于2022年6月Inverse 給出相關系數矩陣的逆矩陣。Reproduced 再生相關矩陣。此項給出因子分析后的相關矩陣,還給出殘差,即原始相關陣與再生相關陣的差。Anti-image 給出反映像相關矩陣KMO and Bartlett test of sphericity 要求進行KMO檢驗和球形Bartlett檢驗。KMO是用來比較變量間相關系數的大小。如果KMO接近1,表示適合做因子分析,如果KMO

5、接近0,表示不適合做因子分析。球形Bartlett檢驗是檢驗相關矩陣是否是單位矩陣,表明數據是否合適做因子模型。第十一張,PPT共六十三頁,創作于2022年6月Extraction按鈕:用于設置因子提取方法、迭代收斂條件、公因子數等。第十二張,PPT共六十三頁,創作于2022年6月Method:選擇因子提取方法,共有七種因子提取方法,默認為主成份法。七種方法分別是:Principal Components:主成份法;Unweighted least squares :未加權最小二乘法Generalized least square:綜合最小平方法Maximum likelihood:最大似然估

6、計法Principal axis factoring:主軸因子法Alpha factoring: 因子法Image factoring:映像因子法。第十三張,PPT共六十三頁,創作于2022年6月Analyze Correlaton Matrix 使用相關矩陣進行因子分析。如果原始變量的量綱不同選擇此項。Covariance Matrix 使用協方差矩陣進行因子分析。Extract 因子提取選項。Eigenvalues over 指定提取的因子的特征根應具有的范圍。Number of factors 指定提取公因子的數目。第十四張,PPT共六十三頁,創作于2022年6月Display 指定與因

7、子提取相關的輸出項。 Unrotated solution 要求顯示未經旋轉的因子提取結果。 Scree plot 顯示碎石圖。Maximum iterations for Convergence 指定因子分析收斂的最大迭代次數,默認值為25.第十五張,PPT共六十三頁,創作于2022年6月Rotation 按鈕第十六張,PPT共六十三頁,創作于2022年6月Method 選擇旋轉的方法。 None 不進行旋轉。 Varimax 方差最大旋轉。是一種正交旋轉。它使得每個因子具有最高載荷的變量數最小。 Direct Oblimin 直接斜交旋轉。如果指定此項需要輸入Delta值,越接近于0,斜交

8、程度越深。 Quartmax 四次最大正交旋轉。四次方最大法通過使因子載荷矩陣中每一行的因子載荷平方的方差達到最大。四次方最大旋轉是從簡化載荷矩陣的行出發,通過旋轉初始因子,使每個變量只在一個因子上又較高的載荷,而在其它的因子上盡可能低的載荷。如果每個變量只在一個因子上有非零的載荷,這時的因子解釋是最簡單的。第十七張,PPT共六十三頁,創作于2022年6月Equamax 平均正交旋轉。是方差最大旋轉和四次最大旋轉的結合。可以使在一個因子上有較高載荷的變量數和變量中需要解釋的因子數最少。Promax 斜交旋轉方法。允許因子之間彼此相關,它比直接斜交旋轉更快,因此適用于大數據集的因子分析。Disp

9、layRotated solution 給出旋轉后的因子載荷矩陣和因子轉換矩陣。對于斜交旋轉除顯示以上兩項外,還顯示因子之間的相關矩陣。第十八張,PPT共六十三頁,創作于2022年6月Loding plots 因子載荷散點圖。給出以因子為坐標軸的各變量的載荷散點圖。如果有兩個因子,給出原始變量旋轉以后的散點圖。如果多于三個因子,則給出基于前三個因子的三維載荷散點圖。如果只提取一個因子則不會給出散點圖。Scores 因子得分對話框。Save as variable 將因子得分最為新變量保存在數據文件中。2第十九張,PPT共六十三頁,創作于2022年6月Method 指定計算因子得分的方法。Reg

10、ression 回歸法。Bartlett 巴特利特法(加權最小二乘法)。Anderson-Rubin 安德森-魯賓法。是為了保證因子的正交性,而對Bartlett做的調整。因子得分的均值為0,方差為1,且彼此不相關。Display factor score coefficient matrix 顯示因子得分系數矩陣,是標準化的得分系數。第二十張,PPT共六十三頁,創作于2022年6月Options 2第二十一張,PPT共六十三頁,創作于2022年6月 Sorted by size 載荷系數按其數值的大小排列并構成因子載荷矩陣。使在同一個因子上具有較高載荷的變量排在一起,便于觀察。Suppres

11、s absolute values less than 不顯示那些絕對值小于所指定值的載荷系數。輸入0-1之間的數,默認值為0.1。選擇此項可以突出載荷較大的變量,便于得出結論。第二十二張,PPT共六十三頁,創作于2022年6月Initial 列表示各變量的方差。Extraction列表示每個變量被公共因子提取的方差,即共同度。因子分析結果第二十三張,PPT共六十三頁,創作于2022年6月第二十四張,PPT共六十三頁,創作于2022年6月上表為未經旋轉的因子載荷矩陣。國內生產總值0.968第一公因子0.238第二公共因子。第二十五張,PPT共六十三頁,創作于2022年6月再生相關矩陣:它是因子

12、分析后的相關矩陣。即根據各個變量的公共因子表達式所計算的變量之間的相關系數矩陣。殘差為原始相關矩陣與再生相關矩陣的差。第二十六張,PPT共六十三頁,創作于2022年6月旋轉后的因子載荷矩陣。相對于未旋轉前因子載荷的元素更加極端。第二十七張,PPT共六十三頁,創作于2022年6月上表為因子旋轉時的因子轉換矩陣。第二十八張,PPT共六十三頁,創作于2022年6月成分得分系數矩陣,上表給出了用原始變量表示主成份得分的系數信息。標準化第一主成份(第一公因子)0.221標準化后的國內生產總值0.187標準化后的城鄉存款余額第二十九張,PPT共六十三頁,創作于2022年6月未標準化第一主成份0.221標準

13、化后的國內生產總值0.187標準化后的城鄉存款余額未標準化第二主成份-0.046標準化后的國內生產總值0016標準化后的城鄉存款余額第三十張,PPT共六十三頁,創作于2022年6月上表為因子得分的協方差矩陣,由此可見各個因子之間是完全正交的。第三十一張,PPT共六十三頁,創作于2022年6月例2: 用主成份分析研究影響我國物價波動的因素。受國內經濟波動、居民收入及財富變化、生產成本價格上漲、國際石油、糧食等原材料價格的影響使得我國物價的波動變得極其復雜。由于物價的波動不是取決于某一種因素,或某幾個指標,而是受多方面因素的影響。而且隨著我國市場化程度的深化以及經濟全球化進程的加快,我國物價的波動

14、不僅反映了國內市場中總供給和總需求的矛盾,而且受國際經濟的影響,尤其是國際市場價格的影響也越來越大。 因此選取能夠反映上述因素的15個經濟變量 ,進行因子分析。第三十二張,PPT共六十三頁,創作于2022年6月第三十三張,PPT共六十三頁,創作于2022年6月 4個公因子對原始變量方差的累計貢獻率為85.89%,可見通過因子分析實現了將15維數據變量降至4維的目的。 代表成本因素的各上游價格指數在公因子F1上有較高的載荷,可稱為成本因子;而代表居民需求增長的兩個收入變量在公因子F3上有較高的載荷,可稱為需求因子;表示貨幣因素的3個變量在公因子F2上有較高的載荷,可稱為貨幣因子;而代表財富變化的

15、股票指數在公因子F4上有較高的載荷,稱為財富因子。但還有一些變量的載荷并不是很明確,我們可以通過因子旋轉得到實際意義更加明確的因子模式。 第三十四張,PPT共六十三頁,創作于2022年6月第三十五張,PPT共六十三頁,創作于2022年6月旋轉后的各公因子的載荷可以看出各因子所代表的意義更明確:代表成本因素的各上游價格指數和G7PPI的變化在公因子F1上有較高的載荷,可稱 F1為成本因子,同時也表明我國價格的變化,尤其是原材料類價格的變化和國際PPI的變化有較高的相關性;而代表居民需求增長的兩個收入變量在公因子F3上有最高的載荷,可稱 F3為需求因子;而表示包括GDP增長率在內的貨幣因素在公因子

16、F2上的載荷都是最大的,可稱 F2為貨幣因子;而代表財富變化的股票指數和表示國際經濟形勢的G7GDP指數同比增速在公因子F4上載荷最大,稱為財富因子和國際經濟因子。通過觀察旋轉后的因子載荷,可以發現各因子所代表實際意義更明確。第三十六張,PPT共六十三頁,創作于2022年6月 要考察物價波動,通過觀察可以發現CPI在各公因子的載荷分別為0.77、0.08、0.54和0.12,可見代表成本和需求變動的因子和對CPI變化的解釋能力是最強的,即在樣本區間內物價波動受成本推動和需求拉動的影響較大,其中成本推動占主導地位。 第三十七張,PPT共六十三頁,創作于2022年6月第三十八張,PPT共六十三頁,

17、創作于2022年6月例3:用主成份法構建我國出口景氣指數。由于出口同多個產業相關,并涉及投資、生產等經濟環節,因此選取多個與出口相關的指標合成出口景氣指數,從而綜合反映出口的波動水平。目前應用較廣泛的景氣指數方法有擴散指數(DI)方法、合成指數(CI)方法,還有應用主成分分析、狀態空間模型、Markov動態因子轉移模型、Probit模型等方法來構建景氣指數的方法。在構建某一產業部門的景氣指數時,主要應用主成分分析方法。第三十九張,PPT共六十三頁,創作于2022年6月 由于中國出口商品總值同比增長率直接反映了中國的出口狀況,因此將出口總值增長率作為基準指標。 一致指標是指該指標的波動與當前出口

18、的景氣變動大體一致。 先行指標是指在經濟波動達到高峰(或低谷)前,超前出現峰和谷的指標。 滯后指標是指那些轉折點(峰或谷)滯后于經濟波動的指標,其作用在于它的峰和谷的出現可以確認經濟波動的高峰或低谷確已出現。 第四十張,PPT共六十三頁,創作于2022年6月 將收集到的指標進行數據處理,計算相應的增長率序列,并將其進行季節調整,然后利用時差相關分析方法、K-L信息量方法、峰谷對應法等多種方法篩選出了15個景氣指標,分別構成中國出口的先行、一致、滯后指標組。 本文所選取的一致指標包括加拿大、香港、美國、澳大利亞、韓國、OECD等國家和地區的進口商品總額。由于上述國家和地區都為中國的前10大貿易伙

19、伴,中國向他們的出口額占到出口總額將近90%,而歐盟、美國和香港也是中國貿易順差的三大來源地;因此他們的進口總額同中國出口額是密切相關的。第四十一張,PPT共六十三頁,創作于2022年6月指標名稱K-L信息量相關系數先行指標中國固定資產投資累計增速中國外商直接投資實際利用金額累計增速美國狹義貨幣指數增速OECD狹義貨幣指數增速六國加權廣義貨幣指數增速30.50(-12)84.01(-12)42.98(-12)47.45(-9)57.53(-11)0.72(-12)0.37(-12)0.66(-12)0.64(-9)0.65(-12)一致指標中國出口總值增速美國進口商品總值增速澳大利亞進口商品總

20、值增速韓國進口商品總值增速OECD進口商品總值增速加拿大進口商品總值增速香港進口商品總值增速0.00(0)40.01(0)26.24(-2)96.74(-2)28.08(+1)34.50(+1)34.33(+2)1.0(0)0.61(0)0.78(-2)0.64(-2)0.76(+1)0.68(+1)0.69(+2)滯后指標美國進口價格指數發展中國家進口單位價格世界進口單位價格48.38(+5)55.35(+8)51.73(+8)0.55(+5)0.43(+8)0.49(+9)第四十二張,PPT共六十三頁,創作于2022年6月特征向量特征值貢獻率(%)累積貢獻率(%)1234567第一主成分0

21、.390.390.390.360.400.380.334.9370.3870.38第二主成分0.16-0.38-0.130.34-0.09-0.470.680.699.8680.24計算結果表明:一致指標組的第一主成分的貢獻率達到70.38%,較充分地代表了一致指標組的變動狀況,因此將第一主成分作為出口一致合成指數。一致指標組各指標的特征向量都在0.30.4之間,對合成指數的貢獻較為平均。 第四十三張,PPT共六十三頁,創作于2022年6月特征向量特征值貢獻率(%)累積貢獻率(%)12345第一主成分0.410.300.450.560.492.5651.2151.21第二主成分0.230.88

22、-0.15-0.22-0.290.9218.3969.60先行指標組的第一主成分的貢獻率為51.21%,還未能充分解釋先行指標組的變動。第一和第二主成分的累積貢獻率達到了69.60%,解釋了先行指標組的大部分變動。 第四十四張,PPT共六十三頁,創作于2022年6月 第一主成分中,加權廣義貨幣指數、固定資產投資、美國狹義貨幣指數、OECD狹義貨幣指數的特征向量的分量分別為0.41、0.45、0.56和0.49,這表明先行指標組的第一主成分主要包含了上述四個指標的信息。在第二主成分中,外商直接投資的特征向量分量為0.88,這說明先行指標組第二主成分主要受外商直接投資影響。第四十五張,PPT共六十

23、三頁,創作于2022年6月圖1 出口一致合成指數(一致指標組第一主成分,實線)、 出口先行合成指數(先行指標組第一主成分,虛線)圖2 出口一致合成指數(一致指標組第一主成分,實線)、 出口先行合成指數(先行指標組第二主成分,虛線)第四十六張,PPT共六十三頁,創作于2022年6月例4 研究影響住宅價格波動因素的因子分析模型。影響住宅價格波動的因素有宏觀經濟因素、政策因素、市場的供給、需求和資本因素以及消費者和投資者的心理因素等,本文選擇與這些因素相關的14項指標進行分析 ,各項指標經過標準化處理 ,進行因子分析結果如下表: 第四十七張,PPT共六十三頁,創作于2022年6月指標名稱變 動 因

24、素f 1f 2f 3f 41.房地產開發資金來源中的外商直接投資增速-0.049-0.2350.0150.8742.房地產開發資金來源中的國內貸款增速0.6080.680.238-0.1143.房地產開發資金來源合計增速0.860.130.236-0.1454.房地產開發資金來源中的自籌資金增速0.943-0.2010.011-0.0795.金融機構建筑業貸款增速0.2650.6760.071-0.4076.貨幣供應量M1增長率0.3400.1410.7610.4647.五年期貸款利率-0.8760.1270.146-0.278.建筑材料購進價格指數(上年=100)0.296-0.890-0.

25、0760.1719.全國住宅土地交易價格指數(上年=100)0.695-0.324-0.477-0.10310.住宅完成投資額增速-0.1950.752-0.0950.14811.商品房新開工面積同比增速-0.2680.6040.654-0.08812.商品房竣工面積同比增速0.0310.7080.437-0.28213.商品房銷售面積同比增速0.4420.1810.7840.25114.城鎮居民人均可支配收入增速0.3920.13-0.8360.181特征值3.9833.4482.9061.503貢獻率(%)28.45224.62620.75810.734累計貢獻率(%)28.45253.0

26、7873.83684.570第四十八張,PPT共六十三頁,創作于2022年6月 其中,資金來源中的自籌資金增長率、國內貸款增長率,資金來源合計增長率、五年期利率等代表資金可獲得性的指標在因子f1上有較高的載荷,并且全國住宅土地交易價格指數在因子f1上也有較高的載荷,因此,用因子f1代表資本可獲得性和土地交易價格;同樣,可以發現因子f2對各供給因素的載荷較高(如:建筑材料購進價格指數、住宅完成投資額增速、新開工面積增速、竣工面積增速等),因此因子f2代表供給因素;因子f3對需求因素(如:個人可支配收入、銷售面積和M1增長率等)的載荷較高,代表需求因子;而資金來源中的外商投資增長率和金融機構建筑業

27、貸款增長率等在因子f4上有較高的載荷,因此因子f4也代表資本可獲得性。 第四十九張,PPT共六十三頁,創作于2022年6月pe表示商品住宅銷售價格的增長率,用商品住宅銷售價格指數(上年同期=100) - 100來代表 。利用普通最小二乘法得到下面的結果: 利用表中列出的4個公共因子代表14個相關變量,進一步分析這些因素對我國住宅價格波動的影響。建立下面的回歸分析模型: t = (1.56) (29.76) (3.85) (1.48) (2.48) t = (14.0) (-7.8) R 2=0.998 D.W.=2.03第五十張,PPT共六十三頁,創作于2022年6月由于因子f2在回歸結果中不

28、顯著,因此從式中剔除掉。表明在本輪的住宅價格上漲中,供給因素的影響較弱。而代表資本可獲得性的因子f1和因子f4對價格波動有正的影響,需求因子f3對住宅價格波動也有正的影響。因此,可以得出結論認為近幾年我國住宅價格的上漲主要受兩方面因素影響:(1)由于缺乏較好的融資渠道,民間大量閑置資本流入房地產住宅投資市場,產生較大的投機需求,造成市場需求虛高;(2) 住房制度改革以后釋放出的對住宅的大量需求。而實際上,房地產開發資金合計從1998年的5030億元增加到2005年的25360億元,在7年的時間里增長了5倍多。而且在表中可以看到住宅土地交易價格在因子f 1中有較高的載荷。綜上所述,在調控我國住宅價格波動的過程中,緊縮“銀根”和“地根”起著重要的作用 。第五十一張,PPT共六十三頁,創作于2022年6月對應分析 因子分析分為R型因子分析和Q型因子分析。一般來說兩種因子分析是分開進行的。這一方面會漏掉一些指標和樣本之間的信息,另一方面Q型因子分析的工作量較大對應分析是借助列聯表獨立檢驗中卡方統計量的計算方法對原始數據矩陣進行轉換,得到規格化的概率矩陣,使數據資料具有對稱性,將R型因子分析和Q型因子分析建立起聯系,在做R型因子分析的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論