




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第20卷 第6期2004年11月地理與地理信息科學GeographyandGeo-InformationScience主成分分析法在地區綜合實力評價中的應用馮利華,馬未宇(浙江師范大學地理系,浙江金華321004)摘要:地區綜合實力反映一個地區社會經濟系統的發展水平。主成分分析法能夠在保證原始數據信息損失最小的情況下,以少數的綜合變量取代原有的多維變量,使數據結構大為簡化,并且客觀地確定權數,避免了主觀隨意性,因而是地區綜合實力評價的一種有效方法。通過主成分分析,可以全方位地了解各個地區社會經濟系統的發展水平及其差距。關鍵詞:地區綜合實力;指標;變量;數據信息;主成分分析中圖分類號:F224.
2、9 文獻標識碼:A 文章編號:1672-0504(2004)06-0073-03地區綜合實力是評價一個地區社會經濟系統發展狀況的重要指標1,2。自1991年以來,為了對全國2000多個縣(市)的整體經濟實力和社會發展狀況進行定量的檢驗和排序,已多次進行地區綜合實力的評價工作,并由此產生了歷屆的全國綜合實力百強縣。評價所選用的方法主要有等份計分法、模糊綜合評判法等,所選用的指標涉及社會經濟系統中生產、分配、交換、消費等環節,并且指標數量還有不斷增加的趨勢,如從最初的12個,增加到22個,在全國社會發展總指數的計算中,指標數量則增加到130多個。事實上,這些方法本身存在著明顯的缺陷,如等份計分法需
3、要對每個指標人為地給定一個權數,并且由于指標數量多,無法突出主要指標的作用,同時增加了評價工作量。除此以外,模糊綜合評判法采用取小取大的運算法則,還會使大量的有用信息遺失,并且評價指標越多,遺失的有用信息也越多,誤判的可能性越大。近年來,隨著多元統計方法的普及和應用,主成分分析法也成為一種較新的評估方法3,4。它與前述方法有著不同的原理和特性,能夠在最大限度地保留原有信息的基礎上,對高維變量系統進行最佳的綜合與簡化,并且能夠客觀地確定各個指標的權數,避免了主觀隨意性。為此,本文根據主成分分析法,對地區綜合實力進行評價,以便客觀而準確地衡量一個地區社會經濟系統的發展水平。舍棄部分信息,以少數的綜
4、合變量取代原有的多維變量,這樣既抓住了主要矛盾,又簡化了評價工作。設原始變量為x1,x2, ,xn,主成分分析后得到的新變量(綜合變量)為z1,z2, ,zm,它們是x1,x2, ,xn的線性組合(m<n)。新變量z1,z2, ,zm構成的坐標系是原坐標系經平移和正交旋轉后得到的,稱z1,z2, ,zm構成的空間為m維主超平面。在主超平面上,第一主成分z1對應于數據變異(貢獻率e1)最大的方向,對于z2, ,zm,依次有e2 em。因此,z1是攜帶原始數據信息最多的一維變量,而m維主超平面是保留原始數據信息量最大的m維子空間。主成分分析法的步驟如下:(1)為了排除數量級和量綱不同帶來的影
5、響,首先對原始數據進行標準化處理:x*ij=(xij-i)/ i (i=1,2, n;j=1,2, ,p)式中:xij為第i個指標第j個分區的原始數據,xi和 i分別為第i個指標的樣本均值和標準差。(2)根據標準化數據表(x*ij)n!p,計算相關系數矩陣R=(rij)n!n,其中:rij=1n(x-i)(xkj-j)/ ijnk=1ki(3)計算R的特征值和特征向量。根據特征方程R- I=0,計算特征根 i,并使其從大到小排列: 1 2 n,同時可得對應的特征向量u1,u2, ,un。它們標準正交,u1,u2, ,un稱為主軸。(4)計算貢獻率ei= i/j= i和累計貢獻率Ej= j/1j
6、=1i。i=1nnm1 主成分分析法主成分分析法旨在力保原始數據信息丟失最小的情況下,對高維變量空間進行降維處理,即在保證原始數據信息損失最小的前提下,經過線性變換和(5)計算主成分zj=j= uiix*ij。1i=1(6)綜合分析。一個m維主超平面究竟以多大的pn收稿日期:2004-04-02; 修訂日期:2004-08-05基金項目:浙江省自然科學基金資助項目(402034);浙江省金華市科技計劃項目(03-1-508):(),第74頁地理與地理信息科學 第20卷精度來近似代替原始變量系統,才能確保盡可能多的(3)求解R的特征值 i(表1)和特征向量ui。第*原始數據信息?這可以通過求累計
7、貢獻率Ej來判斷。一主成分z1與各指標的關系為:z1=-0 18x* 15x21+0*一般取Ej大于80%的最小m(m<n),則可得主超平-0 08x* 23x* 25x* 04x6+0 18x* 24x*3+04+05+07+08+面的維數m,從而可對m個主成分進行綜合分析。*0 25x9+0 26x* 27x* 22x* 24x* 23x*10+011+012-013+014+*0 21x15-0 02x* 20x* 25x* 27x* 23x*16+017+018+019+020+*0 18x21+0 26x*22。2 地區綜合實力的評價實例地區綜合實力反映了一個地區整體的經濟實力
8、和社會經濟發展狀況。因此,應該全方位地從一個地區社會經濟系統的各個領域去選擇指標。在第三屆全國百強縣的評選中,選擇了22個指標:x1為人均耕地面積(hm);x2為有效灌溉面積占耕地面積的比重(%);x3為人均農林牧漁業增加值(元);x4為勞均農用機械總動力(W);x5為勞均農村用電量(kWh);x6為每畝耕地化肥施用量(kg);x7為國內生產總值(萬元);x8為地方財政收入(萬元);x9為人均國內生產總值(元);x10為人均地方財政收入(元);x11為人均各項稅金(元);x12為社會勞動生產率(元);x13為農業勞動力占全社會勞動力的比重(%);x14為第二、三產業增加值占國內生產總值的比重(
9、%);x15為每百萬人中中學生數(人);x16為每個教師負擔學生數(人);x17為每萬人口擁有的醫院、衛生院床位數(張);x18為農業技術人員占農業勞動力的比重(%);x19為人均儲蓄余額(元);x20為農民人均純收入(元);x21為職工平均工資(元);x22為人均社會消費品零售額(元)。前已述及,多指標的綜合評價一方面增加了評價工作量,另一方面勢必淡化主要指標的作用。為此,需要從現有指標中精選出若干個有代表性的指標。但人為地精選指標難免帶有主觀隨意性,可能丟失部分有價值的原始信息。因此必須對所考慮的眾多指標,利用數理統計法,經過正交化處理,使其成為少數幾個相互獨立的綜合指標,再根據這些指標來
10、評價一個地區的綜合實力,而主成分分析法為實現這一思路提供了有效的數學方法。本文以金華市社會經濟系統的22個指標為例,來說明主成分分析法在地區綜合實力評價中的應用。金華市位于浙江省的中部地區,共有9個縣(市),分布在丘陵山地與河谷平原等不同的地貌單元內,社會經濟系統的發展水平差異懸殊。(1)對9個縣(市)的22個指標共198個數據進行標準化處理,得到標準化數據表(x*ij)(i=1,2, ,22;j=1,2, ,9)。(2)根據(x*ij)22!9,計算得到相關系數矩陣R=(rij!5-8(4)根據 i可得貢獻率ei和累計貢獻率Ej(表1)。(5)計算得到主成分zj(表2)。表2中列出了第一、第
11、二、第三主成分。表1 特征值、貢獻率和累計貢獻率Table1 Characteristicvalues,contributionratesandaccumulativecontributionrates序號12345678累計貢獻率(%)表2 各縣(市)的主成分、綜合主成分及其排名Table2 Everycountrysprincipalcomponent,syntheticprincipalcomponentandplace序號123456789地區金華縣義烏市武義縣東陽市磐安縣蘭溪市永康市浦江縣市 區排名827495361(6)從表1可以看出,前8個特征值所對應的累計貢獻率E8=100%,
12、也就是如果選用前8個主成分,它們所攜帶的數據信息已經完全包括了原來22個變量所攜帶的數據信息,這就使數據結構大為簡化。事實上,根據最小m的選取標準(Ej>80%),只要選用前3個主成分就夠了,因為此時累計貢獻率E3=83 36%>80%,而損失的數據信息只占原信息的16 64%,使數據結構更為簡化了。通過以上分析,根據主成分z1、z2、z3和對應的客3觀權數e1、e2、e3之積z13=i= 1eizi計算,最后得到各縣(市)的綜合主成分z13及其排名(表2)。從表2可以看出,市區和義烏市的綜合實力最強,分別排在第一和第二位,而位于丘陵山區的磐安縣的綜合實力最弱,排在最后一位。如果根
13、據前8個主成分來計算綜合主成分z18,那么由此而得到的各縣(市)第6期馮利華等:主成分分析法在地區綜合實力評價中的應用第75頁明,主成分分析法利用少數幾個綜合變量就能夠代替眾多原始變量所攜帶的大部分數據信息。根據表2的綜合主成分,參考有關等級分類方法,得到各縣(市)綜合主成分的分級標準(表3)。由表3可知,市區和義烏市的綜合實力最強,永康市的綜合實力較強,東陽市和蘭溪市的綜合實力中等,浦江縣、武義縣、金華縣的綜合實力
14、較弱,而磐安縣的綜合實力最弱。表3綜合主成分的分級標準Table3Classificationstandardofsyntheticprincipalcomponents序號12345綜合主成分z13綜合實力等級強較強中等較弱弱分信息,以少數的綜合變量取代原有的多維變量,使數據結構大為簡化,并且客觀地確定權數,避免了主觀隨意性,因而是地區綜合實力評價的一種簡單易行的有效方法。3)通過主成分分析,可以全方位地了解各個地區社會經濟系統的發展水平及其差距,這不僅能為各級領導進行科學管理和決策提供重要的信息,而且也能為理論工作者制定政策提供可靠的依據。4)地貌單元的
15、差異是金華市各縣(市)社會經濟發展的主要限制因子,為此需要推出#移民下山等扶貧政策。參考文獻:特征J.地理與地理信息科學,2003,19(6):65-69.2劉慧.我國農村發展地域差異及類型劃分J.地理與地理信息科學,2002,18(4):71-75.3張超,楊秉庚.計量地理學基礎M.北京:高等教育出版社,1993.145-159.4任若恩,王惠文.多元統計數據分析M.北京:國防工業出版社,1997.92-110.2002J.ComputationalStatistics&DataAnalysis,2002,40(3):471-47
16、4.multivariatefamilialcorrelationmatrixJ.JournalofMultivariateAnaly sis,2002,82(2):457-470.earprincipalcomponentanalysisJ.StatisticsandComputing,2003,13(3):267-276.largemarginclassifiersJ.NeuralNetworks,2001,14(10):1447-1461.主成分分析法的結果表明,地貌單元的差異是金華市各縣(市)社會經濟發展的主要限制因子,因為浦江縣、武義縣、金華縣的山
17、地面積占全縣面積的60%80%,而磐安縣的山地面積則占全縣面積的91%。為此,近年來市政府推出了#移民下山的扶貧政策,還在金華市的經濟開發區內特設了磐安經濟開發小區(金磐開發區),這對增強地區綜合實力起到了積極而有效的作用。3結論根據上述分析,可以得到如下結論:1)在地區綜合實力的評價中,原有的等份計分法等具有人為給定權數、指標數量多、評價工作量大等缺陷,因而有可能出現誤判。2)主成分分析法能夠在保證原始數據信息損失最小的情況下,經過線性變換和舍棄部ApplicationofPrincipalComponentAnalysisinEvaluationofAreasCompre
18、hensiveStrengthFENGLi-hua,MAWei-yu(DepartmentofGeography,ZhejiangNormalUniversity,Jinhua321004,China)Abstract:Theareascomprehensivestrengthisusedtoindicatedevelopmentlevelofsocietyandeconomysystemofanarea.Theprincipalcomponentanalysismethodcansubstituteasmallnumbercomprehensivevariablefororiginalmultidimensionalvariable,andobviouslysimplifydatastructureinthepreconditionofminimizinglossoforiginaldatainformation.Theprincipalcomponentanalysiscanobjectivelygiveweighta
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論