SPSS聚類分析_第1頁
SPSS聚類分析_第2頁
SPSS聚類分析_第3頁
SPSS聚類分析_第4頁
SPSS聚類分析_第5頁
已閱讀5頁,還剩43頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、聚類分析聚類分析- 聚類分析是用多元統計技術進行分類的一種方法,聚類分析是用多元統計技術進行分類的一種方法, 其中類是指其中類是指相似相似元素的集合。元素的集合。 聚類分析基本概念如何衡量如何衡量相似相似程度?程度? 距離:相似程度越大,相當于距離越短距離:相似程度越大,相當于距離越短 包括點間距離和類間距離。包括點間距離和類間距離。 類間距離是根據點間距離來確定的,如兩類的最近點之間、最類間距離是根據點間距離來確定的,如兩類的最近點之間、最遠點之間、中心點之間的距離均可以定義為類間距離。遠點之間、中心點之間的距離均可以定義為類間距離。 聚類分析中距離算法 (1) (1)歐氏距離歐氏距離 歐氏

2、距離基于勾股定理,可以很容易推廣到三個以上變量。對歐氏距離基于勾股定理,可以很容易推廣到三個以上變量。對于于n n個變量,個變量,21()nijkikjkdxx (2) (2)閔閔( (明明) )氏距離氏距離11( )()nqqijkikjkdqxxq=0,閔氏距離,閔氏距離 同歐氏距離同歐氏距離 缺點:距離大小和各指標觀測單位有關缺點:距離大小和各指標觀測單位有關 沒有考慮指標間的相關性沒有考慮指標間的相關性 SPSS中聚類功能 ( (1) )非系統聚類法非系統聚類法 快速聚類法快速聚類法kk值聚類法值聚類法( (K-Means Cluster) ) ( (2) )系統聚類法系統聚類法 分層

3、聚類法分層聚類法( (Hierarchical Cluster過程過程) ) 樣本聚類樣本聚類( (Q型型) )、變量聚類、變量聚類( (R型型) ) ( (3) )其他聚類方法其他聚類方法 分解聚類法、動態聚類法、降維法及圖法、分解聚類法、動態聚類法、降維法及圖法、 有序樣品聚類等有序樣品聚類等 K-Means Cluster K-Means Cluster過程可完成由用戶指定類別數的大樣本資料的過程可完成由用戶指定類別數的大樣本資料的逐步聚類分析。所謂逐步聚類分析就是先把被聚對象進行初始分類,逐步聚類分析。所謂逐步聚類分析就是先把被聚對象進行初始分類,然后逐步調整,直到得到最終分類。然后逐

4、步調整,直到得到最終分類。 原理:原理: (1)選擇選擇n個數值型個數值型觀測量觀測量,確定最后的,確定最后的聚類數聚類數k (2)由系統選擇由系統選擇(也可由用戶指定也可由用戶指定)k個觀測量作為初始聚心個觀測量作為初始聚心 (3)計算歐氏距離計算歐氏距離(距離最小的原則距離最小的原則)把所有觀測量選入把所有觀測量選入k個類中個類中 (4)重新計算每個類中的均值,作為第二次迭代的聚心重新計算每個類中的均值,作為第二次迭代的聚心 (5)然后根據這個聚心重復第三、第四步驟,直到兩次迭代計算然后根據這個聚心重復第三、第四步驟,直到兩次迭代計算的聚心之間距離的最大改變量小于初始聚心之間最小距離的倍數

5、時,的聚心之間距離的最大改變量小于初始聚心之間最小距離的倍數時,或者是達到迭代次數的上限時,停止迭代。或者是達到迭代次數的上限時,停止迭代。 K-Means Cluster- K-Means Cluster激活數據管理窗口激活數據管理窗口定義變量名定義變量名 K-Means Cluster數據輸入數據輸入 K-Means Cluster數據標準化處理數據標準化處理 K-Means Cluster查看描述統計量查看描述統計量 K-Means Cluster數據儲存數據儲存 K-Means Cluster打開打開“分析分析”菜單菜單選選“分類分類”中的中的“k-k-均值聚類均值聚類”項項 K-Me

6、ans Cluster觀測量觀測量選擇選擇“迭代與分類迭代與分類”所有輸入量所有輸入量聚類數聚類數k=5k=5 K-Means Cluster確定確定“最大迭代次數最大迭代次數”確定確定“收斂標準值收斂標準值” K-Means Cluster存儲最終結果輸出情況,存儲最終結果輸出情況,在數據文件中在數據文件中(QCL-1/QCL-2)(QCL-1/QCL-2) K-Means Cluster初始聚心選項初始聚心選項輸出方差分析表輸出方差分析表 K-Means Cluster初始聚類中心表初始聚類中心表 K-Means Cluster K-Means Cluster方差分析表方差分析表 K-Me

7、ans Cluster K-Means Cluster聚類結果:聚類結果: K-Means Cluster具體城市聚類結果具體城市聚類結果QCL-1QCL-1說明聚類結果,說明聚類結果,QCL-2QCL-2說明聚類的長度情況說明聚類的長度情況 Hierarchical Cluster 系統聚類法系統聚類法( (分層聚類法分層聚類法) ) 樣本聚類樣本聚類( (Q型型) )、變量聚類、變量聚類( (R型型) ) 開始時,有多少點就是多少類,第一步先把最近的兩個點合并開始時,有多少點就是多少類,第一步先把最近的兩個點合并成一類,然后再把剩下的最近的兩類合并成一類,這樣每次都少一成一類,然后再把剩下

8、的最近的兩類合并成一類,這樣每次都少一類,直到最后只有一大類為止,越是后來合并的類距離越遠。類,直到最后只有一大類為止,越是后來合并的類距離越遠。 優點:既可以對觀測量優點:既可以對觀測量( (樣本樣本) ),也可以對變量進行聚類,既可,也可以對變量進行聚類,既可以是連續變量也可以是分類變量。以是連續變量也可以是分類變量。Hierarchical Cluster (Q Q型型)- Hierarchical Cluster (Q Q型型)激活數據管理窗口激活數據管理窗口定義變量名定義變量名數據輸入數據輸入 Hierarchical Cluster (Q Q型型)數據標準化處理數據標準化處理 Hi

9、erarchical Cluster (Q Q型型)查看描述統計量查看描述統計量 Hierarchical Cluster (Q Q型型)數據儲存數據儲存 Hierarchical Cluster (Q Q型型)打開打開“分析分析”菜單菜單選選“分類分類”中的中的“系統聚類系統聚類”項項 Hierarchical Cluster (Q Q型型)觀測量觀測量所有輸入量所有輸入量選擇個案聚類選擇個案聚類輸出統計量和圖像輸出統計量和圖像 Hierarchical Cluster (Q Q型型)選擇“合并進程表”和“相似性矩陣”選項 Hierarchical Cluster (Q Q型型)選擇圖像輸出

10、“樹狀圖”選項 Hierarchical Cluster (Q Q型型)SPSS提供了7種類間距離的測量方法1、組間鏈接法2、組內鏈接法3、最近距離法4、最遠距離法5、重心法6、中間距離法7、Ward最小偏差平 方和法SPSS提供了8種距離度量標準1、Euclidean 距離2、Euclidean 距離平方3、Cosine 距離4、Pearson 相關距離5、Chebychev 距離6、City-Block 距離7、Minkowski 距離8、自定義距離 Hierarchical Cluster (Q Q型型) Hierarchical Cluster (Q Q型型) Hierarchical

11、 Cluster (Q Q型型)觀測量描述表 Hierarchical Cluster (Q Q型型) Hierarchical Cluster (Q Q型型) Hierarchical ClusterHierarchical Cluster (R R型型)- Hierarchical Cluster (R R型型)選擇變量聚類 Hierarchical Cluster (R R型型) Hierarchical Cluster (R R型型) Hierarchical Cluster (R R型型) Hierarchical Cluster聚類方法選擇組間聯接度量方法選擇Pearson相關性 Hierarchical Clus

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論