SPSS聚類分析

本文轉載自查看原文 2021-08-21 15:12 260 SPSS/ 聚類分析

聚類分析是根據對象的特性對其進行定量分類的一種多元統計方法。比如：不同地區城鎮居民收入和消費狀況的分類研究；區域經濟及社會發展水平的分析及全國區域經濟綜合評價.......

通常聚類分析分為Q型聚類分析和R型聚類分析。

Q型聚類分析：對樣品的分類；

R型聚類分析：對變量的分類。

通常聚類之前，要首先分析樣品（或變量）間的相似性。

樣品相似性度量（距離）：明氏距離（歐式距離、絕對值距離、切比雪夫距離）、馬氏距離。

變量相似性度量（相似系數）：夾角余弦、相關系數

距離越小（相似系數越大），樣品（變量）相似性越大

系統聚類法的過程是：假設總共有n個樣品（或變量），第一步將每個樣品（或變量）獨自聚成一類，共有n類；第二步根據所確定的樣品（或變量）“距離”公式，把距離較近的兩個樣品（或變量）聚合為一類，其它的樣品（或變量）仍各自聚為一類，共聚成n 1類；第三步將“距離”最近的兩個類進一步聚成一類，共聚成n 2類；……，以上步驟一直進行下去；最后將所有的樣品（或變量）全聚成一類。為了直觀反映系統聚類過程，可以將整個聚類過程繪制一張圖，圖稱為譜系圖或樹狀結構圖。常用的系統聚類法：最短距離法、最長距離法、組間類平均法、組內類平均法、重心法、中間法、Ward法

系統聚類法是一種比較成功的聚類方法。然而當樣本點數量十分龐大時，則是一件非常繁重的工作，且聚類的計算速度也比較慢。此時K-均值聚類就會顯得方便，適用。 K均值法是麥奎因（MacQueen，1967）提出的，這種算法的基本思想是將每一個樣品分配給最近中心（均值）的類中，具體的算法至少包括以下三個步驟： 1.確定類別數目k 2.將所有的樣品分成K個初始類； 3.通過歐氏距離將某個樣品划入離中心最近的類中，並對獲得樣品與失去樣品的類，重新計算中心坐標； 4.重復步驟2，直到所有的樣品都不能再分配時為止。

例：

系統聚類：

快速聚類

分類情況如下：第一類：阿富汗、中國、印度、印度尼西亞、馬來西亞、老撾、菲律賓、泰國第二類：澳門、新加坡第三類：香港、以色列、日本、沙特、韓國

由上表可知：第一類國家和地區的經濟水平相對較低，人口老齡化程度也相對較輕。第二類國家和地區的經濟水平較高，同時人口老齡化程度嚴重。第三類國家和地區的經濟水平居中，人口老齡化程度較重。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 SPSS聚類分析 SPSS-聚類分析 SPSS聚類分析：K均值聚類分析利用SPSS對數據做系統聚類分析聚類分析詳解聚類分析案例 Mahout聚類分析 Mahout聚類分析實驗12-SPSS-聚類分析-公司員工績效評估 python聚類分析