SPSS K均值聚類（k-means）和可視化方法

本文轉載自查看原文 2021-05-21 14:53 18915 數據統計分析方法

1. 打開數據，依次選擇分析-> 分類 -> K-均值聚類…

2. 將分類的關鍵變量選入，這里以PM2.5和O3的監測數據為例。

3. 單擊迭代…，將最大迭代次數設置成一個將大的數值，單機繼續

4. 單擊保存…，勾選聚類成員和與聚類中心的距離，單擊繼續

5. 單擊選項…，勾選統計中的所有選項，缺失值中選擇成列排除個案，單擊繼續

6. 聚類數設置為5，單擊確定

7. 結果解讀：迭代歷史記錄，反應了迭代過程中聚類中心的變動情況。第10次無變動，說明算法收斂。

8. 結果解讀：最終聚類中心，是個各類的均值，可用於之后的分類。

9. 結果解讀：最終聚類中心之間的距離，可用於分析聚類情況是否合適，是否有必要減少或增加類的數量

10. 結果解讀：ANOVA（單因素方差分析），可根據F值大小近似得到變量對聚類的貢獻，如下表說所示，重要程度排序為 O3_OBS > PM25_OBS，同時二者的顯著性均低於0.05，均對聚類有顯著的貢獻。

11 .結果解讀：每個聚類中的個案數目，統計各類別數目及缺失情況。

12. 聚類結果，會保存在數據表中，QCL_1標注個案的類別，QCL_2表示個案與聚類中心的距離

13. 可視化，依次選擇圖形 -> 圖表構建器…

14. 選擇散點圖/點圖中的分組散點圖，將其拖入繪圖展示區中

15. 將O3_OBS和PM25_OBS分別拖入橫軸和縱軸

16. 將個案聚類編號拖入設置顏色方框中，單擊確定

17. 繪圖效果如下所示，可以直觀展示聚類效果。

參考資料：

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 k均值聚類（k-means clustering） R語言使用K-Means聚類可視化WiFi訪問 K-means + PCA + T-SNE 實現高維數據的聚類與可視化【sklearn入門】通過sklearn實現k-means並可視化聚類結果基於python3的可視化數據聚類系統（k-means算法和k-中心點算法）聚類-K-Means K-均值（K-means）聚類算法 k-means k均值聚類的弱點/缺點 K-Means K均值聚類 python代碼實現 K均值(K-MEANS)