熱線電話:13121318867

登錄
首頁精彩閱讀SPSS聚類分析:K均值聚類分析
SPSS聚類分析:K均值聚類分析
2017-12-13
收藏

SPSS聚類分析:K均值聚類分析

一、概念:(分析-分類-K均值聚類)

   1、此過程使用可以處理大量個案的算法,根據選定的特征嘗試對相對均一的個案組進行標識。不過,該算法要求您指定聚類的個數。如果知道,您可以指定初始聚類中心。您可以選擇對個案分類的兩種方法之一,要么迭代地更新聚類中心,要么只進行分類??梢员4婢垲惓蓡T、距離信息和最終聚類中心。還可以選擇指定一個變量,使用該變量的值來標記個案輸出。您還可以請求分析方差F統計量。

二、聚類中心(分析-分類-K均值聚類)

為獲得最佳有效性,可取一個個案樣本并選擇迭代和分類方法確定聚類中心。選擇最終聚類中心另存為。然后恢復整個數據文件并選擇僅分類作為方法,并選擇讀取初始聚類中心來源以使用該樣本估計的中心對整個文件分類。您可以寫入和讀取文件或數據集??梢栽谕粫捴欣^續使用數據集,但不會將其另存為文件,除非在會話結束之前明確將其保存為文件。數據集名稱必須符合變量命名規則。

三、迭代(分析-分類-K均值聚類-迭代)

   注意:只有在您從“K均值聚類分析”對話框中選擇了迭代和分類方法的情況下,這些選項才可用?!蜃畲蟮螖?。限制K均值算法中的迭代次數。即使尚未滿足收斂準則,達到迭代次數之后迭代也會停止。此數字必須在1到999之間?!蚴諗啃詷藴?。確定迭代何時停止。它表示初始聚類中心之間的最小距離的比例,因此必須大于0且小于等于1。例如,如果準則等于0.02,則當完整的迭代無法將任何聚類中心移動任意初始聚類中心之間最小距離的2%時,迭代停止?!蚴褂眠\行均值。允許您請求在分配了每個個案之后更新聚類中心。如果不選擇此選項,則會在分配了所有個案之后計算新的聚類中心。

四、保存(分析-分類-K均值聚類-保存)

1、聚類成員。創建指示每個個案最終聚類成員的新變量。新變量的值范圍是從1到聚類數。

2、與聚類中心的距離。創建指示每個個案與其分類中心之間的歐式距離的新變量。

五、選項:(分析-分類-K均值聚類-選項)

   統計量。您可以選擇以下統計量:初始聚類中心、ANOVA表以及每個個案的聚類信息?!虺跏季垲愔行?每個聚類的變量均值的第一個估計值。默認情況下,從數據中選擇與聚類數相等的分布良好的多個個案。初始聚類中心用于第一輪分類,然后再更新?!駻NOVA表.顯示方差分析表,該表包含每個聚類變量的一元F檢驗。F檢驗只是描述性的,不應解釋生成的概率。如果所有個案均分配到單獨一個聚類,則ANOVA表不顯示?!蛎總€個案的聚類信息.顯示每個個案的最終聚類分配,以及該個案和用來對個案分類的聚類中心之間的Euclidean距離。還顯示最終聚類中心之間的歐氏距離。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢