熱線電話:13121318867

登錄
首頁精彩閱讀SPSS聚類分析是否需要對數據進行標準化處理?
SPSS聚類分析是否需要對數據進行標準化處理?
2016-03-15
收藏

SPSS聚類分析是否需要對數據進行標準化處理?

為了從不同的角度反映一組數據的特征,我們往往追求更多的指標,這些數據單位不同,數量級也不同,這就需要我們在開始分析之前 對數據進行標準化處理。聚類分析就經常遇到,因為聚類就是利用多個指標來對樣本進行分類的統計方法。

那么,SPSS聚類分析是否需要對數據進行標準化處理呢?經常有人提問。

問:SPSS聚類分析是否需要對數據進行標準化處理?-09大數據

首先,從聚類分析的概念上來判斷。

聚類的要求是同一類的樣本有較大的相似性,不同類的樣本有較大的差異性。那如何才算是有相似性呢?這里經常用的就是判斷點與點之間的距離是不是很近或者有相關性,只要是用距離來判斷,就涉及到不同指標的運算,而量綱和數量級上的差異對距離的判斷有很大的影響,為了消除這種影響,因此在聚類前需要對數據進行標準化處理。

有一種例外情況,如果采用相關系數來衡量個體的相似性,可以不做標準化處理,也留給大家討論。

其次,我們從聚類操作對話框來看。

SPSS軟件封裝了3種聚類方法,TwoStep、Kmeans、Hierarchical。

先來看TwoStep聚類,如下圖對話框。

問:SPSS聚類分析是否需要對數據進行標準化處理?-09大數據

SPSS明確指出需要對連續變量進行標準化操作,這個選項非常適合初學者,把數據質量的因素直接考慮進去,我們只需要按照提示一步步來完成即可。

再來看Kmeans聚類,如下圖,

問:SPSS聚類分析是否需要對數據進行標準化處理?-09大數據

我們發現,SPSS并沒有在這個過程中預裝標準化操作,因此對于剛接觸SPSS的人來說,就會造成一定的困惑或者麻煩,會認為完全按照spss的菜單項操作就可萬無一失,從這一例子來看,SPSS初學者一定不能有這樣的惰性思維,SPSS為我們提供便捷菜單操作的同時,我們仍然不能放棄基本的數據分析思維。

再看Hierarchical聚類過程,對話框如下圖,

問:SPSS聚類分析是否需要對數據進行標準化處理?-09大數據

spss同樣預裝了數據標準化操作,SPSS菜單操作的便捷一目了然。

總結


講到這里,大家對這個問題應該比較清晰。小兵再次提醒大家,不管SPSS是否在菜單選項中提供數據標準化處理,作為分析師,首先我們要有提前標準化的思維習慣,數據標準化也是數據預處理中的一項重要工作。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢