熱線電話:13121318867

登錄
首頁大數據時代如何清晰的理解Z-Score這種數據標準化的處理方法?
如何清晰的理解Z-Score這種數據標準化的處理方法?
2020-07-10
收藏

Z-Score數據標準化處理的一種常用方法,通過Z-Score,可以將不同量級的數據轉化為統一量度的Z-Score分值,并進行比較。

(1)Z-score定義

根據圖可以看出,Z-score的數據分布滿足“正態分布”(N(0.1)),而“正態分布”又被稱為“Z-分布”,所以該方法被稱為“Z-score”。

(2)Z-score公式

Z-score的計算公式如下:

總體數據的均值(μ)、總體數據的標準差(σ)、個體的觀測值(x)

(3)Z-score優缺點

Z-score最大優點就是計算簡單,使用起來比較方便;當數據分布非常凌亂,無法進行最大、最小值的判斷時,用Z-score可以實現數據的規范化處理。

Z-score缺點為,在一定程度生對數據分布有要求,并且Z-score的結果通常都是用來比較,實際意義比較小。

(4)Z-Score計算方法


# define dataset

data_A <- rnorm(100. 80. 10)     # randomly create population dataset

data_B <- rnorm(100. 400. 100)   # randomly create population dataset

hist(data_A) #histogram

hist(data_B) #histogram

#Calculate population mean and standard deviation

A_data_std <- sd(data_A)*sqrt((length(data_A)-1)/(length(data_A)))

A_data_mean <- mean(data_A)

B_data_std <- sd(data_B)*sqrt((length(data_B)-1)/(length(data_B)))

B_data_mean <- mean(data_B)

# Provided that A got 92 and B got 610

A_obs <- 92

B_obs <- 610

A_Z_score <-  (A_obs - A_data_mean) / A_data_std

B_Z_score <-  (B_obs - B_data_mean) / B_data_std


想深入學習統計學知識,為數據分析筑牢根基?那快來看看統計學極簡入門課程!

學習入口:https://edu.cda.cn/goods/show/3386?targetId=5647&preview=0

課程由專業數據分析師打造,完全免費,60 天有效期且隨到隨學。它用獨特思路講重點,從數據種類到統計學體系,內容通俗易懂。學完它,能讓你輕松入門統計學,還能提升數據分析能力。趕緊點擊鏈接開啟學習,讓自己在數據領域更上一層樓!

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢