熱線電話:13121318867

登錄
首頁大數據時代這3種數據標準化方法,你知道嗎?
這3種數據標準化方法,你知道嗎?
2020-07-09
收藏

數據標準化(normalization)是一個常用的數據預處理操作,就是對原始各項指標數據按比例進行縮放,將數據的單位限制去除,轉化為無規模、無量綱的純數值,減少規模、特征、分布差異等對模型的影響,以便于不同單位或量級的指標能夠進行比較和加權。

下面小編整理了三種最常用的標準化方法:min-max法(規范化方法),z-score法(正規化方法),歸一化。

1.min-max法(規范化方法)也叫離差標準化,是對原始數據的線性變換,使結果映射到[0.1]區間

2.Z-Score(正規化方法)標準化是基于原始數據的均值和標準差進行的標準化。


標準化之后的數據是以0為均值,方差為1的正態分布。需要注意的是:Z-Score方法是一種中心化方法,這會改變原有數據的分布結構,對于稀疏數據的處理不太適合。

z-score的簡單化模型:y=1/(1+x) ,x越大證明y越小,這樣就可以把很大的數規范在[0-1]之間了。

3.歸一化


注意該方法主要用于全部數據為正值的序列。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢