熱線電話:13121318867

登錄
首頁大數據時代偏態數據:何為數據的偏態分布?
偏態數據:何為數據的偏態分布?
2020-06-29
收藏

相信大家在一定有接觸過偏態分布這一概念,在統計學偏態分布,是指統計數據峰值與平均值不相等的頻率分布。根據峰值小于或大于平均值可分為正偏函數和負偏函數,其偏離的程度可用偏態系數刻畫。在數據預處理過程中,根據頻數分布狀態不同,有正態分布偏態分布之分。

正態分布是指多數頻數集中在中央位置,兩端的頻數分布大致對稱。

偏態分布是指頻數分布不對稱,集中位置偏向一側。偏態分布又可以分為以下幾種情況:

1.正偏態分布:集中位置偏向數值小的一側,或者也可以說頻數分布的高峰向左偏移,長尾向右側延伸稱為正偏態分布,也稱右偏態分布;

2.負偏態分布:集中位置偏向數值大的一側,或者也可以說頻數分布的高峰向右偏移,長尾向左延伸則成為負偏態分布,也稱左偏態分布。

總結來說就是:

峰左移,右偏,正偏

峰右移,左偏,負偏

正態分布的情況下,眾數=中位數= 平均數

偏態分布情況下,相當于在正太分布的基礎上增加了很大的異常值,因為異常值對均值影響大,對中位數影響小、對眾數無影響,所以:

偏態分布(負偏態)情況下,平均數<中位數<眾數

總體分布呈右偏態狀態,存在極大值,平均值向極大值方向偏移

偏態分布(正偏態)情況下,眾數<中位數<平均數

總體分布呈左偏態狀態,存在極小值,平均值向極小值方向偏移

數據整體服從正態分布,那樣本均值和方差則相互獨立。正態分布具有很多好的性質,很多模型假設數據服從正態分布。因此構建模型時要盡量將偏態數據轉換為正態分布數據

想深入學習統計學知識,為數據分析筑牢根基?那快來看看統計學極簡入門課程!

學習入口:https://edu.cda.cn/goods/show/3386?targetId=5647&preview=0

課程由專業數據分析師打造,完全免費,60 天有效期且隨到隨學。它用獨特思路講重點,從數據種類到統計學體系,內容通俗易懂。學完它,能讓你輕松入門統計學,還能提升數據分析能力。趕緊點擊鏈接開啟學習,讓自己在數據領域更上一層樓!

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢