熱線電話:13121318867

登錄
首頁精彩閱讀產品運營數據分析:數據分組統計公式
產品運營數據分析:數據分組統計公式
2016-01-23
收藏

產品運營數據分析:數據分組統計公式

第一步確定組數

一組數據分多少組合適呢?一般與數據本身的特點及數據的多少有關。

如組數太少,數據的分布就會過于集中,組數太多,數據的分布就會過于分散,這都不便于觀察數據分布的特征和規律。組數的確定應以能夠顯示數據的分布特征和規律為目的。

可以按美國人斯特杰斯(Sturges)提出的經驗公式來確定組數K:

數據分析

K:組數
n: 數據個數
ln(n):㏑即自然對數,以e為底數的對數通常用于㏑;以e為底數, e約等于2.71828…….

數據分析師為方便大家進行數據分組,這里計算了從10個數據到1千萬條數據的分組個數,供大家參考。

需要注意的是,這僅僅是分組理論,在實際的分組中,還需要觀察數據,摸清數據分布規律,可以根據統計分析實際情況進行調整,組數過多,也不利于做進一步的統計分析。

數據分析

第二步確定組距

確定各組的組距。組距是一個組的上限與下限的差,可根據全部數據的最大值和最小值(即極差)及所分的組數來確定,公式如下:

Excel公式

例如,最大值為100,最小值為30,則組距=(100-30)÷8=8.75 ,可以近似取到10。

第三步 分組

明確兩個分組原則:

窮盡原則

使總體中的每一個單位都應有組可歸,或者說各分組的空間足以容納總體所有的單位。

互斥原則

在特定的分組標志下,總體中的任何一個單位的只能歸屬于某一組,而不能同時或可能歸屬于幾個組。

上面的數據,最大值為100,最小值為30,組距是10,那么分組可能是:最小值——40,41——50,51——60……如此類推。數據分析師培訓


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢