2018-11-20
閱讀量:
1157
分布特征、其他趨勢的描述指標
除了以上兩大基本趨勢外,隨著對數據特征了解的逐步深入,研究者常常會提出假設, 認為該數據所在的總體應當服從某種分布。那么,針對每一種分布類型,都可以由一系列 的指標來描述數據偏離分布的程度。例如對正態分布而言,偏度系數和峰度系數可以用來 反映當前數據偏離正態分布的程度。相對而言,這些分布指標使用得較少。 由于假定的分布不同,所使用的分布特征描述指標也會有所差異,這里我們只簡單介 紹和正態分布有關的偏度系數及峰度系數的概念。 偏度(Skewness):用來描述變量取值分布形態的統計量,指分布不對稱的方向和程 度。樣本的偏度系數記為 g1,偏度是與正態分布相比較而言的統計量。g1>0 分布 為正偏或右偏,即長尾在右,峰尖偏左;g1<0 分布為負偏或左偏,即長尾在左, 峰尖偏右;g1=0 分布為對稱狀態。 峰度(Kurtosis):用來描述變量取值分布形態陡緩程度的統計量,是指分布圖形的 尖峭程度或峰凸程度。樣本的峰度系數記為 g2。峰度也是與正態分布相比較而言 的統計量,g2>0 即峰的形狀比較尖,比正態分布峰要陡峭;g2<0 即形狀比正態分 布平坦;g2=0 分布為正態峰。 除上述幾類指標外,統計描述中還可能需要描述一些上文未提到的數據趨勢,比如數 據呈單峰還是雙峰分布,數據是否存在極端值等,常用的有專門針對異常值數據進行描述 的極端值(Outlier)列表等。






評論(0)


暫無數據
推薦帖子
0條評論
0條評論
0條評論