熱線電話:13121318867

登錄
首頁精彩閱讀 K近算法之巴氏距離
K近算法之巴氏距離
2014-11-30
收藏

 K近算法之巴氏距離

  • 巴氏距離(Bhattacharyya Distance),在統計中,Bhattacharyya距離測量兩個離散或連續概率分布的相似性。它與衡量兩個統計樣品或種群之間的重疊量的Bhattacharyya系數密切相關。Bhattacharyya距離和Bhattacharyya系數以20世紀30年代曾在印度統計研究所工作的一個統計學家A. Bhattacharya命名。同時,Bhattacharyya系數可以被用來確定兩個樣本被認為相對接近的,它是用來測量中的類分類的可分離性。
(1)巴氏距離的定義
對于離散概率分布 p和q在同一域 X,它被定義為:
其中:
是Bhattacharyya系數。
對于連續概率分布,Bhattacharyya系數被定義為:
這兩種情況下,巴氏距離并沒有服從三角不等式.(值得一提的是,Hellinger距離不服從三角不等式)。 
對于多變量的高斯分布 ,
,

和是手段和協方差的分布。
需要注意的是,在這種情況下,第一項中的Bhattacharyya距離與馬氏距離有關聯。 
(2)Bhattacharyya系數
Bhattacharyya系數是兩個統計樣本之間的重疊量的近似測量,可以被用于確定被考慮的兩個樣本的相對接近。
計算Bhattacharyya系數涉及集成的基本形式的兩個樣本的重疊的時間間隔的值的兩個樣本被分裂成一個選定的分區數,并且在每個分區中的每個樣品的成員的數量,在下面的公式中使用
考慮樣品a 和 b ,n是的分區數,并且,被一個 和 b i的日分區中的樣本數量的成員。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢