熱線電話:13121318867

登錄
首頁大數據時代評估機器學習模型的指標:召回率,精確率和F值
評估機器學習模型的指標:召回率,精確率和F值
2020-07-27
收藏

機器學習中、完成建模之后,我們需要對模型的效果做評價,而召回率、精確率和F值就是評估機器學習模型的三大重要指標。

一、基本概念

True Positive(真正,TP):將正類預測為正類數

True Negative(真負,TN):將負類預測為負類數

False Positive(假正,FP):將負類預測為正類數誤報 (Type I error)

False Negative(假負,FN):將正類預測為負類數→漏報 (Type II error)

二、召回率

召回率,recall, 也就是正確預測為正的占全部實際為正的比例(真正正確的占所有實際為正的比例)。是針對原樣本來說的,其含義是在實際為正的樣本中被預測為正樣本的概率。

準確率和召回率互相影響,理想狀態下肯定追求兩個都高,但是實際情況是兩者相互“制約”:追求準確率高,則召回率就低;追求召回率高,則通常會影響準確率。

三、精確率

精確率precision,也叫查準率, 也就是正確預測為正的占全部預測為正的比例,(真正正確的占所有預測為正的比例)。針對預測結果而言的,其含義是在被所有預測為正的樣本中實際為正樣本的概率。

四、F值(F-Measure)

1.精確率P和召回率R指標有時候會出現的矛盾的情況,這樣就需要綜合考慮他們,最常見的方法就是F值,也就是F-Measure(又稱為F-Score)。

F-Measure是一種統計量,又稱F-Score,也是精確率(Presicion)和召回率(Recall)的加權調和平均,常用于評價分類模型的好壞。

當參數α=1時,就是最常見的F1.也即

可知F1綜合了P和R的結果,當F1較高時則能說明試驗方法比較有效。

2.E值

E值表示P和R的加權平均值,當其中一個為0時,E值為1.其計算公式:

b越大,表示查準率的權重越大。

五、P-R曲線

對模型進行評估,不能僅靠精確率或者召回率,最好構建多組精確率和召回率,繪制出模型的P-R曲線。

P-R曲線的橫軸是召回率,縱軸是精確率。P-R曲線上的一個點代表著,在某一閾值下,模型將大于該閾值的結果判定為正樣本,小于該閾值的結果判定為負樣本,此時返回結果對應的召回率和精確率。整條P-R曲線是通過將閾值從高到低移動而生成的。原點附近代表當閾值最大時模型的精確率和召回率。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢