熱線電話:13121318867

登錄
首頁大數據時代關于混淆矩陣(Confusion Matrix)概念的分析和理解
關于混淆矩陣(Confusion Matrix)概念的分析和理解
2020-07-08
收藏

混淆矩陣(confusion matrix),又被叫做錯誤矩陣(error matrix)。矩陣的每一列代表分類器對于樣本的類別預測,矩陣的每一行代表版本所屬的真實類別。

混淆矩陣‘這個名字來源于,它能夠很容易的看到機器學習是否將樣本的類別給混淆了(也就是一個class被預測成另一個class)。

混淆矩陣就是為了進一步分析性能而對該算法測試結果做出的總結,現在假設有一個用來對貓(cats)、狗(dogs)、兔子(rabbits)進行分類的系統,共有 27 個動物樣本:8只貓, 6條狗, 13只兔子。混淆矩陣如下圖:

在預測分析中,混淆矩陣,表現為由false positives,false negatives,true positives和true negatives而組成的兩行兩列的表格。它允許我們做出除了正確率之外的,更多的分析。

說明一下概念:

真陽性,即 True Positive(TP): 真實為0.預測也為0

真陰性,即 False Negative(FN): 真實為0.預測為1

假陽性 ,即False Positive(FP): 真實為1.預測為0

假陰性,即 True Negative(TN): 真實為1.預測也為1

混淆矩陣延伸出的各個評價指標:

1.正確率(Accuracy):被正確分類的樣本比例或數量

Accuracy=(TP+TN)/Total

2.錯誤率(Misclassification/Error Rate):被錯誤分類的樣本比例或數量

Misclassification/Error Rate)=(FP+FN)/Total

3.真陽率(True Positive Rate)也叫敏感度(sensitivity)或召回率(recall):分類器預測為正例的樣本占實際正例樣本數量的比例,描述了分類器對正例類別的敏感程度。

True Positive Rate=TP/ actual yes

4.假陽率(False Positive Rate):分類器預測為正例的樣本占實際負例樣本數量的比例。

False Positive Rate=FP/actual no

5.特異性(Specificity):真實為1的準確率

Specificity=TN/actual no

6. 精度(Precision):在所有判別為正例的結果中,真正正例所占的比例,即預測為0的準確率。

Precision=TP/predicted yes

7.流行程度(Prevalence):正例在樣本中所占比例。

Prevalence=Actual Yes/Total

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢