關于混淆矩陣(Confusion Matrix)概念的分析和理解-CDA數據分析師官網

熱線電話：13121318867

登錄

首頁大數據時代關于混淆矩陣(Confusion Matrix)概念的分析和理解

關于混淆矩陣(Confusion Matrix)概念的分析和理解

2020-07-08

收藏

混淆矩陣(confusion matrix)，又被叫做錯誤矩陣(error matrix)。矩陣的每一列代表分類器對于樣本的類別預測，矩陣的每一行代表版本所屬的真實類別。

’混淆矩陣‘這個名字來源于，它能夠很容易的看到機器學習是否將樣本的類別給混淆了(也就是一個class被預測成另一個class)。

混淆矩陣就是為了進一步分析性能而對該算法測試結果做出的總結，現在假設有一個用來對貓(cats)、狗(dogs)、兔子(rabbits)進行分類的系統，共有 27 個動物樣本：8只貓， 6條狗， 13只兔子。混淆矩陣如下圖：

在預測分析中，混淆矩陣，表現為由false positives，false negatives，true positives和true negatives而組成的兩行兩列的表格。它允許我們做出除了正確率之外的，更多的分析。

說明一下概念：

真陽性，即 True Positive(TP): 真實為0.預測也為0

真陰性，即 False Negative(FN): 真實為0.預測為1

假陽性，即False Positive(FP): 真實為1.預測為0

假陰性，即 True Negative(TN): 真實為1.預測也為1

混淆矩陣延伸出的各個評價指標：

1.正確率(Accuracy)：被正確分類的樣本比例或數量

Accuracy=(TP+TN)/Total

2.錯誤率(Misclassification/Error Rate)：被錯誤分類的樣本比例或數量

Misclassification/Error Rate)=(FP+FN)/Total

3.真陽率(True Positive Rate)也叫敏感度(sensitivity)或召回率(recall)：分類器預測為正例的樣本占實際正例樣本數量的比例，描述了分類器對正例類別的敏感程度。

True Positive Rate=TP/ actual yes

4.假陽率(False Positive Rate)：分類器預測為正例的樣本占實際負例樣本數量的比例。

False Positive Rate=FP/actual no

5.特異性(Specificity)：真實為1的準確率

Specificity=TN/actual no

6. 精度(Precision)：在所有判別為正例的結果中，真正正例所占的比例，即預測為0的準確率。

Precision=TP/predicted yes

7.流行程度(Prevalence)：正例在樣本中所占比例。

Prevalence=Actual Yes/Total

CDA數據分析師考試相關入口一覽（建議收藏）：

? 想報名CDA認證考試，點擊>>> “CDA報名” 了解CDA考試詳情；

? 想學習CDA考試教材，點擊>>> “CDA教材” 了解CDA考試詳情；

? 想加入CDA考試題庫，點擊>>> “CDA題庫” 了解CDA考試詳情；

? 想了解CDA考試含金量，點擊>>> “CDA含金量” 了解CDA考試詳情；

混淆矩陣召回率機器學習

數據分析咨詢請掃描二維碼

若不方便掃碼，搜微信號：CDAshujufenxi

上一篇python數據挖掘的基本任務是什么？

下一篇召回率(Recall)與精確率(precision)的區別在哪里？怎樣進行衡量

數據分析師考試動態

考試介紹
考試大綱
考試內容
考試地點

CDA報考指南

報考流程
考試時間
報名費用
聯系我們

數據分析學習

數據分析師資訊

更多

Copyright © 2015-2021, www.ruiqisteel.com All Rights Reserved. CDA數據分析師(北京國富如荷網絡科技有限公司) 版權所有京ICP備11001960號-9

京公網安備 11010802034615號經營許可證編號：京B2-20210330

聯系電話：13321103290 (微信同號)

OK

免費資料
免費試聽
訂制課程
職業規劃
認證考試

客服在線

日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码

客服在線

立即咨詢

免密碼登錄

提交首次登錄驗證后自動注冊