关于混淆矩阵(Confusion Matrix)概念的分析和理解-CDA数据分析师官网

关于混淆矩阵(Confusion Matrix)概念的分析和理解

2020-07-08

混淆矩阵(confusion matrix)，又被叫做错误矩阵(error matrix)。矩阵的每一列代表分类器对于样本的类别预测，矩阵的每一行代表版本所属的真实类别。

’混淆矩阵‘这个名字来源于，它能够很容易的看到机器学习是否将样本的类别给混淆了(也就是一个class被预测成另一个class)。

混淆矩阵就是为了进一步分析性能而对该算法测试结果做出的总结，现在假设有一个用来对猫(cats)、狗(dogs)、兔子(rabbits)进行分类的系统，共有 27 个动物样本：8只猫， 6条狗， 13只兔子。混淆矩阵如下图：

在预测分析中，混淆矩阵，表现为由false positives，false negatives，true positives和true negatives而组成的两行两列的表格。它允许我们做出除了正确率之外的，更多的分析。

说明一下概念：

真阳性，即 True Positive(TP): 真实为0.预测也为0

真阴性，即 False Negative(FN): 真实为0.预测为1

假阳性，即False Positive(FP): 真实为1.预测为0

假阴性，即 True Negative(TN): 真实为1.预测也为1

混淆矩阵延伸出的各个评价指标：

1.正确率(Accuracy)：被正确分类的样本比例或数量

Accuracy=(TP+TN)/Total

2.错误率(Misclassification/Error Rate)：被错误分类的样本比例或数量

Misclassification/Error Rate)=(FP+FN)/Total

3.真阳率(True Positive Rate)也叫敏感度(sensitivity)或召回率(recall)：分类器预测为正例的样本占实际正例样本数量的比例，描述了分类器对正例类别的敏感程度。

True Positive Rate=TP/ actual yes

4.假阳率(False Positive Rate)：分类器预测为正例的样本占实际负例样本数量的比例。

False Positive Rate=FP/actual no

5.特异性(Specificity)：真实为1的准确率

Specificity=TN/actual no

6. 精度(Precision)：在所有判别为正例的结果中，真正正例所占的比例，即预测为0的准确率。

Precision=TP/predicted yes

7.流行程度(Prevalence)：正例在样本中所占比例。

Prevalence=Actual Yes/Total

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试详情；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试详情；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

混淆矩阵召回率机器学习

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇python数据挖掘的基本任务是什么？

下一篇召回率(Recall)与精确率(precision)的区别在哪里？怎样进行衡量

关于混淆矩阵(Confusion Matrix)概念的分析和理解

CDA考试动态

CDA报考指南

热门栏目

最新资讯

【CDA持证人干货分享】13年国企财务：如何借助DeepS ...

【CDA持证人案例分享】Excel动态报表设计：基于业务 ...

【CDA干货】字节大佬：如何通过动态分级快速提升转 ...

Windows 系统和 MacOS 系统下的 Anaconda 安装教程 ...

数据运营的工作内容、技能要求及发展前景 ...

【干货】字节大佬：教培行业销售运营全景作战地图【 ...

四大一线城市约50%人口租房，数据分析能挖出哪些 “ ...

Python 实战案例 —RFM 客户价值分析模型 ...

【案例】奥利奥坚果新品与蒙牛“数字牧场”的成功经 ...

美关税政策下的全球金融市场动荡：深度数据分析与洞 ...

【重磅】苹果捐赠3000万给浙大这专业，透露未来就业 ...

非专业，怎么才能证明自己的数据分析能力？ ...

保姆级教程！一文读懂数据分析师的职业发展路径 ...

【干货】用DeepSeek三步骤搞定Excel数据清洗，效率 ...

被统计公式劝退？这门极简课程让你14天学会用Python ...

【干货】如何用RFM模型精准识别高价值客户？ ...

CDA数据分析师就业班3月29日开班，仅剩1个名额 ...

【案例】网飞Netflix流量漏斗分析案例 ...

tensorflow_datasets 如何load本地的数据集？ ...

《CDA二级教材》试读版上线CDA网校，助你轻松拿下二 ...