![08-分类评价指标_第1页](http://file4.renrendoc.com/view/05dfbc624388f1ab435275dd9fbd20a0/05dfbc624388f1ab435275dd9fbd20a01.gif)
![08-分类评价指标_第2页](http://file4.renrendoc.com/view/05dfbc624388f1ab435275dd9fbd20a0/05dfbc624388f1ab435275dd9fbd20a02.gif)
![08-分类评价指标_第3页](http://file4.renrendoc.com/view/05dfbc624388f1ab435275dd9fbd20a0/05dfbc624388f1ab435275dd9fbd20a03.gif)
![08-分类评价指标_第4页](http://file4.renrendoc.com/view/05dfbc624388f1ab435275dd9fbd20a0/05dfbc624388f1ab435275dd9fbd20a04.gif)
![08-分类评价指标_第5页](http://file4.renrendoc.com/view/05dfbc624388f1ab435275dd9fbd20a0/05dfbc624388f1ab435275dd9fbd20a05.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、分类模型的评价指标王秋月中国人民大学信息学院要求你为白血病的诊断构建一个分类器训练数据:1% 的样例患有白血病,99% 是健康的评价指标是预测精度:即预测正确的百分比精度指标的局限性要求你为白血病的诊断构建一个分类器训练数据:1% 的样例患有白血病,99% 是健康的评价指标是预测精度:即预测正确的百分比那么构建一个最简单的分类器,对所有输入都回答“健康”仍然可以达到99%的精度。精度指标的局限性现实中样本在不同类别的分布不平衡,导致精度不能很好地反应分类器的性能PredictedPositivePredictedNegativeActual PositiveTrue Positive (TP)
2、False Negative (FN)Actual NegativeFalse Positive (FP)True Negative (TN)混淆矩阵混淆矩阵(confusion matrix)可以展示各种类型的错误,能更好地描述模型的性能;从混淆矩阵中可计算出多种指标。PredictedPositivePredictedNegativeActual PositiveTrue Positive (TP)False Negative (FN)Actual NegativeFalse Positive (FP)True Negative (TN)Type II ErrorType I Error混
3、淆矩阵漏报误报PredictedPositivePredictedNegativeActual PositiveTrue Positive (TP)False Negative (FN)Actual NegativeFalse Positive (FP)True Negative (TN)Accuracy = TP + TNError = 1 - AccuracyTP + FN + FP + TN精度:预测正确的比例SensitivityTP + FNRecall or= TPPredictedPositivePredictedNegativeActual PositiveTrue Posit
4、ive (TP)False Negative (FN)Actual NegativeFalse Positive (FP)True Negative (TN)查全率或敏感度:识别出所有正例Precision = TPTP + FPPredictedPositivePredictedNegativeActual PositiveTrue Positive (TP)False Negative (FN)Actual NegativeFalse Positive (FP)True Negative (TN)查准率:识别出的都是正例Specificity = TN FP + TNPredictedPo
5、sitivePredictedNegativeActual PositiveTrue Positive (TP)False Negative (FN)Actual NegativeFalse Positive (FP)True Negative (TN)特异度:避免误报PredictedPositivePredictedNegativeActual PositiveTrue Positive (TP)False Negative (FN)Actual NegativeFalse Positive (FP)True Negative (TN)Accuracy =TP + TNPrecision
6、=TP + FN + FP + TN TPTP + FPRecall or SensitivityTP=Specificity =TP + FN TNFP + TNF1 = 2 xPrecision * RecallPrecision + Recall错误评价指标0.20.40.60.81.0Perfect ModelBetterRandom GuessWorse0.20.40.60.81.0False Positive Rate (1Specificity)取所有可能的阈值,计算(FPR, TPR)True Positive Rate (Sensitivity)受试者工作特征(Receive
7、r Operating Characteristic,ROC)曲线真正例率(TPR):在所有实际为阳性的样本中,被正确地判断为阳性之比率。假正例率(FPR):在所有实际为阴性的样本中,被错误地判断为阳性之比率。取所有可能的阈值,计算(FPR, TPR)0.20.40.60.81.00.20.40.60.81.0False Positive Rate (1Specificity)AUC 0.9AUC 0.75AUC 0.5True Positive Rate (Sensitivity)ROC曲线下面积(AUC)衡量ROC曲线下的面积衡量查准率与查全率之间的权衡P-R曲线Predicted Cla
8、ss 1Predicted Class 2Predicted Class 3Actual Class 1TP1ActualClass 2TP2Actual Class 3TP3多分类错误评价指标Predicted Class 1Predicted Class 2Predicted Class 3Actual Class 1TP1ActualClass 2TP2Actual Class 3TP3Accuracy =TP1 + TP2 + TP3Total多分类错误评价指标Predicted Class 1Predicted Class 2Predicted Class 3Actual Class
9、 1TP1ActualClass 2TP2Actual Class 3TP3Accuracy =TP1 + TP2 + TP3Total大部分多分类错误评价指标和二分类的类似只是扩展为求和取平均。多分类错误评价指标宏平均和微平均宏平均(Macro-averaging),先对每个类统计指标值,然后再对所有类求算术平均值。微平均(Micro-averaging),对数据集中每个实例不分类别进行统计,建立全局混淆矩阵,然后再计算相应指标。练习假设有10个样本,属于A、B、C三个类别。假设这10个样本的真实类别和预测的类别分别是:真实:A A A C B C A B B C预测:A A C B A C
10、 A C B C求出每个类别的P, R, 和F1求出宏平均P, R, 和F1求出微平均P, R, 和F1micro-F1=micro-precision=micro-recall = accuracy导入想用的评价指标函数:from sklearn.metrics import accuracy_score在测试集和预测得到的结果上计算指标值:accuracy_value = accuracy_score(y_test, y_pred)分类错误评价指标的语法导入想用的评价指标函数:from sklearn.metrics import accuracy_score在测试集和预测得到的结果上计算指标值:accuracy_value = accuracy_score(y_test, y_pred)分类错误评价指标的语法其他评价指标函数和检测工具:from sklearn.metrics import precision_score, recall_score,f1_score, roc_auc_score,confu
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年公司注销委托代理服务协议
- 2025年信用担保与抵押合同
- 2025年农副产品直销业务协议
- 2025年农业用地承包权抵债协议范本
- 2025年优惠协议价格
- 2025年会议室重构性合作协议
- 2025年光通信电缆项目规划申请报告范文
- 2025年信息安全集成项目合作协议
- 2025年个人财产抵押巨额借款合同示范文本
- 2025年企业电器租赁合同
- 湖北省普通高中2022-2023学年高一下学期学业水平合格性考试模拟化学(一)含解析
- 银行案件防控培训课件
- 装配式混凝土结构施工技术讲课课件
- 小型屠宰场可行性研究报告
- 急性呼吸道感染护理查房课件
- 物业品质检查标准及评分细则
- 密闭取芯完整
- 驾驶服务外包投标方案(完整版)
- 全日制普通高级中学体育教学大纲
- 2023年敬老院重阳节老年人活动策划方案通用
- 《Web前端综合实战》实训-课程标准
评论
0/150
提交评论