评价模型性能的指标_第1页
评价模型性能的指标_第2页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 4/4评价模型性能的指标 评价模型性能的指标有很多,目前应用最广泛的有准确度,灵敏度,特异性,马修相关系数。首先我们定义以下参数。 表2.1 预测结果的参数定义 符号 名称 描述 TP True position,真阳性 表示阳性样本经过正确分类之后被判为阳性 TN True negative,真阴性 表示阴性样本经过正确分类之后被判为阴性 FP False position,假阳性 表示阴性样本经过错误分类之后被判为阳性 FN False negative,假阴性 表示阳性样本经过错误分类之后被判为阴性 1.准确度:TP TN accuracy TP FP TN FN += + 准确度表示

2、算法对真阳性和真阴性样本分类的正确性 2.灵敏度: TP sencitivity TP FN = + 灵敏度表示在分类为阳性的数据中算法对真阳性样本分类的准确度,灵敏度越大表示分类算法对真阳性样本分类越准确。即被正确预测的部分所占比例。 3.特异性:TN specificity TN FP = + 特异性表示在分类为阴性的数据中算法对阴性样本分类的准确度,特异性越大表示分类算法对真阴性样本分类越准确。 4.马修相关系数: MCC = 马修相关系数表示算法结果的可靠性,其值范围为1,1?+,当FP 和FN 全为0时,MCC 为1,表示分类的结果完全正确;当TP 和TN 全为0时,MCC 值为1,

3、表示分类的结果完全错误。 ROC 曲线指受试者工作特征曲线 / 接收器操作特性曲线(receiver operating characteristic curve), 是反映敏感性和特异性连续变量的综合指标,是用构图法揭示敏感性和特异性的相互关系,它通过将连续变量设定出多个不同的临界值,从而计算出一系列敏感性和特异性,再以敏感性为纵坐标、(1特异性)为横坐标绘制成曲线,曲线下面积越大,诊断准确性越高。在ROC 曲线上,最靠近坐标图左上方的点为敏感性和特异性均较高的临界值。 ROC 曲线的例子 考虑一个二分问题,即将实例分成正类(positive)或负类(negative)。对一个二分问题来说,

4、会出现四种情况。如果一个实例是正类并且也被 预测成正类,即为真正类(True positive),如果实例是负类被预测成正类,称之为假正类(False positive)。相应地,如果实例是负类被预测成负类,称之为真负类(True negative),正类被预测成负类则为假负类(false negative)。 TP:正确肯定的数目; FN:漏报,没有正确找到的匹配的数目; FP:误报,给出的匹配是不正确的; TN:正确拒绝的非匹配对数; 列联表如下表所示,1代表正类,0代表负类。 预测 1 0 合计 实际 1 True Positive(TP) False Negative(FN) Actu

5、al Positive(TP+FN) 0 False Positive(FP) True Negative(TN) Actual Negative(FP+TN) 合计 Predicted Positive(TP+FP) Predicted Negative(FN+TN) TP+FP+FN+TN 从列联表引入两个新名词。其一是真正类率(true positive rate ,TPR), 计算公式为 TPR=TP/ (TP+ FN),刻画的是分类器所识别出的 正实例占所有正实例的比例。另 外一个是负正类率(false positive rate, FPR),计算公式为FPR= FP / (FP +

6、 TN),计算的 是分类器错认为正类的负实例占所有负实例的比例。还有一个真负类率(True Negative Rate,TNR),也称为specificity,计算公式为TNR=TN/ (FP+ TN) = 1FPR。 其中,两列True matches和True nonmatch分别代表应该匹配上和不应该匹配上 的 两行Pred matches和Pred nonmatch分别代表预测匹配上和预测不匹配上的 在一个二分类模型中,对于所得到的连续结果,假设已确定一个阀值,比如 说 0.6,大于这个值的实例划归为正类(阳性),小于这个值则划到负类(阴性)中。 如果减小阀值,减到0.5,固然能识别出

7、更多的正类,也就是提高了识别出的正 例占所有正例 的比类,即TPR,但同时也将更多的负实例当作了正实例,即提高 了FPR。为了形象化这一变化,在此引入ROC,ROC曲线可以用于评价一个分类 器。 ROC曲线和它相关的比率 (a)理想情况下,TPR应该接近1,FPR应该接近0。 ROC曲线上的每一个点对应于一个threshold,对于一个分类器,每个threshold 下会有一个TPR和FPR。 比如Threshold最大时,TP=FP=0,对应于原点;Threshold最小时,TN=FN=0,对 应于右上角的点(1,1) P和N得分不作为特征间距离d的一个函数,随着阈值theta增加,TP和F

8、P都增加 Receiver Operating Characteristic,翻译为接受者操作特性曲线,够拗口的。曲线由两个变量1specificity 和 Sensitivity绘制. 1specificity=FPR,即负正类率。Sensitivity即是真正类率,TPR(True positive rate),反映了正类覆盖程度。这个组合以1specificity对sensitivity,即是以代价(costs)对收益(benefits)。 此外,ROC曲线还可以用来计算“均值平均精度”(mean average precision),这是当你通过改变阈值来选择最好的结果时所得到的平均精

9、度(PPV). 下表是一个逻辑回归得到的结果。将得到的实数值按大到小划分成10个个数 相同的部分。 Percentile 实例数 正例数1特异度(%)敏感度(%) 10 6180 4879 2.73 34.64 20 6180 2804 9.80 54.55 30 6180 2165 18.22 69.92 40 6180 1506 28.01 80.62 50 6180 987 38.90 87.62 60 6180 529 50.74 91.38 70 6180 365 62.93 93.97 80 6180 294 75.26 96.06 90 6180 297 87.59 98.17 100 6177 258 100.00 100.00 其正例数为此部分里实际的正类数。也就是说,将逻辑回归得到的结 果按从大到小排列,倘若以前10%的数值作为阀值,即将前10%的实例都划归为正类

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论