12213088朱绍军开题报告_第1页
12213088朱绍军开题报告_第2页
12213088朱绍军开题报告_第3页
12213088朱绍军开题报告_第4页
12213088朱绍军开题报告_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

经典word整理文档,仅参考,双击此处可删除页眉页脚。本资料属于网络整理,如有侵权,请联系删除,谢谢!北京交通大学毕业设计(论文)开题报告题目:受试者操作特征曲线的绘制与原理演示学院:电信专业:电子科学与技术学生姓名:朱绍军学号:12213088ROC是受试者工作特征(ReceiverOperatingCharacteristic)或相对工作特征(RelativeOperatingCharacteristic)的缩写。ROC分析技术于五十年代起源于统计决策理论,用来说明分类器命中率和误报警率之间的关系,最早在第二次世界大战中应用于雷达信号观察能力的评价,后来使用在晶体管的相关研究中。六十年代中期,ROC开始应用于实验心理学和心理物理学研究。Lusted在1988年首次提出了ROC分析可用于医疗决策评价,随后该方法广泛应用于医疗诊断性能的评价.最近,Swets等人为ROC分析技术进一步扩展到更广阔的公共领域提供了思路和建议。[1][2-5]Spackman将ROC分析技术引到机器学习领域中,并说明了ROC曲线的数值估计和比较算法。ROC分析技术在最近几年越来越多的应用到机器学习领域中。ROC分析技术不仅是一种通用图形化性能估计方法,更主要的是,ROC曲线的独特属性使它在类别,ROC曲线可以在多类ROC问题给出清楚的解释。ROC分析技术在类别分布、代价不敏感性、直观性[6]以及可理解性等方面的优势,足以使它能够代替传统的正确率成为更好的分类精度度量标准。目前,机器学习领域的研究者非常重视ROC分析技术。国外一些机器学习研究者根据实际需要扩展和改进了ROC分析技术。并在ROC分析的基础上改进并提出了一些新的方法。如ROC曲线是对分类性能的二维描述,为了能够直接比较多个分类器,希望将ROC曲线描述的分类器性能转换为一个数值来表示分类器的性能。一个通用的方法是计算ROC曲线下的面积(AreaUndertheROC,AUC)。其基本原理是:通过临界点(cutoffpoint/cutoffvalue)的移动,获得多对灵敏度(sensitivity)和误判率(1-Specificity(特异度)),以灵敏度为纵轴,以误判率为横轴,连接各点绘制曲线,然后计算曲线下的面积,面积越大,AUC的估计,ROC可以用来评价分类方法的性能。研究发现,使用大量的比较实验获得的AUC比正确率更适合作为分类评价标准。Hand和Till进而提出了一种简单的近似AUC的计算方法。[7]另外,ROC分析技术也被用来重新评估以前的机器学习方法,对于一些几乎是常识,我们一直认为精度的提高主要依靠于裁剪技术。但是在用AUC评估算法时,,一直认为NaiveBayes方法和决策树的方法不相伯仲。但是ROC分析研究表明NaiveBayes方1北京交通大学毕业设计(论文)开题报告,一些学者还针对与ROC分析在分类中的应用,提出了新的分裂标准,Smoothing方法,集成方法等。ROC总体性能标准,在最近几年越来越多的应用到机器学习领域中。ROC曲线对类别分布比例和错误代价不敏感性,使它在类别分布未知的领域和代价敏感学习中变得越来越重要。ROC分析技术已经广泛应用到处理两个类别分类器的性能评估中。在国内的科学研究实践中,ROC分析技术虽然在医疗领域已得到了广泛的应用,但是在其他应用领域还很少看到关于ROC的文献资料。因此引入和推广ROC分析技术是十分有必要的。2北京交通大学毕业设计(论文)开题报告理论基础:ROC(ReceiverOperatingCharacteristic)曲线,也就是受试者工作曲线,用于二分类判别效果的分析与评价。对于二值因变量模型,一般自变量为连续变量,因变量为二分类变量。灵敏度指将实际为真值的样本判断为真值的概率。特异度指将实际为假值的样本判断为假值的概率。误判率指将实际为假值的判断为真值的概率,其数值等于1-特异度。TNF和TPF分别代表正确诊断的真阳性和阴性病例所占比例;FPF和FNF分别代表部分未经正确诊断的真阳性和真阴性病例所占比例。(cutoffpoint/cutoffvalue)(sensitivity)和误判率(1-Specificity(特异度,以灵敏度为纵轴,以误判率为横轴,将绘成的曲线与45度对角线对比,若差不多重合,说明自变量对因变量的判断价值很差,若越远离45量可以较为准确地判断因变量。3、利用得到的数值绘制ROC曲线。预期成果:不同测试方式对应相同阈值求得的TPFTNFFPF并不完全一致。利用相应数据绘制的曲线也不重合,计算得到的AUC不一致。AUC大的测试方法较另一测试方法性能好。3北京交通大学毕业设计(论文)开题报告[1]VictorFroelicher,KaterinaShetlerandEuanAshley.Bet2terdecisionsthroughscience[J].CurrentProblemsinCar2diology,2003,28(11):589~620[2]Fawcett,T.&Provost,F.Combiningdataminingandmachinelearningforeffectiveuserprofiling[c].InSimo2udis,Han,&Fayyad(Eds.),ProceedingsontheSecondInternationalConferenceonKnowledgeDiscoveryandDataMining,MenloParkCA.AAAI~13[3]PeterFlach.ThemanyfacesofROCanalysisinmachinelearning[J].ICML’04tutorialonROCanalysis,2004,7,485~487[4]JinHuang,CharlesX.Ling.UsingAUCandAccuracyinEvaluatingLearningAlgorithms[c]-Appendices.IEEETrans.Knowl.DataEng.17(3):(2005).[5]Jin.Huang,J.Lu,andC.X.Ling.Comparingnaivebayes,decisiontrees,andsvmusingaccuracyandauc[C].InProceedingsofthe5rdInternationalConferenceonDataMining,(ICDM-2005),2005,653~656[6]C.Ferri,P.A.Flach,andJ.Hernandez-Orallo.LearningdecisiontreesusingtheareaundertheROCcurve[C].InProceedingsoftheNineteenthInternationalConferenceonMachineLearning(ICML~146[7]A.P.Bradley.TheuseoftheareaundertheROCcurveintheevaluationofmachinelearningalgorithms[J].Pat2ternRecognition,1997,~1159[8]MetzCE.BasicprinciplesofROCanalysis.SeminNuclMed1978;82:83-98[9]MetzCE.ReceiverOperatingCharacteristicsAnalysis:AToolfortheQuantitativeEvaluationofObserverPerformanceandImagingSystem.AmericanCollegeofRadiology2006[10]MetzCE.ROCanalysisinmedicali

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论