ROC曲线的统计学试验报告_第1页
ROC曲线的统计学试验报告_第2页
ROC曲线的统计学试验报告_第3页
ROC曲线的统计学试验报告_第4页
ROC曲线的统计学试验报告_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

上海大学2014?2015学年秋季学期研究生课程报告课程名称:生物医学测量及仪器课程编号:07SBE7002论文题目:基于甲胎蛋白诊断肝癌的ROC曲线绘制及AUC计算研究生姓名:廖小金学号:14723542论文评语:成绩:任课教师: 成绩:任课教师: 评阅日期:摘要在检验某一物质对疾病的诊断效果时,ROC曲线是一个重要的统计学分析方法。其以真阳率作为纵坐标,假阳率作为横坐标,随诊断临界值的移动而形成一条连续的曲线。曲线下的面积AUC是判断诊断效果的一个依据,面积越接近于1效果越好。显著性差异可以帮助判断样本是否来自同一总体,也可以因此评价诊断方法的效果。AbstractIntheexaminationoftheeffectofasubstanceforthediagnosisofadisease,ROCcurveisasignificantstatisticanalysis.Itsetthetruepositiverateasordinate,thefalsepositiverateasthehorizontalaxis,andformsacontinuouscurvewiththechangeofdiagnosticthreshold.AUCareaunderthecurveisaparameterforjudgingtheeffectofdiagnosis,andthemoreitclosesto1,thebettereffectitimplies.Significantdifferencecanhelpjudgewhetherthesamplesarefromthesamepopulation,andthereforecanalsoevaluatetheeffectivenessofthediagnosticmethod.第一章概论20微克/20微克/升。但当肝白从血液中消失,因此正常人血清中甲胎蛋白的含量尚不到细胞发生癌变时,却又恢复了产生这种蛋白质的功能,而且随着病情恶化它在血清中的含量会急剧增加,甲胎蛋白就成了诊断原发性肝癌的一个特异性临床指标。过去一直认为是诊断原发性肝癌的特异性肿瘤标志物,具有确立诊断、早期 诊断、鉴别诊断的作用。大量的临床却发现,部分肝硬化病人会长期出现AFP达到上千,但多年都没有肝癌的迹象;同时发现约 20%勺晚期肝癌病人,直至病故前,AFP仍不超过10。也就是说,尽管甲胎蛋白是检验肝癌的有效的指标,但肝癌患 者不一定甲胎蛋白检验呈阳性(80%呈阳性),而AFP检验呈阳性的人也不一定是肝癌患者。这就涉及到对诊断试验评价的问题,我们课程中所学的假设检验、ROC曲线绘制及AUC计算正是针对这类问题的方法之一。诊断试验的评价指标显著性差异显著性差异是检验假设是否合理的一个方法。例如在本项目中,用甲胎蛋白作为肝癌的诊断指标,若这两组实际数据有显著性差异,基于此,它们所来自的各自的总体不具有显著性差异的概率p是多少?p达到一个足够小的值时,认为总体具有显著性差异,以此说明甲胎蛋白作为诊断指标是一个有力的依据。一般取这个足够小的值为0.05或0.01,本项目中取0.05。ROC曲线Tint已PnH、ptHhisizixJTmePDSiiiVCfiRaisePositivesul:i小NFalseNcaalivcsTrueNefColumntotals:如上图所示,在评价诊断试验时,患者中被诊断试验正确判断为阳性的比例亦叫真阳性率(truepositiverate,TPR),也称灵敏度;非患者中被诊断试验正确判断为阴性的比例亦叫真 阴性率(truenegativerate,TNR),也称特异性;患者被诊断试验错误地判断为阴性的比例称为 假阴性;非患者被错误地诊断为阳性的比例称为假阳率。而 ROC曲线是以灵敏度为纵轴,假阳率为横轴,通过不同的诊断临界值的移动绘制而成的曲线。多条曲线进行比较时,曲线下 的面积越大,说明诊断越准确。将绘成的曲线与斜 45度的直线对比,若差不多重合,说明自变量对因变量的判定价值很差,若越远离斜45度的直线,说明自变量对因变量的判定价值越好。分析单个曲线时,越靠近左上角的点所对应的诊断临界值越好,例如本项目中的。1.3项目数据:测得正常人及肝病患者的甲胎蛋白 (AFP)水平如下,分作两组(肝癌、非肝癌)。肝癌组(17人,ug/L):5.2,3.2,20.7,40.2,50.2,100.7,1030.2,800.7,400.5,90.2,19.3,32.1,8.4,25.3,83.8,37.4非肝癌组(20人,ug/L):0.8,1.5,3.2,10.7,20.8,21.4,5.2,2.3,7.2,4.3,9.2,15.1,3.4,5.1,5.6,6.2,22.3,25.2,18.2检验肝癌组与非肝癌组的甲胎蛋白水平是否有显著性差异。绘制用AFP诊断肝癌的ROC曲线,并计算曲线下面积(AUC),确定最优的诊断临界值第二章判断显著性差异2.1正态检验lillietest显著性差异的检验有多种方法,其中常见的t检验是针对正态分布的检验,而我们的两组数据并不能确定是服从正态分布,因此需要先进行正态分布检验。利用Lillieforstest函数:[H,P,LSTAT,CV]=lillietest(A);[h,p,lstat,cv]=lillietest(B);结果显示H=1,h=1,说明这两组数据不服从正态分布,因此不能用 t检验而选用Kruskal-Wallis秩和检验秩和检验调用Kruskal-Wallis函数p=kruskalwallis(C,group,'off);结果显示p=3.8332e-04,p<0.05,两组数据所来自的总体有显著性差异。

第三章ROC曲线与最优临界值在本项目的数据中,AFP的分布范围是0.8-1030.2,那么假设临界值的范围取为0-1100又因数据中不个体的AFP差值最小为0.1,故取递增间隔为0.1。用trapz函数绘制ROC曲线。结果如下图所示。11ROC曲线图11I i iJDOO&~q e—ef090.907; ?(: ~e_e—©u%05-004<i◎2QQG?u◎2QQG?u3210ooo1 ■ ■ ■ ■ i i ・ i01 0.2 03 0.4 0.5 06 07 0.8 0.9 1花特异性(%)则诊断效果越好。程序如下:zc=ya-xb;max=1;fori=1:Lenif(abs(zc(i))>abs(zc(max)))max=i;w=i;endendholdon;plot(xb(w),ya(w),'b*');25.2ug/L.得到的最优诊断临界值是

25.2ug/L.第四章使用SPSS输入数据:AFP15201.0023.201.00320701.004口40.201005二50.201.006100701.0011030.201008800701.009n400.5010010口90.201.001119.301.00126.201001332.101.0014n8.401.0015二25.301.001663.801.0017H37.401.001880200191.502.0020口3.202.002110.702002220.802.002321402003.1正态检验

假设检验汇总原假设测试Sig.1鑑W霍級平均值为单样本Kolmogorov-Smirnov检脸.000葩继原假设.显拆渐进也苦牲。楚署件木半足一 053.2显著性差异检验用Mann-WhitneyU检验:假设检验汇总原假谡测试Sig-1AFP的分布在组类别上相同.独立样本Mann-WhitneyU检監000抱绝原假设.显乔渐进显署性-显唐性水严足』乩两组之间有显著性差异。3.3绘制ROC?线并计算AUCROCROC曲线»1少AFP»1少AFP状态娈量( 晶组狀态賁量的值世):[ ]检绘夷童QX迭顶@.一輸出輸出4ROC曲线带对角参考线-标准谋和畫信区间逅}0ROC曲线的坐标点(C)结果:ROC曲绒曲线下的面积检验结果变量:AFP面积标准误a渐进Sig*渐近95%置信区间下限上限.843.068.000.710.976检验结果变量:AFP在正的和负的实际状态组之间至少有一个 结。统计量可能会岀现偏差。在非参数假设下零假设:实面积=0.5第四章结论与总结由第一步检验显著性差异可以知道,这两组数据存在显著性差异,说明甲胎蛋白用于诊断肝癌是有一定可靠性的。由ROC曲线计算所得的面积AUC>0.5并且接近于1,可知诊断效果较好。计算真阳率和假阳率之差得到本项目中最优诊断临 界值是25.2ug/L。在本项目实践中,学习了利用MATLAB?程和SPSS软件进行统计分析,收获不少。统计学分析的方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论