非参数法估计ROC曲线下面积_第1页
非参数法估计ROC曲线下面积_第2页
非参数法估计ROC曲线下面积_第3页
非参数法估计ROC曲线下面积_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

非参数法估计ROC曲线下面积第I川军I欠人7卩.生统计7教研电宇传华徐勇勇ROC是受试者匸作特征(ReceiverOperatingCharacteristic)的缩ROC曲线及ROC曲线卜■而积可作为某…诊断方法准确性评价的指标;通过对同疾病的多种诊断试验分析比较,这些指标可帮助临床医生筛选出最佳诊断力案叭对于ROC曲线的构建及其实际临床意义,文献2已作了详细介绍,木文将采用实例数据兵体介绍如何利用简单、实用的非参数法估计与比较ROC曲线下面积。一、ROC曲线下而积的计算”£/=!1O木文所指的“诊断”是泛拆果対彖(如人、仪器、设备、试剂、方法等[对某确定事件作出是正常还是异常(无病还绘冇病、噪音还是苗号等〉判断的过程。假设匸常组冇g个观察值,记为<j=1.2.-.nn);界常组冇几个观察值,记为小(=12…,叩。如果观察值人为丹常,根WilcoxonMannWhitney统汁品R()C曲钱卜而积(A”£/=!1O<//7-z.V<//7-z.V该公式为叫个%与心个*竹比较,如果前者人J:后者则比较结果为1,和等时为().5,否则为0,将i^Xn,.个比较结果相加取平均即得禺。如果观察值小为界常,则改变公式中的大于与小于符号即可。Az的标准i吴可采用公式:Wz)=爲(1-“Z)+Sa-1)©-4^)+仇-1)©-為?)Wz)=%®计算。其中SE(Az)为Az的标准误,Q、是两个随机选择的界常组观察值比…个随机选择的疋常组观察值都将冇更大可能分类为并常的概率。Q是个随机选择的界常组观察值比两个随机选择的止常组观察値将冇更人可能分类为界常的概率。得出的ROC曲线卜面积是否与完全随机俏况下获得的Az().5仃统计学经界,可采用公式2=«_0.5作检验。乙是止态离差值,查iE态分布表,可得HP值,如z=1.96,P=0.05。SE(每)根据Az±uaSE(Az)可计算«的1()()(!-«>%可信区间,这电%为标准匚态分位数。卜•而以分类资料和计吊:资料数据分别说明计算的具体实现方法。1.分类资料:放射*影像评价…般将诊断结果分成5至6类,如按疔定止常、可能止常、杲常可疑、可能开常和肯定杲常分别分为1>2、3、4>5五类,然后由放射I矢生将已知诊断结果的影像分到各类中,根据分类情况,可评价该页生的诊断能力。表1的第1和2行是某医生对疋常组193份,并常组41份影像资料诊断为某种疾病的分类结果。第3行是界常组人「该分类的影像份数・它筲于界常组总例数减该类及以卞影像份数的和c第4行是匸常组小于该分类的影像份数,它等于止常组该类以卜•影像份数的和。第5、6>7行利用第1〜4行数据及相应备行所列公式,分别计算出ROC曲线卜■而积Az=77.97%、Q}=0.6624和Q2=0.6629,具体结果分别见表山将这些结果及na=41=r^=193代入⑴式,得弘仏)(HM03o第5、6>7行所歹L公式Lllfkuilcy和McNeil根拯分类资料捉即叫「这些公式门戚.仏、0和心的i…筋表1 分类资科的厶、0和。购L算筍号内容分:类说明145 汁订1疋常组0)35684912IMIL.址本数据2后常组(為)238小124111:|基本数据3异常汁分类较丿、393628120叫=41连减第2廿(yj4匸常纠.分类较小||35103152181第If.勳」至町(yj5 厂2ZI4IIC25501568580726170.lz=<ril7(n:1nL)=0.7797&电(y/+备儿5601195676504375762149190i=件计4叩吒=0-6624十3 \ )7 『十站-i\:iHI7154391316514446774W7721012356Q2=-M'il7(nann2尸05629z检验得】E态分布统计mI:^(0.7797-0.5)/0.0403=6.9304-和应的P=0.00()0oAz的95忆可信区间为(0.70060358S)-不包括0.5,结果表明该放射医生的诊断分类较好。2.让吊资料:采川骨髓诊断作为金标肚,对rloo例可疑为缺铁性卸仏患者作诊駅将诊断结果为映铁性贫』L的34例作为异常纽,其余砧例作为|強生,然后对每组的每一例测量红细胞平均容秩(MCV)・其测盾值列1;表2。表] 红酣胞T均容匚卅骨躺诊斷MCV.[[-:常泪60666871717374747476777777777878也.)79798081HISIX2芒£838384S4S4858f)8687厲88if)豁的SO9091'■)29393泪帥949&9798100103异常殂5258626567686971727273737475767777J7879sogo81HlSI82S384S585粉88碍9092为了检査MCV诊断缺铁性皱血的准确性・忤先根据100例测定值选择所冇可能的截断点©如样本较大・可根拯实际要求桁确的程度选择…疋数沆的截断点八对于侮个截断点分别清点正常组与杲常纽的观察例数。此时截断点和为丁分类资料的类别,匸常组与并常纽例数和y「表I的第1、2行,资料可仿照分类资料处田卜该资料仃丸个订隐的截断点,邹分截断点及其对应的匸常组与并常细例数百和其它计算结果见农3。注懣:|闵为该资料是观察值小诊断为并常,所以儿应为呆常组截断点处观察值较小的例数,而弘为止常纽截断点处观察值较人的例数。这与加察们上诊断为HP;计舁恰好和反。八二Q「和(”分別忙」i「•表I的第%&和了行,按让相应行所列公式计算。表3 连续件资料「勺後、Qi^Qi的计算编号心 忑 y<Q;010660..0ii.01..:n.2011K60.0(I.C1/6.::■■・・■■-・・・■■-I1?8()219800.71232.781:521422::;1521.0m.!:■:打0(} 1 34 1 34.0 1l.'i.. iI.!j38 03 1 :] 34 0 34.0im m命汁血, 一- 16W 3&立匚丨滾资料的九和%,(J,(J.5S37-0().5712-]]034-nL1弘将这屿值代入(丁)式,徉5匹(.口)U.O52bo检齡/丄卩〔口川〔川,.■的95%^,',.^(U.6I.VAO.^2UI)-不包松0.5,结杲农明MCV对缺铁性養血具有一定的诊断价伯A】、俶)「曲线卜而积的比较比较两个RCK:內线下血和Q是否点低推异,可按⑶式讣算工统计量。尿:+.S'£22-2r.S,£|.S,£,其中z是匸态离差值,Az】和是两诊断试验的曲线卜而积,SEJ1ISE2是H时应的标准误,分别由公式(D和⑵求得。r是两个ROC曲线下而积间的相关系数,它的计算需耍肯先求得两个中介和关系数,即匸常组的两诊断试強间和界常组的两诊断试強间的相关系数,记为©利H:计算可采用传统的IJedrson积差法KendalLau^级相:关法,前者适用丁连续性资料,后者适用丁等级资料,标准统计软件包(如SM、S1JSS)均可计算。以两诊断试验平均相关冗十q”2羽平均而积(AZ1+AZ2)/2查表4譽“花表4两个ROC曲线卜而积估计值间的相关系数⑴平即11关a十M]T均面积{(AZ]十AZ2)/2J;.7〔川.725.75().775.S(M).S25.S5U.S75.900/)259丸().()20.U2U.021X()2().020.02().020.02U.OI().01().01().01O.(HU.04U.U4U.040.030.03().03().03(HBU.030.030.020.020.02・・・0.540.51().?()().5()CUE()」90.4S0.47CU60.450.43().41()36U.56U.53{).51U.?20.?l0.5()(U9U.4SU.470.45U.430.3S…0.S6U.S6U.S6U.S5U.S5(].S50.S40.S4(LS3(rS2(LSI〔丿加(1(川U.SS(XSSO.SS0.S7U.S6U.S60.S5(LS40.S2为了解释非参数法ROE曲线卜而积的比较方法・用表5所列资料加以说明。农5 和同研究对彖山两种不同诊断方法分类诊断方法1分.类诊析方汉2分类12匸常组6合计异常徂—i41 2 345合计19()00(]120()10卄仆]217920{)(]2S1()20仆仆JfjfJ410{)0S111仆仆641221{)06111q1仆13511U2004°UU710522UU0U0(]U00U04合N3150(.〕?S32515W54農5左侧是两种诊断方法对止常纽丹例分类的数据,分类等级1到&分别衣小疔运止常、可能止常、止常可疑、界常可疑、可能界常和肯定异常“诳常纽弊级和关系数用表6的SAS程序计算得=0.3920=用同样的刀法可计算表5右侧异常纽等级相关系数=0.7034=该资料呼灼和关冗十rJ/20.5477o表6 il诵组两种诊昕方汉间等级和关系数几门SAS计算积序行号程序行再忙;201dcLL;l:07end:1311U20002duX11«】(Y.備cluxI^.:14(WUU0(103diiy=1Io(r.(N心000()1504inputlrut|aa:K)17V2UU016pRK'CV】丁kCDllu]];05〔11叩ul;1134I0(H)1"I'rcqfreq:end;12122](H)用run:<Jk?资料汁算陶诊断方法的AZI>AZ2.SE^hSE,分别得(L眇4“卩巧归、〔MW4和(k()261-山此可得其平均而积(Azl+Azz)/2=0.9164o査表4得而积间和关系数r为0.44=所以根据公式<3)TT:|0.8945-0.9382|二-』 =-1.4509V0.03042+0.02612-2/0.44x0.0304x0.026I其z小于1%P>0.05,在检验水准为].05时,两诊断方法无统计誉嗟爪如果比较的两个诊断试验是独立的,可令尸(X即采用z二|畀刀—L进行统计学检验。J,S£「十讨论对门出「贽性可根据分类或截忙「点计算出I⑴「匚件点,绘出未光滑i<(x'iii^|2|o.-un

线连接各点,并在每个点处作丙线至横轴,可将瑕疋曲线下面枳分成若T个梯形,原点勾

第•个啦)匚点组成的三角形:1看成上底为()的梯形。此时,将各梯形面不沛加可得ROCIII线

》面积。以表I资料为例,它I为各ROC (().())>(0.0622.0.2927)> (0.2124.(k6S29)-((0.4663,0.8780)>(0.^1S7.0.9512}.仃」),H各梯形面喩的和77.97%,该结果农明WilcoxonMann-Whitney统汁匮计算出的ROC曲线下而积与梯形规则计算卅來的结果和等,他们是未光滑甩)C曲线卜匸:】面枳。関」匕A参数法汁算出的Jz-般小「参数法估M的光滑ROC曲线F的面积。有研究还表明非参数法计算出的标准误较参数法大,便得非参数法计算结果较保疔。L算沖R0(川线卜而鼻:及其栋准误匚:川的不只是为U随机诊昕产匚的」汀&j和比,山」主要的H的是为「比载两个或两个以匕诊断试验,帮助闻木悵空筛选IlKfl-诊断方法"<J「本文第-部分介绍的KOCIII浅F而积及其标准误的肚参估计方决作怦用SAS6.11版木编写了SAS计算粒序创(见附录),该程序可输岀文中介绍的所有结果,包括幕木资料、ROCI二线卜血枳,及时小准[:、2检验统L量、95%厂伺〈可和仃关中间结果等。参考文献匚家良•临床流行茹浮中华医学杂志1998;78(12):941943.宇传华,徐勇勇-ROC分析的圧木原理-中华流行病巻杂志199S;19(2-A):413-415.Hanley」A,McNeulIII.Thein('iin'andusr-ofLheareai.indfra'verope■-it:ngcliaracterisi.ic{H'X)rurve.I^iciologyRi82;]l3:29-3b.lieckJR,S:i:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论