版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第六章第六章诊断试验与筛检试验诊断试验与筛检试验案例案例1 1心力衰竭是多种心脏疾病晚期共同表现出的一种综合心力衰竭是多种心脏疾病晚期共同表现出的一种综合征,是心源性死亡的重要原因。征,是心源性死亡的重要原因。B型利钠肽型利钠肽(BNP)、心房利、心房利钠肽钠肽(ANP)、N-末端末端ANP(NT-ANP)是人体内重要的心脏激是人体内重要的心脏激素,研究显示,充血性心力衰竭时,血浆素,研究显示,充血性心力衰竭时,血浆BNP、ANP和和NT-ANP浓度升高。通过放射免疫法检测三项指标的血浆浓度浓度升高。通过放射免疫法检测三项指标的血浆浓度变化对心力衰竭有诊断价值。变化对心力衰竭有诊断价值。图图1
2、是测定三种不同利钠肽的血浆浓度水平和后前位是测定三种不同利钠肽的血浆浓度水平和后前位X线胸片测心胸比例线胸片测心胸比例(CTR)对诊断心力衰竭效能的对诊断心力衰竭效能的ROC曲线曲线比较。比较。BNP、ANP、NT-ANP和和CTR的的ROC曲线下面积分曲线下面积分别为别为0.96、0.93、0.89和和0.79。 图图1 三种利钠肽浓度和后前位三种利钠肽浓度和后前位X线胸片测心胸比例对诊断心力衰竭效能的线胸片测心胸比例对诊断心力衰竭效能的ROC曲线曲线 (Cowie MR, et al. Lancet, 1997;350:1349-53 )作为一名医生,你认为何项指标是最佳诊作为一名医生,你
3、认为何项指标是最佳诊断的指标?断的指标?神经母细胞瘤神经母细胞瘤(NB)是最常见的儿童恶性肿瘤之一,是最常见的儿童恶性肿瘤之一,它可产生于自主神经系统的各个神经网络它可产生于自主神经系统的各个神经网络(肾上腺髓质最肾上腺髓质最为常见为常见),但其发病率较低,但其发病率较低(英国每年患此病的人不足英国每年患此病的人不足100例例)。目前,超过目前,超过50%的的NB在诊断时已从原发部位扩散,在诊断时已从原发部位扩散,过去过去20年中,年中,该病的生存该病的生存状况状况并未改善并未改善。本病预后取决于。本病预后取决于患儿年龄和疾病诊断的阶段,疾病发现越早,预后越好。患儿年龄和疾病诊断的阶段,疾病发
4、现越早,预后越好。检测尿中儿茶酚胺检测尿中儿茶酚胺(VMA)及其代谢产物的含量可对该病进及其代谢产物的含量可对该病进行筛查。行筛查。案例案例2 2 目前在英国尚未确立神经母细胞瘤的筛查方目前在英国尚未确立神经母细胞瘤的筛查方案,但该病的筛查方案已在日本实施。神经母细案,但该病的筛查方案已在日本实施。神经母细胞瘤有自发消退的可能,筛查可能会导致过度诊胞瘤有自发消退的可能,筛查可能会导致过度诊断。断。如何建立一个研究以探讨在英国实行神如何建立一个研究以探讨在英国实行神经母细胞瘤筛检的价值?经母细胞瘤筛检的价值? 学习目的学习目的u定义诊断和筛检,比较诊断试验与筛检试验有何不同;定义诊断和筛检,比较
5、诊断试验与筛检试验有何不同;u学会计算试验评价的各种指标;学会计算试验评价的各种指标;u应用真实性、可靠性和收益等指标评价诊断试验和筛检应用真实性、可靠性和收益等指标评价诊断试验和筛检试验;试验;u列举和讨论试验结果阳性截断值的选定方法及注意的问列举和讨论试验结果阳性截断值的选定方法及注意的问题;题;u讨论患病率、灵敏度、特异度及预测值等各类指标的相讨论患病率、灵敏度、特异度及预测值等各类指标的相互关系;互关系;u了解提高试验效率的方法。了解提高试验效率的方法。第一节第一节 概概 述述第二节第二节 诊断试验与筛检试验的评价诊断试验与筛检试验的评价第三节第三节 提高试验效率的方法提高试验效率的方
6、法内内 容容一、概念一、概念 筛检筛检(screening)是运用快速、简便的检)是运用快速、简便的检验、检查或其它措施,在健康的人群中,发现验、检查或其它措施,在健康的人群中,发现那些表面健康,但可疑有病或有缺陷的人。那些表面健康,但可疑有病或有缺陷的人。 筛检也称筛查,筛检所用的各种手段和方筛检也称筛查,筛检所用的各种手段和方法称为法称为筛检试验筛检试验(screening test),它可以是),它可以是体检、实验室检查和问卷调查等。体检、实验室检查和问卷调查等。 第一节第一节 概概 述述 筛检试验只是将人群中可疑有病或有筛检试验只是将人群中可疑有病或有缺陷者(试验阳性者)与那些可能无病
7、者缺陷者(试验阳性者)与那些可能无病者(试验阴性者)区分开来,仅是一个初步(试验阴性者)区分开来,仅是一个初步的检查,对筛检结果阳性或可疑阳性者需的检查,对筛检结果阳性或可疑阳性者需进一步做确诊检查,对确诊者还需进行治进一步做确诊检查,对确诊者还需进行治疗。疗。图图2 筛检试验流程图筛检试验流程图 (引自:连志浩流行病学北京医科大学,北京,1989) 筛检的目的筛检的目的1. 疾病的二级预防,早发现、早诊断、早治疗。疾病的二级预防,早发现、早诊断、早治疗。如乳腺癌等筛检。如乳腺癌等筛检。2. 疾病的一级预防,高危人群,采取相应的干预疾病的一级预防,高危人群,采取相应的干预措施。例如筛检高血压预
8、防脑卒中。措施。例如筛检高血压预防脑卒中。3. 识别疾病的早期阶段,帮助了解疾病的自然史,识别疾病的早期阶段,帮助了解疾病的自然史,揭示疾病的揭示疾病的“冰山现象冰山现象”。4. 合理分配卫生资源。合理分配卫生资源。是指在临床上医务人员通过详尽的检是指在临床上医务人员通过详尽的检查及调查等方法收集各种信息,经过整理查及调查等方法收集各种信息,经过整理加工后对病人病情的基本认识和判断。据加工后对病人病情的基本认识和判断。据此制定下一步的治疗或干预方案,完成救此制定下一步的治疗或干预方案,完成救治任务。治任务。 诊诊 断(断(diagnosisdiagnosis)用于诊断的各种检查及调查的方法称用
9、于诊断的各种检查及调查的方法称诊断试验诊断试验(diagnostic test)。诊断试验的含义。诊断试验的含义是广泛的,它既包括各种实验室检查,也是广泛的,它既包括各种实验室检查,也包括放射线、包括放射线、B超等物理检查手段,还包括超等物理检查手段,还包括病史、体检等临床资料。病史、体检等临床资料。 诊断的主要诊断的主要目的目的是对病人病情做出及时、是对病人病情做出及时、正确的判断,以便采取相应有效的治疗措施。正确的判断,以便采取相应有效的治疗措施。此外,还可应用诊断试验进行病例随访,确定此外,还可应用诊断试验进行病例随访,确定疾病的转归、判断疗效和估计预后以及监测治疾病的转归、判断疗效和估
10、计预后以及监测治疗的副作用等。疗的副作用等。二、应用原则二、应用原则筛检的应用原则筛检的应用原则 1.被筛检的疾病或缺陷是当地重大的卫生问题。被筛检的疾病或缺陷是当地重大的卫生问题。2.对被筛检的疾病或缺陷有进一步确诊的方法与条件。对被筛检的疾病或缺陷有进一步确诊的方法与条件。3.对发现并确诊的病人及高危人群有条件进行有效的治疗和对发现并确诊的病人及高危人群有条件进行有效的治疗和干预,且应有统一的标准。干预,且应有统一的标准。4.了解被筛检疾病的自然史,有可供识别的早期症状和体征了解被筛检疾病的自然史,有可供识别的早期症状和体征或测量的标志。或测量的标志。5.筛检试验要快速、简便、经济、可靠、
11、安全、有效及易为筛检试验要快速、简便、经济、可靠、安全、有效及易为群众接受。群众接受。 诊断的应用原则诊断的应用原则 诊断是临床采取有效治疗措施的前提,因诊断是临床采取有效治疗措施的前提,因此诊断试验必须能正确判断病人和非病人,还此诊断试验必须能正确判断病人和非病人,还要为受检者所接受,所以诊断试验要求:要为受检者所接受,所以诊断试验要求: 1.灵敏度、特异度要高。灵敏度、特异度要高。 2.快速、简单、价廉、容易进行。快速、简单、价廉、容易进行。 3.安全、可靠、尽量减少病人的损伤和痛苦。安全、可靠、尽量减少病人的损伤和痛苦。 三、诊断试验与筛检试验的区别三、诊断试验与筛检试验的区别筛检试验筛
12、检试验诊断试验诊断试验目的目的用以区别可疑病人与可能无病者 用来区别病人与可疑有病但实际无病的人 对象对象健康或表面健康的人 病人或可疑病人 要求要求快速、简便,有高灵敏度,尽可能发现所有可能的病人 较高的准确性、特异度和灵敏度,尽可能诊断出所有病人和排除所有非病人 费用费用简单、廉价的方法 一般价格较高 处理处理阳性者须进一步作诊断试验以确诊 阳性者需要进一步观察和及时治疗 图图3 宫颈癌自然史与筛检和诊断的示意图宫颈癌自然史与筛检和诊断的示意图(Ahrens 2005)不管是不管是“诊断试验诊断试验”还是还是“筛检筛检试验试验”都需要针对该方法对疾病都需要针对该方法对疾病“诊诊断断”的真实
13、性和价值做出评价。的真实性和价值做出评价。一、试验评价的基本步骤一、试验评价的基本步骤试验的试验的评价评价就是将待评价的试验结果就是将待评价的试验结果与与 “金标准金标准”(gold standard)结果结果进进行同步盲法比较,判定该方法对疾病行同步盲法比较,判定该方法对疾病“诊诊断断”的真实性和价值。的真实性和价值。 第二节第二节 筛检试验的评价筛检试验的评价(一)确定(一)确定“金标准金标准”“金标准金标准”指当前临床医学界公认最可靠、指当前临床医学界公认最可靠、最权威的、可以反映有病或无病实际情况的诊最权威的、可以反映有病或无病实际情况的诊断方法称为断方法称为金标准(金标准(gold
14、standard),是诊断是诊断疾病的最可靠的方法,也称为标准诊断。疾病的最可靠的方法,也称为标准诊断。活活/ /尸检尸检手术发现手术发现微生物培养微生物培养特殊检查特殊检查影像诊断影像诊断长期随访的结果长期随访的结果应注意应注意:金标准会随着医学的发展不断更新,如:金标准会随着医学的发展不断更新,如金标准选择不当,则可造成金标准选择不当,则可造成错误分类偏错误分类偏倚倚,影响对试验的正确评价。,影响对试验的正确评价。一些较难诊断的疾病可能没有真正意义上的一些较难诊断的疾病可能没有真正意义上的金标准,或金标准复杂且昂贵、甚至使受检者遭金标准,或金标准复杂且昂贵、甚至使受检者遭受痛苦或冒一定风险
15、,此时可选一种相对公认的受痛苦或冒一定风险,此时可选一种相对公认的诊断方法作金标准,但要考虑此类金标准的假阳诊断方法作金标准,但要考虑此类金标准的假阳性率和假阴性率。性率和假阴性率。(二)选择研究对象(二)选择研究对象用于评价诊断试验和筛检试验的研究对象,应能代用于评价诊断试验和筛检试验的研究对象,应能代表筛检试验和诊断试验可能应用到的表筛检试验和诊断试验可能应用到的目标人群目标人群。因此,筛。因此,筛检的研究对象应从社区人群中选择,诊断试验的研究对象检的研究对象应从社区人群中选择,诊断试验的研究对象应从可疑人群或高危人群中选择。应从可疑人群或高危人群中选择。 用金标准确诊用金标准确诊有病有病
16、的病例,应包含典型的、不的病例,应包含典型的、不典型病例,早、中、晚期病例,轻、中、重病例、有和无典型病例,早、中、晚期病例,轻、中、重病例、有和无并发症的患者。并发症的患者。代表性代表性使评价结果具有普遍意义。来自男性、年轻使评价结果具有普遍意义。来自男性、年轻人群的试验评价结果一般不能适用于女性、老年人群。人群的试验评价结果一般不能适用于女性、老年人群。 (三)样本大小的计算(三)样本大小的计算待评试验的灵敏度待评试验的灵敏度待评试验的特异度待评试验的特异度显著性检验水平显著性检验水平,一般为,一般为0.05容许误差容许误差,一般为,一般为0.050.10 当灵敏度和特异度均接近当灵敏度和
17、特异度均接近50%时,可用近似公式时,可用近似公式 21znpp待评价方法的灵敏待评价方法的灵敏度或特异度度或特异度正态分布中累积概率正态分布中累积概率等于等于2 2时的时的值值( (双侧双侧) ) 此公式适用于此公式适用于p接近接近50%时,当预期的灵敏度或特异度小于时,当预期的灵敏度或特异度小于20%或或大于大于80时,需对灵敏度或特异度的估计值做平方根反正弦转换。时,需对灵敏度或特异度的估计值做平方根反正弦转换。 (四)同步盲法测试(四)同步盲法测试对用金标准所确定的病例组与非病对用金标准所确定的病例组与非病例组的研究对象,用待评价试验进行例组的研究对象,用待评价试验进行同同步盲法测试。
18、步盲法测试。(五)整理分析资料(五)整理分析资料 待评价待评价 试验试验 金标准确诊金标准确诊合计合计 病例病例非病例非病例阳性阳性a(真阳性)b(假阳性)a+b阴性阴性c(假阴性)d(真阴性)c+d合计合计a+cb+dn表表1 1 评价试验的整理表评价试验的整理表在收集和分析试验资料时,盲法的使用具在收集和分析试验资料时,盲法的使用具有非常重要的意义,可以减少人为的主观偏差。有非常重要的意义,可以减少人为的主观偏差。假设未实施盲法,研究者可能对同样可疑假设未实施盲法,研究者可能对同样可疑的结果,倾向于将金标准确诊的病人判断为试的结果,倾向于将金标准确诊的病人判断为试验阳性,金标准诊断为非病人
19、的判断为试验阴验阳性,金标准诊断为非病人的判断为试验阴性,这样就会性,这样就会过高估计待评价试验的价值。过高估计待评价试验的价值。(六)质量控制(六)质量控制 除采用同步盲法测试以保证结果的真实性外,除采用同步盲法测试以保证结果的真实性外,对试验所用的仪器型号、试验条件、试验方法、所对试验所用的仪器型号、试验条件、试验方法、所用试剂的质量、标号等要统一、标准化,尽量采用用试剂的质量、标号等要统一、标准化,尽量采用客观指标,对调查员要进行严格培训,将误差减小客观指标,对调查员要进行严格培训,将误差减小到最低。到最低。二、试验评价的指标二、试验评价的指标(一)真实性(一)真实性(validity,
20、效度,效度)指测量值与实际值(金标准)相符合的程指测量值与实际值(金标准)相符合的程度,故又称准确性度,故又称准确性(accuracy)灵敏度灵敏度(sensitivity)与假阴性率与假阴性率(false negative rate)特异度特异度(specificity)与假阳性率与假阳性率(false positive rate)约登指数(约登指数(Youdens index )粗一致性(粗一致性(crude agreement) 灵敏度灵敏度又称敏感度或真阳性率,指金标准确诊的病例中待又称敏感度或真阳性率,指金标准确诊的病例中待评价试验也判断为阳性者所占的百分比。它可反映待评评价试验也判
21、断为阳性者所占的百分比。它可反映待评价试验能将实际患病的病例正确地判断为价试验能将实际患病的病例正确地判断为患患某病的能力。某病的能力。理想值应为理想值应为100%。 式中式中n为实际患病人数,即计算灵敏度的分母。为实际患病人数,即计算灵敏度的分母。 nSenSenSEsen)1 ()(%100caa灵敏度特异度特异度又称真阴性率,指金标准确诊的非病例中待评价试验又称真阴性率,指金标准确诊的非病例中待评价试验也判断为阴性者所占的百分比。它可反映待评价试验能将也判断为阴性者所占的百分比。它可反映待评价试验能将实际未患某病的研究对象正确地判断为未患某病的能力。实际未患某病的研究对象正确地判断为未患
22、某病的能力。理想值也应为理想值也应为100%。式中式中n为实际无病人数,即计算特异度的分母。为实际无病人数,即计算特异度的分母。 %100dbd特异度nSpeSpeSESpe)1 ()(假阴性率假阴性率 又称漏诊率又称漏诊率, ,是指金标准确诊的病例中待是指金标准确诊的病例中待评价试验错判为阴性者所占的百分比,理想值评价试验错判为阴性者所占的百分比,理想值也应为也应为0%0%,漏诊率,漏诊率=1=1灵敏度。灵敏度越高,灵敏度。灵敏度越高,漏诊率越低。漏诊率越低。 %100cac假阴性率假阳性率假阳性率 又称误诊率,是指金标准确诊的非病例中又称误诊率,是指金标准确诊的非病例中待评价试验错判为阳性
23、者所占的百分比,理想待评价试验错判为阳性者所占的百分比,理想值应为值应为0%,误诊率,误诊率=1特异度。特异度越高,特异度。特异度越高,误诊率越低。误诊率越低。%100dbb假阳性率 灵敏度与特异度是评价试验灵敏度与特异度是评价试验真实性真实性的两个基本指标。临床上,病人和医生的两个基本指标。临床上,病人和医生都希望获得高灵敏度和高特异度的诊断都希望获得高灵敏度和高特异度的诊断试验或筛检试验,即尽可能没有漏诊和试验或筛检试验,即尽可能没有漏诊和误诊,但大多数情况下是难以达到的。误诊,但大多数情况下是难以达到的。 因为许多试验是用定量或半定量方法判定阳因为许多试验是用定量或半定量方法判定阳性与阴
24、性,而患者与非患者的测量值多不能截然性与阴性,而患者与非患者的测量值多不能截然分开,有重叠现象,故灵敏度与特异度之间往往分开,有重叠现象,故灵敏度与特异度之间往往顾此失彼。顾此失彼。 往往往往提高了试验的灵敏度却降低了试验的特提高了试验的灵敏度却降低了试验的特异度异度,而,而提高了试验的特异度却又降低了试验的提高了试验的特异度却又降低了试验的灵敏度灵敏度,下图说明了两者的关系,当判断标准移,下图说明了两者的关系,当判断标准移向向B B时,提高了特异度降低了灵敏度,当判断标准时,提高了特异度降低了灵敏度,当判断标准移向移向A A时,提高了灵敏度降低了特异度。时,提高了灵敏度降低了特异度。图图5
25、人群中血清钙水平的分布图人群中血清钙水平的分布图 约登指数约登指数也称正确指数也称正确指数 是灵敏度与特异度之和减去是灵敏度与特异度之和减去1表示试验方法发现真正病人与非病人的总能力表示试验方法发现真正病人与非病人的总能力范围在范围在01之间,指数越大,其真实性越高之间,指数越大,其真实性越高粗一致性粗一致性是指试验所检出的真阳性和真阴性例数之和占受试人是指试验所检出的真阳性和真阴性例数之和占受试人数的百分比。它反映试验结果与金标准诊断结果的符合程数的百分比。它反映试验结果与金标准诊断结果的符合程度。度。 %100dcbada粗一致性表表2 2 人群某病患病状况与试验结果的关系(虚拟数据)人群
26、某病患病状况与试验结果的关系(虚拟数据) %00.60%1002012%100 caa灵敏度%00.95%1006057%100 dbd特异度表示在无甲状旁腺功能亢进的人中血清钙试验阴性或正常者占表示在无甲状旁腺功能亢进的人中血清钙试验阴性或正常者占95.00。 表示在甲状旁腺功能亢进确诊的病人中血清钙试验阳性或异常者占表示在甲状旁腺功能亢进确诊的病人中血清钙试验阳性或异常者占60.00。 %00.40%100208%100 cac假阴性率(漏诊率)%00. 5%100603%100 dbb假阳性率(误诊率)表示在甲状旁腺功能亢进确诊的病人中血清钙试验阴性或正常者占表示在甲状旁腺功能亢进确诊的
27、病人中血清钙试验阴性或正常者占40.00。 表示在无甲状旁腺功能亢进的人中血清钙试验阳性或异常者占表示在无甲状旁腺功能亢进的人中血清钙试验阳性或异常者占5.00。约登指数约登指数=(0.60+0.95)-1=0.55%25.86%100805712%100dcbada粗一致性(符合率)表示血清钙试验阳性和阴性结果均正确的概率是表示血清钙试验阳性和阴性结果均正确的概率是86.25。 (二)评价试验的可靠性(二)评价试验的可靠性 (reliability) 也称信度、精确度也称信度、精确度(precision)或可重复性或可重复性(repeatability) ,指在相同条件下用某测量工具,指在相
28、同条件下用某测量工具(如待评如待评试试验验)重复测量同一受试者时获得相同结果的稳定程度。重复测量同一受试者时获得相同结果的稳定程度。影响试验可靠性的因素影响试验可靠性的因素 受试对象自身生物学差异受试对象自身生物学差异观察者差异观察者差异 试验方法的差异试验方法的差异 评价试验可靠性的指标评价试验可靠性的指标标准差标准差变异系数变异系数(CV) 符合率符合率(agreement/consistency rate) Kappa值值 %100测定值均数测定值均数的标准差变异系数符合率符合率 又称一致率又称一致率 是筛检试验判定的结果与标准诊断的结果是筛检试验判定的结果与标准诊断的结果相同的数占总受
29、检人数的比例相同的数占总受检人数的比例%100nda符合率表表3 可靠性评价的资料归纳表可靠性评价的资料归纳表然而仅仅通过符合率来评价筛检或诊断试验然而仅仅通过符合率来评价筛检或诊断试验的一致性是不全面的。的一致性是不全面的。 第一,符合率未表明结果不一致性的具体原第一,符合率未表明结果不一致性的具体原因:两个观察者所得的阳性结果和阴性结果是否因:两个观察者所得的阳性结果和阴性结果是否相同?还是其中一个观察者更倾向于阳性结果?相同?还是其中一个观察者更倾向于阳性结果? 第二,许多一致性是第二,许多一致性是由由偶然性造成偶然性造成的,然而的,然而符合率不能表明偶然性的大小。若要考虑机遇因符合率不
30、能表明偶然性的大小。若要考虑机遇因素对观察一致性的影响,则需进行素对观察一致性的影响,则需进行Kappa 分析。分析。 Kappa值值:是一个有用的测量分类变量的可靠性分:是一个有用的测量分类变量的可靠性分析指标,该值表示不同观察者对同一批结果的判定和同析指标,该值表示不同观察者对同一批结果的判定和同一观察者在不同情况下对同一批结果判定的一致程度。一观察者在不同情况下对同一批结果判定的一致程度。 Kappa值不同于观察一致率,它在判断两次测量的值不同于观察一致率,它在判断两次测量的一致性时,考虑了一致性时,考虑了机遇因素机遇因素对试验一致性的影响。对试验一致性的影响。)()()(A-NA-AK
31、appa22112211CC0NrcNrcNNrcNrcdaK)值()(2)()(22112211crcrNcrcrdaN200)()1 (/ )1 (CKPNPPSEKappa值的取值范围为值的取值范围为11,若若K为负数,说明为负数,说明观察一致率比机遇造成的一致率还观察一致率比机遇造成的一致率还要低要低;K=1,说明两结果完全不一致。,说明两结果完全不一致。K=0,表明观察一致率完全是,表明观察一致率完全是由机遇所致由机遇所致。如如K0,说明,说明观察一致率比机遇所致的一致率高观察一致率比机遇所致的一致率高;K=1,说明两结果完全一致。,说明两结果完全一致。Kappa值值越高一致性越好越
32、高一致性越好,0.2以下一致性可忽略以下一致性可忽略不计,不计,0.20.4较差一致性,较差一致性,0.40.6中度一致性,中度一致性,0.60.8较较好一致性,好一致性,0.8以上极好一致性。以上极好一致性。表表4 两位临床医生对两位临床医生对100名病人判定心脏杂音的一致性比较名病人判定心脏杂音的一致性比较Kappa值为值为0.78或或78%,表明两位临床医生,表明两位临床医生的诊断一致性较好。的诊断一致性较好。在评价试验时应注意,一个诊断试验具有较在评价试验时应注意,一个诊断试验具有较好的真实性,不一定具有较好的可靠性,而可靠好的真实性,不一定具有较好的可靠性,而可靠性较好,不一定有较好
33、的真实性。性较好,不一定有较好的真实性。真实性和可靠真实性和可靠性不是必定相关的性不是必定相关的。因此在选择评价试验时既要。因此在选择评价试验时既要考虑其真实性,又不能忽略其可靠性。考虑其真实性,又不能忽略其可靠性。 (三)评价试验的收益(三)评价试验的收益预测值预测值(predictive value) 反映应用筛检结果来估计受检者患病和不反映应用筛检结果来估计受检者患病和不患病可能性的大小的指标。患病可能性的大小的指标。阳性预测值阳性预测值(positive predictive value, PPV)阴性预测值阴性预测值(negative predictive value, NPV) P
34、PV 指试验阳性结果中真正患病指试验阳性结果中真正患病(真阳性真阳性)的比例的比例 NPV 指筛检试验阴性者不患目标疾病的可能性指筛检试验阴性者不患目标疾病的可能性 %100baa阳性预测值%100dcd阴性预测值试验的预测值与试验的灵敏度、特异试验的预测值与试验的灵敏度、特异度及受检人群中所检疾病的患病率有关。度及受检人群中所检疾病的患病率有关。在患病率一定时,试验的灵敏度越高,阴在患病率一定时,试验的灵敏度越高,阴性预测值越高;试验的特异度越高,阳性性预测值越高;试验的特异度越高,阳性预测值越高。灵敏度和特异度对阳性预测预测值越高。灵敏度和特异度对阳性预测值的影响较阴性预测值明显。值的影响
35、较阴性预测值明显。注:图中实线为阳性预测值曲线,虚线为阴性预测值曲线,注:图中实线为阳性预测值曲线,虚线为阴性预测值曲线, 较粗的曲线代表灵敏度和特异度均为较粗的曲线代表灵敏度和特异度均为95%时的预测值,时的预测值, 较细的曲线代表灵敏度和特异度均为较细的曲线代表灵敏度和特异度均为85%时的预测值时的预测值灵敏度越高,阴性预测值越高灵敏度越高,阴性预测值越高特异度越高,阳性预测值越高特异度越高,阳性预测值越高图图 6 预测值与和患病率、灵敏度和特异度的关系预测值与和患病率、灵敏度和特异度的关系似然比(似然比(likelihood ratiolikelihood ratio)是指病例组中某种试
36、验结果出现的概率与非是指病例组中某种试验结果出现的概率与非病例组中该试验结果出现的概率之比。因试验结病例组中该试验结果出现的概率之比。因试验结果有阴阳之分,所以似然比也有阳性似然比和阴果有阴阳之分,所以似然比也有阳性似然比和阴性似然比。性似然比。 阳性似然比阳性似然比(positive likelihood ratio,LR+):):是指试验结果是指试验结果真阳性率与假阳性率真阳性率与假阳性率之比,说之比,说明病人中出现某种试验结果阳性的概率是非病人明病人中出现某种试验结果阳性的概率是非病人的多少倍。其值越大,试验结果阳性者为真阳性的多少倍。其值越大,试验结果阳性者为真阳性的概率越大。一个诊断
37、价值高的试验,的概率越大。一个诊断价值高的试验,LR+应显应显著高于著高于1。特异度灵敏度假阳性率真阳性率阳性似然比1阴性似然比阴性似然比(negative likelihood ratio,LR-):): 是指试验结果是指试验结果假阴性率与真阴性率假阴性率与真阴性率之比,说之比,说明病人中出现某种试验结果阴性的概率是非病人明病人中出现某种试验结果阴性的概率是非病人的多少倍。其值越小,试验结果阴性者为真阴性的多少倍。其值越小,试验结果阴性者为真阴性的可能性越大。的可能性越大。 特异度灵敏度真阴性率假阴性率阴性似然比1如果如果LR+值大,值大,LR-值小,该试验是个理想值小,该试验是个理想的试验
38、。试验分析时可以计算的试验。试验分析时可以计算LR+和和LR-的比值,的比值,来评价试验的阳性和阴性。来评价试验的阳性和阴性。LR+/LR-为为12.0/0.42 ,等于,等于28.5,这个数值,这个数值没有预期的高(一般没有预期的高(一般50试验效果弱)。如果数试验效果弱)。如果数据来源于据来源于22表,可以通过计算比值比表,可以通过计算比值比(ad/bc=33.48)得到相同的结果。)得到相同的结果。 由于各级医院的诊治水平不同,以及各地区由于各级医院的诊治水平不同,以及各地区疾病的患病率也有差异,故到不同医院就诊的人疾病的患病率也有差异,故到不同医院就诊的人员中患病率差别也较大。因此在一
39、所医院或一个员中患病率差别也较大。因此在一所医院或一个地区进行的诊断试验评价,地区进行的诊断试验评价,其预测值不能外延至其预测值不能外延至其他级别或其他地区的医院其他级别或其他地区的医院。而似然比的计算不。而似然比的计算不受患病率的影响,受患病率的影响,只与灵敏度和特异度有关只与灵敏度和特异度有关,虽,虽然不如预测值直观,但在医院评价诊断试验时不然不如预测值直观,但在医院评价诊断试验时不失为一种有效方法。失为一种有效方法。验后概率(验后概率(post-test probability) 进行诊断试验的目的是提高对疾病诊断的准进行诊断试验的目的是提高对疾病诊断的准确性,及时进行合理的治疗。因此,
40、临床医生应确性,及时进行合理的治疗。因此,临床医生应善于估计就诊个体患病的验后概率,即诊断试验善于估计就诊个体患病的验后概率,即诊断试验为阳性(或阴性)时研究对象患某病(或未患某为阳性(或阴性)时研究对象患某病(或未患某病)的概率。病)的概率。 验前比验前比=验前概率验前概率/(1验前概率)验前概率) 验后比验后比=验前比验前比LR+ 验后概率验后概率=验后比验后比/(1+验后比)验后比) 在诊断试验中,如果患病率为验前概率,那在诊断试验中,如果患病率为验前概率,那么阳性预测值即为验后概率。诊断试验的似然比么阳性预测值即为验后概率。诊断试验的似然比综合了灵敏度、特异度的信息,在已知患病率与综合
41、了灵敏度、特异度的信息,在已知患病率与似然比的情况下,可以根据诊断试验特定测量值似然比的情况下,可以根据诊断试验特定测量值相应的似然比计算验后比,从而准确地估计单个相应的似然比计算验后比,从而准确地估计单个病人的患病概率,以帮助临床医生进行诊断决策。病人的患病概率,以帮助临床医生进行诊断决策。 例:患者男,例:患者男,60岁,有间歇性的胸前绞痛,当地医生怀岁,有间歇性的胸前绞痛,当地医生怀疑心肌梗死,根据该病病例统计,此年龄段有该症疑心肌梗死,根据该病病例统计,此年龄段有该症状的男性患心肌梗死可能性为状的男性患心肌梗死可能性为60%。实验室进一步。实验室进一步作血清肌酸激酶检查,结果为异常。血
42、清肌酸激酶作血清肌酸激酶检查,结果为异常。血清肌酸激酶试验的灵敏度为试验的灵敏度为90%,特异度为,特异度为83%。该患者患急。该患者患急性心肌梗死的概率是多少?性心肌梗死的概率是多少? 验前概率验前概率=患病率患病率=0.60 验前比验前比=验前概率验前概率/(1验前概率)验前概率)=0.60/(1-0.60)=1.5 阳性似然比阳性似然比=真阳性率真阳性率/假阳性率假阳性率=0.9/(1-0.83)=5.3 验后比验后比=验前比验前比LR+=1.55.3=7.95 验后概率验后概率=验后比验后比/(1验后比)验后比)=7.95/(1+7.95)=0.8883 该患者在血清肌酸激酶试验阳性后
43、,患该患者在血清肌酸激酶试验阳性后,患急性心肌梗死概率比验前概率明显上升,为急性心肌梗死概率比验前概率明显上升,为88.83%,因此,对该患者患急性心肌梗死,因此,对该患者患急性心肌梗死的诊断有的诊断有88.83%的把握。的把握。三、试验阳性结果截断值的确定三、试验阳性结果截断值的确定 截断值(截断值( cut off value)是判定试)是判定试验阳性与阴性的界值,即确定某项指验阳性与阴性的界值,即确定某项指标的正常值,以区分正常与异常。标的正常值,以区分正常与异常。 理想的筛检试验理想的筛检试验 灵敏度、特异度均应接灵敏度、特异度均应接近近100%。 但在实际工作中很难达到,往往表现为但
44、在实际工作中很难达到,往往表现为灵敏度灵敏度则特异度则特异度。两者高低的转换与确定筛检试验阳性结两者高低的转换与确定筛检试验阳性结果的截断值果的截断值(cut off point)或临界点的选择密或临界点的选择密切相关。切相关。图图7 7 病人与非病人观测值分布类型病人与非病人观测值分布类型确定截断值的方法有多种,如均数确定截断值的方法有多种,如均数2倍标准差法、百分位数法、从治疗和倍标准差法、百分位数法、从治疗和预防的实际应用出发确定截断值等,但预防的实际应用出发确定截断值等,但在常规情况下,即灵敏度、特异度均很在常规情况下,即灵敏度、特异度均很重要的情况下,最常用的还是受试者工重要的情况下
45、,最常用的还是受试者工作特征曲线法。作特征曲线法。定义定义 用真阳性率和假阳性率作图得出的用真阳性率和假阳性率作图得出的曲线,可反映灵敏度和特异度的关系曲线,可反映灵敏度和特异度的关系 受试者工作特性曲线受试者工作特性曲线 ( Receiver operator characteristic curve, ROC )表表5 5 糖尿病血糖试验不同血糖水平的灵糖尿病血糖试验不同血糖水平的灵敏度和特异度分布敏度和特异度分布餐后餐后2小时血糖小时血糖mg/100ml灵敏度(灵敏度(%)特异度(特异度(%)7098.6 8.8 8097.1 25.5 9094.3 47.6 10088.6 69.8
46、11085.7 84.1 12071.4 92.5 13064.3 96.9 14057.1 99.4 15050.0 99.6 16047.1 99.8 17042.9 100.0 18038.6 100.0 19034.3 100.0 20027.1 100.0 图图8 8 糖尿病血糖试验的糖尿病血糖试验的ROC曲线曲线横轴表示假阳横轴表示假阳性率性率(1-(1-特异度特异度) )纵轴表示真阳纵轴表示真阳性率性率( (灵敏度灵敏度)点代表筛检试验的特定阳性标准点代表筛检试验的特定阳性标准值相对应的灵敏度和特异度对子值相对应的灵敏度和特异度对子 最理想最理想ROC曲线是纵坐标垂直上升,横坐标
47、曲线是纵坐标垂直上升,横坐标缓慢增加,如图缓慢增加,如图9最上方的曲线(最优曲线)。若最上方的曲线(最优曲线)。若计算所得的灵敏度总与假阳性率相同,那么所得计算所得的灵敏度总与假阳性率相同,那么所得的的ROC曲线为一条从左下角到右上角的对角线,曲线为一条从左下角到右上角的对角线,即图即图9中最下方的线(无意义线)。中最下方的线(无意义线)。临床试验中,所得的临床试验中,所得的ROC曲线一般位于两者曲线一般位于两者之间,如图之间,如图9中所标记出的较优曲线和一般曲线。中所标记出的较优曲线和一般曲线。 ROC曲线也可用来比较两种和两种以上诊断曲线也可用来比较两种和两种以上诊断试验的诊断价值,从而帮
48、助临床医师作出最佳选试验的诊断价值,从而帮助临床医师作出最佳选择。择。图图9 ROC曲线曲线 % %ROC曲线在各领域运用的十分广泛。其中一种方法就曲线在各领域运用的十分广泛。其中一种方法就是通过比较各是通过比较各ROC曲线下的面积曲线下的面积来进行显著性检验。曲线来进行显著性检验。曲线下面积越大,试验的诊断价值就越高。下面积越大,试验的诊断价值就越高。在图在图10中,中,ROC曲线为对角状的无效曲线(灵敏度与曲线为对角状的无效曲线(灵敏度与假阳性率相同)下的面积为假阳性率相同)下的面积为50%,50岁病例组的曲线下岁病例组的曲线下面积约为面积约为60%,50岁病例组的曲线面积可占岁病例组的曲
49、线面积可占90%。因此,在得到病理报告前,因此,在得到病理报告前,50岁病人的肿瘤直径大岁病人的肿瘤直径大小对临床医生决定是否要摘除肿瘤更具有指导意义,而对小对临床医生决定是否要摘除肿瘤更具有指导意义,而对年轻的病人来说,意义不大。年轻的病人来说,意义不大。图图10 滤泡型甲状旁腺肿瘤直径大小与肿瘤恶性有关的滤泡型甲状旁腺肿瘤直径大小与肿瘤恶性有关的ROC曲线曲线 %优化试验方法优化试验方法联合试验的应用联合试验的应用选择患病率高的人群作为受试对象选择患病率高的人群作为受试对象第三节 提高试验效率的方法 联合试验联合试验 在实施筛检时,可采用多项筛检试验检查同一受试对象,在实施筛检时,可采用多项筛检试验检查同一受试对象,以提高筛检的灵敏度或特异度,增加筛检的收益,这种方以提高筛检的灵敏度或特异度,增加筛检的收益,这种方式称为联合试验。式称为联合
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度工程建设项目协议范本
- 2024年商用经营权租赁协议
- 7.5相对论时空观与牛顿力学的局限性(含答案)-2022-2023学年高一物理同步精讲义(人教2019必修第二册 )
- 2024年国际货物运输销售协议模板
- 儿童抚养权转移协议模板2024年
- 2024年无房产证私房买卖协议范本
- 2024年度个人汽车租赁协议范本
- 2024年酒吧业主权益转让协议
- BF2024年二手房销售协议模板
- 2024年度龙湖房地产开发建设协议
- 蔬菜出口基地备案管理课件
- 高考英语单词3500记忆短文40篇
- 北京市商业地产市场细分研究
- 2023-2024学年重庆市大足区八年级(上)期末数学试卷(含解析)
- 肺结节科普知识宣讲
- 网络直播营销
- 2024年节能减排培训资料
- 2024传染病预防ppt课件完整版
- 2024年华融实业投资管理有限公司招聘笔试参考题库含答案解析
- 2024年1月普通高等学校招生全国统一考试适应性测试(九省联考)历史试题(适用地区:贵州)含解析
- 《宽容待人 正确交往》班会课件
评论
0/150
提交评论