临床流行病学:文献的阅读和评价(诊断)_第1页
临床流行病学:文献的阅读和评价(诊断)_第2页
临床流行病学:文献的阅读和评价(诊断)_第3页
临床流行病学:文献的阅读和评价(诊断)_第4页
临床流行病学:文献的阅读和评价(诊断)_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、文献的阅读和评价(诊断),背景,医学生在学校接受的知识,10年后其中一半可能是错误的,而可悲的是没有人能预见哪一半是错误的。 哈佛大学医学院前院长 Dr. Sydney Burwell,主要内容,复习诊断试验的相关内容 如何评价有关介绍诊断试验的论文 诊断性试验的报告标准 诊断试验文章的常见问题,循证医学中诊断性试验常用的指标,判断题,当试验方法和阳性标准固定时,每个诊断试验的灵敏度和特异度是恒定的。,6,诊断性试验检测为阳性的病例在用金标准确定为“有病”的病例中所占的比例。敏感度越高,漏诊率(1SEN)越少 ,易误诊。 有助于排除相应的疾病。,敏感度(sensitivity,SEN = a/

2、a+c),评价诊断试验的指标(1),诊断试验的四格表 黄金标准 病例组非病例组 诊断阳性(真阳性)ab(假阳性)a+b 试验阴性(假阴性)cd(真阴性)c+d a+c b+d a+b+c+d 灵敏度= 特异度=,a/a+c,d/b+d,当试验方法和阳性标准固定时,每个诊断试验的灵敏度和特异度是恒定的。,8,特异度(specificity,SPE=d/b+d),诊断性试验检测为阴性的受试者在用金标准确定为“无病”的受试者中所占的比例。特异度越高,误诊率(1SPE)越低 ,易漏诊。 有助于确定诊断。,评价诊断试验的指标,诊断试验的四格表 黄金标准 病例组非病例组 诊断阳性(真阳性)ab(假阳性)a

3、+b 试验阴性(假阴性)cd(真阴性)c+d a+c b+d a+b+c+d 灵敏度=阳性预测值= 特异度=阴性预测值= 准确度= 患病率=,a/a+c,a/a+b,d/b+d,d/c+d,(a+d) / (a+b+c+d),(a+c) / (a+b+c+d),10,灵敏度和特异度的应用,区分诊断试验正常和异常的临界点会影响灵敏度和特异度。 灵敏度高的试验适用于 疾病漏诊可能会造成严重后果(AIDS) 有几个假设诊断,为排除某病的诊断 用于筛检无症状病人而该病的发病率又比较低,当试验结果呈阴性时,价值更大,11,灵敏度和特异度的应用,特异度高的试验适用于 凡假阳性结果会导致病人精神和肉体上严重

4、危害时 要肯定诊断时,当试验结果呈阳性时,价值更大,判断题,2. 阳性预测值只受到试验的灵敏度和特异度的影响。,False,评价诊断试验的各种指标(2),预测值(predictive value): 阳性预测值指诊断试验阳性结果中真正患病的比例 +PV = a/(a+b) 阴性预测值指诊断试验阴性结果中真正未患病的比例 -PV = d/(c+d),是否 阳性ab 阴性cd,患病率(prevalence,PREV=a+c/a+b+c+d),经诊断性试验检测的全部病例中,真正“有病”患者所占的比例。 在级别不同的医院中,某种疾病的患者集中程度不同,故患病率差别大,从而影响阳性预测值的结果。,预测值

5、的特点,灵敏度越高的试验,阴性预测值越高; 可作为排除诊断(c 小) 特异度越高的试验,阳性预测值越高; 可作为纳入诊断 (b 小) 患病率的高低对预测值的影响更大。 灵敏度=a/a+c阳性预测值=a/a+b 特异度=d/b+d 阴性预测值=d/c+d 患病率=a+c/a+b+c+d,是否 阳性ab 阴性cd,3.区分诊断试验正常和异常的临界点会影响灵敏度和特异度。,评价诊断试验的指标(5),受试者工作特性曲线 (ROC曲线) (Receiver Operating Characteristic Curve ) ROC曲线是用 真阳性率(灵敏度)作Y轴、 假阳性率(1-特异度)作X轴, 作图所

6、得曲线; 表示灵敏度和特异度之间的关系。,ROC曲线的用途,用来决定最佳临界点 最左上方 根据实际情况的需要 比较两种或两种以上诊断试验的价值 曲线下面积.,4. 似然比是一个稳定的反应诊断试验作用的指标,阳性结果似然比等于(1-敏感度)特异度。,评价诊断试验的指标(6),似然比(Likelihood ratio, LR) 反映诊断试验真实性的一种指标,是可以同时反映灵敏度和特异度的复合指标 即有病者得出某一试验结果的概率与无病者得出这一概率可能性的比值,即概率(而不是简单的正常或异常),评价诊断试验的指标(6),似然比(Likelihood ratio, LR) 试验阳性结果的似然比系真阳性

7、率和假阳性率之比 +LR= =Sen/(1-Spe),是否 阳性ab 阴性cd,评价诊断试验的指标(6),似然比(Likelihood ratio, LR) 试验阴性结果的似然比系假阴性率和真阴性率之比 -LR= =(1-Sen)/Spe,是否 阳性ab 阴性cd,如何评价有关介绍新的诊断试验的文章,文献评阅总的步骤,阅读、评价 4步法阅读 题目,有无兴趣 作者背景 摘要,有无利用价值 正文 3方面的评价 研究结果是否真实? 研究结果是什么? 研究结果是否有助于处理我的病人?,诊断试验评价的目的,选择诊断试验,用于: 诊断疾病:灵敏度和特异度高 筛检无症状患者:简便、经济、安全易接受 疾病随访

8、:重复性好,影响因素少 判定疾病的严重程度 估计疾病的临床过程及其预后 估计对治疗的反应 测定目前对治疗的实际反应,诊断试验的范畴,各种实验室检查 病史和体检获得的临床资料 X线、B超、核素等影像学检查 各种临床公认的诊断标准,诊断试验文献评价的主要内容,研究的结果是否真实? 研究的结果是什么? 研究的结果是否有助于治疗我的病人?,科学性,重要性,实用性,证据等级,诊断试验文献的真实性判断,1.是否与金标准进行盲法对比?,有无金标准(组织学检查、手术、冠脉造影、尸体解剖、长期随访等) 金标准是否正确 有无盲法比较 比较方法 验前概率、似然比(LR) 四格表:敏感性、特异性、ROC曲线、预测值,

9、etc,2.研究对象选择是否正确?,研究对象是否包括轻的、重的、治疗过的、未治疗过的以及患有极易混淆的疾病的病例? CEA AFP,3.是否讲清病例和对照组来源?,病例或对照的来源与能够获得的样本大小有关 肾动脉狭窄性高血压 三级医院专科门诊 vs. 地段医院 病例或对照的来源决定诊断试验的适用人群,病人人群的代表量应足够大、广,以确保检测差异不是由年龄、性别、饮食、活动等非疾病因素所造成。 诊断性试验的真正价值在于它能够鉴别目标疾病与其他容易混淆的疾病或状态。 如Thomson在36例晚期结直肠癌病人的诊断试验中,发现有35例病人癌胚抗原(Carcino-embryonic-antigen)

10、升高,而在正常人和其他的病人则癌胚抗原水平很低。因此,他们断定癌胚抗原在诊断结直肠癌方面很有价值,甚至作为筛选手段。但后来的研究发现,如果将病人人群扩展到早期结直肠癌病人和其他癌症病人以及其他消化道疾病,癌胚抗原的诊断准确度就明显下降。因此,癌胚抗原已不再作为诊断和筛选指标,只作为结直肠癌病人的随访指标。,4.该诊断试验的重复性如何?,试验的准确度和可靠度 测量变异 允许误差 操作者的技术水平 多少研究者? 水平?,5.参考值确定是否合理、可靠?,数据本身的特性 连续性数据、归类性数据 均数加或减2倍标准差 中位数或百分位数 临界点的确定 Cutting point ROC曲线,6.联合试验的

11、评价是否正确?,联合试验(平行或系列)方法是否正确 是否在评价总的诊断价值外还评价了每一试验的价值 联合试验应用是否正确,7.有否介绍试验的具体方法?,试验对象、方法 结果判断方法 客观?主观? 对检查对象饮食、活动药物的限制 注意事项 副反应,证据的重要性,新的试验?老试验的重新评估? 诊断试验的应用是否会改变临床决策? -验前概率和验后概率是否有差异 在不同人群中的重要性可以不同,证据的实用性效用(Utility)分析,病人能否接受 有无副作用 有无介绍那些假阳性和假阴性病人的最后结局 假阳性病人接受治疗 假阴性病人未予治疗的结果 是否存在特别的伦理问题,研究与实际的差异:查获的研究证据往

12、往是较好的医生在较好的医院完成的。不同地区、不同医院的就诊患者具体情况及疾病谱存在很大差异。受试者具体情况及依从性也与实际情况存在差异。,如何利用?,重复性 结果适用与否? 病情程度 有无亚组可参考?资料完整与否? 是否改变我的处理? 试验阈值、治疗阈值 治疗的危险性 vs. 不治疗的危险性,证据的科学性,是否诊断试验与金标准进行了独立的盲法比较? 研究对象选择是否合理? 是否讲清病例和对照组来源? 诊断性试验的重复性如何? 诊断性试验的参考值是否合理、可靠? 如果是联合诊断试验,是否每一个试验的敏感度与特异度等重要指标都进行了测量? 对诊断试验操作步骤、注意事项等是否有详细描述? 效用分析:

13、诊断试验的实用价值是否予以描述?,诊断试验的报告标准 STARD标准,文题 引言 研究方法 统计分析 结果 讨论 结论,科研论文的格式,研究方法,研究设计方案: 研究场所: 人群或社区,医学中心,基层医院,门诊,住院 试验措施及方法:药名、剂量、用法、试剂、仪器 盲法:安慰剂、保证措施 测量指标,判断结果标准 控制偏倚措施,结 果,数据表达完整,剔除,失访应交待 两组基线情况均衡性检验 应同时报告绝对数(10/20例)及相对数(50),同时报告95CI和P值 诊断试验应报告灵敏度、特异度、预测值、似然比、ROC曲线 文字部分和图表部分不重复 统计表与统计图要按统计学规定制作 篇幅:占全文1/3

14、-1/4,讨 论,结合研究发现进行讨论,而不是重复(可能机理、临床应用范围、 对总体推论) 和文献同类研究结果比较,而不是综述 研究不足处讨论,内部外部真实度,练 习,诊断试验文献中的常见问题,1.事先未进行科研设计或设计不够完善合理,目前,许多临床医生还停留在经验总结的水平上,用某种药物或疗法治疗了若干病例之后,才想起总结分析。由于事先没有进行科研设计,所以,分析总结病例时,经常发现资料不完整,有时甚至是病人的诊断、观察指标、疗效评定也未能统一。,2.对随机方法未给予足够重视,对于随机二字的真正含义,许多作者并不是真正理解,错误地将随机与随意等同起来。 随机选取某病例,分成组”,或“选取年病

15、例,随机分成组”的字样。,3.对照组设立不合理或根本就没有对照,报道用某种新药或措施治疗某病若干例,住院治疗后与治疗前相比,症状与体征都有明显好转,结论为该药疗效显著。这种没有对照的研究不能将干预措施的疗效跟心理作用、霍桑效应、疾病的自然缓解等作用结果区分开来。,4.不测量基线资料,国内医学期刊论文有很大一部分不交待两组间的基线资料是否可比,或只在文字上叙述两组的在一般资料有可比性,但不提供具体的数据,使编辑和读者都有无从判断。,5.受试对象的诊断不明确,这也是一个致命的问题,如果连病人的诊断都有问题,都不准确可靠,那么,疗效的评定就不知道是对谁的评定了。如有作者研究用尿激酶治疗心梗,其诊断标准为:胸痛持续30 min;ST段抬高0.2 mV;发病在12 h以内;年龄小于70岁。以上标准不能构成AMI的诊断,其中和冠脉痉挛、心肌缺血等其它原因均可引起。,6.对疗效结果报喜不报忧,不能如实地全面报道,少数研究者为了突出个人研究成绩,自觉不自觉地犯有报喜不报忧的错误。这不仅背离了临床疗效研究的根本意义,也是职业道德所不允许的。特别是目前有一些药厂资助的临床疗效研究,根本就不报道阴性(无效)结果,只公布自认为无妨碍大局的轻微的副作用。这恐怕正是许多人盲目注射丙种球蛋白,流行口服大量维生素E、硫酸锌的重要原因。,7.样本量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论