循证医学考试资料_第1页
循证医学考试资料_第2页
循证医学考试资料_第3页
循证医学考试资料_第4页
循证医学考试资料_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章系统综述和Meta分析

系统综述(systematicreview):被公认为客观地评价和综合针对某一特定问题的研究证据的最佳手

段。

Meta分析(Meta-analysis):作为系统综述中使用的一种统计方法,过去20年间在医学研究领域也得

到了广泛的应用。

引言

目前发表的系统综述和Meta分析存在问题:

•文献查全率不高

•没有列出被排除的试验

•病人的特征范围、诊断标准和治疗范围不明确

•对资料的可合并性的检验较差

•对潜在偏倚的控制和检测不足

•统计分析不规范

•缺少对原始研究的质量评价,未改变方法进行敏感度分析

•缺少对发表偏倚的检测

•缺少对结果应用价值的评估

第一节概述

一、简史

•系统综述的思想最早可以追溯到17世纪

•瑞利勋爵(LordRayleigh,1842~1919)最早描述这样一种方法

•1898年Gould进一步明确

•1904年Pearson首次提出数据合并的概念

专业.专注

•20世纪20年代,Fisher介绍了对若干独立试验结果的P值进行合并的方法

•1955年,首次对治疗的有效率进行Meta分析的文章发表

•1976年,英国心理学家Glass首次将合并统计量的文献综合研究称为Meta分析

•20世纪70年代Chalmers医生经过10年的努力,对产科常规使用的226种诊疗方法进行了系统

综述,由此开启了循证医学的序幕

二、基本概念

系统综述:

针对某个主题进行的二次研究

在复习、分析、整理和综合针对该主题的全部原始文献的基础上进行

综述过程依照一定的标准化方法

是循证决策的良好依据

系统综述的主要特征:

1.清楚地表明题目和目的

2.采用综合检索策略

3.明确的研究入选和排除标准

4.列出所有入选的研究

5.清楚地表达每个入选研究的特点并对它们的方法学质量进行分析

6.阐明所有排除的研究的原因

7.如果可能使用meta分析合并合格的研究的结果

8.如果可能对合成的结果进行敏感性分析

9.采用统一的格式报告研究结果

Meta分析:

专业.专注

简史:

l.Meta(after,morecomprehensive,secondary)希腊词

2.1976年以综合研究结果为目的而对不同的研究结果进行收集、合并及统计分析的一种方法(Glass)

3.1986年对先前研究结果进行统计合并和评述的一种新方法(Sack)

4.1987年用以汇总众多研究结果的各种定量分析(Hedge)

5.1991年是一类统计方法,用来比较和综合针对同一科学问题所取得的研究结果(Fleiss和Gross)

定义:以综合研究结果为目的,通过查阅文献收集与某一特定问题相关的多个研究并对这些研究的结果

所进行的统计分析

优点:几个、甚至上百个研究者在不同地区进行研究并发表研究结果进行整合后所得到的综合结果(证

据)更有说服力

区别:经过统计分析的研究结果(Meta分析)

分析单位:原始数据(一般统计分析)

三、为什么要进行系统综述和Meta分析

海量信息需要整合、避免“只见树木不见森林”、克服传统文献综述的缺陷、连接新旧知识的桥梁

与传统文献综述的区别:

传统文献综述的缺陷、主观综合、缺乏共同遵守的原则和步骤、注重统计学是否"有意义"、等价对待每

篇文献,无权重、定性而非定量

系统综述和Meta分析的功能:定量综合;提供系统的、可重复的、客观的综合方法;通过对同一主题

多个小样本研究结果的综合,提高原结果的统计效能,解决研究结果的不一致性,改善效应估计值;回

答原各研究未提出的问题

第二节步骤和方法

拟定研究计划;收集资料;根据入选标准选择合格的研究;复习每个研究并进行质量评估;提取信息,

专业.专注

填写过录表,建立数据库;计算各独立研究的效应大小;异质性检验;敏感性分析;总结报告

一、拟定研究计划

明确研究目的、提出检验假设、特殊注意的亚组、确定和选择研究的方法和标准、提取和分析资料的方

法和标准

二、收集资料

原则:多途径、多渠道、最大限度

途径:利用多途径广泛收集资料:多种电子资源数据库;参考文献的追溯;手工检索;临床试验注册

登记系统;

注意:未正式发表"灰色文献"(greyliterature.——这些文献中可能包含阴性研究结果:会议专题论

文;未发表的学位论文;专著内的章节;制药工业的报告

三、根据入选标准选择合格的研究

检索大量的文献

根据入选和排除标准进行仔细的筛选

挑出合格的研究进行系统综述和Meta分析

四、复习每个研究并进行质量评估

方法学质量研究设计和实施过程中避免或减小偏倚的程度

精确度(随机误差的程度)一般用可信限的宽度来表示

外部真实性研究结果外推的程度

随机对照试验(RCT)的方法学质量考察:

受试者分组是否真正随机

随机方案是否隐藏

是否详细说明入选标准

专业.专注

组间基线是否可比

研究过程中是否使用了盲法

对失访、退出及不良反应病例是否进行了详细录,是否报告失访原因

是否采用意向分析法(intention-to-treat,ITT)分析结果

患者的依从性(compliance.如何

RCT质量评价的Jadad量表:

记分为1~5分(1或2分:低质量,3~5分:高质量):

随机化方法

恰当如计算机产生的随机数字或类似的方法(2分)

不清楚试验描述为随机试验,但没有告知随机分配产生的方法(1分)

不恰当如采用交替分配或类似方法的半随机化(0分)

盲法:

恰当使用完全一致的安慰剂或类似的方法(2分)不

祥试验称为双盲法,但未交代具体的方法(1分)非

盲法未采用双盲法或盲的方法不恰当(0分)

失访与退出:

具体描述了撤除与退出的数量和理由(1分)

未报告撤除或退出的数目或理由(0分)

五、提取信息,填写过录表,建立数据库

按事先制定的资料摘录表内容提取相应变量并填表

用meta分析软件MetaView或SPSS、SAS、EXCEL等建立数据库

注意对计量资料必须注明单位

专业.专注

比较的两组有x和S;计数资料要使用相同的率来表示双重录入

六、计算各独立研究的效应大小

通常两组间比较时

连续变量平均差值

二分变量比值比(OR)、率差(ratedifference,.相对危险度(RR)

七、异质性检验(heterogeneity)

重要性:Meta分析重要的环节

目的检查各个独立研究的结果是否具有可合并性

产生异质性的原因:研究设计不同;试验条件不同;试验所定义的暴露、结局及其测量方法不同;协变

量的存在

注意:资料的“可合并性”

八、敏感性分析

检查一定假设条件下结果稳定性的方法

目的:发现影响meta分析研究结果的主要因素;解决不同研究结果的矛盾性;发现产生不同结论的原

分层分析:按不同研究特征,将各独立研究分为不同组;按26时21-电6第261法进行合并分析;比较各

组及其与合并效应间有无显著性差异

九、总结报告

可以用直观的图示方法表示

研究结果(线宽表示其95%CI)

研究结果点估计值,其大小代表该研究在Meta分析中的权重

各个研究合并后的效应估计

专业.专注

观察性研究的Meta分析(Meta-analysisofObservationalStudiesinEpidemiology,MOOSE):

随机对照试验的Meta分析报告质量(thequalityofreportingofMeta-analysesofrandomized

controlledtrials,QUOROM)

进行总结报告

第三节分析常用统计方法

一致性检验:是对各研究结果进行的

加权合并:是根据检验结果选用固定效应模型或随机效应模型对各研究的统计量进行的

一、两均数之差的合并和一致性检验

二、两率之差的合并和一致性检验

三、病例-对照研究OR值的合并和一致性检验

第四节偏倚及其检查

一、偏倚的种类

发表偏倚(publicationbias)

定位偏倚(locationbiases)

引用偏倚(citationbias)

多次发表偏(multiplepublicationbias)

有偏倚的入选标准(biasedinclusioncriteria.

(一)发表偏倚

定义:具有统计学显著性意义的研究结果较无显著性意义和无效的结果被报告和发表的可能性更大。

产生原因:医学文献中发表偏倚的问题相当严重

如果meta分析只是基于已经发表的研究结果,可能会夸大疗效,甚至得到一个虚假的疗效

解决办法:好的meta分析应包括所有与课题有关的可获得的资料,但应尽最大可能收集未发表的研究

专业.专注

先行将所有的RCT进行登记,通过这一系统随访并获得所有研究的结果是解决发表偏倚的根本途径

应用统计学方法,计算拒绝结论所需的未发表研究数量的大小,评估发表偏倚对研究结果的影响

(二)定位偏倚

定义:在已发表的研究中,阳性结果的文章更容易以英文发表在国际性杂志,被引用的次数可能更

多,重复发表的可能性更大,从而带来文献定位中的偏倚。

产生原因:英语偏倚(Englishlanguagebias);文献库偏倚(Databasebias)

(三)引用偏倚

产生原因:支持阳性结果的研究比不支持的研究可能更多地被作为参考文献加以引用;杂志的知名度对

文章的引用也会产生影响

(四)多次发表偏倚

产生原因:阳性结果的研究更容易多次发表或作为会议报告,这就使得这些文章更容易被查到并纳入

Meta分析中;Meta分析中如果包括重复数据会高估疗效

(五)有偏倚的入选标准

产生原因:通常文献入选标准由熟悉所研究领域的调查者来制定,那么这个标准就可能受调查者知识的

影响;对入选标准的处理可能导致某些阳性结果的研究被选择,而阴性结果的研究被排除

二、偏倚的检查

Meta分析检查上述偏倚的最佳途径:先根据一个基本的入选标准收集全部的研究;再考虑不同的入选

标准进行彻底的敏感性分析

检查偏倚的程度:漏斗图分析(funnelplots);计算失效安全数(fail-safenumber,Nfs)

(一)漏斗图分析

漏斗图:相对于样本量的效应值,是以研究的效应估计值作为横坐标,样本量作为纵坐标画出的散点图

漏斗图分析:L根据图形的不对称程度判断Meta分析中偏倚有无2.基于治疗效应的精确度随样本量增

专业.专注

大而增加这一事实;样本量大的研究结果集中在图形上部一个较窄的范围内。如果Meta分析中

,图形构成一个倒置"漏斗";如果图形呈现明显的,表明存在(见右图)

样本量小的研究结果通常分散在图形底部很宽的范围内

(二)失安全数

定义:Meta分析中计算需多少阴性研究结果的报告才能使结论逆转

用途:估计发表偏移的程度

研究个数:各个独立研究的Z值

意义:失安全数,说明Meta分析的结果越稳定,结论被推翻的可能性

第九章病因和危险因素证据的分析与评价

第一节病因学研究的基本概念

一、病因(causeofdisease)的定义

1、现代因果观

认识病因必须首先树立正确的因果观。

现代因果观:概率论的因果观或称广义的因果观

概率论的因果观:原因就是使结果发生概率升高的事件或特征,即一定的原因可能导致一定的结果。

2、流行病学的病因观

美国约翰.霍普金斯大学教授Lilienfeld的定义:那些能使人群发病概率升高的因素,就可认为是病因,其

中某个或多个因素不存在时,人群疾病频率就会下降。

流行病学中的病因一般称为危险因素(riskfactor)。

★对实际防制工作有重大意义

不须弄清具体发病机制,即可采取措施,控制疾病流行。如伦敦宽街霍乱的控制。

专业.专注

二、病因模型

(一)流行病学三角(宿主、病因、环境)

A.三者处于平衡状态,表现为健康;

B.环境不变、病因作用增强:如流感V出现变种,引起流感流行;

C.环境不变、宿主状态变化:如宿主免疫力下降;

D.环境因素变化,加强了病原因子的作用:如多雨高温促进蚊虫孳生和病毒繁殖引起乙型脑炎流

行;

•优点:充分考虑了发病的三要素,是比较全面的。

•缺点:①强调了单一的病原因子的作用,这只在传染病中表现明显,而在慢性病和非传染性疾病往

往是多因素的作用,并无特异性的病原物;②将三要素等量齐观,未能反映各自作用的大小。

(二)轮状模型

(1)含义:强调疾病的发生是宿主和环境相互作用的结果,环境又分为生物、理化和社会环境,宿主

还包括遗传内核。

(2)特点:所谓的病因本身就来自于宿主或环境,模型中各部分的相对大小反映了在疾病发生中所起

作用的大小。

(三)病因网(病因网络模型)

现代病因学从多因子复合病因学说观点出发提出了“病因网络模型"这是因为:不同的病因因素或危

险因素可以单独作用影响疾病发生,也可形成病因链,按一定的作用机制表达其致病作用,同时各病因

链间也可互相交错构成网络,这要就形成了一个病因网。

第二节病因学研究的基本过程与方法

在现代流行病学中,病因学研究强调要宏观与微观相结合。

没有宏观,方向不明;没有微观,道理不清。

专业.专注

一般对危险因素、间接病因的研究常涉及环境、营养、社会、经济等因素,这类研究多属于宏观性

研究,对象常常是整个人群、各家系或宿主所处的整个环境;

针对直接病因的研究常常细微至细胞、分子、基因甚至更微观的水平,其研究方法也主要以微观研

究方法为主。

病因学研究的基本过程

(一)提出病因假设

(二)验证病因假设

(三)病因推断

流行病学病因研究的基本步骤

1,描述分布描述e.p

2、形成假设比较组间分布的差异,结合逻辑推理

3、检验假设分析e.p—实验e.p(干预试验)

病例对照队列研究

(回顾性)(前瞻性)

4、病因推断:判断关联性质,并应用因果判断标准进行因果推论。

建立病因假设的推理方法

例:伦敦宽街霍乱流行

两个特点:

1、霍乱是沿陆地或海上的交通线渐次传播。瘴气或飞虫学说

2、霍乱新病例多与已感染霍乱的病例有接触。并观察到由接触患者的时间算起至发病的时间平均在

24-48H之间。

两个假定:

专业.专注

1、霍乱的发生是由于霍乱"病毒”从患者传给正常人的。

2、霍乱是由患者粪便传播的。

两点推论:

1、住在肮脏环境中的人们,得此病者一定较多。

2、在清洁的环境中,即使没与病人接触,也可以因为饮水污染而得病。

四个步骤:

特点分析

建立假设

假设推论

现场调查论证

演绎推理法

(一)提出病因假设

1、进行专题的流行病学调查

根据描述性研究所获该病的分布特征,再运用缜密的逻辑推理与分析提出病因假设。常用Mill's(密

尔氏)法则:

1、求同法(methodofagreement):在不同情况下某病的高发人群中,如果具有某一共同的因素,则

该因素很可能为该病的病因。如放射科医生、原子弹爆炸地区居民、核电站核泄漏后受害人群等白血病

发病率均高,同时几组人群均受过大剂量射线辐射,则射线辐射可能是该病病因。

2、求异法(methodofdifference)两组人群在某病的发病率上有明显差异,同时在某因素的暴露上也

存在明显差异,则该因素可能是该病的病因。如A地区的氟斑牙患病率明显高于B地区,同时A地区饮

水中的氟含量也明显高于B地区,则氟含量高可能是该病的病因。

3、共变法(methodofconcomitantvariation):当某因素出现的频度或强度发生变化时,某病发生的频

专业.专注

率与强度也发生变化,则该因素可能是该病的病因。如随着吸烟量的增加,肺癌死亡率相应增加。

4、类推法(methodofanalogy):如果研究疾病的分布与某已知病因的疾病的分布相似时,则这两种病

可能有共同的病因。如大骨节病地区分布特征与克山病相一致,而克山病已知与缺硒有关,则推想大骨

节病的发生也与缺硒有关。

5、排除法(methodofexclusion):如果一种疾病有多种可疑的病因,当其中多种因素已被排除,则剩

余因素是该病的病因的可能性就大大增加。

2、临床特殊病例的发现

当一种以前不为人们所认识的疾病出现时,最初接触到的常常是临床医生,因此,作为临床医生应

具备敏感的发现问题、分析问题的能力,当遇到一种不明原因疾病时,要仔细全面收集病史和进行体格

检查,然后再有选择地进行必要的实验室或特殊检查,再结合病情的发生、发展情况进行综合分析,提

出假设。

(二)验证病因假设

一般先从快速,简单、花费不大的横断面研究或病例对照研究入手,对病因进行广泛、初步的探

索,在得到肯定结果后再进一步做前瞻性的队列研究,有条件的情况下还可再深入进行实验性研究,这

一过程中,论证力由低一高、直至得出肯定结论。

病因学研究常用的设计方案及特点:

1、生态学研究(群体研究):是一种宏观社会性研究。它是在群体水平上研究因素与疾病之间的关

系,一般是通过分析比较不同生态环境中人群的发病、患病情况来研究疾病与环境中某暴露因素的联

系。例如WHO对47个国家12岁儿童进行含糖食物与患齿患齿情况的调查,得出糖消耗量与儿童患躺齿

率呈正相关的结论。生态学研究所得结果具有较强的不确定性,容易产生一种称之为“生态学谬误”的严

重偏倚,其研究结果论证力弱。

2、现况调查(横断面研究):它常常是采用随机抽样的方法,以某总体人群中的随机样本为对象,对

专业.专注

其在特定时点或时段的健康状况及同时存在的可疑危险因素进行定量研究。由于它不能提供事件发生的

时序证据,因此无法提供合乎逻辑的因果联系证据。它主要用于病因学研究的早期,对病因假设进行初

步验证及为进一步研究提供线索。

3、病例对照研究

(1)传统的病例对照研究:宏观、初探、不能确定因果关系。

(2)巢式病例对照研究(nestedcase-controlstudy):建立在队列基础上、具前瞻性,发病时序与队列

研究相同,常结合分子生物学技术,使宏观与微观结合,能证实因果联系。

(3)病例一队列研究(case-cohortstudy):与前类似,但其对照为随机抽样得到的一个子队列、而不

是病例的配对者,从而增加了对照的代表性。

4、队列研究:有合理的时间顺序,能证实因果联系,但费时、费力,一般是在其他研究获得了较肯定

结论后,用它来验证病因假设。

危险度估计如下(P246-247):

(1)相对危险度(RR)

(2)归因危险度(AR)

(3)病因分值(AR%)

(4)人群病因分值(PAR%)

5、随机对照试验:论证力强,但可行性差。一般是进行干预试验,通过人为干预,看去除了某危险因

素作用后,发病危险是否会下降。

6、实验病因学研究:在上面研究结果的基础上,进一步结合基础医学研究,从病理、病生、细胞、分

子、基因水平进行发病机制研究,对病因的致病性加以证实。

表14-1各种病因学研究设计的论证强度

设计类型性质可行性论证强度

专业.专注

随机对照试验的系统前瞻性好++++

评价

随机对照试验前瞻性视具体情况++++

队列研究前瞻性好+++

巢式病例-对照研究前瞻性好+++

病例-对照研究回顾性好++

横断面调查研究断面性好+

叙述性研究前瞻/回顾好+

第三节病因与危性七因素研究证据的评价

病因学研究的评价原则

一、研究方法的论证强度

二、偏倚的控制

(一)测量性偏倚

(二)回忆偏倚

(三)选择性偏倚

(四)混杂偏倚

三、随访时间及失访率

四、病因与危险因素因果效应的先后顺序

五、病因学研究的因一果相关程度:即因果联系的强度,RR、AR、AR%、OR等。以RR例,RR越大

或越小,则联系越强,RR=1则无联系。

RR与联系强度关系Monson1980

RR联系强度

专业.专注

0.9-1.0;1.0-1.1无

0.7-0.8;1.2-1.4中等

0.4-0.6;1.5-2.9高等

0.1-0.3;3.0-9.9强

0.1<;>10很强

六、因果关系是否符合流行病学规律

首先病因的分布与疾病的分布具有一致性;

另外流行病学调查如发现某一疾病的致病因素或病因,并且采取干预措施之后,能使被研究疾病的

流行得到控制。

这种流行病学的宏观效应,对病因或危险因素的肯定,有着非常重要的意义。

七、是否有充分的生物学证据:暴露和疾病之间的因果联系可以用现代的生物医学知识加以解释。研究

出的病因如果有生物学上的合理解释,则可增加因果联系的证据。

但这取决于当时科学知识的进展,暂时不能解释的现象也可能是由于医学知识发展水平的限制。

八、在不同研究中,病因学的结论是否一致

在不同的地区和单位、不同的研究者,采用不同或相似的研究设计和方法,应用有关测量指标,对

某种疾病的病因学进行研究,所得出的结论如果一致,则该病因结论就比较可信。

三病因推断标准应用举例

幽门螺杆菌感染与十二指肠溃疡

1、时间顺序的证据

•••324例幽门螺杆菌感染者,10年中有11%发生十二指肠溃疡

133例非感染者0.8%发生十二指肠溃疡

感染在前,发病在后

专业.专注

2、关联强度的证据

90%~100%的十二指肠患者存在幽门螺杆菌感染,OR>10。感染者n%在10年中发生该病,

RR>10

3、可重复性证据:许多研究者得到相同结果

4、合理性证据:幽门螺杆菌结合部位在胃窦细胞,可随着胃窦细胞进入十二指肠,引起炎症

5、实验研究(高论证强度)的证据:清除幽门螺杆菌可使十二指肠溃疡愈合,其效果等同于组胺受体

拮抗剂

可以判定幽门螺杆菌感染与十二指肠溃疡有因果关联

第十章疾病诊断证据的分析与评价

第一节评价诊断性试验的意义

诊断试验(Diagnostictest)概念:指对疾病进行诊断的试验方法,它不仅包括各种实验室检查,还包括

各种影像学诊断,如X线诊断、CT等。

评价诊断试验的意义:有助于科学地选择诊断方法;有助于正确地分析和评价诊断结果。

第二节诊断性试验研究的方法与评价条件

一、确定金标准

“金标准"(Goldstandard.指当前为临床医师公认的诊断某种疾病最可靠的方法,也称为标准诊断。

应用金标准可以正确区分"有病"、"无病";对诊断试验的评价必须有金标准为依据;

常用的金标准:

(1)病理组织学诊断:如肿瘤;

(2)外科手术发现:如畸形或某些肿瘤;

(3)特殊影像造影:如冠状动脉造影诊断冠心病;

专业.专注

(4)对目前尚无特异诊断方法的疾病,可采用由临床专家共同制定的、公认的综合诊断标准,如诊断

风湿热的Johes标准;

(5)长期临床随访所获得的肯定诊断。

二、选择研究对象

1、病例组:由金标准确诊的"有病"的患者组成。

病例组应包括各种类型,如病程(早、中、晚期),不同病情(轻、中、重),不同临床类型(典

型、不典型)及并发症(有、无并发症)等情况。

2、非病人:由金标准证实没有患目标疾病的“无病"者所组成。为明确鉴别诊断的价值,最好是容易与

该病相混淆的其他疾病患者。

三、比较诊断试验与金标准的结果

1、将研究对象用两种诊断方法进行同步、盲法判定;

2、最后将资料收集整理后进行分析。

金标准合计

有病无病

诊断性试验+a(真阳性)b(假阳性)a+b

-c(假阴性)d(真阴性)c+d

合计a+cb+dN

四、样本大小的估算:按照估计总体率样本含量的方法,分别计算病人组及非病人组的样本含量。

所需已知条件:(1)诊断试验的灵敏度P1(2)诊断试验的特异度P2(3)允许误差5

第三节诊断性试验的评价指标

诊断试验的评价指标

1、科学性:标准(可靠性、真实性)、收益(预测值)

专业.专注

2、实用性

1、真实性(Validity)

①灵敏度(sensitivity):又称真阳性率,指实际有病者中,被试验正确判定为病人的比例。

灵敏度:Sen=a/(a+c)xlOO%它反映该项试验正确检出病人的能力。

②特异度(Specificity):又称真阴性率,指实际无病者中,被该试验正确判定为非病人的比例。

特异度:Spe=d/(b+d)xioo%它反映该项试验正确排除患某病的能力。

③准确度(accuracy):又称符合率。指诊断性试验检测为真阳性和真阴性在总受检例数中的比例。

准确度Acc=(a+b)/(a+b+c+d)xlOO%其值越大,反映诊断试验检测结果越接近于真实情况。

④假阳性率(falsepositive:又称误诊率指在无病者中,被该试验错判为有病的比例。

假阳性率=b/(b+d)xl00%.其值越大,反映该项试验误诊者越多。特异度和误诊率互补。

⑤假阴性率(falsenegative):又称漏诊率指有病者中,被该项试验错判为无病的比例。

假阴性率=c/(a+c)xl00%.其值越大,反映该项试验漏诊者越多。灵敏度和漏诊率互补。

⑧阳性似然比(positivelikelihoodratio)即诊断试验中,真阳性率与假阳性率的比值。

阳性似然比:(a/(a+c))/(b/(b+d))

表明诊断试验阳性时患病与不患病机会的比值,比值愈大则患病的概率愈大。

⑨阴性似然比(negativelikelihoodratio)即诊断试验中,假阴性率与真阴性率的比值。

阴性似然比:(c/(a+c))/(d/(b+d))

表明诊断试验阴性时,患病与不患病机会的比值

2、可靠性(reliability):即可重复性。指用同一种诊断方法在同样条件下,对相同的人群进行一次以

上的检查,获得试验结果的稳定程度。

影响诊断试验可靠性的因素有:

1、测量仪器、试剂等实验条件中所致的变异;

专业.专注

2、观察者的变异;

3、被观察者的变异。

Kappa分析:考虑了机遇因素对一致性的影响K叩pa值=实际一致性/非机遇一致性Kappa值

=55.14%

Kappa检验:Kappa检验可用来检验诊断试验测量的可靠性,Kappa检验是校正了"机遇"的一种一致

性检验,其统计量"K"值的波动范围是-1~+1。

计算公式Po-Pe

K=----------------

1-Pe

Po:观察一致率Pe:机遇一致率

K值分级

LandisKoch(1977)

0.81-1.00完全一致

0.61-0.8基本一致

0.41-0.6中等一致

0.21-0.4一般一致

0-0.2缺乏一致

Fleiss(1981)

0.75-1一致很好

0.4-0.74一般一致

0.01-0.39缺乏一致

3,诊断收益:指诊断试验结果能正确判断患病与否的能力。评价指标有预测值、成本效益分析、决策

专业.专注

分析等。

(1)阳性预测值(positivepredictivevalue.指试验结果阳性中,实际患病者的百分率。

阳性预测值=a/(a+b)x100%

(2)阴性预测值(negativepredictivevalue)指试验结果阴性中,非患者的百分比。

阴性预测值=d/(c+d)x100%

患病率,预测值,似然比间的关系

当已知某病患病率时,可以用某诊断试验的阳性似然比来计算阳性预测值,即当该试验为阳性时有病的

概率。

患病率=验前概率1%1%55%

似然比1512010

验前比=验前概率/I-验前概率0.01010.01011.2

验后比=验前比X似然比0.15151.212112

验后概率=验后比/1+验后比13%55%92%

注意:当验前概率=患病率,则验后概率=阳性预测值当验前概率H患病率则验后概率,阳性预测值

4、实用性

(1)灵敏度高、特异度高,重复性好;

(2)可行性好即简单、易行,易于操作者掌握;

(3)能被受试者接受即无损伤、无痛苦、无副作用;

(4)价格便宜;

(5)出结果周期快。

第四节诊断性试验的应用及临床意义

一、诊断试验指标的稳定性

专业.专注

稳定的指标:Sen、Spe不稳定的指标:+PV、-PV。

预测值受两方面因素的影响:

1、受试人群患病率高低的影响。现患率T、阳预"阴预1,反之亦然。如图15-1。

2、诊断试验本身的特性(灵、特)的影响。灵"特3、阳预3、阴预T,反之亦然。

二、ROC曲线

1、含义:ROC曲线(ReceiverOperatorCharacteristicCurve,又称受试者工作特性曲线,在诊断性试

验中,主要用于正常值临界点的正确选择。

2、制图方法:研究者假设一系列界值(截断值),在每个截断值处,计算其灵敏度、特异度,然后以灵

敏度(真阳性率)为纵座标、1-特异度(假阳性率)为横坐标作图,将各点联成曲线即为ROC曲

线。

制图要求最少有五组连续分组的数据。

3、主要用途:

(1)诊断界值的选择:ROC曲线中最靠近左上角的那一点即为最佳临界点,因为此点上灵敏度与特度都

比较高,而假阳性与假阴性最少。

(2)比较两种以上诊断试验的诊断价值以便对诊断试验作出最佳选择。

ROC曲线常用来决定最佳临界点,通常最接近左上角那一点,可定为最佳临界点

ROC曲线也可用来比较两种和两种以上诊断试验的诊断价值,从而帮助临床医师作出最佳选择。

三、多项试验的联合应用

为提高诊断试验的灵或特,可采用多种试验方法检查或重复一种检查方法,此种形式称为联合试验。

表4-6联合试验诊断糖尿病的结果

试验结果糖尿病病人非糖尿病人

尿糖血糖

专业.专注

+-1410

-+3311

++11721

--357599

合计1997641

并联试验:

试验结果病人非病人

+14+33+11710+11+21

-357599

合计1997641

灵敏度=(14+33+117)/199xl00%=82.41%

特异度=7599/7641xl00%=99.45%

幻灯片36

串联试验:

试验结果病人非病人

+11721

-14+33+3510+11+7599

合计1997641

灵敏度=117/199x100%=58.79%

特异度=(10+11+7599)/7641xl00%=99.73%

专业.专注

第五节诊断性试验证据的评估

1.是否与“金标准”进行同步盲法比较和评价;

2.研究对象的代表性、有效性;最好能包括各型病例及易于混淆的病例。

3.是否采用了盲法

4.试验的重复性

5、临界值确定的方法是否合理、可靠

诊断界值水平对指标的影响(见下图)

界值t灵敏度I、特异度t、漏诊率t、误诊率I

界值1灵敏度t、特异度1、漏诊率1、误诊率t

如何选择:

①为确诊某种疾病时,需尽可能减少误诊,应提高界值;

②如要尽可能无遗漏地发现病人,即要减少漏诊,则应降低界值水平;

③一般情况下,可将界值定在误诊率=漏诊率的位置上。

6、是否是同类试验中最佳的诊断方法

7、试验的具体操作与结果判断是否明确

8、实用性评价.可行性、价格、是否能被接受。

第十一章疾病防治的循证医学分析与评价

第一节防治性研究的重要意义

不经过严格的研究方案证实的一些经验主义的防治措施常常可能是错误的。

增强免疫力的错误疗法:鸡血疗法;食用胎盘。

感冒的错误疗法:捂汗疗法;抗菌消炎疗法;运动疗法;饥饿疗法;多种药物联合疗法

专业.专注

防治性研究主要解决两个方面的问题:

1、有效性:即“防治措施”是否有真正的临床重要意义,是否能真正改善或预防临床的不利结局。

要注意下面两种可能的情况:①该措施的效应评价来自严格的科研设计,结果真实可信,但只能产生有

限的效果,不能使临床结果产生明显的改善,无显著的临床意义。②自称为具有“显著”临床效果的措

施,但研究中因观察对象数量少、缺乏有力的措施避免偏倚的影响,或在一组具有特别特征的人群中观

察,或对效果大小的判定缺乏可靠的方法,都会使所得结果失去真实性。

2、实用性:即“收益"是否超过"损失”,由采用的防治措施可能带来的效益是否超过由其同时引起的副

作用。这是防治性研究的先决条件,无论措施本身的效力如何,一定要坚持产生的防治效益必须超过其

同时引起的副作用。

临床试验的分期:

1、I期临床试验:试验人数约10~30人。试验目的:为临床药理学和人体安全性评价,以观察人体

对药物的耐受程度和药物代谢动力学,确定安全剂量,以及副作用,为制定给药方案提供依据。

2、n期临床试验:试验人数约100~300人。试验目的:初步评价药物的有效性,并进一步评价安全

性,推荐临床用药剂量。

3、m期临床试验:试验人数约1000~3000人。试验目的进一步确定有效性,监测副作用,同标准

疗法比较,并收集安全用药的信息。

4、IV期临床试验:试验目的:新药批准上市后的监测,以获得广泛使用后不同人群的长期用药效果,

以及远期或罕见副作用的发生率。

临床试验(clinicaltrial)

随机化分组

简单随机分组(simplerandomization)、分层随机分组(stratifiedrandomization)、整群随机分组

(clusterrandomization)

专业.专注

简单随机分组(simplerandomization)

例如:将10名研究对象随机分配到甲(实验组)、乙(对照组)两组,先将研究对象编号,然后从随

机排列表中任选一行数字,取个位数字后,排列如下:

研究12345678910

对象

编号

随机6154078392

数字

所属甲乙乙甲甲乙甲乙乙甲

组别

优点:简单易行,随时可用,不需要专门工具。

缺点:要求在随机分组前抄录全部研究对象的名单并编号。

因此,研究对象数量大时,工作量大,有时难以做到。但它是理解和实施其他随机分组方法的基础。

分层随机分组(stratifiedrandomization)

例如:根据实验研究要求,将年龄分成3层,即0~4岁、5~9岁、1。~14岁;性另吩成2层,即男

性、女性;种族分成3层,即汉族、壮族、其他族。共计分成18层,每层研究对象随机组。

优点:增加组间均衡性,提高实验效率

缺点:分组前需要有一个完整的研究对象名单。这一点上具有简单随机分组同样的缺点

整群随机分组(clusterrandomization)

优点:实际工作中易为群众所接受,抽样和调查比较方便,节约人力、物力,因而多用于大规模调查。

缺点:抽样误差大,分析工作量大。

设立对照

专业.专注

原因:不能预知的结局、霍桑效应(Hawthorneeffect)、安慰剂效应(placeboeffect)、潜在的

未知因素的影响

方式:安慰剂对照、自身对照、交叉对照

1)标准对照(standardcontrol):以目前临床公认的治疗某病最有效、最规范的治疗方法施加给对

/昭O

效果稳定,能保证对照组成员受到合理治疗。是最规范、最常用的一种对照方法。

2)空白对照(blankcontrol):对照组在试验期间不给任何处理,仅对他们进行观察、记录结果。对

照组成员在试验阶段未得到任何治疗,可造成不良后果,应用时要特别谨慎.可用于病情轻、稳定,即使

不给任何治疗也不会导致病情恶化的疾病如近视。

3)安慰剂对照(placebocontrol):给对照组成员施加的是一种没有药理活性,但其色、形、味均与

试验的新药相同的制剂。实质上也是一种空白对照。目的是为消除主观因素的影响。

4)自身对照(selfcontrol):受试者要接受前后两个阶段、两种不同的处理措施,然后对其效果进行

比较。

合格的对照措施+洗脱期研究因素+

研究对象(第一阶段)-(wash-out)(第二阶段)-

可比性好、节约样本量,但难以做到双盲。

5)交叉对照(intersectioncontrol):是一种特殊的自身前后对照试验。

除自身对照优点外,因有同期对照结果更可靠。

6)潜在对照(latentcontrol):试验期间不设对照,而是以某病以往的高病死率或治疗的高失败率为

潜在的对照。仅在特殊情况下适用,受到很大的局限。

7)历史对照(historicalcontrol):也称文献对照。试验期间不专门设立对照,而是将该次试验的结

果与过去文献资料上类似方法的疗效进行比较。对照组与试验组可比性很差,一般不提倡。但如恶性肿

专业.专注

瘤疗效的评价,由于非研究因素的作用较弱,且不同时期的诊断标准都比较统一和严格。

盲法的应用

单盲(singleblind.研究对象不知分组情况

双盲(doubleblind.研究对象、研究者不知分组情况

三盲(tripleblind.研究对象、研究者、负责资料收集者不知分组情况

第二节防治性研究的方法

一、立题:临床干预试验立题的根本依据:

(1)对欲研究的“处理措施”的作用原理、功用、效力等有一个切实的基本估计。

(2)对于所研究疾病在接受该处理措施后其结局所受的影响(预防发病、治愈缓解、改善预后等)有

较正确的估计。

立题要有科学性、创新性、可行性。

这里所指的防治措施包括了可以增进健康的所有干预措施。总体上可分为以4类:(根据作用效应

进行分类)

⑴特异免疫、预防发病:主要是免疫疫苗效果的研究,另外有些病因明确、单一的慢性病也可预防。

⑵根治疾病、治愈患者:主要针对一些急性病,如手术切除治疗阑尾炎、抗生素治疗感染性疾病。(3)

缓解症状防止恶化:主要针对一些难以治愈的慢性病.如降糖药对于糖尿病,降压药对于高血压病等。(4)

改善预后、延长寿命如脑血管意外后期的康复治疗措施。

二、设计方案的选择

基本原则:

1、设计方案的科学性所采用的设计方案所获得的研究结果应是真实可靠的,科学的论证强度高。防

治性研究最佳的设计方案首选为随机对照试验,其研究结论真实性强,可靠性高。

2、设计方案的可行性即所采用的设计方案在具体的研究单位执行时,在研究的条件、对象的来源、

专业.专注

人力、物力等方面要有所保障;可望在预期的研究时间内能完成任务。

三、研究对象的选择

同一种疾病其病程长短、病情轻重、临床分型、是否伴有并发症等的不同将直接影响防治措施的效

果,所以在选择研究对象时:

1、首先要制订诊断标准(diagnosisstandard.尽量采用WHO所建议的国际通用标准。另外诊断疾病

所采用的检验方法和仪器型别都应符合统一诊断标准的规定。

2、制订纳入标准(conclusionstandard,纳入标准的要点是从复杂的研究群体中,选择临床特点相对

单一的对象进行研究。如:LieKI等进行利多卡因预防心肌梗死后心室颤动的临床试验,进入试验病人

条件除符合心肌梗死诊断标准外,规定:A.症状发作后6小时内;B.70岁以下两条纳入标准。

3、制订排除标准(exclusionstandard,在纳入标准的基础上再加入排除标准,能更好地控制非研究因

素的干扰。如研究者规定:伴有心源性休克、充血性心衰、完全房室传导阻滞、持续心动过缓等为排除

标准。但要注意的是严格的纳入或排除标准虽然提高了可比性,但失去了整体的代表性,可能会影响到

结果的外推。

选择研究对象应注意的问题:

a.选择的对象应是对干预措施能产生反应的人群;如某疫苗的预防效果评价时,应选择某病的易感人群

为研究对象。b.选择症状发作频繁者为研究对象;如平喘解痉药物的疗效试验,最好选择近期频繁发作

支气管哮喘的患者为研究对象。c.选择干预对其无害的人群为研究对象;如在新药临床试验中,往往将

老年人、儿童、孕妇除外,因为这些人对药物易产生不良反应。d.选择能将实验坚持到底者为研究对

象;如一种新药治疗脑出血后肢体瘫痪的临床试验研究,常将伴有严重肝、肾疾病者或伴有癌症的患者

除外。

e.选择依从性好的对象;所谓依从性是指研究对象能服从设计安排并密切配合列底的可能性。

关于'新病例'写'1日病例’的问题:

专业.专注

从原则上讲,新发生而且尚未治疗的患者用作疗效评价是最佳选择。因为旧病例从发病到现在存有

多种因素干扰,特别是有过治疗史的,很可能在不同程度上留有其影响。

但仅用新患则难以累积足够的病例,须在较多机构且长时间地持续收集病例,而这样又有可能混入

新的干扰因素。所以有些已经治疗的患者,可以在其以前所用药停药并经过一段洗脱期(washout)

后,再以作用原理完全不同的药物投用,这样对药效评价有时可不产生影响。

但注意:使用旧患时,要充分考虑其背景因子,且判断定疗效时要慎重。

四、估计样本量大小

干预试验中影响样本大小的主要因素:

①干预措施本身效力的大小:即观察组与对照组出现的结果差异的大小。

②第I型(a)错误出现的概率:a越小,要求的显著性水平越高,则所需样本量越大,常定为0.05或

0.01o

③第II型⑹错误出现的概率:B越小,把握度越高,则所需样本量越大,一般常将B定为0.20;0.10;

0.05。

④单侧检验或双侧检验。

⑤研究对象分组数量:分组越多,则样本量则大。

样本量的计算要注意:

①以上计算的N是一组人群的大小,如果两组人数相等,则全部实验所需要的样本量为2N;

②实验中a和B值一般由研究者根据需要确定,如要使样本大一些以保证结果的可靠性,则可将其数值

定得更小;

③要考虑失访对结果的影响,最好在计算的样本量基础上增加10-15%作为实际的样本量。

五、效果衡量的指标及终点的选择

原则:能最大限度地反映处理措施的效应。

专业.专注

(1)选与处理因素有特异相关性的指标:如抗结核治疗应选用痰菌阴转为指标。

(2)选用客观性强的硬指标:不选以主观感觉为主的软指标。

(3)选用灵敏度高的指标:如某药治疗缺铁性贫血,指标:a(症状)、b(体征)、c(Hb)、d(血清铁蛋白

含量)a、b、c只有在缺铁较明显时才能出现变化,而d则灵敏。

(4)选用精确性强的指标,即重复性好的指标。

分类:

(1)定性——计数、⑵定量——计量常两者结合

常用指标:

(1)防:保护率、效果指数。

(2)治:治愈率、有效率、N年生存率、病死率。

观察终点的选择

应结合具体的专业知识定出合理的观察终点,不能太短(可能有的效应尚未显示出来),也不能

太长(造成失访者t,也可能错过效应高峰期)。

第三节单个防治性研究证据的分析评价

一、证据的真实性评价

(一)是否真正随机分配:这是决定防治研究的结果是否真实的最关键问题;强调随机对照试验结果的

真实性和可靠性,并不排斥其他非随机试验的结果,但在判定和解释结果时,其治疗效果的真实性有所

差别。

(二)患者的随访是否完全:任何观察病例的丢失,都会直接影响最后的结果和证据的真实性。要求丢

失病例控制在10%以内。还要注意观察期是否合适。

(三)所有随机分配入组的病例是否均纳入分析:意向性治疗分析。

(四)防治措施是否在盲法下执行

专业.专注

(五)除了观察的防治措施以外,两组的其他处理措施是否完全一致

(六)对随机入组的两组病例基线状况分析

二、证据的重要性评价

(一)防治措施证据的效果评价

反映处理效应和临床意义的综合性指标:

设(1)CER:对照组某结局事件发生率(controleventrate)

EER:试验组某结局事件发生率(experimenteventrate)

RRR:相对危险度的减少(relativeriskreduction)

RRR二(CER-EER)/CER可用百分率表示

RBI:相对获益的增加(relativebenefitincrease)

RRI:相对危险性的增加(relativeriskincrease)

(2)ARR:绝对危险性降低率(absoluteriskreduction)

ARR=CER-EER

ABI:绝对获益增加率(absolutebenefitincrease)

ARI:绝对危险增加率(absoluteriskincrease)

以上两组指标意义不同:第(1)组三个指标都只能反映不同处理组某结局事件发生率的相对增

减量,不能反映临床相关危险性到底有多大、无法区分不同处理效应的具体大小;第(2)组三个指标

则反映了不同处理效应的具体差值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论