临床科研设计系统评价与meta分析1_第1页
临床科研设计系统评价与meta分析1_第2页
临床科研设计系统评价与meta分析1_第3页
临床科研设计系统评价与meta分析1_第4页
临床科研设计系统评价与meta分析1_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

临床科研设计系统评价与meta分析1肯循证医学概述肯系统评价肯临床证据评价肯统计学方法肯Meta分析1.临床医生的挑战选择最事宜的诊断方法提供最安全、经济、有效的治疗方法进行最精确的预后估计产生临床证据——临床研究应用临床证据——循证实践循证医学的目的:解决临床问题发病和危险因素—认识与预防疾病•疾病的早期诊断—提高诊断的准确性•疾病的正确合理治疗—应用有效的措施•疾病预后的判断—改善预后,提高生存质量•合理用药和促进卫生管理及决策科学化★循证医学是遵循证据的医学,是慎重、准确和明智地应用当前所能获得的最好的研究证据、同时结合临床医生的个人专业技能和多年临床经验,考虑患者的价值和愿望,将三者完美地结合制定出患者的治疗措施。•实施循证医学意味着医生要参酌最好的研究证据、临床经验和病人的意见进行临床决策。循证医学的特点“证据”及其质量是实践循证医学的决策依据临床医师的专业技能与经验是实践循证医学的基础充分考虑病人的期望或选择是实践循证医学的独特优势高质量证据的共同特征•科学和真实•系统和量化•动态和更新•共享和实用•分类和分级•肯定、否定和不确定高质量证据的共同特征 科学和真实原始研究的设计科学偏倚控制好实施过程质量有保障结果分析方法正确研究资料能溯源•能经受时间和实践检验偏倚的分类•选择偏倚-由于选入的研究对象与未选入的研究对象某些特征上存在差异而引起的误差。如病人到哪个医院就诊;不同病种有不同的入院频率;•信息偏倚-在收集整理信息过程中由于测量暴露与结局的方法有缺陷造成的系统误差•混杂偏倚-研究某个因素与某种疾病的关联时,由于某个既与疾病有制约关系,又与所研究的暴露因素有联系的外来因素的影响,掩盖或夸大了所研究的暴露因素与疾病的联系高质量证据的共同特征——系统和量化系统:是指在严格科学的顶层设计下,全面、科学、分步骤的证据生产和使用。量化:理想的证据应是定量证据,即“拿数据说话”。高质量证据的共同特征——动态和更新随着时间的变化不断有新的证据出现;随着时间的变化不断有过去的证据被证明是错误的;不断淘汰旧证据、补充新证据。高质量证据的共同特征——共享和实用证据作为解决问题的知识产品,应该为人类所共享。学术证据应加工成能满足不同用户需求,易于使用和乐于接受的形式。(论文、系统综述、综述、临床指南、标准等)高质量证据的共同特征——分类和分级•不同的原始研究,存在内部真实性和外部真实性差异,应对证据有明确的分类和分级,便于临床医生和患者做出决策。高质量证据的共同特征——肯定、否定和不确定•肯定、否定和不确定都可能是研究的合理结果,但需要证据支持。•统计学检验p〈0.05,A优于B——肯定•统计学检验p〈0.05,A劣于B——否定•统计学检验p〉0.05,A=B 样本量大时,肯定;样本量小时,不确定。实践循证医学的困难1•缺乏高质量的证据,缺乏查询和评价最佳临床证据的条件和经费;2•目前绝大多数证据,尤其是高质量证据主要是英文,一般医生查阅、理解困难;3•临床医生和管理者时间有限;4•查到群体病人治疗有效的证据,难以应用于指导解决每一个不同个体病人的实际问题;5.不是总能找到循证治病有效或有实践参考价值的病例作参考。实践循证医学的困难一一高质量的证据高质量的原始文献的缺乏:研究设计的档次不高、研究数据的不真实、研究过程无质量控制措施。文献检索的条件:国外全文数据库资源的获取、文献查全等影响因素。利益关联者的证据偏倚:医药公司赞助课题发表的证据。实践循证医学的困难——外语水平英文是应用最多的语言,也有日文、韩文等,带来文献检索和阅读原文的苦难;外语水平是限制大多数医生实践循证医学的最大难题。实践循证医学的困难——充分的研究时间文献检索、阅读原文、系统评价等一系列过程需要花费大量时间,临床医生的研究时间有限,就会带来实践和研究周期的延长,影响时效性。新证据的不断出现,要求研究周期不能过长。实践循证医学的困难——方法学的掌握文献检索策略统计学方法——meta分析临床流行病学——科研设计方案•工具软件的应用 ReMan、Express文献管理、R软件、SAS等RCT/meta分析/临床指南都只是循证医学的证据。循证医学是一门学科,更是一种方法,体现在我们日常处理病人的过程中。系统评价(Systematicreview):是一种严格的评价文献的方法,它针对某一个具体的临床问题,采用临床流行病学减少偏倚和随机误差的原则和方法,系统、全面地收集全世界所有已发表或未发表的临床研究结果,筛选出符合质量标准的文献,进行定量合成,获得较为可靠的结论。针对某个主题进行的二次研究,在复习、分析、整理和综合针对该主题的全部原始文献的基础上进行。综合大量类似研究,是循证决策的良好依据。系统评价过程依照一定的标准化方法。系统评价的特点肯清楚地表明题目和目的;肯采用综合检索策略;肯明确的研究入选和排除标准;肯列出所有入选的研究;肯清楚地表达每个入选研究的特点并对它们的方法学质量进行分析;肯阐明所有排除的研究的原因;肯使用meta分析合并合格的研究的结果;肯对合并的结果进行敏感性分析;肯采用统一的格式报告研究结果。传统文献综述肯综述是查阅了某一专题在一段时期内的相当数量的文献资料,经过分析研究,选取有关情报信息,进行归纳整理,作出综合性描述。特点:肯①综合性:综述要“纵横交错”纵向的进展,横向的比较。肯②评述性:对所综述的内容进行综合、分析、评价,反映作者的观点和见解。肯③先进性:要搜集最新资料,获取最新内容。Cochrane系统评价Cochrane系统评价是指在Cochrane协作网统一工作手册指导下,在相应Cochrane评价组编辑部指导和帮助下所完成的系统评价。Cochrane系统评价的指导思想•以病人为中心(当今世界潮流)帮助临床决策,解决病人的问题•采用与病人密切相关的判效指标Patientoriented/Patientcenteredoutcome•以实践者(医生、政府决策者)为主要使用者复杂问题简单化、科学语言白话化Cochrane系统评价完成过程选题及在专业评价组注册题目•完成研究方案(Protocol)送专业评价组编辑部审批修改•接受和发表完成全文送专业评价组编辑部审批•修改•接受和发表•随时更新SR步骤(2008CochraneSR手册)建立一个规范化的问题制定纳入研究的标准检索研究筛选研究和收集数据研究质量的严格评阅分析数据并在可能的情况下进行meta-分析解决报告的偏倚陈述结果并制作结果摘要表格解释结果,得出结论SR1:建立一个规范化问题(PICO_S始终贯穿SR)PopulationInterventionComparatorOutcomesStudydesign提出临床问题一PIC0原则Ppopulation/patients人群/病人群-关心的是哪一类病人群或对象Iintervention/exposure干预/暴露-我们所感兴趣的治疗策略,诊断试验或暴露是什么?如一种药物、食物,外科手术方式,诊断试验或暴露于一种化学?Ccomparisonorcontrol比较物或对照-我们感兴趣的干预措施相比较的对照物、处理策略、试验或暴露是什么?Ooutcome结果-病人经干预处理后得到的结果是什么?SR2:纳入标准和排除标准•研究对象(Participants)干预措施(Interventions)结果(Outcome):PrimaryOutcome•研究类型(根据研究问题选择,干预研究:随机对照研究RCT)SR3:检索研究制定检索词、检索策略:PICO•全面检索资料:Pubmed、Cochrane、EBMbase、OVID、Google、国内全文数据库、报告、会议、摘要等所有可用资源文献管理软件:NoteExpress、EndNoteSR4:筛选研究和提取信息•评价研究合格性,两位以上的研究着独立提取数据;•区分study与report;•数据收集表的设计要符合研究目标,正式应用前需要试用;•报道的数据可能格式不同,需要转换成适合meta分析的格式。SR5:文献评阅要用批评的眼光看结果A.研究结果是否真实?(真实性,validity)B.研究结果是什么?(可靠性,reliability)C.研究结果是否对我的患者有帮助?(应用性,applicability)CochraneHandbook标准随机分配方法隐蔽分组盲法结果数据的完整性选择性报告研究其他偏倚来源SR6:数据分析•两分变量(e.g•死/活)•连续变量(e.g.胆固醇水平)数据分析——二分类变量•从各研究中提取出四格表•将数据输入RevMan软件•对OR、RR值进行Meta分析(特殊情况下对RD进行Meta分析)•使用NNT时,需要同时提供对照组的风险范围(rangeofbaselinerisks)数据分析——连续性变量从各研究中提取出各组的研究例数、平均值和标准差;•正态分布数据进行Meta分析是安全的,偏态分布数据需特殊处理;若各研究使用统一的单位或量表,则对平均值差进行Meta分析;若各研究的单位或量表不同,则对标准平均值差进行Meta分析。数据分析——异质性分析(一)异质性:各研究结果之间的差异,包括:多样性(Diversity):各研究之间真实的差异,如因研究对象,干预措施、剂量等不同引起的差异;2•偏倚(Bias):如因研究设计、质量控制等引起的差异。数据分析——异质性分析(二)异质性检验统计检验:X2检验,Q值越大,异质性越大量化异质性:I2值,12值越大,异质性越大数据分析——异质性分析(三)异质性较大时,查提取的数据:更换统计方法:异质性不明显时:考虑固定效应模型(fixedeffectmodel)异质性明显时:考虑不做Meta分析,或随机效应模型(random-effectmodel)寻找异质性原因:亚组分析、meta回归等数据分析——异质性分析(四)固定效应模型假定所有研究的治疗效果均相同;各研究间的不同结果仅由随机误差引起。随机效应模型各研究之间的治疗效果均不同;各研究之间的治疗效果服从一定的分布(一般为正态分布)。SR7:报告的偏倚SR8:陈述结果•森林图结果总结表SR目的是为卫生决策服务,所以同时要用科普语言SR9:解释结果,得出结论考虑研究的局限性:如发表偏倚考虑证据强度效应大小,变异比较其它综述考虑可应用性外延性:结果还适合于哪些患者治疗描述:若应用这个治疗,需详细描述考虑benefit/harm考虑经济学评价可支付性相对于其它治疗考虑进一步研究是否需要进一步研究来明确答案得出结论•综述的结果对临床实践的影响•综述的结果对进一步研究的影响临床证据评价按研究方法分类原始临床研究证据:是指直接在受试者中进行单个有关病因、诊断、预防、治疗和预后等试验研究所获得的第一手数据,进行统计学处理、分析、总结后得出的结论。二次临床研究证据:指尽可能全面收集某一问题的全部原始研究证据,进行严格评价、整合、分析、总结后所得出的综合结论,是对多个原始研究证据再加工后得到的证据。非研究证据:主要包括专家意见、个人经验、智慧、诀窍、常识等。二次研究证据的主要分类•系统评价/meta分析•临床实践指南临床决策分析临床证据手册卫生技术评估实践参数按研究问题分类•病因临床研究证据•诊断临床研究证据•预防临床研究证据•治疗临床研究证据•预后临床研究证据按获得渠道分类•公开发表的临床研究证据•灰色文献:灰色文献(grayliterature)是一种新型信息源,一般指非公开出版的文献。灰色文献品种繁多,包括非公开出版的政府文献、学位论文;不公开发行的会议文献、科技报告、技术档案;不对外发行的企业文件、企业产品资料、贸易文件(包括产品说明书、相关机构印发的动态信息资料)和工作文件;未刊登稿件以及内部刊物、交换资料,赠阅资料等。灰色文献流通渠道特殊,制作份数少,容易绝版。虽然有的灰色文献的信息资料并不成熟,但所涉及的信息广泛,内容新颖,见解独到,具有特殊的参考价值。•在研的临床研究证据•网上信息牛津循证医学中心证据质量标准牛津循证医学中心(OxfordCentreforEvidence-basedMedicine)标准在证据分级的基础上整合了分类的概念,可用于病因、预防、诊断、预后、治疗、危害、经济学分析等七个方面,是循证医学实践的经典标准。A级证据:具有一致性的、在不同群体中得到验证的随机对照临床研究、队列研究、全或无结论式研究、临床决策规则;B级证据:具有一致性的回顾性队列研究、前瞻性队列研究、生态性研究、结果研究、病例对照研究,或是A级证据的外推得出的结论;*C级证据:病例系列研究或B级证据外推得出的结论;*D级证据:没有关键性评价的专家意见,或是基于基础医学研究得出的证据。GRADE标准特点及应用1.由一个具有广泛代表性的国际指南制定小组制定2.明确界定了证据质量和推荐强度3.清楚评价了不同治疗方案的重要结局4.对不同级别证据的升级与降级有明确、综合的标准5.从证据到推荐全过程透明6.明确承认价值观和意愿7.就推荐意见的强弱,分别从临床医生、患者、政策制定者角度做了明确实用的诠释8.适用于制作系统评价、卫生技术评估及指南影响证据质量的因素(一)可能降低证据质量的因素研究的局限性研究结果不一致间接证据(二)可能增加证据质量的因素效应值很大可能的混杂因素会降低疗效剂量-效应关系(1) Riskofbias(偏倚风险):1)RCT•①无隐蔽分组:招募受试者的人知道下一位受试者将被分到哪一组(按星期几、出生日期或图表编号等来分配的“假”或半“随机试验);•②未设盲:患者、照护者、记录结果者、裁定结果或数据分析者,知道患者分配到哪一组(特别是结局指标为主观性指标且对其的评估极易受偏倚影响时);•③不完整报告患者和结局事件:未报告失访情况,失访过多和未遵从意向性治疗原则;•④选择性结果报告偏倚:观察到疗效就过早终止试验、或未报道结果(通常是未观察到疗效的一些研究);•⑤使用未经检验的结果测量方法:如病人报告的结果。2)观察性研究•①未能制定和使用合理的入选标准(对照人群的纳入):病例对照研究中匹配不足或匹配过度;队列研究中从不同的人群中选择暴露组和非暴露组;②暴露和结局测量存在缺陷;③未能充分控制混杂因素;④随访不完整。(2) Inconsistency(不一致性)•在做系统评价时发现不同研究间干预效应大小不同,对其可能的解释是:•人群(如药物对重症人群疗效可能相对显著);•干预措施(如较高药物剂量会使疗效更显著);•结局指标(如随访时间推移疗效降低)。•如果这三类中任意一项提供解释,则需要提供不同患者人群、干预措施和结局指标的不同效应估计。临床指南小组专家则可能对不同患者人群和干预措施提出不同的推荐意见。•如果效应尺度变异(异质性)很大且无法解释,应降低证据质量级别!(3)Indirectness(间接性)Population/patients:患者可能与我们关注的患者不同;Interventions:所检验的干预措施可能与我们关注的干预措施不同;Outcome:结果可能有别于最初设定的结局指标;Indirectcomparisons。通常,基于替代结果的证据应降低证据级别,而其他类型的间接性将需要进行更仔细的判断。(4)Imprecision(不精确性)当研究纳入的患者和观察事件相对较少而致可信区间较宽时,指南小组将降低该研究的证据质量。Publicationbias(发表偏倚)发表偏倚可能较常见,尤其是厂商资助的研究。提示要审慎看待早期结果,对样本量小而发生事件数少的研究时当慎之又慎。GRADE建议,如怀疑有发表偏倚,最多将证据质量降低1级(而非2级)。可能增加证据质量的因素(1)存在很大的效应量:•危险度RR=2~5或者0.5~0.2时且无合理的混杂,效应量大;RR>5或〈0.2时,且无偏移风险或精确性(足够窄的可信区间)相关严重问题,效应量非常大;(2)有剂量-反应关系:药物剂量及其效应大小有明显关联;(3)可能的混杂因素会降低疗效。GRADE认为升高证据质量不常发生,主要与观察性研究(包括队列、病例对照、前后对照和时间序列研究)及非随机试验或非随机干预性研究有关。推荐强度的概念推荐强度反映对一项干预措施是否利大于弊的确定程度。干预措施的有利方面包括降低发病率和病死率、提高生存质量、降低医疗负担和减少资源消耗。•干预措施的不利方面包括增加发病率和病死率,降低生存质量或增加资源消耗等。推荐强度的涵义强推荐的含义•对患者——在这种情况下,多数患者会采纳该推荐方案,只有少数不会;此时若未予推荐,则应说明。•对临床医生——多数患者应该接受该推荐方案。•对政策制定者——该推荐方案在大多数情况下会被采纳为政策。弱推荐的含义•对患者——在这种情况下,多数患者会采纳该推荐方案,但仍有不少患者不采用。•对临床医生——应该认识到不同患者有各自适合的方案,帮助每个患者作出体现他价值观和意愿的决定。•对政策制定者——制定政策需要实质性讨论,并需要众多利益相关者参与。影响推荐强度的因素•(1)决定推荐强度的第一个关键因素是在充分权衡不同治疗方案利弊基础上的利弊平衡,对利弊相当的方案,应为弱推荐。•(2)决定推荐强度的第二个关键因素是证据质量。当一项干预措施的利弊大小不确定时,作为强推荐去支持或反对某个方案会出问题,这时候就需要看证据质量。•(3)决定推荐强度的第三个关键因素是患者价值观和意愿的不确定或多变性。•(4)决定推荐强度的最后一个关键因素是费用。尽管一个很好的治疗方案可能因其高成本而使其成为强推荐的可能性降低,但决定性的因素是推荐方案的实际使用条件。评价临床研究证据的重要性★证据来源复杂★证据质量良莠不齐临床研究证据必须结合患者具体情况如何高效率阅读医学文献1.明确阅读文献的目的★2.熟悉文献的基本结构★3.选择性地阅读文献如何评价临床研究证据评价临床研究证据的步骤1.初筛临床研究证据的真实性和相关性2.确定研究证据的类型3.根据研究证据的类型评价其真实性和相关性临床研究基本类型(1)•病因研究:分析危险因素或病因•病例对照研究:按照临床结果分为疾病即病例组和非疾病即对照组,追溯之前某种危险因素是否存在,并比较病例与对照组某种危险因素存在比例的差异。•队列研究:按照暴露因素分为暴露和非暴露,随访一段时间后评估临床结果即疾病是否发生,比较暴露与非暴露状态下疾病发生的可能性大小临床研究的基本类型(2)•诊断试验评价•最基本的思想是将这个新的试验同诊断该病的标准诊断方法进行盲法和同步的比较,以评价其对疾病诊断的真实性和价值。•通常包括金标准评价的患病人群与金标准评价的非患病人群。临床研究的基本类型(3)•疗效评价:随机对照临床试验•采用随机化方法,将患者分为治疗组和对照组•接受干预后,观察临床疗效•评估两组疗效差别•疗效指标包括计数、计量指标临床研究的基本类型(4)•预后研究:队列研究•研究预后因素,比较某种因素存在与否对预后的影响•疗效指标包括率、生存曲线、生存时间等预后问题的三要素•定性的:会有什么样的结果发生•定量的:这些结果发生的可能性有多大•时序的:这些结果发生在何时•例:胃癌5年生存率从三个方面综合考虑临床研究证据的价值:(1)研究证据的内在真实性:是评价研究证据的核心。临床研究能正确反映研究人群中实际应该产生的研究结果(实施过程相关)。例如:评价治疗性研究,应考虑合格病例是否随机分配到不同的治疗组?随机化方法是否完善?是否隐藏?统计分析时是否按随机分配的组别将全部研究对象纳入分析?是否采用盲法等?如果一篇文献内在真实性有缺陷,则勿需谈论其他方面的价值。⑵研究证据的临床重要性:是指研究结果本身是否具有临床价值。评价其临床价值主要采用客观指标,而不同的研究类型其指标不同。例如:治疗性研究可采用相对危险度降低率(RRR)、绝对危险度降低率(ARR)和防止一例某种事件的发生需要治疗的病例数(NNT)等判断某种治疗措施的净效应及其临床价值;诊断性试验则采用敏感度、特异度、阳性预测值和阴性预测值、似然比及ROC曲线等指标判断某种诊断试验的价值。⑶研究证据的外在真实性:是指文章的结果或结论在不同人群、不同地点和针对具体病例推广应用价值。具有内部的真实性的结果推广到研究人群以外的同类人群仍有效,则该项研究结果具外部真实性(设计相关,人群选择)。例如:大型临床试验和系统评价均证实使用B-受体阻滞剂对心力衰竭有益,而你主管的心力衰竭患者有糖尿病,并且正在使用胰岛素治疗,是否立即使用B-受体阻滞剂需要仔细权衡其利弊,而不能盲目遵从文章结论。统计学方法抽样误差与标准误>总体是根据研究目的确定的同质研究对象的全体,分为无限总体和有限总体。>在医学研究中,无论是无限总体还是有限总体,由于受到人力、财力、物力、时间或其他条件的限制,不可能对总体中的每一个个体都进行研究,只能抽取部分有代表性的个体(即样本)进行研究,进而由样本信息来推断总体特征。>这种由随机抽样造成的样本统计量与总体参数之间或各样本统计量之间的差异称为抽样误差。>衡量抽样误差大小的指标称为标准误,常用均数的标准误反映均数抽样误差的大小,用率的标准误反映率的抽样误差的大小。均数的抽样误差>均数的标准误二标准差/样本例数的平方根总体均数的估计>参数估计是指由样本统计量估计总体参数,是统计推断的重要方面,有点估计和区间估计两种方法。>点估计是将样本统计量直接作为总体参数的估计值,如直接用随机抽样的样本均数x作为总体均数产的点估计值。>区间估计是按预先给定的概率估计总体均数可能存在的范围,亦称可信区间(confidenceinterval,CI)。预先给定的概率称为可信度,用1-a表示,常取95%或99%。>总体均数的95%可信区间的含义从理论上来说是指做100次抽样,可算得100个可信区间,平均有95个可信区间包括总体均数,只有5个可信区间不包括总体均数。>可信区间的两个端点值称为可信限,较小值称为可信区间的下限,较大值称为可信区间的上限,可信区间为开区间,不包含这两个值。可信区间的两个要素>1.准确度>反映在可信度(1-a)的大小上,即可信区间包含总体均数口的可能性大小,准确度愈接近1愈好。可信度99%的比95%的准确度高。>2.精密度>反映在可信区间的长度上,长度愈小精密度愈高。>在样本含量n确定的情况下,两者是矛盾的。要提高准确度,则要减少a,这样势必使区间的长度变宽,精密度减小。在实际工作中两者都要考虑,所以95%的可信区间更为常用。>在可信度(1-a)确定的情况下,增加样本含量n,可减少s使区间变窄,精密度得到提高。x,总体率的估计A总体率的估计也分点估计和区间估计,点枯计就是直接用样本率作为总体率的估计值。区间估计就是按预先给定的概率估计总体率可能存在的范围。分类资料的评价指标在系统评价中,除了有效率、死亡率、患病率、发病率等常用率的指标外,相对危险度(RR)、比值比(OR)及由此导出的其他指标也是循证医学中富有特色的指标。目前,在循证医学中分类资料常用的描述指标主要有EER、CER、OR、RR、RRR、ARR、NNT等。1、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论