临床试验中的统计学要求.doc_第1页
临床试验中的统计学要求.doc_第2页
临床试验中的统计学要求.doc_第3页
临床试验中的统计学要求.doc_第4页
临床试验中的统计学要求.doc_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

临床试验中的统计学要求临床试验是以病人为研究对象,比较临床治疗干预措施和对照措施的效果及其临床价值的前瞻性研究。临床试验以人为研究对象,与动物实验不同。在临床试验中,研究者不能完全支配病人的行为,只能要求病人避免采用某些干扰试验的治疗或行为,因此必须考虑病人的依从性问题。临床试验还必须考虑医学伦理学问题,当新药已被证实对病人弊大于利,尽管试验仍未完成,也要中止。当已经存在经医学验证对试验疾病有效的药物时,使用安慰剂对照是不适当的。当病人出现紧急情况需要额外治疗措施时,也必须给予。因此临床试验要面对比动物实验更多的问题,在设计上有着更严格的特殊要求。新药的临床试验分为、期:期临床试验是初步的临床药理学及人体安全性评价试验,观察人体对于新药的耐受程度和药物代谢动力学,为制定给药方案提供依据;期临床试验是随机盲法对照临床试验,对新药有效性及安全性作出初步评价,推荐临床给药剂量;期临床试验是扩大的多中心临床试验,遵循随机对照原则,进一步评价有效性和安全性;期临床试验是新药上市后的监测,在广泛使用条件下考察疗效和不良反应,尤其是罕见不良反应。本节主要讨论II期和III期临床试验的统计学要求。例11.1 临床观察发现急性心肌梗塞后,梗塞区膨出和左心室重构常导致左心室增大和心功能不全。为研究急性心肌梗塞后长期使用卡托普利治疗对心脏的保护作用,需设计一个药物疗效评价的临床试验,在设计中要考虑以下问题。 1 观察变量的选择 (1)主要变量和次要变量 主要变量 (primary variable)又称目标变量(target variable),即能够为临床试验目的提供可信证据的变量。临床试验的主要变量一般只有一个,必要时可有多个。主要变量应易于量化、客观性强、被相关研究领域所公认。次要变量(secondary variable)是指与试验主要目的有关的附加的变量,也可以是与试验次要目的有关的变量。两种变量均应在临床试验的设计方案中明确定义,并说明其被选择的理由。临床试验的样本含量估计、疗效或安全性评价应以主要变量为依据。 (2)复合变量(compound variable) 当与临床试验主要目的有关的变量很多,难以确定单一的主要变量时,可预先确定一种综合计算方法(如求和,加权求和等),或用多元分析的方法(如主成分分析等)将多个变量综合成一个复合变量,如临床研究中采用的各种量表就是一种复合变量。当组成复合变量的某些单项变量具有临床意义时,也可以单独进行统计分析。(3)全局评价变量(global assessment variable) 将客观指标和研究者对病人的病情及其改变总的印象综合起来所设定的变量称为全局评价变量,它通常是有序分类变量。全局评价变量往往带有一定的主观成份。因此,如果需选择全局评价变量,应在方案中明确说明它与试验的主要目的有关,有选择的依据和可靠的基础,同时具有明确判断等级的方法。客观性较好的全局评价变量应该作为主要变量之一单独加以考虑。例11.1中,研究目的是为评价卡托普利治疗对左心室容量、收缩功能和舒张充盈的作用,因此主要指标是用多普勒超声心动图测定左心室容量和射血分数。次要变量可选择左心室充盈速率。评价左心室容量和充盈速率的变量有多个,各变量的结果不一致时,难以对药物作总的结论。因此在统计分析时可以将多个变量综合成一个变量进行分析,这综合变量就是复合变量。上例中研究的最终目的是卡托普利治疗对心功能的保护作用,因此可以选择心功能级别作为全局评价变量。对照组的选择 临床试验中对照组与试验组唯一的差别是试验组中受试者接受新药治疗, 而对照组的受试者则接受对照药物的治疗。 临床试验要求试验组和对照组来自相同的受试者总体。 两组受试者不但在试验开始时要求基本情况相似, 而且在试验进行中除了试验药物不同外, 其它条件均需保持一致。临床试验中常用的对照组设置有以下3种类型: ()安慰剂对照 安慰剂(placebo)是一种虚拟药物, 其外观剂型、大小、颜色、重量、气味和口味等都与试验药尽可能保持一致, 但不含有试验药物的有效成份。设置安慰剂对照的目的在于消除研究者、受试者和参与评价人员等由心理因素等影响而形成的偏倚,分离出由试验药物所引起的真正的效应和不良反应。 安慰剂可以用于平行对照或自身交叉对照。 (2)阳性药物对照 在临床试验中采用已知的、已批准上市的有效药物作为试验药的对照, 称为阳性药物对照。阳性对照药物必须是合法的、公认有效的、并对所研究的适应症最为有效安全的药物。设计方案可以是平行对照也可以是自身交叉对照。 (3)剂量-反应对照 将试验药物设计成几个剂量, 而受试者随机地分入其中一个剂量组; 它可以包括安慰剂对照即零剂量,也可以不包括安慰剂组。 剂量-反应对照主要用于研究剂量与疗效和不良反应的关系, 或者仅用于说明疗效。 剂量-反应对照有助于回答给药方案中采用的剂量是否合适。 例11.1中急性心肌梗塞病人不适宜采用安慰剂对照,因此采用常规治疗包括溶栓剂、阿斯匹林等作阳性药物对照,试验组采用常规治疗加卡托普利治疗。一个临床试验不一定只有一个对照组, 可以根据实际情况设立多个对照组。 如在一个阳性药物的临床试验中,增加一个安慰剂对照组, 就形成同时使用安慰剂和阳性药物对照组的试验, 常称为三手试验(three-arm study); 又如在安慰剂对照试验中,根据医学伦理学要求,有时需对每个受试者在给予一种标准治疗药物的同时,试验组给予试验药物,对照组给予安慰剂,这种试验称为标准治疗加安慰剂的试验(placebo-standard study)。 避免偏性的重要技巧?盲法盲法(blind method)系指按试验方案的规定,尽量不让参与临床试验的受试者、研究者、参与疗效和安全性评价的医务人员、监视员、数据管理人员和统计分析人员知道病人所接受的是何种药物,从而避免他们对试验结果的人为干扰。在具体实施过程中常常根据盲态的程度分为双盲(double blind)和单盲(single blind)两种临床试验。在具备条件的情况下,应当采用双盲试验,尤其在试验的主要变量易受主观因素干扰时更应采用双盲试验。若条件不完全具备,也可采用单盲设计。确实难以实施者,也可不采用盲法(open label)。采用单盲或非盲法试验应在研究方案中申述理由。双盲临床试验系指临床试验中受试者、研究者、参与疗效和安全性评价的医务人员、监查员、数据管理人员和统计分析人员都不知道治疗分配程序,并在整个试验过程中不知道哪一个病例属于试验组或对照组。当反映疗效和安全性的主要变量是主观评定的 (如疼痛、认知功能障碍评分), 而用以评定的量表内容极易由主观因素造成偏倚时, 必须使用双盲试验。 即使主要指标为客观指标(如生化指标、血压测量值等), 为了避免研究者选择病例的误差或填写病例报告表受主观因素影响, 也应尽量采用双盲试验。在双盲临床试验中,不论是安慰剂对照,还是阳性药物对照,都需要具备药品检验部门的检定,同时要求试验药品与对照药品剂型、外形等一致。但是有时试验药品与对照药品剂型不相同,(这种情况大部发生在使用阳性对照的临床试验),如试验药为片剂,对照药为胶囊;有时,虽然两种药物剂型相同(如同为片剂),但外观不同,服用量不同(如试验药为2次/日,1片/次,而对照药每3次/日,2片/次)。为了执行双盲试验,需要用双模拟技术(double dummy)。即由申办者制备一个与试验药外观相同的安慰剂,称为试验药的安慰剂;再制备一个与对照药外观相同的安慰剂,称为对照药品的安慰剂。按编码结果,试验组服用试验药加上对照药的安慰剂;对照组服用对照药加上试验药的安慰剂;各药和其安慰剂服用方法相同。因此从整个用药情况来看,每个病例所服用的药物,每日次数,每次片数都是一样的,这就保证双盲法的实施。从医学伦理学方面考虑,双盲试验应为每一个受试者编号设置一个应急信件(emergency letter),信件内容为该编号的受试者所分入的组别。应急信件是密封的,随相应编号的试验药物发往各临床试验中心,由该中心负责人保存,非必要时切勿拆阅。在发生紧急情况(如严重不良事件,或病人需要抢救)必须知道该病人接受的是何种处理时,由该中心负责人拆阅。一旦被拆阅,该编号病例就作为脱落处理,不计入疗效分析;但有不良反应时仍需计入安全性分析;应急信件的拆阅率超过20%,意味着双盲试验的失败。所有应急信件在试验结束后随病例报告表一起收回。双盲应自始至终地贯串于整个试验之中,从方案制定、产生随机数编制盲底、根据随机数分配药物、病人入组用药、记录和整理试验结果、监查员的检查、数据管理直至统计分析都必须保持盲态。在统计分析结束后才能揭盲。在这以前任何非规定情况所致的盲底泄露,称为破盲(breaking of blindness)。双盲试验需要制定严格的操作规范,防止盲底编码不必要的扩散。如果在临床试验执行的过程中,一旦全部或大部分病例被破盲,试验将被视作无效,需要重新实施新的试验。单盲试验或非盲试验应尽可能按照双盲要求进行,即随机产生处理编码,每个编码封存于一个信封之中,并由各临床试验中心保存。只有当病例符合纳入标准并确定入组时,方可打开对应的编码信封,按编码入组。在单盲和非盲试验中,最好另请一位不知道处理编码的研究者协助观察,尽可能地避免主观偏性。 例11.1采用了双盲法,即病人不知道自己是否接受了额外的卡托普利治疗,进行治疗和作多普勒超声心动图等检测的医生不知道病人是否接受了额外的卡托普利治疗,统计分析人员也不知道哪组是实验组。为了保证病人不知道服用药物的不同,采用模拟方式,即对照组病人服用与卡托普利外形相同的安慰剂。数据管理新药临床试验最基础的工作是保证新药研究原始试验资料和档案的真实、科学、规范和完整。数据管理的目的是将得自受试者的数据迅速、完整、无误地纳入报告。数据管理包括根据试验方案所制定的病例报告表(case report form, CRF)的规范化操作。研究者是数据填写的第一执行者,监查员需核实研究者填写的数据的真实、可靠; 数据管理员保证将CRF表数据完整真实地录入计算机; 统计分析人员对数据的逻辑合理进行检查,并对数据锁定直至作出统计分析,写出统计分析报告。()数据库 数据库管理员应该在第一份病例报告表送达前准备好数据库。数据库需要保密性强、可靠。在第一份病例报告表到达后对数据库试运行,在运行过程中作进一步必要的完善,以便在大批病例报告表到达后数据库能正式运行。()CRF表的进一步检查 数据管理员对数据进行审查,包括研究日期、入组标准、排除标准、脱落、缺失值等。当发生疑问时,用质询表(query form)的方式由监查员通知研究者作出回答;研究者的回答应填入质询表,由监查员交回数据管理员。质询表是临床试验的一种文件,应妥善保存,如果能用一式三份的无炭复写本形式更加合适。质询表内容包括临床试验日期、题目、分中心、病例编号、受试者姓名等,其主要内容为数据管理员或监查员所提出的问题及研究者对此问题的回答。填写质询表的人员必须签名,质询表能保证病例报告表的修改和数据库的修改都查有实据,避免数据被人为、任意修改之可能。()双份输入 对于完成的病例报告表,必须使用双份输入方式进入计算机数据库,即由两个输入员独立地分别将病例报告表输入数据库; 再用软件包将两份独立的数据文件进行逐项对比; 如果发现不一致,就由输入员对照原始的病例报告表,找出原因,作出修改。双份输入能基本保证数据库的数据与病例报告表上数据的完全一致。(4)人工核查 对于试验方案中所规定的主要变量必要时可进行人工核对。即将双份输入后已被判断为完全一致的主要变量,输出计算机,再与病例报告表中的数据进行人工核对。这就进一步保证了数据库中的数据与病例报告表上数据的完全一致。(5)计算机核对 计算机核对是指由数据管理员使用编制好的程序对数据库中的数据作进一步的检查与核对。注重于入组、排除标准、访视日期、脱落、违背设计方案、不良事件和不良反应等。为了对数据库进行质量控制,还可以从全部病例中随机抽取5%左右的病例,(当全部病例数不足100例时,至少应随机抽取5份病例)。将病例报告表中的数据与数据库中的数据进行人工比较。如果10000个数据中发现15个以上的错误,则应对数据库中的全部数据进行人工比较。临床试验中统计分析人员的职责与任务(1) 统计分析人员的职责 参加新药临床试验的统计分析人员必须熟悉新药临床试验的有关规定、操作规范,与临床试验的研究者紧密合作完成设计和统计分析任务,确保临床试验中有关统计学要求和指导原则在新药临床试验中的贯彻。统计分析人员必须自始至终地参加整个新药的临床试验,其主要任务为:1) 协助研究者完善与修订研究方案,设计病例报告表,拟定所采用的统计设计方法。2) 按标准操作规范完成随机化、双盲设计方案和数据管理等各项。3)制订统计分析计划书,并完成全部资料的统计分析,写出统计分析报告。协助主要研究者完善临床试验总结报告。新药临床试验中所有涉及到的统计学工作,必须由有资格的医学统计学专业人员具体负责。所谓有资格的医学统计学专业人员是指接受过专门培训、有丰富经验、能与临床试验的研究者合作,贯彻执行新药临床试验各项指导原则的医学统计学专业人员。()拟定统计分析计划书 统计分析计划书是由医学统计学家和主要研究者拟定的统计分析计划,它比设计方案中所规定的统计分析更为详尽细致。统计分析计划书上应列出统计分析数据集的选择、主要变量、次要变量、可能的数据变换方法、统计分析方法与模型、疗效及安全性评价方法等,并将预期获得的统计分析结果以统计分析表的格式列出。统计分析计划书是根据试验设计方案和病例报告表而拟定的,其初稿应形成于试验设计方案和病例报告表之后。在临床试验进行过程中,可以修改、补充和完善。在盲态审核时再次修改完善。但是在第一次揭盲之前必须以文件形式予以确认,不能再作变动。(3) 临床试验数据的统计分析 临床试验中数据分析所采用的统计分析方法取决于研究目的、研究设计方案和观察资料的性质。根据统计学原理决定应当采用参数统计还是非参数统计分析。统计分析人员应根据统计分析计划书要求应用统计分析软件编制相应的统计分析程序。 根据临床试验的要求,理论上应当对全部病例按随机化纳入时的分组进行统计分析,称为意向性分析(intention to treat, ITT)。对于未能观察到全部治疗过程的病例资料,通常的做法是将最后一次观察到的数据结转(carry forward) 到试验最终结果进行统计分析。凡符合试验方案规定、依从性好且收集到所规定的全部病例资料,则称为合格病例集资料,也称为符合方案集(Per-Protocol, PP) 资料。对违反试验方案的病例,如依从性差、失访或使用了不允许用的药物的病例资料,不应列入符合方案集,但在不良反应发生率计算时应包括在内。(4) 撰写统计分析报告 根据统计分析计划书和统计分析结果,医学统计学家写出统计分析报告,提供给主要研究者作为撰写临床试验总结报告的素材。统计分析报告的内容包括以下几部分: 1) 对整个临床试验中资料的收集和整理过程的描述,包括入选病例是否符合入选、排除标准;各试验中心有无按照试验设计方案规定的观察病例数完整地收集到相应的数据;试验过程中有无增加新的观察指标;如何处理脱落病例及理由;盲法试验如何作盲态审核;在资料整理过程中有无按需对变量进行数据变换;如何定义离群值等内容。 2) 统计分析方法的选择及其理由。 3) 各组病例入选时的基本特征描述及统计检验。 4) 各组病例的主要变量、次要变量和全局评价变量的统计描述、参数估计及其优效性或等效性的统计检验。 5)各组病例安全性评价,包括不良反应发生率及不良事件的具体描述、实验室检验结果、试验前后的变化情况、以及异常改变与试验药物的关系。以上结果应尽可能用统计表、统计图表示。统计检验结果应包括有统计学意义的水平、统计量数值和精确的P值。应注明所使用的统计软件及版本,所有统计计算程序应以文件形式保存,以便核查。临床试验数据分析要点 11421调节协方差11422退出者或缺失数据处理11423中期分析和数据监控11424多中心研究11425多重比较多重性11426受试者的有效性子集(subset)11427证明等效性的阳性对照研究11428亚组检查1143受试者反应数据列表1144药物剂量,药物浓度及与反应的关系1145药物一药物和药物一疾病相互作用1146按受试者列出数据1147有效性结论12安全性评价121暴露程度122不良反应事件1221不良反应事件的简述1222不良事件总表1223木良事件分1224不良事件详细列表(按研究人员和治疗组)123死亡,其他严重不良事件,其他有意义的不良事件1231死亡,其他严重不良事件,其他有意义的不良事件列表12311死亡12312其他严重不良事件12313其他有意义的不良事件1232死亡,其他严重不良事件,其他有意义的不良事件的描述1233死亡,其他严重不良事件,其他有意义的不良事件的分析和讨论124临床实验室评价1241按受试者列出实验室测定值和异常的实验室值1242实验室参数评价12421试验中不同事件的实验室测定值12422(各治疗组)个体受试者的实验室值变化12423有临床意义的异常值的受试者125生命指征,体检发现和其他有关安全性的观察126安全性结论13讨论和结论14在前面没有列人的有关图、表141人口学数据142有效性数据143安全性数据(摘要)1431不良事1432死亡,其他严重木良事件,其他有意义的不良事件列表1433死亡,其他严重不良事件,其他有意义的不良事件的描述1434异常实验室测定值(每个受试者)15参考文献16附件161研究资料1611试验方案和试验方案修改1612病例报告表(该试验的特殊部分)1613 EIC或IRB的成员姓名,受试者须知和知情同意书样本16l4主要研究人员和其他重要参加者的简历或与完成该临床试验有关的培训和经验1615主要研究人员或协调研究员或申办者方的医学代表签字1616当试验药品不是同一批号时,列出接受各批药物的受试者名单1617随机程序和受试者编码1618稽查员证明书 1619统计方法文件16110所用的实验室间的标准化程序和质量保证程16111根据本研究发表的出版物16112在报告中所参考的重要出版物162(受试者)数据列表1621中途退出(受试者1622违反试验设计(受试者)1623从有效性分析剔除的对象1624人口学数据1625依从性和人变药物浓度数据(如果有)1626个体有效性反应数据1627木良事件列表(每个受试者)1628根据主管部门要求,提供个体实验室测定值163病例报告表1631死亡(受试者)的全套病例报告表;其他严重不良事件和中途退出(受试者)的不良事件报告表(AE)1632其他病例报告表164各种(受试者)数据列表(归档列表)。 2.目前临床试验中存在的问题申办者和/或研究者对GCP缺少了解。没有或没有得到知情同意书。试验未经伦理委员会批准或没有伦理委员会。缺乏临床试验统计专业人员。试验方案中没有试验样本量计算依据。临床试验药品没有发放、回收、销毁的记录。出现失访和中途退出者时随意增补受试者。不遵守试验方案。记录不准确或记录缺失。试验中修改试验方案未通知试验各方。缺乏临床试验质量控制机制。没有临床试验标准操作程序(SOP)。试验结束后有关文件和数据不及时归档。未获得药政管理部门批准即开始试验。3.结语为保证我国开发研制新药的安全性与有效性,确保人民安全用药,数据能获得国内外公认,实施符合GCP规范的高质量临床试验是先决条件。我国临床试验规范的颁布必将有力地促进我国新药发展计划,以及医药领域的国际接轨。但目前仍有许多方面的问题有待改进。缺乏训练有素的临床统计学家和质量保证体系是我国临床试验中的主要弱点。要真正实施GCP规范,最根本的问题是人员培训和严格要求。,其他有意义的不良事件的描述1233死亡,其他严重不良事件,其他有意义的不良事件的分析和讨论124临床实验室评价1241按受试者列出实验室测定值和异常的实验室值1242实验室参数评价12421试验中不同事件的实验室测定值12422(各治疗组)个体受试者的实验室值变化12423有临床意义的异常值的受试者125生命指征,体检发现和其他有关安全性的观察126安全性结论13讨论和结论14在前面没有列人的有关图、表141人口学数据142有效性数据143安全性数据(摘要)1431不良事1432死亡,其他严重木良事件,其他有意义的不良事件列表1433死亡,其他严重不良事件,其他有意义的不良事件的描述1434异常实验室测定值(每个受试者)15参考文献16附件161研究资料1611试验方案和试验方案修改1612病例报告表(该试验的特殊部分)1613 EIC或IRB的成员姓名,受试者须知和知情同意书样本16l4主要研究人员和其他重要参加者的简历或与完成该临床试验有关的培训和经验1615主要研究人员或协调研究员或申办者方的医学代表签字1616当试验药品不是同一批号时,列出接受各批药物的受试者名单1617随机程序和受试者编码1618稽查员证明书 1619统计方法文件16110所用的实验室间的标准化程序和质量保证程16111根据本研究发表的出版物16112在报告中所参考的重要出版物162(受试者)数据列表1621中途退出(受试者1622违反试验设计(受试者)1623从有效性分析剔除的对象1624人口学数据1625依从性和人变药物浓度数据(如果有)1626个体有效性反应数据1627木良事件列表(每个受试者)1628根据主管部门要求,提供个体实验室测定值163病例报告表1631死亡(受试者)的全套病例报告表;其他严重不良事件和中途退出(受试者)的不良事件报告表(AE)1632其他病例报告表164各种(受试者)数据列表(归档列表)。 2.目前临床试验中存在的问题申办者和/或研究者对GCP缺少了解。没有或没有得到知情同意书。试验未经伦理委员会批准或没有伦理委员会。缺乏临床试验统计专业人员。试验方案中没有试验样本量计算依据。临床试验药品没有发放、回收、销毁的记录。出现失访和中途退出者时随意增补受试者。不遵守试验方案。记录不准确或记录缺失。试验中修改试验方案未通知试验各方。缺乏临床试验质量控制机制。没有临床试验标准操作程序(SOP)。试验结束后有关文件和数据不及时归档。未获得药政管理部门批准即开始试验。3.结语为保证我国开发研制新药的安全性与有效性,确保人民安全用药,数据能获得国内外公认,实施符合GCP规范的高质量临床试验是先决条件。我国临床试验规范的颁布必将有力地促进我国新药发展计划,以及医药领域的国际接轨。但目前仍有许多方面的问题有待改进。缺乏训练有素的临床统计学家和质量保证体系是我国临床试验中的主要弱点。要真正实施GCP规范,最根本的问题是人员培训和严格要求。药品临床试验中几个统计学概念浅释摘要:本文介绍效应和响应, 平衡与均衡, 研究总体和研究人群, 区组和分层等可互相比较的统计学概念,说明了它们在药品临床试验中的用法。 关键词:效应和响应; 平衡与均衡; 研究总体和研究人群; 区组和分层 Statistical Principles for Clinical Trials was prepared under the auspices of the International Conference on Harmonisation of Technical Requirements for Registration of Pharmaceuticals for Human Use (ICH). To build a bridge between the principles and popular courses of medical statistics in our country, we compare and interpret some important but misunderstood concepts in this field. In this paper there are four pairs of such concepts with explanation in clinical trials. KEY WORDS: effect and response; balance and homogeneity study; population and target population; blocking and stratifying 临床试验的统计学原则(ICH-E9)1是在人用药品注册技术要求国际协调会议(ICH)的赞助下制定的文件,其中列出29条名词解释以求准确理解文件。但这些解释对我国情况而言是很不够的,为使我国有关期刊和教材与国际接轨,我们对该领域一些重要的,但却常有混淆的概念做了一些探讨,陆续刊出,以求指正。本期刊出有效应和响应, 平衡与均衡, 研究总体和研究人群, 区组和分层等可互相比较的概念。 1效应和响应 效应(effect)在英语里是个常见的词,把它译作“效应”, “响应”, “效果”, “作用”,“效用”等都是可以的,所发表的ICHE9译文2,3,对这个词就有不止一种译法,单从英文上看似乎无不可。然而,在数理统计和医学统计学科领域中,effect 在一定意义上说是专业名词,所以在统计学试验设计和分析中,宜按多数人习惯,只译为“效应”较妥。与之容易互相混淆的词是“响应”(response)。“响应”是试验所观测到的结果,是在受试对象那里所实测到的指标。而效应常常不是直接观测到的,是从一定数量的响应中分析出来的。效应一般分为三类4:处理效应,区组效应,和误差效应。处理效应是指当处理因素改变时引起响应的变化;区组效应是为了对于误差进行控制(区组可广义理解为可控制的非处理因素),把试验的非处理因素产生的效应分解出来;误差效应一般是随机的,服从正态分布的。效应和响应二者的对比如下。 响应 现象 结果 对因素效应的综合 包含各种误差影响 效应 实质 原因 对响应总和的分解 一种或几种因素的影响ICHE9的原文中还提到“效应大小”( effect size ),文献5中有专门条目解释这一词组:“效应大小指由于因素引起的差别”。有人2,3把effect size译作“样本含量” ,从1的上下文看,似乎不可能是sample size之误,在“样本含量”一节提到“效应大小”,是指主要变量引起的响应差别除以相应的标准误差,这一相对量对估算样本含量是很重要的。 2平衡与均衡 平衡(balance)一词在统计学中也是专业术语,指可比较的两组或多组中各受试对象数或所作的处理数目相等;或者说,在不同的因素-水平组合的实验基元(cell)中各受试对象数目相同,则称为平衡。而均衡(homogeneity)是指一个试验组内的受试对象按照所研究的性质而言在统计上是均匀的,一致的。 有的书把均衡当作实验设计的一个原则,指“非处理因素都一样”。这里的均衡与我们所指的完全是不同的概念。有两个以上非处理因素时,很难做到“非处理因素都一样”,但针对这种情况有许多现代的多因素实验设计方法可供使用。 例1 随机区组实验(randomized block design),或称随机化完全区组实验(randomized complete block design 简称RCB):12只小鼠按体重的不同分为4个区组,每个区组有三只,随机分配喂以三种不同饲料。 这里每个区组内的小鼠从体重看是一致的,称为均衡;4个区组每个都有3种饲料,称为完全,本例也是平衡的;每种饲料都喂以4种不同体重的小鼠,称为配伍。 如果饲料多于3种,比方说是4种,每个区组只能安排其中的3种,所有区组喂每种饲料的小鼠数也相同,可以看出这里平衡有两种意义,一是指每区组都三只小鼠,另一是指整个试验每种饲料都喂4个小鼠,因此称为平衡的不完全区组实验(balanced incomplete randomized block design, 简称BIB)。 如果12只小鼠的体重是均衡的,可以完全随机地分配喂以不同饲料,称完全随机设计(completely randomized design)。这里完全随机,是简单随机,有别于RCB或BIB中的区组随机;后二者中“完全”和“不完全”是针对所有处理而言的,同一区组内不同对象接受了所有处理,谓之“完全”,不同区组是平衡的。 方差齐性(homogeneity of variances),意味着方差是一致的,人们却不翻译成“方差均衡”。 方差齐性不满足(heterogeneity of variances), 也不翻译成“方差不均衡”。 对一个分布而言,均衡(homogeneity of distribution)是指其变异来自随机误差,不均衡(heterogeneity of distribution )是指其变异还来自系统误差6。 3 研究总体和研究人群 “总体”(population)是个重要概念。在我国内目前出版的几十本医学统计学一类的书,几乎都认为总体是“同质观察单位的全体”。而国外有关的几十本书中,虽然他们在说明此概念的用语互相有很大差别,却没有见到用过“同质”、“均衡”、“均匀”一类的词。现把文献7中的定义翻译如下:“总体是特定时间内关心的观察单位最大的集合。如果用某一变量的数值作为观测总体中个体的尺度,于是产生变量数值的总体。” 一个实际的总体常常既有同质的一面,又有不同质的一面,一个总体一般都可分为不同的次级总体。从研究总体( study population)得出统计结论,能否或怎样推广到以后所关心的总体(目标总体)呢?ICHE9用很大篇幅回答这一问题。现有译文2,3都没把目标总体(target population)作为专业词组翻出来, 把推广(generalization) 有时译成“推论”,有时译成“广义性”,就失去了统计推断的涵义。 在国外或国内的与临床试验有关的期刊中,经常会遇到“研究人群”或“研究群体”,这里人群或群体,在英文中也是population,它常常却不是统计学中的总体,仅仅指参与试验的受试对象的集合。因此,在ICH-E9 引入分析集(set)的概念,以避免population两种不同涵义引起混乱。 4区组和分层 文献8介绍了与这两个概念有关的内容,概括如下: 区组(blocking)是将受试对象作为样本所进行的分组或划分;分层(stratifying)是将受试对象所在总体按某(些)特征分割为次级总体。分组的原则一般是使一区组内处理数平衡,有时区组内各处理数之比是个常数。 区组大小或区组长度(size, length)是指一个区组包含多少个接受不同处理的受试单元。 预后因素(prognostic factor)是临床试验研究中有实际意义的协变量,它可作为分层的依据。 这里需要强调的是,在目前流行的统计学书籍上,往往受试对象存在不均衡的情况下才将其划分成不同的区组,用以分解出“区组效应”,从而降低随机误差,或者说是使随机误差更接近实际情况。 在文献8中扩展了区组的概念和用法:标以不同区组的受试对象可以是均衡的,即实际上并不存在区组因素,这时还要分成区组,是为了平衡处理因素,详见8中的有关例子。 临床科研中统计方法的选择临床科学研究从制定设计方案、资料收集、抽样方法、样本大小到数据的整理与分析等,都离不开统计学。正确应用统计学方法,有助于面对不确定的数据作出科学推断,正确揭示疾病分布规律,掌握疾病特征,阐明致病因素,评价防治效果。不同的研究设计方法、资料类型、研究目的,适用的统计方法也各不相同,所以临床科研人员应依据自身研究的特点,选择合适的统计方法,才能得出科学的结论。常用的基本统计方法包括:1、 统计描述:指用统计指标、统计表、统计图等方法,对资料的数量特征及其分布规律进行测定和描述;2、 参数估计:用样本指标来估计总体指标;3、 组间差异的显著性检验:用适当的统计方法分析、衡量各组研究结果之间是否有统计学差异;4、 变量间的相关性分析:用于分析两个或多个变量的相关性。本节将就常用统计方法的选择作一个简要介绍,有关方法的详细内容参见相关统计学书籍。一、资料类型统计资料按其性质分为计量资料、计数资料及介于其中的等级资料。不同类型的资料应采用不同的统计方法进行分析。(一)计量资料(measurement data) 对每个观察单位用定量的方法测定某项指标的具体数值所得资料称为计量资料,又称定量资料(quantitative data),亦称数值变量(anumerical variable)。这类资料一般有度量衡单位。例如每个观察对象的血压(kPa)、脉搏(次/分)、身高(cm)、体重(kg)及临床上诸多定量检测指标的检测结果,都属于计量资料。(二)计数资料(enumeration data) 将观察单位按性质或类别分组,然后清点每组的个数所得资料称为计数资料,又称定性资料( qualitative data ),亦称分类变量 (categorical variable)。这类资料一般没有度量衡单位,所得数据是各组观察单位的个数。例如药物治疗的有效人数与无效人数;化验结果的阳性人数与阴性人数;某病的患病人数与未患病人数;某人群中A、B、AB、O各种血型的人数及临床上诸多定性检测指标的检测结果,都属计数资料。(三)等级资料(ranked data) 将观察单位按某种属性的不同程度分组计数,得到各组观察单位个数,称为等级资料。等级资料具有计数资料的性质,又兼有半定量的性质,因其按等级大小排序,有人亦称之为有序分类变量(ordinal categorical variable)。例如疗效考核中的治愈、好转、未愈、死亡;症状中的重、中、轻、无;某些检测结果中的、等,都属等级资料。二、组间差异的显著性检验研究结果的统计分析中,不同类型资料差异的表达方式不同。对于计数资料以率表示,计量资料以均数表示,等级资料以秩和表示。分析比较组间差异时,需先求出组间差异,再进一步进行统计学显著性检验。选择恰当的检验方法需明确以下四个问题:1、 资料类型;2、 实验设计方法,常用的有成组设计,配对设计,配伍组设计等;3、 是两组比较还是多组比较;4、采用单侧或双测统计学显著性检验。下面就不同类型资料的组间差异的显著检验方法作一个归纳。(一)计量资料 正态或近似正态分布资料用参数检验法,偏态分布资料或有不定值资料用非参数检验法。完全随机设计两组比较方差齐时,用t 检验;方差不齐时,用秩和检验法或近似t 检验法。完全随机设计多组比较方差齐时,用方差分析检测在总的资料比较中是否存在统计学差异,当肯定存在显著性差异时,需作组间的两两比较,用q检验、最小显著差法或新复极差法;方差不齐时,用近似F检验或多个样本比较的秩和检验。配对设计资料,用配对t 检验法。配伍组设计的资料,需用配伍组的方差分析。(二)等级资料 对等级资料的显著性检验采用非参数检验法。1、两组比较:成组设计资料用wilcoxon两样本比较法,配对设计资料用符号秩和检验法。2、多组比较:成组设计用kruskal-wallis法(H-检验)、Ridit法;多个样本两两比较用Nemenyi法;配伍组设计用Friedman秩和检验法。(三)计数资料 对于计数资料的差异检验,也即率的差异显著性检验,两组比较:样本数较大,用u检验法或 检验法;样本数小于40例,或理论值小于1,用矫正 检验,或精确概率法。多组比较:用行乘列 检验法。配对设计资料用配对 检验法。三、变量间的关联性研究关联性研究在医学科学研究中占有重要地位。从某种意义上讲,医学科学研究就是要寻找健康、疾病与有关诸因素之间的关系和规律,而运用统计学技术的方法,不仅能帮助确定事物间的关系,还可以定量表述事物间关系的方向大小强弱。(一)计量资料 研究两连续变量间的数量关系常用简单相关与回归分析,一般通过相关分析计算出反映两变量相关密切强度大小的指标相关系数(r),并对其作显著性检验,当肯定了其统计学显著性差异存在之后,则作直线回归分析,求出回归方程,回归方程可用于描述两变量间的依存关系,进行预测和统计控制。至于多变量间的相关性分析,则应作复相关及多元回归分析。(二)等级资料 对于等级资料,或不服从双变量正态分布资料,一般用等级相关来分析变量间的相关关系,等级相关分析属于非参数统计方法,它是先把两变量的原始数据分别编秩,再利用两变量之间秩次的差异分析二者之间的线性相关关系,常用的有spearman等级相关法和kendall等级相关法,分别计算rs及rk等级相关系数反映变量间的相关关系。(三)计数资料 在临床医学研究中,常常在病因学的探讨上采用计数资料相关性分析,这类资料分析一般先用 检验判定疾病与暴露因素是否有关联,再通过计算比值比(OR)、相对危险度(RR)、归因危险度(AR)等指标,以评价暴露与疾病的关联强度。DPS数据处理系统在药学研究数据处理中的应用摘要 目的介绍一个药学研究中数据处理的实用软件。方法举例论述DPS数据处理系统在药学研究中的实际应用。结果方法简便、实用、迅速、准确,能显著提高工作效率。结论DPS数据处理系统是一个优秀软件,应推广应用。关键词 DPS数据处理系统;药学研究;数据处理中图分类号 R911文献标识码 B文章编号 100420781 (2006) 0420363203在药学研究过程中有大量的数据资料需进行统计分析处理,已有一些专门的统计软件,如SPSS、SAS、Excel等 13 ,它们在数据处理中均发挥了一定的作用,但有些软件非汉化,使用不便。DPS数据处理系统的应用,使用者可在中文平台上十分方便地处理药学研究中的数据,现介绍如下。1DPS功能简介DPS数据处理系统是浙江大学研制多功能数理统计和数学模型处理软件系统。它将数值计算、统计分析、模型模拟以及画线制表等功能融为一体。DPS系统兼有Excel电子表格软件和若干专业统计分析软件的功能。与Excel电子表格软件比较,DPS平台具有更加强大的统计分析和数学模型模拟分析功能。与国外同类专业统计分析软件系统(如SAS、STAT、STATISTICA等)相比,DPS系统具有操作简便,在统计分析和模型模拟方面功能齐全,易于掌握,其工作界面友好。2在药学领域中的应用2. 1数据基本参数计算试验资料经整理之后,可以计算出一系列的统计指标以说明资料的特征和对资料进行进一步的统计分析。最常用的统计指标是和( sum) 、均值(mean) 、方差( variance) 、标准差( standard deviation) 、斜差( skewness)和峰度( kurtosis)等。例1,从某药厂生产的六味地黄胶囊中随机抽取10粒,测得胶囊装量为0. 315 1, 0. 320 4, 0. 324 2, 0. 319 0, 0. 332 0,0. 326 1, 0. 324 7, 0. 334 3, 0. 328 9, 0. 311 6 g,试计算该组数据的均数、几何均数、中位数、标准差、样本方差。操作步骤: 在DPS工作表中按行输入数据,再选中数据区域(单击并拖动) ,将资料定义成数据块; 单击菜单栏中“数据分析”“基本参数估计”,就可立即得到这些基本参数。见图1。图1下部的计算结果, 得到偏度系数skew 等于- 0. 196 16, uskew =- 0. 285 51,显著水平P = 0. 775 26;因P 0. 05,说明资料所属总体分布的偏度系数1为0。又峰度系数kurt等于- 0. 67727, ukurt = - 0. 507 60,显著水平P = 0. 611 73;因P 0. 05,说明资料所属总体分布的峰度系数2为0,即属于正态峰度。因此,这10粒胶囊的装量数据属于正态分布。图1基本参数估计界面与结果2. 2两样本均值差异t检验在DPS中,系统将同时给出如两分布方差相等时均值差异显著性、两分布方差

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论