一种临床试验中的适应性样本量调整方法_第1页
一种临床试验中的适应性样本量调整方法_第2页
一种临床试验中的适应性样本量调整方法_第3页
一种临床试验中的适应性样本量调整方法_第4页
一种临床试验中的适应性样本量调整方法_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2中国卫生统计2010年2月第27卷第1期一种临床试验中的适应性样本量调整方法谢之辉' 胡 芳2任建玲"贺江南'贺 佳3【提 要)目的 介绍一种临床试验中的适应性样本诡调镀方法,并探讨样本量调整后统计分析方祛的第1类错谋 率及检验效能。方法 通过monte carlo模拟的方法研究m大小对最终样本*%的影响,并估计最终方差偏移大小;同 时模拟研究样本凤调整后统计分析方法的第I类错误率及检验效能大小。结果(1)模拟结果显示运用该样本散调整方 祛所得到的最终样本it N,非常接近其真实值N。,尤其在仃=0.4时进行样本位调整。(2)同时模拟结果显示所介绍的样 本倣鬧整后的

2、校正f检验方法不仅能有效控制第【类错误率a并且能充分满足试脸检脸效旌(1-0)。结论 该样本值 调整方法研究结果是在一般两样本单側t检验条件下得到也可应用于优效或非劣效设计的临床试验中。【关後词】样本凤重估内部预试验适应性临床试脸2中国卫生统计2010年2月第27卷第1期2中国卫生统计2010年2月第27卷第1期在试验前能否准确估计所需样本最关系到整个临 床试验成败。样本最大小是由第I类错误率a、第二 类错误率B或检验效能(1-/3)、相应容许误差6及终点 主要观察变量个体间变异大小7(或总体率”)共同决 定的。试验开始前.aS和§是可以确定的,但c大小 一般悄况下是未知的。b大小通

3、常是从历史相关试验 中获得把其作为a的估计值代入相应样本量计算公 式得岀本次试验所需样本量。然而,先前的临床试验 与当前的试验在某些因素方面可能存在不同,并且大 多数情况下这些因素又影响个体间变异程度,因此不 能确定根据先前试验所确定的当前试验a大小是否 合适。不准确的方差估计值将导致试验检验效能过高 或过低过高的检验效能将使不必要多的受试者暴篦 于无效或不安全的药物中检验效能过低将使所得结 果不可信。在试验完成之前不可能知道真正"大小, 然而在试验之前必须确定一个样本量以便试验计划. 实施,这是一个看似前后矛盾的难题。解决这个难题 的一种方法就是允许在试验进行期间做一次方差的重 估

4、从而确定当前试验真正所需样本議。因此在试验进 行中允许方差重估从而可以进行样本駅调整的两阶段 适应性临床试验无论是对医药工业界还是对相关监管 部门来说都很有吸引力。这种在试验进行期间允许样本值调整的适应性临 床试验起始阶段与固定样本量设计的临床试验一样. 根据试验方案招募患者,当先纳入的一部分患者(山) 完成整个试验时利用这部分患者资料进行方差重估, 从而在必要时进行样本诫的调整。在临床试验中,错 误的估计方差将导致低的研究效能或使不必婆多的患:図家十一五電大談药创制科技電大专項° (2008ZXD9312-007和 2OO8ZXO9312XJ25)1第二军医大学卫Jft瑕卫生统卄学

5、教硏室(200433)X上禅市普陀区疾病侦防控制中心(200333)通讯作者:员佳 vE*mail:bejud smmu. edu. co者暴露在无效或不安全的药物中,所以上述带有内部 预试验(internal pilot study)性质的适应性设计的临床 试验十分具有吸引力并且近来变得越来越流行。因 此在ICH-E9关于临床试验统计学指导原则中有关 于样本最调整的相关内容。该内容强调尽可能的在盲 态状况下进行方差估计,并且任何情况下最终的第I 类错误率都应该是可解释的。本文就基本遵 循指导原则条件下探索一种允许在试验期间进行样本 虽调整的方法。在本文第二部分将介绍在试验进行期间进行的方 差

6、重估和样本就调整规则。在第三部分介绍样本董调 整后统计分析方法。第四部分将通过模拟展示该统计 分析方法的第一类错误率a大小及检验效能(1力)大 小。第五部分给岀一个離要样本凰调整的临床试验实 例。本文介绍的适应性样本童调整方法意义及可能存 在的问題将在第六部分讨论阐述。方差直怙及样本调整规则1方差乘估本文以终点观测变童值服从正态分布的两样本平 行设计试验为例进行介绍。假设该试验为单侧检验, 第i组观测变議值服从正态分布其均数为 血,并且两组共同的未知方菱为则其假设检验为 Hol二血,已3血。在给定检验水准a,容许效应 差值o二血血0.检验效能1-0,如果总体方差亦 已知,则每组所需样本最叫为:

7、N%2 (1)A 为标准正态分布下值。 然而确切的,值一般情况下是未知的,因此在制定试 验方案时可根据历史资料确定一个/的先验估计值 £,根据公式(1)计算出本次试验每组所需样本最私。 然后根据试验方案招募患者当每组有山N0个患者2中国卫生统计2010年2月第27卷第1期Chines匚Jounud of Health Stilistic民b 2010,VoL27,No. 13完成试验时在独立监察委员会监督指导下有独立的 统计分析人员计算第i组方差晞=12.然后得岀两 组合并方差£。把公式(1)中的,替换成£,得出本 实验每组所需样本量n八入阳在这里把样本量稍微 的

8、改成N* =入£ +1,稍后的计算表明这样改变是合适 的。需要注意的是入&有可能不是整数2样本量调整规则根据Wittes and Brittain提岀的样本就调整规 则调整后每组的样本量Nf决不能小于凡,即的= max(AT0t)o Birkett and Day指岀 W&B 规则的 缺点,认为如果估计值S。很大时将纳入过多不必要 的患者使其暴露在无效或不安全的药物中,这也不符 合临床试验的伦理学要求。Birkett and Day认为调整 后的样本量Nf决不能小于m即巧二max (山,必)。 W & B规则被称之为限制性(restrict)调整规则,B &a

9、mp; D规则被称之为非限制性(unrestrict)调整规则。另 外,Gould认为可在方案中预先给定一个最终的样 本盘范围,如WNqWN/Ww2No.W = 2卫2 =2。本文 认为把B &D规则和Gould规则接合一起应用可能会 更有实际意义,即凡,=2。当 然最终样本匾大小还受相关政策法规及申办者资金 多寡等其他因素的影响。3样本量调整后存在的问题最终的样本星竹确定后当N产叫时,则终止试 验,进行最终的统计分析。但大多数的情况下试验随 访周期是以周或月为单位,当名患者完成试验时, 试验没有终止纳入试验的患者肯定大于n,;再者,进 行方差重估也要花费一定时间,因此,最终统计分析时

10、 要把后入部分患者资料也包含在内。当Nf>nx时,需 要每组再招募叫个患者。然后把山+心个 患者资料放在一起进行相关的统计分析。根据成组两 样本rtest公式得:2 J空严 x&g理 v = +H, -2(2)天:表示第i组样本均数,7 = 1,2;/为两组合并方 差;自由度八"2-2。但是用该mesi所得的统计 最t宜接与自由度为+心-2中心/分布的检验统 计最仏忙山相比较从而做出拒绝I%或不拒绝Ho 的判断时,其犯第I类错误的慨类将超过预先设定的 检验水准a。这是因为总体样本量"不再是一个固 定的常数,而是一个有S;大小所决定的随机变敬,所 以导致公式(2

11、)中的统计量t不再是在出:A1十 条 件下的中心/分布的5在S条件下-%2N(R -血,4/(也+n2)o具体证明将在下文给出。为 了在统计分析时把样本最调整后的假设检验水准控制 在a以内,Stein在最终的统计分析时把£代入公式 (2),用所得的统计量f与匚进行比较从而做 出拒绝或不拒绝也的判断。但这种方法存在两 个明显的缺陷。首先,X和区来自于全部观测,但在 计算”时没有应用所有的Nf个观测而仅用M,个观 测,特别在m很小时所得的£变异大而不够稳定. 同时也缺乏精度;其次,该方法检验效能也不高。下面 将介绍一种在样本最调整后可控制检验水准的校正/ 检验方法。校正f检验统

12、计分析方法1.样本疑调整后的方差估计£52 = £E(S* IS:) = E 斗牙£号(4 _即sj|j ,由于也大小是有S:决定的,因此上式可变为:E【込7匕帀鶯皿“"囂(吁Q桔请傀7)2)呦 2(7VrTy(2(n>-1)s; +2g “)/ + £個昭皿)| 别在/条件下,和心的样本方差是&«方差的无偏估计,因此,E(也.畑)“也则t如)居=2几即n2a2 + (岂二 IJb, (”i -】)(&-</)m 4- n2 1-卜/ +-1) 8V £/(% +n2 -1)众所周知,在没有样本量

13、调整的固定样本址设计 的临床试验中是/的无偏估计。但在试验进行 中有样本量调整时G不再是a的无偏估计,此时& 的期望值要小于/。设g = l,2代表两个组别丛=1, 2代表样本量调整前后两阶段J为第j个观测值则:(3)Chinese Journal of Health Statstict,Fteb 2010.Vol.27.N6 I5从等式(3)中看出在固定样本虽设计的舲床试 验时,由于也是个常数,所以£二但在有样本 量调整的试验中2是个随S变化而变化的随机变 童并且 随尺增大而祓小,所以covS;t/! +/12 - 11)为负值,即在有样本危凋整的临床试 验中用通常方法算得

14、的方差估计值0是低估的。此 时把低估的G代入公式(2)做统计学检验,所得的统 计最值或P值做出拒绝或不拒绝出的判断时,犯 第I类错误的概率将超过预先设定的检验水准a。2.方差估计值的校正从公式(3)可得出:ElS2 -a2 = (hj -1) cov £/(% +- 1)=(H1-l)COv,max(-/ji 心-)8vpt 古卜 ¥1-E(劉 一出4)略卜可零卜25W鼎,* 为服从自由度为2m2的"分布的随机变,Kotz, and Balakrishna在其书中给出了 X"的期望值的详 细算法。综上所述,当Ng时,所得的方差S2是无 偏的;当Nfn.时

15、偏移下限为-忆+。因 此,本文认为方差的估计值可为:s2当时I卜羽十当g时(5) 下面将通过应用SAS/IML模拟评估使用该校正 方法调粲后所得方差必及未经校正方差S2与真实方 差/间的偏移大小。同时模拟调整后样本最的随 变化趋势。下面所有结果都是循环1000次所得。假设 a=0.05J-/?=0.9t5 = l,真实方差 则入=17.12力,根据公式(1)得,N。=52。分别取/»,=0. lNo,03No,04No,05No.0.6No,08No. 1N°,1.2M时,£与真实方差/间偏移随山变化趋 势(图1)以及根据本文调整规则所得Nf值大小及其 变异程度(

16、表1)。同时模拟a=0.05tl -/3=0.9t5 = 1,真实方差恥 =20 Bt,8B1第一阶段方差估计值与其2实值间僞移随叫变化施势S2及酶与真实方差a2间偏移随a2变化管势(图2)。 «1根据产風调整规则 所确定的N,值大小及其变异大小V5?NfSD0.162.12624116.670.3162.85395012.650.4212.87535011.430.5262.W4I3110.130.6313.0348528.820.8413.0762527.211.0523.0771534.381.2623.1274620.98僞移随真实方差变化趋势从图1模拟结果显示在7T =0.

17、4 06时方差瞬 与真实方差/间偏移程度相对较小存=01-0.5间 偏遼为负。当偏移程度相同时建议取偏菱值为 负因为当偏差为负值时山相对较小,因而便于尽早 做出是否需要调整样本量的决策。Posch and Bauer(J, 认为允许样本量调整的临床试验中应当存在一个而且 是唯一的一个山使最终的样本匮最小,经研究发现当 tt*0.4时所得的最终样本量期里值最小。本文模拟 结果也显示当f =0. 5时第一阶段方差$与真实方 差/间馅移散小因此调整后所得样本量也最接近其 真实值M 这与Posch and Bauer结果基本一致(见表 l)o考虑到临床试验实际情况,即临床试验大多数周 期较长以及算得(

18、也需花费一定时间,但试验还在继 续进行因此最终纳入患者数肯定大于山。所以,本 文建议在tt=0.4时进行方差St估以及样本横调整。 模拟结果二显示,调整后的方差侈偏移明显小于未经 调整的方差f偏移,更轨要的是调整后方差偏移值为 正值,这样的校正结果对试验结果的解释是有好处的。 具体原因将在下文给岀。并且S:与/间偏移程度以 及f与/间偏移程度均明显小于£与真实方差72 间偏移程度这是因为比叭,从而S;得到自身校正, 最终达到工。这也间接证明了上述Stein方法的不合 理性,尤其当山较小时。3样本儆调整后的校正f检验上文已经证明在允许中期样本童调整的适应性 临床试验中总体方差估计值L是

19、有偏的,因此用公 式(2)进行统计分析时犯第I类错误的概率将超过预 先设定的检验水准a。统计推断时能控制第I类错误 概率的方法除了 Stein介绍的方法外,Kieser and Fried介绍了一种a校正的方法。但这种方法十分 复杂应用起来很不方便。下面介绍一种简便易行的 校正检验方法。就是用校正的方差估计值侈代替 公式(2)中的即当心如2时可拒绝由于校正后方差 此与真实方差*间的偏差为正值,所以用校正后方 差值侈进行统计分析时相对保守从而能更好的对假 设检验结果进行解释,即有更充分的理由认为做出拒 绝出或不拒绝Ho的判断是正确的。下面一节将进 一步通过模拟研究用校正r检验方法进行统计推断时

20、犯第1类错谋率大小。校正t检验第I类错误率及检验效能为了评估有样本就调整的适应性设计临床试验的 可靠性将通过模拟研究其第I类错误率大小及检验 效能髙低。假设各参数设置如下2=0.05,1-0 = 0.9,5 = 1,a2 = 1,5 J0,7T = 0. 1,0. 3,0. 510. 7,0. 9 时 校正检验第1类错误概率大小(见表2)及a2 =3,5, 10时检验效能(见图3)。表2校正r检验第I类错误率/V心a10.130.051510.360.051410.590.051210.7120.050810.9160.050550.190.050950.3260.050450.5430.05

21、0*50.7600.050450.9780.050580.1140.050380.3420.050380.5690.050380.7960.050280.91240.0500100.1180.0503100.3520.0502100.5860.0502100.7)200.0502100.91550.0498从表2中看岀,总体上校正/检验第I类错误率 偏移很小只有当山较小时第I类错误率相对较大. 并且最大值不超过0.052;另外,第I类错误率有随(/ 增大而减小的趋势。当/较小而”较大情况下,在 样本量调桀时就有可能终止试验,此时对第I类错误 率大小几乎不产生影问。从图3看出当”=05时校 正r

22、检验检验效能最大。最大值为0.97(/=3,” = 0.5),最小值为088(/=3"=01)。并且当山 10时所有检验效能均不小于09。因此在样本量调 整时尽可能使©10。00.20.40.60.8图3枚正/检验效能实 例以Apple等在1997年所做的通过改变饮食降 血压(dietary alterations stop hypertensiontDASH)的临 床试验为例展示适应性样本量调整以及调整后的相关 统计分析。该试验为平行组设计,主要研究对照组一 般饮食与试验组混合饮食混合饮食是指在饮食中水 果和蔬菜所占比重较高摄入脂肪含量较低的饮食状 况两组纳入者经过为期8

23、周的饮食试验,观测两组间 舒张压变化情况。试验前确定该试验检验水准为单侧 ««0. 05,最小临床效应菱值5-2mmHgt检验效能1 0=0.85,标准差估计值为5mmHg;则入=3.5947, 根据公式(1)得每组需要90名参加者;规定当7T =0. 4 时即每组有36名完成研究时确定是否需要样本最调 整。假设每组完成山二力名后发现对照组和试验组 标准差分别为58和62。则合并方差为36,即标准 差应为6。这表明标准差在试验前被低估如果根据 通常的固定样本童设计的临床试验继续进行试验,则 该试验銀终检验效能只有0.604。因此决定调幣样本 量,调整后的每组参加者应为130

24、名。所以每组需要 继续招募 = 130 - 36 = 94名参加者,当试验全部完 成时进行统计分析。计算得对照组和试验组标准差分 别为 5.5 和 56门=1.4mmHg0 则:£ =31.4 = 20272“=258人切2“005。则可判定两组 间的舒张压差异具有统计学意义,即试验组舒张压小 于对照组舒张压。讨 论本文中样本量调整后方差误差的范围计算简单明 了,应用起来十分方便,从而能用来判断误差是否可以 忽略不计。如果所得误差较大,建议使用本文方法进 行校正。因为药物临床试验不是单个独立的试验,通 常是有I期、II期.皿期甚至IV期一系列试验组成,因 此如果在每次试验时都能够给岀

25、足够精确的方差估计 6 值,将为后来的试验设计提供确切的信息。另外,本文 介绍的样本最调整后校正t检验能很好的控制第I类 错误率,并能充分满足方案预定的检验效能。虽然该 样本倉调整方法研究结果都是在一般两样本单测/检 验条件下得到的但在优效或非劣效设计的临床试验 中运用该方法能得到同样的结果即本文介绍的样本 量调整方法也可应用于优效或非劣效设计的临床试验 中。本文介绍样本重估的方法需要揭盲因此存在 一定的风险如研究者有可能在方差重估时获得组间 差值因为如果知道组内方差和总体方基,从而能得到 组间方差,组间方差越大说明组间变异大研究者也 能从中判断组间基值较大即组间可能存在至异。因 此,应该尽臭

26、避免计算总体方差。并且这些都有可能 对研究者在随后选择患者或治疗患者等方面产生一定 影响因此应尽量滅小这些风险,如有独立统计师进行 中期分折,并成立一个独立监察委员会(Independent Data Monitoring Committee t IDMC)对相关结果进行决 策,同时对有关操作进行监督指导以避免产生操作偏 移。这样有可能使本来就错综复杂的临床试验变的更 复杂。并且当需要进行相关调整时IDMC不一定能 协调好各利害相关者之间的矛盾.IDMC给出的有关 指导怠见不一定能被申办者或研究者所采纳。需要强 调的艇本文中揭盲的目的是为了计算组间合并方基, 而不是为了推断两组差异,因此我们不

27、认为这种中期 揭盲中断了双盲试验的完整性。本文样本就调整方法,是在假设5始终保持不变 的前提条件下进行的,没有考虑5变化情况。但在现 实的临床试验中,有可能试验前设定的也需要改变。 同时考虑S。和5均变化的样本量调整方法对试验各 方面将产生怎样的影响,方差估计值是否同样存在偏 移调整后的假设检验能否很好的控制第I类错误率 并达到预期的检验效能等等都需要进一步研究。因 此,综合考虑S。和5都有变化时的样本量调整方法是 作者下一步要继续进行的工作。A Method of Sample Size Re-estimation During Adaptive Clinical Trials Xie Zh

28、ihui.Hu Fang.Ren Jumling9et al. Department中国卫生烧计2010年2月第27卷第I朗 of Health Statistics .Second Military Medical Cniversity( 200433 ) 9 Shanghai.Abstract Objective Introducing method of sample size re estimation in adaptive clinical trials .and studying the type I error rate and the power of suiistical

29、mebod after the sample size adjusuncnt. Methods We studied the impact of magnitude of 叫 to final sample size .assessing the bias of finally cakuhied variance to tnie variance ; memwhiie studying the type I error rau and the power of the adjustment stansucal mebod by monte carlo simulMions. Results (

30、l)Tbe simulition results showed that the final sample size was very near to the true size (specially when the adjustment was made at n »0.4. (2)Meanwhile our results indicated chat the bias in (be type I error rate was negligible and (he desired power was maintained with the introduced correcud

31、 r-test after the wunpk size adjustment. Conclusion AU simuhtion results cre got under the two-sample / test with ooe-side and it can be applied in non-infcriority or superiority clinical trills.Key words Sample size re-esdmauon;The internal pilot study;Adaptive clinical trials簽考文駅1. ICH ICH harmoni

32、sed tripartite guideline E9: statistical principles for clinicd Sutistics in MedidneJ999t18:l905-J942.2. Wittes J9Brituio E. The role of intcnul pikx studies in increasing the efficiency of clinical trials. Statistics in Medicine, 1990,9 :65-72.3. Birtxa MA,Day SJ. Intenul pikx studies for estimatin

33、g sample size. Suh tisucs in Medicine ,1994113:2455-2463 4. Gould AL. locerim analyses for rooaitonng clinical triab that do no materially affect the type I enor mu. Suoslics in Medicine, 1992 tlI :55-665. Stein C A two-sample test for a linear hypothesis whose power is inde pendem of the variance.

34、Annals of Muhematical Sutis6cs91945 v16:243» 258.6. Johnson, Kotx. Bahkrishnan. Continuous Uoivviate Distributkms, Vol umes I and U.2nd Ed John WUey and Sons.1994.421 7. Posch M. Bauer P. Interim aniiysu and sample size reaascssmeni. Bio- gritt.2000.56:ll70-U76 & Kieser M.Friede T. Re-cakuhtng the sample size in intenu) pikx study designs with cootroi of the type I error rau. Statistic in Medicine v2000. 19:901-911 9. Appel LJ,Moore TJ.Obarzanek E.et al. A dinical trill of he effects of dietary

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论