




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、整理课件1统计学的基本概念统计学的基本概念 样本量与检验效能样本量与检验效能临床试验课程汕头大学医学院2011年10月2829日Marcel Wolbers越南牛津大学临床研究中心整理课件2重温统计学的基本概念(针对连续性变量)- 点估计- 标准误和可信区间- 假设检验, p值, 显著性水平和效能整理课件3例子 随机对照临床试验 一种降压药与安慰剂的比较 主要指标:随机分配后一个月时病人收缩压与之前基础水平的差值 随机分配病人到每个组,每组 n=100 (总数为:N=200) 结果 使用安慰剂后血压改变的均值: x1 = -0.8 mmHg 使用降压药后血压改变的均值: x2 = -5.4 m
2、mHg 观察到的降压药效果: x2 - x1 = -4.6 mmHg 个值偏离平均值的距离的平均数(标准差): = 10 mmHg 我们可以从中学到什么?整理课件4观测效应是否反映了真实的总体效应? 目标人群研究对象干预组对照组结果结果时间?整理课件5统计学的一些基本问题 对真实的(总体)疗效最可靠的估计是怎样的? 估计 从中得出的总体疗效在什么范围内是可信的? 可信区间 治疗是否有效?也就是说, 我们是否能得出真实疗效不等于0的结论? 假设检验整理课件6在同样的目标人群中50个随机对照临床试验的观测值Observed treatment effect-12-10-8-6-4-20True (
3、population) effect整理课件7参数估计与不确定性 最可靠的真实疗效的参数估计: x2 - x1 = -4.6 mm Hg 我们如何量化这种评估方法的不确定性? 标准误 可信区间整理课件8标准误 量化估计疗效的准确性 定义为:当随机对照试验重复很多次时估计疗效的标准差 公式: 仅根据一次随机对照试验就可以得出:数学公式:nES2.).effect, true(212ESNxx 整理课件9True (population) effect2.5%2.5%S.E.= 2 n1.96S.E.观察到的疗效分布图整理课件10可信区间 (CI) 量化试验结果中可信真实疗效的准确范围 通常采用
4、95% CI 我们有95%的把握认为,真实的疗效在95%的可信区间内。 如果进行多次随机对照试验,则95%CI会包含95%的试验的真实疗效。 整理课件1150次随机对照试验中观察到的药物疗效(95% CI)Observed treatment effect-12-10-8-6-4-20True (population) effect整理课件12计算CI几个类似的公式.58. 2 :CI 99%.96. 1 :CI 95%.64. 1 :CI 90%121212ESxxESxxESxx整理课件13适用于我们的例子的S.E.和CI公式0 . 1, 2 . 8 Interval 41. 158. 2
5、6 . 4.58. 2 :CI %998 . 1, 4 . 7 Interval 41. 196. 16 . 4.96. 1 :CI %9541. 11002102.1212ESxxESxxnES整理课件14假设检验的步骤 I建立无疗效的零假设 H0: 干预与对照效果一样 (“无差异”, 真实疗效=0) HA: 干预有效果, 真实疗效0 (对立的假设, 双侧)进行随机对照试验和收集数据 在H0假设(即“无差异”)的前提下,比较实际疗效与预期疗效整理课件15假设检验步骤 II计算试验观察到的样本数据符合“零假设成立” 的可能性(P值) 如果零假设成立,那么 比如说,如果观察到的疗效值比1.96S
6、.E. 大,那么意味着p (通常: p 0.05) “无统计意义” “零假设成立”但是,并不说明两组一样! 有可能是因为: - 两组间确实无差别 - 无法测出存在的差别 - 差别很小 - 样本量不够 整理课件17统计检验和可信区之间的对偶性 95% CI包括 0 p0.05 95% CI不包括0 p0.05整理课件18假设检验中的第一类和第二类错误 第一类: 零假设 ()为真,拒绝零假设, 也就是说,错误地认为有差别. 提前设定的一类错误的概率 通常 =5% (显著性水平) 第二类: 零假设 ( )不真 ,接受零假设,也就是说,无法测出真实的差别。 犯二类错误的可能性(即 ), 取决于效应的大
7、小和样本量 检验效能= 1- 整理课件19显著性检验的选择结果选择 H0 成立 HA 成立接受 H0拒绝 H0 显著性水平: 犯第一类错误的可能性. (一般取: =5% or 1%.)检验效能: 1- 犯第二类错误的可能性. (一般取: 1-=80% or 90%.)正确接受错误接受(第二类错误, )错误拒绝(第一类错误, )正确拒绝整理课件20p值和可信区间的解释 实例 * Kirkwood&Sterne, p.76 f整理课件20例子 有3种针对心脏病发作高危的中年人群的降血脂新药(A,B,C) 药A和B 价格低廉 药C 价格昂贵 进行了5个包含这3种药物和对照(安慰剂)的随机试验
8、 主要的检测指标 一年内血脂水平 临床上确认的血脂下降均值(相对于安慰剂) 40 mg/dl或更多 对心脏病发作有重要保护作用 20-40 mg/dl 中等保护作用整理课件22试验结果- 如何分析?试验药物价格每组的病人数一年内血脂均值(mg/dl)药物引起的下降值待测药 安慰剂估计值95% CIP值1A便宜30140180-40(-118,+38)0.322A便宜3000140180-40(-48,-32)0.0013B便宜40160180-20(-85,+45)0.544B便宜4000178180-2(-8.5,+4.5)0.545C昂贵5000175180-5(-8.9,-1.1)0.0
9、1整理课件23重点 P值大并不代表零假设是正确的 “没有证据并不证明不存在” 统计学意义不完全和临床相关 小试验 真实疗效大不一定会有统计学意义 大试验 疗效小也可以有统计学意义 通常情况下,可信区间比P值更有意义 给出数据中可信值的范围 即使在相关性检验无统计意义的时候,窄的可信空间也能排除疗效大的情况。 一般建议:描述数值的时候,通常应该给出数值的95%CI和P值整理课件24随机对照试验中样本量的计算 基本概念整理课件25在随机对照临床试验中计算样本量的重要性 问题: 在随机对照临床试验(RCT)中,需要多少病人来随机分配? 在设计随机对照临床试验时,设定样本量是一个严肃的问题! 伦理学方
10、面 样本量过大 太多的病人暴露在RCT的危险中 样本量过小 尽管病人暴露在RCT的危险中,但试验却无法说明重要的临床差异。 经济方面 以上两种情况都会导致资源和时间的浪费整理课件26样本量计算基本原理 选定的显著性水平和检验效能 两个治疗组之间的预期差异 最小的临床相关性差异 预期的差异(根据之前的试验和/或专家的判断) 个值和总体均值之间的差异在RCT中,通常根据试验的主要检测指标计算样本量,还根据:整理课件27显著性检验的选择结果选择 H0 成立 HA 成立接受 H0拒绝 H0 显著性水平: 犯第一类错误的可能性. (一般取: =5% or 1%.)检验效能: 1- 犯第二类错误的可能性.
11、 (一般取: 1-=80% or 90%.)正确接受错误接受(第二类错误, )错误拒绝(第一类错误, )正确拒绝整理课件28适用于两组间比较的简单样本量公式整理课件29计算样本量的参数(连续性结果) 必须在试验中能测到的效应大小: (情境依赖) 病人结果的标准差与样本均数的差异: (情境依赖) 显著性水平: (一般: =5%) 检验效应大小的检验效能: 1-(一般: 1-=80% or 90%)整理课件30H0成立时,观察到的疗效分布H0:0100 2 2Critical valueS.E.= 2 nz1 2 2 n整理课件31当H0或HA成立时,观察到的疗效分布H0:0100 2 2Crit
12、ical valueS.E.= 2 nz1 2 2 nHA:01Power 1S.E.= 2 nz1 2 n整理课件32适合连续性结果的样本量公式当试验采用统计意义水平和检验效能 1-时,备注 n是组样本量; 总的来说, N=2n的病人量是必须的 样本量与/(标准化的效应大小)的平方成反比. =0.05, =0.20 (z1-/2+z1- )2= 7.85 =0.05, =0.10 (z1-/2+z1- )2=10.512212/112/1)/()(2/2/20zznnznz整理课件33简化的样本量计算公式(连续性结果) 显著性水平为5%, 检验效能为80% 每组样本量n 为显著性水平为5%,
13、检验效能为90% 每组样本量n为 指的是标准化的目标效应大小:221n216n整理课件34例子 RCT 比较降压药与安慰剂的试验 主要指标: 随机分配后一个月时血压下降值 (= 服药的日期) 假定: 两组数据接近正态分布,并且差值已知=10 mm Hg 需要有有效的检验效能来检测干预组中比安慰剂组大于5 mm Hg的下降值(=5) =5% (双侧), =10% (90% 检测效能) 需要多少病人?根据公式得出:=0.5 n = 84 (每组)共需要168位患者以供随机分配。整理课件35各组总样本量不同时的样本量 假设不需要1:1随机配对, 而是1:2. 这对样本量有什么影响? 理论上的结果:如
14、果随机分配到一个组的病人比率是,我们需要考虑多一个因素 来增加样本量,从而保持相同的检验效能 (相对于1:1 随机配对)1:1 随机配对是最佳的对于1:2随机配对(=0.333)来说,总样本量必须增加12.5%.)1 (4/(1整理课件36样本量计算需要用到的参数(双重结果) 对照组结果的可能性:p1(情境依赖) 干预组结果的可能性: p2 (情境依赖) 显著性水平: (通常: =5%.) 检测效应大小的检验效能: 1-(通常: 1-=80%或90%)整理课件37适用于双重结果的样本量计算公式 每组所需的样本量n 为 z1-/2=1.96 时,显著性水平为5% z1-=0.84时,检验效能为8
15、0%; z1-=1.28时,检验效能为90%2/ )(with )()1 ()1 ()1 (2212122221112/1pppppppppzppzn整理课件38例子 RCT 癌症标准疗法和新疗法的比较 主要检测指标: 出现完全肿瘤反应的病人比例 假设: p1=0.6, p2=0.8 =5% (双侧), =10% (90% 检验效能) 需要多少病人?根据公式得出 n=109 (每组)总病人数:N=218整理课件39研究标书中样本量的标准说明这个试验中衡量效能的主要指标是,每组中出现完全肿瘤反应的病人的比例。在预试验中, 对照组中约60%的病人出现完全肿瘤反应。由于干预,主要检测指标上升了20%
16、(从 60%到80),可以认为具有真实性和临床相关性。为了在双侧5%显著性水平和90%的检验效能的情况下能检测到这样的变化,需要218个病人(每组109个) 考虑到存在病人失访和违反标书标准的可能性, 需要240个病人来随机分配 (每组120个)。整理课件40计算样本量的软件 现在有很多计算样本量的免费商业软件 许多在线计算工具 可信度多少? 有一款免费的、互动的软件,我觉得挺好用:“PS: Power and Sample Size Calculation” (/wiki/Main/PowerSampleSize)整理课件41讨论
17、整理课件42讨论一 在设计RCT时,计算样本量是一个很重要的问题,也是实验标书的一个必要组成部分(包括对计算时采用哪种假设的说明)。 许多情况下/试验都有样本量计算公式。在某些复杂的情况,样本量也可以通过模拟得出.整理课件43讨论二 样本量的计算通常是基于对真实效应大小和数据差异的假设。 尽量做出尽可能接近现实的假设(“无用输入 无用输出”). 以下方面的结果:二期试验, 相似药物的试验, 后期分析, 专家评判等. 在不同的情况/假设下计算样本量 谨慎的计算 不是:只有80%的检验效能和对疗效非常乐观的假设. 请注意:一些病人有可能改变治疗或者失访,而这会降低有效治疗的效果 (如在意向性治疗分析中所估计的). 整理课件44讨论三 在实践中, RCT中样本量的计算经常需要在对实际情况的假设和实验的可行性这两个方面中择中选择。 例子: 在某种罕见疾病的研究中,通过样本量计算得出需要5000个病人。实际上,要在合理的时间段内收集到这么多病人,简直是天
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 室外庭院涂料施工方案
- 机房 施工方案
- 开工施工方案
- 滩涂锚杆施工方案
- TSHJNXH 0014-2024 火力发电厂烟气二氧化碳捕集系统(化学吸收法)能效评价方法
- TSHAEPI 003-2022 餐饮油烟在线监测(光散射法)与监控技术规范
- 二零二五年度解除影视制作解除担保合同
- 二零二五年度个人债权转让及债务清收执行合作协议
- 二零二五年度跨境离婚协议书电子化执行合同
- 二零二五年度子女自愿离婚协议书范本及离婚后子女监护权
- 2025年共青科技职业学院单招职业适应性测试题库完整版
- 2025年上半年潜江市城市建设发展集团招聘工作人员【52人】易考易错模拟试题(共500题)试卷后附参考答案
- 统编版语文二年级下册15古诗二首 《晓出净慈寺送林子方》公开课一等奖创新教学设计
- 旋转类机电设备故障预测、诊断研究
- 旅游电子商务(第2版) 课件全套 周春林 项目1-8 电子商务概述-旅游电子商务数据挖掘
- 企业承包经营合同范本
- 中学校长2025春开学典礼讲话:以黄旭华之魂、DeepSeek 之智、哪吒之气逐梦新程
- 广东广东省钱币学会招聘笔试历年参考题库附带答案详解
- 2025年福建省中职《英语》学业水平考试核心考点试题库500题(重点)
- 【课件】自然环境课件-2024-2025学年七年级地理下册人教版
- 2025年01月公安部第三研究所公开招聘人民警察笔试笔试历年典型考题(历年真题考点)解题思路附带答案详解
评论
0/150
提交评论