常见研究类型的样本量估算_第1页
常见研究类型的样本量估算_第2页
常见研究类型的样本量估算_第3页
常见研究类型的样本量估算_第4页
常见研究类型的样本量估算_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

样本量的估算1

为什么要估算样本量2

样本量估算的两类问题

3

样本量估算的步骤4使用PASS软件估算样本量目

录一、为什么要估算样本量两个装有红黑色玻璃球的瓶子

偶然性每组研究人数有效人数(AvsB)P值109vs80.535045vs400.1610090vs800.048•

临床研究发现治疗高血压A药有效率90%,B药有效率80%•

A药是否比B药疗效好?每组研究人数低于100时,

组间差异并不显著!

!!

检验效能不足的•可重复性差,不能排除偶然因素的影响样本量

检验效能低,

阴性结果难以解释过大的•

负担不起(财力、人力、时间)样本量•

增加临床研究的难度合适的•确保研究具有可行性且能够得到有价值、可靠的信息

样本量在保证某个临床试验/临床研究的结论具有一定科学性、真实性和可靠性前

提下,

估算某研究所需的最小观察例数。

样本代表性二、样本量估算的两类问题1.

区间估计:

保证测量准确度与精确度•

按一定的概率(置信度)

估计总体参数所在的范围•

估计人群中某种疾病患病率2.假设检验:

确保正确发现差异•

设定假设,

根据样本统计量推断总体参数是否不相等•比较A和B两种治疗方法疗效是否不同

样本量估算的两类问题1.某地区肺癌发病率是多少?2.某地区肺癌发病率是否为10%?3.吸烟者肺癌发病率是否高于非吸烟者?选项:A.假设检验类;B.区间估计类区间估计类假设检验类假设检验类以下三个研究分别属于上述哪类研究问题?

思考题三、样本量估算的步骤1.区间估计类研究问题2.假设检验类研究问题采用横断面调查估计整体均数的样本量估算公式

N=(Z1-α/2S/δ)2进行样本量估计,取置信度1-α=0.95,Z1-α/2=1.96,参考相关文献,取S=9.8,

允许误差

δ=1.2进行样本量估算,考虑20%的无应答和无效问卷,最终所需样本量为

320例。四川凉山地区HIV感染者/艾滋病患者自我管理现状及影响因素研究大部分区间估计类研究问题采用横断面调查设计类型

1.确定研究设计类型>结局指标不同

样本量的估计方法不同口

连续变量:

如年龄、身高;口

分类变量:

如患病率、死亡率多个结局指标

估算每个结局指标所需的样本量取样本数量最大者估算每个结局指标所需的样本量,

取样本数量最大者仅估计主要指标所需样本量(比较常见)

2.确定结局指标主要指标和次要指标··例:

急性胰腺炎患者生活质量与心理状态、社会支持的相关性分析A.估算每个结局指标所需的样本量

取样本量最大者B.仅估计主要指标所需样本量

2.确定结局指标1-α,

反映估计准确度

即置信区间包含总体参数的概率。1-α越接近于1

所需样本量越大。·

通常取95%。

3.确定置信度··85分

88分

95分B省与A省情况相近,想估计B省学生考试成绩平均分·容许误差的确定:

根据研究对精确度的要求、调查预算、调查性质确定。反映估计精确度

两倍的容许误差

(δ)

为置信区间的宽度(CU-CL)·容许误差越大

所需样本量越小

反之

所需样本量越大。

4.确定容许误差CL

CU95%CI:

85,95A省·结局指标为数值变量时

总体标准差σ为估计样本量所必须的条件。结局指标为分类变量时

总体率π为估计样本量条件。>总体标准差σ和总体率π的估计:

查阅文献、预实验或对研究作出合理的

假设来获得。(1)调查某医院护士法律知识水平,应获取某市(国)、某级护士的法律知识水平及标准差(2)调查某市艾滋病的发病率,总体率则为某省或国内艾滋病的发病率

5.确定总体标准差或总体率·软件:PASS、Stata、SAS、SamplePower等

6.估计样本量连续变量的区间估计率的区间估计·查表·

公式单侧α0.400.300.200.100.050.0250.010.005双侧α/20.800.600.400.200.100.050.020.01β0.400.300.200.100.050.0250.010.0051-β0.600.700.800.900.950.9750.990.995Z值0.25320.52430.84171.28161.64491.9602.32632.5758

6.估计样本量Z值表·受试者可能有不合作者(无应答)

中途失访、意外死亡等

因此需对样本量进行校正。

公式:

n'=n/(1-f)f

通常为:

10%、

15%、20%·另外

当总体人数较小时

需明确总体人数(N)

并使用有限总体校正公

式对样本量进行校正。

7.校正样本量三、样本量估算的步骤1.区间估计类研究问题2.假设检验类研究问题>研究设计方案不同

样本量的估计方法不同•

随机对照试验/队列研究•

病例对照研究•

横断面调查

……

1.确定研究设计类型>结局指标不同

样本量的估计方法不同•连续变量:如年龄、身高;•分类变量:如发病率、死亡率;•

生存数据•等级变量(有序多分类):如痊愈、显效、好转、无效

2.确定结局指标估算每个结局指标所需的样本量

取样本数量最大者仅估计主要指标所需样本量(比较常见)多个结局指标

估算每个结局指标所需的样本量取样本数量最大者

2.确定结局指标主要指标和次要指标··>

检验水准α•

α又称I类错误。

H0正确时,拒绝H0

的概率。•

α越小,所需样本量越大。•

通常取α=0.05。>

检验效能1-β•H0错误时(即H1

正确时),拒绝H0

的概率。•

1-β越大,所需样本量越大。•

通常取1-β为0.80或0.90。组间存在的真实差异有无正确(1-β)I类错误

(α)II类错误

(β)

正确(1-α)

3.确定检验水平和检验效能组间出现统计学上显

著性差异有

无•

A药的治疗有效率是50%•

预计B药的有效率为51%•

预计C药的有效率为99%•

拟比较B药和A药的疗效差异•

拟比较C药和A药的疗效差异·不同组之间的差值越大

所需样本量越小

差值越小

所需样本量越大。·差值的确定:

查阅文献、预实验或专业上认为有意义的差值。

4.确定差值合理膳食对降低血清胆固醇疗效的探索研究某研究者拟开展一项随机对照试验,探讨合理膳食是否能降低血清胆固醇。参考相

关文献,估计对照组血清胆固醇水平的平均值为(215±30)mg/dl;根据临床经验,

预期合理膳食可以使试验组的血清胆固醇水平较对照组降低15mg/dl。依那普利叶酸片对降低高血压发病率的效果研究某研究者拟开展一项随机对照试验,探讨使用某药物是否能降低高血压病的发病率。

估计安慰剂对照组的发病率为40%。实施干预措施1年后,估计试验组的发病率为20%。

4.确定差值结局指标为连续变量时

总体标准差σ为估计样本量所必须的条件。结局指标为分类变量时

总体率π为估计样本量条件。·总体标准差σ和总体率π的估计:

查阅文献、预实验或对研究作出合理的假设来获得。

5.确定总体标准差或总体率·单侧检验需要的样本量比双侧检验小。·如果我们肯定试验组的效果要高于对照组(优效性试验)

那么可以

用单侧检验

。·在没有充分理由或专业知识说明的情况下

应该选择双侧检验。

6.确定单双侧检验·

软件

PASS、Stata、SAS、SamplePower等

7.估计样本量两样本率的检验两样本均数的检验·

查表·

公式·受试者可能有不合作者(无应答)

中途失访、意外死亡等

因此需对样本量进行校正。

公式:

n'=n/(1-f)f

通常为:

10%、

15%、20%·另外

当总体人数较小时

需明确总体人数(N)

并使用有限总体校正公

式对样本量进行校正。

8.校正样本量2.确定结局指标2.确定结局指标3.

确定置信度3.确定检验水平和检验效能3.

确定容许误差4.确定差值3.

确定总体标准差或总体率5.确定总体标准差或总体率6.确定单双侧检验3.

计算7.

计算1.确定研究设计类型1.确定研究设计类型区间估计类研究问题假设检验类研究问题3.

校正样本量8.校正样本量

估算样本量的步骤在样本容量确定的过程中总体所起的作用视它规模的大小而有所差异小规模总体的大小将起重要作用对于中等规模的总体,其作用中等重要大总体的规模对样本容量确定则不起作用对于小规模总体,

通常必须调查较大比例的样本,

以取得所期望的精度

因此,

实际操作中,

对小规模总体经常采用普查而不是抽样调查。

总体的大小对样本量的影响10,000,000400总体规模所需的样本量5044100805002221,0002865,00037010,000385100,0003981,000,000400

总体的大小对样本量的影响不同规模总体抽样所需样本量(P=0.5,δ=0.05,

1-α=0.95)◆估算样本量时:•通常假定采用的抽样方式为简单随机抽样(SRS)。◆实际应用时:•分层抽样得到的估计值通常比相同规模的简单随机抽样更精确,或者至少一样精确•整群抽样得到的估计值通常低于简单随机抽样的估计值的精度。◆

简单说:•确定样本量后,采用分层抽样来获取样本更好,其次为简单随机、整群、方便抽样

抽样方法对有样本量的影响使用PASS软件估算样本量P

o

w

e

r

A

n

al

ysisa

ndS

a

m

pleSiz

e•

横断面调查的样本量估算•RCT/队列研究的样本量估算•

成组设计、病例对照研究样本量估算方法

PASS软件介绍适用于Windows系统研究设计/结局指标1.横断面调查+连续变量2.横断面调查+分类变量3.

RCT/队列研究+连续变量4.

RCT/队列研究+分类变量5.

成组设计病例对照研究+OR

常见研究背景研究类型:

横断面调查结局指标:

连续变量横断面调查的样本量估算研究类型:

横断面调查结局指标:

分类变量12某研究者拟开展一项横断面调查,调查某县高三年级男生的身高。据文献报道,邻县高三年级男生的身高均值大约为173cm,标准差约为10cm。规定容许误差为1cm,置信度1-α=0.95,

已知该县高三年级男生共有3800人,则样本含量至少应有多少人?区间估计的样本量估算 横断面调查—连续变量某研究者拟开展一项横断面调查,调查某县高三年级男生的身高。据文献报道,邻县高三年级男生的身高均值大约为173cm,标准差约为10cm。规定容许误差为1cm,置信度1-α=0.95,

已知该

县高三年级男生共有3800人,则样本含

量至少应有多少人?1.确定研究设计类型2.确定结局指标3.

确定置信度3.

确定容许误差3.

确定总体标准差或总体率3.

计算3.

校正样本量区间估计类研究问题横断面调查—连续变量4.容许误差

3.置信度1.研究设计类型5.总体标准差2.结局指标1.研究设计类型某研究者拟开展一项横断面调查,调查2.结局指标某县高三年级男生的身高。据文献报道,邻县高三年级男生的身高均值大约为5.总体标准差173cm,标准差约为10cm。规定容许4.容许误差

3.置信度

误差为1cm,置信度1-α=0.95,

已知该县高三年级男生共有3800人,则样本含

量至少应有多少人?连续变量的区间估计横断面调查—连续变量◆选择Means→OneMean→Confidence

Interval→Confidence

IntervalforOneMean

PASS操作

PASS操作总体标准差允许误差样本总体置信度•DistancefromMeanto

Limit(s):是指均值到置信区间上限(或下限)的宽度,

即容许

误差。•KnowStandardDeviation选项:勾选→表示研究者认为结局指标符合正态分布;

不勾选

→表示研究者认为结局事件符合t分布。(不勾选时样本量略大,一般情况下可以不勾选)•PopulationSize:

当总体数量可以认为是无限大时,填写Infinite;

当知道调查对象大约总

体数量时,填入相应的数值或近似值。(不同总体数量,样本量差别较大,请务必填入)

PASS操作

PASS操作利用PASS2021软件进行样本量估计,取置信度1-α=0.95,取容许误差δ=1,参考相关文献,取标准差s=10,选择“单个均数置信区间的样本量”估计模块进行样本量估计,

需要调查的样本量N=387例,假定应答率为80%,

则公需要样本量N=387÷0.8=484例。某研究者拟开展一项横断面调查,调查某县高三年级男生的身高。据文献报道,邻县

高三年级男生的身高均值大约为173cm,标准差约为10cm。规定容许误差为1cm,置信度1-α=0.95,

已知该县高三年级男生共有3800人,

则样本含量至少应有多少人?

撰写结论设定为有

限总体样本总体

总体大小对样本量的影响

总体大小对样本量的影响有限总体无限总体◆

样本量与置信度1-α及总体标准差6成正

比,

与容许误差δ成反比。◆

置信度1-α及容许误差δ一定时,

总体标

准差6越大,所需样本量越大。◆

置信度1-α及总体标准差6一定时,容许

误差δ越小,所需样本量越大。横断面调查+连续变量

样本量影响因素研究类型:

横断面调查结局指标:

分类变量横断面调查的样本量估算研究类型:

横断面调查结局指标:

连续变量211.研究设计类型某研究者拟开展一项横断面调查,调查北京市40岁及以上人群的高血压病2.结局指标患病率。根据其它地区同类调查的结果,估计该年龄段人群中的高血压病

患病率为30%。规定容许误差为3%,4.容许误差置信度1-α=0.95,

则至少应该调查多3.置信度少人?1.确定研究设计类型2.确定结局指标3.

确定置信度3.

确定容许误差3.

确定总体标准差或总体率3.

计算3.

校正样本量区间估计类研究问题率的区间估计横断面调查—分类变量5.总体率◆

选择Proportions→OneProportion→Confidence

Interval→ConfidenceIntervalforOneProportion

PASS操作

PASS操作置信区间宽度、两倍允许误差总体率估计值置信度

PASS操作◆

样本量影响因素包括置信度1-α、

体率及容许误差。◆

置信度1-α及容许误差一定时,

所需样

本量随总体率π增大先增加后减少

。总体率π为0.5时,

所需样本量最大。◆

置信度1-α及总体率π一定时,

容许误

差越小,

所需样本量越大。横断面调查+分类变量

样本量影响因素

1

DistancefromMean

toLimit(s)Confidence

Interval

Width(Two-Sided)均值到上或下9

5

%

可信区间的距离可信区间上下限的距离(双侧

两倍于前者

2

无PopulationSize选项PASS中连续变量与分类变量的区别允许误差

横断面调查总体标准差总体率估计值允许误差×2样本总体置信度置信度值(P)

如何估算样本量?A.假设P为0.2,计算样本量

B.假设P为0.5,计算样本量C.假设P为0.8,计算样本量

D.假设P为0.9,计算样本量

E.无法估算欲调查某市成年人冠心病患病率

因各种原因无法获得该市成年人患病率估计

思考题研究类型:

RCT/队列研究结局指标:

连续变量RCT/队列研究的样本量估算研究类型:

RCT/队列研究结局指标:

分类变量12R=随机分组随机REO1XAO2O3…E=试验组对照C=对照组试验RCO1XBO2O3…X=干预措施On=第n次观察或测量均具有对照组

样本量计算方法相同追踪观察追踪观察

RCT与队列研究研究对象结局非暴露组结局暴露组队列

研究某研究者拟开展一项随机对照试验,探讨合理膳食是否能降低血清胆固醇。

估计对照组血清胆固醇水平的平均值

为(215±30)mg/dl,合理膳食估计可

以使试验组较对照组降低15mg/dl。设α=0.05(双侧),把握度1-β=0.90,

请估算试验组和对照组所需样本量。假设检验类研究问题1.确定研究设计类型2.确定结局指标3.确定检验水平和检验效能4.确定差值5.确定总体标准差或总体率6.确定单双侧检验7.

计算8.校正样本量研究问题—连续变量1.研究设计类型某研究者拟开展一项随机对照试验,2.结局指标探讨合理膳食是否能降低血清胆固醇。估计对照组血清胆固醇水平的平均值5.标准差为(215±30)mg/dl,合理膳食估计可4.差值以使试验组较对照组降低15mg/dl。设α=0.05(双侧),把握度1-β=0.90,6.双侧检验请估算试验组和对照组所需样本量。假设检验类研究问题1.确定研究设计类型2.确定结局指标3.确定检验水平和检验效能4.确定差值5.确定总体标准差或总体率6.确定单双侧检验7.计算8.校正样本量研究问题—连续变量3.检验水平

3.检验效能选择Means→Two

IndependentMeans

→T-Test(Inequality)→Two-SampleT-TestAssumingEqualVarianceTwo-SampleT-TestAssumingEqualVarianceTwo-SampleT-TestAllowingUnequalVariance

PASS操作假设两组的方差是相等的两组的方差可以不相等

PASS操作默认两组样本相等两组的标准差两组的均数检验效能检验水准两样本均数的检验

PASS操作利用PASS2021软件进行样本量估计,取检验水准α=0.05,检验效能1-β=0.9,根据临床

数据,取µ1=215,S1=30;

根据临床经验,预测通过合理膳食后,试验组的血清胆固醇

水平可以降至200mg/dl,选择“两独立样本t检验,假定两组方差齐”样本量估计模块,

计算得所需样本量为:N1=N2=86,考虑10%的脱落率,校正后所需样本为N1=N2=96。某研究者拟开展一项随机对照试验,探讨合理膳食是否能降低血清胆固醇。估计对照组血

清胆固醇水平的平均值为(215±30)mg/dl,合理膳食估计可以使试验组较对照组降低15mg/dl。设α=0.05(双侧),把握度1-β=0.90,请估算试验组和对照组所需样本量。

撰写结论◆

不同组之间的差值越大,所需样本量越小,差值越小,所需样本量越大;◆

结局指标为数值变量时,总体标准差6为估计样本含量所必须的条件;◆

检验水准α越小,所需样本量越大;◆

检验效能1-β越大,所需样本量越大。RCT/队列研究+连续变量

样本量影响因素两样本均数的检验◆

不同组之间的差值越大,所需样本量越小;

差值越小,所需样本量越大。对照组保持215mg/dl不变,试验组变化RCT/队列研究+连续变量

样本量影响因素1952002052152152154885190201510Mean1

(MeansofGroup

1)

:215Mean2

(MeansofGroup2)

:

195200205RCT/队列研究+连续变量

样本量影响因素对照组保持215mg/dl不变,试验组变化试验组保持200mg/dl不变,对照组变化195

21520

48

2002202048200

21515

852002151585205

21510190

20021010190◆

不同组之间的差值越大,所需样本量越小;

差值越小,所需样本量越大。RCT/队列研究+连续变量

样本量影响因素RCT/队列研究的样本量估算研究类型:

RCT/队列研究结局指标:

连续变量研究类型:

RCT/队列研究结局指标:

分类变量21某研究者拟开展一项随机对照试验,探讨使用某药物是否能降低高血压病

的发病率。估计安慰剂对照组的发病

率为40%。实施干预措施1年后,估计试验组的发病率为20%。规定α=0.01(双侧),β=0.10,请计算试

验组和对照组所需样本量。假设检验类研究问题1.确定研究设计类型2.确定结局指标3.确定检验水平和检验效能4.确定差值5.确定总体标准差或总体率6.确定单双侧检验7.

计算8.校正样本量研究问题—分类变量1.研究设计类型某研究者拟开展一项随机对照试验,探讨使用某药物是否能降低高血压病2.结局指标的发病率。估计安慰剂对照组的发病率为40%。实施干预措施1年后,估计试验组的发病率为20%。规定α6.双侧检验=0.01(双侧),β=0.10,请计算试3.检验水平

3.检验效能验组和对照组所需样本量。假设检验类研究问题1.确定研究设计类型2.确定结局指标3.确定检验水平和检验效能4.确定差值5.确定总体标准差或总体率6.确定单双侧检验7.

计算8.校正样本量研究问题—分类变量4.差值5.总体率选择Proportions→Two

IndependentProportions→Test(Inequality)→TestforTwoProportions

[Proportions]

PASS操作

PASS操作检验效能检验水准默认两组的样本相等两组的率双侧检验

PASS操作以下关于样本量估算的描述中正确的有?(多选)A.RCT中试验组与对照组预计差值越大,所需样本量越小B.检验效能越高,所需样本量越大C.检验水平α越小,所需样本量越小D.对于连续变量,总体标准差6为必备条件,且6越大,所需样本量越小两样本均数的检验两样本率的检验

思考题成组设计、病例对照研究

样本量估算方法研究类型:

成组设计/病例对照研究结局指标:

比值比(OR)1拟采用病例对照研究探讨吸烟与肺癌的关系。选择肺癌患者为病例组,非

肺癌患者为对照组。预期吸烟者发生

肺癌的比值比(OR)为2.0,对照组

人群的吸烟率约为20%,设α=0.05(双侧),β=0.10。病例组和对照组

采用相等样本量,请问如何估计病例

组和对照组的样本量?假设检验类研究问题1.确定研究设计类型2.确定结局指标3.确定检验水平和检验效能4.确定差值5.确定总体标准差或总体率6.确定单双侧检验7.

计算8.校正样本量研究问题—

比值比(OR)是(吸烟)

aba+b否(吸烟)

c

dc+d合计a+cb+dN取值(0,+

)•

OR值(oddsratio,OR),又称比值比、优势比•

主要指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值

比值比是否暴露于某因素对照组(非肺癌)病例组(肺癌)合计1.研究设计类型拟采用病例对照研究探讨吸烟与肺癌的关系。选择肺癌患者为病例组,非

肺癌患者为对照组。预期吸烟者发生肺癌的比值比(OR)为2.0,对照组人群的吸烟率约为20%,设α=0.05(双侧),β=0.10。病例组和对照组采用相等样本量,请问如何估计病例

组和对照组的样本量?假设检验类研究问题1.确定研究设计类型2.确定结局指标3.确定检验水平和检验效能4.确定差值5.确定总体标准差或总体率6.确定单双侧检验7.

计算8.校正样本量研究问题—

比值比(OR)

2.结局指标

4.差值6.双侧检验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论