样本量计算(DOC)_第1页
样本量计算(DOC)_第2页
样本量计算(DOC)_第3页
样本量计算(DOC)_第4页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1. 估计样本量的决定因素1.1资料性质计量资料如果设计均衡 , 误差控制得好 , 样本可以小于 30 例 ; 计数资料即使误差控制严格 , 设计均衡 , 样本需要大一些 , 需要 30-100 例。1.2研究事件的发生率研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。1.3研究因素的有效率有效率越高, 即实验组和对照组比较数值差异越大,样本量就可以越小, 小样本就可以达到统计学的显著性,反之就要越大。1.4显著性水平即假设检验第一类( )错误出现的概率。为假阳性错误出现的概率。 越小,所需的样本量越大,反之就要越小。 水平由研究者具情决定,通常 取

2、0.05或 0.01 。1.5检验效能检验效能又称把握度,为 1,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。 即在特定的 水准下, 若总体参数之间确实存在着差别, 此时该次实验能发现此差别的概率。 检验效能即避免假阴性的能力, 越小, 检验效能越高,所需的样本量越大,反之就要越小。水平由研究者具情决定,通常取 为 0.2 , 0.1 或 0.05 。即 1=0.8 ,0.1或 0.95 ,也就是说把握度为 80%,90%或 95%。1.6 容许的误差( )如果调查均数时,则先确定样本的均数 ( ) 和总体均数 (m) 之间最大的误差为多少。容许误差越小,需要样本量越大。一般取总体

3、均数( 1 )可信限的一半。1.7总体标准差 (s)一般因未知而用样本标准差s 代替。1.8双侧检验与单侧检验采用统计学检验时 , 当研究结果高于和低于效应指标的界限均有意义时, 应该选择双侧检验 , 所需样本量就大 ;当研究结果仅高于或低于效应指标的界限有意义1 / 7时 , 应该选择单侧检验 , 所需样本量就小。 当进行双侧检验或单侧检验时, 其或 的 Ua 界值通过查标准正态分布的分位数表即可得到。2. 样本量的估算由于对变量或资料采用的检验方法不同,具体设计方案的样本量计算方法各异,只有通过查阅资料, 借鉴他人的经验或进行预实验确定估计样本量决定因素的参数,便可进行估算。护理中的量性研

4、究可以分为 3 种类 型:描述性研究:如横断面调查,目的是描述疾病的分布情 况或现况调查;分析性研究:其目的是分析比较发病的相关因素或影响因素; 实验性研究: 即队列研究或干预实验。 研究的类型不同,则样本量也有所不同。2.1 描述性研究护理研究中的描述性研究多为横断面研究, 横断面研究的抽样方法主要包括单纯随机抽样、系统抽样、分层抽样和整群抽样。 分层抽样的样本量大小取决于作者选用的对象是用均数还是率进行抽样调查。例. 要做一项有关北京城区护士参与继续教育的学习动机和学习障碍的现状调查,采用分层多级抽样,选用的是均数抽样的公式,U为检验水准 对应的 值, 为总体标准差, 为容许误差,根据预实

5、验得出标准差 =1.09 ,取=0.05 ,=0.1 ,样本量算得 520 例,考虑到 10%-15%的失访率和抽样误差,样本扩展到690 例。2.2 分析性研究探索有关变量的影响因素研究有关变量影响因素研究的样本量大多是根据统计学变量分析的要求,样本数至少是变量数的 5-10 倍。 例如,如果研究肺结核患者生存质量及影响因素,首先要考虑影响因素有几个,然后通过文献回顾,可知约有12 个预测影响变量,如年 龄、性别、婚姻、文化程度、家庭月收入、医疗付费方式、病程、排菌、喀血、结核中毒症状、心理健康、社会支持,那么研究的变量就可以在60-120 例。这是一种较为简便的估算样本量的方法,在获得相关

6、文献支持下, 最好根据公式计算,计量资料的样本量估算可用公式,根据预实验中的数据(也2 / 7可以依据其他文献的结果) 得出标准差 S 和容许误差 ,代入公式最终计算出样本量,计数资料资料可用公式, P 为样本率。研究某变量对另一变量的影响对于研究某变量对另一变量的影响来说,样本量可以根据直线相关的公式获得, 与 与分别为检验水准 和第类错误的概率 相对应的 U 值, 为总体相关系数。例 . 要做一项血透患者自我管理水 平对其健康状况影响的研究,假设 =0.05 ,power=0.80,查表得 =1.96 , =0.84 ,总体相关系数可选用文献报道中血液透析患者自我管理水平与健康调查简表得分

7、相关系数为0.274 ,代入公式就可算出所需样本量为 103 例。两变量或多变量的相关研究对于两变量或多变量相关的研究,样本量与自变量的多少有关, 一般是其 10 倍,也可以采用公式计算。 U 为检验水准 相对应的 U 值, S 为标准差, 为容许误差。例.研究慢性腰背痛患者认知- 情感应对、自我和谐与适应水平的关系 .设定显著性水平 = 0.05 ,则 U=1.96 ,标准差和容许误差可从预实验中获得,根据 预实验的 S 和值,算出 S/ =5,样本量则为 99 例.2.3实验性研究实验性研究样本量的估算公式,也分计量资料和计数资料两种。计量资料可采用两样本均数的计算公式N1=N2=,计数资

8、料可采用率的计算公式。式中 N1、 N2分别为两样本含量,一般要求相等, S 为两总体标准差的估计值,一般假设其相等或取合并方差的平方根, 为两均数之差值(若为自身对照, 也可以写为 d), t 2 和 t 2 分别为检验水准 和第类错误概率 相对应的 t 值。 有单双侧之分,而 只取单侧。3 / 7例.一项心肌梗死患者院外自助式心脏康复的效果研究,可以采用此公式计算,其中的d可以选取文献中报道的、自助式康复手册的随机对照研究中的干预组和对照组在普通健康问卷 GHQ 的得分:d=10.7-5.3=5.4 ,计算 Sc 为 8.78,双侧 =0.05, =0.1,查表得 t2=1.96, t =

9、1.282,代入公式得出两组各需样本为56 例。附临床研究样本量的估计:1. 计量资料1.1对总体平均数 m做估计调查的样本估计公式: 公式:n= ( U / )(式 )式中: n 为所需样本大小;Ua 为双侧检验中,a 时 U 的界值,当a=0.05时 ,U 0.05=1.96,a=0.01时,U 0.01=2.58;s 为总体标准差;为容许的误差。例 1:某学校有学生 3500 人,用单纯随机抽样调查学生的白细胞水平,根据预查标准差为950 个/ mm ,允许误差不超过100 个 /mm ,应调查多少人 ?N=3500 d=100个 /mm s=950 个/mma=0.05 (双侧) Ua

10、=1.96n=(1.96 ×950/100)3471.2 对样本均数与总体均数的差别做显著性检验时, 所需样本的估计。单侧检验用: 单侧检验用:n= ( U 2 + U 2 ) s/ (式 1.2-1 )双侧检验用: n= ( U + U 2 ) s/(式 1.2-2 )式中: 与分别为第一类错误及第二类错误出现的概率,U 、U 2 、 U 2 分别为 、2、 2 检验水准的 t 值 。2 计数资料2.1对总体率 做估计调查的样本大小公式: n= ( U / )/P ( 1 P)(式 2.1 )式中: 为容许的误差:即允许样本率(p) 和总体率 (P) 的最大容许误差为多少。P 为样

11、本率。4 / 7例 2:对某地 HBsAg阳性率进行调查,希望所得的样本率 (p) 和总体率 (P) 之差不超过 2%,基于小规模预调查样本率 P=14%,应调查多少人 ? ( 规定 a=0.05)已知: =0.02, P=0.14 ,a=0.05 , Ua=1.96n=(1.96/0.02)2/× 0.14(1 0.14) =1156需调查约 1160 人.2.2对样本率与总体率的差别做显著性检验时, 所需样本的估计。单侧检验用: n= ( U22 + U 2 / )(式 2.2-1 )双侧检验用: n= ( U + U2 / )(式 2.2-2 )式中: 与分别为第一类错误及第二

12、类错误出现的概率,U 、U 2 、 U 2 分别为 、2、 2 检验水准的 t 值。2.3 对样本均数与总体均数的差别做显著性检验时, 所需样本的估计。单侧检验用: n= ( U 2 + U 2 ) s/ (P1 P ) 式 2.3-1 )双侧检验用: n= ( U + U 2 ) s/ (P1 P )(2.3-2 )式中: 与分别为第一类错误及第二类错误出现的概率,U 、U 2 、 U 2 分别为 、2、 2 检验水准的 U值。3 病例对照研究的样本量估计选择患有特定疾病的人群作为病例组, 和未患这种疾病的人群作为对照组, 调查两组人群过去暴露于某种 (些)可能危险因素的比例, 判断暴露危险

13、因素是否与疾病有关联及其关联程度大小的一种观察性研究。3.1 设置估算样本量的相关值人群中研究因素的暴露率 ( 对照组在目标人群中估计的暴露率 ) ;比值比 (odds ratio ,OR) 估计出的各研究因素的相对危险度或暴露的比值比(即 RR或 OR)值,检验的显著性水平,通常取 =0.01 或 0.05 ;期望的把握度( 1- ) , 通常区 =0.10 或 0.20 ;即把握度为 90%或 80%。根据以上有关参数查表或代公式计算公式为:5 / 7n= ( U +U) /(p 1 -p 0)2(式 3.1 )p 1 =p 0 × OR/1-p0 +OR×P0=1/2

14、 ( p 1+p 0 ) =1-q1 =1-p 1 q 0 =1-p 0p0 与 P1分别为对照组及病例组人群估计的暴露率;OR为主要暴露因子的相对危险度或暴露的比值比(RR或 OR)。q0=1-P0, q1=1-P1;为两组暴露史比例的平均值,既 =(P1+P2)/2, Q1=1-P1;例:拟用病例对照研究法调查孕妇暴露于某因子与婴儿先天性心脏病的关系。 估计孕妇有 30%暴露于此因子。现要求在暴露造成相对危险度为 2 时,即能在 95% 的显著性水平以 90%的把握度查出,病例组和对照组各需多少例?p0=0.3 OR=2,设 =0.05,=0.10,用双侧检验 U=1.96 U =1.28

15、2p1=(0.3 × 2)/1+0.3(2-1)=0.46q0=1-0.3=0.7 =1/2(0.3+0.46)=0.38q1=1-0.46=0.54 =1-0.38=0.62n=(1.96 +1.282 )2/(0.46-0.3)2192 ,即病例组与对照组各需192 人.4 实验研究的样本量计算4.1计量资料 :计量资料指身高、体重、血压、血脂和胆固醇等数值变量。估计公式为:(式 4.1 )n 为计算所得一个组的样本人数,如果两组的人数相等,则全部试验所需的样本大小为 2n;U U 为显著性水平相应的标准正态差;为 相应的标准正态差; 为估计的标准差, 2=( 12+ 22)/2

16、 ;d 为两组数值变量均值之差,例题:某新药治疗高血压, 将研究对象随机分为治疗组和对照组。假设:a=0.05, =0.10, 血压的标准差分别为 9.7 与 12.3mmHg,检测两组的血压差为 2.6mmHg。查表: z=1.96,z=1.282( 双侧检验 ), 需要多大样本。4.2 计数资料 : 即非连续变量资料,如发病率、感染率、阳性率、死亡率、病死率、治愈率、有效率等。当现场试验的评价指标是非连续变量时,按下式计算样本大小:n=U +U /(P -P )(式 4.2 )P :对照组发生率 P :实验组发生率5 诊断试验的样本量估计6 / 75.1设置估算样本量的相关值灵敏度 60%;特异度 60%;值,检验的显著性水平,通常取 =0.01 或 0.05 ;期望的把握度( 1- ) , 通常区 =0.10 或 0.20 ;即把握度为 90%或 80%。5.2计算公式公式:n= ( U / )/P ( 1 P ) (式 5.2 )式中:U 为显著性水平相应的 U值 , 通常取 =0.01 或 0.05 ; 为容许的误差:即允许样本率(p) 和总体率 (P) 的最大容许误差为多少。P 为诊断试验的灵敏度或特异度;例:预计所评价的诊断试验的灵敏度为 90%,特异度 85%; =0.025 ,规定

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论