![临床医学研究对象样本量的估计_第1页](http://file4.renrendoc.com/view/089c7b1b56a15a61988175ed796592b2/089c7b1b56a15a61988175ed796592b21.gif)
![临床医学研究对象样本量的估计_第2页](http://file4.renrendoc.com/view/089c7b1b56a15a61988175ed796592b2/089c7b1b56a15a61988175ed796592b22.gif)
![临床医学研究对象样本量的估计_第3页](http://file4.renrendoc.com/view/089c7b1b56a15a61988175ed796592b2/089c7b1b56a15a61988175ed796592b23.gif)
![临床医学研究对象样本量的估计_第4页](http://file4.renrendoc.com/view/089c7b1b56a15a61988175ed796592b2/089c7b1b56a15a61988175ed796592b24.gif)
![临床医学研究对象样本量的估计_第5页](http://file4.renrendoc.com/view/089c7b1b56a15a61988175ed796592b2/089c7b1b56a15a61988175ed796592b25.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
临床医学研究对象样本量的估计宁夏医学杂志副主编蒋兴国临床医学研究没有绝对的样本量标准,不同的研究方法、研究目的,研究要求和研究资料决定了样本量。一般而言,样本越小,结果的估计越精确。但样本过大或过小均可影响研究的可行性。因此,科学地确定样本量可增加研究的可靠性,得到可信的研究结果。1.估计样本量的决定因素[1]1.1资料性质计量资料如果设计均衡,误差控制得好,样本可以小于30例;计数资料即使误差控制严格,设计均衡,样本需要大一些,需要30-100例。1.2研究事件的发生率研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。1.3研究因素的有效率有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显著性,反之就要越大。1.4显著性水平即假设检验第一类(a)错误出现的概率。为假阳性错误出现的概率。a越小,所需的样本量越大,反之就要越小。a水平由研究者具情决定,通常a取0.05或0.01。1.5检验效能检验效能又称把握度,为1—卩,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。即在特定的a水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力,卩越小,检验效能越高,所需的样本量越大,反之就要越小。卩水平由研究者具情决定,通常取卩为0.2,0.1或0.05。即1—卩=0.8,0.1或0.95,也就是说把握度为80%,90%或95%。1.6容许的误差(6)如果调查均数时,则先确定样本的均数()和总体均数(m)之间最大的误差为多少。容许误差越小,需要样本量越大。一般取总体均数(1—a)可信限的一半。1.7总体标准差(s)一般因未知而用样本标准差s代替。1.8双侧检验与单侧检验采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大;当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。当进行双侧检验或单侧检验时,其a或卩的Ua界值通过查标准正态分布的分位数表即可得到。表1标准正态分布的分位数表2.样本量的估算方法由于对变量或资料采用的检验方法不同,具体设计方案的样本量计算方法各异,只有通过查阅资料,借鉴他人的经验或进行预实验确定估计样本量决定因素的参数,便可进行估算。2.1现况研究现况研究包括普查和抽样调查两类。抽样调查是从总体中随机抽取一定数量的观察单位组成样本,然后用样本信息来推断总体特征,在设计中要考虑样本含量问题。首先确定样本量的估算的参数容许的误差(6):如果调查均数时,则先确定样本的均数()和总体均数(m)之间最大的误差为多少;在率的调查中,确定样本的率(p)和总体率(P)的最大容许误差为多少。显著性水平(容许误差的概率a):—般取0.05或0.01。总体标准差(s):根据以往的资料或小规模预调查的结果进行估计。2.1.2计量资料2.1.2.1对总体平均数m做估计调查的样本估计公式:n=(Uao/6)(式2.1.2.1)式中:n为所需样本大小;Ua为双侧检验中,a时U的界值,当a=0.05时,U0.05=1.96,a=0.01时,U0.01=2.58;s为总体标准差;6为容许的误差。例1:某学校有学生3500人,用单纯随机抽样调查学生的白细胞水平,根据预查标准差为950个/mm,允许误差不超过100个/mm,应调查多少人?N=3500d=100个/mms=950个/mma=0.05(双侧)Ua=1.96n=(1.96x950/100)-3472.1.2.2对样本均数与总体均数的差别做显著性检验时,所需样本的估计。单侧检验用:n=[(U2a+U2p)s/5](式2.1.2.2-1)双侧检验用:n=[(Ua+U2p)s/5](式2.1.2.2-2)式中:a与卩分别为第一类错误及第二类错误出现的概率,UA、U2a>U2p分别为a、2a、2卩检验水准的t值。2.1.3计数资料2.1.3.1对总体率n做估计调查的样本大小公式:n=(Ua/5)/P(1-P)(式2.1.3.1)式中:5为容许的误差:即允许样本率(p)和总体率(P)的最大容许误差为多少。P为样本率。例2:对某地HBsAg阳性率进行调查,希望所得的样本率(p)和总体率(P)之差不超过2%,基于小规模预调查样本率P=14%,应调查多少人?(规定a=0.05)已知:5=0.02,P=0.14,a=0.05,Ua=1.96n=(1.96/0.02)2/x0.14(1—0.14)=1156需调查约1160人.2.1.3.2对样本率与总体率的差别做显著性检验时,所需样本的估计。单侧检验用:n=(u2a+U2p/52)(式2.1.3.2-1)双侧检验用:n=(Ua+U2p/5)(式2.1.3.2-2)式中:a与卩分别为第一类错误及第二类错误出现的概率,Ua、U2a>U2p分别为a、2a、2卩检验水准的t值。2.1.3.3对样本均数与总体均数的差别做显著性检验时,所需样本的估计。单侧检验用:n=[(U2a+U2p)s/5]P(1-P)式2.1.3.3-1)双侧检验用:n=[(Ua+U2p)s/5]P(1-P)(2.1.3.3-2)式中:Ua、U2a、U2|3分别为a、2a、2卩检验水准的U值。2.2病例对照研究的样本量估计选择患有特定疾病的人群作为病例组,和未患这种疾病的人群作为对照组,调查两组人群过去暴露于某种(些)可能危险因素的比例,判断暴露危险因素是否与疾病有关联及其关联程度大小的一种观察性研究。2.2.1设置估算样本量的相关值人群中研究因素的暴露率(对照组在目标人群中估计的暴露率);比值比(oddsratio,OR)估计出的各研究因素的相对危险度或暴露的比值比(即RR或OR)a值,检验的显著性水平,通常取a=0.01或0.05;期望的把握度(1-卩),通常区卩=0.10或0.20;即把握度为90%或80%。根据以上有关参数查表或代公式计算公式为:n=(U+U)/(p1-p0)2(式2.2.2)p]=p0xOR/l-po+ORxPo=1/2(p1+p0)=1-q1=1-p1q0=1-p0式中:UU分别为a与卩检验水准的U值。p0与P1分别为对照组及病例组人群估计的暴露率;OR为主要暴露因子的相对危险度或暴露的比值比(RR或OR)。q0=1-P0,q1=1-P1;为两组暴露史比例的平均值,既=(P1+P2)/2,Q1=1-P1;例:拟用病例对照研究法调查孕妇暴露于某因子与婴儿先天性心脏病的关系。估计孕妇有30%暴露于此因子。现要求在暴露造成相对危险度为2时,即能在95%的显著性水平以90%的把握度查出,病例组和对照组各需多少例?p0=0.3OR=2,设a=0.05,卩=0.10,用双侧检验Ua=1.96Up=1.282P]=(0.3x2)/[1+0.3(2-1)]=0.46q0=1-0.3=0.7=1/2(0.3+0.46)=0.38q1=1-0.46=0.54=1-0.38=0.62n=(1.96+1.282)2/(0.46-0.3)2-192,即病例组与对照组各需192人.2.3实验研究的样本量计算计量资料:计量资料指身高、体重、血压、血脂和胆固醇等数值变量。估计公式为:n=2(Ua+Up)2§2/d2(2-3-1)n为计算所得一个组的样本人数,如果两组的人数相等,则全部试验所需的样本大小为2n;Ua为显著性水平相应的标准正态差;Up为卩相应的标准正态差;5为估计的标准差,52=(§12+522)/2;d为两组数值变量均值之差,例题:某新药治疗高血压,将研究对象随机分为治疗组和对照组。假设:a=0.05,卩=0.10,血压的标准差分别为9.7与12.3mmHg,检测两组的血压差为2.6mmHg。查表:za=1.96,zp=1.282(双侧检验),需要多大样本。计数资料:即非连续变量资料,如发病率、感染率、阳性率、死亡率、病死率、治愈率、有效率等。当现场试验的评价指标是非连续变量时,按下式计算样本大小:n=[U+U]/(P-P)(2.3.2)P:对照组发生率P:实验组发生率:(P+P)/2U、U和n所示意义同上。例:假设对照组发病率例:假设对照组发病率40%,通过干预措施发病率下降到30%。a水平为5%,1-卩为90%,本研究为双侧检验,问二组要观察多少人?=(0.4+0.3)/2=0.35代入公式(16-8):n=[1.96+1.282]/(0.4-0.3)-476即各组需476人。2.4诊断试验的样本量估计设置估算样本量的相关值①灵敏度60%;②特异度60%;a值,检验的显著性水平,通常取a=0.01或0.05;期望的把握度(1-卩),通常区卩=0.10或0.20;即把握度为90%或80%。计算公式公式:n=(Ua/6)/P(1-P)(式2.4.2)式中:Ua为显著性水平相应的U值,通常取a=0.01或0.05;5为容许的误差:即允许样本率(p)和总体率(P)的最大容许误差为多少。P为诊断试验的灵敏度或特异度;例:预计所评价的诊断试验的灵敏度为90%,特异度85%;5=0.025,规定a=0.05,病例组和对照组应调查多少人?()已知:5=0.02,a=0.05,Ua=1.96n=(1.96/O.O25)2/xO.85(l-0.85)=783n=(1.96/0.025)2/x0.90(l-0.90)=553对照组需783人,病例组需553人。参考文献天小胖给大家简单介绍一下最常见的power-basedsamplesizecalculation,不外乎两种最常见的情况,一是连续性变量的比较和分类变量的比较。1.连续性变量:假如你想比较治疗组与对照组某个变量的均值,那么每组需要的样本量是:N=f(a,卩)*2*S2/52f(a,卩):根据a和卩计算所得,最常用的为:当a=0.05,卩=0.2时,f(a,卩)=7.9当a=0.05,卩=0.1时,f(a,卩)=10.58为你认为的有意义的两组最小能检测出的差异值,通常根据文献以及临床实践来确定S为标准差,需要根据以前的研究来确定血压的例子:假设标准差为20mmHg,有90%的把握度在0.05显著水平上能检验出治疗组和对照组10mmHg的差异,则需要的样本量为每组:N=f(a,卩)*2*S2/82=10.5*2*202/102=84以下是关于这类样本量计算的描述,供大家写方案时参考:英文:Thetotaltargetsamplesizewillbe...subjects(….subjectspertreatment).Withthissamplesize,adifferenceof….between(activearm)and(controlarm)in(primaryendpoint)canbedetectedwith(X)%powerassumingastandarddeviationof.andsignificancelevelof..中文:假设标准差为XX,则需XX例受试者(每组xx)有90%的把握度在XX显著水平上检验出治疗组和对照组XX的差异。当然在最后的样本量确定时,还要考虑一定的失访率。。。总结一下,在这个两均数比较的样本量的计算中,你需要知道的什么?标准差和差异!Remember!一、参数估计的意义一组调查或实验数据,如果是计量资料可求得平均数,标准差等统计指标,如果是计数资料则求
百分率藉以概括说明这群观察数据的特征,故称特征值。由于样本特征值是通过统计求得的,所以又
称为统计量以区别于总体特征值。总体特征值一般称为参数(总体量)。我们进行科研所要探索的是总体特征值即总体参数,而我
们得到的却是样本统计量,用样本统计量估计或推论总体参数的过程叫参数估计。本章第一节例6.1通过检查110个健康成人的尿紫质算得阳性率为10%,这是样本率,可用它来
估计总体率,说明健康成人的尿紫质阳性率水平,这样的估计叫“点估计”。但由于存在抽样误差,不
同样本(如再检查110人)可能得到不同的估计值。因此我们常用“区间估计”总体率(或总体均数)大概
在那一个范围内,这个范围就叫可信区间。区间小的一端叫下限,大的一端叫上限。常用的有95%可
信区间与99%可信区间。根据同一资料所作95%可信区间比99%可信区间窄些(上、下限较靠近),
但估计错误的概率后者为1%,前者为5%,进行总体参数的区间估计时可根据研究目的与标准误的大
小选用95%、或99%。二、总体均数的估计为了说明常用的总体均数之区间估计法,我们不妨回顾一下上节所叙的t分布。由求t的基本公式我们看到X与卩的距离等于t(SX),又根据X集中分布在卩周围的特点,若取t的5%界即t0.05,(或1%界)乘以SX作为X与卩的距离范围,就可用式(6.6)或式(6.7)求出区间来估计总体均数卩所在医'学教'育网搜'集整理范围,估错的概率仅有5%或1%,因此称95%或99%可信区间。下面用实例说明其求法。95%可信区间X-t0.05,vSX<y99%可信区间X-t0.05,vSX<y例6.2上面抽样实验中第1号样本的均数为488.6,标准差为61.65,例数10,自由度v=10-l=9,试求95%与99%可信区间。1.求标准误95%可信区间488.6-2.262(19.50)<^<488.6+2.262(19.50),即有95%的把握估计卩是在444.49〜532.71区间内99%可信区间488.6-3.250(19.50)<卩<488.6+3.250(19.50),可有99%的把握估计卩是在425.22〜551.98区间内这里两个可信区间都包含卩=500在内,所以这次估计是估计对了。抽样实验共抽了100个样本,除1号样本外其余99个样本均数也对卩作了区间估计,这些95%可信区间列在表6.4中。我们看到,只有5个95%可信区间(右上角标有星号)不包含总体均数卩=500在内,它们是:样本号X95%可信区间6-546.7515.78〜577.62h524丄500.45〜548.5528476.1454.91〜497.2972465.3447.02〜483.5875526.6503.10〜550.10平时我们并不重复抽取许多样本来一次次估计总体均数而仅是一次,至于算出的均数会类似一百个样本均数中的那一个就很难说了。如果不遇到类似上列那些均数过大或过小的样本,求出可信区间后总体均数真是在该区间内,那么便是一次成功的估计:但是极少数情况下我们也会遇到极端的样本以至总体均数并不在我们提出的区间内。不过,我们具体所作的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 12古诗三首《示儿》说课稿-2024-2025学年五年级语文上册统编版001
- 2023六年级数学上册 四 人体的奥秘-比说课稿 青岛版六三制
- 会议总包合同范例
- 钢板桥面面层施工方案
- 供热公司用工合同范本
- 专业律师合同范例
- 债务合约合同范例
- 物业车辆清洁方案
- 公司聘用文秘合同范例
- 买矿协议合同范本
- 第八讲 发展全过程人民民主PPT习概论2023优化版教学课件
- 王崧舟:学习任务群与课堂教学变革 2022版新课程标准解读解析资料 57
- 招投标现场项目经理答辩(完整版)资料
- 运动竞赛学课件
- 重大事故隐患整改台账
- 2022年上海市初中毕业数学课程终结性评价指南
- 高考作文备考-议论文对比论证 课件14张
- 新华师大版七年级下册初中数学 7.4 实践与探索课时练(课后作业设计)
- 山东省莱阳市望岚口矿区页岩矿
- 《普通生物学教案》word版
- 安全生产应知应会培训课件
评论
0/150
提交评论