医学研究中样本量的估计_第1页
医学研究中样本量的估计_第2页
医学研究中样本量的估计_第3页
医学研究中样本量的估计_第4页
医学研究中样本量的估计_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学研究中样本量的估计一、确定样本含量的意义正确地确定样本含量是医学研究设计的一个重要内容。在估计样本含量时应客服两种倾向:一是片面追求大样本,认为样本含量越多越好,其结果导致人力、物力、财力和时间的浪费;二是忽视样本含量的估计,使得样本量偏少,检验效能偏低,得出非真实的阴性结果。样本含量太大:一是浪费;二是难以做好质量控制;样本含量太小:容易犯第二类错误。一、确定样本含量的意义

样本含量估计是指为确保研究结论在一定检验效能基础上的最少观察单位数。医学研究没有绝对的样本量标准。样本含量的大小应根据研究目的、研究设计的类型、研究资料的性质、接受的处理因素、研究对象的种类、研究阶段等因素而决定。

二、确定样本含量应具备的条件1.第一类错误的概率(检验水准α)。α:常取0.052.检验效能(把握度1-β)>0.75。检验效能即在特定的α水准下若总体间确实存在着差异,此时该次实验能发现此差异的概率。1-β常取0.80、0.85、0.90。3.所比较的两个总体参数的差值δ:可根据专业上有意义的差值代替4.总体标准差σ:由样本标准差代替、查阅文献…二、样本含量的估计(1)估计总体均数时样本量估计(2)估计总体率时样本量估计(3)样本均数与总体均数比较的样本量估计(4)完全随机设计两样本含量相等时均数比较的样本量估计(5)完全随机设计两样本含量不等时均数比较的样本量估计(6)配对设计两样本均数比较的样本量估计(7)完全随机设计多样本均数比较的样本量估计(8)完全随机设计两样本率比较的样本量估计(9)完全随机设计多个样本率比较的样本量估计(10)直线相关分析时样本含量估计(11)两样本相关系数比较的样本量估计(11)不配对病例-对照研究设计样本量估计(13)病例-对照研究设计时样本量(配对对照研究的样本含量)(14)队列研究设计四格表资料统计分析时样本量(已知RR)(15)队列研究设计四格表资料统计分析时样本量(已知p1、p2)(16)两样本生存率比较的样本量估计(1)估计总体均数时样本量估计例题1:已知某地成年男子心率的标准差为20.9次/分,现在某研究想进一步了解该地区成年男子心率的总体平均水平,若规定误差δ不超过5次/分,取α=0.05,试估计需要调查多少人?

其中,n,δ,σ,s分别为样本含量、允许误差、总体标准差和样本标准差。COMPUTEn=(1.96*8.9/5)**2.EXECUTE.n=68(1)估计总体均数时样本量估计(2)估计总体率时样本量估计

例题2:某研究欲调查乳腺小叶增生的发病率。已知一般中青年女性乳腺小叶增生的发生率约占70%。要求正式调查时所得样本率与已知发生率相差不超过5%的可能性不大于0.05,如果采用简单随机抽样,需要多少调查对象?其中:n,δ,π

0分别为样本量、允许误差、已知的总体率。COMPUTEn=0.70*(1-0.70)*((1.645+1.282)/(0.05))**2.EXECUTE.n=720(2)估计总体率时样本量估计(3)样本均数与总体均数比较的样本量估计

例题3:某药厂评价某种治疗原发性高血压的疗效,要求用药后舒张压下降1.5kPa(1kPa=7.5mmHg)才算该药有实际疗效。根据以前试验表明舒张压下降量的标准差为3kPa。规定α=0.05,检验效能1-β=0,8,试估计需要多少病人进行临床试验?COMPUTEn=((1.96+1.282)*3/1.5)**2.EXECUTE.n=43(3)样本均数与总体均数比较的样本量估计(4)完全随机设计两样本含量相等时均数比较的样本量估计

其中:δ为两均数之差,σ为总体标准差。结果:每组需要64例病人进行临床试验。例题4:某药厂对新研发的降压中成药与标准降压药的疗效比较。已知标准降压药能使血压平均水平下降2kPa,期望降压中成药能平均下降4kPa,降压值的标准差为4kPa。α=0.05,检验效能1-β=0.8时,需要多少病人进行临床试验?COMPUTEn=2*((1.96+1.282)*4/(4-2))**2.EXECUTE.n=85(4)完全随机设计两样本含量相等时均数比较的样本量估计(5)完全随机设计两样本含量不等时均数比较的样本量估计

两样本含量之比为n1:n2=1:k

其中:δ为两均数之差,σ为总体标准差。若以1:4的样本量作调查。

例题5:某研究者分析多毛症患者与正常人血清睾丸酮含量(ng%)的不同。根据其他研究者的血清睾丸酮含量的标准差为13.33。H0:μ1-μ2=δ0=0;H1:μ1-μ2=δ1=10。α=0.05,检验效能1-β=0.9时,由于多毛症患者较少,预计以1:4的比例调查患者与健康人,问需要调查患者与健康人各多少?COMPUTEn=(4+1)/4*((1.96+1.645)*13.33/(10))**2.EXECUTE.n1=29n2=29*4=116(5)完全随机设计两样本含量不等时均数比较的样本量估计

两样本含量之比为n1:n2=1:k(6)配对设计两样本均数比较的样本量估计例题6:用某药治疗硅沉着病患者后,尿矽排除量平均增加15mg/L,其标准差为25mg/L。假定该药确能使尿矽排除量增加,定α=0.05(单侧),β=0.10,问需观察多少患者才能得出服药前后尿矽排除量之间的差别有统计学意义的结论?COMPUTEn=((1.96+1.645)*25/15)**2.EXECUTE.n=37(6)配对设计两样本均数比较的样本量估计(7)完全随机设计多样本均数比较的样本量估计

例题7:某中医院应用中西医结合治疗肺气虚、脾气虚、肾气虚慢性阻塞性肺疾病(COPD)患者,并与单纯西药为对照组,观察中西医结合治疗COPD患者不同中医证型的肺功能改善效果,根据查阅相关资料,肺气虚的FVC(L)为2.44±0.32;脾气虚为2.40±0.36;肾气虚为2.31±0.29;对照组为2.51±0.32。问该项临床研究估计需要观察多少病例数?式中:n为各组样本所需的例数,σi为各组的总体标准差,μi为各组总体均数,μ=Σμi/k,k为所比较的样本组数,ψ值是由α、β、νi=k-1、ν2=∞查ψ值表。(7)完全随机设计多样本均数比较的样本量估计COMPUTEn=2.17**2*((0.32**2+0.36**2+0.29**2+0.32**2)/4)/(((2.44-2.415)**2+(2.40-2.415)**2+(2.31-2.415)**2+(2.51-2.415)**2)/3).EXECUTE.(7)完全随机设计多样本均数比较的样本量估计(8)完全随机设计两样本率比较的样本含量估计(当两样本量相等时)例题8:拟研究新研制的抗菌药物对某感染性疾病的治疗效果。经预试验,试验药有效率为80%,对照药有效率为60%。问正式临床试验每组需要观察多少病例(假设采用双侧检验)?P1和p2分别为两样本率的估计值,p为两样本合并率。每组需要观察109例患者。COMPUTEn=((1.96*SQRT(2*(0.8+0.6)/2*(1-(0.8+0.6)/2)))+(1.282*SQRT(0.8*(1-0.8)+0.6*(1-0.6))))**2/(0.8-0.6)**2.EXECUTE.n=108.27(8)完全随机设计两样本率比较的样本含量估计(当两样本量相等时)(8)完全随机设计两样本率比较的样本量估计(当两样本量不等时)例题9:拟研究新研制的抗菌药物对某感染性疾病的治疗效果。经预试验,试验药有效率为80%,对照药有效率为60%。问正式临床试验每组需要观察多少病例(假设采用双侧检验)?P1和p2分别为两样本率的估计值,,(9)完全随机设计多个样本率比较的样本量估计

例题9:某医院观察三种中药复方甲、乙和丙治疗某病的效果,初步观察结果甲复方有效率85.5%,乙复方80.5%,丙复方75.5%,问正式试验需要观察多少例患者?(9)完全随机设计多个样本率比较的样本量估计COMPUTEn=12.65/(2*((ARSIN(SQRT(0.855)))-(ARSIN(SQRT(0.755))))**2).EXECUTE.n=392(10)直线相关分析时样本量估计

例题9:估计总体相关系数ρ=0.85,α=0.05(双侧),β=0.10,问需要多大样本例数?COMPUTEn=4*((1.96+1.282)/(LN((1+0.85)/(1-0.85))))**2+3.EXECUTE.n=9.66(10)直线相关分析时样本量估计(11)两样本相关系数比较的样本量估计

例题9:设ρ1=0.90,ρ1=0.80,α=0.05(单侧),β=0.10,问需要多大样本例数?COMPUTEn=8*((1.645+1.282)/(LN(((1+0.90)*(1-0.80))/((1-0.90)*(1+0.80)))))**2+3.EXECUTE.(11)两样本相关系数比较的样本量估计(12)不配对病例-对照研究设计

(病例数与对照数相等时的样本含量)例题10:一次吸烟与肺癌关系的研究,得知一般人群中,即对照人群(p0)中有吸烟史的人所占的比例为20%,比值比(OR)为2,设α=0.05(双侧),β=0.1,求样本量。P0表示对照组中暴露着的比例,p1表示病例组中暴露者的比例。每组需要230人。设病例组病例数与对照组例数之比为1:c,则病例组的样本量计算公式为:(12)不配对病例-对照研究设计(病例数与对照数不相等时的样本含量)调查结果有4种情况,即++,--,+-,-+。其中++和--称为一致结果,+-和-+称为不一致结果。配对调查的有点是均衡某些干扰因素的影响,同时可以减少样本量。其杨很两(对子数N)的计算公式:(13)病例-对照研究设计时样本含量

(配对对照研究的样本含量)式中,p1为估计的病例中暴露者的比例;p0为估计的对照组中暴露者的比例;n为不一致的对字数。例题11:如研究口服避孕药与先天性心脏病的关系,采用配对设计,设α=0.05(双侧),β=0.1,病例组暴露比例为p0=0.5,对照组暴露比例为p0=0.3,估计的OR为2。需要多少样本量。(13)病例-对照研究设计时样本含量

(配对对照研究的样本含量)COMPUTEN=((1.96/2+1.645*SQRT((2/(1+2))*(1-2/(1-2))))**2/(2/(1+2)-1/2)**2)/(0.3*0.5+0.5*0.7).EXECUTE.N=788(15)队列研究设计四格表资料统计分析时样本含量(已知p1、p2)

例题13:某研究者拟采用队列研究的方法评价某药物预防脑卒中复发的效果,根据流行病学调查得不用药者脑卒中的复发率为23%,用药者复发的概率为10%,设α=0.05,β=0.1的条件下,问需要多少样本量?p0、p1分别表示对照组与暴露组的发病率。(16)两样本生存率比较的样本量估计例题14:已知乳腺癌常规手术的5年生存概率为60%,现拟改进手术,要求新手术的生存概率达到75%以上,设α=0.05(单侧),β=0.2的条件下,问需要多少样本量?COMPUTEn=(((-1.645-1.282)*(LN(0.60)+LN(0.75)))/(LN(0.60)-LN(0.75)))**2.EXECUTE.n=109.71(16)两样本生存率比较的样本量估计(17)其他情况样本量估计多因素分析时,多元线性回归分析样本含量至少变量数的10倍;logisitic回归样本含量至少为变量数的20倍;Cox回归截尾例数小于20%,样本含量至少变量数的10倍。计数资料行

列表资料

2检验,一般不宜有1/5以上格子理论频数小于5,或有一个格子的理论频数小于1。(14)队列研究设计四格表资料统计分析时样本含量(已知RR)例题12:某研究者拟采用队列研究的方法评价某药物预防脑卒中复发的效果,根据流行病学调查得不用药者脑卒中的复发率为23%,估计RR值为0.5,设α=0.05,β=0.1,问需要多少样本量?p0、p1分别表示对照组与暴露组的发病率。组别例数脾肺气虚脾肾阳虚心脾两虚肺肾阴虚心肾阳虚肝肾阴虚芪众颗粒组(A)504331111玉屏风颗粒组(B)493255331空白对照组(C)5032101331(0.98)合计149107187773%62.4217.456.716.045.372.01表1

三组证型之间比较(17)其他情况样本量估计临床非劣及等效性试验样本含量估计的简算法临床试验中作两药等效判别时,不能依据“显著性检验P>0.05”,而应采用“非劣或等效性试验(noninferiorityorequivalencetrials)

的P<0.05”。实施时,应确定α、β;选择单侧或双侧;规定等效标准(δ);估算等效或非劣性试验所需要的例数等。对于计数资料(率),其例数估算公式为:非劣性试验:

n

=2×(uα+uβ)2×p(1-p)/δ2等效性试验:

n

=2×(uα+uβ/2)2×p(1-p)/δ2

其中δ是等效标准(界值),uα、uβ为单侧标准正态离差界值,n为样本含量,P是平均有效率。注意:等效性试验实际是高方向及低方向的两个单侧检验,因此在估算例数时,应采用uβ/2,而不是用uα/2。

临床非劣及等效性试验样本含量估计的简算法临床非劣及等效性试验样本含量估计的简算法uα、uβ、uβ/2等值,使用不够方便。其实在临床试验中通常用α=0.05,β=0.2(把握度=80%),非劣性试验为单侧检验,等效性试验为两个单侧检验。对于计数资料(率),其例数估算公式为(α=0.05,β=0.2):非劣性试验:n=12.365×p(1-p)/δ2等效性试验:

n=17.127×p(1-p)/δ2

临床非劣及等效性试验样本含量估计的简算法对于计量资料(均数),其例数估算公式为:非劣性试验:n

=

2×(uα+uβ)2×(s/δ)2

等效性试验:n

=

2×(uα+uβ/2)2×(s/δ)2

其中δ是等效标准(界值),uα、uβ为单侧标准正态离差界值,n为样本含量,s是估计的共同标准差。注意:等效性试验实际是高方向及低方向的两个单侧检验,因此在估算例数时,应采用uβ/2,而不是用uα/2。对于计量资料(均数),其例数估算公式为α=0.05,β=0.2:非劣性试验:n

=12.365×(s/δ)2

等效性试验:n

=17.127×(s/δ)2

其中δ是等效标准(界值),s是估计的共同标准差。如β=0.1时,上式算得的非劣性试验例数再乘以1.385,而等效性试验所得例数再乘以1.264即可。临床非劣及等效性试验样本含量估计的简算法两组疗效比较的类型优效(Superiority):>或“试验组(E)优于对照组(C)”等效(Equivalence):

=或“试验组(E)与对照组(C)相当”非劣效(Non-inferiority):

或“试验组(E)与对照组

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论