随机化及样本含量估计(1008周二晚柳伟伟)ppt课件_第1页
随机化及样本含量估计(1008周二晚柳伟伟)ppt课件_第2页
随机化及样本含量估计(1008周二晚柳伟伟)ppt课件_第3页
随机化及样本含量估计(1008周二晚柳伟伟)ppt课件_第4页
随机化及样本含量估计(1008周二晚柳伟伟)ppt课件_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、随机化及其SAS实现,医学统计学教研室 柳伟伟 讲师,实例辨析,在一项基础医学研究中,将15只大鼠分为三组,先对所有大鼠施加某种处理,建立疾病模型,然后采用三种不同的药物治疗 在治疗前、治疗后1周、治疗后2周、治疗后3周分别观测大鼠的三项指标,实例辨析,在对治疗前的数据进行分析时,发现三组之间有两项指标的差别有统计学意义 原因何在?怎样做才能尽量避免这种差别的出现,随机原则回顾,随机原则是指采用随机的方式来选取和分配样本,即研究总体中每个个体都具有同等的机会被抽中进入样本,而样本中每个受试对象都有同等的机会被分配到各个试验组中,随机分组方法,完全随机化 分层随机化 区组随机化 分层区组随机化

2、动态随机化,完全随机化,直接对受试对象进行随机化分组,常通过掷硬币或随机数字表,或用计算机产生随机数来进行随机化,在事先或者实施过程中不作任何限制和干预或调整 分组后各组受试对象的例数不一定相等,查表法的实施步骤,第一步,将受试对象编号,将编号按顺序写成一排 第二步,事先规定分组的规则。分组规则可以有多种方式,但必须事先确定下来,一旦确定不应随意改动,查表法的实施步骤,如分两组时,可规定遇到随机数字为偶数时将对应的受试对象分入实验组、遇到随机数字为奇数时将对应的受试对象分入对照组 再如分三组时,可事先规定,凡随机数字除以3余数为0者分入第一组、余数为1者分入第二组、余数为2者分入第三组,查表法

3、的实施步骤,第三步,从随机数字表中任意指定的位置开始向后(或向前)抄录随机数字,依次写在各编号之下,注意:舍弃不符合要求的随机数字 第四步,根据抄录的随机数字按事先确定的分组规则分组,利用查表法实现完全随机分组,某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名患者,采用完全随机设计方法将患者等分为四组进行双盲试验。问如何进行分组,利用查表法实现完全随机分组,先将120名高血脂患者从1开始到120编号,见第一行 从随机数字表中的任一行任一列开始,如第5行第7列开始,依次读取三位数作为一个随机数录于编号下,见第二行,利用查表法实现完全随机分组,然后将全部随机数由小到大编序号,将每

4、个随机数对应的序号记在第三行 规定序号130为甲组,3160为乙组,6190为丙组,91120为丁组,见第四行,利用SAS实现完全随机分组,现有100只小鼠,编号为1-100号,试将它们完全随机均分入甲、乙两个试验组中去,利用SAS实现完全随机分组,proc plan; factors no=100; output out=a; run; data b c; set a; mouse=_n_,if no=50 then do; group=甲; output b;drop no; end; else do; group=乙; output c;drop no; end; run,利用SAS实现

5、完全随机分组,data d; set b c; run; proc print data=d; run,完全随机化的效果是否总是最好,完全随机化的效果是否总是最好?不一定!关键取决于样本含量的大小 若样本含量很大,完全随机化的效果应当是比较理想的;若样本含量比较小,有时完全随机化的结果可能很糟糕 此时,宜采用分层随机化,分层随机化,首先对可能影响试验过程和结果的主要混杂因素(如年龄、性别、病情、疾病分期等)进行分层,然后在每一层内进行完全随机化分组,最后分别合并为试验组和对照组,分层随机化,分层目的:使某些对结果影响较重的因素在各组中尽可能相等 分层因素选择:根据不同疾病 分层因素的数量和分级

6、:不宜太多,否则组合太多且病人收集有一定困难,分层随机化,现有24只小鼠,其中16只雌性,8只雄性 若采用完全随机化方式将他们均分成两组,则有可能某一组中的12只小鼠全是雌性的,另一组中有4只雌性、8只雄性小鼠 当小鼠性别对观测结果有较大影响时,性别这个重要的非实验因素就会严重地影响实验因素两个水平对观测结果效应大小的正确评价,分层随机化,此时,宜采用分层随机化 先用完全随机化法将16只雌性小鼠随机均分成两组,实验组和对照组各8只;再用完全随机化法将8只雄性小鼠随机均分成两组,实验组和对照组各4只,样本含量估计及其SAS实现,医学统计学教研室 柳伟伟 讲师,一、样本含量和检验效能的含义,样本含

7、量(sample size)也叫样本大小或样本例数,是一项科研工作中,拟进行调查的被调查对象的个体数或拟用于试验研究的动物只数或新药临床试验中拟观察的患者例数,一、样本含量和检验效能的含义,总样本量用N表示,各组的样本含量用n表示 若各组的样本含量不相等,则给“n”加上右下标 不仅要关注N的大小,更应关注n的大小,一、样本含量和检验效能的含义,检验效能也称为把握度,是指当对比组的参数之间确实存在有意义的差别时,假设检验能够发现这种差别的能力或概率,型错误概率,二、估计样本含量和检验效能的意义,在医学科研工作中,无论抽样调查,临床试验或实验研究,正确确定样本含量都是一项十分重要的内容,也是一个需

8、要科研人员给予认真考虑的问题,二、估计样本含量和检验效能的意义,根据假设检验的原理,若样本太小,会使本来存在的差别不能显示出来,难以获得正确的研究结果,结论也缺乏充分的依据 反之,若样本太大,也会增加实际工作中的困难,不必要地浪费人力、物力、财力和时间,此外,由于样本太大,可能投入不足,科研过程的质量控制下降,从而引入不必要的干扰因素,对研究结果造成不良影响,二、估计样本含量和检验效能的意义,目前,不管是从期刊杂志上发表的论文,还是从实际科研人员的实验记录等科研档案来看,绝大多数研究工作都没有交代样本含量的确定方法、计算依据及公式,没有进行科学的、有理有据的样本含量估计 当假设检验的结果为“阴

9、性”,即不能拒绝原假设(H0)时,也很少有研究者去估计假设检验的检验效能,进而判断“阴性”结果的可信度如何,二、估计样本含量和检验效能的意义,造成这种状况的原因: 一是研究者没有认识到样本含量估计与检验效能分析对科学研究的重要性 二是研究者不知道如何进行样本含量与检验效能估计,三、估计样本含量时应具备的条件,影响样本含量估计的因素: 拟开展的研究类型 研究中将涉及到的因素的个数及其水平数的多少 观测的效应指标的性质 必不可少的前提条件,三、估计样本含量时应具备的条件,检验水准或显著性水平:即事先规定本次试验允许犯型(或假阳性)错误的概率,通常规定=0.05,同时还应明确是单侧检验还是双侧检验。

10、定得越小,所需的样本含量越大,三、估计样本含量时应具备的条件,检验效能:要求的检验效能越大,所需的样本含量就越大,实际上,检验效能由犯型错误的概率的大小所决定。在科研设计时,检验效能不宜低于0.75,否则检验的结果很可能反映不出总体的真实差别,出现非真实的阴性结果,三、估计样本含量时应具备的条件,样本推断总体的一些信息:在不同的情形下需要提供的信息会有所不同,可以通过专业知识、文献资料或预试验结果获得,四、样本含量与检验效能估计的具体情形,估计总体均值与总体率 单组设计均值的检验 配对设计均值与率的检验,四、样本含量与检验效能估计的具体情形,成组设计均值与率的差异性检验、等效性检验、非劣效性检

11、验 单因素多水平设计均值与率的检验 两因素析因设计定量资料方差分析,样本含量与检验效能估计的SAS实现方式,根据计算公式编制程序:SAS数据步+宏 利用SAS过程估计:POWER过程、GLMPOWER过程,一)估计总体均值时样本含量的估计,标准正态分布 分位数,总体标准差,容许误差,t 分布分位数,样本标准差,一) 估计总体均值时样本含量的估计,二)估计总体率时样本含量的估计,容许误差,总体率或 样本率,二)估计总体率时样本含量的估计,二)估计总体率时样本含量的估计,三)单组、配对设计定量资料统计分析时样本含量估计,标准差,总体效应差值,三)单组、配对设计定量资料统计分析时样本含量估计,四)成

12、组设计定量资料统计分析时样本含量估计,标准差,两组总体 效应差值,四)成组设计定量资料统计分析时样本含量估计,标准差,两组总体 效应差值,四)成组设计定量资料统计分析时样本含量估计,五)单因素多水平设计定量资料方差分析时样本含量估计,标准差,均数,五)单因素多水平设计定量资料方差分析时样本含量估计,六)两因素析因设计定量资料方差分析时样本含量估计,七)两样本率比较时样本含量的估计,两组合并率,总体率,七)两样本率比较时样本含量的估计,总体率,七)两样本率比较时样本含量的估计,八)配对设计四格表资料统计分析时样本含量估计,八)配对设计四格表资料统计分析时样本含量估计,九)成组设计定量资料的等效检验时样本含量的估计,总体均数,等效界值,标准差,九)成组设计定量资料的等效检验时样本含量的估计,十)成组设计定量资料的非劣效检验时样本含量的估计,总体均数 差值,非劣效界值,标准差,十)成组设计定量资料的非劣效检验时样本含量的估计,十一)成组设计定性资料的等效检验时样本含量的估计,总体率,等效界值,十一)成组设计定性资料的等效检验时样本含量的估计,十二)成组设计定性资料的非劣效检验时样本含量的估计,总体率 差值,非劣效界值,十二)成组设计定性资料的非劣效检验时样本含量的估计,五、几个需要特别说明的问题,在其他条件等同的情况下,定性指标所需的样本含量大于定量指标,每组88只小鼠,每组324只

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论