版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
平衡性检验什么是平衡性检验?Balancetests也称randomisationchecks,是一种普遍的显著性检验。例如,一位研究者希望将一种新的词汇学习方法和传统方法进行比较。他随机分配40名被试到控制组(传统方法)和实验组(新方法)中。4周后,他检查所有被试的词汇知识,让我们假定他发现了一个支持实验组的显著差异
(e.g.t(38)=2.7,p=0.01)。为了有人避免批评,两组之间的差异是由于学习方法之外的其他因素导致的,周密的研究应该进行一次t检验和卡方检验以核查实验组与控制组成员在年龄上和性别比例上是否有显著差异。这些检验是为了确保研究者能够主张随机化分组使得在这些变量上,两组是平衡的,因此我们所观察到的组间差异并不能归因于这些可能的混淆变量。如果一个平衡性检验的结果是显著的,研究者可能试图将该混淆变量作为协变量再进行一次分析。为什么这类显著性检验是多余的?尽管该策略看上去非常合理,但是平衡性检验存在以下几个问题。平衡性检验不能提供能多信息:统计检验是用来对总体而非特定样本进行推断的。诚然,实际中会出现实验组中有3名男性,而控制组有14名男性的情况;卡方检验将会产生一个显著结果。但是我们会真的认为男性更有可能出现在控制组吗?当然不会。因为我们已经随机将所有被试分配至各个条件中,我们知道关于这个变量的零假设(两组成员之间没有性别差异)是真的,因此我们明白男性进入实验组和控制组的机会是均等的。故每一次显著的平衡性检验都是由于完全随机所导致的错误警报。一次平衡性检验不能告诉我们任何我们还不知道的信息。平衡性检验也是多余的:那些同意上述观点的研究者可能继续认为,他们使用平衡性检验不是为了推断总体,而是想了解组间不平衡程度。但是,组间的完美平衡并不是做出有效统计推断的先决条件。因此平衡性检验也是不必要的。平衡性检验使得显著性检验失效:因为p值只有在未进行平衡性检验的条件下才有它确切含义。实际上p值是一个条件概率:如果零假设为真,那么观察到如此极端、甚至更极端的数据模式的概率。一旦进行了平衡性检验,我们为p值增加了一个前提条件:如果零假设为真并且平衡性检验产生一个特定结果,我们能观察到如此极端、甚至更极端的数据模式的概率。虽然看起来并未增加很多限制,实际上它是一种数据依赖性分析模式,这使得显著性检验失效。通过R语言进行模拟实验:我们性检验一个处理效应,随机分配40名被试到实验组和控制组。被试的年龄分布在20-40之间。年龄变量并不是我们感兴趣的,但它与结果变量呈线性相关。假如处理效应为0,即零假设为真。我们的分析策略如下。我们对年龄变量进行一次显著性检验,以确定实验组和控制组在被试年龄方面是否平衡。如果检验结果不显著,可以断定我们拥有平衡的群组,并对结果变量进行一次t检验。我们模拟10000次该场景,并将来自于“有条件的”分析策略的p值分布与不管平衡性检验结果的t检验和协方差分析所提供的p值分布进行比较。下面的直方图显示,这三种检验策略的p值分布。由于在本例中,零假设为真,因此p值的分布应该是均匀的,例如所有的bars应该一样高。左侧和中间的直方图正如如此,表明当分析不受平衡性检验影响时,p值是正确地分布。简言之,在此情况下p值有其预期的含义。右侧直方图表明,当分析受到平衡性检验影响时,低p值太罕见:对处理效应的检验太过于保守,即它的p值没有反映其预期含义。最近有一些文章还是强调,data-dependentanalysis会导致anti-conservative
p-values,例如当不存在处理效应时,非常有可能观测到一个显著效应(e.g.
Gelman&Loken2013
and
Simmonsetal.2011)。因此本文表明data-dependentanalysis可能产生
overconservativeresults似乎有些奇怪。但我的主要观点是,平衡性检验会产生本可以轻松避免的不准确结果——不论错误方向。这就是说,overconservatism也有实践上的缺陷,即更低的统计功效:当处理效应真实存在时,它不太可能观察到一个在统计上显著的效应。下面的直方图显示了当存在一个相对较小的处理效应时,p值的分布情况。很明显,只有ANCOVA策略的统计功效表现最好,反之使用平衡性检验策略甚至比不上单纯的使用t检验的方法。解决办法解决办法很简单:justdon’tusebalancetests。在分析随机试验的数据时,平衡性检验只会把研究报告弄得乱七八糟而不能提供任何明显的优势。当我们有理由假定存在一个影响结果变量的协变量时,最好的办法就是将它纳入到主要分析中,而不管实验组和控制组在该变量上是否平衡。实际上,
MutzandPemantle(2013)发现,当组间是平衡时,加入一个协变量会更加有效。尽管本文只关注随机实验,但我认为在分析非随机的准实验时,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工业建设塔吊租赁合同样本
- 劳务规范制度宣传板
- 汽车承销协议书范本
- 医院建筑施工图设计合同
- 电子产品公司总经理任职合同
- 会展活动招标文件撰写技巧
- 电信运营商出纳劳动合同
- 学校建设模板施工合同
- 游乐园专用停车场出租协议
- 停车场车位租赁合同
- 【道法】认识生命 课件-2024-2025学年统编版道德与法治七年级上册
- 走近湖湘红色人物智慧树知到答案2024年湖南工商大学
- 业务流程绘制方法IDEF和IDEFPPT课件
- (完整版)垃圾自动分拣机构PLC控制毕业设计.doc
- 小学四年级音乐课程标准
- 我的一次教研经历
- 双向细目表和单元测试卷及组卷说明
- 工业厂房中英文对照施工组织设计(土建、水电安装)范本
- PCR仪使用手册
- 离子色谱法测定空气中二氧化硫
- 水蒸汽热力性质表
评论
0/150
提交评论