回归分析之分类变量的编码方法.ppt_第1页
回归分析之分类变量的编码方法.ppt_第2页
回归分析之分类变量的编码方法.ppt_第3页
回归分析之分类变量的编码方法.ppt_第4页
回归分析之分类变量的编码方法.ppt_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、单因素方差分析:单一分类变量的回归模型,回归分析之九,回顾:对比性编码,分类变量作为预测变量时一个重要的问题是如何解释结果,为此需要编码。 对比性编码是众多编码方式中比较简单的一种,更为关键的是这个编码可以比较灵活地回答我们的研究问题。 对比性编码要满足两个条件: 对于经过对比编码后的预测变量,其所有取值之和为零; 如果存在两个以上经过编码的变量,这些变量相互正交。,回归系数的解释,截距是两个组均值的简单平均数: 斜率是两组均值之差的平均:,“control” or “comparison” group coded 0 “treatment” or “target” group coded 1

2、,“conceptually”. Group dc1 dc2 1 1 0 2 0 1 3* 0 0 * = comparison group,For several participants. Case group dc1 dc2 1 1 1 0 2 1 1 0 3 2 0 1 4 2 0 1 5 3 0 0 6 3 0 0,其他编码方式:虚无编码,“control” or “comparison” group coded -1 “treatment” or “target” group coded 1,“conceptually”. Group ec1 ec2 1 1 0 2 0 1 3*

3、-1 -1 * = comparison group,For several participants. Case group ec1 ec2 1 1 1 0 2 1 1 0 3 2 0 1 4 2 0 1 5 3 -1 -1 6 3 -1 -1,其他编码方式:效应编码,如果一侧变量存在2个以上的水平?,某研究者想考察心理表象对记忆的影响。他考察了两种实验条件下三组被试对词语的正确回忆率: 实验组1:记单词时联想 实验组2:记单词的同时呈现图片 控制组:直接记忆这两个词 任务:狗,自行车,实验组1,请想象一条狗骑着自行车,实验组2,正确回忆率,对比编码问题,这时不能只用一个预测变量,因为结果无

4、从解释。 对于分类变量,应当有(m-1)个对比编码 回忆对比编码的两个条件 同一编码的所有取值的和为零; 各个编码之间相互正交,如何知道各编码变量相互正交,Code 1: 11= -2; 12= +1; 13= +1 Code 2: 21= 0; 22= -1; 13= +1 Code 1和Code 2直观含义?,模型A: =76.68+8.33Xi1+5.0Xi2 回归系数与预测值的解释。,模型检验,相对照的模型: 模型C: i = 0 模型A: i = 0 + 1Xi1 + 2Xi2 检验的虚无假设: H0: 1 = 2 = 0 (Model comparison approach) or

5、 H0 : 1 = 2 = 3 (ANOVA approach),SPSS程序,RECODE feedback (1=-2) (ELSE=1) INTO x1 . VARIABLE LABELS x1 contrast coding 1. EXECUTE . RECODE feedback (1=0) (2=-1) (3=1) INTO x2 . VARIABLE LABELS x2 contrast coding 2. EXECUTE . REGRESSION /DESCRIPTIVES MEAN STDDEV CORR SIG N /MISSING LISTWISE /STATISTICS

6、 COEFF OUTS R ANOVA /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT willing /METHOD=ENTER x1 x2 .,SPSS结果,更细节性的检验每一对照编码,To test contrast 1: 模型C: i = 0 + 2Xi2 模型A: i = 0 + 1Xi1 + 2Xi2 Null Hypothesis: H0: 1 = 0 or H0 : 1 = (2 + 3)/2,(-2*60+80+90)2/(6/8)=3333.3,(90-80)2/(2/8)=400,变异来源分析表,整合上述结果,小结,小结

7、回归系数与预测值,如果我们采用对比编码,那么: Y的预测值对应相应组别的均值 截距是各组均值的非加权平均数 斜率反映了在每个对照编码中涉及的组间均值之差,更复杂一点:如果每组被试量不同?,问题的关键是:如果每组被试量不同,这是采用对比编码所生成的变量也不正交。 这时表现为: 每个变量的SS之和不再等于SSbetween 一个变量的回归系数不保持恒定 降低了模型分析的检验力,如果需要检验非正交的编码变量呢?,步骤1:列出所有想要检验的问题,然后寻找包括最多所要检验问题的正交对照编码组合,按照我们前面所讲的流程检验和解释回归模型; 步骤2:对于没有进入编码组合的问题,重新寻找新的正交对照编码组合,然后重新建立回归模型; 步骤3:进行如下的矫正,Bonf

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论