回归分析之分类变量的编码方法_第1页
回归分析之分类变量的编码方法_第2页
回归分析之分类变量的编码方法_第3页
回归分析之分类变量的编码方法_第4页
回归分析之分类变量的编码方法_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、(优选)回归分析之分类变量的编码方法第一页,共二十四页。编码值123m-2m-1m1km-1-1-1-1-1-12k0m-2-1-1-1-13k00m-3-1-1-16k0002-1-17k00001-1第二页,共二十四页。第三页,共二十四页。第四页,共二十四页。回归系数的解释截距是两个组均值的简单平均数: 斜率是两组均值之差的平均:第五页,共二十四页。“control” or “comparison” group coded 0“treatment” or “target” group coded 1“conceptually”.Group dc1 dc2 1 1 0 2 0 1 3* 0

2、0* = comparison groupFor several participants.Case group dc1 dc2 1 1 1 0 2 1 1 0 3 2 0 1 4 2 0 1 5 3 0 0 6 3 0 0其他编码方式:虚无编码第六页,共二十四页。 “control” or “comparison” group coded -1“treatment” or “target” group coded 1“conceptually”.Group ec1 ec2 1 1 0 2 0 1 3* -1 -1* = comparison groupFor several particip

3、ants.Case group ec1 ec2 1 1 1 0 2 1 1 0 3 2 0 1 4 2 0 1 5 3 -1 -1 6 3 -1 -1其他编码方式:效应编码第七页,共二十四页。如果一侧变量存在2个以上的水平?某研究者想考察心理表象对记忆的影响。他考察了两种实验条件下三组被试对词语的正确回忆率:实验组1:记单词时联想实验组2:记单词的同时呈现图片控制组:直接记忆这两个词任务:狗,自行车实验组1请想象一条狗骑着自行车实验组2第八页,共二十四页。控制组联想组图片组60809070708570708540901006080905070857010090608095608090正确回忆率

4、第九页,共二十四页。对比编码问题这时不能只用一个预测变量,因为结果无从解释。对于分类变量,应当有(m-1)个对比编码回忆对比编码的两个条件同一编码的所有取值的和为零;各个编码之间相互正交第十页,共二十四页。如何知道各编码变量相互正交Code 1: 11= -2; 12= +1; 13= +1Code 2: 21= 0; 22= -1; 13= +1Code 1和Code 2直观含义?控制组联想组图片组系列1-2110-11系列2-1010-11第十一页,共二十四页。模型A: =76.68+8.33Xi1+5.0Xi2回归系数与预测值的解释。第十二页,共二十四页。模型检验相对照的模型:模型C:

5、i = 0模型A: i = 0 + 1Xi1 + 2Xi2检验的虚无假设:H0: 1 = 2 = 0 (Model comparison approach)orH0 : 1 = 2 = 3 (ANOVA approach)第十三页,共二十四页。SPSS程序RECODE feedback (1=-2) (ELSE=1) INTO x1 .VARIABLE LABELS x1 contrast coding 1.EXECUTE .RECODE feedback (1=0) (2=-1) (3=1) INTO x2 .VARIABLE LABELS x2 contrast coding 2.EXEC

6、UTE .REGRESSION /DESCRIPTIVES MEAN STDDEV CORR SIG N /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT willing /METHOD=ENTER x1 x2 .第十四页,共二十四页。第十五页,共二十四页。SPSS结果SourceSource(SPSS)Source(ANOVA)SSdfMSFSig.SSRRegressionBetween3733.3321866.6721.78.000SSE(A

7、)ResidualWithin1800.002185.71SSE(C)TotalTotal5533.3323第十六页,共二十四页。更细节性的检验每一对照编码To test contrast 1:模型C: i = 0 + 2Xi2模型A: i = 0 + 1Xi1 + 2Xi2Null Hypothesis:H0: 1 = 0 orH0 : 1 = (2 + 3)/2第十七页,共二十四页。(-2*60+80+90)2/(6/8)=3333.3(90-80)2/(2/8)=400第十八页,共二十四页。变异来源分析表来 源bSSdfMSPRE组 间Xi1Xi2组 内8.335.003733.3333

8、3.3400.01800.0211211866.73333.3400.085.721.77838.8954.667.675.650.182总变异5533.323整合上述结果第十九页,共二十四页。小结第二十页,共二十四页。小结回归系数与预测值如果我们采用对比编码,那么:Y的预测值对应相应组别的均值截距是各组均值的非加权平均数斜率反映了在每个对照编码中涉及的组间均值之差第二十一页,共二十四页。第二十二页,共二十四页。更复杂一点:如果每组被试量不同?问题的关键是:如果每组被试量不同,这是采用对比编码所生成的变量也不正交。这时表现为:每个变量的SS之和不再等于SSbetween一个变量的回归系数不保持恒定降低了模型分析的检验力第二十三页,共二十四页。如果需要检验非正交的编码变量呢?

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论