spss及应用实例-第8章方差分析_第1页
spss及应用实例-第8章方差分析_第2页
spss及应用实例-第8章方差分析_第3页
spss及应用实例-第8章方差分析_第4页
spss及应用实例-第8章方差分析_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

8分5tt检验可以判断两个总体的均值是不t100个总体,那需要做C

=4950浩大的工程有没有法能够不进行两两比较直接从整体上解决多总体的均值的比较呢?SPSS提供t检验推广到多独立总体情形的假设检验,是一种参数检验方在牛市中是否存在行业差异。此时,我们需要在每个行业中选取一些作为样本,计算其涨幅方差分析解决的问生的影响;第二类是控制变量以外的随机因素(随量)所产生的影响。这里随机因素是指认为很难8.28.3节中将详细介绍。总体说来都FF分布来完成的。方差分析的应用条各总体的分布是正态分布,这也是能够推导出F统计量服从F分布的基础SPSSP值是依据F分布计算的。一旦总体从正态分布,那么F统计量自然不再服从F分布,自然SPSS给出的P值对于Q-Q6K-S检验。如果这个条件得不到满足,那么F统计量也不再服从F分布,其自由度也不再是理论上推导出来的自由SPSSP值对于统计检验也将不可用。不过相比较而言,这个条件对假设检验的影响SPSSP值,完成假设检验。应用条件不满足的处理办SPSS计算出的组内方差和组间方差值,手工构造新的统计量和推以采用第6独立样本非参数检验的方法。推荐使用Kruskai-Wallis检验。引例:单因素方差分析概8-11.sav 是否对工资有显著的影响45-65岁是老年护士。如果我们把作为控制变量,显然它有三个水平,这是一个三总体的均值检验将三个段的护士看作三个总体,护士按小时的工资就是观测变量,需要检验的是三个总体的护统误差,当然也就说明对工资没有影响。Xijiij,i1,2,...,k,j1,2,...,其中i代表控制变量的第i个水平即第i个总体,i表示第i个总体的均值 段的平均工资 nkij表示第i个总体第j个样本受随机因素的影响,是服从正态分布的随 量。而ni表示第 nki1kikXiXiH012kH1

p,

p k kS2

(

X)2

(

X

Xn

i1j

n

i1j

n

[(

X)2

X)2

j n

[(

X)2n(

X)2i1j

从公式看,样本方差由两部分构成,一部分即组内方差,即

X)2SSAi1jkk分为组间方差即ni

FSSA/(kSSE/(n

MSAMSE分别称为组间和组内的平均方差。在原假设为真的条件下,统计量服从自由度为k-1n-kFF统计量观测值较小,说明组内方差(分母)大,组间方差(分子)小,此此时就要原假设,认为控制变量各水平对观测变量有显著影响了。SPSS会自动计算F统计量的观PP值就可以完成统计检验了。单因素方差分析的SPSS实对于正态分布的验证,我们利用第6章单样本K-S检验来完成,由于这里分别要检验三个段样本的正态性,因此需要将数据集文件按照段进行拆分,具体操作我们简要列出,留给读者自行对照2章内容完成,作为对前面内容的复习和巩固。Step2Step2:选择CompareGroups单选按钮,将变量 范围(agerange)”选入GroupBasedon变量中,设置完成后点中,设置完成后点 完成操作8-1Std. 8- Std. 31- Std. 46- 8-2One-SampleKolmogorov-SmirnovNN18- Kolmogorov-SmirnovAsymp.Sig.(2-NKolmogorov-Smirnov Asymp.Sig.(2-N46- Kolmogorov-SmirnovAsymp.Sig.(2-TestdistributionisCalculatedfrom从表8-2的结果来看,三个段的总体样本数分别是、和861,有89个无收入数据的缺失样本。三个段的检验结果均不显著,说明三个段的总体分布和正态分布没有显著差异,满8-1看出,无论 ANOVA是ysisofVariance的缩写,代表方差分析。在图8-1的单因素方差分析主框中,左边是SPSS数据集文件中的所有变量列表,中间是DependentList是观测变量列表,下面Factor框中是控析的,在下一小节讲到它们。选入控制因素变量框Factor,设置完成后点击完成操作。观测变观测变图8-1单因素方差分析主单因素方差分析的进一步分利用以上的分析,我们就可以得到三个总体均值是否显著差异的结果,也就知道了对工资是否各水平的必要,自然方差分析到此终止;但是,如果方差分析检验结果是显著的,即各段总体工资的均值是不同的,那么我们就还想知道的结论,例如:哪个段平均工资最高,哪个段平均工资最低,两个段的平均工资差异是多少,这个差异在统计上是否是显著的等等结论,这个就需这三个问题SPSS分别用三个按钮来提供相应的功能,第一个按钮提供先验对比检验、趋SPSSij只要存在一定程度的差异就可以被检验出来,缺点是因为敏感,犯第MSEn-kt分布。MSE(11 njt(XiXj)MSE(11 njN,从而控制了犯第一类错误的概率。Tukey方法:TukeyqMSE/t(XiXj)(ijMSE/Tukey方法。Tukeyqkn-kq分布。S-N-K方法:S-N-K(Student

1.2logZ ,当l3时,ZMSE 3[0.251/(n 3[0.251/(nZLSDBonferroniSPSS对于方差齐性检验采用的是方差同质性检验(homogeneityofvariance)t先验对比检验是检验两组水平的线性组合均值是否有显著差异,例如,本例中有31,2,

1

1/2(2

趋势检验:当控制因素是顺序尺度变量时,随着控制变量的增大,趋势检验能检验观测变量的总在图8-1的单因素方差分析主框中,点击按钮进入如图8-2的框,在框中根据本例的特点选择LSD和Bonferroni方法,点击按钮回到主框。在图8-1主框中,点击按钮,进入如图8-3的框,在框Statistics复选框组中勾选Homogeneityofvariancetest复选框,点击按钮回到主框。在图81主框中,点按钮进入图84子框,勾选lynomil复选框,在eedrticCoficints数1、0.5、0.5,点按钮回到主框。图8-2PostHoc子框 图8-3Option子框 图8-4Contrasts子框单因素方差分析的结果分8-3TestofHomogeneityofLevene 从表8-3我们可以看出观测变量在控制变量各水平上方差统计量观测值为0.5932和2908,对应的P值为0.553,显然P值远远大于显著水平0.05,不能原假设,认为观测变量在各水平方差齐性得到满足,这也从统计显著性的角度再次证明了我们在表8-1看到的各水平样本方差观测值差异较下面是单因素方差分析的结果,结果主要在表5中,我看到组间方差由于总体不同的变10176945914.297组内方差分别为508.85和15668,F统计量观测值为3244对应的概率P值接近0,显然应该原假设,认为观测变量在控制变量各水平上均值显著差异,也就是说会影响工资。另外根据趋势检的结果,线性趋势是显著的,但是二次趋势不显著。8-5221 1111Within

8-6Multiple(I)范围(J)范围Difference(I- Std.

95%ConfidenceIntervalwer

18-31-46-18-31-

31- - - -46- - - -18- 46- - - -18- 31- 31- - - -46- - - -18- 46- - - -18-46-31-*.Themeandifferenceissignificantatthe0.05表8-6给出多重比较检验的结果,从结果上看,无论是LSD方法还是Bonferroni方法,各段的差异都是显著的(检验的P值都接近0。显然46-60岁段的护士平均工资最高,比31-45岁段护士平均工资高0.7853,比18-30岁段护士平均工资高1.81824;31-45岁段护士工资其次,比18-30岁段护士平均工资高1.03231;相比来说,18-30岁段护士平均工资最低。8-7Contrast

18- 31- 46- - -表8- Contrast Std.t(2-每小时 1--Doesnotassume1--表8-7和表8-8列出先验对比检验的结果8-7列出先验对比检验的检验系数确定了是18-30果来看,由于方差是齐的,因此看第一行结果,显然检验统计量t观测值为-7.078,说明18-30岁段护士平均工资低于另外两个段工资的平均数。检验概率P值接近于0。显然小于显著水平,应该拒而且还要考虑多个控制因素的交互作用对观测变量的影响,在后面的叙述中详细解释这种差异。引例:多因素方差分析概本小节中,从具体的一个例子出发,研究多因素方差分析的模型、假设检验过程、和主要注8-2:8-28-1两个两个 在例8-1中,已经证明了段对护士工资有显著影响,现在增加了工作经验这一新的控制因素,A、BApBq个水平,则p×q个水平,每个水平的观测变量的样本我们可以描述为:Xijkijijijk,i1,2,...,p;j1,2,...,q;k1,2,...,式中,XijkAiBjk个样本;ijk表示相应的随机误差,i,jABi、j水平上的总体均值,代表了因素独立的影响;而iji、jp=3,q=5。ABSST的分解为: qSST(

X)2SSASSBSSABi1j1k nijAi nijnj,nijni,nij

ninji、j水平边际样本数,n SSAn(XAX)2n(XAX i1j (X (XBn(XX)

X

q SSE

AB i1j1k对交互作用,我们直观解释如下,如果因素A水平发生变化,例如从水平1变化到水平2,如果无论因素B取哪个水平,观测值变量要么同时增加,要么同时减小,即因素A的变化就可以决定观测值的变化,此时称A、B无交互作用;反之,如果因素A从水平1变化到水平2,观测值在B的不同水平上A、B交叉的水平才能确定观测变量的A、B8-98-10可以帮助读者更好理解交互作用。8-9AAB因素水平37B58-10AAB因素水平37B858-9A水平从12时,无论因素B取m水平还是n水平,观测变量的值都上升,反过Bm到nA取何水平,观测变量的值都上升,此时两因素无交互作用。8-10A12Bm水平上增加,n水平减少,即是说需A、B共同的水平,例如:1×m→2×m,观测变量值增加;1×n→2×n,观测变量值减小,此时H0:12...p,12...q,ij0,i1,...,p,j1,...,3个不同的统计量:FAFB

SSA/(pSSE/(nSSB/(qSSE/(n

SSAB/(p1)(q1) SSE/(n F计算样本统计量观测值和概P值,SPSSP值,并以表根据P值,进行统计检验。如果P值大于显著水平,则不能原假设,仍为因素水平上没有显著三个统计量,因此要计算三个P值,完成三个检验,分别对应A、B因素各自的影响和AB交互作用的影计量,例如:三因素时,样本方差的分解为:77,3个建设检验。,3+5+15=2323SPSS操作。多因素方差分析的SPSS实由于篇幅关系,本小节不再列出对方差分析条件的验证,请读者仿造8.2节相关内容进行验证,需 ysis】菜单→【GeneralLinearModel】菜单→【Univariate】菜为可控的控制变量,RandomFactor(s):代表随机效应,即人为不可控制,但是取值是有限个,可以作为控制因素的控制变量。Covariate(s):代表协变量,在8.4节中进行介绍,而WLSWeight表示选最小二乘方法的变量。右边有5个按钮用于多因素方差分析进一步分析使用图8-5多因素方差分析主点击进入图8-6框,框中所提供的多重比较检验的方法是一样的,只是多了多种比较检验变量的选择,由于前面已经做过的,我们这里做工作经验的多重比较检验,将变量“yrsscale”选入PostHocTestsfor:框中,选择LSD和Bonferroni方法,点击点击按钮回到主框。图8-6多重比较检验这是多因素方差分析比单因素方差分析增加的功能。SPSS默认是对所有的影响作用都要做检验,例如本例是2个因素,就需要做3个假设检验,分析控制变量主效应和交互效应。这种考虑了所有情况SPSS按默认的饱和模型完成多因素方差分析。我们可以通过点击按钮进入图8-7模型选择框,在SpecityModel单选框组中选CustomBuildTermsType6Maineffect时选中两个以上变量,在点间箭头,此时右边框中会出现yrsscale*agerange字样,表示交互效应,本例中,选择了两个变量的主效应和它们的交互效应以后就等价于饱和模型了;对于后面的All2-wayAll5-way25次的所有效应,这些选项使用很少。本例中只分析主效应,不选交叉效应,则选择两个变量,选Maineffect选项。点击按钮回到主框。图8-7模型选择对比检验可通过点击按钮进入图8-8框,选择控制变量,在下拉菜单中选择Simple后Change就可以了,对于下拉菜单的选项,解释如下:Diviation表示检验观测变量总的均值和各水平上均值的差异,SimpleFirst或最后水平Last与各水平上均值的差异,Difference表示当前水平上的均值和前一水平均值比较,Helmert表示当前水平均值和后一水平均值比较。这里我们对yrsscale变量进行Simple检验。点击按钮回到主框。图8-8对比检验框多因素方差分析的结果分LSDBonferroni方法。8-12第一行表示校正的模型,即总体结果,F15.797P0,说明检验结果显著,即段和工作经验各水平上总体均值(即平均工资)有显著差异。8-11Between-SubjectsN18-31-46-6-工作经验(年16-21- 每小时薪水TestsofBetween-SubjectsTypeIIISumofMeanFCorrected125agerange*6Correcteda.RSquared=.066(AdjustedRSquared=首先是变换模型以后的检验结果,列在表8-13中比较表8-13和8-12,发现表8-13少了交互作用这上显著,段水平上不显著。虽然结论一致,但是注意到具体统计量的值已经有所变化,这是因为我们少考虑了一个交互效应,交互效应的样本方差SSAB会分配到SSA和SSB中,使得这两个组间方差增FP值出现。 每小时薪水TestsofBetween-SubjectsTypeIIISumofMeanFCorrected7 1 2 5 Correcteda.RSquared=.064(AdjustedRSquared=LSD表8- 每小时薪水MultipleMean

95%Confidence(I)工作经验(年(J)工作经验(年(I-Std.Upper6-------16----21----------6-16----21-------6-16----21-------6-16-21-------6-21-16---6-16-21--8-143621-35两个水平上总体均值差异不显著,在其他水平表8- SumofF5接下来我们来看对比检验的具体结果,限于篇幅,我们仅列出表格中差异值,P值等重要量,其余 ContrastResults(K工作经验(年)Simple DependentContrast-Level1vs Std.Contrast-Level2vs Std.Contrast-Level3vs.Level Std.Contrast-Level4vs.Level Std.Contrast-Level5vs.Level Std.a.Referencecategory=8-16结果来看,虽然整体来说,1-56水平上的均值有显著差异,但0.16156上总体均值也无显著差异(P0.295,其他水平上总体均值有显著差异。8-16的结果8-14中level1level60.37378-162.7548倍左右,8-14多重比细心的读者比较例8-1和例8-2也许发现了问题:在例8-1中,段对护士平均工资是有影响的,即护士每小时薪水在不同段上其均值是显著差异的;但是在例8-2中,护士每小时薪水在不同段上其均值变成不是显著差异的(见表8-12。这是什么原因呢?为什么同样的观测变量只是多增加一180度的大转折?这些问题我们都将在本节给出答案。在本节中,我们沿用8-18-2引例:协方差分析的引入和概8-3作用 XijiZijij,i1,2,...,k;j1,2,...,式中,iZij变量对观测变量的影响系数,而ijF

RSS/(n2)

(RSSSSE)/(kSSE/(nkSSregRSSRSS,RSSRSSSSTSSregSSA其中SSA+SSE=RSS,在原假设为真时,第一统计量服从自由度为1n-2F分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论