SPSS统计分析-差异分析_第1页
SPSS统计分析-差异分析_第2页
SPSS统计分析-差异分析_第3页
SPSS统计分析-差异分析_第4页
SPSS统计分析-差异分析_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

差异分析1、均值描述—Means过程2、t检验3、方差分析2021/5/91均值描述——Means过程

定义:Means过程是SPSS计算各种基本描述统计量的过程。Means过程其实就是按照用户指定条件,对样本进行分组计算均数和标准差,如按性别计算各组的均数和标准差。Means过程的计算公式为:2021/5/92

研究问题比较不同性别同学的数学成绩平均值和方差。数据如表所示。

数学成绩表性别数学Male99 79 59 89 79 89 99Female88 54 56 232021/5/93假设检验的一般步骤:根据实际问题提出原假设H0与备择假设H1。选择统计量t作为检验统计量,并在H0成立的条件下确定t的分布。选择显著性水平,并根据统计量t的分布查表确定临界值及H0的拒绝域。根据样本值计算统计量的值,并将其与临界值作比较。下结论:若统计量的值落入拒绝域内,就拒绝H0;否则,不拒绝H0。t检验就是检验统计量为t的假设检验。用于检验两个变量之间的差异。显著性水平:0.05——显著0.001——非常显著0.0001——极其显著2021/5/94单样本t检验——样本均值与总体均值的比较独立两样本t检验——独立两样本均值比较配对样本t检验——配对设计的差数均值与总体均值0的比较t检验的类型2021/5/95单样本t检验统计学上的定义和计算公式

定义:SPSS单样本T检验是检验某个变量的总体均值和某指定值之间是否存在显著差异。统计的前提是样本总体服从正态分布。也就是说单样本本身无法比较,进行的是其均数与已知总体均数间的比较。2021/5/96

单样本T检验的零假设为H0总体均值和指定检验值之间不存在显著差异。采用T检验方法,按照下面公式计算T统计量:2021/5/97SPSS中实现过程分析——比较均值——单样本T检验2021/5/98SPSS中实现过程

研究问题分析某班级学生的高考数学成绩和全国的平均成绩70之间是否存在显著性差异。数据如表所示。

数学成绩表性别数学Male99 79 59 89 79 89 99Female88 54 56 232021/5/99单尾检验与双尾检验(邱P169)

在平均数的检验中,研究者的兴趣往往在于比较不同平均数的差距,而提出两个平均数大于、小于与不等于几种不同形式的研究假设,形成有特定方向的检验或无方向性的检验两种不同模式。当研究者只关心单一一个方向的比较关系时(例如男生的数学成绩X1优于女生X2),平均数的检验仅有一个拒绝区,需使用单尾检验(one-tailedtest),范例如下:

单尾检验由于仅需考虑单方向的差异性,因此在同样的显著水平下,可以较双侧检验容易得到显著结果,统计检验力(power)大于双侧检验,因此采用单侧检验对于研究者较为有利。但是,采用单尾检验必须提出支持证据,除非理论文献支持单侧的概念,或是变量间的关系具有明确的线索显示必需使用单侧检验,否则需采用双侧检验来检验平均数的特性。当研究者并无特定方向的设定(例如男生的智商与女生的智商有所不同),假设检验在两个极端的情况皆有可能发生,而必须设定两个拒绝区,此时即需使用双尾检验(two-tailedtest)。如:分别是男生与女生数学成绩的平均数2021/5/910独立两样本t检验

定义:所谓独立样本是指两个样本之间彼此独立没有任何关联,两个独立样本各自接受相同的测量,研究者的主要目的是了解两个样本之间是否有显著差异存在。这个检验的前提如下:注意:两样本必须是独立的,即从一总体中抽取一批样本对从另一总体中抽取一批样本没有任何影响,两组样本个案数目可以不同,个案顺序可以随意调整。

样本来自的总体要服从正态分布且变量为连续测量数据。在进行独立两样本t检验之前,要通过F检验来看两样本的方差是否相等。从而选取恰当的统计方法。2021/5/911

两独立样本T检验的零假设H0为两总体均值之间不存在显著差异。在具体的计算中需要通过两步来完成:第一,利用F检验判断两总体的方差是否相同;第二,根据第一步的结果,决定T统计量和自由度计算公式,进而对T检验的结论作出判断。2021/5/912F值异质同质结果显著结果不显著是否显著?T值显著否?T值显著否?P>.05(接受虚无假设)P<=.05P<=.05P>.05(接受虚无假设)P>.052021/5/9131.判断两个总体的方差是否相同SPSS采用LeveneF方法检验两总体方差是否相同。如果“F值”检验不显著(Sig.的值大于.05),表示两个组别群体变异数相等,此时看“方差齐性相等”所列之t值,看其是否显著。如果“F值”检验显著(Sig.的值小于.05),表示两个组别群体变异数不相等,此时看“方差齐性不相等”所列之t值,看其是否显著。2021/5/9142.根据第一步的结果,决定T统计量和自由度计算公式

(1)两总体方差未知且相同情况下,T统计量计算公式为2021/5/915

(2)两总体方差未知且不同情况下,T统计量计算公式为

T统计仍然服从T分布,但自由度采用修正的自由度,公式为2021/5/916

从两种情况下的T统计量计算公式可以看出,如果待检验的两样本均值差异较小,t值较小,则说明两个样本的均值不存在显著差异;相反,t值越大,说明两样本的均值存在显著差异。2021/5/917SPSS中实现过程分析——比较均值——独立样本T检验2021/5/918SPSS中实现过程

研究问题分析A、B两所高校大一学生的高考数学成绩之间是否存在显著性差异。两所学校学生的高考数学成绩表学校数学清华998879595489795689北大9923897050677889562021/5/919图4-6“Independent-SamplesTTest”对话框图4-7“DefineGroups”对话框2021/5/920结果和讨论2021/5/921统计学上的定义和计算公式两配对样本T检验

定义:两配对样本T检验是根据样本数据对样本来自的两配对总体的均值是否有显著性差异进行推断。一般用于同一研究对象(或两配对对象)分别给予两种不同处理的效果比较,以及同一研究对象(或两配对对象)处理前后的效果比较。前者推断两种效果有无差别,后者推断某种处理是否有效。

两配对样本T检验的前提要求如下:两个样本应是配对的。在应用领域中,主要的配对资料包括:具有年龄、性别、体重、病况等非处理因素相同或相似者。首先两个样本的观察数目相同,其次两样本的观察值顺序不能随意改变。样本来自的两个总体应服从正态分布。2021/5/922

两配对样本T检验的零假设H0为两总体均值之间不存在显著差异。原理1、配对样本t检验是配对设计的样本差数的均值同总体均值0比较的t检验。

2、配对样本t检验是针对配对数据的t检验。其检验方法是首先求出每对样本的差值,然后比较样本差值的均值和总体均值0之间的关系。如果两组数据没有差别,那么其样本差值的均值应该在0附近波动。否则为两组数据是有差别的。这种方法的本质就是在对配对样本的差值同总体均值0做单样本t检验。2021/5/923

◆注意

单样本t检验和独立两样本t检验样本内部数据的顺序是可以任意调换。而配对样本t检验的样本必须是一一对应的。样本内数据的顺序不能随意交换顺序。

2021/5/9242021/5/925SPSS将自动计算T值,由于该统计量服从n−1个自由度的T分布,SPSS将根据T分布表给出t值对应的相伴概率值。如果相伴概率值小于或等于用户设想的显著性水平,则拒绝H0,认为两总体均值之间存在显著差异。相反,相伴概率大于显著性水平,则不拒绝H0,可以认为两总体均值之间不存在显著差异。2021/5/926SPSS中实现过程分析——比较均值——配对样本T检验2021/5/927方差分析多个独立样本的差异显著性检验,通常可以使用方差分析方法。油菜品种差异性分析P164不同教学方式是否给学生成绩造成了显著影响;不同地区的考生成绩是否有显著的差异等。2021/5/928方差分析基本概念

方差分析是R.A.Fister发明的,用于两个及两个以上样本均数差别的显著性检验。方差分析方法在不同领域的各个分析研究中都得到了广泛的应用。从方差入手的研究方法有助于找到事物的内在规律性。

由于各种因素的影响,研究所得的数据呈现波动状而有所不同。造成波动的原因可分成两类:一类是不可控的随机因素的影响,这是人为很难控制的一类影响因素,称为随机变量;另一类是研究中人为施加的可控因素对结果的影响,称为控制变量。方差分析可以用来判断样本数据之间的差异到底是由以上哪种因素造成的。2021/5/929随机变量控制变量随机误差系统误差不可控有固定的大小和方向(正或负),重复测定时重复出现,可以校正或消除。2021/5/930方差分析的目的主要有以下:

1、通过数据分析找出对该事物有显著影响的因素;

2、研究各因素之间的交互作用是否对该事物造成影响。2021/5/931◆注意:方差分析的适用条件1、样本来自的总体服从正态分布。2、样本方差必须是齐次的。3、各样本之间相互独立。2021/5/932方差分析的类型2021/5/933单因素方差分析单因素方差分析是指只单独考虑一个因素A对指标X的影响。此时其他因素都不变或者控制在一定的范围之内。考虑因素A有k个水平,在每次水平下做ni次试验。2021/5/934

在方差分析中,代表变异大小,并用来进行变异分解的指标是离均差平方和。总的变异平方和记为SST,被分解为两项:第一项是各组的离均差平方和之和,代表组内变异(即随机变量引起的变异),称为组内平方和SSW(WithinGroups);第二项是按样本含量大小加权的各组均数与总均数的差值平方之和,代表组间变异(由控制变量引起的变异),称为组间平方和或者处理平方和SSB(BetweenGroups)。总变异=组内变异+组间变异总变异=随机变异+处理因素导致的变异2021/5/935

这样,我们可采用一定的方法来比较组内变异和组间变异的大小,如果后者远远大于前者,则说明处理因素的影响确实存在,如果两者相差无几,则说明影响不存在,这就是方差分析的基本思想。2021/5/936其中,k为水平数;ni为第i个水平下的样本容量。可见,组间样本离差平方和是各水平组均值和总体均值离差的平方和,反映了控制变量的影响。组内离差平方和是每个数据与本水平组平均值离差的平方和,反映了数据抽样误差的大小程度。SST=SSW+SSB计算公式2021/5/937F统计量是平均组间平方和与平均组内平方和的比(组间变异与误差变异的比值)。

从F值计算公式可以看出,如果控制变量的不同水平对观察变量有显著影响,那么观察变量的组间离差平方和必然大,F值也就比较大;相反,如果控制变量的不同水平没有对观察变量造成显著影响,那么,组内离差平方和影响就会比较大,F值就比较小。2021/5/9382021/5/939SPSS中实现过程分析——比较均值——单因素ANOVA2021/5/940SPSS中实现过程

研究问题三组学生的数学成绩人名数学组别hxh99.000yaju88.000yu99.000shizg89.000hah94.000s90.000watet79.002jess56.002wish89.0022_new199.0022_new270.0022_new389.0022_new455.0012_new550.0012_new667.0012_new767.0012_new856.0012_new956.0012021/5/941

实现步骤在菜单中选择“One-WayANOVA”命令“One-WayANOVA”对话框2021/5/942“One-WayANOVA:Options”对话框“One-WayANOVA:Contrasts”对话框“One-WayANOVA:PostHocMultipleComparisons”对话框2021/5/943结果和讨论

(1)首先是单因素方差分析的前提检验结果,也就是Homogeneityofvariancetest——方差齐次性检验2021/5/944(2)输出的结果文件中第2个表格如下所示。2021/5/945(3)输出的结果文件中第3个表格如下所示。2021/5/946(4)输出的结果文件中第4个表格如下所示。2021/5/947

(5)输出结果的最后部分是各组观察变量均值的折线图,如图5-6所示。2021/5/948事后比较方法的选择LSD法实际上是t检验的变形,只是在变异和自由度的计算上利用了整个样本信息,而不仅仅是所比较两组的信息。因此它敏感度是最高,在比较时仍然存在放大α水准(一类错误)问题,但换言之就是总的二类错误非常的小,要是LSD都没有检验出差别,那恐怕真的没有差别。SNK法运用的最广泛的,它采用StudentRange分布进行所有各组均值间的配对比较。该方法保证在H0真正成立时总的α水准等于实际设定值,即控制了一类错误。张文彤P2682021/5/949多因素方差分析统计学上的定义和计算公式多因素方差分析用来研究两个或两个以上控制变量是否对观测变量产生显著影响。多因素方差分析不仅能够分析多个因素对观测变量的独立影响,更能够分析多个控制因素的交互作用能否对观测变量的分布产生显著影响,进而最终找到利于观测变量的最优组合。2021/5/950

多因素方差分析不仅需要分析多个控制变量独立作用对观察变量的影响,还要分析多个控制变量交互作用对观察变量的影响,及其他随机变量对结果的影响。因此,它需要将观察变量总的离差平方和分解为3个部分:

多个控制变量单独作用引起的平方和;多个控制变量交互作用引起的离差平方和;其他随机因素引起的离差平方和。2021/5/9512021/5/9522021/5/953

以上F统计量服从F分布。SPSS将自动计算F值,并根据F分布表给出相应的相伴概率值。2021/5/9542021/5/955SPSS中实现过程分析——常规线性模型——单变量2021/5/956SPSS中实现过程

研究问题表5-2 三组不同性别学生的数学成绩人名数学组别性别hxh99.000maleyaju88.000femaleyu99.000maleshizg89.000malehah94.000females90.000malewatet79.002malejess56.002femalewish89.002male2_new199.002male2_new270.002female2_new389.002male2_new455.001female2_new550.001male2_new667.001female2_new767.001male2_new856.001female2_new956.001male2021/5/957

实现步骤图5-7在菜单中选择“Univariate”命令图5-8“Univariate”对话框(一)2021/5/958图5-9“Univariate:Options”对话框(一)图5-10“Univariate:PostHocMultipleComparisonsforObservedMeans”对话框2021/5/959图5-11“Univariate:Model”对话框2021/5/960图5-12“Univariate:ProfilePlots”对话框图5-13“Univariate:Contrasts”对话框2021/5/961结果和讨论

(1)SPSS输出结果文件中的第一部分如下两表所示。2021/5/962

(2)输出的结果文件中第二部分如下表所示。2021/5/963

(3)输出的结果文件中第三部分如下表所示。2021/5/964

(4)输出的结果文件中第四部分如下表所示。2021/5/965

(5)输出的结果文件中第五部分如下表所示。2021/5/966

(6)输出的结果文件中第六部分如下表所示。2021/5/967

(7)

输出结果的最后部分是控制变量之间是否有交互影响的图形。2021/5/968统计学上的定义和计算公式协方差分析

定义:协方差分析是将那些很难控制的因素作为协变量,在排除协变量影响的条件下,分析控制变量对观察变量的影响,从而更加准确地对控制因素进行评价。

利用协方差分析就可以完成这样的功能。协方差将那些很难控制的随机变量作为协变量,在分析中将其排除,然后再分析控制变量对观察变量的影响,从而实现对控制变量效果的准确评价。协方差分析要求协变量应是连续数值型,多个协变量间互相独立,且与控制变量之间也没有交互影响。2021/5/969

前面单因素方差分析和多因素方差分析中的控制变量都是一些定性变量。而协方差分析中则即包含了定性变量(控制变量),又包含了定量变量(协变量)。2021/5/970

以上F统计量服从F分布。SPSS将自动计算F值,并根据F分布表给出相应的相伴概率值。如果F控制变量的相伴概率小于或等于显著性水平,则控制变量的不同水平对观察变量产生显著的影响;如果F协变量的相伴概率小于或等于显著性水平,则协变量的不同水平对观察变量产生显著的影响。2021/5/9715.4.2SPSS中实现过程分析——常规线性模型——单变量2021/5/9725.4.2SPSS中实现过程

研究问题表5-3 三组学生的数学成绩人名数学入学成绩组别hxh99.0098.000

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论