SPSS统计分析--第4章--平均数差异检验_第1页
SPSS统计分析--第4章--平均数差异检验_第2页
SPSS统计分析--第4章--平均数差异检验_第3页
SPSS统计分析--第4章--平均数差异检验_第4页
SPSS统计分析--第4章--平均数差异检验_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、LOGO第第4章章 平均数差异检验平均数差异检验 重点班的重点班的学学生和一般生和一般学学生的平均智商是否有差生的平均智商是否有差异异呢?要解呢?要解决这个问题决这个问题就可以就可以运运用本章用本章将将要介要介绍绍的平均的平均数数差差异检验异检验的的方法。方法。4.1 4.1 假设检验原理假设检验原理 假假设检验设检验(hypothesis testinghypothesis testing)是推)是推论统计论统计中的重要中的重要内内容,是指先提出一容,是指先提出一个个假假设设,一般是,一般是对总对总体体参数参数或或总总体分布体分布形形态态的假的假设设,然后通,然后通过检验样过检验样本本统计统

2、计量的差量的差异来异来推推断总断总体体参数参数之之间间是不是存在差是不是存在差异异。因。因为为在在现实调查研现实调查研究中,往往究中,往往由于各由于各种种限制而无法得到限制而无法得到总总体的体的参数参数。 例如要例如要调查汉调查汉族和蒙古族族和蒙古族7 7岁儿岁儿童的童的运运算能力是否存在差算能力是否存在差异异,不可能,不可能对对所有的所有的汉汉族和蒙古族族和蒙古族7 7岁儿岁儿童童进进行行测试测试,只,只能通能通过过合理的抽合理的抽样样,然后,然后对样对样本本进进行行调查调查。这样这样得到的得到的参参数数就是就是样样本本参数参数,通,通过对样过对样本的本的参数进参数进行行检验从检验从而推而推

3、测汉测汉族族7 7岁儿岁儿童童总总体和蒙古族体和蒙古族7 7岁儿岁儿童童总总体在体在运运算能力上是否有算能力上是否有差差异异。 在在统计学统计学中,假中,假设设一般用一般用来来指指对总对总体体参数参数所做的假定性所做的假定性说说明。明。 在在统计学统计学上有上有两种两种假假设设,一,一种称为虚种称为虚无假无假设设(null null hypothesishypothesis),或叫做零假),或叫做零假设设,记为记为H H0 0;一;一种称为备择种称为备择假假设设(alternative hypothesisalternative hypothesis),或叫做),或叫做对对立假立假设设,记为记

4、为H H1 1。H H1 1是是研研究者提出的究者提出的研研究假究假设设。 在在统计学统计学上,只能上,只能对虚对虚无假无假设设H H0 0进进行直接的行直接的检验检验。假。假设检设检验验的任的任务务就是先假就是先假设设H H0 0是是真真的,然后以此的,然后以此为为前提,如果有前提,如果有不合理的不合理的现现象出象出现则说现则说明假明假设设是是错误错误的,即的,即H H0 0为真这为真这一假一假设设是不成立的,要被拒是不成立的,要被拒绝绝。如果。如果H H0 0为为假,就要拒假,就要拒绝绝H H0 0并并接接受受H H1 1,则研则研究者的假究者的假设设成立;如果成立;如果H H0 0 为真

5、为真,就要接受,就要接受H H0 0并并拒拒绝绝H H1 1,则研则研究者的假究者的假设设不能成立。不能成立。这这就是就是统计学统计学上的上的“ “反反证证法法” ”。H H1 1称为备择称为备择假假设设就是指其是就是指其是预备当预备当H H0 0被拒被拒绝时绝时以以供供选择选择的。的。虚虚无假无假设设和和备择备择假假设设互相排斥互相排斥并并且只有一且只有一个个正正确,因此确,因此H H1 1又又称为对称为对立假立假设设。4.1.2 4.1.2 假设检验中的小概率事件假设检验中的小概率事件 小小概概率事件就是指一率事件就是指一个发个发生生概概率接近零的事件,也就是一率接近零的事件,也就是一般情

6、般情况况下不下不会发会发生的事件。生的事件。4.1.3 4.1.3 假设检验的两类错误假设检验的两类错误 虽虽然小然小概概率事件率事件发发生的可能性很小,但仍有生的可能性很小,但仍有发发生的可能。生的可能。 若若设设定定临临界界概概率率为为0.050.05,从从某一平均某一平均数为数为0 0的的总总体中抽体中抽取任一取任一样样本,本,样样本平均本平均数为数为。当没当没有落入有落入总总体分布体分布两两端端5%5%概概率的范率的范围内围内,如,如图阴图阴影部分所示。影部分所示。 然而,即使然而,即使概概率再小(如率再小(如=0.01=0.01)、)、临临界界区区域的面域的面积积再小,任再小,任意抽

7、取的仍有意抽取的仍有1%1%的的概概率落入率落入临临界界区区域,即域,即这种这种小小概概率事件的率事件的发发生仍有生仍有1%1%的可能性是合理的。的可能性是合理的。这时这时H H0 0是是真真的,然而依据假的,然而依据假设检设检验验的的统计逻辑统计逻辑却要拒却要拒绝绝H H0 0,这样这样就犯就犯错误错误了。了。统计学统计学中中将这类将这类不不该该拒拒绝绝H H0 0却拒却拒绝绝了了H H0 0的的错误称为错误称为型型错误错误(typeerrortypeerror), ,因因为为常用常用表示表示概概率,所以又常率,所以又常称为称为型型错误错误。这种错误这种错误往往往往导导致致虚虚假的科假的科学

8、发现学发现。 如如图图所示,是所示,是H H0 0为真时为真时和和H H1 1为真时为真时的分布,的分布,两个两个分布是有重合的分布是有重合的。 在在这个阴这个阴影部分中影部分中既既有可能是有可能是H H0 0为真为真也有可能也有可能H H1 1为真为真。但是我。但是我们们拒拒绝绝了了H H1 1为真为真的可能性,的可能性,这这就可能又犯就可能又犯错误错误了。了。统计学统计学中中将这将这类类不不该该拒拒绝绝H H1 1却拒却拒绝绝了了H H1 1的的错误称为错误称为型型错误错误(type errortype error), ,这类错误这类错误的的概概率用率用表示,所以又表示,所以又称称型型错误

9、错误,这类错误这类错误往往往往导导致科致科学发现学发现被埋被埋没没。4.1.4 4.1.4 单侧检验和双侧检验单侧检验和双侧检验 根据是否强根据是否强调检验调检验的方向性,的方向性,将检验将检验分分为单侧检验为单侧检验和和双侧双侧检验检验。双侧检验双侧检验只只关关心心两个总两个总体体参数参数之之间间是否有差是否有差异异,而,而不不关关心心谁谁大大谁谁小。小。4.1.5 4.1.5 假设检验的步骤假设检验的步骤 假假设检验设检验一般包括以下五一般包括以下五个个步步骤骤: (1 1)根据)根据研研究究问题问题的要求提出假的要求提出假设设,包括,包括虚虚无假无假设设H H0 0和和备择备择假假设设H

10、 H1 1。 (2 2)选择选择合适的合适的检验统计检验统计量。量。 (3 3)根据需要)根据需要选择显选择显著性水平著性水平。 (4 4)计计算出算出检验统计检验统计量。量。 (5 5)根据)根据检验统计检验统计量做出量做出统计决统计决策。策。4.2 4.2 均值比较均值比较 介介绍绍了一定的假了一定的假设检验设检验的的统计学统计学知知识识,下面,下面将将具体具体讲讲解在解在SPSS18.0SPSS18.0中如何利用假中如何利用假设检验设检验的思想的思想对对平均平均数数的差的差异进异进行行检验检验。在。在SPSS18.0SPSS18.0中,是由中,是由“ “分析分析” ”|“|“比比较较均均

11、值值” ”下的子菜下的子菜单单完成各完成各种种情情况况下的平均下的平均数数差差异检验异检验的。先的。先从从最基本的最基本的“ “均均值过值过程程” ”进进行介行介绍绍。4.2.1 4.2.1 均值比较的主要功能均值比较的主要功能 均均值过值过程和前面的描述程和前面的描述统计过统计过程一程一样样,可以,可以对对指定指定变变量的量的描述性描述性统计变统计变量量进进行呈行呈现现。4.2.2 4.2.2 均值比较的适用条件均值比较的适用条件 均均值过值过程主要功能是程主要功能是统计变统计变量的描述和不同量的描述和不同组组之之间间粗略的粗略的比比较较,因此,因此对数对数据据没没有什有什么么要求。需要注意

12、的是用要求。需要注意的是用来来形成形成分分组组的的变变量量应该应该是能明确表明某是能明确表明某种种特征的特征的变变量。另外均量。另外均值值过过程中有一程中有一个对数个对数据据进进行行线线性性检验检验的功能,由的功能,由“ “选项选项” ”对话对话框中的框中的“ “线线性相性相关检验关检验” ”功能功能实现实现,这这要求在第一要求在第一层层的控制的控制变变量要不少三量要不少三个个水平。水平。4.2.3 4.2.3 均值比较的操作过程均值比较的操作过程 在在SPSSSPSS中均中均值值比比较较的操作的操作过过程如下:程如下: (1 1)打)打开开或建立或建立数数据文件。据文件。 (2 2)选择选择

13、“ “分析分析” ”|“|“比比较较均均值值” ”|“|“均均值值” ”命令,打命令,打开开“ “均均值值” ”主主对话对话框,如框,如图图所示。所示。 (3 3)选择选择因因变变量:量:对话对话框左面是源框左面是源变变量框,其中量框,其中罗罗列了列了数数据据文件中已命名的文件中已命名的变变量,量,从从中中选择选择作作为为因因变变量的量的变变量,量,单击单击上上方的箭方的箭头头按按钮钮,该变该变量量进进入入“ “因因变变量列表量列表” ”框。因框。因变变量可以根量可以根据需要据需要选择选择一一个个或多或多个变个变量。量。 (4 4)选择选择自自变变量:在源量:在源变变量框中量框中选择选择作作为

14、为自自变变量的量的变变量,即量,即分分组变组变量。量。单击单击下面的箭下面的箭头头按按钮钮,该变该变量量进进入入“ “自自变变量列表量列表” ”框。首先框。首先选择选择的自的自变变量默量默认为认为第一第一层层控制控制变变量,若量,若单击单击“ “下一下一张张” ”按按钮钮,可以再,可以再选择选择其他其他变变量作量作为为第二第二层层控制控制变变量。量。 (5 5)选择选择描述性描述性统计统计量:量:单击单击“ “选项选项” ”按按钮钮,出,出现现“ “选项选项” ”对话对话框,如框,如图图所示。所示。 (6 6)选择进选择进行行单单因素方差分析或因素方差分析或线线性相性相关关性性检验检验:在:在

15、“ “选选项项” ”对话对话框的下方有框的下方有两个复选两个复选按按钮钮,分,分别别是是Anova Anova 表表 和和 etaeta、线线性相性相关检验关检验, ,前者前者对对第一第一层层的自的自变变量量进进行行单单因素方因素方差分析和差分析和计计算算变变量相量相关关程度的程度的etaeta值值;后者在第一;后者在第一层层自自变变量有三量有三个个以上水平以上水平时对时对其其进进行行线线性相性相关关性性检验检验。 (7 7)设设置完成后,置完成后,单击单击“ “继续继续” ”按按钮钮返回均返回均值值主主对话对话框,框,单击单击 “ “确定确定” ”按按钮钮,执执行操作,行操作,输输出出结结果

16、。果。4.2.4 4.2.4 实例分析:某普通高校本科生自尊平均水平实例分析:某普通高校本科生自尊平均水平 在某普通高校在某普通高校随随机抽取机抽取152152名本科生,名本科生,运运用缺憾感量表用缺憾感量表对对其自尊水平其自尊水平进进行行测测量,收集量,收集测验数测验数据。部分据。部分数数据如下所示据如下所示:1 1描述不同性别学生自尊的平均水平描述不同性别学生自尊的平均水平解:在该案例中,因变量是被试的缺憾感量表的得分,即自尊解:在该案例中,因变量是被试的缺憾感量表的得分,即自尊水平;自变量是被试的性别和专业。要描述不同性别学生的自水平;自变量是被试的性别和专业。要描述不同性别学生的自尊平

17、均水平,可以直接由均值比较的操作实现。尊平均水平,可以直接由均值比较的操作实现。 操作过程操作过程(1)(1)创建新的数据文件:变量包括被试的性别、专业和自尊。创建新的数据文件:变量包括被试的性别、专业和自尊。(2)(2)打开主对话框并完成变量选择:选择打开主对话框并完成变量选择:选择“分析分析”| |“比较均值比较均值”| |“均值均值”命令,打开命令,打开“均值均值”对话框。将因变量对话框。将因变量“自尊自尊”选入选入“因变量因变量列表列表”框中,将分组变量框中,将分组变量“性别性别”选入选入“自变量列表自变量列表”框中,如图框中,如图所示:所示:(3)(3)选择选择描述性描述性统计统计量

18、:量:单击单击“ “选项选项” ”按按钮钮,打,打开开“ “选项选项” ”对话对话框框。因。因为为系系统统已已将将均均值值作作为为默默认认的描述的描述统计统计量,因此可以不做其量,因此可以不做其他他选择选择。单击单击“ “继续继续” ”按按钮钮,返回,返回“ “均均值值” ”主主对话对话框。框。(4)(4)单击单击“ “确定确定” ”按按钮钮,执执行操作,行操作,输输出出结结果。果。 结果分析结果分析(1)(1)案例处理摘要表:案例处理摘要表: 结果首先呈现的是案例处理摘要表。该表格呈现了在均值结果首先呈现的是案例处理摘要表。该表格呈现了在均值比较中参与统计分析的案例和排除的案例的个数和所占的

19、百分比较中参与统计分析的案例和排除的案例的个数和所占的百分比。如下表所示,有比。如下表所示,有152152个数据个案参与统计处理,占总个案个数据个案参与统计处理,占总个案数的数的100%100%,剔除的个案数为,剔除的个案数为0 0。(2)(2)均均值值比比较结较结果果报报表:表: 均均值值比比较结较结果果报报表呈表呈现现了不同分了不同分组组的描述性的描述性统计统计量量变变量,量,便于直便于直观观比比较较。如下表所示,分。如下表所示,分别别呈呈现现了女生和男生自尊的平了女生和男生自尊的平均水平,女生共有均水平,女生共有8585人人参与检验参与检验,平均自尊得分是,平均自尊得分是158.6515

20、8.65,标标准差准差为为27.23027.230;男生共有;男生共有6767人人参与检验参与检验,平均自尊得分是,平均自尊得分是173.00173.00,标标准差准差为为28.41028.410;所有;所有参与参与比比较较的被的被试试的的总数为总数为152152,自尊平均,自尊平均值值是是164.97164.97,标标准差准差为为28.57228.572。2 2描述不同性别和不同专业的学生的自尊平均水平描述不同性别和不同专业的学生的自尊平均水平解:在该案例中,如果要描述不同性别和不同专业学生的平均解:在该案例中,如果要描述不同性别和不同专业学生的平均自尊水平,需要有两层分组,分别以自尊水平,

21、需要有两层分组,分别以“性别性别”和和“专业专业”为分组变为分组变量,可以通过均值比较中添加分组层次的功能来实现。量,可以通过均值比较中添加分组层次的功能来实现。 操作过程操作过程(1)(1)打开数据文件。打开数据文件。(2)(2)打开主对话框并完成变量选择:选择打开主对话框并完成变量选择:选择“分析分析”| |“比较均值比较均值”| |“均值均值”命令,打开命令,打开“均值均值”主对话框。将因变量主对话框。将因变量“自尊自尊”选入选入“因变因变量列表量列表”框中,将分组变量框中,将分组变量“性别性别”选入选入“自变量列表自变量列表”框中。单框中。单击击“下一张下一张”按钮,选择按钮,选择“专

22、业专业”进入进入“自变量列表自变量列表”框中作为第二框中作为第二层分组变量,如图所示:层分组变量,如图所示:(3)(3)选择选择描述性描述性统计统计量:量:选择选择描述性描述性统计统计量:量:单击单击“ “选项选项” ”按按钮钮,打,打开开“ “选项选项” ”对话对话框。因框。因为为系系统统已已将将均均值值作作为为默默认认的描述的描述统计统计量,因此可以不做其他量,因此可以不做其他选择选择。单击单击“ “继续继续” ”按按钮钮,返回,返回“ “均均值值” ”主主对话对话框。框。(4)(4)单击单击“ “确定确定” ”按按钮钮,执执行操作,行操作,输输出出结结果。果。 结果分析结果分析 结果除了

23、呈现案例处理摘要表,还呈现了均值结果报表,结果除了呈现案例处理摘要表,还呈现了均值结果报表,如下表所示。从该统计报表中不仅可以分别看出女生和男生的如下表所示。从该统计报表中不仅可以分别看出女生和男生的平均自尊得分,还可以进一步看到不同专业的女生和男生的平平均自尊得分,还可以进一步看到不同专业的女生和男生的平均自尊得分,以及不同专业学生总体的平均自尊得分。例如哲均自尊得分,以及不同专业学生总体的平均自尊得分。例如哲学专业女生共有学专业女生共有2626人,平均自尊得分为人,平均自尊得分为151.46151.46,标准差为,标准差为20.12020.120;心理学专业的学生共有;心理学专业的学生共有

24、111111人,平均自尊得分为人,平均自尊得分为167.06167.06,标准差为,标准差为29.60129.601。4.3 4.3 单一样本单一样本T T检验检验 4.24.2节节所介所介绍绍的均的均值过值过程可以呈程可以呈现现分分组变组变量的平均量的平均值值等描等描述述统计统计量,量,将将不同的不同的组进组进行一行一个个直直观观的比的比较较。在以下的三。在以下的三节节中中将将介介绍绍的的检验检验方法有方法有单样单样本本T T检验检验、独独立立样样本本T T检验检验、配配对样对样本本T T检验检验,根据,根据数数据的特征,据的特征,选择运选择运用合适的用合适的检验检验方法。方法。4.3.1

25、4.3.1 单一样本单一样本T T检验的主要功能检验的主要功能 单单一一样样本本t t检验检验是比是比较较某一某一样样本的平均本的平均数与数与某一确定某一确定总总体体均均值值是否有是否有统计学统计学意意义义上的差上的差异异。用。用样样本的平均本的平均数来数来估估计计样样本所代表的未知本所代表的未知总总体的平均体的平均数数,通,通过检验样过检验样本平均本平均数与数与确定确定总总体平均体平均数值数值是否存在差是否存在差异来异来推推论论未知未知总总体是否和确体是否和确定定总总体一致。体一致。4.3.2 4.3.2 单一样本单一样本T T检验的适用条件检验的适用条件 当当确定均确定均值值的的总总体的体

26、的条条件不同件不同时时,如,如总总体是否体是否为为正正态态分布分布以及以及总总体方差是否已知,所适用的体方差是否已知,所适用的单单一一样样本平均本平均数数差差异检异检验验的方法是不同的。的方法是不同的。4.3.3 4.3.3 单一样本单一样本T T检验的操作过程检验的操作过程 在在SPSSSPSS中中进进行行单单一一样样本本t t检验检验的操作的操作过过程如下:程如下: (1 1)打)打开开或建立或建立数数据文件。据文件。 (2 2)打)打开开主主对话对话框:框:选择选择“ “分析分析” ”|“|“比比较较均均值值” ”|“|“单样单样本本T T检验检验” ”命令,打命令,打开开“ “单样单样

27、本本T T检验检验” ”主主对话对话框,如框,如图图所示。所示。 (3 3)选择变选择变量:在左量:在左边边的源的源变变量列表框中量列表框中选选中要中要进进行行单单一一样样本本t t检验检验的的变变量名,量名,单击单击中中间间的箭的箭头头按按钮钮,使,使选选中的中的变变量量进进入入右右边边的的“ “检验变检验变量量” ”列表框中。列表框中。 (4 4)输输入入检验值检验值:在:在“ “检验变检验变量量” ”列表框下方的列表框下方的“ “检验值检验值” ”文本文本框中框中填填入要入要进进行行检验检验的确定的均的确定的均值值。 (5 5)设设置置信度、置置信度、选择选择缺失缺失值处值处理方法:理方

28、法:单击单击“ “选项选项” ”按按钮钮,打打开开“ “选项选项” ”对话对话框,如框,如图图所示。所示。 (6 6)设设置完成后,置完成后,单击单击“ “继续继续” ”按按钮钮返回返回单样单样本本t t检验检验主主对话对话框,框,单击单击 “ “确定确定” ”按按钮钮,执执行操作,行操作,输输出出结结果。果。4.3.4 4.3.4 实例分析:全国各地区城市园林绿地面积实例分析:全国各地区城市园林绿地面积 20082008年的全国调查显示中国各地区平均城市园林绿地面积年的全国调查显示中国各地区平均城市园林绿地面积约为约为5630056300公顷。假设公顷。假设20102010又进行一次全国各地

29、区城市园又进行一次全国各地区城市园林绿地面积的调查,试检验林绿地面积的调查,试检验20102010年各地区城市园林绿地面年各地区城市园林绿地面积与积与20082008年全国平均城市园林绿地面积是否有差异。年全国平均城市园林绿地面积是否有差异。解:在本案例中,要检验解:在本案例中,要检验20102010年各地区城市园林绿地面积与年各地区城市园林绿地面积与20082008年全国平均城市园林绿地面积(已知值:年全国平均城市园林绿地面积(已知值:5630056300公顷)公顷)是否有差异,即某一样本数据与某一确定均值进行比较。虽是否有差异,即某一样本数据与某一确定均值进行比较。虽然不知道总体分布是否是

30、正态,但样本较大(然不知道总体分布是否是正态,但样本较大(N=30N=30),狂热),狂热以运用单样本以运用单样本T T检验。检验。1 1操作操作过过程程(1)(1)建立建立数数据文件据文件: :将调查获将调查获得得数数据据输输入入数数据文件中,如下表据文件中,如下表所示,所示,单单位(公位(公顷顷)。)。(2)(2)打打开开主主对话对话框:框:选择选择“ “分析分析” ”|“|“比比较较均均值值” ”|“|“单样单样本本T T检验检验” ”命令,打命令,打开开“ “单样单样本本T T检验检验” ”主主对话对话框。框。(3)(3)选择变选择变量:量:将变将变量列表框中量列表框中“ “绿绿化面化

31、面积积” ”变变量移入右量移入右边边的的“ “检验变检验变量量” ”列表框中。列表框中。(4)(4)输输入入检验值检验值:在:在“ “检验变检验变量量” ”列表框下方的列表框下方的“ “检验值检验值” ”文本框文本框中中填填入入检验检验均均值值5630056300,如,如图图所示:所示:(5)(5)单击单击 “ “确定确定” ”按按钮钮,执执行操作,行操作,输输出出结结果。果。2 2结结果分析果分析(1)(1)描述性描述性统计统计量表:量表:该该表格呈表格呈现现了了单个样单个样本的描述性本的描述性统计统计量量的的值值,包括,包括参与统计参与统计的的单个样单个样本的本的个个案案数数(N N)、均

32、)、均值值、标标准准差和均差和均值值的的标标准准误误。如下表所示,共。如下表所示,共调查调查了中了中国国3030个个地地区区,平均城市平均城市园园林林绿绿地面地面积为积为58030.6358030.63公公顷顷,标标准差准差为为69705.95769705.957,标标准准误为误为12726.50812726.508。(2)(2)单样单样本本T T检验结检验结果果报报表:表:该样该样本呈本呈现现了了单样单样本本T T检验检验的的结结果果,包括,包括T T值值、自由度(、自由度(dfdf)、)、检验检验的的概概率(率( Sig. Sig.)、均)、均值值差差值值,以及差分的,以及差分的95%95

33、%置信置信区间区间。如下表所示,本案例。如下表所示,本案例T T检验检验的的T T值为值为0.1360.136,自由度,自由度df=29df=29,双侧双侧T T检验检验的的概概率率Sig.(Sig.(双侧双侧)=0.893.)=0.893.由于由于显显著性水平著性水平为为0.050.05,而,而0.8930.050.8930.05,因此接受,因此接受虚虚无假无假设设,即,即20102010年年调查调查所得各地所得各地区区平均城市平均城市园园林林绿绿地面地面积积,与与20082008年年调查调查所得的全所得的全国国平均城市平均城市园园林林绿绿地面地面积积5630056300公公顷顷无无显显著差

34、著差异异。4.4 4.4 两独立样本两独立样本t t检验检验 4.3节节已已经经介介绍绍了了单样单样本本T检验检验一般用一般用来检验单样来检验单样本均本均值值与与确定的确定的总总体均体均值值是否存在是否存在显显著差著差异异,即,即检验检验某一某一样样本是本是否否来来自已知自已知总总体。那体。那么么如何如何检验两个样检验两个样本的均本的均值值是否有是否有显显著性差著性差异异呢?呢?对对于于两个样两个样本均本均值值的差的差异检验异检验,推,推断统计断统计的的逻辑逻辑是由是由两个样两个样本的平均本的平均数数差差异来异来推推断它们断它们所代表的所代表的两个两个总总体的平均体的平均数数之之间间是否存在是

35、否存在显显著差著差异异。两个样两个样本平均本平均数数差差异检验异检验所要考所要考虑虑的的检验条检验条件要比件要比单样单样本本T检验复杂检验复杂,不但,不但要考要考虑两个样虑两个样本所代表的本所代表的总总体是否正体是否正态态分布,分布,总总体方差是体方差是否已知,否已知,还还要考要考虑两个总虑两个总体的方差是否体的方差是否齐齐性,性,两个样两个样本是本是独独立立样样本本还还是相是相关样关样本,本,两个样两个样本的容量是否相同等本的容量是否相同等问题问题。当数当数据的据的条条件不同件不同时时,所适用的,所适用的检验检验方法也是不同的。方法也是不同的。 本本节节主要介主要介绍绍在在SPSS 18.0

36、中如何中如何进进行行独独立立样样本本T检验检验的操作。的操作。4.4.1 4.4.1 两独立样本两独立样本t t检验的主要功能检验的主要功能 在在两个样两个样本平均本平均数数差差异检验异检验中,根据中,根据两个样两个样本是否相本是否相关关,分分为独为独立立样样本和配本和配对样对样本。本。独独立立样样本是指本是指两个样两个样本的本的数数据据之之间没间没有有关联关联性,即性,即两个样两个样本中的任一本中的任一数数据的据的获获取不取不会会受受到到两个样两个样本中其他任何本中其他任何数数据的影据的影响响,是,是独独立的。立的。两独两独立立样样本本t t检验检验就是用就是用来检验两个独来检验两个独立立样

37、样本的均本的均值值之之间间是否是否显显著著差差异异,即,即检验两样检验两样本所代表的本所代表的总总体的均体的均值值是否相同。是否相同。4.4.2 4.4.2 两独立样本两独立样本t t检验的适用条件检验的适用条件 进进行行两独两独立立样样本平均本平均数数差差异检验时异检验时要先要先检验两个样检验两个样本所代本所代表的表的总总体方差是否已知,以及方差是否体方差是否已知,以及方差是否齐齐性。性。当两个总当两个总体体的方差未知的方差未知时时,需要用,需要用样样本的方差本的方差来来作作为总为总体方差的无偏体方差的无偏估估计计量,需要用量,需要用t t检验检验。当两个总当两个总体的方差未知且不体的方差未

38、知且不齐齐性性时时,需要,需要运运用用Cochran-Cox-testCochran-Cox-test来进来进行行检验检验。具体。具体统计学统计学知知识识在此不做在此不做赘赘述。述。4.4.3 4.4.3 两独立样本两独立样本t t检验的操作过程检验的操作过程 在在SPSSSPSS中中进进行行两独两独立立样样本本t t检验检验的操作的操作过过程如下:程如下: (1 1)打)打开开或或创创建建SPSSSPSS数数据文件。据文件。 (2 2)打)打开开主主对话对话框:框:选择选择“ “分析分析” ”|“|“比比较较均均值值” ”|“|“独独立立样样本本T T检验检验” ”命令,打命令,打开开“ “

39、独独立立样样本本T T检验检验” ”主主对话对话框。如框。如图图所所示。示。 (3 3)选择变选择变量:量:从从左左边边的源的源变变量框中量框中选选中需要中需要检验检验的一的一个个或或多多个变个变量,量,单击单击中中间间上面一上面一个个箭箭头头按按钮钮,使,使检验变检验变量量进进入入“ “检检验变验变量量” ”列表框中。列表框中。从从左左边边的源的源变变量框中量框中选选中分中分组变组变量,量,单击单击下面一下面一个个箭箭头头按按钮钮,使之,使之进进入入“ “分分组变组变量量” ”列表框中。列表框中。 (4 4)定)定义义分分组变组变量:量:单击单击“ “定定义组义组” ”按按钮钮,打,打开开“

40、 “定定义组义组” ”对话对话框,有框,有两个复选两个复选框,框,对应两种对应两种定定义义分分组变组变量的情量的情况况,如,如图图所所示。示。 使用指定使用指定值值单选单选按按钮钮:这这是默是默认认的定的定义义方法,方法,当当分分组变组变量量有有两个两个水平水平时时,一般,一般选选用用这种这种方法,如性方法,如性别别:男、女。在:男、女。在组组1和和组组2后面的文本框中后面的文本框中填填入分入分组变组变量的量的值值。若在。若在数数据中分据中分别别用用1代表女、用代表女、用2代表男,代表男,则则在在组组1文本框中文本框中填填1,在,在组组2文本框中文本框中填填2。 割点割点单选单选按按钮钮:当当

41、分分组变组变量有量有3个个及以上水平及以上水平时时,一般,一般选选用用该该定定义义方法。在方法。在割点割点文本框中文本框中输输入一入一个数值个数值,系,系统将统将全全部部数数据分据分为为分分组变组变量量数值数值小于割点小于割点值值和大于等于割点和大于等于割点值两组值两组,再,再对这两组进对这两组进行行两独两独立立样样本本T检验检验。若分。若分组变组变量有量有3个个水平水平,在,在割点割点文本框中文本框中输输入入2,则将则将分分组变组变量的量的数值数值等于等于1的分的分为为一一组组,将将分分组变组变量的量的数值数值等于等于2和和3的分的分为为一一组组。 (5 5)设设置置信度、置置信度、选择选择

42、缺失缺失值处值处理方法:定理方法:定义义好分好分组变组变量后量后,单击单击“ “继续继续” ”按按钮钮,返回,返回“ “独独立立样样本本T T检验检验” ”主主对话对话框。框。单击单击“ “选项选项” ”按按钮钮,进进入入“ “选项选项” ”对话对话框。其中,框。其中,“ “置信置信区间区间百分比百分比” ”文文本框是用本框是用来设来设定定设设定定检验检验的置信度的,默的置信度的,默认认的的为为95%95%,“ “缺失缺失值值” ”复选复选框是用框是用来选择来选择用用哪种哪种方式方式处处理包含有缺失理包含有缺失值值的的变变量的量的。 (6 6)设设置完成后,置完成后,单击单击“ “继续继续”

43、”按按钮钮返回返回独独立立样样本本t t检验检验主主对对话话框,框,单击单击“ “确定确定” ”按按钮钮,执执行操作,行操作,输输出出结结果。果。4.4.4 4.4.4 实例分析:某大学超市会员卡消费情况实例分析:某大学超市会员卡消费情况 假设某大学超市要调查该校学生一年在该超市用超市会员假设某大学超市要调查该校学生一年在该超市用超市会员卡消费情况,随机抽取卡消费情况,随机抽取255255名学生的消费情况,试检验该名学生的消费情况,试检验该大学学生一年在该超市使用超市会员卡的消费金额是否存大学学生一年在该超市使用超市会员卡的消费金额是否存在性别差异。在性别差异。解:在该案例中,需要将男生消费情

44、况与女生消费情况进行解:在该案例中,需要将男生消费情况与女生消费情况进行比较,检验差异是否显著。男生的消费数据和女生的消费数比较,检验差异是否显著。男生的消费数据和女生的消费数据是两个相互独立的样本,且样本容量较大,可以认为两总据是两个相互独立的样本,且样本容量较大,可以认为两总体分布近似正态,因此选用两独立样本体分布近似正态,因此选用两独立样本T检验来检验二者是检验来检验二者是否存在显著差异。在创建的文件中需要两个变量,一个是自否存在显著差异。在创建的文件中需要两个变量,一个是自变量,即本案例中的变量,即本案例中的性别性别;另一个是因变量,即本案例中;另一个是因变量,即本案例中的的消费金额消

45、费金额。1 1操作操作过过程程(1)创创建建数数据文件:据文件:将调查获将调查获得得数数据据输输入入数数据文件中,部分据文件中,部分数数据如下所示,据如下所示,单单位(元)。位(元)。 注:注:性性别别一一栏栏中中1代表女生,代表女生,2代表男生。代表男生。(2)打)打开开主主对话对话框:框:选择选择分析分析|比比较较均均值值|独独立立样样本本T检验检验命令,打命令,打开开独独立立样样本本T检验检验主主对话对话框。框。(3)选择变选择变量:量:从从左左边边的的变变量列表框中量列表框中选择选择“消消费费”作作为检验为检验变变量,量,单击单击上方箭上方箭头头按按钮钮 ,将将其移入其移入“检验变检验

46、变量量”列表框中。列表框中。从变从变量列表框中量列表框中选择选择“性性别别”作作为为分分组变组变量,量,单击单击下方箭下方箭头头按按钮钮 ,将将其移入其移入“分分组变组变量量”列表框中,如下列表框中,如下图图所示。所示。(4)定)定义义分分组变组变量:量:单击单击“定定义组义组”按按钮钮,弹弹出出“定定义组义组”对对话话框,在默框,在默认认的的“使用指定使用指定值值”单选单选按按钮钮下,在下,在“组组1”文本框文本框中中填填1(代表女生),在(代表女生),在“组组2”文本框中文本框中填填2(代表男生),(代表男生),如下如下图图所示。所示。(5)设设置完成后,置完成后,单击单击继续继续按按钮钮

47、返回返回独独立立样样本本T检验检验主主对话对话框,框,单击单击确定确定按按钮钮,执执行操作,行操作,输输出出结结果。果。2 2、结结果分析果分析(1)描述性)描述性统计统计量表:量表:该该表格分表格分别别呈呈现现了分了分组变组变量的量的简单简单描描述性述性统计统计量,包括量,包括参与检验数参与检验数据的据的个个案案数数(N)、均)、均值值、标标准准差和均差和均值值的的标标准准误误。如下表所示,是。如下表所示,是对对分析分析变变量量性性别别的的简简单单描述描述统计统计。从从表中可以看出表中可以看出随随机抽取的女生机抽取的女生样样本容量本容量为为1 3 1 , 平 均 消, 平 均 消 费费 金金

48、 额额 是是 1 8 1 7 . 2 2 1 4 , 标标 准 差 是准 差 是338.69831,标标准准误误是是29.59221。读读者同者同样样也可以看出也可以看出男生男生样样本相本相关关描述性描述性统计统计量。量。(2)独独立立样样本本T检验结检验结果果报报表:表:该该表呈表呈现现的是的是对两独对两独立立样样本本进进行行T检验检验的的结结果,包括方差果,包括方差齐齐性性检验检验的的F值值和和概概率,率,T检验检验的的t值值、自由度(、自由度(df)和)和检验检验的的概概率,均率,均值值的差的差值值,标标准准误误差差值值和差分的和差分的95%置信置信区间区间。如下表所示,是。如下表所示,

49、是对对男生男生组组和女生和女生组组的消的消费费金金额进额进行行独独立立样样本本T检验检验的的结结果。果。4.5 4.5 两配对样本两配对样本t t检验检验 两样两样本平均本平均数数差差异检验异检验,根据,根据两个样两个样本本数数据之据之间间是是够够有有关关联联性,分性,分为独为独立立样样本和配本和配对样对样本。本。独独立立样样本是指本是指两个样两个样本本的的数数据之据之间没间没有有关联关联性,而配性,而配对样对样本,也本,也称称相相关样关样本,是本,是指指两个样两个样本的本的数数据之据之间间存在一一存在一一对应对应的的关关系。系。两个样两个样本中本中的一的一对数对数据是有某据是有某种关联种关联

50、性的。例如在配性的。例如在配对组实验对组实验中或在中或在对对同一同一样样本前本前测测后后测实验测实验中中获获得的得的数数据。本据。本节将对节将对配配对样对样本本t t检验检验的一些的一些统计统计原理和在原理和在SPSS18.0SPSS18.0中的操作中的操作进进行介行介绍绍。4.5.1 4.5.1 两配对样本两配对样本t t检验的主要功能检验的主要功能 两两配配对样对样本本t t检验检验是是对两个对两个配配对样对样本的平均本的平均数数之之间进间进行差行差异检验异检验。配。配对样对样本一般本一般来来自配自配对组对组或是同或是同对对一一个样个样本的本的两两次施次施测测,而配,而配对组对组是可以是可

51、以认为认为是是两个两个同同质质的的组组,因此,因此来来自自配配对组对组的的两个数两个数据也是有据也是有关联关联的。的。4.5.2 4.5.2 两配对样本两配对样本t t检验的适用条件检验的适用条件 对两对两配配对样对样本本进进行平均行平均数数差差异检验异检验,需要考,需要考虑数虑数据的各据的各种种条条件,如件,如两总两总体是否正体是否正态态分布,分布,两总两总体方差是否已知以及体方差是否已知以及相相关关系系数数是否已知,是否已知,从从而而选择选择合适的合适的检验检验的方法。的方法。与两独与两独立立样样本差本差异检验异检验不同,不同,两两配配对样对样本差本差异检验异检验不用事先不用事先进进行行方

52、差方差齐齐性性检验检验,因,因为为配配对样对样本的本的数数据是成据是成对数对数据,可以据,可以认认为为方差一致。方差一致。 4.5.3 4.5.3 两配对样本两配对样本t t检验的操作过程检验的操作过程 在在SPSSSPSS中进行两配对样本中进行两配对样本t t检验的操作过程如下:检验的操作过程如下:(1 1)打开或创建)打开或创建SPSSSPSS数据文件。数据文件。(2 2)打开主对话框:选择)打开主对话框:选择“分析分析”| “| “比较均值比较均值”| “| “配对样配对样本本T T检验检验”命令,打开命令,打开“配对样本配对样本T T检验检验”主对话框,如图所示主对话框,如图所示。(3

53、 3)选择变量:对话框左边是源变量框,右边是)选择变量:对话框左边是源变量框,右边是“成对变量成对变量”列列表框,该列表框中,表框,该列表框中,“对对”下显示的是配对组的序号,下显示的是配对组的序号,Variable Variable 1 1和和Variable 2Variable 2下将分别显示选中的配对的两个变量名。在左边下将分别显示选中的配对的两个变量名。在左边的源变量框中单击选中参与配对的一个变量名,单击中间的箭的源变量框中单击选中参与配对的一个变量名,单击中间的箭头按钮,使变量进入头按钮,使变量进入“成对变量成对变量”列表框中。该变量名将出现在列表框中。该变量名将出现在“成对变量成对

54、变量”列表框中的第一组配对组的列表框中的第一组配对组的Variable 1Variable 1下。再从左边下。再从左边的源变量框中选中另一个参与配对的变量名,单击箭头按钮,的源变量框中选中另一个参与配对的变量名,单击箭头按钮,该变量名将出现在该变量名将出现在“成对变量成对变量”列表框中的第一组配对组的列表框中的第一组配对组的Variable 2Variable 2下。下。 当第一组变量配对完成后,当第一组变量配对完成后,成对变量成对变量列表框中的列表框中的对对下自动下自动跳出第二组的序号。可以根据需要依照上述方法指定多组配对跳出第二组的序号。可以根据需要依照上述方法指定多组配对变量。变量。(4 4)设置置信度、选择缺失值处理方法:单击)设置置信度、选择缺失值处理方法:单击“选项选项”按钮,弹出按钮,弹出“选项选项”对话框。如图所示。对话框。如图所示。(5 5)执行操作:设置完成后,单击)执行操作:设置完成后,单击“继续继续”按钮返回独立样本按钮返回独立样本t t检检验主对话框,单击验主对话框,单击“确定确定”按钮,执行操作,输出结果。按钮,执行操作,输出结果。4.5.4 4.5.4 实例分析:各地区私营企业中来自城镇和乡村的员工数实例分析:各地区私营企业中来自城镇和乡村的员工数 假设一次全国范围内的调查,统计各地区私营企

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论