第五章 均值比较与T检验_第1页
第五章 均值比较与T检验_第2页
第五章 均值比较与T检验_第3页
第五章 均值比较与T检验_第4页
第五章 均值比较与T检验_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1第五章均值比较与均值比较与T T检验检验2主要内容主要内容5.1 统计推断与假设检验统计推断与假设检验5.2 Means过程过程5.3 单样本单样本T检验检验5.4 两独立样本两独立样本T检验检验5.5 两配对样本两配对样本T检验检验35.1 统计推断与假设检验统计推断与假设检验1、参数检验利用样本数据对总体特征的推断通常有两种情况:(1)当总体分布已知(如总体为正态分布)的情况下,对总体包含的参数进行推断的问题称为参数检验;(2)当总体分布未知的情况下,根据样本数据对总体的分布形式或特征进行推断,通常采用的统计推断方法是非参数检验方法。45.1 统计推断与假设检验统计推断与假设检验1、参数

2、检验均值比较(Means),用于计算指定变量的综合描述统计量; 单样本T检验(One-Sample T Test),检验单个变量的均值与假设检验值之间是否存在差异; 独立样本T检验(Independent Sample T Test),用于检验两组来自独立总体的样本,其独立总体的均值或中心位置是否一样; 配对样本T检验(Paired-Sample T Test),用于检验两个相关的样本是否来自具有相同均值的总体。 Compare Means子菜单 55.1 统计推断与假设检验统计推断与假设检验2、假设检验的几个概念(1)统计假设原假设原假设:在很多情况下,我们给出一个统计假设仅仅是为了拒绝它。

3、例如,如果我们要判断给定的一枚硬币是否均匀,则我们假设硬币是均匀的(即p=0.5,其中p是正面出现的概率)类似地,如果我们要判断一种方法是否优于其他的方法,则我们假设两种方法之间没有差异。这样的假设通常称为零假设或原假设,记为备择假设备择假设:任何不同于零假设的假设都称为备择假设。例如,如果零假设是 ,则备择假设是 。备择假设记为 。 0H0H0.5p 0.5p 1H0H65.1 统计推断与假设检验统计推断与假设检验2、假设检验的几个概念(2)假设检验的两类错误第一类错误:在假设检验中拒绝了本来是正确的零假设,称为“弃真”错误 。第二类错误:在假设检验中没有拒绝本来是错误的零假设,称为“取伪”

4、错误 。 0H0H75.1 统计推断与假设检验统计推断与假设检验2、假设检验的几个概念(3) 显著性水平 在作假设检验时,我们犯第一类错误的最大概率称为检验的显著性水平。这个概率常记为,通常抽样前就指定好,这样得到的结果才不会影响我们的选择。 在实际问题中,显著性水平可以有多种选择,但最为普通的是0.05或0.01。例如,如果设计一个决策法则选择的显著性水平是0.05(5%),那么在100次中可能有5次机会使我们拒绝本该接受的假设。也就是说,我们大约有95%的把握作出正确的决策。此时,我们说拒绝假设的显著性水平为0.05,即犯拒绝本应接受的假设这类错误的概率是0.05。 0H0H85.1 统计

5、推断与假设检验统计推断与假设检验2、假设检验的几个概念(4) 概率p值 p值是当零假设正确时,观测到的样本信息出现的概率。如果这个概率很小,以至于几乎不可能在零假设正确时出现目前的观测数据时,我们就拒绝零假设。p值越小,拒绝零假设的理由就越充分。但怎样的p值才算“小”呢?通常是与预先设定的显著性水平 值比较,若 值为0.05,p值小于0.05则认为该概率值足够小,应拒绝零假设。0H0H95.1 统计推断与假设检验统计推断与假设检验3、假设检验的基本步骤第1步 给出检验问题的原假设; 根据检验问题的要求,将需要检验的最终结果作为零假设。例如,需要检验某学校的高考数学平均成绩是否同往年的平均成绩一

6、样,都为75,由此可做出零假设,第2步 选择检验统计量; 在统计推断中,总是通过构造样本的统计量并计算统计量的概率值进行推断,一般构造的统计量应服从或近似服从常用的已知分布,例如均值检验中最常用的t分布和F分布等。0H0H0:75H105.1 统计推断与假设检验统计推断与假设检验3、假设检验的基本步骤第3步 计算检验统计量的观测值及其发生的概率值; 在给定零假设前提下,计算统计量的观测值和相应概率p值。概率p值就是在零假设 成立时检验统计量的观测值发生的概率,该概率值间接地给出了样本值在零假设成立的前提下的概率,对此可以依据一定的标准来判断其发生的概率是否为小概率。第4步 在给定显著性水平条件

7、下,做出统计推断结果。 这里的显著性水平指的是当假设正确时被拒绝的概率,即弃真概率,一般取0.01或0.05。当检验统计量的概率p值小于显著性水平时,则认为此时拒绝零假设而犯弃真错误的概率小于显著性水平,即低于预先给定的水平,也就是说犯错误的概率小到我们能容忍的范围,这时可以拒绝零假设;反之,如果检验统计量的概率p值大于显著性水平,如果拒绝零假设,犯弃真错误的概率大于预先给定的容忍水平,这时不应该拒绝零假设。0H0H11主要内容主要内容5.1 统计推断与假设检验统计推断与假设检验5.2 Means过程过程5.3 单样本单样本T检验检验5.4 两独立样本两独立样本T检验检验5.5 两配对样本两配

8、对样本T检验检验125.2 Means过程过程1、Means过程的主要功能 Means过程即均值过程,其主要功能是分组计算,比较指定变量的描述性统计量包括均值、标准差、总和、观测量数、方差等一系列单变量描述性统计量,还可以给出方差分析表和线性检验结果。 均值过程中系统默认的描述统计量可按分组给出指定变量的均值、标准差、观测量数等,对话框中的选项可以给出其他更加丰富的描述统计量。0H0H135.2 Means过程过程2、Means过程的操作界面 0H0H选择待分析的变量。在该选项组中定义分组变量,主要包括以下几项:Independent List文本框:选择分组变量。可定义多层分组变量,每层分组

9、变量中也可以有多个变量;Previous按钮:选择前一层的分组变量;Next按钮:选择下一层的分组变量。单击该按钮,弹出如图5-2所示的options子对话框。 图5-1145.2 Means过程过程2、Means过程的操作界面 0H0H图5-2 Option 按钮Statistics文本框:在该文本框中列出可以选择的描述性统计量,这些统计量的具体含义同描述性统计分析中的统计量含义一样 。Cell Statistics文本框:列出要输出的统计量。默认输出Mean(均值)、Number of Cases(观测量数)和Standard Deviation(标准差);Statistics for F

10、irst Layer选项组:该选项组定义是否进行分组第一层变量的方差分析(Anova table and eta)和线性检验(Test for linearity)。 155.2 Means过程过程3、实例分析【例5-1】表5.1是各地区分性别受教育程度的人口数量,利用均值过程比较受教育程度是否受性别的影响。 0H0H165.2 Means过程过程3、实例分析第1步 数据组织; 根据表5.1生成SPSS数据文件,建3个变量:“sex”、“edu”、“num”, 数据文件的部分数据如图5-3所示。0H0H图5-3175.2 Means过程过程3、实例分析第2步 打开主对话框;选择Analyze

11、Compare Means Means,打开同图5-1一样的均值过程主对话框。第3步 确定要进行均值比较的变量;在图5-1的对话框中,从左边的候选变量列表框中选择“人口数量(num)”变量,移入Dependent List文本框中,表示对该变量进行均值比较分析。第4步 确定分组变量;分组变量可以有几层,选择“性别(sex)”变量作为第一层分组变量,将其移入Independent List文本框中。0H0H185.2 Means过程过程3、实例分析第5步 确定输出的统计量;单击图5-1上的Options按钮,弹出如图5-2所示的子对话框,选择Anova table and eta复选框,进行方差

12、分析,单击Continue按钮,返回主对话框。0H0H195.2 Means过程过程3、实例分析结果分析0H0H205.2 Means过程过程3、实例分析结果分析0H0H表5.4是性别的单因素方差分析,在下一章会详细介绍方差分析,此处不再详细讲述。表中的Sig.值远大于0.05,说明不同性别受教育的人口数量没有显著性差异。 215.2 Means过程过程3、实例分析结果分析0H0H表5.5是人口数量与性别的相关性度量表。此时的Eta和Eta Squared取值都很小,说明性别和受教育的人口数量的相关性很差,这也和单因素方差分析表的结论是一致的。 22主要内容主要内容5.1 统计推断与假设检验统

13、计推断与假设检验5.2 Means过程过程5.3 单样本单样本T检验检验5.4 两独立样本两独立样本T检验检验5.5 两配对样本两配对样本T检验检验235.3 单样本单样本T检验检验1、单样本T检验目的和步骤(1)单样本)单样本T检验的目的检验的目的 单样本T检验的目的是利用来自某总体的样本数据,推断该总体的均值是否与指定的检验值之间存在显著性差异。它是对总体均值的假设检验。 例如,从新生的入学成绩的抽样数据推断平均成绩是否为75分;在人口普查中,某地区职工今年的平均收入是否和往年的平均收入有显著差异。0H0H245.3 单样本单样本T检验检验1、单样本T检验目的和步骤(2)单样本)单样本T检

14、验的步骤检验的步骤第第1步步 提出零假设;提出零假设;单样本T检验需要检验总体均值与指定的检验值是否存在显著差异。为此,给出检验均值为 ,零假设为: ,其中, 为总体均值。例如,假设储户一次平均存(取)款金额与2000元无显著性差异,零假设则为: 。0H0H0002000255.3 单样本单样本T检验检验1、单样本T检验目的和步骤(2)单样本)单样本T检验的步骤检验的步骤第第2步步 选择检验统计量;选择检验统计量;单样本单样本T检验的前提是总体服从正态分布检验的前提是总体服从正态分布 ,其中 为总体均值, 为总体方差 。如果样本容量为n,样本均值为 ,则 仍服从正态分布,即: 。在零假设成立的

15、条件下,均值检验使用t统计量,构造的t统计量为: ,其中, 用 代入,t统计量服从自由度为n-1的t分布,S为样本标准差。SPSS的操作结果中还显示均值标准误差(Std.Error Mean),计算公式为: ,即统计量的分母部分。0H0H2( ,)N 2XX2( ,)XNn/XtSn0Sn265.3 单样本单样本T检验检验1、单样本T检验目的和步骤(2)单样本)单样本T检验的步骤检验的步骤第第3步步 计算检验统计量的观测值及其发生的概率;计算检验统计量的观测值及其发生的概率; 在给定零假设的前提下,SPSS将检验值代入t统计量,得到检验统计量观测值以及根据t分布的分布函数计算出概率p值。第第4

16、步步 给定显著性水平,做出统计推断。给定显著性水平,做出统计推断。 给出显著性水平 ,与检验统计量的概率p值作比较。当检验统计量的概率p值小于显著性水平时,则拒绝零假设,认为总体均值与要检验的 之间存在差异;反之,如果检验统计量的概率p值大于显著性水平,则接受零假设,认为总体均值与检验值 之间无显著性差异。0H0H00275.3单样本单样本T检验检验2、单样本T检验的操作界面0H0H从候选变量框中选择要进行T检验的变量移入此框中,可同时选择多个变量,此时,SPSS就将分别产生多个变量的T检验分析结果。 在此框中输入检验值,即检验与什么值有无显著性差异。 单击该按钮 弹出Option对话框,该对

17、话框用于指定置信水平和缺失值的处理方法 图5-3285.3 单样本单样本T检验检验3、实例分析【例5-2】某生产食盐的生产线,其生产的袋装食盐的标准重量为500g,现随机抽取10袋,其重量分别为:495,502,508,496,505,499,503,498,505,500。假设数据呈正态分布,请检验生产线的工作情况。第1步 数据组织;首先建立SPSS数据文件,只需建立一个变量“Weight”,录入相应的数据即可。0H0H295.3 单样本单样本T检验检验3、实例分析第2步 打开主对话框; 选择Analyze Compare Means One-Sample T Test ,打开同图5-3一样

18、的单样本T检验主对话框。第3步 确定要进行T检验的变量; 在图5-3所示的对话框中,选择“Weight”变量作为检验变量,移入“Test Variable(s)”框中。第4步 输入要检验的值; 在图5-4的对话框中的“Test value”中输入要检验的值,本例应输入500。0H0H305.3 单样本单样本T检验检验3、实例分析结果分析0H0H315.3 单样本单样本T检验检验3、实例分析结果分析0H0H 表5.7是单样本T检验结果表,第一行的Test Value为检验参数值500,即用于比较的总体均值,下面从左至右依次为检验统计量(t)、自由度(df)、双尾检测概率P值(Sig.(2-tai

19、led))、样本均值与和检验值的差(Mean Difference)、均值差的95%置信区间(95%Confidence Interval of the Difference)。 当置信水平为95%时,显著性水平为0.05,从表5.7中可以看出,双尾检测概率P值为0.432,大于0.05,故零假设成立,也就是说抽样袋装食盐的重量与500克无显著性差异,有理由相信生产线工作状态正常。 32主要内容主要内容5.1 统计推断与假设检验统计推断与假设检验5.2 Means过程过程5.3 单样本单样本T检验检验5.4 两独立样本两独立样本T检验检验5.5 两配对样本两配对样本T检验检验335.4 两独立

20、样本两独立样本T检验检验1、两独立样本T检验目的和主要步骤(1)两独立样本)两独立样本T检验的目的检验的目的单样本T检验是检验样本均值和总体均值是否有显著性差异,而两独立样本T检验的目的是利用来自某两个总体的独立样本,推断两个总体的均值是否存在显著差异。例如,为比较两种牧草对奶牛的饲养效果,随机从奶牛群中选取喂养不同牧草的奶牛各10头记录每日平均产奶的量,根据记录的数据推断两种牧草对奶牛饲养的效果有无显著性差异。0H0H345.4 两独立样本两独立样本T检验检验1、两独立样本T检验目的和主要步骤(2)两独立样本)两独立样本T检验的主要步骤检验的主要步骤第第1步步 提出零假设;提出零假设;两独立

21、样本T检验需要检验两个总体的均值是否存在显著性差异。因此,零假设 为: ,即假设两样本均值相等,备择假设为: ,即假设两样本均值不等。0H0H0H1212355.4 两独立样本两独立样本T检验检验1、两独立样本T检验目的和主要步骤(2)两独立样本)两独立样本T检验的主要步骤检验的主要步骤第第2步步 选择检验统计量;选择检验统计量; 两独立样本T检验的前提是两个独立的总体分别服从 和 。在零假设成立的条件下,独立样本T检验使用t统计量。构造独立样本T检验的t统计量分为两种情况。1)当样本方差相等时,t统计量定义为:其中 和 分别为两样本容量, 和 分别为两样本标准差。该统计量服从自由度为 的t分

22、布。 0H0H2(,)xxN 2(,)yyN 121212()11XXtSnn1n2n1S2S122nn222112212(1)(1)2nSnSSnn365.4 两独立样本两独立样本T检验检验1、两独立样本T检验目的和主要步骤(2)两独立样本)两独立样本T检验的主要步骤检验的主要步骤第第2步步 选择检验统计量;选择检验统计量; 2)当样本方差不等时,t统计量定义为:可见,两独立样本T检验的结论在很大程度上取决于两个总体的方差是否相等。这就要求在检验两总体均值是否相等之前,首先应对两总体方差是否相等进行检验,也称之为方差齐性检验。 0H0H1212221212()XXtSSnn375.4 两独立

23、样本两独立样本T检验检验1、两独立样本T检验目的和主要步骤(2)两独立样本)两独立样本T检验的主要步骤检验的主要步骤第第3步步 计算检验统计量的观测值及其发生的概率;计算检验统计量的观测值及其发生的概率; 在给定零假设的前提下,在给定零假设的前提下,SPSS将检验值将检验值0代入代入t统计量的统计量的 部分,部分,得到检验统计量观测值以及根据得到检验统计量观测值以及根据t分布的分布函数计算出概率分布的分布函数计算出概率p值。值。第第4步步 给定显著性水平,做出统计推断。给定显著性水平,做出统计推断。 给出显著性水平,与检验统计量的概率给出显著性水平,与检验统计量的概率p值作比较。当检验统计量的

24、概值作比较。当检验统计量的概率率p值小于显著性水平时,则拒绝零假设,认为两个总体均值之间存在差值小于显著性水平时,则拒绝零假设,认为两个总体均值之间存在差异;反之,如果检验统计量的概率异;反之,如果检验统计量的概率p值大于显著性水平,则接受零假设,值大于显著性水平,则接受零假设,认为两个总体均值之间无显著性差异。认为两个总体均值之间无显著性差异。0H0H0H12385.4 两独立样本两独立样本T检验检验2、两独立样本T检验的操作界面0H0H从候选变量框中选择要进行T检验的变量移入此框中,图5-4选择分组变量,在选择变量进入Grouping Variable框后,Define Groups按钮将

25、被激活 ,单击该按钮定义分组信息单击该按钮 弹出Option对话框,该对话框用于指定置信水平和缺失值的处理方法 395.4 两独立样本两独立样本T检验检验3、实例分析【例5-3】为比较两种不同品种的玉米的产量,分别统计了8个地区的单位面积产量,具体数据见表5.8。假定样本服从正态分布,且两组样本相互独立,试比较在置信度为95%的情况下,两种玉米产量是否有显著性差异。 0H0H405.4 两独立样本两独立样本T检验检验3、实例分析第第1步步 数据组织;数据组织;根据表5.8,SPSS数据文件中建立两个变量,分别为“品种”、“产量”,变量“品种”的变量值标签为:a-品种A,b-品种B,录入数据即可

26、。第第2步步 打开主对话框;打开主对话框;选择Analyze Compare Means Independent-Samples ,打开同图5-4一样的两独立样本T检验主对话框。0H0H415.4 两独立样本两独立样本T检验检验3、实例分析第第3步步 确定要进行确定要进行T检验的变量;检验的变量;在图在图5-4所示的对话框中,选择所示的对话框中,选择“产量产量”变量作为检验变量,变量作为检验变量,移入移入“Test Variable(s)”框中。框中。第第4步步 确定分组变量;确定分组变量;选择变量选择变量“品种品种”作为分组变量,将其移入图作为分组变量,将其移入图5-4中的中的“Groupi

27、ng variable”文本框中,并定义分组的变量值:文本框中,并定义分组的变量值:Group1a,Group2b。0H0H425.4 两独立样本两独立样本T检验检验3、实例分析结果分析结果分析0H0H435.4 两独立样本两独立样本T检验检验3、实例分析结果分析结果分析0H0H 在方差相等的情况下,两独立样本T检验的结果应该看表5.10中的“Equal variances assumed”一行,第5列为相应的双尾检测概率(Sig.(2-tailed)为0.332,在显著性水平为0.05的情况下,T统计量的概率p值大于0.05,故不应拒绝零假设,,即认为两样本的均值是相等的,在本例中,不能认为

28、两种玉米品种的产量有显著性差异。 44主要内容主要内容5.1 统计推断与假设检验统计推断与假设检验5.2 Means过程过程5.3 单样本单样本T检验检验5.4 两独立样本两独立样本T检验检验5.5 两配对样本两配对样本T检验检验455.5 两配对样本两配对样本T检验检验1、两配对样本T检验目的和主要步骤(1)两配对样本)两配对样本T检验目的检验目的 两配对样本T检验的目的是检验两个相关样本是否来自相同均值的正态总体,即推断两个总体的均值是否存在显著差异。 配对的概念是指两个样本的各样本值之间存在着对应关配对的概念是指两个样本的各样本值之间存在着对应关系,配对样本的两个样本值之间的配对是一一对

29、应的,并且系,配对样本的两个样本值之间的配对是一一对应的,并且两个样本的容量相同。配对样本两个样本的容量相同。配对样本T检验与独立样本检验与独立样本T检验的差检验的差别之一是要求样本是配对的。所谓配对样本可以是个案在别之一是要求样本是配对的。所谓配对样本可以是个案在“前前”“”“后后”两种状态下某属性的两种状态,也可以是对某两种状态下某属性的两种状态,也可以是对某事物两个不同侧面或方面的描述。其差别在于抽样不是相互事物两个不同侧面或方面的描述。其差别在于抽样不是相互独立的,而是互相关联的。独立的,而是互相关联的。0H0H465.5 两配对样本两配对样本T检验检验1、两配对样本T检验目的和主要步

30、骤(2)两配对样本)两配对样本T检验主要步骤检验主要步骤第第1步步 提出零假设;提出零假设; 配对样本T检验需要检验两个总体均值是否存在显著性差异,其零假设为 ,其中, 和 分别为第一个总体和第二个总体的均值。第第2步步 选择检验统计量;选择检验统计量; 在配对样本T检验中,设 、 分别为配对样本。其样本差值 ,此时检验统计量为:其中 为 的均值,S为 的标准差,n为样本数,当 时,t统计量服从自由度为n-1的t分布。 0H0H012:0H121ix2(1)ixin 12iiidxx12()/dtSndidid120475.5 两配对样本两配对样本T检验检验1、两配对样本T检验目的和主要步骤(

31、2)两配对样本)两配对样本T检验主要步骤检验主要步骤第第3步步 计算检验统计量的观测值及其发生的概率;计算检验统计量的观测值及其发生的概率; 该步骤的目的是计算t统计量的观测值以及相应的概率p值。SPSS将计算两组样本的差值,并将相应数据代入上式的t检验统计量计算公式中,计算出t统计量的观测值和对应的概率p值。第第4步步 给出显著性水平给出显著性水平 ,并做出统计推断结果,并做出统计推断结果。 给出显著性水平 ,与检验统计量的概率p值作比较。如果概率p值小于显著性水平 ,则应拒绝零假设,认为差值的总体均值与0有显著不同,两总体的均值有显著差异;反之,如果概率p值大于显著性水平 ,则不应拒绝零假

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论