SPSS统计分析第4章参数估计与假设检验新_第1页
SPSS统计分析第4章参数估计与假设检验新_第2页
SPSS统计分析第4章参数估计与假设检验新_第3页
SPSS统计分析第4章参数估计与假设检验新_第4页
SPSS统计分析第4章参数估计与假设检验新_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章均值比较与均值比较与T T检验检验主要内容主要内容4.1 假设检验假设检验4.2 平均值分析平均值分析4.3 单样本单样本T检验检验4.4 独立样本独立样本T检验检验4.5配对样板配对样板T检验检验4.1 假设检验假设检验点估计简介点估计简介1.基本概念基本概念 点估计用样本统计量的值直接作为总体参数的估计值。如用样本均值直接作为总体均值的估计值,用样本方差直接作为总体方差的估计值等。2.2.常用的点估计方法常用的点估计方法(1)矩估计法(2)极大似然估计法(3)稳健估计法4.1 假设检验假设检验区间估计简介区间估计简介 因为点估计直接用样本估计值作为总体参数的估计值,没有提供关于估计精

2、度的任何信息,存在抽样标准误差,故提出了未知参数的区间估计法。 给出两个数,指出总体参数以一定概率位于两数所确定的区间内,这种估计叫做参数的区间估计。区间估计是在点估计的基础上,给出总体参数估计的一个范围,所以区间估计相对于点估计更加精确,要优于点估计。4.1 统计推断与假设检验统计推断与假设检验SPSS实例分析实例分析【例【例4 4-1-1】 从一个正态总体中随机抽取容量为8的样本,各样本值分别为10,8,12,15,6,13,5,11;求总体均值在95%的置信区间。分析:分析:这是一个求总体均值的区间估计问题,进行总体均值的区间估计可以采用探索分析或单样本T检验,本例中采用探索分析,具体分

3、析步骤同例4-3。4.1假设检验假设检验基本概念及统计原理基本概念及统计原理1.1.统计假设统计假设原假设:原假设:被检验的假设,通过检验可能被接受,也可能被否定;在很多情况下,我们给出一个统计假设仅仅是为了拒绝它。例如,如果我们要判断给定的一枚硬币是否均匀,则假设硬币是均匀的(即p=0.5,其中p是正面出现的概率);类似地,如果我们要判断一种方法是否优于其他的方法,则假设两种方法之间没有差异。这样的假设通常称为零假设或原假设,记为 。备择假设:备择假设:与原假设对应的假设,只有在原假设被否定后才可接受的假设;例如,如果零假设是 ,则备择假设是 。备择假设记为 。拒绝域、临界点:拒绝域、临界点

4、:当检验统计量取某个区域中的值时,拒绝原假设,则称该取值区域为拒绝域,称拒绝域的边界点为临界点。0.5p 0.5p 1H0H4.1 假设检验假设检验基本概念及统计原理基本概念及统计原理2.2.显著性水平与置信水平显著性水平与置信水平显著性水平显著性水平: :在作假设检验时,我们犯第一类错误的最大概率称为检验的显著性水平。这个概率常记为,通常抽样前就指定好,这样得到的结果才不会影响我们的选择。 在实际问题中,显著性水平可以有多种选择,但最为普通的是0.05或0.01。例如,如果设计一个决策法则选择的显著性水平是0.05(5%),那么在100次中可能有5次机会使我们拒绝本该接受的假设。也就是说,我

5、们大约有95%的把握作出正确的决策。此时,我们说拒绝假设的显著性水平为0.05,即犯拒绝本应接受的假设这类错误的概率是0.05。置信水平:置信水平:1- 为置信度或置信水平;4.1 假设检验假设检验基本概念及统计原理基本概念及统计原理3.3.假设检验的两类错误假设检验的两类错误第一类错误:第一类错误:在假设检验中拒绝了本来是正确的原假设。第二类错误:第二类错误:在假设检验中没有拒绝错误的原假设。4 4概率概率P P值值 P值是当原假设正确时,观测到的样本信息出现的概率。通常用P值与预先设定的显著性水平值比较,若P值小于显著性水平,则认为该概率值足够小,应拒绝原假设。5 5单侧检验与双侧检验单侧

6、检验与双侧检验双侧检验双侧检验:只强调差异而不强调方向性的检验叫双侧检验。单侧检验:单侧检验:强调某一方向的检验叫单侧检验。4.1 假设检验假设检验小概率事件原理小概率事件原理 在概率论中我们把发生概率小到接近于0的事件称为小概率事件(即在大量重复试验中出现的频率非常低)。 在统计学上,把小概率事件看成在一次特定的抽样中不可能发生的事件,称为“小概率事件实际不可能原理”。这是统计学上进行假设检验(显著性检验)的基本依据。根据这一原理,若某事件在理论上被认为在原假设成立的情况下是个小概率事件,它不会出现,而在实际中出现了,我们就推翻原来的假设,认为原假设不成立,从而接受备择假设。4.1 假设检验

7、假设检验假设检验的一般步骤假设检验的一般步骤第第1 1步步 给出检验问题的原假设;给出检验问题的原假设; 根据检验问题的要求,将需要检验的最终结果作为零假设。例如,需要检验某学校的高考数学平均成绩是否同往年的平均成绩一样,都为75,由此可做出零假设,第第2 2步步 选择检验统计量;选择检验统计量; 在统计推断中,总是通过构造样本的统计量并计算统计量的概率值进行推断,一般构造的统计量应服从或近似服从常用的已知分布,例如均值检验中最常用的t分布和F分布等。 第第3 3步步 规定显著性水平规定显著性水平; ;0:75H4.1 假设检验假设检验假设检验的一般步骤假设检验的一般步骤第第4 4步步 计算检

8、验统计量的观测值及其发生的概率值;计算检验统计量的观测值及其发生的概率值; 在给定零假设前提下,计算统计量的观测值和相应概率p值。概率p值就是在零假设 成立时检验统计量的观测值发生的概率,该概率值间接地给出了样本值在零假设成立的前提下的概率,对此可以依据一定的标准来判断其发生的概率是否为小概率。4.1 假设检验假设检验假设检验的一般步骤假设检验的一般步骤第第5 5步步 在给定显著性水平条件下,做出统计推断结果。在给定显著性水平条件下,做出统计推断结果。 这里的显著性水平指的是当假设正确时被拒绝的概率,即弃真概率,一般取0.01或0.05。当检验统计量的概率p值小于显著性水平时,则认为此时拒绝零

9、假设而犯弃真错误的概率小于显著性水平,即低于预先给定的水平,也就是说犯错误的概率小到我们能容忍的范围,这时可以拒绝零假设;反之,如果检验统计量的概率p值大于显著性水平,如果拒绝零假设,犯弃真错误的概率大于预先给定的容忍水平,这时不应该拒绝零假设。 4.1 假设检验假设检验参数检验简介参数检验简介 参数检验的总体分布形式是已知的或假定的,只是一些参数的取值或范围未知,分析的主要目的是估计参数的取值范围,或对其进行某种统计检验。如正态总体的均值是否与某个值存在显著差异,两个总体的均值是否有显著差异等。主要包括: 单样本T检验:检验单个变量的均值与假设检验值之间是否存在差异; 独立样本T检验:检验两

10、组来自独立总体的样本,其独立总体的均值或中心位置是否一样; 配对样本T检验:检验两个相关的样本是否来自具有相同均值的总体。 4.1 假设检验假设检验非参数检验简介非参数检验简介 非参数检验是在总体分布未知的情况下,利用样本数据对总体分布形态等进行推断的方法,在推断过程中不涉及有关总体分布的参数,而是检验总体某些有关的性质,如总体的分布位置、分布形状之间的比较等。 与参数检验的原理相同,非参数检验过程也是先根据问题提出原假设,然后利用统计学原理构造出适当的统计量,最后利用样本数据计算统计量的概率P值,与显著性水平进行比较,得出拒绝或者接受原假设的结论。 非参数检验包括单样本(O)、独立样本(I)

11、、相关样本(R)的非参数检验。 4.1 假设检验假设检验参数检验及非参数检验比较参数检验及非参数检验比较 1参数检验和非参数检验的区别 参数检验和非参数检验最本质的区别是:参数检验需要事先确定或假定总体的分布,非参数检验则不需要假定总体的分布,而是直接用样本来推断总体的分布。 除此之外,二者之间还可以从很多方面来区分。研究的对象和目标不同。 研究的统计量有所不同。 主要内容主要内容4.1 假设检验假设检验4.2 平均值分析平均值分析 4.3 单样本单样本T检验检验4.4 独立样本独立样本T检验检验4.5配对样板配对样板T检验检验与第三章中的“描述统计 ”中计算某一样本总体均值相比,平均值分析可

12、以对样本进行分组计算。例 各地区分性别受教育程度的人口数量,数据见data4-0.sav 4.2 平均值分析平均值分析主要内容主要内容4.1 假设检验假设检验4.2 平均值分析平均值分析4.3 单样本单样本T检验检验4.4 独立样本独立样本T检验检验4.5配对样板配对样板T检验检验 4.3 单样本单样本T检验检验4.3.1 基本概念及统计原理基本概念及统计原理1.单样本单样本T检验的概念检验的概念 单样本T检验利用来自某总体的样本数据,推断该总体的均值与指定的检验值之间是否存在显著性差异,它是对总体均值的假设检验。 为此,给出检验均值 ,原假设: = ,其中 为总体均值,即认为总体均值与检验值

13、 之间无显著性差异。 。 例如,从新生的入学成绩的抽样数据推断平均成绩是否为75分;在人口普查中,某地区职工今年的平均收入是否和往年的平均收入有显著差异。0004.3 单样本单样本T检验检验4.3.1 基本概念及统计原理基本概念及统计原理2.单样本单样本T检验的检验统计量检验的检验统计量 单样本T检验的前提是总体服从正态分布 ,其中 为总体均值, 为总体方差。如果样本容量为n,样本均值为 ,则 仍服从正态分布,即: 。 在零假设成立的条件下,均值检验使用t统计量,构造的t统计量为: 其中, 用 代入,t统计量服从自由度为n-1的t分布,S为样本标准差。 在给定原假设的前提下,SPSS将检验值代

14、入t统计量,得到检验统计量观测值,以及根据T分布的分布函数计算出的概率P值。 2( ,)N 2XX2( ,)XNn/XtSn04.3 单样本单样本T检验检验4.3.1 基本概念及统计原理基本概念及统计原理3.单样本单样本T检验的步骤检验的步骤 在给定样本来自正态总体的假设下,单样本T检验作为假设检验的一种方法,其基本步骤与假设检验的步骤是一样的。 4.3 单样本单样本T检验检验4.3.2 单样本单样本T检验检验SPSS实例分析实例分析 【例4-2】 某生产食盐的生产线,其生产的袋装食盐的标准质量为500 g,现随机抽取10袋,其质量分别为495 g,502 g,510 g,497 g,506

15、g,498 g,503 g,492 g,504 g,501 g。假设数据呈正态分布,请检验生产线的工作情况。分析分析: :这是一个典型的比较样本均值和总体均值的T检验问题 ;第1步 数据组织:数据组织:首先建立SPSS数据文件,只需建立一个变量“Weight”,录入相应的数据即可,建立的数据文件存入文件data4-1.sav中。 4.3 单样本单样本T检验检验4.3.2 单样本单样本T检验检验SPSS实例分析实例分析 第第2步步 单样本单样本T检验分析设置检验分析设置选择菜单“分析比较均值单样本T检验(S)”,打开 “单样本T检验” 对话框,将变量“weight”移入”检验变量”列表框,并输入

16、检验值500;打开“单样本T检验:选项”对话框 ,设置置信区间为95%(缺省为95%); 4.3 单样本单样本T检验检验4.3.2 单样本单样本T检验检验SPSS实例分析实例分析 第第3步步 主要结果及分析主要结果及分析:单样本统计量表 单样本T检验结果表 N均值标准差均值的标准误weight10500.80005.391351.70489检验值 = 500tdfSig(双侧)均值差值差分的 95% 置信区间下限上限weight.4699.650.800003.05674.6567本例置信水平为95%,显著性水平为0.05,从上表中可以看出,双尾检测概率P值为0.650,大于0.05,故原假设

17、成立,也就是说,抽样袋装食盐的质量与500克无显著性差异,有理由相信生产线工作状态正常 下表给出了单样本T检验的描述性统计量,包括样本数(N)、均值、标准差、均值的标准误。 主要内容主要内容4.1 假设检验假设检验4.2 平均值分析平均值分析4.3 单样本单样本T检验检验4.4 独立样本独立样本T检验检验4.5配对样板配对样板T检验检验4.4 独立样本独立样本T检验检验4.4.1 基本概念及统计原理基本概念及统计原理1. 独立样本独立样本T检验的概念检验的概念 单样本T检验是检验样本均值和总体均值是否有显著性差异,而两独立样本T检验的目的是利用来自某两个总体的独立样本,推断两个总体的均值是否存

18、在显著差异。其原假设H0为 ,即假设两总体均值相等,备择假设为 ,即假设两总体均值不等。 例如,为比较两种牧草对奶牛的饲养效果,随机从奶牛群中选取喂养不同牧草的奶牛各10头记录每日平均产奶的量,根据记录的数据推断两种牧草对奶牛饲养的效果有无显著性差异。12124.4 独立样本独立样本T检验检验4.4.1 基本概念及统计原理基本概念及统计原理2独立样本独立样本T检验的检验统计量检验的检验统计量 独立样本T检验的前提是两个独立的总体分别服从 和 和 。在零假设成立的条件下,独立样本T检验使用t统计量。构造独立样本T检验的t统计量分为两种情况。1)当样本方差相等时,t统计量定义为:其中 和 分别为两

19、样本容量, , 和 分别为两样本标准差。该统计量服从自由度为 的t分布。 2(,)xxN2(,)yyN 121212()11XXtSnn1n2n1S2S122nn222112212(1)(1)2nSnSSnn4.4 独立样本独立样本T检验检验4.4.1 基本概念及统计原理基本概念及统计原理2独立样本独立样本T检验的检验统计量检验的检验统计量 2)当样本方差不等时,t统计量定义为: 可见,独立样本T检验的结论在很大程度上取决于两个总体的方差是否相等。这就要求在检验两总体均值是否相等之前,首先应对两总体方差是否相等进行检验,也称之为方差齐性检验。 1212221212()XXtSSnn4.4 独立

20、样本独立样本T检验检验4.4.1 基本概念及统计原理基本概念及统计原理3.方差齐性检验方法方差齐性检验方法 利用Levene F方差齐性检验方法检验两总体方差是否存在显著差异;首先提出原假设;执行检验过程中,若概率p 值小于给定的显著性水平(一般为0.05),则拒绝原假设,认为两个总体的方差不等;否则认为两个总体的方差无显著性差异。4. 独立样本独立样本T检验的一般步骤检验的一般步骤 在两样本来自正态总体且相互独立的假设下,独立样本T检验作为假设检验的一种方法,其基本步骤与假设检验的步骤是一样的。 4.4 独立样本独立样本T检验检验4.4.2 独立样本独立样本T检验检验SPSS实例分析实例分析

21、 【例4-3】为比较两种不同品种的玉米的产量,分别统计了8个地区的单位面积产量,具体数据见表5.8。假定样本服从正态分布,且两组样本相互独立,试比较在置信度为95%的情况下,两种玉米产量是否有显著性差异。 4.4 独立样本独立样本T检验检验4.4.2 独立样本独立样本T检验检验SPSS实例分析实例分析 第第1步步 数据组织数据组织: 在SPSS数据文件中建立两个变量,分别为“品种”、“产量”,度量标准分别为“名义”、“度量”,变量“品种”的值标签为:a品种A,b品种B,录入数据后,保存名为data4-2.sav的SPSS数据文件;第第2步步 独立样本独立样本T检验设置检验设置:选择菜单 “选择

22、比较均值独立样本T检验”,打开“独立样本T检验”对话框,将“产量” 作为要进行T检验的变量,将“品种”字段作为分组变量,定义分组变量的两个分组分别为“a”和“b”。 打开“独立样本T检验:选项”对话框,具体选项内容及设置与单样本T检验相同。 4.4 独立样本独立样本T检验检验4.4.2 基本概念及统计原理基本概念及统计原理第第3步步 运行结果及分析:运行结果及分析:独立样本独立样本T检验的基本描述统计量检验的基本描述统计量 玉米品种N均值标准差均值的标准误单位面积产量品种A881.250011.804964.17368品种B875.750010.024973.54436 上表给出了本例独立样本

23、T检验的基本描述统计量,包括两个样本的均值、标准差和均值的标准误。 4.4 独立样本独立样本T检验检验4.4. 基本概念及统计原理基本概念及统计原理独立样本独立样本T检验结果表检验结果表 独立样本检验独立样本检验方差方程方差方程的的 Levene Levene 检验检验均值方程的均值方程的 t t 检验检验F FSigSig. .t tdfdfSig.Sig.( (双双侧侧) )均值均值差值差值标准误标准误差值差值差分的差分的 95% 95% 置置信区间信区间下限下限上限上限单位面积单位面积产量产量假设方差相假设方差相等等.10.104 4.75.752 21.001.004 41414.33

24、2.3325.5005.50000005.475605.47560- -6.24396.24398 817.24317.2439898假设方差不假设方差不相等相等1.001.004 413.6413.642 2.333.3335.5005.50000005.475605.47560- -6.27296.27297 717.27217.2729797 根据上表“方差方程的 Levene 检验”中的sig.为0.752,远大于设定的显著性水平0.05,故本例两组数据方差相等。在方差相等的情况下,独立样本T检验的结果应该看上表中的“假设方差相等”一行,第5列为相应的双尾检测概率(Sig.(双侧)为0

25、.332,在显著性水平为0.05的情况下,T统计量的概率p值大于0.05,故不应拒绝零假设,,即认为两样本的均值是相等的,在本例中,不能认为两种玉米品种的产量有显著性差异。 主要内容主要内容4.1 假设检验假设检验4.2 平均值分析平均值分析4.3 单样本单样本T检验检验4.4 独立样本独立样本T检验检验4.5配对样板配对样板T检验检验4.5 配对样本配对样本T检验检验4.5.1 基本概念及统计原理基本概念及统计原理1配对样本T检验的概念 配对样本T检验用于检验两个相关样本是否来自相同均值的正态总体,即推断两个总体的均值是否存在显著差异。其零假设为 ,其中 和 分别为第一个总体和第二个总体的均

26、值。 配对的概念是指两个样本的各样本值之间存在着对应关系,配对样本的两个样本值之间的配对是一一对应的,并且两个样本的容量相同。配对样本T检验与独立样本T检验的差别之一是要求样本是配对的。所谓配对样本可以是个案在“前”、“后”两种状态下某属性的两种状态,也可以是对某事物两个不同侧面或方面的描述。其差别在于抽样不是相互独立的,而是互相关联的。012:0H124.5 配对样本配对样本T检验检验4.5.1 基本概念及统计原理基本概念及统计原理2配对样本T检验的数学思想配对样本T检验须求出每对观测值之差,所有样本值的观测值之差形成一个新的单样本,显然,如果两个样本的均值没有显著差异,则样本值之差的均值应

27、该接近零,这实际上转换成了一个单样本的T检验。所以,配对样本T检验就是检验差值所来自的总体其均值是否为零,这就要求差值来自的总体服从正态分布。 4.5 配对样本配对样本T检验检验4.5.1 基本概念及统计原理基本概念及统计原理3配对样本T检验的检验统计量 在配对样本T检验中,设 、 分别为配对样本。其样本差值 ,此时检验统计量为:其中 为 的均值,S为 的标准差,n为样本数,当 时,t统计量服从自由度为2n-2的t分布。 1ix2(1)ix in 12iiidxx12()/dtSndidid1204.5 配对样本配对样本T检验检验4.5.2 4.5.2 配对样本配对样本T T检验检验SPSSS

28、PSS实例分析实例分析【例4-4】以下是某大学跆拳道选手15人的平衡训练的数据,统计实验前、后平衡训练成绩是否有差异。训练前:86,77,59,79,90,68,85,94,66,72,75,72,69,85,88训练后:78,81,76,92,88,76,93,87,62,84,87,95,88,87,80第第1步步 数据组织:数据组织:首先建立SPSS数据文件,建立两个变量:“训练前”、“训练后”,录入相应数据。第第2步步 配对样本配对样本T检验设置:检验设置: 选择菜单“分析比较均值配对样本T检验”,弹出“配对样本T检验”对话框,同时选中“训练前”及“训练后”字段,将其加入“成对变量“列

29、表框;打开“选项”对话框,指定置信水平和缺失值的处理方法;具体方法在前面已有讲述,可以参考前文4.5 配对样本配对样本T检验检验4.5.2 4.5.2 配对样本配对样本T T检验检验SPSSSPSS实例分析实例分析第第3步步 运行结果及分析:运行结果及分析:配对样本T检验的基本描述统计量配对样本相关性检验成对样本统计量成对样本统计量均值均值N N标准差标准差均值的标准误均值的标准误对对 1 1训练前训练前77.6777.67151510.10410.1042.6092.609训练后训练后83.6083.6015158.4338.4332.1772.177成对样本相关系数成对样本相关系数N N相

30、关系数相关系数Sig.Sig.对对 1 1训练前训练前 & & 训练后训练后1515.407.407.132.132 左表是配对样本T检验的简单相关关系检验结果。表中显示训练前和训练后两样本的相关系数为0.407,相关系数的检验P值为0.132显著性水平,接受原假设,可以认为训练前后的成绩没有明显的线性关系。4.5 配对样本配对样本T检验检验4.5.2 4.5.2 配对样本配对样本T T检验检验SPSSSPSS实例分析实例分析第第3步步 运行结果及分析:运行结果及分析:配对样本T检验结果 上表是配对样本T检验的最终结果。sig.(双侧)为双尾检验概率p值在置信水平为95%时,显

31、著性水平为0.05,由于概率p值为0.041,小于0.05,拒绝零假设,可以认为训练前后对成绩有显著效果。成对样本检验成对样本检验成对差分成对差分t tdfdfSig.(Sig.(双侧双侧) )均值均值标准标准差差均值的标准均值的标准误误差分的差分的 95% 95% 置信置信区间区间下限下限上限上限对对 1 1训练前训练前 - - 训练训练后后- -5.935.933 310.1810.187 72.6302.630- -11.57511.575-.292-.292- -2.2562.2561414.041.041主要内容主要内容4.1 参数估计参数估计4.2 假设检验假设检验4.3 参数检验

32、与非参数检验参数检验与非参数检验4.4 单样本单样本T检验检验4.5 独立样本独立样本T检验检验4.6 配对样板配对样板T检验检验4.7 单样本的非参数检验单样本的非参数检验 4.7 单样本的非参数检验单样本的非参数检验4 4.7.1 .7.1 基本概念及统计原理基本概念及统计原理 单样本非参数检验使用一个或多个非参数检验方法来识别单个总体的分布情况,不需要待检验的数据呈正态分布。 SPSS的单样本非参数检验方法包括卡方检验、二项分布检验、游程检验、K-S检验及Wilcoxon符号检验五种。 在SPSS 19中,所有单样本的非参数检验有一些共同的设置。单样本非参数检验的对话框有三个选项卡,分别

33、为“目标”、“字段”和“设置”,具体设置如下: 4.7 单样本的非参数检验单样本的非参数检验4 4.7.1 .7.1 基本概念及统计原理基本概念及统计原理(1)“目标”选项卡:用于设置非参数检验的目标,每个不同的选项对应于“设置”选项卡上不同的默认配置,如下图所示。 4.7 单样本的非参数检验单样本的非参数检验4 4.7.1 .7.1 基本概念及统计原理基本概念及统计原理(2)“字段”选项卡:用于设定待检验变量。 4.7 单样本的非参数检验单样本的非参数检验4 4.7.1 .7.1 基本概念及统计原理基本概念及统计原理(3)“设置”选项卡:用于设定检验方法及对应的选项,如下图所示。4.7 单样

34、本的非参数检验单样本的非参数检验4 4.7.2 .7.2 卡方检验卡方检验1卡方检验的概念 也称卡方拟合优度检验,它是K.Pearson给出的一种最常用的非参数检验方法,用于检验观测数据是否与某种概率分布的理论数值相符合,进而推断观测数据是否是来自于该分布的样本的问题。 4.7 单样本的非参数检验单样本的非参数检验4 4.7.2 .7.2 卡方检验卡方检验1卡方检验的概念 也称卡方拟合优度检验,它是K.Pearson给出的一种最常用的非参数检验方法,用于检验观测数据是否与某种概率分布的理论数值相符合,进而推断观测数据是否是来自于该分布的样本的问题。2统计原理 为检验实际分布是否与理论分布(期望

35、分布一致),可采用卡方统计量,典型的卡方统计量是Pearson卡方统计量,其公式为: 221()kiiiinnpnp 4.7 单样本的非参数检验单样本的非参数检验4 4.7.2 .7.2 卡方检验卡方检验分析步骤第第1 1 步步 提出零假设:提出零假设:卡方检验的零假设H0是“总体服从某种理论分布”,其对立假设H1是“总体不服从某种理论分布”。第第2 2步步 选择检验统计量:选择检验统计量:卡方分布选择的是Pearson卡方统计量。已证明,当n充分大时,它近似地服从自由度为k-1的卡方分布。第第3 3步步 计算检验统计量的观测值和概率计算检验统计量的观测值和概率p p值。值。3.3.第第4 4

36、步步 给出显著性水平,作出决策。给出显著性水平,作出决策。 4.7 单样本的非参数检验单样本的非参数检验4 4.7.2 .7.2 卡方检验卡方检验4卡方检验SPSS实例分析【例4-5】 某公司质检负责人欲了解企业一年内出现的次品数是否均匀分布在一周的五个工作日中,随机抽取了90件次品的原始记录,其结果如下表,问该企业一周内出现的次品数是否均匀分布在一周的五个工作日中?( ) 0.05工作日12345次品数2515816264.7 单样本的非参数检验单样本的非参数检验4 4.7.2 .7.2 卡方检验卡方检验第第1 1步步 分析:分析:由于考虑的是次品是否服从均匀分布的问题,故用卡方检验。第第2

37、 2步步 数据组织数据组织:建立SPSS数据文件,建立两个变量:“工作日”、“次品数”,录入相应数据,保存为文件data4-4.sav。第第3 3步步 “次品数次品数”字段加权处理:字段加权处理:通过分析“工作日”及“次品数”两个字段的含义及度量标准,确定“工作日”为被分析字段,而“次品数”表示各工作日出现的频数,所以应该对“次品数”进行加权处理。执行“数据”“加权个案”,打开“加权个案”对话框,按图4-10所示进行设置。 4.7 单样本的非参数检验单样本的非参数检验4 4.7.2 .7.2 卡方检验卡方检验第第4 4步步 单因素的非参数检验设置:单因素的非参数检验设置:选择菜单“分析非参数检

38、验单样本”,在“目标”选项卡选择“自定义分析”;在“字段”选项卡中选择“使用定制字段分配”,并将“工作日”字段选入“检验字段”;“设置”选项卡中选择“自定义检验”,并选中“比较观察可能性和假设可能性(卡方检验)”,“检验选项”及“用户缺失值”保持默认选项。第第5 5步步 卡方检验的选项设置:卡方检验的选项设置:打开“卡方检验选项”对话框,选择” 所有类别概率相等(V)“选项。 4.7 单样本的非参数检验单样本的非参数检验4 4.7.2 .7.2 卡方检验卡方检验第第6 6步步 运行结果及分析运行结果及分析:卡方检验的假设检验数据摘要 给出了卡方检验给出了卡方检验的原假设为的原假设为“工作日的工

39、作日的类别以相同的概率发类别以相同的概率发生生”,其,其相伴概率值相伴概率值Sig. = 0.014 0.05,说明应说明应拒绝原假设拒绝原假设,因此图,因此图5-12的的“决策者决策者”给出给出“拒绝原假设拒绝原假设”的决策,的决策,认为工作日的类别是以认为工作日的类别是以不同概率发生的,即认不同概率发生的,即认为为该企业一周内出现的该企业一周内出现的次品数次品数不不是均匀分布在是均匀分布在一周的五个工作日中一周的五个工作日中。 4 4.7.3 .7.3 二项分布检验二项分布检验1基本概念基本概念二项分布检验正是要通过样本数据检验样本来自的总体是否服从指定的概率为p的二项分布,其零假设H0是

40、:样本来自的总体与指定的二项分布无显著性差异。2统计原理二项分布检验在样本小于等于30时,按下式计算概率值: 1xiin iniP XxC p q4.7 单样本的非参数检验单样本的非参数检验4.7 单样本的非参数检验单样本的非参数检验4 4.7.3 .7.3 二项分布检验二项分布检验在大样本的情况下,计算的是Z统计量,认为在零假设下,Z统计量服从正态分布,其计算公式如下: 0.5(1)xnpZnpp 当x小于n/2时,取加号;反之取减号,p为检验概率,n为样本总数。4.7 单样本的非参数检验单样本的非参数检验4 4.7.3 .7.3 二项分布检验二项分布检验3分析步骤分析步骤 二项分布检验亦是

41、假设检验问题,检验步骤同前。SPSS会自动计算上述精确概率和近似概率值。如果概率值小于显著性水平,则拒绝零假设,认为样本来自的总体与指定的二项分布有显著差异,反之样本来自的总体与指定的二项分布无显著差异。 4.7 单样本的非参数检验单样本的非参数检验4 4.7.3 .7.3 二项分布检验二项分布检验SPSSSPSS实例分析实例分析【例4-7】有20名学生经过新型教学法后测试成绩如下表,以90分及以上为优秀,请检验这20名同学的优秀率是否达到了10%。 成绩 78 75 84 76 89 93 94 88 95 87 88 73 84 82 80 84 87 91 95 83第第1步步 分析:分

42、析:由于成绩分为优秀与非优秀两种状态,故应用二项分布检验。第第2步步 数据的组织:数据的组织:数据分成一列,其变量名为“成绩”,输入数据并保存。4.7 单样本的非参数检验单样本的非参数检验4 4.7.3 .7.3 二项分布检验二项分布检验SPSSSPSS实例分析实例分析 第第3步步 单因素的非参数检验设置:单因素的非参数检验设置:选择菜单“分析非参数检验单样本”:将“目标”选项卡选择“自定义分析”;在“字段”选项卡中选择“使用定制字段分配”,并将“成绩”字段选入“检验字段”;在“设置”选项卡中选择“自定义检验”,并选中“比较观察二分类可能性和假设可能性(二项式检验)(O)”,“检验选项”及“用

43、户缺失值”保持默认选项;第第4步步 进行二项分布检验选项设置:进行二项分布检验选项设置:打开“二项式选项”对话框,设置“假设比例”为0.9,选择“定义连续字段的成功值”中的“定制割点”选项,并设置割点为99。4.7 单样本的非参数检验单样本的非参数检验 4 4.7.3 .7.3 二项分布检验二项分布检验SPSSSPSS实例分析实例分析第第5步步 主要结果及分析:主要结果及分析:二项式假设检验数据摘要 单尾检测的相伴概率Sig.=0.0430.05,因此应拒绝零假设,即小于90分的学生所占的比例与总体分布存在显著差异,即小于90分的学生所占比例比90%小。这说明优秀学生所占的比重是大于10%的。4.7 单样本的非参数检验单样本的非参数检验4 4.7.4 .7.4 游程检验游程检验 1基本概念 一 个游程(Run)就是某序列中位于一种符号之前或之后的另一种符号持续的最大主序列,或者说,一个游程是指某序列中同类元素的一个持续的最大主集。 主要用于检验一个变量两个值的分布是否呈随机分布,即检验前一个个案是否影响下一个个案的值,如果没有影响,这一组个案便是随机的。 例如,30次掷硬币出现正反面的序列为11100000,如果称连在一起的0或连在一起的1为一个游程,则共有4个0游程和3个1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论