第7章 SPSS非参数检验_第1页
第7章 SPSS非参数检验_第2页
第7章 SPSS非参数检验_第3页
第7章 SPSS非参数检验_第4页
第7章 SPSS非参数检验_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第7章SPSS的非参数检验

教学目的

通过本章学习,使学生明确SPSS提供了哪些非参数检验的方法;理解SPSS单样本非参数检验方法的设计思想并熟练掌握其操作;明确两独立样本和多独立样本的非参数检验方法有哪些?各自适用于什么数据?并掌握其具体操作;明确两配对样本和多配对样本的非参数检验方法有哪些?并掌握其具体操作与含义。【重点掌握】单样本非参数检验中的卡方检验和K-S检验曼-惠特尼检验和Kruskal-Wallis检验Wilcoxon符号秩检验和Friedman检验【掌握】二项分布检验变量值随机性检验两独立样本的游程检验中位数检验【了解】极端反应检验多配对样本的Kendall协同系数检验

参数检验是在总体分布已知的情况下,对总体的参数如均值、方差等进行推断的方法。非参数检验是在总体分布未知或知之甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名“非参数”检验。非参数检验的内容:单样本非参数检验两独立样本非参数检验两配对样本非参数检验多独立样本非参数检验多配对样本非参数检验(“独立”与“配对”的含义同参数检验中)7.1单样本的非参数检验SPSS单样本非参数检验是对单个总体的分布形态等进行推断的方法,其中包括卡方检验、二项分布检验、K-S检验以及变量值随机性检验等方法。7.1.1总体分布的卡方检验是一种极为典型的对总体分布进行检验的非参数检验方法案例7-1:医学家在研究心脏病人猝死人数与日期关系时发现:一周之中,星期一心脏病人猝死者较多,其他日子则基本相当,各天的比例接近2.8:1:1:1:1:1:1。现收集到心脏病人死亡日期的样本数据,推断其总体分布是否与上述理论分布吻合?数据文件名:心脏病猝死.sav由于星期几是定序型变量,对该变量的总体分布往往采用卡方检验方法。一、总体分布卡方检验的基本思想卡方检验是根据样本数据,推断总体分布与期望分布或某一理论分布是否存在显著差异,是一种吻合性检验,通常用于对有多项分类值的总体分布的分析。原假设:样本来自的总体分布与期望分布或某一理论分布无显著差异。卡方检验基本思想的理论依据:如果从一个随机变量X中随机抽取若干个观察样本,这些观察样本落在X的k个互不相交的子集中的观察频数服从一个多项分布,这个多项分布当k趋于无穷时近似服从卡方分布。典型的卡方统计量:Pearson卡方:如果卡方值较大,则说明观测频数分布与期望频数分布差距较大;反之,则说明观测频数与期望频数分布较接近。如果卡方的概率值小于显著性水平,则拒绝原假设,认为样本来自的总体分布与期望分布存在显著性差异;反之,则接受原假设,认为样本来自的总体分布与期望分布无显著性差异。二、总体分布卡方检验的应用举例卡方检验对数据的要求:定义一个存放实际样本值的变量;或者定义一个存放变量舒值的变量和一个存放各变量值观测频数的变量,并指定该变量为加权变量。卡方检验步骤:1.选择菜单[分析A]-[非参数检验N]-[旧对话框]-[卡方]2.选择待检验的变量到[检验变量列表]框中3.在[期望全距]框中确定参与分析的观测值的范围,[从数据中获取]表示所有观察数据都参与分析,[使用指定的范围]表示只有在该取值范围内的观察数据才参与分析。[下限]和[上限]定义取值范围上下界4.在[期望值]框中给出各个理论值。其中,[所在类别相等]表示所有子集都相同,即期望分布为均匀分布;[值]框后可依次输入理论值,并通过按“添加,更改,删除”按钮对这些值进行增加,修改和删除。注:输入值得按变量值的次序其他选项[选项]包括统计选项、缺失值处理选项与前面章节相同7.1.2二项分布检验二项分布检验是通过样本数据检验样本来自的总体是否服从指定概率为p的二项分布。原假设:样本来自的总体与指定的二项分布无显著差异。一、二项分布检验的基本思想变量只有两个取值0和1,如果进行n次相同的实验,则出现两类(0和1)的次数可以分别用离散型随机变量X来描述,如果随机变量值X为1的概率设为p,则随机变量X值为0的概率便等于1-p,形成二项分布。二、二项分布检验的应用举例案例7-2:从某批产品中随机抽取23个样本进行检测,用1表示合格品,0表示不合格品,根据抽样结果验证该批产品的合格率是否为90%。数据文件名:产品合格率.sav检验步骤:1.选择菜单:[分析A]-[非参数检验N]-[旧对话框]-[二项式]2.选定待检验变量到[检验变量列表T]框中3.在[定义二分法]框中指定如何分类,如果检验变量是二值变量,选[从数据中获取],如果检验变量不是二值变量,则可在[割点]框中输入具体数值,小于等于该值的观察数据为第一组,大于该值的数据为第二组。4.在[检验比例]框中输入二项分布的检验概率值p7.1.3单样本K-S检验一、单样本K-S检验的基本思想K-S检验是以俄罗斯数学家柯尔莫哥和斯米诺夫的名字命名的一种非参数检验方法。该方法能利用样本数据推断样本来自的总体是否服从某一理论分布,是一种拟合优度的检验方法,适合于探索连续随机变量的分布。单样本K-S检验的原假设:样本来自的总体与指定的理论分布无显著差异。理论分布包括正态分布、均匀分布、指数分布和泊松分布等。二、单样本K-S检验的应用举例案例7-3:收集到21名周岁儿童身高的样本数据,分析周岁儿童身高的总体是否服从正态分布。数据文件名:儿童身高.savK-S检验的步骤:1.选择菜单:[分析A]-[非参数检验N]-[旧对话框]-[1-样本K-S]出现如下图的窗口2.选择待检验变量到[检验变量列表]框中3.在[检验分布]框中选择理论分布,其中,[常规]是正态分布;[相等]是均匀分布;[泊松]是泊松分布;[指数分布]是指数分布。[选项]选项同卡方检验中7.1.4变量值随机性检验一、变量值随机性检验的基本思想变量值随机性检验是通过对样本变量值的分析,实现对总体的变量值出现是否随机进行检验原假设:总体变量值的出现是随机的。游程:是样本序列中出现相同的变量值的次数。如序列aaabbba中,a的游程为2,b的游程为1,总游程为3;再如ababaabbb中a的游程为3,b的游程也为3,总游程为6.如果样本是随机的,连续出现1或0的可能性不大,1和0交叉出现的可能性也会较小。因此,游程太大或太小都表明变量值存在不随机的现象。二、变量值随机性检验的应用举例案例7-4:为检验某耐压设备在某段时间内工作是否正常,测试并记录下该时段各个时间点上的设备耐压数据。现采用游程检验方法对这批数据进行分析,如果耐压数据的变动是随机的,可认为该设备工作一直正常,否则认为该设备有不能正常工作的现象。数据文件名:电缆数据.sav游程检验步骤:1.选择菜单[分析A]-[非参数检验N]-[旧对话框]-[游程]2.选择待检验变量到[检验变量列表]框中3.在[割点]框中确定计算游程的分界值。其中,中位数表示以样本中位数为分界值;众数表示以样本众数为分界值;均值表示以样本均值为分界值;设定表示以用户输入的值为分界值,小于该值的为一组,大于等于该值的为另一组。7.2两独立样本的非参数检验两独立样本的非参数检验是对总体分布不甚清楚的情况下,通过对两组独立样本的分析来推断样本来自的两个总体的分布是否存在显著差异的方法。独立样本是在一个总体中随机抽样对在另一个总体中随机抽样没有影响的情况下所获得的样本。SPSS中提供了多种两独立样本的非参数检验方法,其中包括mann-WhitneyU检验,K-S检验,W-W检验,极端反应检验等。7.2.1两独立样本mann-whitneyU检验一、两独立样本mann-whitneyU检验的基本思想可用于对两总体分布的比较判断。原假设:两组样本数据来自的总体分布无显著差异。秩:变量值排序的名次,将变量值按升序排列,每个变量值都会有一个在整个变量值序列中的位置或名次,这个位置或名次就是变量值的秩。变量值有几个,秩就有几个。将两组样本数据混合排序,得到每个数据的秩,计算两组样本各自的平均秩,并对平均秩进行比较。如果平均秩相差较大,则说明两个样本差异显著。二、两独立样本mann-whitneyU检验实例案例7-5:对两种不同工艺生产的同一种产品,检验不同工艺生产的产品的寿命是否存在显著差异。数据文件名:使用寿命.sav两独立样本mann-whitneyU检验步骤:1.选择菜单[分析A]-[非参数检验N]-[旧对话框]-[2个独立样本检验]2.选择待分析的变量到[检验变量列表]框中,3.选择分组变量到[分组变量]框中,并在[定义组]框中定义两组的组变量值4.在[检验类型]框中选择检验方法[Mann-WhitneyU][选项]选项同前7.2.2两独立样本的K-S检验检验两总体分布是否存在显著差异。原假设:两组独立样本来自的两总体分布无显著差异。两独立样本K-S检验以变量值的秩作为分析对象。7.2.3两独立样本的游程检验(Wald-Wolfwitz游程)两独立样本的游程检验是用来检验两独立样本来自的两总体分布是否存在显著差异。原假设:两组独立样本来自的两总体分布无显著差异。两独立样本的游程检验中,游程数依赖于变量的秩。将两组样本混合后按升序排列,然后按对应的组标记值序列计算游程数。7.2.4极端反应检验(Moses极限反应)原假设:两独立样本来自的两个总体的分布无显著差异。将一组样本作为控制样本,另一组样本作为实验样本,以控制样本作为对照,检验实验样本相对于控制样本是否出现了极端反应。7.3多独立样本的非参数检验多独立样本的非参数检验是通过分析多组独立样本的数据,推断样本来自的多个总体的中位数或分布是否存在显著差异。多组独立样本是指独立抽样方式获得的多组样本。SPSS提供的多独立样本非参数检验的方法主要包括中位数检验、Kruskal-Wallis检验、Jonckheere-Terpstra检验。案例7-6:希望对北京、上海、成都、广州四个城市的周岁儿童的身高进行比较分析。采用独立抽样方式获得四组独立样本,数据文件名为“多城市独立儿童身高.sav”。对该数据采用各种非参数检验方法进行检验,判断四个城市周岁儿童的身高是否存在显著差异。多独立样本非参数检验的数据应包括两个变量,一个变量存放样本值,另一个存放组标记值。原假设:多个独立样本来自的总体的中位数(或总体分布)无显著差异。多独立样本非参数检验的步骤:1.选择菜单[分析A]-[非参数检验N]-[旧对话框]-[K个独立样本检验]2.选择待检验的变量到[检验变量列表]框中3.指定存放组标志的变量到[分组变量]框中,并按“定义范围”按钮给出组标志值的取值范围4.在[检验类型]框中选择采用哪种检验方法7.3.1中位数检验方法通过对多组独立样本的分析,检验它们来自的总体的中位数是否存在显著差异。原假设:多个独立样本的多个总体的中位数无显著差异。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论