版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第7章SPSS的非参数检验
1教学目的
通过本章学习,使学生明确SPSS提供了哪些非参数检验的方法;理解SPSS单样本非参数检验方法的设计思想并熟练掌握其操作;明确两独立样本和多独立样本的非参数检验方法有哪些?各自适用于什么数据?并掌握其具体操作;明确两配对样本和多配对样本的非参数检验方法有哪些?并掌握其具体操作与含义。2【重点掌握】单样本非参数检验中的卡方检验和K-S检验曼-惠特尼检验和Kruskal-Wallis检验Wilcoxon符号秩检验和Friedman检验【掌握】二项分布检验变量值随机性检验两独立样本的游程检验中位数检验【了解】极端反应检验多配对样本的Kendall协同系数检验3
参数检验是在总体分布已知的情况下,对总体的参数如均值、方差等进行推断的方法。非参数检验是在总体分布未知或知之甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名“非参数”检验。4非参数检验的内容:单样本非参数检验两独立样本非参数检验两配对样本非参数检验多独立样本非参数检验多配对样本非参数检验(“独立”与“配对”的含义同参数检验中)57.1单样本的非参数检验SPSS单样本非参数检验是对单个总体的分布形态等进行推断的方法,其中包括卡方检验、二项分布检验、K-S检验以及变量值随机性检验等方法。7.1.1总体分布的卡方检验是一种极为典型的对总体分布进行检验的非参数检验方法6案例7-1:医学家在研究心脏病人猝死人数与日期关系时发现:一周之中,星期一心脏病人猝死者较多,其他日子则基本相当,各天的比例接近2.8:1:1:1:1:1:1。现收集到心脏病人死亡日期的样本数据,推断其总体分布是否与上述理论分布吻合?数据文件名:心脏病猝死.sav由于星期几是定序型变量,对该变量的总体分布往往采用卡方检验方法。7一、总体分布卡方检验的基本思想卡方检验是根据样本数据,推断总体分布与期望分布或某一理论分布是否存在显著差异,是一种吻合性检验,通常用于对有多项分类值的总体分布的分析。原假设:样本来自的总体分布与期望分布或某一理论分布无显著差异。卡方检验基本思想的理论依据:如果从一个随机变量X中随机抽取若干个观察样本,这些观察样本落在X的k个互不相交的子集中的观察频数服从一个多项分布,这个多项分布当k趋于无穷时近似服从卡方分布。8典型的卡方统计量:Pearson卡方:如果卡方值较大,则说明观测频数分布与期望频数分布差距较大;反之,则说明观测频数与期望频数分布较接近。如果卡方的概率值小于显著性水平,则拒绝原假设,认为样本来自的总体分布与期望分布存在显著性差异;反之,则接受原假设,认为样本来自的总体分布与期望分布无显著性差异。9二、总体分布卡方检验的应用举例卡方检验对数据的要求:定义一个存放实际样本值的变量;或者定义一个存放变量舒值的变量和一个存放各变量值观测频数的变量,并指定该变量为加权变量。卡方检验步骤:1.选择菜单[分析A]-[非参数检验N]-[旧对话框]-[卡方]102.选择待检验的变量到[检验变量列表]框中3.在[期望全距]框中确定参与分析的观测值的范围,[从数据中获取]表示所有观察数据都参与分析,[使用指定的范围]表示只有在该取值范围内的观察数据才参与分析。[下限]和[上限]定义取值范围上下界114.在[期望值]框中给出各个理论值。其中,[所在类别相等]表示所有子集都相同,即期望分布为均匀分布;[值]框后可依次输入理论值,并通过按“添加,更改,删除”按钮对这些值进行增加,修改和删除。注:输入值得按变量值的次序其他选项[选项]包括统计选项、缺失值处理选项与前面章节相同127.1.2二项分布检验二项分布检验是通过样本数据检验样本来自的总体是否服从指定概率为p的二项分布。原假设:样本来自的总体与指定的二项分布无显著差异。一、二项分布检验的基本思想变量只有两个取值0和1,如果进行n次相同的实验,则出现两类(0和1)的次数可以分别用离散型随机变量X来描述,如果随机变量值X为1的概率设为p,则随机变量X值为0的概率便等于1-p,形成二项分布。13二、二项分布检验的应用举例案例7-2:从某批产品中随机抽取23个样本进行检测,用1表示合格品,0表示不合格品,根据抽样结果验证该批产品的合格率是否为90%。数据文件名:产品合格率.sav检验步骤:1.选择菜单:[分析A]-[非参数检验N]-[旧对话框]-[二项式]142.选定待检验变量到[检验变量列表T]框中3.在[定义二分法]框中指定如何分类,如果检验变量是二值变量,选[从数据中获取],如果检验变量不是二值变量,则可在[割点]框中输入具体数值,小于等于该值的观察数据为第一组,大于该值的数据为第二组。4.在[检验比例]框中输入二项分布的检验概率值p157.1.3单样本K-S检验一、单样本K-S检验的基本思想K-S检验是以俄罗斯数学家柯尔莫哥和斯米诺夫的名字命名的一种非参数检验方法。该方法能利用样本数据推断样本来自的总体是否服从某一理论分布,是一种拟合优度的检验方法,适合于探索连续随机变量的分布。单样本K-S检验的原假设:样本来自的总体与指定的理论分布无显著差异。理论分布包括正态分布、均匀分布、指数分布和泊松分布等。16二、单样本K-S检验的应用举例案例7-3:收集到21名周岁儿童身高的样本数据,分析周岁儿童身高的总体是否服从正态分布。数据文件名:儿童身高.savK-S检验的步骤:1.选择菜单:[分析A]-[非参数检验N]-[旧对话框]-[1-样本K-S]出现如下图的窗口172.选择待检验变量到[检验变量列表]框中3.在[检验分布]框中选择理论分布,其中,[常规]是正态分布;[相等]是均匀分布;[泊松]是泊松分布;[指数分布]是指数分布。[选项]选项同卡方检验中187.1.4变量值随机性检验一、变量值随机性检验的基本思想变量值随机性检验是通过对样本变量值的分析,实现对总体的变量值出现是否随机进行检验原假设:总体变量值的出现是随机的。游程:是样本序列中出现相同的变量值的次数。如序列aaabbba中,a的游程为2,b的游程为1,总游程为3;再如ababaabbb中a的游程为3,b的游程也为3,总游程为6.如果样本是随机的,连续出现1或0的可能性不大,1和0交叉出现的可能性也会较小。因此,游程太大或太小都表明变量值存在不随机的现象。19二、变量值随机性检验的应用举例案例7-4:为检验某耐压设备在某段时间内工作是否正常,测试并记录下该时段各个时间点上的设备耐压数据。现采用游程检验方法对这批数据进行分析,如果耐压数据的变动是随机的,可认为该设备工作一直正常,否则认为该设备有不能正常工作的现象。数据文件名:电缆数据.sav游程检验步骤:1.选择菜单[分析A]-[非参数检验N]-[旧对话框]-[游程]202.选择待检验变量到[检验变量列表]框中3.在[割点]框中确定计算游程的分界值。其中,中位数表示以样本中位数为分界值;众数表示以样本众数为分界值;均值表示以样本均值为分界值;设定表示以用户输入的值为分界值,小于该值的为一组,大于等于该值的为另一组。217.2两独立样本的非参数检验两独立样本的非参数检验是对总体分布不甚清楚的情况下,通过对两组独立样本的分析来推断样本来自的两个总体的分布是否存在显著差异的方法。独立样本是在一个总体中随机抽样对在另一个总体中随机抽样没有影响的情况下所获得的样本。SPSS中提供了多种两独立样本的非参数检验方法,其中包括mann-WhitneyU检验,K-S检验,W-W检验,极端反应检验等。227.2.1两独立样本mann-whitneyU检验一、两独立样本mann-whitneyU检验的基本思想可用于对两总体分布的比较判断。原假设:两组样本数据来自的总体分布无显著差异。秩:变量值排序的名次,将变量值按升序排列,每个变量值都会有一个在整个变量值序列中的位置或名次,这个位置或名次就是变量值的秩。变量值有几个,秩就有几个。将两组样本数据混合排序,得到每个数据的秩,计算两组样本各自的平均秩,并对平均秩进行比较。如果平均秩相差较大,则说明两个样本差异显著。23二、两独立样本mann-whitneyU检验实例案例7-5:对两种不同工艺生产的同一种产品,检验不同工艺生产的产品的寿命是否存在显著差异。数据文件名:使用寿命.sav两独立样本mann-whitneyU检验步骤:1.选择菜单[分析A]-[非参数检验N]-[旧对话框]-[2个独立样本检验]242.选择待分析的变量到[检验变量列表]框中,3.选择分组变量到[分组变量]框中,并在[定义组]框中定义两组的组变量值4.在[检验类型]框中选择检验方法[Mann-WhitneyU][选项]选项同前257.2.2两独立样本的K-S检验检验两总体分布是否存在显著差异。原假设:两组独立样本来自的两总体分布无显著差异。两独立样本K-S检验以变量值的秩作为分析对象。7.2.3两独立样本的游程检验(Wald-Wolfwitz游程)两独立样本的游程检验是用来检验两独立样本来自的两总体分布是否存在显著差异。原假设:两组独立样本来自的两总体分布无显著差异。26两独立样本的游程检验中,游程数依赖于变量的秩。将两组样本混合后按升序排列,然后按对应的组标记值序列计算游程数。7.2.4极端反应检验(Moses极限反应)原假设:两独立样本来自的两个总体的分布无显著差异。将一组样本作为控制样本,另一组样本作为实验样本,以控制样本作为对照,检验实验样本相对于控制样本是否出现了极端反应。272025/1/23287.3多独立样本的非参数检验多独立样本的非参数检验是通过分析多组独立样本的数据,推断样本来自的多个总体的中位数或分布是否存在显著差异。多组独立样本是指独立抽样方式获得的多组样本。SPSS提供的多独立样本非参数检验的方法主要包括中位数检验、Kruskal-Wallis检验、Jonckheere-Terpstra检验。29案例7-6:希望对北京、上海、成都、广州四个城市的周岁儿童的身高进行比较分析。采用独立抽样方式获得四组独立样本,数据文件名为“多城市独立儿童身高.sav”。对该数据采用各种非参数检验方法进行检验,判断四个城市周岁儿童的身高是否存在显著差异。30多独立样本非参数检验的数据应包括两个变量,一个变量存放样本值,另一个存放组标记值。原假设:多个独立样本来自的总体的中位数(或总体分布)无显著差异。多独立样本非参数检验的步骤:1.选择菜单[分析A]-[非参数检验N]-[旧对话框]-[K个独立样本检验]312.选择待检验的变量到[检验变量列表]框中3.指定存放组标志的变量到[分组变量]框中,并按“定义范围”按钮给出组标志值的取值范围4.在[检验类型]框中选择采用哪种检验方法327.3.1中位数检验方法通过对多组独立样本的分析,检验它们来自的总体的中位数是否存在显著差异。原假设:多个独立样本的多个总体的中位数无显著差异。基本思想:如果多个总体的中位数无显著差异,或者说有共同的中位数,那么每组样本中大于该中位数或小于该中位数的样本数目应大致相同。通过计算大于中位数的和小于中位数的实际观察频数与期望频数的差异进行卡方检验。337.3.2多独立样本的Kruskal-Wallis检验实质:两独立样本的mann-WhitneyU检验在多个独立样本下的推广,也用于多个总体的分布是否存在显著差异。原假设:多个独立样本的多个总体分布无显著差异。基本思想:将多组样本数据混合并按升序排序,求出各变量值的秩,然后考察各组秩的均值是否存在显著差异。347.4两配对样本的非参数检验两配对样本的非参数检验是在对总体分布不甚了解的情况下,通过对两组配对样本的分析,推断样本来自的两个总体的分布是否存在显著差异的方法。两配对样本的非参数检验方法有McNemar检验、符号检验、Wilcoxon符号秩检验等。配对样本的样本数是相同的,且各样本值的先后次序是不能随意更改的。357.4.1两配对样本的McNemar检验一、两配对样本的McNemar检验的基本思想McNemar检验是一种变化显著性检验,它将研究对象自身作为对照者,检验其“前后”的变化是否显著。原假设:两配对样本来自的两总体的分布无显著差异。二、两配对样本的McNemar检验的步骤案例7-7:分析学生在学习统计学课程前后对统计学重要性的认知程度是否发生了显著改变,随机收集一批学生在学习统计学之前后认为统计学是否重要的样本数据(0表示“不重要”,1表示“重要”),数据文件名为“统计学学习.sav”361.选择菜单:[分析A]-[非参数检验N]-[2个关联样本检验]372.选择待检验的两个配对变量到[检验对]框中。注:如果数据是分组组织形式,在分析前要先选择好加权变量,如本例中的“人数”3.在[检验类型]中选择检验方法McNemar7.4.2两配对样本的符号检验一、两配对样本符号检验的基本思想也是用来检验两配对样本所来自的总体的分布是否存在显著差异的非参数方法。原假设:两配对样本来自的两总体的分布无显著差异。38利用正负号的个数实现检验首先,分别利用第二组样本的各个观察值减去第一组对应样本的观察值。差值为正则记正号,差值为负则记负号。然后,将正号的个数与负号的个数进行比较。如果正负号个数差不多,则认为两配对样本的数据分布差距较小;如果正负号个数相差较多,则认为两配对样本的数据分布差距较大。39二、两配对样本符号检验的计算示例案例7-8:为检验某种新的训练方法是否有助于提高运动员的成绩,收集到10名跳远运动员在使用新训练方法前后的跳远最好成绩。数据文件名“训练成绩.sav”两配对样本符号检验的步骤:1.选择菜单:[分析A]-[非参数检验N]-[2个相关样本检验]402.选择待检验的两个配对变量到[检验对]框中。3.在[检验类型]中选择检验方法“符号检验”417.4.3两配对样本Wilcoxon符号秩检验原假设:两配对样本来自的两总体的分布无显著差异。基本思想:首先,按照符号检验的办法,分别用第二组样本的各个观察值减去第一组对应样本的观察值,差值为正则记为正号,差值为负则记为负号,并同时保留差值数据;然后,将差值变量按升序排列,并求出差值变量的秩;42最后,分别计算正号秩总和W+和负号秩总和W-,如果正号秩总和与负号值总和秩大致相当,则说明一组样本值大于另一组样本样本值和该组小于另一组样本值的幅度大致相当,两组数据差的正负变化程度基本相当,两配对样本所来自的总体无显著差异。菜单选择同前,在[检验类型]中选择检验方法Wilcoxon(W)437.5多配对样本的非参数检验多配对样本的非参数检验是通过分析多组配对样本数据,推断样本来自的多个总体的中位数或分布是否存在显著差异。多配对样本的非参数检验方法有:Friedman检验、CochranQ检验、Kendall协同系数检验等。7.5.1多配对样本的Friedman检验一、多配对样本Friedman检验的基本思想44利用秩实现对多个总体分布是否存在显著差异进行检验原假设:多个配对样本来自的多个总体的分布无显著差异。基本思想:若总体分布无差异,则每一种处理方式下各区组的秩总和或平均秩应当相当。Friedman检验用类似方差分析的方法进行分析和构造检验统计量,即若不同处理方式下的秩不存在显著差异,则由不同处理方式引起的秩变差在秩总平均变差中占相对较小的比例。45二、多配对样本Friedman检验实例案例7-9:为比较三种促销形式对商品销售的影响,收集若干种商品在不同促销形式下的月销售额数据,数据文件名:促销方式.sav检验步骤:1.选择菜单[分析A]-[非参数检验N]-[旧对话框]-[K个相关样本检验]2.选择待检验的若干个配对变量到[检验变量]框中3.在[检验类型]框中选择采用的检验方法Friedman46477.5.2多配对样本CochranQ检验一、多配对样本CochranQ检验的基本思想原假设:多个配对样本来自的多个总体的分布无显著差异。一般用于二值变量的检验(取值只有0和1)基本思想:若多个总体分布无差异,则在每列中出现1的概率是相等的。48二、CochranQ检验实例案例7-10:收集到15名乘客对三家航空公司是否满意的数据(1表示满意,0表示不满意),根据这些数据推断这三家航空公司服务水平是否有差异,数据文件名:航空公司.sav检验步骤前2步同前,最后一步选择检验方法:在[检验类型]框中选择采用的检验方法CochranQ497.5.3多配对样本的Kendal
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- M108抗体注射液生产车间建设项目可行性研究报告写作模板-备案审批
- 郑州职业技术学院《论文写作学术交流和规范》2023-2024学年第一学期期末试卷
- 云南三鑫职业技术学院《财务管理基础(英文版)》2023-2024学年第一学期期末试卷
- 述职报告模板
- 职业导论-房地产经纪人《职业导论》名师预测卷4
- 有关保健与健康书籍读书报告
- 二零二五版城市综合体建设项目招标投标合同书3篇
- 二零二五年项目投资与股权分配合同2篇
- 人教版四年级数学下册第五单元综合卷(含答案)
- 2024-2025学年陕西省榆林市榆林二中高一(上)期末数学试卷(含答案)
- 航天科工集团在线测评题
- 山东省潍坊新2025届高三语文第一学期期末经典试题含解析
- 医院三基考核试题(康复理疗科)
- 2024-2030年中国招标代理行业深度分析及发展前景与发展战略研究报告
- (新版)吉林一级健康管理师高频核心题库300题(含答案)
- JT-T-1344-2020纯电动汽车维护、检测、诊断技术规范
- 2024年湖北省武汉市中考语文试卷真题(含答案)
- 基因突变和基因重组(第1课时)高一下学期生物人教版(2019)必修2
- 天津市八校2023-2024学年高三年级下册联合模拟考试数学试题(二)(含答案解析)
- 纳米技术增强早期疾病生物标志物的检测
- 产品销量分析表折线图excel模板
评论
0/150
提交评论