版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第7章 SPSS非参数检验,前面进行的假设检验和方差分析,大都是在数据服从正态分布或近似地服从正态分布的条件下进行的。但是如果总体的分布未知,如何进行总体参数的检验,或者如何检验总体服从一个指定的分布,都可以归结为非参数检验方法。,本章主要内容,单样本的非参数检验 两独立样本非参数检验 两配对样本非参数检验 多独立样本非参数检验 多配对样本非参数检验,第一节单样本的非参数检验,总体分布的卡方检验 二项分布检验 单样本K-S检验 变量值随机性检验,总体分布的卡方检验,总体分布的卡方检验是一种对总体分布进行检验的极为典型的非参数检验方法。 eg:在一个正20面体的各面上分别标有09十个数字,每个数
2、字在两个面上标出。若把该20面体投掷一些次数后,若检验每个数字出现的概率是否大致相同,则需用卡方检验。,概念,将总体的取值范围分成有限个互不相容的子集,从总体中抽取一个样本,考察样本观察值落到每个子集中的实际频数,并按假设的总体分布计算每个子集的理论频数,最后根据实际频数和理论频数的差构造卡方统计量,即 当原假设成立时,统计量服从卡方分布。以此来检验假设总体的分布是否成立。,基本思想,决策情况: 如果 的概率 ,则应拒绝原假设,即认为样本来自的总体分布与期望分布或某一理论分布存在显著差异;反之,则不存在显著差异。,基本操作及应用举例 (以心脏病猝死.sav为例),分析 非参数检验 卡方,输入检
3、验变量,输入理论(期望)分布值,因为卡方对应的概率P值大于0.05, 所以差异不显著,即认为样本来自的总体分布与指定的理论分布无显著差异,二项分布检验,SPSS的二项分布检验正是通过样本数据检验样本来自的总体是否服从指定概率值为P的二项分布,其原假设为样本来自的总体与指定的二项分布无显著差异。,概念,SPSS二项分布检验,在小样本中采用精确检验方法,对于大样本则采用近似检验方法。精确检验方法计算n次试验中成功出现的次数小于等于x次的概率,即 在大样本下,采用近似检验,用Z检验统计量,即,基本思想,决策情况: 如果上述两种情况下的概率 P值小于显著性水平 ,则应拒绝原假设,即认为样本来自的总体分
4、布与指定的二项分布存在显著差异;反之,则不存在显著差异。,二项分布检验的基本操作与应用 (以产品合格率.sav为例),分析 非参数检验 二项式,输入检验概率值,由于概率P大于0.05,所以不能拒绝原假设,即认为一级品率不低于0.9,K-S检验(Kolmogorow-Smirnov),该方法能够利用样本数据推断样本来自总体是否与某一个理论分布有显著差异,是一种拟合优度的检验方法,适用于探索连续型随机变量的分布。,概念,单样本K-S检验,正态分布 均匀分布 指数分布 泊松分布,理论分布类型,在原假设成立的前提下,计算各样本观测值在理论分布中出现的理论概率值F(x) 计算各样本观测值的实际累计概率值
5、S(x);计算实际累计概率值与理论累计概率值的差S(x) F(x) 计算差值序列中的最大绝对差值,即 修正的D为,基本思想,决策情况: 如果D统计量的概率 P值小于显著性水平 ,则应拒绝原假设,即认为样本来自的总体分布与指定的分布存在显著差异;反之,则不存在显著差异。,单样本K-S检验的基本操作与应用举例 以儿童身高.sav为例,分析 非参数检验 1-样本K-S,正态分布,由于概率P大于0.05,所以不能拒绝原假设,即认为周岁儿童身高的总体分布与正态分布无显著差异,P-P图,Q-Q图,单样本K-S检验的基本操作与应用举例 以储户存款金额总体的分布检验为例,概率P小于0.05,所以拒绝原假设,即
6、认为储户存款金额总体分布不服从正态分布,变量值随机性检验,概念:通过对样本变量值的分析,实现对总体变量值出现是否随机进行检验。 基本思想:利用游程大小进行判断。 游程是指变量值序列中连续出现相同的值的次数 检验统计量: 其中,,基本思想,变量值随机性检验的SPSS操作 以耐电压值.sav为例,因为概率P值大于0.05,所以不能拒绝原假设,即认为该设备是正常工作的,练习,1.在一个正20面体的各面上分别标出09个数字,每个数字在两个面上标出,现将它投掷805次,得出各数字朝上的次数。数据放在Frequncy.sav文件中,试检验其均匀性。 2.试着检验抛硬币实验中,正面出现的概率是否为1/2.数
7、据在硬币结果.sav中。 3.试着检验10个电子元件的使用寿命分布是否服从指数分布?数据在电子元件使用寿命.sav中。,4.现有抛掷一枚硬币66次所得结果保存在数据文件硬币结果.sav中,请检验该实验是否是随机性实验。,第二节两独立样本的非参数检验,如果两个无联系总体的分布是未知的,则检验两个总体的分布是否有显著差异的方法是一种非参数检验方法,或者称为两个独立样本的检验。检验是通过两个总体中分别抽取的随机样本数据进行的。,概念,曼-惠特尼U检验 K-S检验 w-w游程检验 极端反应检验,方法,方法一:两独立样本的曼-惠特尼 U检验,概念 通过对两组独立样本平均秩的研究来推断它们来自的两个总体分
8、布有无显著差异。 检验的基本步骤 首先将两组样本数据(X1,X2,Xn)和( Y1,Y2,Yn )混合并按升序排序,得到每个数据各自的秩Ri,基本思想,分别对两组样本的秩求平均,得到两个平均秩Wx/m和WY/m,然后比较它们的大小,若差值较大,说明原假设很可能不成立。 计算两个样本各自优先于对方的秩的个数U1、U2,即 然后对U1、U2大小进行比较,若它们相差较大时,则有必要怀疑原假设的真实性。 计算WilcoxonW统计量,其为上述U1、U2较小者所对应的秩和,计算曼-惠特尼U统计量, 小样本下,U统计量服从Mann-Whitney分布 即 大样本下,U统计量近似服从正态分布,统计决策 在小
9、样本下,依据U统计量的概率P值进行决策;在大样本下,则依据Z统计量的概率P值进行决策。 若概率P值小于显著性水平 ,则拒绝原假设,即认为样本来自的两总体分布存在显著差异;反之,则差异不显著。,具体计算举例以课本P199页数据为例,曼-惠特尼U检验SPSS基本操作 (以两独立样本使用寿命为例),分析 非参数检验 2个独立样本,由于本题中涉及是小样本,因此采用U检验,相应概率为精确概率,由于0.04小于0.05,所以拒绝原假设,所以认为两种工艺下产品使用寿命的分步存在显著差异,方法二:两独立样本K-S检验,概念 K-S检验不仅能够对单个总体的分布是否与某一理论分布存在显著差异进行检验,还可以对两个
10、总体的分布是否存在差异进行检验,基本思想,基本思想同前面单样本K-S检验,但也有些不同,就是分析的对象是变量值的秩。 基本步骤 首先,将两组样本混合并按升序排序 然后,分别计算两组样本秩的累计频数和累计频率。 最后,计算两组累计频率的差,得到秩的差值序列并得到D统计量,根据D统计量得出的概率P与显著性水平大小进行比较判断。,两独立样本K-S检验SPSS基本操作 (以两独立样本-使用寿命为例),方法三:两独立样本的游程检验,该方法的基本思想与单样本游程检验的基本相同,不同的是计算游程数的方法。两独立样本的游程数依赖于变量的秩。 首先,将两组样本混合并按升序排序,在变量值排序的同时,对应的组标记值
11、也会随之重新排列 然后,对组标记值序列按前面的计算游程的方法进行计算游程数。若游程数较少,则说明两总体有较大差异。反之,则差异不大。,基本思想,根据游程数计算Z统计量,最后,进行统计决策。,两独立样本的游程检验SPSS的基本操作 (以两独立样本-使用寿命为例),方法四:两独立样本的 极端反应检验,将一组样本作为控制样本,另一组样本作为实验样本,以控制样本作为对照,检验实验样本相对于控制样本是否出现了极端反应。如果实验样本没有出现极端反应,则认为两总体分布无显著差异;反之则差异显著。,基本思想,具体分析过程: 首先,将两组样本混合按升序排序 然后,求出控制样本的最小秩 Qmin 和最大秩 Qma
12、x,并计算出跨度S= Qmax- Qmin+1 接着, 为消除样本数据中极端值对分析结果的影响,计算跨度之前可按比例去除控制样本中部分靠近两端的样本值,然后再求跨度,得到截头跨度。,极端反应注重对跨度和截头跨度的分析。针对跨度或截头跨度计算的H检验统计量为: 小样本下,H统计量服从Hollander分布;大样本下,H统计量近似服从正态分布。 最后,进行统计决策。,两独立样本的极端反应检验SPSS的基本操作 (以两独立样本-使用寿命为例),应用举例(以城镇和农村储户存款金额比较为例 ),双样本 Kolmogorov-Smirnov 检验,Wald-Wolfowitz 检验,练习题,现有数据关于患
13、者服用两种不同安眠药后睡眠时间延长情况,请用四种不同方法来检验两种不同安眠药对睡眠时间延长分布是否有显著差异?,第三节多独立样本的非参数检验,中位数检验 Kruskal-Wallis检验 Jonckheere-Terpstra检验,四城市周岁儿童身高样本数据,中位数检验,概念:通过对多组独立样本的分析,检验它们来自的总体的中位数是否存在显著差异。 基本思想:如果多个总体的中位数没有显著差异,那么这个共同的中位数应在各样本组中均处在中间位置上。,基本思想,分析步骤: 首先,将多组样本混合按升序排序,并求出混合样本的中位数。 然后,分别计算各组样本中大于和小于上述中位数的样本个数,形成列联表。 接
14、着,利用卡方检验方法分析各组样本来自的总体对于上述中位数的分布是否一致。如果各组中大于(或小于)上述中位数的样本比例大致相同,则可认为多组样本有共同的中位数,它们来自的总体的中位数没有显著差异。反之,则有显著差异。 最后,进行统计决策。,计算示例,多独立样本的中位数检验SPSS基本操作 以儿童身高.sav为例,分析 非参数检验 K个独立样本,因为概率P小于0.05,所以拒绝原假设,即认为四个不同城市的儿童身高的中位数有显著差异,Kruskal-Wallis检验,概念:检验实质是两独立样本的曼-惠特尼检验在多个独立样本下的推广,用于检验多个总体的分布是否存在显著差异。 基本思想: 首先,将多组样
15、本数据混合并按升序排序,求出各变量值的秩.,基本思想,其次,考察各组秩的均值是否存在显著差异。构造K-W检验统计量为: 最后,根据K-W统计量相应的概率P值与显著性水平 大小进行比较,作出决策。,多独立样本的Kruskal-Wallis检验的SPSS操作 以儿童身高.sav为例,因为概率P值小于0.05,所以拒绝原假设,即认为四个城市的周岁儿童身高的平均秩差异是显著的,总体分布是存在显著差异的,Jonckheere-Terpstra检验,概念:用于检验多个独立样本来自的多个总体的分布是否存在显著差异的非参数检验方法。 基本思想:同两独立样本的曼-惠特尼U检验类似,也是计算一组样本的观察值小于其
16、他组样本观察值的个数。,基本思想,小样本下,构造的J-T统计量为: 大样本下,构造的Z统计量为:,最后,根据统计量得到的概率P值与显著性水平大小进行比较,作出决策,多独立样本的Jonckheere-Terpstra检验的SPSS操作 以儿童身高.sav为例,练习,现有不同地区不同性质工作的职工工资数据保存在文件“职工工资.sav”中,如果定义一个分组变量,将我国东部、中部和西部各省标上1,2,3作为分组值,下面来考察东部、中部和西部的职工平均工资是否存在显著差异( =0.05) ?,两配对样本的非参数检验是在对总体分布不甚了解的情况下,通过对两组配对样本的分析,推断样本来自的两个总体的分布是否
17、存在显著差异的方法。,第四节 两配对样本的非参数检验,概念,Mcnemar 符号检验 Wilcoxon符号检验,方法,方法一:两配对样本的Mcnemar方法,McNemar检验是一种变化显著性检验,它将研究对象自身作为对照者检验其“前后”的变化是否显著。其原假设是两配对样本来自的两总体的分布无显著性差异。,基本思想,该方法主要针对服从二项分布的变量,因此如果变量不是二项分布,还要先对数据进行转化,然后再检验。因此有一定的局限性,分析 非参数检验 2个相关 样本,SPSS基本操作(以统计学.sav为例),因为概率P大于0.05,所以不能拒绝原假设,即认为学习统计学前后学生对其重要性认识没有发生显
18、著变化,方法二:两配对样本符号检验,其检验方法与McNemar检验有类似的解决思路,且利用正负号的个数实现检验。 基本步骤为: 首先,分别用第二组样本的各个观察值减去第一组样本的对应观察值。差值为正则记为正号,为负则记为负号; 然后,将正号的个数与负号的个数进行比较。,基本思想,若两种符号个数大致相同,则认为两组配对样本的数据分布差距较小;反之,则差距较大。 检验方法仍然采用二项分布检验方法。,SPSS基本操作(以训练成绩.sav为例),由于概率P值大于0.05,因此不能拒绝原假设,即认为训练前后的成绩分布没有显著差异,也就是新方法效果不显著,方法三:两配对样本Wilcoxon符号秩检验,首先
19、,按照符号检验的方法,用正负号分别表示两组对应样本数据差值情况。 然后,将差值变量进行升序排序,并求出差值变量的秩。分别计算正号秩及统计量W+ 和负号秩及统计量W-,基本思想,小样本下,检验统计量为: W=min( W+ ,W-) 大样本下,检验统计量为:,最后,进行统计决策,SPSS基本操作(以训练成绩.sav为例),因为概率P值大于显著性水平0.05,所以不能拒绝原假设,认为训练前后的成绩分布没有显著差异,即新方法效果不显著,练习,一车间为了提高工作效率,对某种零件的加工过程进行改进,为了比较加工时间是否明显减少,抽取15名工人对比他们改革前后零件的加工时间,得到相应的数据存放在“改进前后
20、零件加工时间.sav”中,试根据数据检验改进后零件的加工时间是否明显减少(=0.05)?采用两配对样本符号检验和两配对样本Wilcoxon符号秩检验方法,第五节多配对样本的非参数检验,多配对样本的非参数检验是通过分析多组配对样本数据,推断样本来自的多个总体的中位数或分布是否存在显著差异。 Eg:对多个评委对同一批歌手比赛打分标准是否一致。,概念,Friedman检验 Cochran Q检验 Kendall协同系数检验,方法,方法一:多配对样本的Friedman检验,概念:多配对样本的Friedman检验是利用秩实现对多个总体分布是否存在显著差异的非参数检验方法。 基本思想: 比较每种处理下秩总和是否
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智能消费设备的供应链管理与物流协同优化考核试卷
- 光气及光气化产品危险性分析及安全措施考核试卷
- 农药制造中的用户需求分析与产品创新考核试卷
- 中等教育的音乐欣赏与音乐创作考核试卷
- DB11∕T 1776-2020 水利工程绿色施工规范
- 楼阁国画课件教学课件
- 科普宣传课件教学课件
- 淮阴工学院《建筑结构试验与测试技术》2022-2023学年第一学期期末试卷
- 淮阴工学院《机械制造技术》2022-2023学年第一学期期末试卷
- 石油钻采机械相关项目投资计划书范本
- 植物的象征意义
- 基础护理质量标准及考核评分表
- 夏商周考古课件 第5章 西周文化(1、2节)
- 商务条款响应表
- 二年级上册美术教案-7. 去远航 -冀教版
- 二年级上册语文课件-10《日月潭》|人教(部编版) (共19张PPT)
- 《诗情画意》教学设计
- 中华文化与传播教材课件
- Unit3 Sports and Fitness Reading for writing健康生活讲义-高中英语人教版(2019)必修第三册
- Unit 4 Viewing Workshop 课件-高中英语北师大版(2019)选择性必修第二册
- 血尿尿频尿急尿痛课件
评论
0/150
提交评论