版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五讲非参数检验2统计推断方法是根据样本数据推断总体特征(均值,方差等)的方法,包括参数检验和非参数检验两种方法。参数检验是适用于总体分布已知的情况。非参数检验适用于总体分布未知或知道甚少的情况。(由于在推断过程中不涉及有关总体分布的参数,故得名“非参数”检验)3单样本的非参数检验两配对样本的非参数检验两独立样本的非参数检验多独立样本的非参数检验多配对样本的非参数检验4单样本的非参数检验SPSS单样本非参数检验是对单个总体的分布形态等进行推断的方法,其中包括:K-S检验二项分布检验游程检验
51.单样本K-S检验
K-S检验是以俄罗斯数学家KolmogorovSmirnov命名的一种非参数检验方法。该方法能够利用样本数据推断样本来自的总体是否服从某一理论分布,是一种拟合优度的检验方法,适用于探索连续性随机变量的分布。
原假设:样本来自的总体与指定的理论分布无显著差异。SPSS的理论分布主要包括正态分布、均匀分布、指数分布和泊松分布等。
基本原理:首先,在原假设成立的前提下,计算各样本观测值在理论分布中出现的累计概率值;其次,计算各样本观测值的实际累计概率值;然后计算两者之差;最后,计算差值序列中的最大绝对差值,即
6通常,由于实际累计概率为离散值,因此修正为称为K-S统计量。小样本下,原假设成立时统计量服从Kolmogorov分布;大样本下,原假设成立时统计量服从分布:显然,若样本总体分布与理论分布差异不明显,那么不应较大。若统计量的P值大于显著性水平,则接受原假设;反之,拒绝原假设。无论大样本还是小样本,SPSS仅给出大样本下的和对应的概率P值。
72.
二项分布检验(二值数据)
原假设:样本来自的总体与指定的概率为的二项分布无显著差异。
基本原理:1小样本情况(精确检验法):计算次试验中某类(1或0)事件出现的次数小于等于次的概率,即2大样本情况(近似检验):采用检验统计量,在原假设成立下统计量近似服从正态分布,即(当小于时加0.5,当大于时减0.5。)SPSS自动计算上述精确概率和近似概率值。若概率值小于显著性水平,则拒绝原假设,认为样本来自的总体与指定二项分布有显著差异;若大于显著性水平,则接受原假设,认为样本来自的总体与指定的二项分布无显著差异。8
生活中的有些总体只能划分为两类,如性别、硬币的正反面等。通常将这样的二值分别用1和0表示。如果进行次独立重复实验,则出现两类的次数可以用离散型随机变量来表述。如果随机变量值为1的概率设为,则为0的概率为,形成二项分布。93.
变量值随机性检验(游程检验)
通过对样本变量值的分析,实现对总体的变量值出现是否随机进行验。
原假设:总体变量值出现是随机的。
基本原理:利用游程数构造检验统计量。游程数(Runs),样本序列中连续出现相同的变量值的次数。例如,如果28次投掷硬币出现正反面的变量值序列为1011011010011000101010000111游程数为17。如果硬币的正反面出现是随机的,那么在该数据序列中,许多个1或0连续出现的可能性将不太大,同时,1和0频繁交叉出现的可能性也会较小。故游程数太大或太小都将表明变量值存在不随机现象。设为出现1的个数,为出现0的个数,当,较大时,游程的抽样分布的均值为:10方差为:大样本时,游程近似服从正态分布,即其中,为游程数。SPSS自动计算值和概率P值。
11两配对样本的非参数检验
两配对样本的非参数检验是在对总体分布不甚了解的情况下,通过对两组配对样本的分析,推断样本来自的两个配对总体的分布是否存在显著差异的方法。配对样本的样本数是相同的,且各样本值的先后次序是不能随意更改的。
SPSS提供的检验方法有:符号检验
Wilcoxon符号秩检验McNemar检验MarginalHomogeneity检验121.符号检验
原假设:两配对样本来自的两总体的分布无显著差异基本思路:(1)分别用第二组样本的各个观察值减去第一组对应的观察值。差值为正记为正号,差值为负记为负号。(2)将正号的个数与负号的个数进行比较:若正、负号个数大致相当,则认为两组配对样本的数据分布差距较小;相反,如果正、负号个数相差较多,则可认为两个配对样本的数据分布差距较大。
原理:二项分布检验,检验正号个数和负号个数的分布是否服从概率p为0.5的二项分布,即对正负符号变量进行单样本二项分布检验。注:该方法注重对变化方向的分析,只考虑数据变化的性质,没有考虑变化幅度,即定性而非定量,故对数据的利用不充分。132.Wilcoxon符号秩检验
原假设:两配对样本来自的两总体的分布无显著差异。
基本思想:(1)同符号检验的基本思路(1),但这里要保存差值数据;(2)将差值变量按升序排序,并求出差值变量的秩;(3)分别计算正号秩总和和负号秩总和,如果总样本数为,则的最小可能值为0,最大可能值为。如果与大致相当,则说明一组样本值大于另一组样本值和小于时的幅度大致相当,两组样本数据差的正负变化程度基本相当,两配对总体的分布无显著差异。原假设成立下,小样本的检验统计量服从Wilcoxon符号秩分布;大样本下利用可构造Z统计量,它近似服从正态分布。143.McNemar检验
McNemar检验是基于列联表进行分析的,它注重处理前后的变化情况。McNemar检验采用二项分布检验的方法,计算处理前后变化的分布是否服从概率p为0.5的二项分布。在小样本下计算二项分布的累积精确概率,大样本下采用修正的Z统计量,它近似服从正态分布。SPSS自动计算Z统计量和相应的概率P值。如果拒绝原假设,则认为处理前后变化的分布与p为0.5的二项分布存在显著差异,即两配对样本来自的两总体的分布存在显著差异;反之,接受则认为没有显著差异。注:这里分析的变量是二值变量。在实际应用中,若不是,应首先进行数据转换方可采用该方法。故它在应用范围上有一定局限性。McNemar检验是一种变化显著性检验,它将研究对象自身作为对照者检验其“前后”的变化是否显著。
原假设:两配对样本来自的两总体的分布无显著差异。4.MarginalHomogeneity检验
是McNemar方法向多分类情形下的扩展15两独立样本的非参数检验两独立样本的非参数检验是对总体分布不太了解的情况下,通过对两组独立样本的分析来推断样本来自的两个总体的分布等是否存在显著差异的方法。独立样本是指在两个总体中的分别随机抽样互相没有影响。检验方法有:
曼-惠特尼U检验
K-S检验
W-W游程检验极端反应检验1.
曼-惠特尼U检验(Mann-WhitneyU)
原假设:两组独立样本来自的两总体分布无显著差异。
基本原理:通过对两组样本平均秩的研究来实现推断。秩,是变量值排序的名次。可以将数据按升序排列,每个变量值都会有一个在整个变量值序列中的名次,这个名次就是变量值的秩。变量值有几个,对应的秩便有几个。首先,将两组样本数据和混合并按升序排序,得到每个数据各自的秩;然后,分别对两组样本数据的秩求平均,得到两个平均秩和。对两个平均秩的差距进行比较:如果两个平均秩相差甚远,则应是一组样本的秩普遍偏小,另一组样本的秩普遍偏大的结果,也就是一组样本的值普遍偏小,另一组样本的值普遍偏大的结果。此时,原假设很可能不成立;再次,计算样本每个秩优先于样本每个秩的个数,以及样本每个秩优先于样本每个秩的个数。并对和进行比较:如果和相差较大,则有必要怀疑原假设的真实性;最后,依据和计算WilcoxonW统计量和曼-惠特尼U统计量。曼-惠特尼U统计量计算公式为:式中,W值为WilcoxonW;为W对应样本组的样本个数。小样本下,U统计量服从曼-惠特尼分布。SPSS自动计算U统计量和概率P值。并依据此U统计量的概率P值决策。
大样本下,U统计量近似服从正态分布,计算公式为
SPSS将自动计算Z统计量和对应的概率P值。依据Z统计量的概率P值决策。不过,这些计算过程也可以通过SPSS的数据处理功能自己计算。2.K-S检验
K-S检验不仅能够检验单个总体是否服从某一理论分布,还能够检验两总体是否存在显著差异。
原假设:两组独立样本来自的两总体的分布无显著差异。
基本原理与前面讨论的单样本情况大体一致。主要差别在于:这里是以变量值的秩作为分析对象,而非变量值本身。首先,将两组样本混合并按升序排序;然后,分别计算两组样本秩的累计频数和累计频率;最后,计算两组累计频率的差,得到秩的差值序列并得到D统计量(同单样本的K-S检验,但无须修正)。
SPSS中将自动计算在大样本下的的观测值和概率P值。据此作出决策。3.
游程检验(Wald-WolfwitzRuns)
两独立变量的游程检验用来检验两独立样本来自的总体的分布是否存在显著差异。不同于单样本情况的目的。
原假设:两组独立样本来自的两总体的分布无显著差异。
基本原理和单样本情况基本相同,不同的是计算游程数的方法。在两独立样本的游程检验中,游程数依赖于变量的秩。
步骤:(1)将两组样本混合并按升序排序。在变量值排序的同时,对应的组标记值会随之重新排列;(2)对组标记值序列按前面讨论的计算游程的方法计算游程数,如果两总体的分布存在较大差距,那么游程数会相对比较少;如果游程数比较大,则应是两组样本值充分混合的结果,两总体的分布不会存在显著差异。(3)根据游程数据计算Z统计量,该统计量近似服从正态分布。SPSS自动计算Z统计量的观测值和对应的概率P值。根据P值决策。4.
极端反应检验(MosesExtremeReactions)
该检验法从另一角度检验两独立样本所来自的两总体分布是否存在显著差异。
原假设:两组独立样本来自的两总体的分布无显著差异。
基本原理:将一组样本作为控制样本,另一组样本作为实验样本。以控制样本作为对照,检验试验样本相对于控制样本是否出现了极端反应。如果试验样本没有出现极端反应,则认为两总体分布无显著差异,反之,有显著差异。
步骤:(1)将两组样本混合按升序排序;(2)求出控制样本的最小秩和最大秩,并计算出跨度(Span):(3)为消除样本数据中极端值对分析结果的影响,在计算跨度之前可按比例(通常为5%)去除控制样本中部分靠近两端的样本值,然后再求跨度,得到截头跨度。
极端反应检验注重对跨度和截头跨度的分析:如果跨度或截头跨度较小,则是两组样本数据无法充分混合,一组样本值显著大于另一组样本值的结果,可以认为相对控制样本和实验样本出现了极端反应,则样本来自的两总体分布存在显著差异;相反,如果跨度或截头跨度较大,则是两组样本数据充分混合,一组样本值没有显著大于另一组样本值的结果,可以认为没有出现极端反应,则样本来自的两总体没有显著差异。对跨度或截头跨度计算H检验统计量,即式中,为控制样本的样本数,为控制样本在混合样本中的秩;为控制样本的平均秩。SPSS自动计算H统计量及其概率P值,据此决策。小样本下,H统计量服
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 定量秤相关行业投资方案
- 出版物发行零售行业相关投资计划提议
- 概率复习教学课件公开
- GPS高空探测系统相关项目投资计划书
- 幼儿园学期规划润物无声造福未来计划
- 《酒店礼节礼貌规范》课件
- 实习实训基地建设方案计划
- DSA脑血管造影术后皮肤医用粘胶相关损伤的护理
- 《砂石工业大气污染防治技术指南》(编制说明编写要求)
- 《设备的设计变量》课件
- 2022年诸暨市高中提前招生考试中考数学试卷及解析
- 集体土地使用权流转协议书
- 2012NCCN指南更新解读结直肠癌
- 第三讲_阴离子型黏土插层复合材料
- 供销合作社知识答题最新
- MATLAB多旅行商问题源代码
- 节假日机房安全巡检记录表
- 电机维修工艺―高压电机定子绕组嵌线工艺规程
- 《电气安全用具》PPT课件
- 西北工业大学四开题报告模板
- 麓湖营销体系及逻辑
评论
0/150
提交评论