第九章非参数检验_第1页
第九章非参数检验_第2页
第九章非参数检验_第3页
第九章非参数检验_第4页
第九章非参数检验_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章非参数检验

参数检验:是在给定或假定总体的分布形式基础上,对总体的未知参数进行估计或者检验。它一方面以明确的总体分布为前提;另一方面需要满足某些总体参数的假定条件。

非参数检验:是在不符合参数检验的条件下使用的另一类检验方法。与参数统计相比,非参数检验对总体分布不作严格假定,特别适用于计量信息较弱的资料,往往依据数据的顺序、等级资料即可进行统计推断。由于这些方法一般不涉及总体参数故得名。非参数检验(分布检验)所要处理的问题是:

(1)两个总体的分布未知,它们是否相同(用两组样本来检验);(2)(由一组样本)猜出总体的分布(假设),然后用(另一组)样本检验它是否正确。非参数检验方法1.二项分布检验(Binomialtest)2.单样本K-S检验(1-SampleKolmogorov-Smirnovtest)3.两独立样本检验(2independentSamplesTest)4.多独立样本检验(KindependentSamplesTest)5.两相关样本检验(2relatedSamplesTest)6.多相关样本检验(KrelatedSamplesTest)9.1二项分布检验Binomialtest二项分布:在现实生活中有很多的取值是两类的,如人群的男和女、升学与落榜、三好学生和非三好学生、投掷硬币的正面和反面。这时如果某一类出现的概率是P,则另一类出现的概率就是1-P。这种分布称为二项分布。二项分布检验:就是根据收集到的样本数据,推断总体分布是否服从某个指定的二项分布。一般零假设为:H0:样本来自某一分布总体或与某分布无显著差异。

SPSS将自动计算,并给出对应的相伴概率值。如果相伴概率值小于或等于用户的显著性水平,则应拒绝零假设;反之,则接受零假设。实例:为验证某批产品的一等品率是否达到90%,现从该批产品中随机抽取23个样品进行检测,结果有19个一等品(1-一等品,0-非一等品)。(变量2个:一等品和个数,Cases2个:1:19和0:4)Analyze->NonparametricTests->BinomialTestVariable:一等品TestProportion:0.9比较有用的结果:两组个数和sig=.193>0.5,不能拒绝零假设,认为该批产品的一等品率达到了90%。9.2单样本K-S检验

单样本K-S检验是利用样本数据推断总体是否服从某一理论分布,适用于探索连续型随机变量的分布形态(判断定距变量的分布情况):—Normal正态分布;—Uniform均匀分布;—Poisson泊松分布;—Exponential指数分布。K-S检验的统计分析过程

Analyze-NonparametricTests-1SampleK-S。然后把变量选入VariableList。再在下面TestDistribution选中零假设的分布(Normal、Poisson、Uniform和Exponential)作为零假设。由于sig=.074›.05,接受零假设由于sig=.000<.05,拒绝零假设9.3两独立样本非参数检验两独立样本的非参数检验是在对总体分布不很了解的情况下,通过分析样本数据,推断样本来自的两个独立总体分布是否存在显著差异。一般用来对两个独立样本的均数、中位数、离散趋势、偏度等进行差异比较检验。常用的两种方法有:—Mann-WhitneyU检验;—两独立样本的K-S检验Wilcoxon(Mann-Whitney)秩和检验Wilcoxon(或称Mann-Whitney)秩和检验的原理:假定第一个样本有m个观测值,第二个有n个观测值。把两个样本混合之后把这m+n个观测值升幂排序,记下每个观测值在混合排序下面的秩。之后分别把两个样本所得到的秩相加。记第一个样本观测值的秩的和为WX而第二个样本秩的和为WY。这两个值称为Wilcoxon统计量。直观上看,如果WX与WY之中有一个显著地大,则可以选择拒绝零假设。该检验需要的唯一假定就是两个总体的分布有类似的形状(不一定对称)。秩(rank)

非参数检验中秩是最常使用的概念。什么是一个数据的秩呢?一般来说,秩就是该数据按照升序排列之后,每个观测值的位置。例如我们有下面数据Xi159183178513719Ri75918426310这下面一行(记为Ri)就是上面一行数据Xi的秩。

SPSS统计分析过程

Analyze-NonparametricTests-2IndependentSamples。把变量(gdp)选入TestVariable

List;再把用1和2分类的变量area输入进GroupingVariable,在DefineGroups输入1和2。在TestType选中Mann-Whitney。最后OK即可两样本分布的Kolmogorov-Smirnov检验

两独立样本的Kolmogorov-Smirnov检验主要推测两个样本是否来自具有相同分布的总体。其基本思想是:首先将两组样本数据混合并按升序排列,分别计算两组样本秩的累计频率和每个点上的累计频率;最后将两个累计频率相减,得到差值序列数据。如果这个差值序列数据很大,则零假设(样本来自的两独立总体均质没有显著差异)不一定成立。两独立样本的K-S检验适用于大样本情况。SPSS统计分析过程

Analyze-NonparametricTests-2IndependentSamples。把变量(duration)选入TestVariableList;再把用1和2分类的变量type输入到GroupingVariable,在DefineGroups输入1和2。在TestType选中Kolmogorov-SmirnovZ。最后OK即可9.4多独立样本非参数检验

(KindependentSamplesTest)通过分析多个样本数据,推断它们的分布是否存在显著性差异。方法有三种:1、中位数检验(Median):是通过对中位数的研究来实现推断的2、K-W检验:是通过对推广的平均秩的研究来实现推断的3、J-T:与两个独立样本检验的Mann-WhitneyU类似1、中位数检验法

是通过对来自两个独立总体的两个样本数据在联合中位数上、下分布的情况,来推断两个样本是否来自同一个总体的。其基本思想是假设两个样本来自的总体分布相同,这样,每个样本中在联合中位数上下出现的数据个数应大体相同。若两个样本在中位数上下出现的数据个数差异较大,则有理由否定两个样本来自同一总体的假设。检验过程1、将两个样本数据混合从大到小排列。2、求混合排列的中位数。3、分别找出每一样本中大于混合中位数及小于混合中位数的数据个数,列成四格表。4、对四格表进行卡方检验。若卡方检验结果显著,则说明两样本的集中趋势(中位数)差异显著。SPSS统计分析过程

Analyze-NonparametricTests-KIndependentSamples。把变量(这里是price)选入TestVariableList;再把数据中用1、2、3来分类的变量group输入GroupingVariable,在DefineRange输入1、2、3。在下面TestType选中Median。最后OK即可

秩和检验法是一种直接将两样本的数据混在一起排成等级,并用容量较小那个样本的各数据等级之和与临界值相比较进行差异的显著性检验的方法。方法和Wilcoxon-Mann-Whitney检验的思想类似。Kruskal-Wallis关于多个样本的秩和检验

1、把两个样本的数据混在一起由小到大排成等级,最小的列为1等,其次列为2等,以此类推。当遇到相同数据时,用平均等级来表示。2、计算容量较小的样本数据等级之和,即秩和,用T表示。当两样本容量相等时,以较小的秩和为T。3、将计算的T值与秩和检验表中某α水平下的界限值相比较,判断两样本差异是否显著。若T1<T<T2,则两样本差异不显著,接受原假设;若T≤T1或T≥T2,则拒绝原假设。

Kruskal-Wallis关于多个样本的秩和检验

SPSS统计分析过程

Analyze-NonparametricTests-KIndependentSamples。把变量选入TestVariable

List;再把数据中用1、2、3来分类的变量group输入GroupingVariable,在DefineGroups输入1、2、3。在下面TestType选中Kruskal-WallisH。最后OK即可秩和检验的可靠性数理统计学家已经证明如下结论:1)在小样本的情况下,秩和检验的精度几乎与t检验一样。2)在原始总体为偏态分布的情况下,秩和检验的精度比t检验高。3)在原始总体服从“抛物线型”分布的情况下,秩和检验最为不利,其精度没有t检验高。Kruskal-Wallis关于多个样本的秩和检验

9.5两相关样本非参数检验在对总体分布不很清楚的情况下,两相关样本检验(2relatedSamplesTest)非参数检验一般用于同一研究对象(或两配对对象)分别给予两种不同处理的效果比较,以及同一研究对象(或两配对对象)处理前后的效果比较。前者推断两种效果有无差异,后者推断某种处理是否有效。—McNemar变化显著性检验;—Wilcoxon符号平均秩检验符号平均秩检验法(Wilcoxon)计算各对数据的差数,取其绝对值。把所有差数的绝对值由小到大排成等级,称为秩。绝对值最小的差数列为1等,其次列为2等,以此类推。当遇到相同差数时,用平均等级来表示。计算正差等级之和,用符号T+表示;计算负差等级之和,用负号T-表示。T+和T-最小者,用符号T表示。等级之和称为秩和。将T值与符号秩和检验表所列某α水平的临界值相比较,来判断差异是否显著。以三岁幼儿的两个相关样本关于颜色命名测验得分进行符号秩和检验。符号平均秩检验法(Wilcoxon)统计决断T+和T-中较小者T越小,正差等级之和与负差等级之和相差“太大”的可能性就越大。如T过小,小于或等于负号秩和检验表中的临界值T0.05时,说明仅由于抽样误差所致的可能性很小,两样本差异显著,我们有95%的把握拒绝原假设;如果T>T0.05,则差异不显著,接受原假设。SPSS统计分析过程Analyze->NonparametricTests->2relatedSamples

将配对变量选入TestPairs:Testtype:选一种或多种单击“OK”。9.6多相关样本非参数检验对多个被测试者,多个打分,看打分是否有显著性差异。方法有三种:CochranQ:要求样本数据为二值的(1-满意0-不满意)Friedman:利用秩实现Kendall协同系数检验:H0:协同系数为0(评分标准不相关的或者是随机的)Friedman秩和检验

前面讨论了两因子试验设计数据的方差分析,那里所用的F检验需要假定总体的分布为正态分布。有一种非参数方差分析方法,称为Friedman(两因子)秩和检验,或Friedman方差分析。它适用于两个因子的各种水平的组合都有一个观测值的情况。Friedman秩和检验

其实现原理是:首先以样本为单位,将各个样本数据按照升序排列,求得各个样本数据在各自行中的秩,然后计算各样本的秩和及平均秩。如果多个配对样本的分布存在显著差异,那么数值普遍大的组,秩和必然偏大;如果各样本的平均秩大致相当,那么可以认为各组的总体分布没有显著差异。SPSS统计分析过程

Analyze-NonparametricTests-KRelatedSamples。然后把变量(这里是a、b、c)选入TestVariableList。在下面TestType选中Friedman。最后OK即可Kendall协同系数检验在实践中,常需要按照某些特别的性质来多次对一些个体进行评估或排序;比如几个(m个)评估机构对一些(n个)学校进行排序。人们想要知道,这些机构的不同结果是否一致。这就要运用Kendall协同系数检验。其检验假设是:H0:这些对于不同学校的排序是不相关的或者是随机的;H1:这些对不同学校的排序是正相关的或者是多少一致的。Kendall协同系数下面是4个独立的环境研究单位对15个学校排序的结果每一行为一个评估机构对这些学校的排序。看上去不那么一致(也有完全一致的):

SPSS统计分析过程

Analyze-NonparametricTests-KRelatedSamples。然后把变量(这里是s1、s2、…、s15

)选入TestVariableList。在下面TestType选中Kendall’sW

。最后OK即可数据school.savSPSS的Kendall协同系数检验的输出

关于二元响应的Cochran检验

前面讨论了两因子方差分析问题的Friedman秩和检验。但是当观测值只取诸如0或1两个可能值时,由于有太多同样的数目(只有0和1),排序的意义就很成问题了。Cochran检验就是用来解决这个问题的一个非参数检验。先看一个例子关于瓶装饮用水的调查。20名顾客对4种瓶装饮用水进行了认可(记为1)和不认可(记为0)的表态。我们感兴趣的是这几种瓶装水在顾客眼中是否有区别。这里的零假设是这些瓶装水(作为处理)在(作为区组的)顾客眼中没有区别。下表是数据,每一行为20个顾客对某一饮料的20个观点(0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论