吴喜之非参数检验教程_第1页
吴喜之非参数检验教程_第2页
吴喜之非参数检验教程_第3页
吴喜之非参数检验教程_第4页
吴喜之非参数检验教程_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

非参数检验说明:非参数检验这章,请看下面吴喜之教授的讲义,更为具体的可参看《统计分析与SPSS的应用》薛薇编著人大出版社,2002.7第二次印刷非参数检验的概念是指在总体不服从正态分布且分布情况不明时,用来检验数据资料是否来自同一个总体假设的一类检验方法。由于这些方法一般不涉及总体参数故得名。这类方法的假定前提比参数性假设检验方法少的多,也容易满足,适用于计量信息较弱的资料且计算方法也简单易行,所以在实际中有广泛的应用。非参数检验的过程1.Chi-Squaretest卡方检验2.Binomialtest二项分布检验3.Runstest游程检验4.1-SampleKolmogorov-Smirnovtest一个样本柯尔莫哥洛夫-斯米诺夫检验5.2independentSamplesTest两个独立样本检验6.KindependentSamplesTestK个独立样本检验7.2relatedSamplesTest两个相关样本检验8.KrelatedSamplesTest两个相关样本检验12.1卡方检验Chi-Squaretest

这里介绍的卡方检验可以检验列联表中某一个变量的各个水平是否有同样比例或者等于你所想象的比例(如5:4:1)实例1:掷骰子300次,变量LMT,1、2、3、4、5、6分别代表六面的六个点,试问这骰子是否均匀。数据data12-01(300个cases)。Analyze->NonparametricTests->ChiSquareTestVariable:lmt想要检验的变量由于这是一个均匀分布检测,使用默认选择(ExpectedValues:Allcategoriesequal作为零假设);比较有用的结果:sig=.111>0.5,不能拒绝零假设,认为均匀。实例1的数据可以组织成:两个变量(side面和number次数),6个cases。但在卡方检验前要求用number加权。结果同。补充:卡方检验实例实例:心脏病人猝死人数与日期的关系,收集168个观测数据。其中用1、2、3、4、5、6、7表示是星期几死的。而人数分别为55、23、18、11、26、20、15。推断心脏病人猝死人数与日期的关系是否为2.8:1:1:1:1:1:1。(变量2个:死亡日期和死亡人数,Cases7个)加权:Data->WeightCases:死亡人数Analyze->NonparametricTests->ChiSquareTestVariable:死亡日期ExpectedValues:2.8:1:1:1:1:1:1

比较有用的结果:sig=.256>0.5,不能拒绝零假设,认为心脏病人猝死人数与日期的关系为2.8:1:1:1:1:1:1。12.2二项分布检验Binomialtest二项分布:在现实生活中有很多的取值是两类的,如人群的男和女、产品的合格和不合格、学生的三好学生和非三好学生、投掷硬币的正面和反面。这时如果某一类出现的概率是P,则另一类出现的概率就是1-P。这种分布称为二项分布。实例1:掷一枚比赛用的挑边器31次,变量tbh,1为出现A面、2为出现A面,试问这挑边器是否均匀。数据data12-03(31个cases)。Analyze->NonparametricTests->BinomialTestVariable:tbh由于这是一个均匀分布检测,使用默认选择(TestProportion:0.5);比较有用的结果:两组个数和sig=1.00>0.5,不能拒绝零假设,认为挑边器是均匀。实例1的数据可以组织成:两个变量(side面和number次数),2个cases。但在二项分布检验前要求用number加权。结果同。补充:二项分布检验实例实例:为验证某批产品的一等品率是否达到90%,现从该批产品中随机抽取23个样品进行检测,结果有19个一等品(1-一等品,0-非一等品)。(变量2个:一等品和个数,Cases2个:119和04)加权:Data->WeightCases:个数Analyze->NonparametricTests->BinomialTestVariable:一等品TestProportion:0.9比较有用的结果:两组个数和sig=.193>0.5,不能拒绝零假设,认为该批产品的一等品率达到了90%。12.3游程检验Runstest单样本变量随机性检验是对某变量值出现是否随机进行检验。实例1(同二项分布检验)

:掷一枚比赛用的挑边器31次,变量tbh,1为出现A面、2为出现A面,试问这挑边器出现AB面是否随机。数据data12-03(31个cases)。Analyze->NonparametricTests->Runs

TestVariable:tbhCutPoint:Custom:2比较有用的结果:总case数(31)、游程Run数(21)、sig=.142>0.5,不能拒绝零假设,认为挑边器出现AB面是随机的。12.4一个样本柯尔莫哥洛夫-斯米诺夫检验

1-SampleKolmogorov-Smirnovtest单样本K-S检验是利用样本数据推断总体是否服从某一理论分布,适用于探索连续型随机变量的分布形态(判断定距变量的分布情况):Normal正态分布、Uniform均匀分布、Poisson泊松分布、Exponential指数分布。实例

:卢瑟福和盖革作了一个著名的实验,他们观察了长为7.5秒的时间间隔里到达某个计数器的由某块放射物资放出的alfa粒子质点数,共观察了2608次。数据data12-05(1个变量zd,2608个cases,按0-10排序)。试问这种分布规律是否服从泊松分布Analyze->NonparametricTests->1-SampleK-STestVariable:zdTestDistribution:Poisson比较有用的结果:均值(3.8673)、sig=.850>0.5,不能拒绝零假设,认为服从泊松分布。12.5两个独立样本检验

2independentSamplesTest通过分析两个样本数据,推断它们的分布是否存在显著性差异。方法有四种:Mann-WhitneyU:是通过对平均秩的研究来实现推断的K-SZ:是通过对分布的研究来实现推断的Mosesextremereactions:一个作为控制样本,另一个作为实验样本WaldWolfwitzRuns:是通过对游程的研究来实现推断的实例

:甲乙两种安眠药服用后的效果。数据data12-06(2个变量:组别zb和延长时间ycss,20个cases)。试问这两种药物的疗效是否有显著性差异。Analyze->NonparametricTests->2independentSamples

TestVariable:ycssGrouping:zb(1,2)Testtype:四种均选比较有用的结果:比较四个sig值,有三个sig>.5,不能拒绝零假设认为疗效无显著性差异。12.6多个独立样本本检验KindependentSamplesTest通过分析多个个样本数据,,推断它们的的分布是否存存在显著性差差异。方法有有三种:Median:是通过对中中位数的研究究来实现推断断的K-W:是通过对推推广的平均秩秩的研究来实实现推断的J-T:与两个独立立样本检验的的Mann-WhitneyU类似实例:某车间用四四种不同的操操作方法检测测产品优等品品率的实验数数据。数据data12-07(2个变量:方方法ff和优等品率ydpl,21个cases)。试问这四四种不同的操操作方法对产产品优等品率率是否有显著著性差异。Analyze->NonparametricTests->KindependentSamplesTestVariable:ydplGrouping:ff(1,4)Testtype:三种均选比较有用的结结果:比较三三个sig值,K-W方法的sig=.009<.05,拒绝零假设,认为这四种不不同的操作方方法对产品优优等品率是有有显著性差异异。其他二个方法法的sig>.5,但不用,原原因是观测量量太少。12.7两个相关样本本检验2relatedSamplesTest同一个被测试试者,前后测测两次,彼此此相关。方法法有四种。实例:某校15名男生的长跑跑锻炼后晨脉脉变化数据。。数据data12-08(2个变量:锻锻炼前dlq和锻炼后dlh优,21个cases)。试问锻炼炼前后的晨脉脉有无显著性性差异。Analyze->NonparametricTests->2relatedSamplesTestPairs:dlq-dlhTesttype:选一种或多多种比较有用的结结果:看sig值,sig<.05,拒绝零假设,认为锻炼前后后的晨脉有显显著性的差异异。12.8多个相关样本本检验KrelatedSamplesTest对多个被测试试者,多个打打分,看打分分是否有显著著性差异。方方法有三种::CochranQ:要求样本数数据为二值的的(1-满意0-不满意)Friedman:利用秩实现现Kendall协同系数检验验:H0:协同系数为为0(评分标准不相相关的或者是是随机的)实例:9个顾客对三种种款式衬衫的的喜爱程度((1-最喜爱2-其次3-不喜爱)。。数据data12-09(3个变量:款款式A,款式B,款式C,27个cases)。试问顾客客对三种款式式衬衫的喜爱爱程度是否相相同。Analyze->NonparametricTests->krelatedSamplesTestVariables:abcTesttype:选选一种或多种种比较有用的结结果:看sig值,sig<.05,拒绝零零假设,认为为顾客对三种种款式衬衫的的喜爱程度是是不相同的。。补充:非参数数检验以下的讲义是是吴喜之教授授有关非参数检验的讲义,我觉觉得比书上讲讲得清楚。非参数检验为什么用非参参数方法?经典统计的多多数检验都假假定了总体的的背景分布。。但也有些没有有假定总体分分布的具体形形式,仅仅依依赖于数据观观测值的相对对大小(秩))或零假设下下等可能的概概率等和数据据本身的具体体总体分布无无关的性质进进行检验。这都称为非参参数检验。为什么用非参参数方法?这些非参数检检验在总体分分布未知时有有很大的优越越性。这时如如果利用传统统的假定分布布已知的检验验,就会产生生错误甚至灾灾难。非参数检验总总是比传统检检验安全。但是在总体分分布形式已知知时,非参数数检验就不如如传统方法效效率高。这是是因为非参数数方法利用的的信息要少些些。往往在传传统方法可以以拒绝零假设设的情况,非非参数检验无无法拒绝。但非参数统计计在总体未知知时效率要比比传统方法要要高,有时要要高很多。是是否用非参数数统计方法,,要根据对总总体分布的了了解程度来确确定。非参数方法这里介绍一些些非参数检验验。关于非参数方方法的确切定定义并不很明明确。我们就就其最广泛的的意义来理解解。在计算中,诸诸如列联表分分析中的许多多问题都有精精确方法,MonteCarlo抽样方法和用用于大样本的的渐近方法等等选择。精确确方法比较费费时间,后两两种要粗糙一一些,但要快快些。秩(rank)非参数检验中中秩是最常使使用的概念。。什么是一个个数据的秩呢呢?一般来说说,秩就是该该数据按照升升序排列之后后,每个观测测值的位置。。例如我们有有下面数据Xi159183178513719Ri75918426310这下面一行((记为Ri)就是上面一一行数据Xi的秩。秩(rank)利用秩的大小小进行推断就就避免了不知知道背景分布布的困难。这这也是大多数数非参数检验验的优点。多数非参数检检验明显地或或隐含地利用用了秩的性质质;但也有一一些非参数方方法没有涉及及秩的性质。。列联表问题我们讲过列联联表的c2检验问题(第第七章)。这里介绍的检检验可以检验验列联表中某某一个变量的的各个水平是是否有同样比比例或者等于于你所想象的的比例。每个检验都可可以选择使用用精确方法,,MonteCarlo抽样方法或用用于大样本的的渐近方法。。利用数据table7.sav,假定你想知知道收入的比比例是否是5比4比1(零假设))。而且选选择精确检检验,你可可以得到各各种检验结结果如下::列联表问题题利用数据table7.sav,假定你想想知道收入入的比例是是否是5比4比1(零假设))。而且选选择精确检检验,你可可以得到各各种检验结结果如下::列联表问题题该结果除了了给出了精精确检验的的p值,表明无无论还给出出渐近检验验的p值;两个都都是0.000;这表明零零假设的比比例欠妥。。输出还给给出了Pearson统计量中的的Oi和Ei(分别为下下表中的ObservedN和ExpectedN):列联表问题题如果要检验验变量的各各水平是否否都相等,,从SPSS可以得到对对这三个变变量的检验验(对每个个变量的零零假设是各各水平影响响相同)结结果:SPSS还分别给出出对每个变变量的Pearson统计量中的Oi和Ei。SPSS软件使用说说明用table7.sav数据。假定定已经加权权了(number:权)Analyze-NonparametricTests-ChiSquare。然后选择想要检验的的变量(如income),如要检验其其水平是否否相等,则则在ExpectedValues选Allcategoriesequal作为零假设设(默认选选择);如要检验其其水平是否否为某比例例,则在下下面Values输入你的比比例(我们们是5比4比1,逐个输入入)作为零零假设。点Exact时打开的对对话框中可可以选择精精确方法(Exact),MonteCarlo抽样方法((MonteCarlo)或用于大大样本的渐渐近方法((Asymptoticonly)。如果选入的的变量多于于一个,则则检验的都都是水平相相等的零假假设。最后后OK即可。单样本Kolmogorov-Smirnov检验单样本的Kolmogorov-Smirnov检验(K-S检验)是用用来检验一一个数据的的观测累积积分布是否否是已知的的理论分布布。这些作为零零假设的理理论分布在在SPSS的选项中有有正态分布布(Normal),泊松分布布(Poisson),均匀分布布(Uniform)和指数分布布(Exponential)。在SPSS软件中对于于是否是正正态分布或或均匀分布布的检验统统计量为数据ksdata.sav的K-S检验我们检验它它是否是正正态分布、、均匀分布布和指数分分布。输出出结果分别别显示在下下面三个表表中:由于sig=.074>.05,不能拒绝绝正态分布布(Normal)零假设。由于sig=.000<.05,拒绝均匀匀分布(Uniform)零假设由于sig=.664>.05,不能拒绝绝指数分布布(Exponential)零假设比较三种分分布检验,,认为是该该数据服从从指数分布布SPSS软件使用说说明使用我们的的ksdata.sav数据。选项为Analyze-NonparametricTests-1SampleK-S。然后把变量量(这里是是x)选入VariableList。再在下面面TestDistribution选中零假设设的分布((Normal、Poisson、Uniform和Exponential)作为零假假设。在点Exact时打开的对对话框中可可以选择精精确方法((Exact),MonteCarlo抽样方法((MonteCarlo)或用于大大样本的渐渐近方法((Asymptoticonly)。最后OK即可。关于随机性性的游程检检验(runtest)游程检验方方法是检验验一个取两两个值的变变量的这两两个值的出出现是否是是随机的。。假定下面面是由0和1组成的一个个这种变量量的样本((数据run1.sav):0000111111001011100000000其中相同的的0(或相同的的1)在一起称称为一个游游程(单独独的0或1也算)。这个数据中中有4个0组成的游程程和3个1组成的游程程。一共是是R=7个游程。其其中0的个数为m=15,而1的个数为n=10。关于随机性性的游程检检验(runtest)出现0和1的的这样一一个过程可可以看成是是参数为某某未知p的Bernoulli试验。但在在给定了m和n之后,在0和1的出现是随随机的零假假设之下,,R的条件分布布就和这个个参数无关关了。根据据初等概率率论,R的分布可以以写成(令令N=m+n)关于随机性性的游程检检验(runtest)于是就可以以算出在零零假设下有有关R的概率,以以及进行有有关的检验验了。利用用上面公式式可进行精精确检验;;也可以利利用大样本本的渐近分分布和利用用MonteCarlo方法进行检检验。利用用上面数据据的结果是是:关于随机性性的游程检检验(runtest)当然,游程程检验并不不仅仅用于于只取两个个值的变量量,它还可可以用于某某个连续变变量的取值值小于某个个值及大于于该值的个个数(类似似于0和1的个数)是是否随机的的问题。看看下面例子子。例(run2.sav):从某装瓶机机出来的30盒化妆品的的重量如下下(单位克克)71.671.071.870.370.572.971.071.070.171.871.970.370.969.371.267.367.667.767.668.168.067.569.867.569.770.069.170.471.069.9为了看该装装瓶机是否否工作正常常,首先需需要验证是是否大于和和小于中位位数的个数数是否是随随机的(零零假设为这这种个数的的出现是随随机的)。。关于随机性性的游程检检验(runtest)如果把小于于中位数的的记为0,否则记为为1,上面数据据变成下面面的0-1序列111111110111101000000000000110这就归为上上面的问题题。当然这这里进行这这种变换只只是为了易易于理解。。实际计算算时,用不不着这种变变换,计算算机会自动动处理这个个问题的。。直接利用这这个数据,,通过SPSS,得到下面面游程检验验结果的输输出。SPSS软件使用说说明用run2.sav数据。选项为Analyze-NonparametricTests-Runs。然后把变量量(这里是是length)选入VariableList。再在下面面CutPoint选中位数((Median)。当然,,也可以选选其他值,,如均值((Mean),众数((Mode)或任何你你愿意的数数目(放在在Custom)。注意在在对前面的的由0和1组成的序列列(run1.sav进行随机性性检验时,,要选均值(为什么?))。在点Exact时打开的对对话框中可可以选择精精确方法((Exact),MonteCarlo抽样方法((MonteCarlo)或用于大大样本的渐渐近方法((Asymptoticonly)。最后OK即可。Wilcoxon(Mann-Whitney)秩和检验这里介绍常常用的Wilcoxon(或称Mann-Whitney)秩和检验。。它的原理理很简单,,假定第一个个样本有m个观测值,,第二个有有n个观测值。。把两个样样本混合之之后把这m+n个观测值升升幂排序,,记下每个观观测值在混混合排序下下面的秩。。之后分别别把两个样样本所得到到的秩相加加。记第一一个样本观观测值的秩秩的和为WX而第二个样样本秩的和和为WY。这两个值值可以互相相推算,称称为Wilcoxon统计量。该统计量的的分布和两两个总体分分布无关。。由此分布布可以得到到p-值。直观上看,,如果WX与WY之中有一个个显著地大大,则可以以选择拒绝绝零假设。。该检验需要要的唯一假假定就是两两个总体的的分布有类类似的形状状(不一定定对称)。。Wilcoxon(Mann-Whitney)秩和检验下面数据((GDP.sav)是地区1的十个城市市和地区2的15个城市的人人均GDP(元)。现现在要想以以此作为两两个样本来来检验两个个地区的人人均GDP的中位数m1和m2是否一样,,即双尾检检验H0:m1=m2对Ha:m1≠m2。由于地区区2的人均GDP的中位数大大于地区1的中位数,,因此也可可以做单尾尾检验H0:m1=m2对Ha:m1<m2。地区1:32234526 3836 278159823216 4710 562823034618地区2:53913983 4076 594147484600 6325 453455265699 7008 540366785537 5257由SPSS的输出可以以得到下面面结果:Wilcoxon(Mann-Whitney)秩和检验该结果头两两行显示了Mann-Whitney和Wilcoxon统计量的值值。另外和和我们需要要结果的相相关部分为为:对于双双尾检验H0:m1=m2对Ha:m1≠m2,p-值为0.016(见“ExactSig.(2-tailed)”);而对于单单尾检验H0:m1=m2对Ha:m1<m2(见“ExactSig.(1-tailed)”),p-值为0.008。这两个结结果是精确确计算的。。通常在样样本量大的的时候利用用近似方法法得到渐近近分布的p-值(见“Asymp.Sig.(2-tailed)”),它只给给了双尾检检验的近似似p-值0.017,和精确值值差别不大大。注意单单尾检验的的p-值是双尾检检验的p-值的一半。。这个例子子的结果表表明,可以以拒绝原假假设,即有有理由认为为地区2的人均GDP的中位数要要高一些。。SPSS软件使用说说明使用GDP.sav数据。选项为Analyze-NonparametricTests-2IndependentSamples。把变量(gdp)选入TestVariableList;再把用1和2分类的变量量area输入进GroupingVariable,在DefineGroups输入1和2。在TestType选中Mann-Whitney。在点Exact时打开的对对话框中可可以选择精精确方法((Exact),MonteCarlo抽样方法((MonteCarlo)或用于大大样本的渐渐近方法((Asymptoticonly)。最后OK即可两样本分布布的Kolmogorov-Smirnov检验假定有分别别来自两个个独立总体体的两个样样本。要想想检验它们们背后的总总体分布相相同的零假假设,可以以进行两独独立样本的的Kolmogorov-Smirnov检验。原理理完全和单单样本情况况一样。只只不过把检检验统计量量中零假设设的分布换换成另一个个样本的经经验分布即即可。假定定两个样本本的样本量量分别为n1和n2,用S1(X)和S2(X)分别表示两两个样本的的累积经验验分布函数数。再记Dj=S1(Xj)-S2(Xj)。近似正态态分布的检检验统计量量为计算结果twonp.sav:两种破坏坏性试验验的持续续时间。。根据这这个数据据,n1=30,n2=25。由SPSS输出,得得到SPSS软件使用用说明使用twonp.sav数据。选项为Analyze-NonparametricTests-2IndependentSamples。把变量((duration)选入TestVariableList;再把用用1和2分类的变变量type输入到GroupingVariable,在DefineGroups输入1和2。在TestType选中Kolmogorov-SmirnovZ。在点Exact时打开的的对话框框中可以以选择精精确方法法(Exact),MonteCarlo抽样方法法(MonteCarlo)或用于于大样本本的渐近近方法((Asymptoticonly)。最后后OK即可两样本Wald-Wolfowitz游程检验验Wald-Wolfowitz游程检验验(Wald-Wolfowitzrunstest)和Kolmogorov-Smirnov检验都是是看两个个样本所所代表的的总体是是否分布布类似。。但是所所采取的的方法不不一样。。Wald-Wolfowitz游程检验验把两个个样本混混合之后后,按照照大小次次序排列列,一个个样本的的观测值值在一起起的为一一个游程程。和单单样本的的游程问问题类似似。可以以由游程程个数R看出两个个样本在在排序中中是否随随机出现现。由twonp.sav数据,可可以得到到下面SPSS关于Wald-Wolfowitz游程检验验的输出出:软件使用用:数据据和前面面一样,,只在TestType选Wald-Wolfowitzruns。Kruskal-Wallis关于多个个样本的的秩和检检验这个检验验的目的的是看多多个总体体的位置置参数是是否一样样。方法和Wilcoxon-Mann-Whitney检验的思思想类似似。假定有k个总体。。先把从从这个k个总体来来的样本本混合起起来排序序,记各各个总体体观测值值的秩之之和为Ri,i=1,……,k。显然如如果这些些Ri很不相同同,就可可以认为为它们位位置参数数相同的的零假设设不妥((备选假假设为各各个位置置参数不不全相等等)。Kruskal-Wallis关于多个个样本的的秩和检检验注意这里里所说的的位置参参数是在在下面意意义上的的qi;由于它它在分布布函数Fi(x)中可以和和变元x相加成为为F(x+qi)的样子,,所以称称qi为位置参参数。形式上,,假定这这些样本本有连续续分布F1,…,Fk,零假设为为H0:F1=…=Fk,备选假设设为Ha:Fi(x)=F(x+qi),i=1,……,k,这里F为某连续续分布函函数,而而且这些些参数qi并不相等等。Kruskal-Wallis检验统计计量为Kruskal-Wallis关于多个个样本的的秩和检检验公式中ni为第i个样本量量,而N为各个样样本量之之和(总总样本量量)。如果观测测值中有有大小一一样的数数值,这这个公式式会有稍稍微的变变化。这个统计计量在位位置参数数相同的的零假设设下有渐渐近的自自由度为为k-1的c2分布。Kruskal-Wallis检验仅仅仅要求各各个总体体变量有有相似形形状的连连续分布布。数据house.sav:三个区区域房价价的数据据为了调查查三个地地区的房房价是否否类似,,在每个个地区抽抽样,得得到三个个样本量量分别为为20、30、25的房价样样本。利利用SPSS软件,很很容易得得到下面面的检验验结果::SPSS软件使用用说明使用house.sav数据。选项为Analyze-NonparametricTests-KIndependentSamples。把变量((这里是是price)选入TestVariableList;再把数数据中用用1、2、3来分类的的变量group输入GroupingVariable,在DefineGroups输入1、2、3。在下面TestType选中Kruskal-WallisH。点Exact时打开的的对话框框中可以以选择精精确方法法(Exact),MonteCarlo抽样方法法(MonteCarlo)或用于于大样本本的渐近近方法((Asymptoticonly)。最后后OK即可Jonckheere-Terpstra多样本的的秩检验验这个检验验处理的的问题和和Kruskal-Wallis检验类似似,零假假设都是是各个总总体的位位置参数数相同,,但这里里的备选选假设为为各个总总体的位位置参数数按升幂幂排列((如为降降幂排列列,可把把总体编编号颠倒倒顺序即即为升幂幂排列))。注意这里里所说的的位置参参数和前前面的Kruskal-Wallis检验中的的位置参参数意义义一样。。Jonckheere-Terpstra检验先在在每两个个样本所所有观测测值对之之间比较较,计算算第i个样本观观测值中中小于第第j个样本观观测值的的对子数数:数据house.sav:三个区区域房价价的数据据很容易得得到SPSS的Jonckheere-Terpstra检验结果果输出::SPSS软件使用用说明使用house.sav数据。选项为Analyze-NonparametricTests-KIndependentSamples。把变量((这里是是price)选入TestVariableList;再把数数据中用用1、2、3来分类的的变量group输入GroupingVariable,在DefineGroups输入1、2、3。在下面TestType选中Jonckheere-Terpstra。在点Exact时打开的的对话框框中可以以选择精精确方法(Exact),MonteCarlo抽样方法法(MonteCarlo)或用于于大样本本的渐近近方法((Asymptoticonly)。最后后OK即可Brown-Mood中位数检检验在有数个个独立样样本的情情况,希希望知道道它们的的中位数数是否相相等。零假设是是这些样本本所代表表的总体体的中位位数相等等。备选假设设是这些中中位数不不全相等等。假定有k个总体,,ni为第i个样本量量;把所所有样本本量之和和记为N。先把从从这个k个总体来来的样本本混合起起来排序序,找出出它们的的中位数数。再计计算每个个总体中中小于该该中位数数的观测测值个数数O1i,i=1,……,k,和每个个总体中中大于该该中位数数的观测测值个数数O2i,i=1,……,k。这样就就形成了了一个由由元素Oij组成的2×k表。其列列总和为为ni,i=1,……,k;而两个个行总和和为各样样本小于于总中位位数的观观测值总总和:R1=O11+O12+…+O1k及各样本本大于总总中位数数的观测测值总和和R2=O21+O22+…+O2k。这显然然是一个个列联表表,可以以用Pearsonc2统计量,,即house.sav数据这里SPSS软件使用用说明使用house.sav数据。选项为Analyze-NonparametricTests-KIndependentSamples。把变量((这里是是price)选入TestVariableList;再把数数据中用用1、2、3来分类的的变量group输入GroupingVariable,在DefineGroups输入1、2、3。在下面TestType选中Median。在点Exact时打开的的对话框框中可以以选择精精确方法(Exact),MonteCarlo抽样方法法(MonteCarlo)或用于于大样本本的渐近近方法((Asymptoticonly)。最后后OK即可Friedman秩和检验验前面讨论论了两因因子试验验设计数数据的方方差分析析,那里里所用的的F检验需要要假定总总体的分分布为正正态分布布。有一种非非参数方方差分析析方法,,称为Friedman(两因子子)秩和和检验,,或Friedman方差分析析。它适适用于两两个因子子的各种种水平的的组合都都有一个个观测值值的情况况。Friedman秩和检验验假定第一一个因子子有k个水平((称为处处理,treatment),第二二个因子子有b个水平((称为区区组);;因此一一共有k×b=kb个观测值值。这里之所所以称一一个因子子为处理理,是因因为这是是我们想想要看该该因子各各水平是是否对试试验结果果有显著著的不同同(它的的各个水水平的观观测值也也就是本本小节的的多个相相关样本本)。而而另一个个因子称称为区组组,不同同的区组组也可能能对结果果有影响响。下面面是一个个例子。。数据fert.sav这里有三三种肥料料作为第第一个因因子(肥肥料因子子)的三三个水平平;而四四种土壤壤为第二二个因子子(土壤壤因子))的四个个水平。。感兴趣趣于是否否这三种种肥料对对于某作作物的产产量有区区别。称称肥料因因子为处处理,而而土壤因因子为区区组。数数据在下下表中((表中数数字为相相应组合合的产量量,单位位公斤))。

肥料种类肥料A肥料B肥料C土壤类型土壤1224668土壤2253648土壤3182120土壤4111319Friedman秩和检验验Friedman秩和检验验是关于于位置的的,和Kruskal-Wallis检验类似似,形式式上,假假定这些些样本有有连续分分布F1,…,Fk,零假设设为H0:F1=…=Fk,备选假假设为Ha:Fi(x)=F(x+qi),i=1,……,k,这里F为某连续续分布函函数,而而且这些些参数qi并不相等等。虽然这和和以前的的Kruskal-Wallis检验一样样,但是是由于区区组的影影响,要首先在在每一个个区组中中计算各各个处理理的秩;;再把每每一个处处理在各各区组中中的秩相相加.如果Rij表示在j个区组中中第i个处理的的秩。则则秩按照照处理而而求得的的和为Friedman秩和检验验这样做的的目的是是在每个个区组内内比较处处理。例例如,同个年龄龄段中比比较药品品的疗效效比不分分年龄来来比较疗疗效要合合理;在在同一个个部位比比较不同同的材料料要比混混合起来来比较要要合理等等等。这这里要引引进的Friedman统计量定定义为第一个式式子表明明,如果果各个处处理很不不一样,,和的平平方就会会很大,,结果就就显著。。第二个个公式是是为了计计算方便便而导出出的。它它有近似似的(有有k-1个自由度度的)c2分布。fert.sav数据SPSS软件使用用说明使用fert.sav数据。选项为Analyze-NonparametricTests-KRelatedSamples。然后把变变量(这这里是a、b、c)选入入TestVariableList。在下面面TestType选中Friedman。在点Exact时打开开的对对话框框中可可以选选择精精确方方法((Exact),MonteCarlo抽样方方法((MonteCarlo)或用用于大大样本本的渐渐近方方法((Asymptoticonly)。最最后OK即可Kendall协同系系数检检验在实践践中,,常需需要按按照某某些特特别的的性质质来多多次对对一些些个体体进行行评估估或排排序;;比如如几个个(m个)评评估机机构对对一些些(n个)学学校进进行排排序。。人们们想要要知道道,这这些机机构的的不同同结果果是否否一致致。如如果很很不一一致,,则该该评估估多少少有些些随机机,意意义不不大。。换句话话说,,这里里想要要检验验的零假设设是:这这些对对于不不同学学校的的排序序是不不相关关的或或者是是随机机的;;而备选假假设为:这这些对对不同同学校校的排排序是是正相相关的的或者者是多多少一一致的的。Kendall协同系系数检检验一个机机构对对诸个个体((学校校)的的秩((次序序)的的和为为1+2+……+n=n(n+1)/2;所有有m个机构构对所所有个个体评评估的的总秩秩为mn(n+1)/2;这样样对每每个个个体的的平均均秩为为m(n+1)/2。如果果记每每一个个个体体的m个秩((次序序)的的和为为Ri(i=1,……,n),那那么,,如果果评估估是随随机的的,这这些Ri与平均均秩的的差别别不会会很大大,反反之差差别会会很大大,也也就是是说下下面的的个体的的总秩秩与平平均秩秩的偏偏差的的平方方和S很大。。S定义为为Kendall协同系系数检检验这个和和Kendall协同系系数((Kendall’sCoefficientofConcordance)是成成比例例的,,Kendall协同系系数W(Kendall’sW)定义义为数据school.sav下面是是4个独立立的环环境研研究单单位对对15个学校校排序序的结结果每每一行行为一一个评评估机机构对对这些些学校校的排排序。。看上上去不不那么么一致致(也也有完完全一一致的的)::数据school.savSPSS的Kendall协同系系数检检验的的输出出SPSS软件使使用说说明使用school.sav数据。。选项为为Analyze-NonparametricTests-KRelatedSamples。然后把把变量量(这这里是是s1、s2、…、s15)选入入TestVariableList。在下面面TestType选中Kendall’sW。在点Exact时打开开的对对话框框中可可以选选择精精确方方法((Exact),MonteCarlo抽样方方法((MonteCarlo)或用用于大大样本本的渐渐近方方法((Asymptoticonly)。最最后OK即可关于二二元响响应的的Cochran检验前面讨讨论了了两因因子方方差分分析问问题的的Friedman秩和检检验。。但是当当观测测值只只取诸诸如0或1两个可可能值值时,,由于于有太太多同同样的的数目目(只只有0和1),排排序的的意义义就很很成问问题了了。这里要要引进进的Cochran检验就就是用用来解解决这这个问问题的的一个个非参参数检检验。。这里里的零零假设设也是是各个个处理理是相相同的的。先先看一一个例例子关于瓶瓶装饮饮用水水的调调查((数据据在water.sav)。20名顾客客对4种瓶装装饮用用水进进行了了认可可(记记为1)和不不认可可(记记为0)的表表态。。我们感感兴趣趣的是是这几几种瓶瓶装水水在顾顾客眼眼中是是否有有区别别。这这里的的零假假设是是这些些瓶装装水((作为为处理理)在在(作作为区区组的的)顾顾客眼眼中没没有区区别。。数据water.sav下表是数据据,每一行行为20个顾客对某某一饮料的的20个观点(0或1)。最后一一列1为认可总数数Ni而最后一行行为每个顾顾客给出的的4个观点中认认可数的总总和Li。最后一行行的最后的的元素为总总认可数N。显然,如果果Ni和这些Ni的均值的差差距很大,,那么这些些处理就很很不一样了了。Cochran检验就是基基于这个思思想的。用用Ni表示第i个处理所得得到的“1”的个数,而而Lj为第j个区组(例例子中的顾顾客)所给给的“1”的个数,““1”的总数记为为N。关于二元响响应的Cochran检验Cochran检验统计量量(Cochran’sQ)为(假定定有k个处理和b个区组)当k固定时,Q在b很大时有近近似的自由由度为k-1的c2分布。数据water.savCochran检验的SPSS输出:9、静夜四四无邻,,荒居旧旧业贫。。。12月-2212月-22Wednesday,December28,202210、雨中黄叶树树,灯下白头头人。。20:40:5020:40:5020:4012/28/20228:40:50PM11、以我独沈沈久,愧君君相见频。。。12

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论