版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本资料来源
吴喜之
统计学─从数据到结论第十六章非参数检验
16.1关于非参数的一些常识经典统计的多数检验都假定了总体的背景分布。但在总体未知时,如果假定的总体和真实总体不符,那么就不适宜用通常的检验这时如果利用传统的假定分布已知的检验,就会产生错误甚至灾难。无需假定总体分布的具体形式,仅仅依赖于数据观测值的相对大小(秩)或零假设下等可能的概率等和数据本身的具体总体分布无关的性质进行的检验都称为非参数检验(nonparametrictesting)。16.1关于非参数的一些常识这些非参数检验在总体分布未知时有很大的优越性。它总是比传统检验安全。在总体分布形式已知时,非参数检验不如传统方法效率高。这是因为非参数方法利用的信息要少些。往往在传统方法可以拒绝零假设的情况,非参数检验无法拒绝。但非参数统计在总体未知时效率要比传统方法要高,有时要高很多。是否用非参数统计方法,要根据对总体分布的了解程度来确定。
这里介绍一些非参数检验。关于非参数方法的确切定义并不很明确。我们就其最广泛的意义来理解。在计算中,诸如列联表分析中的许多问题都有精确方法,MonteCarlo抽样方法和用于大样本的渐近方法等选择。精确方法比较费时间,后两种要粗糙一些,但要快些。
秩(rank)
非参数检验中秩是最常使用的概念。什么是一个数据的秩呢?一般来说,秩就是该数据按照升幂排列之后,每个观测值的位置。例如我们有下面数据Xi159183178513719Ri75918426310这下面一行(记为Ri)就是上面一行数据Xi的秩。
秩(rank)
利用秩的大小进行推断就避免了不知道背景分布的困难。这也是非参数检验的优点。多数非参数检验明显地或隐含地利用了秩的性质;但也有一些非参数方法没有涉及秩的性质。
16.2单样本检验
16.2.1单样本中位数(a-分位数)符号检验我们知道某点为中位数(a-分位数)意味着一个数小于该点的概率应该为0.5(a).因此,一个观测值小于该点(或与该点之差的符号为负号)的概率为0.5(a)。这就是符号检验名称的来源,并与二项分布有关。例:数数据gs.txt例16.1质量监监督部部门对对商店店里面面出售售的某某厂家家的西西洋参参片进进行了了抽查查。对对于25包写明明为净净重100g的西洋洋参片片的称称重结结果为为(单单位::克)):99.05100.25102.5699.15104.89101.8696.3796.7999.3796.9093.9492.97108.2896.8693.9498.2798.36100.8192.99103.7290.6698.2497.8799.21101.79数据gs.txt样本中中位数数为m=98.36。因此此,人人们怀怀疑厂厂家包包装的的西洋洋参片片份量量不足足。由由于对对于这这些重重量的的总体体分布布不清清楚,,决定定对其其进行行符号号检验验。需需要检检验的的是::数据gs.txt按照零零假设设,每每个观观测值值(每每包西西洋参参的净净重))大于于中位位数m0=100g的机会会和小小于100g的概率率都是是0.5。这服服从二项分分布Bin(25,0.5)。重于于100g的只只有有8包。。这这样样的的二二项项分分布布变变量量小小于于或或等等于于8的概概率率为为0.05388。这这就就是是p-值。。因此此,对于于水水平平a=0.05,根据据这这个个符符号号检检验验,,没没有有充充分分的的证证据据拒拒绝绝零零假假设设。。数据据gs.txtSPSS输出出的的结结果果在在下下面面表表格格中中。。从从该该表表格格可可以以看看出出精精确确的的双双边边检检验验的的p-值=0.108(精确地地为0.1078);也就就是说,,我们的的单尾检检验的p-值为其一一半。数据gs.txt另一种输输出来自自于SPSS的另一种种选项::SPSS软件使用用这里有两两种选项项方式::1.以数据gs.sav为例。直直接使用用SPSS选项Analyze-NonparametricTests-Binomial,再把变变量gsweight选入TestVariableList,然后在在下面DefineDichotomy的Cutpoint输入100(克),,在下面面TestProportion输入p0=0.50(零假假设大大于100小时的的比例例);;还可可以点点击Exact来选择择精确确检验验,渐渐近检检验和和MonteCarlo方法等等,然然后OK即可得得到前前面显显示的的结果果。SPSS软件使使用2.数据gs.sav有一列列(变变量名名为m),这这是重重复零零假设设的100g使得m的长度度和gsweight一样。。然后后利用用选项项Analyze-NonparametricTests-RelatedSamples,再把把变量量gsweight和m同时选选入TestPair(s)List之中,,再在在下面面选Sign及在Exact中选Exact;然后后回到到主对对话框框,OK即可。。得出出前面面的第第二个个输出出。16.2单样样本本检检验验16.2.2单样样本本位位置置参参数数的的Wilcoxon符号号秩秩检检验验符号号检检验验只只用用了了差差的的符符号号,,但但没没有有利利用用差差值值的的大大小小。。Wilcoxon符号号秩秩检检验验(Wilcoxonsigned-ranktest)把差差的的绝绝对对值值的的秩秩分分别别按按照照不不同同的的符符号号相相加加作作为为其其检检验验统统计计量量。。它利利用用了了更更多多的的信信息息。。16.2单样样本本检检验验16.2.2单样样本本位位置置参参数数的的Wilcoxon符号号秩秩检检验验Wilcoxon符号号秩秩检检验验需需要要一一点点总总体体分分布布的的性性质质;;它它要要求求假假定定样样本本点点来来自自连连续续对对称称总总体体分分布布;;而而符符号号检检验验不不需需要要知知道道任任何何总总体体分分布布的的性性质质。。在对对称称分分布布中中,,总总体体中中位位数数和和总总体体均均值值是是相相等等的的;;因因此此,,对对于于总总体体中中位位数数的的检检验验,,等等价价于于对对于于总总体体均均值值的的检检验验。。假定定x1,x2,……,xn为来来自自连连续续对对称称总总体体。。如如果果零零检检验验为为中中位位数数((均均值值))m=m0。把满满足足xi-m0<0的|xi-m0|的秩秩求求和和,,并并用用W-表示示;;同同样样把把满满足足xi-m0>0的|xi-m0|的秩秩求求和和,,并并用用W+表示示。。如如果果m0的确确是是中中位位数数,,那那么么,,W-和W-应大大体体差差不不多多。。如果果W-或者者W+过大大或或过过小小,,则则应应该该怀怀疑疑中中位位数数m=m0的零零假假设设。。令W=min(W-,W+),则则当当W太小小时时,,应应该该拒拒绝绝零零假假设设。。这这个个W就是是Wilcoxon符号号秩秩检检验验统统计计量量。。例::数数据据gs.txt例16.1质量量监监督督部部门门对对商商店店里里面面出出售售的的某某厂厂家家的的西西洋洋参参片片进进行行了了抽抽查查。。对对于于25包写明为净重重100g的西洋参片的的称重结果为为(单位:克克):99.05100.25 102.5699.15104.89 101.8696.3796.79 99.3796.9093.94 92.97 108.2896.8693.94 98.27 98.36100.81 92.99 103.7290.6698.24 97.87 99.21 101.79例16.1:数据gs.txt(继续)利用SPSS,很容易得到到该数据的Wilcoxon符号秩检验结结果(Wilcoxon符号秩检验精精确(单尾))的p-值为0.047):软件使用说明明利用例16.1数据(gs.txt或gs.sav)。该数据有有一列(变量量名为m),这是重复复零假设的100g使得m的长度和gsweight一样。然后利利用选项Analyze-NonparametricTests-RelatedSamples,再把变量gsweight和m同时选入TestPair(s)List之中,再在下下面选Wilcoxon及在Exact中选Exact;再回到主对对话框,OK即可。16.2.3单样本Kolmogorov-Smirnov检验单样本的Kolmogorov-Smirnov检验(K-S检验)是用来来检验一个数数据的观测累累积分布是否否是已知的理理论分布。这些作为零假假设的理论分分布在SPSS的选项中有正正态分布,Poisson分布,均匀分分布和指数分分布。在SPSS软件中对于是是否是正态分分布或均匀分分布的检验统统计量为数据ksdata.sav的K-S检验我们检验它是是否是正态分布、均均匀分布和指指数分布。输出结果分分别显示在下下面三个表中中:单边检验的p-值等于0.074/2=0.037(渐近检验))和0.069/2=0.0345(精确检验验)。如果果按照显著著性水平为为0.05的标准,可可以拒绝产产生数据的的总体为正正态分布的的零假设。。p-值等于0.000(渐近检验验)和0.000(精确检验验)。如果果按照显著著性水平为为0.05的标准,可可以拒绝产产生数据的的总体为均均匀分布的的零假设。。p-值等于0.664/2=0.332(渐近检验验)和0.662/2=0.331(精确检验验)。如果果按照显著著性水平为为0.05的标准,不不能拒绝产产生数据的的总体为指指数分布的的零假设。。警告经常有人在在Kolmogorov-Smirnov检验中,当当检验不能能拒绝总体体分布为某某分布时,,来“接受受”或“证证明”该样样本来自该该分布。这这是错误的的。比如我们有有由1、2、3、4、5五个数目组组成的数据据,我们分分别检验该该数据是否否是正态分分布、均匀匀分布、Poisson分布或指数数分布。结结果归纳为为下表(读读者可以自自己练习去去算)Kolmogorov-Smirnov单样本分布布检验零假设的分分布 (渐渐近双边检检验的)p-值正态分布1.000均匀分布0.988Poisson分布1.000指数分布0.806根据此表,,没有足够够证据来拒拒绝任何一一个零假设设。难道我我们可以随随意“接受受”该总体体为其中任任一个分布布吗?SPSS软件使用说说明使用我们的的ksdata.sav数据。选项为Analyze-NonparametricTests-1SampleK-S。然后把变量量(这里是是x)选入VariableList。再在下面面TestDistribution选中零假设设的分布((Normal、Poisson、Uniform和Exponential)作为零假假设。在点Exact时打开的对对话框中可可以选择精精确方法((Exact),MonteCarlo抽样方法((MonteCarlo)或用于大大样本的渐渐近方法((Asymptoticonly)。最后OK即可。16.2.4关于随机性性的游程检检验(runtest)游程检验方方法是检验验一个取两两个值的变变量的这两两个值的出出现是否是是随机的。。假定下面面是由0和1组成的一个个这种变量量的样本((数据run1.sav):0000111111001011100000000其中相同的的0(或相同的的1)在一起称称为一个游游程(单独独的0或1也算)。这个数据中中有4个0组成的游程程和3个1组成的游程程。一共是是R=7个游程。其其中0的个数为m=15,而1的个数为n=10。关于随机性性的游程检检验(runtest)出现0和1的的这样一一个过程可可以看成是是参数为某某未知p的Bernoulli试验。但在在给定了m和n之后,在0和1的出现是随随机的零假假设之下,,R的条件分布布就和这个个参数无关关了。根据据初等概率率论,R的分布可以以写成(令令N=m+n)关于随机性性的游程检检验(runtest)于是就可可以算出出在零假假设下有有关R的概率,,以及进进行有关关的检验验了。利利用上面面公式可可进行精精确检验验;也可可以利用用大样本本的渐近近分布和和利用MonteCarlo方法进行行检验。。利用上上面数据据的结果果是关于随机机性的游游程检验验(runtest)当然,游游程检验验并不仅仅仅用于于只取两两个值的的变量,,它还可可以用于于某个连连续变量量的取值值小于某某个值及及大于该该值的个个数(类类似于0和1的个数))是否随随机的问问题。看看下面例例子。例(run2.sav):从某装瓶瓶机出来来的30盒化妆品品的重量量如下((单位克克)71.671.071.870.370.572.971.071.070.171.871.970.370.969.371.267.367.667.767.668.168.067.569.867.569.770.069.170.471.069.9为了看该该装瓶机机是否工工作正常常,首先先需要验验证是否否大于和和小于中中位数的的个数是是否是随随机的((零假设设为这种种个数的的出现是是随机的的)。关于随机机性的游游程检验验(runtest)如果把小小于中位位数的记记为0,否则记为1,上面数据变变成下面的0-1序列111111110111101000000000000110这就归为上面面的问题。当当然这里进行行这种变换只只是为了易于于理解。实际际计算时,用用不着这种变变换,计算机机会自动处理理这个问题的的。直接利用这个个数据,通过过SPSS,得到下面游游程检验结果果的输出。SPSS软件使用说明明用run2.sav数据。选项为Analyze-NonparametricTests-Runs。然后把变量((这里是length)选入VariableList。再在下面CutPoint选中位数(Median)。当然,也也可以选其他他值,如均值值(Mean),众数(Mode)或任何你愿愿意的数目((放在Custom)。注意在对对前面的由0和1组成的序列((run1.sav进行随机性检检验时,要选均值(为什么?)。。在点Exact时打开的对对话框中可可以选择精精确方法((Exact),MonteCarlo抽样方法((MonteCarlo)或用于大大样本的渐渐近方法((Asymptoticonly)。最后OK即可。§16.3两独立样本本检验§16.3.1比较两总体体中位数的的非参数检检验:Wilcoxon(Mann-Whitney)秩和检验为检验两总总体的中位位数是否相相等,常用用Wilcoxon(或称Mann-Whitney)秩和检验,,其原理很很简单假定两个个个样本分别别有m个和n个观测值。。把两个样样本混合后后把这m+n个观测值升升幂排序,,记下每个观观测值在混混合排序下下面的秩。。之后分别别把两个样样本所得到到的秩相加加。记第一一个样本观观测值的秩秩的和为WX而第二个样样本秩的和和为WY。这两个值值可以互相相推算,称称为Wilcoxon统计量。该统计量的的分布和两两个总体分分布无关。。由此分布布可以得到到p-值。直观上看,,如果WX与WY之中有一个个显著地大大,则可以以选择拒绝绝零假设。。该检验需要要的唯一假假定就是两两个总体的的分布有类类似的形状状(不一定定对称)。。例子子下面面数数据据((GDP.txt)是是地地区区1的十十个个城城市市和和地地区区2的15个城城市市的的人人均均GDP(元元))。。现现在在要要想想以以此此作作为为两两个个样样本本来来检检验验两两个个地地区区的的人人均均GDP的中中位位数数m1和m2是否否一一样样,,即即双双尾尾检检验验H0:m1=m2对Ha:m1≠m2。由由于于地地区区2的人人均均GDP的中中位位数数大大于于地地区区1的中中位位数数,,因因此此也也可可以以做做单单尾尾检检验验H0:m1=m2对Ha:m1<m2。地区区1:3223452638362781598232164710562823034618地区2:539139834076594147484600632545345526569970085403667855375257SPSS的输出出该结果果头两两行显示了了Mann-Whitney和Wilcoxon统计量量的值值。另另外和和我们们需要要结果果的相相关部部分为为:对对于双双尾检检验H0:m1=m2对Ha:m1≠m2,p-值为0.016(见““ExactSig.(2-tailed)”);而对对于单单尾检检验H0:m1=m2对Ha:m1<m2(见““ExactSig.(1-tailed)”),p-值为为0.008。这这两两个个结结果果是是精精确确计计算算的的。。通通常常在在样样本本量量大大的的时时候候利利用用近近似似方方法法得得到到渐渐近近分分布布的的p-值((见见““Asymp.Sig.(2-tailed)””),,它它只只给给了了双双尾尾检检验验的的近近似似p-值0.017,和和精精确确值值差差别别不不大大。。注注意意单单尾尾检检验验的的p-值是是双双尾尾检检验验的的p-值的的一一半半。。这这个个例例子子的的结结果果表表明明,,可可以以拒拒绝绝原原假假设设,,即即有有理理由由认认为为地地区区2的人均GDP的中位数数要高一一些。SPSS软件使用用说明使用GDP.sav数据。选项为Analyze-NonparametricTests-2IndependentSamples。把变量((gdp)选入TestVariableList;再把用用1和2分类的变变量area输入进GroupingVariable,在DefineGroups输入1和2。在TestType选中Mann-Whitney。在点Exact时打开的的对话框框中可以以选择精精确方法法(Exact),MonteCarlo抽样方法法(MonteCarlo)或用于于大样本本的渐近近方法((Asymptoticonly)。最后后OK即可16.3.2两样本分分布的Kolmogorov-Smirnov检验假定有分分别来自自两个独独立总体体的两个个样本。。要想检检验它们们背后的的总体分分布相同同的零假假设,可可以进行行两独立立样本的的Kolmogorov-Smirnov检验。原原理完全全和单样样本情况况一样。。只不过过把检验验统计量量中零假假设的分分布换成成另一个个样本的的经验分分布即可可。假定两个样本本的样本量分分别为n1和n2,用S1(X)和S2(X)分别表示两个个样本的累积积经验分布函函数。再记Dj=S1(Xj)-S2(Xj)。近似正态分分布的检验统统计量为计算结果twonp.txt:两种破坏性试试验的持续时时间。根据这这个数据,n1=30,n2=25。由SPSS输出,得到SPSS软件使用说明明使用twonp.sav数据。选项为Analyze-NonparametricTests-2IndependentSamples。把变量(duration)选入TestVariableList;再把用1和2分类的变量type输入到GroupingVariable,在DefineGroups输入1和2。在TestType选中Kolmogorov-SmirnovZ。在点Exact时打开的对话话框中可以选选择精确方法法(Exact),MonteCarlo抽样方法(MonteCarlo)或用于大样样本的渐近方方法(Asymptoticonly)。最后OK即可16.3.3两样本Wald-Wolfowitz游程检验Wald-Wolfowitz游程检验(Wald-Wolfowitzrunstest)和Kolmogorov-Smirnov检验都是看两两样本代表的的总体分布是是否类似。但但是方法不一一样。Wald-Wolfowitz游程检验把两两个样本混合合之后,按照照大小次序排排列,同样本本的观测值在在一起的为一一个游程。和单样本的游游程问题类似似。可以由游游程个数R看出两个样本本在排序中是是否随机出现现。软件使用:数数据和前面一一样,只在TestType选Wald-Wolfowitzruns。由twonp.sav数据,可以得得到下面SPSS关于Wald-Wolfowitz游程检验的输输出:16.4关于多个独立立样本的检验验16.4.1Kruskal-Wallis关于多个样本本的秩和检验验检验目的是看看多总体位置置参数是否一一样。方法和Wilcoxon-Mann-Whitney检验的思想类类似。假定有k个总体。先把把从这个k个总体来的样样本混合起来来排序,记各各个总体观测测值的秩之和和为Ri,i=1,…,k。显然如果这这些Ri很不相同,就就可以认为它它们位置参数数相同的零假假设不妥(备备选假设为各各个位置参数数不全相等))。Kruskal-Wallis关于多个样本本的秩和检验验注意这里所说说的位置参数数是在下面意意义上的qi;由于它在分分布函数Fi(x)中可以和变元元x相加成为F(x+qi)的样子,所以以称qi为位置参数。。形式上,假定定这些样本有有连续分布F1,…,Fk,零假设为H0:F1=…=Fk,备选假设为Ha:Fi(x)=F(x+qi),i=1,…,k,这里F为某连续分布布函数,而且且这些参数qi并不相等。Kruskal-Wallis检验统计量为为(R上面一杠表示示平均)Kruskal-Wallis关于多个样本本的秩和检验验公式中ni为第i个样本量,而而N为各个样本量量之和(总样样本量)。如果观测值中中有大小一样样的数值,这这个公式会有有稍微的变化化。这个统计量在在位置参数相相同的零假设设下有渐近的的自由度为k-1的c2分布。Kruskal-Wallis检验仅仅要求求各个总体变变量有相似形形状的连续分分布。数据house.txt:三个区域房房价的数据为了调查三个个地区的房价价是否类似,,在每个地区区抽样,得到到三个样本量量分别为20、30、25的房价样本。。利用SPSS软件,很容易易得到下面的的检验结果::SPSS软件使用说明明使用用house.sav数据据。。选项项为为Analyze-NonparametricTests-KIndependentSamples。把变变量量((这这里里是是price)选选入入TestVariableList;再再把把数数据据中中用用1、2、3来分分类类的的变变量量group输入入GroupingVariable,在在DefineGroups输入入1、2、3。在下下面面TestType选中中Kruskal-WallisH。点Exact时打打开开的的对对话话框框中中可可以以选选择择精精确确方方法法((Exact),,MonteCarlo抽样样方方法法((MonteCarlo)或或用用于于大大样样本本的的渐渐近近方方法法((Asymptoticonly)。最后OK即可16.4.2Jonckheere-Terpstra多样本的秩检检验这个检验处理理的问题和Kruskal-Wallis检验类似,零零假设都是各各个总体的位位置参数相同同,但这里的的备选假设为为各个总体的的位置参数按按升幂排列((如为降幂排排列,可把总总体编号颠倒倒顺序即为升升幂排列)。。这里所说的位位置参数和前前面的Kruskal-Wallis检验中的位置置参数意义一一样。Jonckheere-Terpstra检验先在每两两个样本所有有观测值对之之间比较,计计算第i个样本观测值值中小于第j个样本观测值值的对子数::数据house.sav:三个区域房房价的数据很容易得到SPSS的Jonckheere-Terpstra检验结果输出出:SPSS软件使用说明明使用house.sav数据。选项为Analyze-NonparametricTests-KIndependentSamples。把变量(这里里是price)选入TestVariableList;再把数据中中用1、2、3来分类的变量量group输入GroupingVariable,在DefineGroups输入1、2、3。在下面TestType选中Jonckheere-Terpstra。在点Exact时打开的对话话框中可以选选择精确方法(Exact),MonteCarlo抽样方法(MonteCarlo)或用于大样样本的渐近方方法(Asymptoticonly)。最后OK即可16.4.3Brown-Mood中位数检验在有数个独立立样本的情况况,希望知道道它们的中位位数是否相等等。零假设是这些样本所代代表的总体的的中位数相等等。备选假设是这些中位数数不全相等。。假定有k个总体,ni为第i个样本量;把把所有样本量量之和记为N。16.4.3Brown-Mood中位数检验先把从这个k个总体来的样样本混合起来来排序,找出出它们的中位位数。再计算每个总总体中小于该中位数的观观测值个数O1i,i=1,…,k,和每个总体体中大于该中位数的观观测值个数O2i,i=1,…,k。这样就形成成了一个由元元素Oij组成的2×k表。其列总和为为ni,i=1,…,k;而两个行总总和为各样本本小于总中位位数的观测值值总和:R1=O11+O12+…+O1k及各样本大于于总中位数的的观测值总和和R2=O21+O22+…+O2k。这显然是一个个列联表,可可以用Pearsonc2统计量,即house.txt数据这里SPSS软件使使用说说明使用house.sav数据。。选项为为Analyze-NonparametricTests-KIndependentSamples。把变量量(这这里是是price)选入入TestVariableList;再把把数据据中用用1、2、3来分类类的变变量group输入GroupingVariable,在DefineGroups输入1、2、3。在下面面TestType选中Median。在点Exact时打开开的对对话框框中可可以选选择精精确方法((Exact),MonteCarlo抽样方方法((MonteCarlo)或用用于大大样本本的渐渐近方方法((Asymptoticonly)。最最后OK即可16.5多个相相关样样本的的检验验16.5.1Friedman秩和检检验前面讨讨论了了两因因子试试验设设计数数据的的方差差分析析,那那里所所用的的F检验需需要假假定总总体的的分布布为正正态分分布。。有一种种非参参数方方差分分析方方法,,称为为Friedman(两因因子))秩和和检验验,或或Friedman方差分分析。。它适适用于于两个个因子子的各各种水水平的的组合合都仅有一一个观观测值值的情况况。Friedman秩和检检验假定第第一个个因子子有k个水平平(称称为处处理,,treatment),第第二个个因子子有b个水平平(称称为区区组));因因此一一共有有k×这里之所以称一个因子为处理,是因为这是我们想要看该因子各水平是否对试验结果有显著的不同(它的各个水平的观测值也就是本小节的多个相关样本)。而另一个因子称为区组,不同的区组也可能对结果有影响。下面是一个例子。数据fert.txt这里有有三种种肥料料作为为第一一个因因子((肥料料因子子)的的三个个水平平;而而四种种土壤壤为第第二个个因子子(土土壤因因子))的四四个水水平。。感兴兴趣于于是否否这三三种肥肥料对对于某某作物物的产产量有有区别别。称称肥料料因子子为处处理,,而土土壤因因子为为区组组。数数据在在下表表中((表中中数字字为相相应组组合的的产量量,单单位公公斤))。
肥料种类肥料A肥料B肥料C土壤类型土壤1224668土壤2253648土壤3182120土壤4111319Friedman秩和检检验Friedman秩和检检验是是关于于位置置的,,和Kruskal-Wallis检验类类似,,形式式上,,假定定这些些样本本有连连续分分布F1,…,Fk,零假假设为为H0:F1=…=Fk,备选选假设设为Ha:Fi(x)=F(x+qi),i=1,…,k,这里里F为某连连续分分布函函数,,而且且这些些参数数qi并不相相等。。虽然这这和以以前的的Kruskal-Wallis检验一一样,,但是是由于于区组组的影影响,要首先先在每每一个个区组组中计计算各各个处处理的的秩;;再把把每一一个处处理在在各区区组中中的秩秩相加加.如果Rij表示在在j个区组组中第第i个处理理的秩秩。则则秩按按照处处理而而求得得的和和为Friedman秩和检检验这样做做的目目的是是在每每个区区组内内比较较处理理。例例如,同个年年龄段段中比比较药药品的的疗效效比不不分年年龄来来比较较疗效效要合合理;;在同同一个个部位位比较较不同同的材材料要要比混混合起起来比比较要要合理理等等等。这这里要要引进进的Friedman统计量量定义义为Friedman秩和检检验第一个个式子子表明明,如如果各各个处处理很很不一一样,,和的的平方方就会会很大大,结结果就就显著著。第第二个个公式式是为为了计计算方方便而而导出出的。。它有有近似似的((有k-1个自由由度的的)c2分布。。fert.txt数据SPSS软件使使用说说明使用fert.sav数据。。选项为为Analyze-NonparametricTests-KRelatedSamples。然后把变量量(这里是是a、b、c)选入TestVariableList。在下面TestType选中Friedman。在点Exact时打开的对对话框中可可以选择精精确方法((Exact),MonteCarlo抽样方法((MonteCarlo)或用于大大样本的渐渐近方法((Asymptoticonly)。最后OK即可16.5.2Kendall协同系数检检验实践中常需需要按照某某些特别的的性质来多多次对一些些个体进行行评估或排排序;比如几个个(m个)评估估机构对对一些((n个)学校校进行排排序。人们想要要知道,,这些机机构的不不同结果果是否一一致。如如果很不不一致,,则该评评估多少少有些随随机,意意义不大大。换句话说说,这里里想要检检验的零假设是:这些些对于不不同学校校的排序序是不相相关的或或者是随随机的;;而备选假设设为:这些些对不同同学校的的排序是是正相关关的或者者是多少少一致的的。Kendall协同系数数检验一个机构构对诸个个体(学学校)的的秩(次次序)的的和为1+2+…+n=n(n+1)/2;所有m个机构对所有有个体评估的的总秩为mn(n+1)/2;这样对每个个个体的平均均秩为m(n+1)/2。如果记每一一个个体的m个秩(次序))的和为Ri(i=1,…,n),如果评估是随随机的,这些些Ri与平均秩的差差别不会很大大,反之差别别会很大,也也就是说下面面的个体的总秩与与平均秩的偏偏差的平方和和S很大。S定义为Kendall协同系数检验验这个和Kendall协同系数(Kendall’sCoefficientofConcordance)是成比例的的,Kendall协同系数W(Kendall’sW)定义为数据school.txt下面是4个独立的环境境研究单位对对15个学校排序的的结果每一行行为一个评估估机构对这些些学校的排序序。看上去不不那么一致((也有完全一一致的):数据school.savSPSS的Kendall协同系数检验验的输出SPSS软件使用说明明使用school.sav数据。选项为Analyze-NonparametricTests-KRelatedSamples。然后把变量((这里是s1、s2、…、s15)选入TestVariableList。在下面面TestType选中Kendall’sW。在点Exact时打开开的对对话框框中可可以选选择精精确方方法((Exact),MonteCarlo抽样方方法((MonteCarlo)或用用于大大样本本的渐渐近方方法((Asymptoticonly)。最最后OK即可16.5.3关于两两值响响应的的Cochran检验前面讨讨论了了两因因子方方差分分析问问题的的Friedman秩和检检验。。但是当当观测测值只只取诸诸如0或1两个可可能值值时,,由于于有太太多同同样的的数目目(只只有0和1),排排序的的意义义就很很成问问题了了。这里要要引进进的Cochran检验就就是用用来解解决这这个问问题的的一个个非参参数检检验。。这里里的零零假设设也是是各个个处理理是相相同的的。先先看一一个例例子16.5.3关于两两值响响应的的Cochran检验关于瓶瓶装饮饮用水水的调调查(数据在在water.txt)。20名顾客客对4种瓶装装饮用用水进进行了了认可可(记记为1)和不不认可可(记记为0)的表表态。。我们感感兴趣趣的是是这几几种瓶瓶装水水在顾顾客眼眼中是是否有有区别别。这这里零零假设设是这这些瓶瓶装水水(作为为处处理理)在(作为为区区组组的的)顾客客眼眼中中没没有有区区别别。。数据据water.txt下表表是是数数据据,,每每一一行行为为20个顾顾客客对对某某一一饮饮料料的的20个观观点点((0或1)。。最最后后一一列列1为认认可可总总数数Ni而最最后后一一行行为为每每个个顾顾客客给给出出的的4个观观点点中中认认可可数数的的总总和和Li。最最后后一一行行的的最最后后的的元元素素为为总总认认可可数数N。显然然,,如如果果Ni和这这些些Ni的均均值值的的差差距距很很大大,,那那么么这这些些处处理理就就很很不不一一样样了了。。Cochran检验验就就是是基基于于这这个个思思想想的的。。用用Ni表示示第第i个处处理理所所得得到到的的““1””的个个数数,,而而Lj为第第j个区区组组((例例子子中中的的顾顾客客))所所给给的的““1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 盖板涵基础及下部构造施工方案
- 特种金属靶材相关行业投资方案
- 2024年大数据服务合同条款解析
- 专科医院绩效评估分配方案
- 2024年度河北省高校教师资格证之高等教育心理学考前冲刺试卷B卷含答案
- 施工现场安全管理专项方案
- 2024年度江西省高校教师资格证之高等教育心理学通关题库(附带答案)
- 金融机构高层薪酬结构优化方案
- 河南省部分学校2024-2025学年高二上学期开学考试语文试题(解析版)
- 福建省南平市2023-2024学年高二下学期7月期末考试语文试题(解析版)
- 《工业革命与工厂制度》
- 课程领导力-资料教学课件
- 老人租房免责协议书
- 家校沟通案例七篇
- 特灵中央空调机组RTHD详细介绍
- 2023人民教育出版社在职人员招聘笔试模拟试题及答案解析
- 大学生心理健康教育论文范文3000字(8篇)
- 消费者心理学PPT完整全套教学课件
- 退行性腰椎间盘病诊疗和阶梯治疗
- fas设备应急预案
- 新材料概论课件ppt 第7章 信息功能材料
评论
0/150
提交评论