非参数统计讲义三-两样本检验课件_第1页
非参数统计讲义三-两样本检验课件_第2页
非参数统计讲义三-两样本检验课件_第3页
非参数统计讲义三-两样本检验课件_第4页
非参数统计讲义三-两样本检验课件_第5页
已阅读5页,还剩123页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

非参数统计非参数统计复习两个总体参数检验复习两个总体参数检验

设X~N(

1

1

2),Y~

N(

2

2

2)两总体X,Y相互独立,样本(X1,X2,…,Xn),(Y1,Y2,…,Ym)

样本值

(x1,x2,…,xn),(y1,y2,…,ym)显著性水平

两个正态总体的假设检验设X~N(112),

1–

2

=

(

12,

22

已知)关于均值差

1–

2

的检验

1–

2

1–

2

1–

2

<

1–

2>

1–

2

原假设

H0备择假设

H1检验统计量及其在H0为真时的分布拒绝域1–2=(12,22已知)关于均值

1–

2

=

1–

2

1–

2

1–

2

<

1–

2>

1–

2

其中

12,

22未知

12=

22原假设

H0备择假设

H1检验统计量及其在H0为真时的分布拒绝域1–2=1–21–2假定甲、乙两机床截下的长度方差相等,问长度的期望值是否一样?例8-8从两台切断机所截下的坯料(长度按正态分布)中,分别抽取8个和9个产品,测得长度如下(单位:mm):甲:150,145,152,155,148,151,

152,148乙:152,150,148,152,150,150,

148,151,148假定甲、乙两机床截下的长度方差相等,问长度的期望值是否一样?设甲床截下的长度为X;乙床截下的长度为Y,由假定知

21=22=2检验假设

解设甲床截下的长度为X;乙床截下的长度为Y,由假定知21=非参数统计讲义三--两样本检验ppt课件对查表得拒绝域为所以应接受对查表得拒绝域为所以应接受非参数统计讲义三--两样本检验ppt课件两样本位置和尺度检验样本之间相互独立,为位置参数,称为尺度参数。假设样本:(X1,X2,…,Xn)~i.i.d.F1

(Y1,Y2,…,Yn)~i.i.d.F2

Brown-Mood中位数检验Moses方法Mood检验Mann-Whitney秩和检验。

两样本位置和尺度检验样本之间相互独立,为位置参两个样本检验两个独立样本两个成对相关样本两个样本检验两个独立样本两个成对相关样本MINITAB非参数统计界面与功能MINITAB非参数统计界面与功能两个独立样本检验两个独立样本检验Brown-Mood中位数检验统计思想:用于检验两个总体抽取的样本的中位数是否相同。Brown-Mood中位数检验统计思想:用于检验两个总体抽取Brown-Mood中位数检验原理:在零假设成立时,如果数据有相同中位数,那么混合样本的中位数应该和混合前的项等。假设(X1,X2,…,Xn)~i.i.d.F(x),

(Y1,Y2,…,Yn)~i.i.d.F(x-)样本来自两个相互独立总体。Brown-Mood中位数检验原理:在零假设成立时,如果数据首先将两个样本混合,找出混合样本中位数,将X和Y按照在两侧分类计数,即:

在给定m,n和t的时候,在零假设成立时,A的分布服从超几何分布:

当A值太大时,考虑拒绝零假设。

计算和例子HYPGEOMDIST(a,m,a+b,m+n)首先将两个样本混合,找出混合样本中位数,将X和Y按照X样本Y样本总和观测值大于MEA=11B=4A+B=15观测值大于ME11415总和M=12N=18M+N=30从M+N=30个中抽出A+B=15个,成功A=11个,M=12,N=18例:全国30个省人均GDP,中位数4690,检验沿海省X与非沿海省Y的中位数是否有差异?X样本Y样本总和观测值大于MEA=11B=4A+B=15观测P(A=11)=0.000236724拒绝H0,认为沿海省与非沿海省的中位数有显著差异。P(A=11)=0.000236724拒绝H0,认为沿海省与检验基本内容P-值

检验统计量

对于水平,如果p-值小于,那么拒绝零假设

检验基本内容P-值检验统计量对于水平,如果p-值小于非参数统计讲义三--两样本检验ppt课件HYPGEOMDIST(2,9,8,16)=0.01958HYPGEOMDIST(1,9,8,16)=0.00699=0.02028拒绝H0,认为两品牌的价格有显著差异HYPGEOMDIST(2,9,8,16)=0.01958=

大样本检验对于大样本情况下,可以使用超几何分布的正态近似进行检验:另外可求得置信区间:其中c和c’满足:

大样本检验对于大样本情况下,可以使用超几何分布的正态近似进大样本卡方分布近似大样本卡方分布近似省市人均GDP沿海与否

北京630291

天津554731

辽宁312591

上海731241

江苏396221

浙江422141

福建301231

山东330831

广东375891

广西149661

海南171751

贵州88241

河北232390

山西203980

内蒙古322140

吉林235140

黑龙江217270

安徽144850

江西147810

河南195930

湖北198600

湖南175210

重庆180250

四川153780

云南125870

西藏138610

陕西182460

甘肃121100

青海173890

宁夏178920

新疆198930中位数ME=198602008年全国经济数据省市人均GDP沿海与否北京630291天津554非参数统计讲义三--两样本检验ppt课件非参数统计讲义三--两样本检验ppt课件例:比较两个企业的收入X1group111110711001991102110611091108110419911011961971102110711131116111311101981X1group10721082106298210521032110210521042100296210821032104211421142113210821062992例:比较两个企业的收入X1group111110711001非参数统计讲义三--两样本检验ppt课件Datamoodtest;Dog=1,2;Inputn;Doi=1ton;Inputx@@;Output;End;End;Datalines;19111107100991021061091081049910196971071131161131109820107108106981051031101051041009610810310411411411310810699;procnpar1waymediandata=moodtest;classg;varx;run;Datamoodtest;

TheNPAR1WAYProcedureMedianScores(NumberofPointsAboveMedian)forVariablexClassifiedbyVariablegSumofExpectedStdDevMeangNScoresUnderH0UnderH0Score-----------------------------------------------------------------1199.6666679.2564101.5255870.5087722209.3333339.7435901.5255870.466667

Averagescoreswereusedforties.MedianTwo-SampleTestStatistic9.6667Z0.2689One-SidedPr>Z0.3940Two-SidedPr>|Z|0.7880MedianOne-WayAnalysisChi-Square0.0723DF1Pr>Chi-Square0.7880TheNPAR1WAYProcedure

MoodScoresforVariablexClassifiedbyVariableg

SumofExpectedStdDevMeangNScoresUnderH0UnderH0Score-----------------------------------------------------------------1192789.833332406.66667355.433586146.8333332202150.166672533.33333355.433586107.508333Averagescoreswereusedforties.MoodTwo-SampleTestStatistic2789.8333Z1.0780One-SidedPr>Z0.1405Two-SidedPr>|Z|0.2810MoodOne-WayAnalysisChi-Square1.1621DF1Pr>Chi-Square0.2810MoodScoresforVariablexWilcoxon(或称Mann-Whitney)秩和检验。是一种比较两个独立总体的均值的非参数检验方法。与参数统计的T检验相对应。由Henry.B.Mann和D.R.Whitney1947年提出。(Mann,Whitney和Wilcoxon三人共同设计的一种检验,有时也称为Wilcoxon秩和检验)如果总体服从正态分布的假设不成立,或是定序数据,不能用T检验,要用Mann-Whitney检验wethinkitisnotgaussian(tocheckot,lookataquantile-quantileplotorperformaShapiro–Wilktest)–otherwise,wewoulduseStudent’sTtest,thatismorepowerful.Wilcoxon(或称Mann-Whitney)秩和检验。Mann-Whitney检验的假设条件1、样本独立2、数据至少为定序尺度检验假设:H0:两总体相同H1:两总体不同Mann-Whitney检验的假设条件1、样本独立检验假两独立样本非参数检验含义:由样本数据推断两独立总体的分布是否存在显著差异(或两样本是否来自同一总体)基本假设:H0:两总体分布无显著差异(两样本来自同一总体)将两样本混合并按升序排序分别计算两个样本秩的累计频数和累计频率两个累计频率相减.如果差距较小,则认为两总体分布无显著差异应保证有较大的样本数(大于40)应用举例–不同工艺产品寿命分布一致吗?–城镇和农村的存(取)款分布一致吗?两独立样本非参数检验Wilcoxon(Mann-Whitney)秩和检验它的原理:假定第一个样本有m个观测值,第二个有n个观测值。把两个样本混合之后把这m+n个观测值升幂排序,记下每个观测值在混合排序下面的秩。之后分别把两个样本所得到的秩相加。记第一个样本观测值的秩的和为WX而第二个样本秩的和为WY。这两个值可以互相推算,称为Wilcoxon统计量。Wilcoxon(Mann-Whitney)秩和检验它的原该统计量的分布和两个总体分布无关。由此分布可以得到p-值。直观上看,如果WX与WY之中有一个显著地大,则可以选择拒绝零假设。该检验需要的唯一假定就是两个总体的分布有类似的形状(不一定对称)。该统计量的分布和两个总体分布无关。由此分布可以得到p-值。设两个独立样本为:第一个的样本X容量为N1,第二个样本y容量为N2,在容量为N=N1+N2的混合样本(第一个和第二个)中,x样本的秩和为WX,Y样本的秩和为WY设两个独立样本为:第一个的样本X容量为N1,第二个样本y容量Mann-Whitney秩和检验

假设样本来自于,来自于并且独立。假设检验问题:

将两个样本混合,在混合样本中的秩;定义,同样可定义,称为Wilcoxon秩和统计量。

Mann-Whitney秩和检验假设样本W-M-W统计量称为Man-Whitney统计量:在零假设情况下,和独立同分布,并且和Wilcoxon秩和统计量等价。当统计量偏小的时候,考虑拒绝零假设。W-M-W统计量称为Man-Whitney统计量:在零假设情例:某高中学生主要来自A,B校两个初中生,研究一个问题,是否来自A初中的学生的总体与来自B初中的学生的总体在学术潜力上是相同的。假设;H0:两个学校在学习潜力上是相同的,H1:两个学校在学习潜力上是不相同的从高中生中抽4名在A校上学的学生,抽5名在B校上学的学生。研究中使用的9名学生现今的高中班级名次。例:某高中学生主要来自A,B校两个初中生,研究一个问题,是否解:N1=4,N2=5,N=N1+N2=9X组Y组A校学生号班级名次B校学生号班级名次A18B170A252B2202A3112B3144A421B4175B5146学生名次RANKA181A4212A2523B1704A31125B31446B51467B41758B22029解:X组Y组A校学生号班级名次B校学生号班级名次A18B17学生名次秩学生名次秩A181B1704A2523B22029A31125B31446A4212B41758B51467合计1134分开学校的学生,计算各校学生的秩和。学生名次秩学生名次秩A181B1704A2523B22029WX=11,WY=34W1=WX-N1*(N1+1)=11-10=1W2=WY-N2*(N2+1)=34-15=29若A校学生均取到最前(小)名次,XL=N1(N1+1)/2=10若A校学生均取到最后(高)名次,XU=N2(N2+1)/2==[9*(9+1)-5*(5+1)]/2=(90-30)/2=30如果两个学校的学生学习能力相同的话,XL与XU应接近平均值(30+10)/2=20查表得到临界点值,n1=4,n2=5,a=0.05,得到临界值下限TL=12,上限TU==n1(n1+n2+1)-TL=4*(4+5+1)-12=28A校学生XL=10<12,所以拒绝原假设,两校学生有差异。WX=11,WY=34非参数统计讲义三--两样本检验ppt课件典型例题13411461104111911241161111218311131129197112317021182101285210721322942典型例题13411461104111911241161111例题解答例题解答Wilcoxon’sUtest

Hereisanothermethodofcomputingthis:Contatenatethetwosamples,rankthemR1=sumoftheranksonthefirstsampleR2=sumoftheranksonthesecondsampleU2=n1*n2+n1(n1+1)/2-R1U1=n1*n2+n2(n2+1)/2-R2U=min(U1,U2)Wilcoxon’sUtestHereisanot大样本正态近似大样本正态近似Datawmwtest;Dog=1,2;Inputn;Doi=1ton;Inputx@@;Output;End;End;Datalines;12 134 146 104 119 124 161 112 83 113 129 97 1237 70 118 101 85 107 132 94;procnpar1waywilcoxondata=wmwtest;classg;varx;run;Datawmwtest;

TheNPAR1WAYProcedureWilcoxonScores(RankSums)forVariablexClassifiedbyVariablegSumofExpectedStdDevMeangNScoresUnderH0UnderH0Score-----------------------------------------------------------------112141.0120.011.83216011.7502749.070.011.8321607.000

WilcoxonTwo-SampleTestStatistic49.0000NormalApproximationZ-1.7326One-SidedPr<Z0.0416Two-SidedPr>|Z|0.0832tApproximationOne-SidedPr<Z0.0501Two-SidedPr>|Z|0.1003Zincludesacontinuitycorrectionof0.5.

R程序x1<-c(34, 146, 104, 119, 124, 161, 112, 83, 113, 129, 97, 123)x2<-c(70, 118, 101, 85 ,107, 132, 94)x<-c(x1,x2)xshapiro.test(x)$p.valueshapiro.test(x2)$p.valuewilcox.test(x1,x2)Shapiro–Wilktest,Thistestcheckifarandomvariableisgaussian.

R程序x1<-c(34, 146, 104, 119, 12正态性检验P=0.6779109,说明数据呈正态性。正态性检验P=0.6779109,说明数据呈正态性。Wilcoxonranksumtestdata:x1andx2W=56,p-value=0.2614alternativehypothesis:truelocationshiftisnotequalto0不能拒绝H0.Wilcoxonranksumtest不能拒绝H0.t.test(x1,x2)WelchTwoSamplet-testdata:x1andx2t=0.9143,df=16.731,p-value=0.3735alternativehypothesis:truedifferenceinmeansisnotequalto095percentconfidenceinterval:-14.5225636.68923sampleestimates:meanofxmeanofy112.0833101.0000t.test(x1,x2)Mann-Whitney秩和检验下面数据是地区1的十个城市和地区2的15个城市的人均GDP(元)。现在要想以此作为两个样本来检验两个地区的人均GDP的中位数m1和m2是否一样,即双尾检验H0:m1=m2对Ha:m1≠m2。Mann-Whitney秩和检验下面数据是地区1的十个城市和由于地区2的人均GDP的中位数大于地区1的中位数,因此也可以做单尾检验H0:m1=m2对Ha:m1<m2。地区1:3223 4526 3836 2781 5982 3216 4710 5628 2303 4618地区2:5391 3983 4076 5941 4748 4600 6325 4534 5526 5699 7008 5403 6678 5537 5257由SPSS的输出可以得到下面结果:由于地区2的人均GDP的中位数大于地区1的中位数,因此也可以32231452613836127811598213216147101562812303146181539123983240762594124748246002632524534255262569927008254032667825537252572322314526138361278115982132161非参数统计讲义三--两样本检验ppt课件Wilcoxon(Mann-Whitney)秩和检验该结果头两行显示了Mann-Whitney和Wilcoxon统计量的值。另外和我们需要结果的相关部分为:对于双尾检验H0:m1=m2对Ha:m1≠m2,p-值为0.016(见“ExactSig.(2-tailed)”);而对于单尾检验H0:m1=m2对Ha:m1<m2(见“ExactSig.(1-tailed)”),p-值为0.008。这两个结果是精确计算的。Wilcoxon(Mann-Whitney)秩和检验该结果通常在样本量大的时候利用近似方法得到渐近分布的p-值(见“Asymp.Sig.(2-tailed)”),它只给了双尾检验的近似p-值0.017,和精确值差别不大。注意单尾检验的p-值是双尾检验的p-值的一半。这个例子的结果表明,可以拒绝原假设,即有理由认为地区2的人均GDP的中位数要高一些。通常在样本量大的时候利用近似方法得到渐近分布的p-值(见“ASPSS软件使用说明

选项为Analyze-NonparametricTests-2IndependentSamples。把变量(gdp)选入TestVariable

List;再把用1和2分类的变量area输入进GroupingVariable,在DefineGroups输入1和2。在TestType选中Mann-Whitney。在点Exact时打开的对话框中可以选择精确方法(Exact),MonteCarlo抽样方法(MonteCarlo)或用于大样本的渐近方法(Asymptoticonly)。最后OK即可SPSS软件使用说明选项为Analyze-Nonparam性质和检验定理4.2在零假设下:若,且,时:

在检验时,,,其中a,b值由前面定理确定。在水平为拒绝域为:,其中k是使式子成立的最大值。对于打结的情况需要使用修正的公式。

性质和检验定理4.2在零假设下:若亚特兰大(芝加哥(航班次数组)组)放弃人数统一编秩放弃人数统一编秩1115.513721591483103.5103.541812815115.51610620139272416171182215211492517秩和96.556.5某航空公司的CEO注意到飞离亚特兰大的飞机放弃预定座位的旅客人数在增加,他特别有兴趣想知道,是否从亚特兰大起飞的飞机比从芝加哥起飞的飞机有更多的放弃预定座位的旅客。获得一个从亚特兰大起飞的9次航班和从芝加哥起飞的8次航班上放弃预定座位的旅客人数样本,见表中的第2列和第4列所示。亚特兰大(芝加哥(航班组)组)放弃人数统一编秩放弃人数统一编最小值是8秩值为1,最大值是25秩值为17,有两个结值10和11,两个10平均分享秩值3和4为3.5,两个11平均分享秩值5和6为5.5。有节时需要对公式进行修正。结值的存在将使原方差变小,这里τ为节的个数最小值是8秩值为1,最大值是25秩值为17,有两个结值10和如果设定显著水平0.1,我们知道标准正态分布在0.1显著水平时,上临界值为1.645,下临界值为-1.645,由于1.445<1.645,所以不能拒绝原假设。如果设定显著水平0.1,我们知道标准正态分布在0.1显著水平SAS程序如下:datanoshows;dogroup=1to2;inputn;doi=1ton;inputx@@;output;end;end;datalines;9111510181120242225813141081691721;procnpar1waydata=noshowswilcoxon;classgroup;varx;run;SAS程序如下:1.51.5非参数统计讲义三--两样本检验ppt课件非参数统计讲义三--两样本检验ppt课件非参数统计讲义三--两样本检验ppt课件WALD-WOLFOWITZ检验Wald-Wolfowitz检验是对游程检验的扩展,用于确定两个总体是否具有相同的分布。H0:两个总体分布相同H1:两个总体分布不同假设:两个样本独立WALD-WOLFOWITZ检验Wald-Wolfowitz将两个样本的值按升序排成一列,不考虑来自哪个总体,用符号表示每一个值来自哪个总体,这样就构成由两个符号表示的一个序列。可以计算游程个数值R。统计思想:若两个总体分布相同,那么两种符号的交迭率较高,否则,如果两个总体的分布不同,符号就会堆积。较小的游程就可能拒绝原假设H0将两个样本的值按升序排成一列,不考虑来自哪个总体,用符号表示例:某光盘公司的老板要检验两个售货员的效率是否相同,获得每个售货员日销售量的下列样本数据售货员B售货员A35174423391350244833292160187516493266

例:某光盘公司的老板要检验两个售货员的效率是否相同,获得每个NPARTESTS/W-W=XBYG(12)/MISSINGANALYSIS.拒绝H0NPARTESTS拒绝H01、两个售货员无法作为同一天发生数据进行配对2、Wald-Wolfowitz是一个弱的检验。两个样本独立1、两个售货员无法作为同一天发生数据进行配对例:比较两种广告的吸引力,随机选择8名顾客记录他们对广告一的评分,随机选择另外9名顾客展示广告2,并记录得分。数据如下广告一广告一73845375849295104

5例:比较两个行业的老板薪水。单位千美元。是否能用统计方法证明哪种广告好家具造纸175891701201661361681602041119610114798

80例:比较两种广告的吸引力,随机选择8名顾客记录他们对广告一的

柯尔莫哥洛夫-斯米尔诺夫检验

KOLMOGOROV-SMIRNOV检验即两个独立样本的K-S检验(Kolmogorov-SmirnovZ)。基本思想:检验两组样本是否来自同一总体K-S(aliasKOLMOGOROV-SMIRNOV)testswhetherthedistributionofavariableisthesameintwoindependentsamplesthataredefinedbyagroupingvariable.两个独立样本的K-S检验的基本思想与前面讨论的单样本K-S检验的基本思路是一致的,差别在于这里处理的是观察值的秩,而非观察值本身。

柯尔莫哥洛夫-斯米尔诺夫检验

KOLMOGOROV-SM一,将两组样本混合并按升序排序;二,分别计算两组样本秩的累计频数和每个点上的累计频率;三,将两个累计频率相减,得到差值序列数据。两独立样本的K-S检验仍然关注差值序列,系统将自动计算K-SZ统计量,并依据正态分布表给出的显著性。如果显著性小于或等于用户心中的显著性水平α,则拒绝零假设,认为样本来自的两个独立总体的分布有显著差异。K——S检验比较两个样本的累计频数分布曲线一,将两组样本混合并按升序排序;K——S检验比较两个样本的累特点:这个检验对两个样本的中位数,离散程度,偏度差异较敏感

Thetestissensitivetoanydifferenceinmedian,dispersion,skewness,andsoforth,betweenthetwodistributions.特点:这个检验对两个样本的中位数,离散程度,偏度差异较敏感非参数统计讲义三--两样本检验ppt课件售货员B售货员A35274433392350244833292160287546493266

比较两个售货员的业绩是否存在差异NPARTESTSKENDALL=ALL.NPARTESTS/K-S=XBYG(12)/MISSINGANALYSIS.351441391501481291601751491661272332232242332212282462322售货员B售货员A3527443339235024483329非参数统计讲义三--两样本检验ppt课件非参数统计讲义三--两样本检验ppt课件非参数统计讲义三--两样本检验ppt课件dataks;inputxg;datalines;29 135 139 144 148 149 150 160 166 175 121 223 224 227 228 232 233 233 246 2;proc

npar1waydata=ksd;classg;varx;run;dataks;

TheNPAR1WAYProcedureKolmogorov-SmirnovTestforVariablexClassifiedbyVariablegEDFatDeviationfromMeangNMaximumatMaximum--------------------------------------------------1100.100000-1.181693290.8888891.245614Total190.473684MaximumDeviationOccurredatObservation18ValueofxatMaximum=33.0KS0.3939KSa1.7170Kolmogorov-SmirnovTwo-SampleTest(Asymptotic)D=max|F1-F2|0.7889Pr>D0.0055D+=max(F1-F2)0.0000Pr>D+1.0000D-=max(F2-F1)0.7889Pr>D-0.0028

Cramer-vonMisesTestforVariablexClassifiedbyVariablegSummedDeviationgNfromMean-------------------------------------1100.522292290.580324Cramer-vonMisesStatistics(Asymptotic)CM0.058032CMa1.102616KuiperTestforVariablexClassifiedbyVariablegDeviationgNfromMean---------------------------1100.000000290.788889KuiperTwo-SampleTest(Asymptotic)K0.788889Ka1.716960Pr>Ka0.0594

Moses方差检验原理及计算过程:不用假定均值相等,设来自方差为的独立同分布样本;来自方差为的独立同分布样本。假设检验问题:

莫斯检验:即两个独立样本的极端反应检验(MosesExtremeReaction)。Moses方差检验原理及计算过程:莫斯检验:基本思想两独立样本的极端反应检验(MosesExtremeReaction),也是一种检验样本来自的两总体分布是否存在显著差异的检验,它将一个样本作为控制样本,另一个样本作为实验样本。以控制样本作为对照,检验实验样本是否存在极端反应。如果实验样本不存在极端反应,则认为两独立总体分布无显著性差异。相反,如果实验样本存在极端反应,则认为两独立总体分布存在显著差异。基本思想Moses方差检验统计量计算1.将随机分为组,每组k个观测,记为;将随机分为组,每组k个观测,记为

2.求每组内样本偏差平方和:

Moses方差检验统计量计算1.将随机首先,将两组样本混合并按升序排序;然后,找出控制样本最低秩和最高秩之间包含的观察个数,称为跨度。为控制极端值对分析结果的影响,也可先去掉控制样本两个最极端的观察值后再求跨度,这个跨度称为截头跨度。本系统自动计算跨度和截头跨度后,会依据分布表给出对应的相伴概率值。如果相伴概率值小于或等于用户心中的显著性水平α,则拒绝零假设,认为样本来自的两个独立总体的分布存在显著差异。首先,将两组样本混合并按升序排序;然后,找出控制样本最低秩和Moses方差检验统计量计算3.将,混合,并求出在混合样本中对应的秩.4.求第1组样本对应的秩和,构造Moses统计量:如果值很大,那么就考虑拒绝零假设。实际检验时可以查分布表。

Moses方差检验统计量计算3.将,8.24.710.76.37.55.214.66.86.35.69.24.211.965.67.412.88.15.26.54.9

13.5

8.24.710.76.37.55.214.66.86.35各组秩和SY=6,秩和Sx=22S=min(6,22)各组秩和SY=6,秩和Sx=22S=min(6,22)非参数统计讲义三--两样本检验ppt课件两个相关样本的检验两个相关样本的检验配对样本的WILCOXON检验对比较配对样本观测值的两个总体用WILCOXON检验。对相关样本的检验用WILCOXON检验统计量配对样本的WILCOXON检验对比较配对样本观测值的两个总体例:太阳镜有紫色和粉红两种颜色,相知道销量是否有差异,16个商店销售数据。紫色粉红564048701006085702284440354528752607770899010106585906170403326例:太阳镜有紫色和粉红两种颜色,相知道销量是否有差异,16个非参数统计讲义三--两样本检验ppt课件例某制造商想要比较两种不同的生产方法所花费的生产时间是否有差异。随机地选取了11个工人,每一个工人都分别使用两种不同的生产方法来完成一项相同的任务,每一个工人开始选用的生产方法是随机的,即可以先使用生产方法1再使用生产方法2,也可以先用生产方法2再使用生产方法1。这样,在样本中的每一个工人都提供了一个配对观察。数据见表所示。任务完成时间的正差值表示生产方法1需要更多的时间,负差值表示生产方法2需要更多的时间。例某制造商想要比较两种不同的生产方法所花费的生产时间是否有工人编号n生产方法M差值D绝对差值秩次R符号秩次RM1M2D=M1-M2|D|-+110.29.50.70.78829.69.8-0.20.22239.28.80.40.43.53.5410.610.10.50.55.55.559.910.3-0.40.43.53.5610.29.30.90.91010710.610.50.10.111810.010.000———911.210.60.60.6771010.710.20.50.55.55.51110.69.80.80.8995.549.5工人编号生产方法M差值D绝对差值秩次符号秩次RM1M2D=Mm1M210.29.59.69.89.28.810.610.19.910.310.29.310.610.5101011.210.610.710.210.69.8两种方法生产时间比较m1M210.29.59.69.89.28.810.610.非参数统计讲义三--两样本检验ppt课件符号检验sign基本思想两个相关样本的符号检验利用正、负符号个数的多少进行检验。首先,分别将第二组样本的各个观察值减去第一组样本的各个观察值,差值为正,则记为正号,差值为负,则记为负号,然后用S+和S-统计正负的个数。如果正负的个数大致相当,则两配对样本数据分布差距较小;若正负的个数相差较多,则两配对样本数据分布差距较大。因为在零假设前提下,两个相关样本中的S+和S—的分布时概率值为0.5的二项分布,为精确计算,系统自动根据S+、S—和n计算实际的概率值,如果该概率值小于或等于用户心中的显著性水平α,则不能拒绝H0,认为样本来自的两个配对总体的分布无显著差异。符号检验sign正负符号检验(sign)将样本2的各样本值减去样本1的各样本值.如果差值为正,则记为正号;如果差值为负,则记为负号如果正号的个数与负号的个数相当,则认为无显著变化.否则,认为有显著变化正负符号检验(sign)两种方法生产时间比较m1M210.29.59.69.89.28.810.610.19.910.310.29.310.610.5101011.210.610.710.210.69.8两种方法生产时间比较m1M210.29.59.69.89.2麦克尼马尔检验McNemar基本思想麦克尼马尔变化显著性检验将研究对象自身作为对照者,采用二项分布检验,通过研究其“前后”的变化,计算二项分布概率值。如果概率值小于或等于用户心中的显著性水平α,则拒绝H0,认为样本来自的两个配对样本总体的分布有显著性差异。麦克尼马尔检验McNemar非参数统计讲义三--两样本检验ppt课件非参数统计讲义三--两样本检验ppt课件非参数统计讲义三--两样本检验ppt课件非参数统计讲义三--两样本检验ppt课件X<-c(49,21,25,107);dim(X)<-c(2,2)mcnemar.test(X,correct=FALSE)Spss有两种方法求mcnemar检验结果X<-c(49,21,25,107);dim(X)<0111000101111010111101111110110011111101对两种饮料的口味评价结果如下表两种饮料没有显著差异NPARTEST/MCNEMAR=Y1WITHY2(PAIRED)/MISS

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论