


版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、非参数统计-十道题09统计学 王若曦32009121114一、 Wilcoxon符号秩检验下面是10个欧洲城镇每人每年平均消费的酒类相当于纯酒精数,数据已经按升序排列:4.125.817.639.7410.3911.9212.3212.8913.5414.45人们普遍认为欧洲各国人均年消费酒量的中位数相当于纯酒精8升,试用上述数据检验这种看法。数据来源:非参数统计(第二版)吴喜之 手算:建立假设组:H0:M=8H1:M>8编号纯酒精数xD=x-8|D|D|的秩D的符号14.12-3.883.885-25.81-2.192.193-37.63-0.370.371-49.741.741.74
2、2+510.392.392.394+611.923.923.926+712.324.324.327+812.894.894.898+913.545.545.549+1014.456.456.4510+;一2 4 6 7 8 9 10=46T_=5 3 1=9n=10查表得P=0.032<=0.05,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。SPSS:操作:An alyzeNon parametric Tests2-Related Sample TestRanksMean Rank Sum of Ranksc - x Negative RanksPositive Ran
3、ksTies7a3b0c6.5746.003.009.00Total10a. c < xb. c > xc. c = xTest Statisticsc - xZ-1.886 aAsymp. Sig. (2-tailed).059Exact Sig. (2-tailed).064Exact Sig. (1-tailed).032Point Probability.008a. Based on positive ranks.b. Wilcoxon Signed Ranks Test由输出结果可知,单侧精确显著性概率P=0.032<: =0.05,因此拒绝原假设,即认为欧洲各国人
4、均年消费酒量的中位数多于8升。与手算结果相同。R语言:> x=c(4.12,5.81,7.63,9.74,10.39,11.92,12.32,12.89,13.54,14.45)> wilcox.test(x-8,alt="greater")Wilcox on sig ned rank testdata: x - 8V = 46, p-value = 0.03223alter native hypothesis: true locati on is greater tha n 0由输出结果可知,P=0.03223<=0.05,因此拒绝原假设,即认为欧洲各国
5、人均年消费 酒量的中位数多于 8升。与以上结果一致。Mann-Whitney-Wilcoxon 检验下表为8个亚洲国家和8个欧美国家2005年的人均国民收入数据。检验亚洲国家和欧 美国家的人均国民收入是否有显著差异(:-=0.05 )。亚洲国家人均国民收入(美元)欧美国家人均国民收入(美元)中国1740美国43740日本38980加拿大32600印度尼西亚1280德国34580马来西亚4960英国37600泰国2750法国34810新加坡27490意大利30010韩国15830墨西哥7310印度720巴西3460数据来源:统计学(第三版)贾俊平 手算:设亚洲国家为X,欧美国家为 Y建立假设组:
6、H0:M x=M yH jM x = M y数值秩组别数值秩组别7201X274909X12802X3001010Y17403X3260011Y27504X3458012Y34605Y3481013Y49606X3760014Y73107Y3898015X158308X4374016YTx =1 2 3 4 6 8 915 = 48Ty =5 7 10 11 12 13 14 16 =88N=m n =16, m=n=8, U 二Tx-m(m 1)/2 = 12查表得,Tx=48的右尾概率的2倍为0.019*2=0.038<: =0.05,因此拒绝原假设,即认为亚洲国家和欧美国家的人均国
7、民收入有显著差异。SPSS:操作:DataSort CasesAn alyzeNon parametric Tests2-1 ndepe ndent SamplesRanks分组NMean RankSum of Ranks收入亚洲国家86.0048.00欧美国家811.0088.00Total16Test Statistics b收入Mann-Whitney U12.000Wilcoxon W48.000Z-2.100Asymp. Sig. (2-tailed).036Exact Sig. 2*(1-tailed Sig.).038 aExact Sig. (2-tailed).038Exac
8、t Sig. (1-tailed).019Point Probability.005a. Not corrected for ties.b. Grouping Variable: 分组由输出结果可知,精确双尾概率P=0.038< : =0.05,因此拒绝原假设,即认为亚洲国家和欧美国家的人均国民收入有显著差异。与手算结果一致。R语言:> x<-c(1740,38980,1280,4960,2750,27490,15830,720)> y<-c(43740,32600,34580,37600,34810,30010,7310,3460)> wilcox.tes
9、t(x,y,exact=F,cor=F)Wilcox on rank sum testdata: x and yW = 12, p-value = 0.03569alter native hypothesis: true locati on shift is not equal to 0由输出结果可知,P=0.03569< :- =0.05,因此拒绝原假设,即认为亚洲国家和欧美国家的人均国民收入有显著差异。与以上结果一致。两样本的Kolmogorov-Smirnov检验F面是13个非洲地区和13个欧洲地区的人均酒精年消费量,试分析这两个地区的酒精人均年消费量是否分布相同。非洲欧洲5.38
10、6.674.3816.219.3311.933.669.853.7210.431.6613.540.232.40.0812.892.369.31.7111.922.015.740.914.451.541.99数据来源:非参数统计(第二版)吴喜之手算: 建立假设组:H°:Fi(x)=F2(x)Hi:Fi(x) Tx)xf1f2Z f1Z f2S(x)S2 ( X )lDl0.0810100.07692300.0769230.2310200.15384600.1538460.910P 300.23076900.2307691.5410400.30769200.3076921.661050
11、0.38461500.3846151.71:10P 600.4615380 :0.4615381.9901610.4615380.0769230.3846152.0110710.5384620.0769230.4615382.36:10P 810.6153850.076923 0.5384622.401820.6153850.1538460.4615383.6610920.6923080.1538460.5384623.72:10:1020.7692310.153846 :0.6153854.38101120.8461540.15384610.6923085.38101220.9230770.
12、1538460.7692315.7401r 1230.9230770.2307690.6923086.67 丁011240.9230770.3076920.6153859.3011250.9230770.3846150.5384629.331013510.3846150.6153859.85 :0113610.46153810.53846210.430113710.5384620.46153811.9201r 13810.6153850.38461511.930113910.69230810.30769212.8901131010.7692310.23076913.5401131110.846
13、1540.15384614.45 :01131210.923077 10.07692316.21011313110D=max ( D )=0.769231, mnD=130查表得,当mnD=130时,双侧检验的概率 P<0.01,所以P<=0.05 ,因此拒绝原假设, 即认为这两个地区的酒精人均年消费量分布有显著差异。SPSS:操作: An alyzeNon parametric Tests2-1 ndepe ndent SamplesFrequencies分组N消费量非洲地区13欧洲地区13Frequencies分组N消费量非洲地区13欧洲地区13Total26Test Stat
14、istics消费量Most Extreme DifferencesAbsolute.769Positive.769Negative.000Kolmogorov-Smirnov Z1.961Asymp. Sig. (2-tailed).001Exact Sig. (2-tailed).000Point Probability.000a. Grouping Variable: 分组由输出结果可知,双侧精确显著性概率:=0.05,因此拒绝原假设,即认为这两个地区的酒精人均年消费量分布有显著差异。与手算结果一致。四、 Cochran Q检验下面是某村村民对四个候选人( A,B,C, D)的赞同与否的调
15、查(“ 1”代表同意,“ 0” 代表不同意);最后一列为行总和,最后一行为列总和,全部“1 ”的总和为42。试分析4位候选人在村民眼中有没有区别( a =0.05)。20个村民对A、B、C、D四个候选人的评价NA0110011111111111011116B1100011111011011000011C011110000100011010109D000011001000010110006L1321232233122333212142数据来源:非参数统计(第二版)吴喜之手算:建立假设组:H 0:4位候选人在村民眼中没有差异H, :4位候选人在村民眼中有差异(k-1) |匹 x2- (£
16、 x)IL j=i j=ink-i=1df =4-1=3n丁 2yi 八yii=1_(4 _1)4(162 +112 + 92 + 6j _422 =935294(42) -(5 12 8 22 7 32)查表得尤0.05=7.82 : Q =9.3529,因此在5%的显著性水平上拒绝原假设,即认为4位候选人在村民眼中有显著差异。SPSS:操作: An alyzeNon parametric TestsK Related SamplesFrequenciesValue01A416B911C119D146Test StatisticsN20Cochran's Q9.353 adf3Asy
17、mp. Sig.025Exact Sig.025Point Probability.006a. 0 is treated as a success.由输出结果可知,Q=9.353,精确的显著性概率P=0.025< : =0.05,因此拒绝原假设,即认为4位候选人在村民眼中有显著差异。与手算结果一致。R语言:> x=read.table("f:/Cochra nQ.txt")> n=apply(x,2,sum)> N=su m(n)> L=apply(x,1,sum)> k=dim(x)2> Q=(k*(k-1)*sum( n-mea
18、 n(n )A2)/(k*N-sum(LA2)> Q1 9.352941> pvalue=pchisq(Q,k-1,low=F)> pvalue1 0.02494840由输出结果可知, Q=9.352941 , P=0.02494840< : =0.05,因此拒绝原假设,即认为 4 位候选人在村民眼中有显著差异。与以上结果一致。五、 Friedman检验一项关于销售茶叶的研究报告说明销售方式可能和售出率有关。三种方式为:在商店内等待,在门口销售和当面表演炒制茶叶。 对一组商店在一段时间的调查结果列再下表中(单位为购买者人数)。试问三种不同的销售方式是否有显著差异( a
19、=0.05 )。销售方式购买率(%商店内等待2025291817221820门口销售2623153026322827表演炒制5347484352574956数据来源:非参数统计(第二版)吴喜之手算: 建立假设组:H0:三种销售方式无差异H,:三种销售方式有差异1212 R2 -3n(k1)=nk(k 1)j=1 j8 3(3 1)(102 142242) -3 8(3 1)=13三种方式购买率等级销售方式购买率合计商店内等待1221111110门口销售2112222214表演炒制3333333324df =3 -1 =2查表得Z0.05 =5.99< 3; =13,因此在5%的显著性水平
20、上拒绝原假设,即认为三种销售方式有显著差异。SPSS:操作: An alyzeNon parametric TestsK Related SamplesRanksMean Rank商店内等待1.25门口销售1.75表演炒制3.00Test StatisticsN8Chi-Square13.000df2Asymp. Sig.002Exact Sig.000Point Probability.000a. Friedman Test由输出结果可知,=1332.05 =5.99,精确的显著性概率 P<0.001,因此在5%的显著性水平上拒绝原假设,即认为三种销售方式有显著差异。与手算结果一致。R
21、语言:> d=read.table("f:/Friedma n. txt")> friedma n. test(as.matrix(d)Friedma n rank sum testdata: as.matrix(d)Friedman chi-squared = 13, df = 2, p-value = 0.001503由输出结果可知,2 =13, P=0.001503<=0.05,因此拒绝原假设,即认为三种销售方式有显著差异。与以上结果一致。六、 K个样本的卡方检验在一个有三个主要百货商场的商贸中心,调查者问479个不同年龄段的人首先去三个商场中的哪个
22、,结果如下表,检验人们去这三个商场的概率是否一样。年龄段商场1商场2商场3总和<3083704519830 50918615192>5041381089总和21519470479数据来源:非参数统计 王星 手算:建立假设组:H0:人们去三个商场的概率相同H1:人们去三个商场的概率不同分组f1f2f3fi0e2e32(fy)尼12(f2-e2)尼22(f3-®) /e<3083704519888.87380.19228.9350.3881.2958.91930 5091861519286.18077.76228.0580.2700.8736.077>504138
23、 :1089:39.94836.04613.0060.028P 0.106P 0.695合计21519470479215.000194.00070.0000.6852.27415.6912r k(f -e“ xQ=0.685+2.274+15.69 仁18.651i=i j=i edf=(k-1)(r-1)=4查表得尤0.05=9.49,因为Q=18.651>监05=9.49,因此拒绝原假设,即认为人们去三个商场的概率不同。SPSS:操作:DataWeight CasesAn alyzeDescriptive StatisticsCrosstabsChi-Square TestsValu
24、edfAsymp. Sig.(2-sided)Exact Sig. (2-sided)Exact Sig. (1-sided)Point ProbabilityPearson Chi-Squarea18.6514.001bkelihood Ratio18.6914.001.001Fisher's Exact Test18.314.001near-by-Linear Association5.110c1.024.026.013.003N of Valid Cases479a. 0 cells (.0%) have expected count less than 5. The minim
25、um expected count is 13.01.b. Cannot be computed because there is insufficient memory.c. The standardized statistic is -2.260.由输出结果可知,卡方统计量为18.651,精确双尾检验概率P=0.01<g =0.05,因此拒绝原假设,即认为人们去三个商场的概率不同。与手算结果一致。七、 Kruskal-Wallis 检验某制造商雇用了来自三个本地大学的雇员作为管理人员。最近,公司的人事部门已经收集信息并考核了年度工作成绩。从三个大学来的雇员中随机地抽取了三个独立样本。
26、制造商想知道是否来自这三个不同的大学的雇员在管理岗位上的表现有所不同。雇员大学A大学B大学C12560502702070360306048515805954090690357078075数据来源:百度文库 SAS讲义手算: 建立假设组:H。:三个总体的考核成绩分布相同 已:三个总体的考核成绩分布不同雇员大学A大学B大学C13972122123949417115.5520618.5618.5512715.514秩和952788各雇员的成绩等级KW统计量H= R!-3(N+1)=上型+凹1+鯉1N(N+1) j=i nj20(21) 767-3(20 1) =8.9163因为出现同分的情况,应对
27、H 进行校正,校正系数c ” 送 u3_:Zu 一 (33 _3 + 33 3+23 _2+23_2) C 二 1 _ o =1N(N2+1)20(202+1)校正后的统计量 H =8.9163/0.9925 = 8.9839 df=k 一1 =2二 0.9925查表得,在a =0.05的显著性水平上,7-105 =5.99,由于H=8.9839為.05 =5.99,因此拒绝原假设,即三个总体的考核成绩分布不同。SPSS:操作: An alyzeNon parametric TestsK In depe ndent Samples分组NMean Rank成绩大学A713.57大学B64.50大
28、学C712.57Total20RanksTest Statistics '成绩Chi-Squaredf8.984Asymp. Sig.011Exact Sig.006Point Probability.000a. Kruskal Wallis Testb. Grouping Variable:分组由输出结果可知,KW统计量为8.984,精确概率为0.006,远远小于显著性水平 0.05, 因此拒绝原假设,即三个总体的考核成绩分布不同。与手算结果一致。八、列联表卡方检验一种原料来自三个不同的地区,原料质量被分成三个不同等级。从这批原料中随机抽取500件进行检验,得样本数据如下表所示,要求
29、检验地区与原料质量之间有无依赖关系。一级二级三级合计地区1526424140 :地区2605952171地区3506574189 1合计162188150500数据来源:百度文库统计学教程PPT 手算:建立假设组:H。:地区与原料质量无关H1:地区与原料质量相关地区等级fjq(fij-eij)2/ej115245.360.97126452.642.451324427.71216055.40.38225964.30.442 :3P 5251.30.01315061.242.06326571.060.52337456.75.28合计19.82Qr *=19.82i=i j=i edf=(r-1)(
30、c-1)=4查表得,逬05=9.49,由于Q=19.82<0.05=9.49,因此拒绝原假设,即认为地区与原料质量相关。SPSS:操作:DataWeight CasesAn alyzeDescriptive StatisticsCrosstabs地区 * 等级 Crosstabulation等级Total一级二级三级地区地区1Count526424140Expected Count45.452.642.0140.0地区2Count605952171Expected Count55.464.351.3171.0地区3Count506574189Expected Count61.271.15
31、6.7189.0TotalCount162188150500Expected Count162.0188.0150.0500.0Chi-Square TestsValuedfAsymp. Sig.(2-sided)Exact Sig. (2-sided)Exact Sig. (1-sided)Point ProbabilityPearson Chi-Square19.822 a4.001bkelihood Ratio20.7324.000.000Fisher's Exact Test20.510.000near-by-Linear Associationc13.9631.000.000
32、.000.000N of Valid Cases500a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 42.00.b. Cannot be computed because there is insufficient memory.c. The standardized statistic is 3.737.由输出结果可知,检验统计量为19.822,精确双尾显著性概率P远远小于显著性水平0.05,因此拒绝原假设,即认为地区与原料质量相关。与手算结果一致。九、 Kendall秩相关某研
33、究所对10对双胞胎儿童的智力进行调查,结果如下表: 儿童智力测试得分双胞胎编号先出生儿童(X后出生儿童(丫)197.8n216.619.3316.220.1411.37.1516.21367.14.877.88.9847.4911.210101.31.5数据来源:非参数统计:方法与应用 易丹辉 董寒青 手算:儿童智力测试得分评秩XYX的秩Y的秩D1.31.5P 110P 047.424-247.14.832117.88.956-1197.8550011.21067-1:1 111.37.17341616.220.18.510-1.52.2516.213:8.580.5r 0.25 116.61
34、9.310911u =9 6 7 4 4 3 3 01= 37V =0 2 0 21 101 0 0=7Kendall 秩相关系数 T= 2(U V) = 2(37 7) =0.6667n(n-1)10(10-1)由于同分,所以T二(37-7)二门6742J(1/2)10(10-1)-(1/2)2(2-1) 7(1/2)10(10-1)对T的显著性进行检验,建立假设组:H0:不相关H + :正相关查表得,n=10,T=0.6667或T=0.6742相应的概率在 0.0002至0.0005之间,远远小于显著性水平0.05,因此拒绝原假设,即认为双胞胎儿童的智力之间存在着正相关。SPSS:操作:
35、An alyzeCorrelateBivariateCorrelations先岀生儿童后岀生儿童Kendall's tau_b先岀生儿童Correlation Coefficient1.000*.674Sig. (2-tailed).007N1010后岀生儿童Correlation Coefficient*.6741.000Sig. (2-tailed).007N1010*. Correlation is significant at the 0.01 level (2-tailed).由输出结果可知,T=0.674,双侧检验的显著性概率为0.007,则单侧的显著性概率为0.0035,
36、远远小于显著性水平 0.05,因此拒绝原假设,即认为双胞胎儿童的智力之间存在着 正相关。与手算结果一致。R语言:> x=c(9.0,16.6,16211.3,1627.1,7.8,4.0,11.2,1.3)> y=c(7.8,19.3,20.1,7.1,13.0,4.8,8.9,7.4,10.0,1.5)> cor.test(x,y,method="ke ndall")Ken dall's rank correlatio n taudata: x and yz = 2.6941, p-value = 0.007058alter native hypothesis: true tau is not equal to 0 sample
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论