非参数统计十道题_第1页
非参数统计十道题_第2页
非参数统计十道题_第3页
非参数统计十道题_第4页
非参数统计十道题_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

非参数统计 十道题09统计学王若曦114一、Wilcoxon符号秩检验下面是10个欧洲城镇每人每年平均消费的酒类相当于纯酒精数,数据已经按升序排列:4.125.817.639.7410.3911.9212.3212.8913.5414.45人们普遍认为欧洲各国人均年消费酒量的中位数相当于纯酒精8升,试用上述数据检验这种看法。数据来源:《非参数统计(第二版)》吴喜之手算:建立假设组:H:M=80H:M>81编号纯酒精数xD=x-8|D||d|的秩D的符号14.12-3.883.885—25.81-2.192.193—37.63-0.370.371—49.741.741.742+510.392.392.394+611.923.923.926+712.324.324.327+812.894.894.898+913.545.545.549+1014.456.456.4510+T二2+4+6+7+8+9+10二46+T二5+3+1二9n=10查表得p=0.032va=0.05,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。SPSS:操作:Analyze NonparametricTests 2-RelatedSampleTestRanksNMeanRankSumofRanksc-x NegativeRanks7a6.5746.00PositiveRanks3b3.009.00Ties0cTotal10TOC\o"1-5"\h\zc<xc>xc=xTeststatisticsbc-xZ-1.886aAsymp.Sig.(2-tailed).059ExactSig.(2-tailed).064ExactSig.(1-tailed).032PointProbability.008Basedonpositiveranks.WilcoxonSignedRanksTest由输出结果可知,单侧精确显著性概率P=0.032va=0.05,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。与手算结果相同。R语言:x=c(4.12,5.81,7.63,9.74,10.39,11.92,12.32,12.89,13.54,14.45)wilcox.test(x-8,alt="greater")Wilcoxonsignedranktestdata:x-8V=46,p-value=0.03223alternativehypothesis:truelocationisgreaterthan0由输出结果可知,P=0.03223<a=0.05,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。与以上结果一致。二、Mann-Whitney-Wilcoxon检验下表为8个亚洲国家和8个欧美国家2005年的人均国民收入数据。检验亚洲国家和欧美国家的人均国民收入是否有显著差异(a=0.05)。亚洲国家人均国民收入(美元)欧美国家人均国民收入(美元)中国1740美国43740日本38980加拿大32600印度尼西亚1280德国34580马来西亚4960英国37600泰国2750法国34810新加坡27490意大利30010韩国15830墨西哥7310印度720巴西3460数据来源:《统计学(第三版)》贾俊平手算:设亚洲国家为X,欧美国家为Y建立假设组:H:M=M0xyH:M丰M1xy数值秩组别数值秩组别7201X274909X12802X3001010Y17403X3260011Y27504X3458012Y34605Y3481013Y49606X3760014Y73107Y3898015X158308X4374016YT=1+2+3+4+6+8+9+15=48xT=5+7+10+11+12+13+14+16=88yN=m+n=16,m=n=8,U=T-m(m+1)/2=12x查表得,Tx=48的右尾概率的2倍为0.019*2=0.038<«=0.05,因此拒绝原假设,即认为亚洲国家和欧美国家的人均国民收入有显著差异。SPSS:操作:Data SortCasesAnalyze NonparametricTests 2-IndependentSamplesRanks分组NMeanRankSumofRanks收入亚洲国家86.0048.00欧美国家811.0088.00Total16TestStatisticsb收入Mann-WhitneyU12.000WilcoxonW48.000Z-2.100Asymp.Sig.(2-tailed).036ExactSig.[2*(1-tailedSig.)]・038aExactSig.(2-tailed).0383ExactSig.(1-tailed).019PointProbability.005Notcorrectedforties.GroupingVariable:分组由输出结果可知,精确双尾概率P=0.038v =0.05,因此拒绝原假设,即认为亚洲国家和欧美国家的人均国民收入有显著差异。与手算结果一致。R语言:x<-c(1740,38980,1280,4960,2750,27490,15830,720)y<-c(43740,32600,34580,37600,34810,30010,7310,3460)wilcox.test(x,y,exact=F,cor=F)Wilcoxonranksumtestdata:xandyW=12,p-value=0.03569alternativehypothesis:truelocationshiftisnotequalto0由输出结果可知,P=0.03569va=0.05,因此拒绝原假设,即认为亚洲国家和欧美国家的人均国民收入有显著差异。与以上结果一致。三、 两样本的Kolmogorov-Smirnov检验下面是13个非洲地区和13个欧洲地区的人均酒精年消费量,试分析这两个地区的酒精人均年消费量是否分布相同。非洲欧洲5.386.674.3816.219.3311.933.669.853.7210.431.6613.540.232.40.0812.892.369.31.7111.922.015.740.914.451.541.99数据来源:《非参数统计(第二版)》吴喜之手算:建立假设组

H:F(x)=F(x)012H:F(x)主F(x)112xf1f2工f1工f2S(x)1S(x)2D0.0810100.07692300.0769230.2310200.15384600.1538460.910300.23076900.2307691.5410400.30769200.3076921.6610500.38461500.3846151.7110600.46153800.4615381.9901610.4615380.0769230.3846152.0110710.5384620.0769230.4615382.3610810.6153850.0769230.5384622.401820.6153850.1538460.4615383.6610920.6923080.1538460.5384623.72101020.7692310.1538460.6153854.38101120.8461540.1538460.6923085.38101220.9230770.1538460.7692315.74011230.9230770.2307690.6923086.67011240.9230770.3076920.6153859.3011250.9230770.3846150.5384629.331013510.3846150.6153859.850113610.4615380.53846210.430113710.5384620.46153811.920113810.6153850.38461511.930113910.6923080.30769212.8901131010.7692310.23076913.5401131110.8461540.15384614.4501131210.9230770.07692316.21011313110D=max(|D|)=0.769231,mnD=130查表得,当mnD=130时,双侧检验的概率Pv0.01,所以P"=0.05,因此拒绝原假设,即认为这两个地区的酒精人均年消费量分布有显著差异。SPSS:操作:Analyze NonparametricTests 2-IndependentSamplesFrequencies分组N消费量非洲地区13欧洲地区13Frequencies分组N消费量非洲地区13欧洲地区13Total26TestStatisticsa消费量MostExtremeDifferencesAbsolute.769Positive.769Negative.000Kolmogorov-SmirnovZ1.961Asymp.Sig.(2-tailed).001ExactSig.(2-tailed).000PointProbability.000GroupingVariable:分组由输出结果可知,双侧精确显著性概率P=«=0.05,因此拒绝原假设,即认为这两个地区的酒精人均年消费量分布有显著差异。与手算结果一致。四、CochranQ检验下面是某村村民对四个候选人(A,B,C,D)的赞同与否的调查“1”代表同意,“0”代表不同意);最后一列为行总和,最后一行为列总和,全部“1”的总和为42。试分析4位候选人在村民眼中有没有区别(Q=0.05)。20个村民对A、B、C、D四个候选人的评价NA0110011111111111011116B1100011111011011000011C011110000100011010109D000011001000010110006L1321232233122333212142数据来源:《非参数统计(第二版)》吴喜之手算:建立假设组:H:4位候选人在村民眼中没有差异0H:4位候选人在村民眼中有差异(k-1)Ik工x2-£)2|Q=Lj=ijj=ij」=(4-1)[4(1压+112+92+62)-422]=9.3529k工V-》V2 4(42)-(5x12+8x22+7x32) *iii=1i=1df=4-1=3查表得X2二7.82<Q二9.3529,因此在5%的显著性水平上拒绝原假设,即认为40.05位候选人在村民眼中有显著差异。SPSS:操作:Analyze NonparametricTests KRelatedSamplesFrequenciesVaue01A416B911C119D146TestStatisticsN20Cochran'sQ9.353adf3Asymp.Sig..025ExactSig..025PointProbability.006a.0istreatedasasuccess.由输出结果可知,Q=9.353,精确的显著性概率P=0.025v«=0.05,因此拒绝原假设,即认为4位候选人在村民眼中有显著差异。与手算结果一致。R语言:x=read.table("f:/CochranQ.txt")n=apply(x,2,sum)N=sum(n)L=apply(x,1,sum)k=dim(x)[2]Q=(k*(k-1)*sum((n-mean(n))人2))/(k*N-sum(L^2))Q[1]9.352941pvalue=pchisq(Q,k-1,low=F)pvalue[1]0.02494840由输出结果可知,Q=9.352941, P=0.02494840va=0.05,因此拒绝原假设,即认为4位候选人在村民眼中有显著差异。与以上结果一致。五、Friedman检验一项关于销售茶叶的研究报告说明销售方式可能和售出率有关。三种方式为:在商店内等待,在门口销售和当面表演炒制茶叶。对一组商店在一段时间的调查结果列再下表中(单位为购买者人数)。试问三种不同的销售方式是否有显著差异(a=0.05)。销售方式购买率(%)商店内等待2025291817221820门口销售2623153026322827表演炒制5347484352574956数据来源:《非参数统计(第二版)》吴喜之手算:建立假设组:H:三种销售方式无差异0H:三种销售方式有差异1三种方式购买率等级销售方式购买率合计商店内等待1221111110门口销售2112222214表演炒制333333332410X2二—芳R2-3n(k+1)二— (102+142+242)-3x8(3+1)二13rnk(k+1)j 8x3(3+1)j=1df二3-1二2查表得X2二5.99<X2二13,因此在5%的显著性水平上拒绝原假设,即认为三种销0.05 r售方式有显著差异。SPSS:操作:Analyze NonparametricTests KRelatedSamplesRanksMeanRank商店内等待1.25门口销售1.75表演炒制3.00

TestStatisicsaN8Chi-Square13.000df2Asymp.Sig..002ExactSig..000PointProbability.000a.FriedmanTest由输出结果可知,X2二13>X2二5.99,精确的显著性概率PvO.OOl,因此在5%的r 0.05显著性水平上拒绝原假设,即认为三种销售方式有显著差异。与手算结果一致。R语言:d=read.table("f:/Friedman.txt")friedman.test(as.matrix(d))Friedmanranksumtestdata:as.matrix(d)Friedmanchi-squared=13,df=2,p-value=0.001503由输出结果可知,X2二13,P=0.001503va=0.05,因此拒绝原假设,即认为三种销售方式有显著差异。与以上结果一致。六、K个样本的卡方检验在一个有三个主要百货商场的商贸中心,调查者问479个不同年龄段的人首先去三个商场中的哪个,结果如下表,检验人们去这三个商场的概率是否一样。年龄段商场1商场2商场3总和<3083704519830—50918615192>5041381089总和21519470479数据来源:《非参数统计》王星手算:建立假设组:H:人们去三个商场的概率相同0H:人们去三个商场的概率不同1分组f1f2f3fie1e2e3(f-e)2/e111(f-e)2/e222(f-e)2/e3 3 3<3083704519888.87380.19228.9350.3881.2958.919

30—509130—5091861519286.18077.76228.0580.2700.8736.077>504138108939.94836.04613.0060.0280.1060.695合计21519470479215.000194.00070.0000.6852.27415.691,k\f-eJ2q=EY ijij=0.685+2.274+15.691=18.651ei=1j=1 ijdf=(k-1)(r-1)=4查表得X0J9.49'因为Q=18.651>猛5=9.49,因此拒绝原假设’即认为人们去三个商场的概率不同。SPSS:操作:Data WeightCasesAnalyze DescriptiveStatistics CrosstabsChi-SquareTestsValuedfAsymp.Sig.(2-sided)ExactSig.(2-sided)ExactSig.(1-sided)PointProbabilityPearsonChi-Square18.651a4.001.bLikelihoodRatio18.6914.001.001Fisher'sExactTest18.314.001Linear-by-LinearAssociation5.110c1.024.026.013.003NofValidCases4790cells(.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis13.01.Cannotbecomputedbecausethereisinsufficientmemory.Thestandardizedstatisticis-2.260.由输出结果可知,卡方统计量为18.651,精确双尾检验概率P=0.01va=0.05,因此拒绝原假设,即认为人们去三个商场的概率不同。与手算结果一致。七、 Kruskal-Wallis检验某制造商雇用了来自三个本地大学的雇员作为管理人员。最近,公司的人事部门已经收集信息并考核了年度工作成绩。从三个大学来的雇员中随机地抽取了三个独立样本。制造商想知道是否来自这三个不同的大学的雇员在管理岗位上的表现有所不同。雇员大学A大学B大学C12560502702070360306048515805954090690357078075数据来源:百度文库SAS讲义

手算:建立假设组H:三个总体的考核成绩分布相同0H:三个总体的考核成绩分布不同1各雇员的成绩等级雇员大学A大学B大学C13972122123949417115.5520618.5618.5512715.514秩和952788(95)2*(27)^*竺12kR2 12KW统计量H= fa-3(N+1)=N(N+1)nj=1j因为出现同分的情况,应对H进行校正,校正系数C=1-工U3-》U=1-(33-3*33-3*23-2*23-2)=0.9925N(N2+1) 20(202+1)校正后的统计量H=8.9163/0.9925=8.9839df=k-1=220(21) 7-3(20+1)=8.9163查表得,在0.05的显著性水平上,X2=5.99,由于H=8.9839>X2=5.99,因此0.05 0.05拒绝原假设,即三个总体的考核成绩分布不同。SPSS:操作:Analyze NonparametricTests KIndependentSamples成绩Chi-Square8.984成绩Chi-Square8.984Ranks分组NMeanRank成绩大学A713.57大学B64.50大学c712.57Total20TestStatistcsa,bAsymp.Sig..011ExactSig..006PointProbability.000KruskalWallisTestGroupingVariable:分组由输出结果可知,KW统计量为8.984,精确概率为0.006,远远小于显著性水平0.05,因此拒绝原假设,即三个总体的考核成绩分布不同。与手算结果一致。八、列联表卡方检验一种原料来自三个不同的地区,原料质量被分成三个不同等级。从这批原料中随机抽取500件进行检验,得样本数据如下表所示,要求检验地区与原料质量之间有无依赖关系。一级二级三级合计地区1526424140地区2605952171地区3506574189合计162188150500数据来源:百度文库统计学教程PPT手算:建立假设组:H:地区与原料质量无关0H:地区与原料质量相关1地区等级fijeij(f-e)2/eijij ij115245.360.97126452.642.451324427.71216055.40.38225964.30.44235251.30.01315061.242.06326571.060.52337456.75.28合计19.82Q±cfij-eij"=19.82ei=1j=1 ijdf=(r-1)(c-1)=4查表得,X2=9.49,由于Q=19.82>X2=9.49,因此拒绝原假设,即认为地区与原0.05 0.05料质量相关。

SPSS:操作:Data WeightCasesAnalyze DescriptiveStatistics Crosstabs地区*等级Crosstabulation等级Total一级二级三级地区地区1Count526424140ExpectedCount45.452.642.0140.0地区2Count605952171ExpectedCount55.464.351.3171.0地区3Count506574189ExpectedCount61.271.156.7189.0TotalCount162188150500ExpectedCount162.0188.0150.0500.0Chi-SquareTestsValuedfAsymp.Sig.(2-sided)ExactSig.(2-sided)ExactSig.(1-sided)PointProbabilityPearsonChi-Square19.822a4.001.bLikelihoodRatio20.7324.000.000Fisher'sExactTest20.510.000Linear-by-LinearAssociation13.963c1.000.000.000.000NofValidCases5000cells(.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis42.00.Cannotbecomputedbecausethereisinsufficientmemory.Thestandardizedstatisticis3.737.由输出结果可知,检验统计量为19.822,精确双尾显著性概率P远远小于显著性水平0.05,因此拒绝原假设,即认为地区与原料质量相关。与手算结果一致。九、Kendall秩相关某研究所对10对双胞胎儿童的智力进行调查,结果如下表儿童智力测试得分双胞胎编号先出生儿童(X)后出生儿童(Y)197.8216.619.3316.220.1411.37.1516.213

67.14.877.88.9847.4911.210101.31.5数据来源:《非参数统计:方法与应用》易丹辉董寒青手算:儿童智力测试得分评秩XYX的秩Y的秩D1.31.5110047.424-247.14.832117.88.956-1197.8550011.21067-1111.37.17341616.220.18.510-1.52.2516.2138.580.50.2516.619.310911U=9+6+7+4+4+3+3+0+1=37V=0+2+0+2+1+1+0+1+0+0=7Kendall秩相关系数丁=2(U-V)=2(37-7)=0.6667n(n-l)10(10-1)由于同分,所以T= =0.6742J(1/2)10(10-1)-(1/2)2(2-1)J(1/2)10(10-1)对T的显著性进行检验,建立假设组:H:不相关0H:正相关+查表得,n=10,T=0.6667或T=0.6742相应的概率在0.0002至0.0005之间,远远小于显著性水平0.05,因此拒绝原假设,即认为双胞胎儿童的智力之间存在着正相关。SPSS:操作:Analyze Correlate BivariateCorrelations先出生儿童后出生儿童Kendall'stau_b先出生儿童CorrelationCoefficient1.000.674**Sig.(2-tailed).007N1010后出生儿童CorrelationCoefficient.674**1.000Sig.(2-tailed).007N1010**.Correlationissignificantatthe0.01level(2-tailed).由输出结果可知,T=0.674,双侧检验的显著性概率为0.007,则单侧的显著性概率为0.0035,远远小于显著性水平0.05,因此拒绝原假设,即认为双胞胎儿童的智力之间存在着正相关。与手算结果一致。R语言:x=c(9.0,16.6,16.2,11.3,16.2,7.1,7.8,4.0,11.2,1.3)y=c(7.8,19.3,20.1,7.1,13.0,4.8,8.9,7.4,10.0,1.5)cor.test(x,y,method="kendall")Kendall'srankcorrelationtaudata:xandyz=2.6941,p-value=0.007058alternativehypoth

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论