王静龙《非参数统计分析》教案_第1页
王静龙《非参数统计分析》教案_第2页
王静龙《非参数统计分析》教案_第3页
王静龙《非参数统计分析》教案_第4页
王静龙《非参数统计分析》教案_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

引言总体分布,但大部分情况,总体是未知合格产品的标准长度为(),随即抽取n=100件零件,数据如下:表ii=1格,所以需要更换供应厂长长度(cm)频率(%)~5~0~14545~0~4100的工资企业企业1111213141516171819204060企业23456789103050数的假设检验问题,原假设为H:a=b,备择假设为H:a>b0mn若H为真,则0i=1i=1也可以用P值检验这里我们采用的显着性水平为.要是因为假设工资服从正态分布,这然得出的结论不可靠。这时候,它们各有优缺点,互第二章描述性统计?表格法和图形法和频率分布表10710773689776799459985773815465718084799863656679866874618265986371621166479787977868976748573806878897258927888771038863688881647375906289717470856165617562947185848363926881(1)找到最小值43,最大值116;布表灯丝寿命(小时)灯丝寿命(小时)频率(%)112883101?表格法和图形法。11353313234^^众数3最小值1大值534观测数12布表赔款次数0--4002400--80032240--1600190--200010--24006030023200--360013600--40001合计100?经济专业毕业生的月收入数据卜SS8ce卜己a?有缺陷的小巧克力不合格品问题的频数频率分布表频率(次)卜Sc卜己()()()()aiiai=1i=1aiiai=1i=1***********789?表示离散程度的数值,而四分位数又分上四分位数与下值,下四分位数,中4数据容量数据容量N12平均数Mean1940数Median1905切尾平均数TrMean1924Q1上四分位数Q3b图四分位数的计算数是将总体的全部数据按大小顺序排列后,处于各等分位置的变量值.如果将全部数据分成相等的两部分,它就是中位数;如果分成四等分,就是四分位数;八等分就是等.四分位数也称为四分位点,它是将全部数据分成相等的四部分,其中每部分包括25%的数据,处在各分位点的数值就是四分位数.四分位数有三个,第一个四分位常所说的四分位数,称为下四分位数,第二个四分位数就是中位数,第三个四统计中有着十分重要的作用和意义,现就四分位数的计算做一详细阐述.一、资料未分组四分位数计算第二步:根据第一步四分位数的位置,计算相应四分位数./4=9.QQQ36(岁)四分位数的位置就带有小数,需要进一步研究.带有小数的位置与位置前后数位置的远近,距离越近,权数越大,距离越远,权数越小,权/4=.计算第一步:向上或向下累计次数(因篇幅限制,以下均采取向上累计次数方式计算);位数):(1)向上累计方式获得四分位数位置:shitouwa3?标准误由~N(0,1)得~t(n一1)QnSn区间的端点S即得=xt(n一1).n0.975nVariableNN*MeanSEMeanStDevMinimumQ1MedianQ3均194018801700234023280观测数12§偏度偏度(Skewness)反应单峰分布的对诚性,总体偏度用s表示jnjni=1ssssss峰度(Kurtosis)反映峰的尖峭程度,总体峰度用k表示,总体的峰度的定义为(国家标准)kkkk验法检验的一个重要230722437020327242962225619140256692240426744267442340620439248902481524556184722451422516251122348026552240741806422590^^^^^?符号检验在定性数据分析中的应用比认为我们的生活比过去差的 (380)?成对数据的比较问题9=12,6i=c1ic2i,9为品种差,6i为随机差。6i关于原点对称的分布。由于c和c都服从关于原点对称的分布,cc=cc(同分布)1i2i1i2i2i1i则i所以6关于原点对称。ii=1冷却水中取样,测量水中的含氯量(106)一次,记录如下:差xiyi1123456789由于x=+,iiiiii.yiii.iiiii选取统计量z=xiiiiiii=1ii=1z1211ii=1方法二:也可采用P值检验每平方可开发水资源每平方可开发水资源i=1右侧拒绝域为:W={S+16}0146915233136657788H:M34H:M<3401i=1左侧拒绝域为:W={S+2}01i=1右侧拒绝域为:W={S+10}故接受H,拒绝H。01第四章符号秩和检验法?对称中心为原点的检验问题iiiii=1‘如果9>0,则P(X>0)>P(X>9)=1,P(X<0)<P(X<9)=122即P(X>a)>P(X<a),Va>0此时P(X>a)<P(X<a),Va>0我们在W+较大或者较小的时候拒绝原假设,检验的临界值c,d为?符号秩和检验统计量W+的性质性质令S=niu,则在总体的分布关于原点0对称时,W+与S同分布:ii=1表r0个观察值和它们的符号,绝对值和绝对值的秩表r0个观察值和它们的符号,绝对值和绝对值的秩i=1i=112nii2iii2ii=1i=1nnnnnnni=14时间及其差值工人工人方式1方式2差值工人方式1方式2差值172839410511612及绝对值的秩工工人差值符号差的绝绝对值工人对值的秩差值符号差的绝绝对值对值的秩110752781233984910115211461126所以拒绝原假设H,接受备择假设H01i绩yi72455308-79166(1)假设测验成绩服从正态分布,问学生的培训效果是否显着?(2)不假定总体分布,采用符号检验的方法检验学生的培训效果是否显着?(3)采用符号秩和检验方法检验学生的培训效果是否显着,三种检验方法结论解:(1)由于测验成绩符合正态分布,而2未知,所以我们采用T检验由于2未知,所以我们选取统计量zz-4.3333而检测值T===-1.6378茫WSn7.93739z故接受H,拒绝H,即认为培训效果不明显。1(2)原假设与备择假设为:故接受H,拒绝H,即认为培训效果不明显。1(3)原假设与备择假设为:满足P(W+>C)=0.05,右侧临界点为37,由于W+密度的对称中心为iii1故接受H,拒绝H,即认为培训效果不明显.01101112131415ABiii(2)采用符号秩和检验,结论是什么?解:(1)由于di符合正态分布,而(2未知,所以我们采用T一检验由于(2未知,所以我们选取统计量zD0.5533而检测值T===2.0959=WSn1.022515d故拒绝H,接受H,即认为材料A制成的鞋后跟比材料B耐穿。1(2)原假设与备择假设为:00781674482574835285362656999(1)采用符号检验法作检验;(2)采用符号秩和检验法作检验.ii1ii1即检测值未落入拒绝域,故接受H,拒绝H。01(2)原假设与备择假设为:选取统计量WnuR,其中u1iiixy0ii其他.故接受H,拒绝H,即认为两种饮料的评分没有显着性差异。1H:9=0H:9<0其中9为d=x_y总体密度函数的对称中心,01iii故拒绝H,接受H,即认为有精神压力导致血压增加。1§符号秩和检验统计量W+的渐近正态性(1)期望与方差在总体X的分布关于原点o对称时,u,u,^u相互独立,每一个u的分布12niii2i与()结果一样。由()减去()得到于是由()与()得:结果,所以严格书写应该按照现在有十名男性,他们在放松下与紧张状态下的入睡时间分别为x与y,iid=xy,表显示10个差值8个小与-2,只有2个不小于-2,所以我们有理iii没有放松的条件下入睡所需的时间i1i1秩373723456789234567899897873936833128524-7-10671061069-31i其他3iiRiii故拒绝H,接受H,即认为成年男性在放松条件下入睡的时间比紧张状态下入01ii拒绝域故拒绝H,接受H,即认为成年男性在放松条件下入睡的时间比紧张状态下入01章两样本问题的工资企业企业1111213141516171819204060企业23456789103050表四格表工资工资<千元工资>千元合计合计N服从超几何分布设总体的X和Y的中位数分别为me和mexy在H成立的情况下,N服从超几何分布h(N,12,11,22)1111这是一个单侧检验问题,拒绝域在左边.N落入拒绝域,故拒绝H,接受H,即认为企业1的职工比企业2的职工的工资要高。1§Wilcoxon秩和检验法12N12N12Ni定理对于任意的1ijN,都有证明:对于任意的1ijN,都有12r1211234567891011秩121213141516171819202122秩]表示企业2的工资,不带[]表示企业1的工资.xy22这是一个单侧检验问题,拒绝域在左边.2故检测值在拒绝域,所以拒绝原假设H,接受备择假设H,010.yjn0.yjn中的秩为R(R=1,2,^,N)。在原假设H为真jjj0(2)对称性性质在原假设H为真的条件下,当n,m时,有01Wy()()()()立的条件下,y的值较大.1立的条件下,y的值较大.1§Wilcoxon秩和检验的平均秩法ij\i|i又=(Na)2-xNa2i故定理设样本x,x,^,x和y,y,^,y分别来自相互独立的连续型随机变量总12m12njjj针对有结的情况下,在a(R)=R下,由()()iiN+1E(a(R))=a=i2iNj=1ijN(N1)i=1=N+1+g(T3T)jj()1212N(N1)j=1yy里程,合样本中的秩见表第一种型号汽油第一种型号汽油第二种型号汽油汽车行驶里程(英里)秩序汽车行驶里程(英里)秩序11224383344755667728899516i=1i=1则W~N(E(W),D(W))=N(150,299.61)111i=1故检测值落入拒绝域,所以拒绝原假设H,接受备择假设H,01§Wilcoxon秩和处理位置参数差的检验问题检测模式类似,这里就不做详细介绍.§两样本尺度参数的秩检验法必要性的证明.若对任意y都有G(y)=F(yb),则由于bX的分布函数所以bXY.即P(Y>c)>P(X>c),c>0即样本y,y,^,y倾向于排两边,样本x,x,^,x倾向于排中间。12n12m即样本y,y,^,y倾向于排中间,样本x,x,^,x倾向于排两边。12n12m§尺度参数检验问题(1)Mood检验(2)Ansari-Bradley检验55453336372227288191446433354422rii=1(3)siegel-Turkey检验取a(r)为单谷函数,被减序列为0,3,47,811,1277442356326989587yii=1(4)Klotz检验N记K=na(R)yii=1何何种情况拒绝原假设M比较大,A比较小yySM较大yyM比较小,A比较大yySM较小yyMy比较大或比较小,Ay比较大或比较小S比较大或比较小,M比较大或比较小yy0§Kruskal-Waillis检验AA大学AA大学99349127设X的分布函数F(x9)ii§Kruskal-Wallis检验H:9=9=^=9,012kH:9,9,^,9不全相等,我们用ANOVA方法处理112kiiii2iiii2i=1i=12()()N(N+1)N(N+1)ii2i=1=12[xkN(N+1)2]N(N+1)n4i=1iN(N+1)ni=1i§Kruskal-wallis检验统计量的渐进分布当min{n,n,^,n})w,且ni)入=(0,1).时12kNi()()所以H的修正H为:aH)X2(k_1)a.a123123HH=CttN3_N()()()()?趋势的秩检验法ij

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论