![非参数统计 单一样本的推断问题_第1页](http://file4.renrendoc.com/view/76ce13de39353021ca803fc3a72eed27/76ce13de39353021ca803fc3a72eed271.gif)
![非参数统计 单一样本的推断问题_第2页](http://file4.renrendoc.com/view/76ce13de39353021ca803fc3a72eed27/76ce13de39353021ca803fc3a72eed272.gif)
![非参数统计 单一样本的推断问题_第3页](http://file4.renrendoc.com/view/76ce13de39353021ca803fc3a72eed27/76ce13de39353021ca803fc3a72eed273.gif)
![非参数统计 单一样本的推断问题_第4页](http://file4.renrendoc.com/view/76ce13de39353021ca803fc3a72eed27/76ce13de39353021ca803fc3a72eed274.gif)
![非参数统计 单一样本的推断问题_第5页](http://file4.renrendoc.com/view/76ce13de39353021ca803fc3a72eed27/76ce13de39353021ca803fc3a72eed275.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
胡雪梅QQ:182048520E-mail:huxuem@163.com
第三章
数学与统计学院单一样本的推断问题主要内容第一节符号检验和分位数推断假设总体,是总体的中位数,对于假设检验问题:是待检验的中位数取值
定义:,则在零假设情况下,在显著性水平为的拒绝域为其中k是满足上式最大的k值。
例3.1.假设某地16座预出售的楼盘均价,单位(百元/平方米)如下表所示:
36323125283640324126353532873335
解一:用t检验法用T统计量结论:不能拒绝H0。解二:用符号检验法在显著性水平0.05下,拒绝H0。符号检验与t检验得到了相反的结论,到底选择哪一种结果呢?结论:符号检验在总体分布未知的情况下优于t检验!补充:R中的t检验法的用法t-test(x)X1,X2,…,Xn~N(a,σ2),H0:a=a0,H1:a≠a0补充:R中的t检验法的用法例如,某食品厂用自动装罐机装罐头食品,每罐质量为500g,现从每天生产的罐头中随机抽测9罐,其质量分别为:510,505,498,503,492,502,497,506,495(单位:g)欲检验H0:a=500,H1:a≠500>t.test(x-500)data:x-500t=0.46,df=8,p-value=0.6578alternativehypothesis:meanisnotequalto095percentconfidenceinterval:-3.5674715.345249sampleestimates:meanofx0.88888892)配对t检验法
X1,X2,…,Xn~N(a1,σ12),Y1,Y2,…,Yn~N(a2,σ22),H0:a1=a2,H1:a1<a2补充:R中的t检验法的用法例如,欲比较甲乙两种轮胎的耐磨性,现抽取数据如下:甲:4900,5220,5500,6020,6340,7660,8650,4870乙:4930,4900,5140,5700,6110,6880,7930,5010欲检验H0:a1=a2,H1:a1<a2>x<-c(4900,5220,5500,6020,6340,7660,8650,4870)>y<-c(4930,4900,5140,5700,6110,6880,7930,5010)>t.test(x,y,alternative=“less”,paired=T)补充:R中的t检验法的用法Pairedt-Testdata:xandyt=2.8312,df=7,p-value=0.9873alternativehypothesis:meanofdifferencesislessthan095percentconfidenceinterval:NA534.1377sampleestimates:meanofx-y320接受H0,认为两种轮胎无显著性差异.结果讨论k是满足式子的最大值
单边符号检验问题[例]生产过程是否需要调整。某企业生产一种钢管,规定长度的中位数是l0米。现随机地:从正在生产的生产线上选取10根进行测量,结果:
9.89.8,10.0,9.710.0,9.99.8分析:中位数是这个问题中所关心的一个位置参数。若产品长度真正的中位数大于或小于10米,则生产过程需要调整。这是一个双侧检验,应建立假设大样本结论当n较大时:当n不够大的时候可用修正公式进行调整。双边:,p-值左侧:,p-值右侧:,p-值
例3.2设某化妆品厂商有A和B两个品牌,为了解顾客对A品牌和B品牌在使用上的差异,将A品牌和B品牌同时交给45个顾客使用,一个月后得到如下数据:喜欢A品牌的客户人数:22人喜欢B品牌的客户人数:18人不能区分的人数:5人解:假设检验问题:由给定的数据知:运用大样本的性质,结论:不能拒绝零假设。符号检验在配对样本比较中的应用
配对样本(x1,y1),(x2,y2),…(xn,yn)
将记为“+”,记为“-”,记为“0”,记P+
为“+”比例,P-
为“-”比例,那么假设检验问题:可以用符号秩检验。H0:P+=P-
H1:P+=P-例3.4如右表是某种商品在12家超市促销活动前后的销售额对比表,用符号检验分析促销活动的效果如何?连促销前促销后锁销售额销售额符号店14240+25760-33838044947+56365-63639-74849-85850+947470105152-118372+122733-结论:不能拒绝零假设。
根据同样原理,可以将中位数符号检验推广为任意分位点的符号检验。例3.1.假设某地16座预出售的楼盘均价,单位(百元/平方米)
36,32,31,25,28,36,40,32,41,26,35,35,32,87,33,35
36323125283640324126353532873335------0-+----+--S+=2,S-=13,Pbinom(15,0.75){min{S+,S-}<2}=0因此,拒绝H0。>binom.test(sum(x>40),length(x)-1,0.75) Exactbinomialtestdata:sum(x>40)outoflength(x)-1numberofsuccesses=2,n=15,p-value=9.23e-07alternativehypothesis:pisnotequalto0.75
R编程计算:95percentconfidenceinterval:0.016575910.40460270sampleestimates:probabilityofsuccess0.1333333Cox-Staut趋势存在性检验
检验原理:设数据序列:,双边假设检验问题:令:取数对,,为正的数目,为负的数目,当正号或者负号太多的时候,认为数据存在趋势。在零假设情况下Di服从二项分布。从而转化为符号检验问题。X1,X2,…,Xn例3.6某地区32年来的降雨量如下表问(1):该地区前10年来降雨量是否有变化?(2):该地区32年来降雨量是否有变化?年份19711972197319741975197619771978降雨量206223235264229217188204年份19791980198119821983198419851986降雨量182230223227242238207208年份19871988198919901991199219931994降雨量216233233274234227221214年份19951996199719981999200020012002降雨量226228235237243240231210=5,结论:不能拒绝零假设。>x<-c(206,223,235,264,229)>y<-c(217,188,204,182,230)>binom.test(sum(x<y),length(x),0.5) Exactbinomialtestdata:sum(x<y)outoflength(x)numberofsuccesses=2,n=5,p-value=1alternativehypothesis:pisnotequalto0.5>x<-c(206,223,235,264,229,217,188,204,182,230,223,227,242,238,207,208)>y<-c(216,233,233,274,234,227,221,214,226,228,235,237,243,240,231,210)>binom.test(sum(x>y),length(x-y),0.5) Exactbinomialtestdata:sum(x>y)outoflength(x-y)numberofsuccesses=2,n=16,p-value=0.004181alternativehypothesis:pisnotequalto0.5结论:拒绝H0,认为降雨量有明显变化.>rain<-c(206,223,235,264,229,217,188,204,182,230,223,227,242,238,207,208,216,233,233,274,234,227,221,214,226,228,235,237,243,240,231,210)>year<-1971:2002>anova(lm(rain~(year)))AnalysisofVarianceTableResponse:rainTermsaddedsequentially(firsttolast)DfSumofSqMeanSqFValuePr(F)year1535.36535.36371.5792280.2185691Residuals3010170.11339.0035接受H0,认为降雨量线性趋势并不显著.随机游程检验游程的概念一个总体,如按性别区分的人群,按产品是否有毛病区分的总体等等,随机从中抽取一个样本,样本也可以分为两类;类型I和类型E。若凡属类型I的给以符号A,类型E的给以符号B,则当样本按某种顺序排列(如按抽取时间先后排列)时,一个或者一个以上相同符号连续出现的段,就被称作游程,也就是说,游程是在一个两种类型的符号的有序排列中,相同符号连续出现的段。例如,将某售票处排队等候购票的人按性别区分,男以A表示,女以B表示。按到来的时间先后观察序列为:AABABB。在这个序列中,AA为一个游程,连续出现两个A;B是一个游程,A也是一个游程,BB也是一个游程。于是,在这个序列中,A的游程有2个,B的游程也有2个,序列共有4个游程。每一个游程所包含的符号的个数,称为游程的长度。如上面的序列中,有一个长度为2的A游程、一个长度为2的B游程,长度为1的A游程、B游程也有1个。游程:01111为两个游程游程长度:一个游程中数据的个数一个序列里游程个数记为R.例3.7序列1100001110110000111100R=8,游程长度分别为2,4,3,1,2,4,4,2极端情况:000001111111R=20101010101010R=2min(n0,n1)+1
所以,2≤R≤2min(n0,n1)+1极端情况都说明数据不具有随机性。R服从什么分布呢?
检验原理和计算方法
设是由0或者1组成的序列,假设检验问题:
R为游程个数,假设有个0,个1,,这时R取任何一个值的概率都是,R的条件分布
建立了抽样分布之后,在零假设成立时,可以计算或者的值,进行检验。
X1,X2,…,Xn小样本的例子(p69例3.8)H0:样本中的观测是随机产生的.Ha:样本中的观测是随机产生的
=.05n1=18n2=8R=12由于7
R=1217,不能拒绝H0RunsTest:大样本的例子经验表明:如果n1或n2>20,R
的抽样分布近似为正态RunsTest:大样本例子(p70例3.10)H0:样本中的观测是随机产生的.Ha:样本中的观测是随机产生的
=.05n1=40n2=10如果-1.96
Z
1.96,不能拒绝H0否则拒绝H0.11
2
3
4
5
6
7
8
9
0
11NNNFNNNNNNNFNNFFNNNNNNFNNNNFNNNNN12
13FFFFNNNNNNNNNNNN
R=13RunsTest:大样本例子-1.96
Z=-1.811.96,不能拒绝H0/web/packages/tseries/index.html>library(tseries)>run1=c(1,1,1,0,rep(1,7),0,1,1,0,0,rep(1,6),+0,rep(1,4),0,rep(1,5),rep(0,4),rep(1,13))>ff=as.factor(run1)>runs.test(ff)RunsTestdata:ffStandardNormal=-1.8074,p-value=0.0707alternativehypothesis:two.sidedWilcoxon符号秩检验
基本概念及性质
对称分布的中心一定是中位数,在对称分布情况下,中位数不唯一,研究对称中心比中位数更有意义。
例:下面的数据中,O是对称中心吗?0称连续分布F(x)关于对称,如果称是分布的对称中心。Wilcoxon符号秩检验既考虑了Xi-M0的符号,又考虑其大小。Wilcoxon符号秩检验原理以及性质
如果数据关于0点对称,那么对称中心两侧的数据疏密程度应该一样,取正值数据在绝对值样本中的秩和与取负值在绝对值样本中的秩和相近。用表示在绝对值样本中的秩,Wilcoxon符号秩统计量定义为:
正等级的总和即正秩次总和
负等级的总和即负秩次总和Wilcoxon符号秩检验原理以及性质例3.11如果样本值:9,13,-7,10,-18,4,计算符号秩统计量。X1X2X3X4X5X6913-710-184|X1||X2||X3||X4||X5||X6|R1+=3R2+=5R3+=2R4+=4R5+=6R6+=1Wilcoxon符号秩检验步骤:3.令表示和对应的的秩和,令表示和对应的的秩和。
2.找出的秩,打结时取平均秩。1.计算4.双边检验,取,当W很小时拒绝零假设;对,取;对,取。
5.根据W的值查Wilcoxon符号秩检验分布表。对n很大的时候,可以采用正态近似。
Wilcoxon符号秩统计量分布
在小样本情况下可以计算Wilcoxon符号秩统计量的精确分布。在大样本情况下可以使用正态近似:
计算出Z值以后,查正态分布表对应的p-值,如果p-值很小,则拒绝零假设。
在小样本情况下,用连续性修正公式:
例3.12
为了解垃圾邮件对大型公司决策层工作发影响程度,某网站收集了19家大型公司的CEO邮箱里每天收到的垃圾邮件数,得到如下数据:(单位:封)310350370377389400415425440295325296250340298365375360385问收到垃圾邮件的数量的中心位置是否超出320封?使用Wilcoxon符号秩检验法计算如下:例3.121030505769809510512025-++++++++-2710121416171819652470202245554065+--+-++++151534911813结论:不拒绝原假设。例3.12用R的内置函数计算格式:wilcox.test(x,y,alternative="two.sided",mu=0,paired=F,exact=T,correct=T)alternative"two.sided“or"greater"or"less"
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年日照道路运输从业资格考试系统
- 2025年黄冈货运从业资格证考试题目库存答案
- 2025年济宁货运从业资格证在哪里练题
- 内分泌概述(正常人体机能)
- 2025年四川年货运从业资格证考试试题及答案
- 循环系统疾病病人诊查 肝源性营养不良性及其他原因水肿
- 2025年甘孜考从业资格证货运试题
- 探析“词”与“物”的关系-读福柯《词与物-人文科学考古学》
- 2024-2025学年高中语文第一单元唐诗之旅上4即景抒情诗四首课时作业粤教版选修唐诗宋词元散曲蚜
- 贵阳职业技术学院《生物医学工程整合课程》2023-2024学年第二学期期末试卷
- 职业健康监护评价报告编制指南
- 急诊科中的妇科急症处理
- 《机械基础》课程标准
- 大理市房地产市场调研报告
- 企业关停方案
- 铝冶炼生产技术指标元数据规范
- 家庭教育指导委员会章程
- 高三一本“临界生”动员会课件
- 浙江省2023年中考科学真题全套汇编【含答案】
- 《公益性公墓管理章程》-
- C++面向对象程序设计双语教程(第3版)课件全套 ch01Introduction-ch08Templates
评论
0/150
提交评论