版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第八章 假设检验什么是假设检验n假设检验就是利用样本数据对关于总体参数的原假设和备选假设进行检验的过程。若样本数据不支持原假设,则拒绝原假设;n原假设用 标注, 为备选假设。n原假设就是,在进行检验之前,对总体参数或总体分布做的一个初步假设。n备选假设与原假设互为排斥。0HaH假设检验的原理n在原假设为真的前提下考虑某统计量的一次实现值,若该值的出现是一个小概率事件,则表明原假设成立的前提是不正确的,从而拒绝原假设。n一般认为,小概率事件在一次试验中不可能出现,可以忽略不计。若原假设成立的情况下,由样本的统计量的出现是小概率事件,则拒绝原假设。n假定已知某总体服从正态分布,其标准差为2,但不知
2、其均值。现有人认为其均值为3,抽取一个容量为36的样本,得到样本平均值为3.9n原假设 ;备选假设:n假定H0成立,则有,n假设|z|1.96,则该事件发生是小概率事件,(因为有:P(|z|1.96)=0.05那么我们认为不会发生,因此我们拒绝原假设。接受备选假设。n计算得到z2.7,因此我们拒绝原假设。30:H3:aH) 1 , 0(36/23Nxz0z1.961.96拒绝域/2拒绝域/2n注意到:假设检验涉及到小概率事件的标准,多小的概率算不可能出现?n在上例中,小概率事件的出现以0.05为 规范,这一标准我们称为显著水平,用表示。n由于确定了显著水平,我们相应的可以确定假设检验的临界值,
3、上例中的临界值为1.96和-1.96。这里出现了双侧临界值的情况。如何建立原假设和备选假设n建立规则的三种情形:n1.检验研究中的假设:研究中的假设一般为备选假设拒绝H0,则研究假设为真,将得出支持研究的结论并采取行动;生产线)n2.检验某项声明的有效性:在涉及对某项声明的有效性进行检验的情况下,通常将声明作为原假设声明被质疑,拒绝H0将得出该声明不正确的结论。应考虑采取措施予以纠正;质检)n3.决策中的假设检验:在上述两种情形中,如果拒绝H0则必须采取措施。然而,当面对分别与原假设和备选假设相联系的措施,决策者必须在二者间做出选择,在这种情况下,无论是否拒绝H0,都必须采取某种措施。n关于假
4、设形式的总结n假设检验:双侧检验和单侧检验n双侧检验:H0: n Ha: n 单侧检验:H0: 或n Ha: 或n n表达式中的等号总是出现在原假设中,在选择原假设或备选假设时,应将试图建立的结果设定为备选假设。000000第一类错误和第二类错误n原假设和备选假设是关于总体的两个对立的解释。二者之中有且仅有一个是正确的。n因为假设检验是建立在样本数据基础上的,因此得出来的结论不一定百分百正确,存在发生错误的可能。n存在两种错误:第一类错误和第二类错误H0为真H0为假接受H0结论正确第二类错误(纳伪)拒绝H0第一类错误(弃真)结论正确n例如:某汽车生产研究小组设计了一种能提高汽车油料效能的新的燃
5、料喷射器。目前旧型喷射器的效能为24公里每加仑,设定的假设检验如下:nH0:u24n由Ha表明,我们将试图找出的结论放入备选假设。n在这个例子中,当H0为真时而拒绝了H0,表明这种新型喷射器实际上不比目前所用的喷射器好,但却错误认为这种新型的喷射器提高了每加仑燃料的功效,那么此时发生了第一类错误。n若当H0为假时而接受了H0,表明这种新型喷射器实际上比目前所用的喷射器好,但错误认为这种喷射器没有提高每加仑燃料的功效,则此时发生了第二类错误。n第一类错误发生的概率为,即检验的显著性水平。一般设置为0.05和0.01。n在发生第一类错误概率较小时,如果拒绝原假设H0,则我们可以很大的程度相信关于拒
6、绝原假设的结论是正确的。n在这种情况下,统计上支持我们做出H0为假,而Ha为真的结论。即拒绝原假设总有较大的把握。n第二类错误发生的概率为:它是把来自=1(10)的总体的样本值代入检验统计量所得结果落入接受域的概率。n在绝大多数的假设检验运用中,一般都只对第一类错误进行控制,而通常不对第二类错误加以控制。由于第二类错误发生的不稳定性,我们一般采用“不能拒绝H0而不采用“接受H0的说法。采用“不能拒绝H0的说法使我们避免了犯第二类错误的风险。因此,我们往往把要否定的陈述作为原假设,而把拟采纳的陈述本身作为备择假设。总体均值的单侧检验:大样本nHILLTOP咖啡的标签上表明其重量至少为3磅,今抽取
7、36听咖啡组成一样本,检测其平均质量,得到x=2.92磅。由以前的研究结果已知总体的标准差为 =0.18,选定0.01,检验标签上的重量说明。nH0: u3nHa: u3n检验统计量为:n根据显著性水平=0.01,对应的拒绝域面积为0.01,临界值为-2.33nZ-2.33,所以拒绝H0,即可认为没听咖啡的容量不足3磅。n统计证据支持对HILLTOP咖啡重量不足采取投诉措施。) 1 , 0(/Nnxz67. 26/18. 0392. 2/nxz0 x-2.67拒绝域=0.01-2.33落入小概率事件发生区域n同样咖啡检验平均重量的例子,现抽取新的样本,平均重量为2.97磅,再做检验。H0: u
8、3Ha: u-2.33,所以不能拒绝H0,即不能说每听咖啡的平均重量不低于3磅的说明不真实。统计证据不能支持对HILLTOP咖啡重量不足采取投诉措施。16/18. 0397. 2/nxz0 x1拒绝域=0.01-2.33样本统计量未落入小概率事件发生区域小结:总体均值的单侧检验大样本下)n1.左侧检验的形式n假设:H0: uu0,Ha: uu0n检验统计量 n (总体方差已知)n n (总体方差未知)n显著性水平为是的拒绝法则为:n假设 ,则拒绝H0) 1 , 0(/Nnxz) 1 , 0(/Nnsxzzzn2.右侧检验的形式n假设:H0: uu0,Ha: uu0n检验统计量 n (总体方差已
9、知)n n (总体方差未知)n显著性水平为是的拒绝法则为:n假设 ,则拒绝H0zz ) 1 , 0(/Nnxz) 1 , 0(/Nnsxz假设检验的步骤n1.确定原假设和备选假设n2.选择检验统计量n3.指定检验的显著性水平n4.建立拒绝原假设的规则n5.收集样本数据,计算检验统计量的值n6.将检验统计量的值域拒绝规则的临界值比较,以决定是否拒绝原假设。或者,由检验统计量的值计算p值,利用p值确定是否拒绝原假设。n关于p值: 大多数统计软件提供有关假设检验的p值,p值是一个概率值。若我们假定原假设为真,则p值是获得一个至少与实测结果有相同不可能性的样本结果的概率。P值常被称为实测显著性水平。若
10、p值 ,则拒绝H0。) 1 , 0(/Nnxz) 1 , 0(/Nnsxz2/zz2 /z0拒绝域为/2拒绝域拒绝域拒绝域为/22/zn某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克,某日随机抽查40包,测得样本平均重量为986克,样本标准差是24克。试问在=0.05的显著性水平上,能否认为这天自动包装机工作正常?n由题意有:u0=1000,x=986,s=24,n=40大样本)n原假设为 H0: u=u0n Ha: uu0n检验统计量为n有Z=-3.69-1.96,因而拒绝认为自动包装机运作正常的原假设。n因此统计上能够支持对包装机运作不正常采取的措施。
11、) 1 , 0(/Nnsxz69340/241000986.z96. 12/zn2.关于双侧检验的P值:n在双侧检验中,p值为分布一侧面积的两倍。据测我们可以将P值与直接比较。如果不是将一侧面积的两倍取为P值,那么必须另行建立基于一侧面积/2的关于p值的拒绝规则。n3. 区间估计与假设检验的关系n在置信水平1-下的区间估计/显著水平为的假设检验区间估计假设检验估计区间:不拒绝区域:1)|/(|2/znxP)|/(|2/0znxPnzx2/nz2/0n因为有:n所以,若x落在不拒绝区域内,则u0必被包含在置信区间内。即:检验统计量的值落在不拒绝域内,与置信区间包含总体参数是等价的。因此,我们有以
12、下的用置信区间进行假设检验的形式。nzxnznzxnzx2/02/02/02/n假设H0:u=u0;Ha:uu0n我们可以通过计算置信区间来判断是否拒绝或不拒绝原假设。n计算1-置信水平下的估计区间:n n 或n若所得的置信区间不包含u0,则拒绝H0,否则不能拒绝。nzx2nszx/2n上例,我们用求置信区间的方法,来判断原假设是否合理。n大样本下满足中心极限定理,样本均值的抽样分布服从正态分布,从而有置信区间:n(978.56,993.44该区间不包含u0=1000,因此我们拒绝原假设H0.检验表明,该包装机未能正常工作。40249619862.nszx总体均值的检验:小样本情形n小样本下,
13、已知总体为正态分布,我们考虑以下两种情况:n1.总体方差已知n2.总体方差未知n在总体方差已知的情况下,即使样本容量较小,但样本平均数的抽样分布总是以平均值 为均值,以 为标准差的正态分布。因此其检验过程和检验统计量同大样本情形。x总体均值的检验:小样本情形且总体方差未知n1.检验的形式样本来自正态总体)n(1左侧n假设 H0:uu0,Ha:uu0n检验统计量为:n显著性水平为时的拒绝法则为:nsxt/tt n(3双侧n假设 H0: uu0,Ha:uu0n检验统计量为:n显著性水平为时的拒绝法则为:nsxt/2/|tt n国际航空运输联合会通过调查商务旅行者来评定跨太平洋通道的机场等级,最大可
14、为10.限选取12名商务旅行者作为一简单随机样本,要求他们对伦敦的heathrow国际机场评定等级,得到的数据分别为:n7,8,10,8,6,9,6,7,7,8,9,8n假定级别总体近似服从正态分布,试问在显著水平5%下,该机场能否被命名为高水平服务水准机场。(高水平服务水准机场的标准是评分等级超过7.)n由题意有,u0=7,x=7.75,n=12,s=1.125n设定假设命题有:nH0:uu0;Ha:uu0 由命题可知,该假设检验为右侧检验。n计算统计量n在显著水平5下,右侧检验的拒绝域为:nT=2.141.796,统计量落入小概率事件区域,因此我们拒绝原假设,即可将Heathrow机场列入
15、高服务水准机场。14. 212/215. 1775. 7/0nsxt796. 105. 0 ttt0拒绝域1.7962.142.201P-value0.10.050.0250.01T值(v=11)1.3631.7962.2012.718由样本计算得到的统计量2.14对应的Pvalue小于0.05显著水平,因此拒绝H0n设计要求生产过程冲入容器的重量均值为u=16盎司,质量保证人员定期选取8只容器组成简单随机样本进行检验。样本数据为:16.02,16.22,15.82,15.92,16.22,16.32,16.12,15.92n假定冲入重量的总体服从正态分布,问该容器的生产是否满足设计要求。n由
16、题意,n=8,计算得到样本均值x=16.07,样本标准差s:n设定假设命题有,nH0:u=16;Ha:u16(由命题可知该检验为双侧检验)18. 0722. 01)(2nxxsiin由于小样本下未知总体方差,但已假定其总体为正态分布,那么采用t统计量来检验,n根据双侧检验的原则,我们查找5%显著水平下对应的拒绝域:|t|2.365(自由度为n-1的t分布对应的上侧面积为0.025时的点)1 . 18/18. 01607.16/0nsxtn由样本计算得到的统计量t2.365,我们不能得到拒绝原假设的结论,即认为没有足够的证据表明冲入重量不符合设计要求。总体比率的假设检验n1. 检验的形式n(1左
17、侧n假设 H0:pp0,Ha:pp0n检验统计量为n显著性水平为时的拒绝法则为:假设n 则拒绝H0nppppz/)1 (000zz n(3双侧n假设 H0: pp0,Ha:pp0n检验统计量为:n显著性水平为时的拒绝法则为:2/|zz nppppz/)1 (000n在过去的几个月中,PG高尔夫球场的运动者中有20%为女性,为了增加女性运动者的比率,该球场以打折作活动的方式来吸引女性运动者。在活动进行了一段时间后,有400名运动者组成的一个随机简单样本表明,其中有女性运动者100名,男性运动者300名。问能否认为该活动使女性运动者的比率上升?n由题意:p0=0.2,样本计算的到的样本比率为p=0
18、.25,n=400(对应为大样本情况)n设定假设命题有,nH0:Pp0 ; Ha:Pp0(右侧检验)n我们有样本计算统计量zn我们将该统计量与5%显著水平下的拒绝域比较:拒绝域为z1.6455 . 2400/8 . 02 . 02 . 025. 0/)1 (000nppppzn由于样本计算得到的z统计量大于临界值1.645,则说明拒绝原假设。n统计上提供证据可以认为打折活动使女性朋友的参与率提高了。作业n1. Danvers-Hilton风景旅馆的管理者声称,周末顾客帐单的均值小于或等于600美元。该旅馆的会计发现最近几个月客人的帐单上费用持续增加。因此,会计想根据周末帐单所组成的样本来验证管
19、理者的说法。nA.为验证管理者的说法,应采用哪种假设检验形式?为什么?nB.若不能拒绝H0,则得到适当的结论是什么?nC.若可以接受H0,可得到适当的结论是什么?n2. C a r p e t l a n d的推销员每周平均销售额为8000美元,该公司的副董事长Steve Contois建议采取一种新型的刺激销售的补偿计划。nSteve想根据试行该计划的一个销售期间的数据,得出该计划增加了每名销售人员的平均销售量的结论。na. 建立合适的原假设和备择假设。nb. 这种情况下,发生第一类错误的概率是多少?发生这类错误将会导致怎样的后果?nc. 这种情况下,发生第二类错误的概率是多少?发生这类错误
20、将会导致怎样的后果?n3. 在2019年3月3 1日之前, 1994年个人缴纳的联邦所得税平均为1056美元USA To d a y,1 9 9 5 . 4 . 5)。考虑由在所得税纳税期间的最后5天4月1 0日至4月1 5日才汇出其税款的纳税人所组成的“最后一分钟总体。na. 一名研究人员认为,纳税人直到最后5天才缴纳税款的原因之一是这些人所交税款的平均值要比在此之前交税的那些人要少。建立适当的假设,以便得出当拒绝H0时支持该研究人员说法的结论。nb. 由400名在4月1 0日到4月1 5日之间缴税个人所组成的样本表明,其纳税额的样本均值为9 1 0美元,样本标准差为1600美元。在= 0.05时,你的结论是什么?nc. 检验的p-值为多少?4.C N N和A c t M e d i a提供的电视频道用于播放新闻、广告和特别报道,以百货商店等待结帐时排队的个人为播出对象。假定百货商店购物者排队等待结帐时间的总体均值为8分钟,所以这些电视节目每8分钟循环放映一次Astounding Averages,2019)。在某主要百货商店选取120名购物者组成样本,其等待时间的样本均值为7.5分钟,样本标准差为3.2分钟。a. 检验H0:u = 8和Ha:u8。取显著性水
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 建构城堡课件教学课件
- 四数下教案(北师大版)
- 红茶的课件教学课件
- 人力资源经理劳动合同模板
- 代为办理协议
- 仓储用地土地共有协议书
- FOB贸易合同履行主体合同
- 企业竞争情报咨询合同
- KTV风格别墅租赁合同
- 个人并购贷款协议
- DB11T 2256-2024 城市轨道交通钢轨踏面维修技术规范
- 堤溪沱江大桥特别重大坍塌事故工程伦理案例分析
- 2024年秋季1530安全教育记录
- 住建领域有限空间作业安全管理知识课件
- 2024年新大象版六年级上册科学全册知识点(背诵版)
- 经济学金融学课件-第十三章-中央银行货币政策操作
- 变频器原理及应用
- 07J901-2 实验室建筑设备(二)
- 从文学到电影智慧树知到期末考试答案章节答案2024年山东大学
- 人教九年级历史上册《探寻新航路》教学课件
- 应急分队人员招聘方案范文
评论
0/150
提交评论