




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第六章 假设检验与方差分析第一节 假设检验的基本原理 第二节 总体均值的假设检验 第三节 总体比例的假设检验 第四节 单因子方差分析第五节 双因子方差分析第六节 Excel在假设检验与方差 分析中的应用2掌握要点假设检验的基本原理和步骤,以及相关概念Z统计量、t统计量、F统计量的计算和应用方差分析的基本概念针对单因素、双因素的方差分析构造F统计量3第一节 假设检验的基本原理一 什么是假设检验二 原假设与备择假设三 检验统计量四 显著性水平、P-值与临界值五 双侧检验和单侧检验六 假设检验的两类错误七 关于假设检验结论的理解4显著性检验的基本思想用小概率原理解释小概率原理认为,小概率事件在一次试
2、验中是几乎不可能发生的。如果对总体的某个假设是真实的,而在这样的总体中事件A发生的概率非常小,那么,就可认为在一次试验中,事件A是不会发生的。如果在一次试验中事件A事实上发生了。那就只能认为事件A不是来自之前假设的总体,也就是说,之前对总体所做的假设不正确。5一、什么是假设检验例6-1:假定咖啡的分袋包装生产线的装袋重量服从正态分布N(,2)。生产线按每袋净重150克的技术标准控制操作。现从生产线抽取简单随机样本n=100袋,测得其平均重量为 =149.8克,样本标准差S=0.872克。问该生产线的装袋净重的期望值是否为150克(即问生产线是否处于控制状态)?6所谓假设检验,就是事先对总体的参
3、数或总体分布形式做出一个假设,然后利用抽取的样本信息来判断这个假设(原假设)是否合理,即判断总体的真实情况与原假设是否存在显著的系统性差异,所以假设检验又被称为显著性检验。7一个完整的假设检验过程,包括以下几个步骤:(1)提出假设;(2)构造适当的检验统计量,并根据样本计 算统计量的具体数值;(3)规定显著性水平,建立检验规则;(4)做出判断。8二、原假设与备择假设原假设一般用H0表示,通常是设定总体参数等于某值,或服从某个分布函数等;备择假设是与原假设互相排斥的假设,原假设与备择假设不可能同时成立。所谓假设检验问题实质上就是要判断H0是否正确,若拒绝原假设H0 ,则意味着接受备择假设H1 。
4、 9注意:原假设和备择假设合在一起,应涵盖所研究的总体特征的所有可能性。原假设是指观察到的差异只反映机会变异备择假设是指观察到的差异是真实的。10如在例6-1中,我们可以提出两个假设:假设平均袋装咖啡重量与所要控制的标准没有显著差异,记为H0: = 150;假设平均袋装咖啡重量与所要控制的标准有显著差异,记为H1: 150。11注意:一般而言,凡有关总体参数的显著性检验,都应把总体参数等于某定值作为原假设,这样便于在原假设成立的假设下讨论检验统计量的分布。12实际上,原假设和备择假设的设置方法还同我们如何针对总体的不同状态采取行动有关。13三、检验统计量所谓检验统计量,就是根据所抽取的样本计算
5、的用于检验原假设是否成立的随机变量。检验统计量中应当含有所要检验的总体参数,以便在“总体参数等于某数值”的假定下研究样本统计量的观测结果。14检验统计量还应该在“H0成立”的前提下有已知的分布,从而便于计算出现某种特定的观测结果的概率。15例6-2 构造例6-1的检验统计量,并计算相应的样本观测值。 1617 18四、显著性水平、P-值与临界值小概率事件:在单独一次的试验中基本上不会发生,可以不予考虑。在假设检验中,我们做出判断时所依据的逻辑是:如果在原假设正确的前提下,检验统计量的样本观测值的出现属于小概率事件,那么可以认为原假设不可信,从而否定它,转而接受备择假设。19至于小概率的标准是多
6、大?这要根据实际问题而定。假设检验中,称这一标准为显著性水平,用来表示。在应用中,通常取 =0.01, =0.05。一般来说,犯第一类错误可能造成的损失越大, 的取值应当越小。对假设检验问题做出判断可依据两种规则:一是P-值规则;二是临界值规则。20(一)P-值规则 所谓P-值,实际上是检验统计量超过(大于或小于)具体样本观测值的概率。 如果P-值小于所给定的显著性水平,则认为原假设不太可能成立; 如果P-值大于所给定的标准,则认为没有充分的证据否定原假设。21例6-3假定 =0.05,根据例6-2的结果,计算该问题的P-值,并做出判断。22解:查标准正态概率表,当z=2.29时,阴影面积为0
7、.9890,尾部面积为1-0.9890=0.011,由对称性可知,当z= 2.29时,左侧面积为0.011。0.011/2=0.0250.011这个数字意味着,假若我们反复抽取n=100的样本,在100个样本中仅有可能出现一个使检验统计量等于或小于2.29的样本。该事件发生的概率小于给定的显著性水平,所以,可以判断=150的假定是错误的,也就是说,根据观测的样本,有理由表明总体的与150克的差异是显著存在的。23例:某电视机厂声称其产品耐用时间超过1200小时。随机抽取100件产品后测得均值为1251小时,标准差s=300小时。问该厂产品耐用时间是否高于1200小时?(显著水平0.05)24(
8、二)临界值规则假设检验中,还有另外一种做出结论的方法:根据所提出的显著性水平标准(它是概率密度曲线的尾部面积)查表得到相应的检验统计量的数值,称作临界值。直接用检验统计量的观测值与临界值作比较,观测值落在临界值所划定的尾部(称之为拒绝域)内,便拒绝原假设;25观测值落在临界值所划定的尾部之外(称之为不能拒绝域)的范围内,则认为拒绝原假设的证据不足。这种做出检验结论的方法,我们称之为临界值规则。26显然,P-值规则和临界值规则是等价的。在做检验的时候,只用其中一个规则即可。P-值规则较之临界值规则具有更明显的优点。这主要是:第一,它更加简捷;第二,在值规则的检验结论中,对于犯第一类错误的概率的表
9、述更加精确。推荐使用P-值规则。27例6-4假定=0.05,根据例6-2的结果,用临界值规则做出判断。28解:查表得到,临界值z0.025= 1.96。由于z= 2.29 1.96,即,检验统计量的观测值落在临界值所划定的左侧(即落在拒绝域),因而拒绝=150克的原假设。上面的检验结果意味着,由样本数据得到的观测值的差异提醒我们:装袋生产线的生产过程已经偏离了控制状态,正在向装袋重量低于技术标准的状态倾斜。29五、双侧检验和单侧检验 图6-1 双侧、单侧检验的拒绝域分配/21 /2Z /2 Z/2 (a)双侧检验 Z 0 (b)左侧检验 0 Z (c)右侧检验 30表6-1 拒绝域的单、双侧与
10、备择假设之间的对应关系拒绝域位置P-值检验的显著性水平判断标准原假设备择假设双侧/2H0:0H1:0左单侧H0:0H1:031六、假设检验的两类错误显著性检验中的第一类错误是指:原假设事实上正确,可是检验统计量的观测值却落入拒绝域,因而否定了本来正确的假设。这是弃真的错误。发生第一类错误的概率在双侧检验时是两个尾部的拒绝域面积之和;在单侧检验时是单侧拒绝域的面积。32显著性检验中的第二类错误是指:原假设事实上不正确,而检验统计量的观测值却落入了不能拒绝域,因而没有否定本来不正确的原假设,这是取伪的错误。发生第二类错误的概率是把来自=1(10)的总体的样本值代入检验统计量所得结果落入接受域的概率
11、。33根据不同的检验问题,对于和大小的选择有不同的考虑。例如,在例6-1中,如果检验者站在卖方的立场上,他较为关心的是不要犯第一类错误,即不要发生产品本来合格却被错误地拒收这样的事情,这时, 要较小。反之,如果检验者站在买者的立场上,他关心的是不要把本来不合格的产品误当作合格品收下,也就是说,最好不要犯第二类错误,因此, 要较小。34在样本容量n不变的条件下,犯两类错误的概率常常呈现反向的变化,要使和都同时减小,除非增加样本的容量。为此,统计学家奈曼与皮尔逊提出了一个原则,即在控制犯第一类错误的概率情况下,尽量使犯第二类错误的概率小。在实际问题中,我们往往把要否定的陈述作为原假设,而把拟采纳的
12、陈述本身作为备择假设,只对犯第一类错误的概率加以限制,而不考虑犯第二类错误的概率 。35七、关于假设检验结论的理解这就是说在假设检验中,相对而言,当原假设被拒绝时,我们能够以较大的把握肯定备择假设的成立。而当原假设未被拒绝时,我们并不能认为原假设确实成立。 36注意:显著性检验到底回答了什么样的问题?显著性检验只是回答了所观察到的差异(样本数据与我们对总体所作的推测之间的差异)是纯属于机会变异,还是反映了真实的差异?37不能企图用显著性检验回答其不能回答的问题(1)如果显著性检验得到差异显著的结论(观察到的差异提供了较充分的证据表明差异真实存在),这时并不能评价差异的大小和重要性。38不能企图
13、用显著性检验回答其不能回答的问题(2)显著性检验只能告诉我们差异是否在事实上存在,并不能回答差异产生的原因。(3)显著性检验不能检查我们对实验所作的设计是否有缺陷。39第二节 总体均值为某定值的显著性检验40注意:总体指在随机试验中所观测的随机变量。总体均值指的是随机变量的期望值。41总体均值的显著性检验包括:双尾情况左单尾右单尾42如下就总体分布的不同情况总体方差是否已知的不同情况样本大小的不同情况分别介绍检验统计量和检验规则。43(一)总体为正态分布,总体方差已知,样本不论大小来自总体的样本为(x1, x2, , xn)。对于假设:H0: = 0,在H0成立的前提下,有检验统计量 44(二
14、)总体分布未知,总体方差已知,大样本 来自总体的样本为(x1, x2, , xn)。对于假设:H0: = 0,在H0成立的前提下,如果样本足够大(n30),近似地有检验统计量 45(三)总体为正态分布,总体方差未知,小样本来自总体的样本为(x1, x2, , xn)。对于假设:H0: = 0,在H0成立的前提下,有检验统计量 若自由度(n-1)30,该t统计量近似服从标准正态分布。46例:已知初婚年龄服从正态分布。根据9个人的调查结果,样本均值为 岁,样本标准差s=3岁。问是否可以认为该地区初婚年龄数学期望已经超过20岁( )47(四)总体分布未知,总体方差未知,大样本来自总体的样本为(x1, x2, , xn)。对于假设:H0: = 0,在H0成立的前提下,如果总体偏斜适度,且样本足够大,近似地有检验统计量48例6-5 某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克,某日随机抽查9包,测得样本平均重量为986克,样本标准差是24克。试问在=0.05的显著性水平上,能否认为这天自动包装机工作正常?49解:第一步:确定原假设与备择假设。H0: = 1000, H1: 1000第二步:构造出检验
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论