![第八章假设检验_第1页](http://file4.renrendoc.com/view/dcc35a23f7ff98606b9c8df556ee2af3/dcc35a23f7ff98606b9c8df556ee2af31.gif)
![第八章假设检验_第2页](http://file4.renrendoc.com/view/dcc35a23f7ff98606b9c8df556ee2af3/dcc35a23f7ff98606b9c8df556ee2af32.gif)
![第八章假设检验_第3页](http://file4.renrendoc.com/view/dcc35a23f7ff98606b9c8df556ee2af3/dcc35a23f7ff98606b9c8df556ee2af33.gif)
![第八章假设检验_第4页](http://file4.renrendoc.com/view/dcc35a23f7ff98606b9c8df556ee2af3/dcc35a23f7ff98606b9c8df556ee2af34.gif)
![第八章假设检验_第5页](http://file4.renrendoc.com/view/dcc35a23f7ff98606b9c8df556ee2af3/dcc35a23f7ff98606b9c8df556ee2af35.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第八章假设检验第一页,共三十六页,2022年,8月28日
现实中的统计案例一:时下不少大学生在一边学习的同时也不断寻找一些机会打些零工以赚点钱弥补学习和生活之需,这已经是学生们之间人所共知的事情。这没有丝毫的让人好奇之处,让人好奇的是这些打工的学生究竟一个月平均能赚多少钱?假设有人说:这个数据是500元,你觉得信不信它呢?当然,你首先需要收集证据,没有证据是肯定说明不了任何问题的。又假设有人通过组织调查取得过如下数据(调查到一共30人,单位:元):350500900100100200240300100320450260650380290400800400250400290870540320140160300400500340第八章假设检验第二页,共三十六页,2022年,8月28日
这时你该做何结论?就算是你得到以上数据的平均数等于423元,你是否就可以作出“是”或“不是”的回答?因为你要作出的回答是针对整个总体的,根据却又只是来自部分总体——即样本,所以事实上不论你最终作出的是“是”还是“不是”的回答,其实都存在犯错误的可能。那么,如何以样本的数据去对总体参数下结论才最科学?才最不容易犯错误呢?这就是一个属于单个总体参数假设检验的问题了,是本章需要解决的问题。第八章假设检验第三页,共三十六页,2022年,8月28日一、基本概念
1、假设检验是统计推断的另一种方式,它与区间估计的差别主要在于:区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。假设检验与区间估计结合起来,构成完整的统计推断内容。假设检验分为两类:一类是参数假设检验,另一类是非参数假设检验。第一节假设检验的基本思想第四页,共三十六页,2022年,8月28日对于随机变量X的分布参数,可以提出如下一些假设:
等等,其中和是已知数,而和是未知常数。特别地,如果已知X服从伯努利分布,参数p(0<p<1)未知,则可以提出如下假设:
H:p=p0;
H:p≤p0;第五页,共三十六页,2022年,8月28日如:在对一批产品的质量验收过程中,若用p表示这批产品的不合格品率,而p0表示不合格品率的最大允许值。当假设H:p≤p0成立时,这批产品被接收,否则被拒收。以上各例中,统计假设可能成立也可能不成立。2、假设检验(也称显著性检验),就是根据对随机变量进行实际观察的结果(即样本取值)来判定事先给定的统计假设H是否成立的一种推断过程。例如,验收一大批产品,就是要检验假设H:p≤p0。假设检验在理论研究和实际应用中都占有重要地位。但在这里只能介绍假设检验的基本概念和思想,作为例子介绍一些常用的统计检验方法。
第六页,共三十六页,2022年,8月28日二、统计假设分类以后把关于随机变量(的分布、特征、相互关系等)的每一种论断都叫做统计假设。前面已经列举了一些统计假设的例子。一般地,根据问题的着眼点、条件和特点不同,统计假设有参数假设和非参数假设、简单假设和复合假设、零假设和备择假设之分。
(一)参数假设和非参数假设假设X是所研究的随机变量。那么,在X的分布函数F(x,θ)的数学形式已知的情形下,关于参数的各种统计假设称作“参数假设”;在X的分布函数的形式不确知(或完全未知)的情况下,与分布函数相关的各种一般性论断则称作“非参数假设”。第七页,共三十六页,2022年,8月28日例如,已知X~N(μ,σ2
),但是其参数μ和σ2
未知,那么H:μ=0,σ2
=1或μ≤0,σ2>0都是参数假设。而诸如:H:X的分布是正态的H:X服从普阿松分布H:X和Y相互独立H:X1,X2,…,Xn服从相同的分布等,则都是非参数假设。第八页,共三十六页,2022年,8月28日(二)简单假设和复合假设如果一个统计假设完全决定随机变量的概率分布,或者说假设只针对参数在某一单点取值而作,称之为“简单假设”,否则便是“复合假设”。比如X~N(μ,1),则假设H:μ=0是简单假设,而H:μ≤0则是复合假设。第九页,共三十六页,2022年,8月28日(三)零假设和备择假设假定关于X有两个统计假设H0和H1,并且已知H0和H1中要么H0真实H1不真,要么H1真实H0不真,称这样的两个假设为二者必居其一的。例如,对于X~(μ,1),H0:μ≤0和H1:μ>0就是二者必居其一的两个假设。对于两个二者必居其一的假设,习惯上称其中一个为“零假设”(或者称为“基本假设”),而另一个为它的“备择假设”(或者“对立假设”)。以后永远以H0表示“零假设”,而H1表示H0
的“备择假设”。尽管二者的划分并不是绝对的,但是在处理具体问题时,通常把那些需要着重考察且不允许或不应该轻易被否定的假设视为“零假设”。例如,往往称“H0:X服从正态分布”为“零假设”,而把“H1:X不服从正态分布”叫做“备择假设”。这是因为,随机变量服从正态分布的场合占大多数情况,所以不应该轻易被否定。第十页,共三十六页,2022年,8月28日三、统计假设的检验考虑关于某个总体的统计假设H0,并以H1表示它的“备择假设”。所谓对假设H0的检验,就是根据随机取样的结果(即来自该总体的随机样本),按照一定的规则来判断假设H0的真伪以决定它的取舍,即是“拒绝”还是“接受”假设H0。以后,把用来判断所作假设真伪性的规则叫做检验准则,简称之为“检验”。第十一页,共三十六页,2022年,8月28日检验的准则以拒绝域的形式给出。为此,按一定的规则把整个样本空间分割成不相交的两部分和。检验按如下规则进行:当样本点x=(x1,x2,…,xn)落在区域中[1][2]时,认为所作假设H0不真实,从而拒绝它(这时,自然接受它的备择假设H1);相反,当样本点x=(x1,x2,…,xn)落在中时,认为H0真实,从而接受它(这时,自然拒绝H1)。这里叫做H0的拒绝域,而叫做H0的接受域。然而,由于“样本值落入拒绝域”和“样本值落入接受域”都是随机事件,故这里可能出现两种类型的错误:第十二页,共三十六页,2022年,8月28日
接受拒绝
真实判断正确弃真错误(第一类错误或α错误)
不真实取伪错误(第二类错误或β错误)
判断正确两种类型的错误第十三页,共三十六页,2022年,8月28日第一类错误:拒绝了真实假设。即H0本来真实,却被拒绝了,叫做“弃真”;第二类错误:接受了不真实假设。即H0本来不真实,却被接受了,叫做“纳伪”。以上两类错误至少要出现一类。但在样本容量n固定的条件下选定检验准则时,不可能追求得到使两类错误的概率都最小,因为这种要求是矛盾的。习惯上处理这个问题是选定第一类错误概率(记为“α”)的一个上界,然后使第二类错误的概率尽可能小。第十四页,共三十六页,2022年,8月28日在犯第一类错误概率得到控制的条件下,犯取伪错误的概率也要尽可能地小,或者说,不取伪的概率1-β应尽可能增大。1-β越大,意味着当原假设不真实时,检验判断出原假设不真实的概率越大,检验的判别能力就越好;1-β越小,意味着当原假设不真实时,检验结论判断出原假设不真实的概率越小,检验的判别能力就越差。可见1-β是反映统计检验判别能力大小的重要标志,我们称之为检验功效或检验力。检验功效第十五页,共三十六页,2022年,8月28日
“小概率事件不发生”原则与显著性水平根据大数定律,在大量重复试验中事件出现的频率会越来越接近于它们的概率。倘若某事件A出现的概率α甚小,则它在大量重复试验中出现的频率也应该很小。例如,若α=0.001,则大体上1000次试验中A才出现一次。因此,概率很小的事件在一次试验中实际上不大可能出现。在概率论的应用中,称这样的事件为“小概率事件”。第十六页,共三十六页,2022年,8月28日在应用统计的每一个具体的领域,人们总是根据所研究的具体问题,规定一个界限α(0<α<1);当一事件的概率P≤α时,就认为该事件是一小概率事件,而且概率小到可以认为它实际上不会发生的地步,这就是所谓“小概率事件不发生”原则。事实上,生活中我们也在无意识的情况下不断地使用这一原则。如一般情况下人们都敢于乘火车而不担心火车颠覆、敢于搭飞机而不担心飞机坠毁、敢于坐轮船而不担心轮船沉没等等,就是因为所对应的事件很少发生,我们实际上就把它当成不发生对待的缘故。第十七页,共三十六页,2022年,8月28日然而事实上,根据“小概率事件不发生”原则所作的判断也可能是错误的,因为小概率事件毕竟不是零概率事件,还是可能发生,只不过发生的概率非常小而已。但,我们却可以控制它,这种错误发生的概率最多也就α这么大,而α是个“很小”的正数。这样的界限α在假设检验中叫做“显著性水平”。α的选择要根据实际情况而定:对于某些重要场合,事件的出现会引起严重的后果,如上述撞车、坠机、沉船等等,α就应选得小一些,否则应该选得大一些。在一般应用中,也象参数估计中选择置信水平一样,常选α=0.01,0.05和0.10等这样一些比较整的值以便于造表。统计假设显著性检验遵循“小概率事件不发生”原则,其理论依据是大数定律。
第十八页,共三十六页,2022年,8月28日四、统计假设显著性检验的一般步骤:假设随机变量X的分布函数F(x,θ)依赖于未知参数θ,以x1,x2,…,xn表示来自总体X的简单随机样本。统计假设的显著性检验大致可分以下几步进行:第一步:提出零假设H0和备择假设H1。零假设和备择假设一般可以表示为:H0:θ满足某某条件;H1:θ不满足上述条件。第二步:规定检验的显著性水平α(0<α<1)。第三步:建立零假设H0的拒绝域。是样本空间的一个特定区域,满足条件:当零假设成立时,样本点落入其中的概率不大于α。检验的拒绝域常借助一统计量T=T(x1,x2,…,xn)来构造,而T的分布是完全已知的。第四步:对假设H0作出推断。如果样本点(x1,x2,…,xn)落入中,则认为H0不真,从而拒绝它,否则便不拒绝假设H0。第十九页,共三十六页,2022年,8月28日
上述推断的依据是“小概率事件不发生”原则:由于样本点落入拒绝域的概率α“很小”,故认为实际不可能落入中。因此,一旦确实落入则说明实际观测结果与所作假设H0严重不符,所以理应拒绝假设H0。必须强调指出:当样本点未落入拒绝域中,即当(x1,x2,…,xn)落入时,并没有理由认定H0是真实的,只能说“未发现所作假设与观测结果有显著矛盾”,确切些说只是不能拒绝假设H0而已,并不是说已经“接受”了H0。这时,事实上需要对X进行进一步的观测才能下进一步的结论。所以从这一意义看正如前面所说,假设检验有一个显著特点,即“含含糊糊地接受,信心十足地拒绝”。第二十页,共三十六页,2022年,8月28日
我们开始讨论具体的假设检验问题。由于正态分布的特殊性及其应用的广泛性,讨论在没有特别说明的条件下都默认为是就正态分布总体进行的。所讨论的检验方法同时也是实践中常用的统计检验方法。对于一个正态总体,我们考虑其数学期望和方差是否为某一特定值的检验问题;对于两个正态总体,则考虑两者数学期望或方差是否相等的检验问题。假设随机变量X服从正态分布N(μ,σ2),而(x1,x2,…,xn)是来自X的简单随机样本。检验均值时,按标准差已知和未知两种不同情况来考虑;检验标准差时,则按均值已知和未知两种不同情况来考虑。第二节单个总体的检验第二十一页,共三十六页,2022年,8月28日一、单个总体均值的检验(一)总体标准差已知——z检验(标准正态分布检验法)法在已知标准差σ=σ0时,检验假设μ=μ0,使用z检验:零假设H0:μ=μ0
(已知σ=σ0
);备择假设H1:μ≠μ0
(已知σ=σ0
);显著性水平:α(0<α<1);检验统计量:其中,X是样本均值。由概率论理论得知:在假设H0:μ=μ0
(已知σ=σ0
)下样本平均数服从正态分布N(μ0,σ02/n),从而统计量z服从标准正态分布N(0,1)。拒绝零假设的条件:对于给定的α,必可从标准正态分布表中查出一个正数(称之为标准正态分布的α水平双侧分位数),使下式成立:P0{|z|≥}=α
第二十二页,共三十六页,2022年,8月28日上式的意思是:在H0确实成立的条件下|z|超过临界值的概率只有α这么大。因此,如下不等式成立时,拒绝零假设H0:或。再用反证法的思想来检验H0:既然假设H0为真,即μ=μ0,而我们已经知道:σ=σ0,所以理应服从分布:N(μ0,σ02/n),从而z应服从标准正态分布N(0,1),从而应遵循规律:P0{|z|≥}=α第二十三页,共三十六页,2022年,8月28日例1中,按历史资料,总体的标准差是4毫升。我们通过检验总体均值是否等于250毫升,来判断饮料厂商是否欺骗了消费者。程序如下:第一步:确定原假设与备选假设。:=250;:<250以上的备选假设是总体均值小于250毫升,因为消费者协会希望通过样本数据推断出厂商的欺骗行为(大于250毫升一般不会发生)。因此使用左侧检验。第二十四页,共三十六页,2022年,8月28日第二步:构造出检验统计量。我们知道,如果总体的标准差已知,则正态总体(正常情况下,生产饮料的容量服从正态分布)的抽样平均数,也服从正态分布,对它进行标准化变换,可得到:可用z作为检验统计量。第二十五页,共三十六页,2022年,8月28日第三步:确定显著性水平,确定拒绝域。通常显著水平由实际问题确定,我们这里取α=0.05,左侧检验,拒绝域安排在左边,查标准正态分布表得临界值:Zα=-1.645,拒绝域是z<-1.645。第四步:计算检验统计量的数值。样本平均数,n=50,代入检验统计量得:第二十六页,共三十六页,2022年,8月28日第五步:判断。检验统计量的样本取值落入拒绝域。拒绝原假设,接受备选假设,认为有足够的证据说明该种纸包饮料的平均容量小于包装盒上注明的250毫升,厂商有欺诈之嫌。例:设总体服从标准差为50的正态分布,从该总体中随机抽出容量为25的随机样本,得出样本平均值为70,试以α=0.05的显著性水平检验假设H0:μ0=90。
第二十七页,共三十六页,2022年,8月28日解:建立假设H0
:μ=μ0;H1
:μ≠μ0因为σ已知,该检验的统计量为:z=将x=70,μ0=90,σ=50,n=25代入,得:z==-2;另一方面,通过查正态分布表得临界值Zα/2=1.96。|z|≥Zα/2
,故拒绝零假设H0,即有95%的把握认为,μ不等于90。第二十八页,共三十六页,2022年,8月28日(二)总体标准差未知—t检验法总体标准差未知时对总体均值检验经常用t统计量:但是,在大样本场合(样本容量n大于30时),t-统计量与标准正态分布统计量近似,通常用z检验代替t检验。零假设H0:μ=μ0,0<σ<∞;备择假设H1:μ≠μ0,0<σ<∞。显著性水平:α(0<α<1);检验统计量:第八章假设检验第二十九页,共三十六页,2022年,8月28日由于在假设H0下,尽管知道的分布是正态分布N(μ0,σ2/n),但因为σ未知,已不是统计量。改用σ无偏估计s代替,然后再进行检验。不过,替代后的新统计量不再服从正态分布而服从t分布,t分布的自由度(参数)为n-1。拒绝零假设的条件:对于给定的σ和n,有其中是自由度为n-1的t分布的α水平双侧分位数,查t分布表可得该数值。因此,如下不等式成立时拒绝零假设:或,其中第八章假设检验P0{|t|≥}=α第三十页,共三十六页,2022年,8月28日例:某制造厂生产某装置的平均工作温度是190℃,今从一个由16台装置所构成的随机样本中求得的工作温度的平均数和标准差分别是194℃和8℃,能否说明平均工作温度与制造厂规定的温度不一致呢?(设α=0.05,并假定工作温度服从正态分布)解:建立假设H0:μ=190℃;H1:μ≠190℃因方差未知,选取统计量。则t~tα/2(15),tα/2
(15)=2.13。将=194,μ0=190,s=8,n=16代人计算得:因|t|<tα/2(15),故接
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 班主任心理健康与压力管理的培训总结
- 公交扫恶除霸承诺书范本
- 2025-2030全球船用防火窗行业调研及趋势分析报告
- 2025年全球及中国运动刺激疗法行业头部企业市场占有率及排名调研报告
- 2025年全球及中国矩形桥式起重机行业头部企业市场占有率及排名调研报告
- 2025-2030全球便携式鼻腔冲洗器行业调研及趋势分析报告
- 2025-2030全球农用氧化亚铜行业调研及趋势分析报告
- 2025年全球及中国钢制螺旋锥齿轮行业头部企业市场占有率及排名调研报告
- 2025年全球及中国户外电气箱行业头部企业市场占有率及排名调研报告
- 2025-2030全球轴承精密滚珠行业调研及趋势分析报告
- 蛋糕店服务员劳动合同
- 土地买卖合同参考模板
- 2025高考数学二轮复习-专题一-微专题10-同构函数问题-专项训练【含答案】
- 2025年天津市政建设集团招聘笔试参考题库含答案解析
- 2024-2030年中国烘焙食品行业运营效益及营销前景预测报告
- 2025年上半年水利部长江水利委员会事业单位招聘68人(湖北武汉)重点基础提升(共500题)附带答案详解
- 宁德时代笔试题库
- 五年级下册北京版英语单词
- 康复医院患者隐私保护管理制度
- 新课标I、Ⅱ卷 (2024-2020) 近五年高考英语真题满分作文
- 浙江省嘉兴市2023-2024学年六年级(上)期末数学试卷
评论
0/150
提交评论