第十二假设检验演示文稿_第1页
第十二假设检验演示文稿_第2页
第十二假设检验演示文稿_第3页
第十二假设检验演示文稿_第4页
第十二假设检验演示文稿_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十二假设检验演示文稿当前第1页\共有38页\编于星期三\11点(优选)第十二假设检验当前第2页\共有38页\编于星期三\11点第十二章假设检验假设检验参数假设检验非参数假设检验总体分布已知,检验关于未知参数的某个假设总体分布未知时的假设检验问题当前第3页\共有38页\编于星期三\11点第一节检验的基本原理

一、检验问题的提法

假设检验是既同估计密切联系,但又有重要区别的一种推断方法。例如:某种电子元件寿命X服从参数为λ的指数分布,随机抽取其中的n件。测得其寿命数据,

问题⑴,这批元件的平均寿命是多少?问题⑵,按规定该型号元件当寿命不小于5000(h)为合格,问该批元件是否合格?

问题⑴是对总体未知参数μ=E(X)=1/λ作出估计。回答“μ是多少?”,是定量的。问题⑵则是对假设“这批元件合格”做出接受还是拒绝的回答,因而是定性的。当前第4页\共有38页\编于星期三\11点

对上述例子,还可做更细致考察,设想如基于一次观察数据算出μ的估计值,我们能否就此接受“这批元件合格”的这一假设呢?尽管但这个估计仅仅是一次试验的结果,能否保证下一次测试结果也能得到μ的估计值大于5000呢?也就是说从观察数据得到的结果与参考值5000的差异仅仅是偶然的呢?还是总体均值μ确实有大于5000的“趋势”?

这些问题是以前没有研究过的。一般而言,估计问题是回答总体分布的未知参数是多少?或范围有多大?而假设检验问题则是回答观察到的数据差异只是机会差异,还是反映了总体的真实差异?因此两者对问题的提法有本质不同。第一节检验的基本原理当前第5页\共有38页\编于星期三\11点例有一批产品,需经检验合格后才能出厂,按按标准其次品率不得超过4%今从这批产品中任意抽10件,发现有3件次品,问这批产品能否出厂解:直观上看,这批产品似乎不能出厂,但理论依据何在现以p表示这批产品的次品率,按标准,若p<=0.04,这批产品可出厂,若p>0.04,则这批产品不能出厂。我们的问题就是要根据“10件产品中有3件次品”,这一抽样结果来判断p是否大于0.04我们先提两个相互对立的假设,注意到,在假设成立的前提下,“10件产品中有3件次品”这一抽样结果的概率其概率小于0.01,即这是一个小概率事件。根据实际推理原理,小概率事件在一次抽样中是不可能发生的。而今这一小概率事件在一次抽样中竟然发生了,这是不合理的。所以不成立,即成立。所以按此标准这批产品不能出厂当前第6页\共有38页\编于星期三\11点

下面通过一个例子介绍原假设和备择假设二.原假设和备择假设第一节检验的基本原理当前第7页\共有38页\编于星期三\11点例1(酒精含量)一种无需医生处方即可达到的治疗咳嗽和鼻塞的药。按固定其酒精含量为5﹪.今从一出厂的一批药中随机抽取10瓶,测试其酒精含量得到的10个含量的百分数:5.01,4.87,5.11,5.21,5.03,4.96,4.78,4.98,4.88,5.06如果酒精含量服从正态分布N(μ,0.00016),问该批药品的酒精含量是否合乎规定?任务:

通过样本推断X的均值μ是否等于5.假设:上面的任务就是要通过样本去检验“X的均值=5”这样一个假设是否成立.(在数理统计中把“X的均值μ=5”这样一个待检验的假设记作“H0:μ=5”称为

“原假设”或“零假设”.表明数据的“差异”是偶然的,总体没有“变异”发生.

当前第8页\共有38页\编于星期三\11点

原假设的对立面是“X的均值μ≠10”记作“H1:μ≠10”称为“对立假设”或“备择假设”.表明数据的“差异”不是偶然的,是总体“变异”的表现.把它们合写在一起就是:H0:μ=10

H1:μ≠10

原假设H0表明含量符合规定,这个5﹪也称之为期望数,尽管10个数据都5﹪与有出入,这只是抽样的随机性所致;备择假设H1表明总体均值μ已经偏离了期望数5﹪,数据与期望数5﹪的差异是其表现.假设检验的任务

必须在原假设与备择假设之间作一选择当前第9页\共有38页\编于星期三\11点检验统计量是构造一个适当的能度量观察数与原假设下的期望数之间的差异程度的统计量,此统计量为检验统计量.特点:在原假设H0下分布式完全一致或者说可以计算.因而通过标准化可得到检验统计量三.检验统计量

本例的观察数通过样本平均表示,它是μ的一个无偏估计,而在下的期望数为μ=5,在H0下当前第10页\共有38页\编于星期三\11点

从试验数据判断是否导致一个矛盾的结果,一个重要的依据是小概率事件的实际推断原理.

看例1,由观察数据,可算得的观察值为4.989,代入统计量Z的表达式,得Z的观察值为

四.否定论证及实际推断原理

否定论证是假设检验的重要推理方法,其要旨是:先假定原假设H0成立,如果从试验观察数据及此假定将导致一个矛盾的结果,则必须否定这个原假设;反之,如果不出矛盾的结果,就不能否定原假设.当前第11页\共有38页\编于星期三\11点

在H0下,Z服从标准正态分布,对于特定的一次试验,统计量Z取得观察值-2.7509,是十分罕见的,以至于实际不会发生.事实上,当H0成立时,事件发生的机会只有5﹪(如图)

这是一个小概率事件.今从试验数据得到Z=-2.7509,由于表明这一小概率事件在该次试验中发生,这与实际推断原理矛盾.因此否定原假设.至此本例已获得解答,即基于数据该批药品的酒精含量不符合规定.注意:

在否定论中最终能否得出矛盾的结果,取决于数据.02.5﹪1.96-1.96-2.7509当前第12页\共有38页\编于星期三\11点第二节显著水平检验法与正态总体检验一.假设检验的两类错误

一类错误是,当H0为真时,因为尽管事件{A|H0}是小概率事件,但仍有可能发生,即样本观察值(x1,x2,...,xn)∈R时,按检验法则将拒绝原假设H0,这种错误称为第一类错误.

根据检验法则,若A发生则拒绝H0,否则接受H0.这不免要犯二类错误.当前第13页\共有38页\编于星期三\11点第二节显著水平检验法与正态总体检验一.假设检验的两类错误

另一类错误是,当原假设H0不真,即H1为真时,A也有可能不发生,即样本观察值(x1,x2,...,xn)∈R*,按检验法则将接受原假设H0,这种错误称为第二类错误.当前第14页\共有38页\编于星期三\11点第二节显著水平检验法与正态总体检验正确正确H0

为真H0

为假真实情况所作判断接受H0拒绝H0第一类错误(弃真)第二类错误(取伪)注意:不可能消除这两种错误,而只能控制发生这两类错误之一的概率.一.假设检验的两类错误当前第15页\共有38页\编于星期三\11点第二节显著水平检验法与正态总体检验

我们当然希望独两类错误的概率都很小,但在样本容量n固定时是无法做到的.基于这种情况,且因为人们常常把拒绝H0比错误地接受H0看得更重些.因此人们希望在控制犯第一类错误的概率α的条件下,尽量使犯第二类错误的概率小,但这也是不容易的,有时甚至是不可能的.于是人们不得不降低要求,只对犯第一类错误的概率α加以限制,而不考虑犯第二错误的概率,在这种原则下,寻找临界域C时只涉及原假设H0,而不涉及备择假设H1,这种统计假设问题称为显著性检验问题.对给定的犯第一类错误的概率α称为显著性水平.当前第16页\共有38页\编于星期三\11点第二节显著水平检验法与正态总体检验二.显著水平检验法

显著水平检验法:在数据收集之前就已经设定好一个检验规则,即文献上称之为拒绝域R,使得当样本观察值落入R就拒绝H0.

对拒绝域R的要求是:在H0

下{样本落入R}为一小概率事件,即对预先给定的0<α<1有

P({样本落入R}|H0)≤α此时称R所代表的检验为显著水平α的检验当前第17页\共有38页\编于星期三\11点第二节显著水平检验法与正态总体检验(1)根据问题的要求建立原假设H0和备择假设H1;假设检验的方法步骤(2)选取检验统计量T(X1,X2,...,Xn),要求T不含任何参数,以便计算H0为真时的条件概率;(3)给定显著性水平α,求出使P{T∈R|H0}≤α的临界域C;(4)若样本观察值T(x1,x2,...,xn)∈R,则拒绝原假设H0,否则接受H0.当前第18页\共有38页\编于星期三\11点第二节显著水平检验法与正态总体检验1).方差已知时总体均值的假设检验1两个正态总体的假设检验当前第19页\共有38页\编于星期三\11点第二节显著水平检验法与正态总体检验当前第20页\共有38页\编于星期三\11点第二节显著水平检验法与正态总体检验找临界值uα/2示意图0a/2ua/2a/2-ua/2当前第21页\共有38页\编于星期三\11点第二节显著水平检验法与正态总体检验当前第22页\共有38页\编于星期三\11点作为未知参数μ的点估计,因此偏小应该拒绝H0.若H0成立,例3某降价盒装饼干,其包装上的广告上称每盒质量为269g.但有顾客投诉,钙饼干质量不足269g。为此质检部门从准备出厂的一批盒装饼干中,随机抽取30盒,由测得的30个质量数据算出样本平均为268.假设盒装饼干质量服从正态分布N(μ,22),以显著水平α=0.05检验该产品广告是否真实.解:依题意,可设原假设H0:μ=269备择假设

H1:μ<269则有则在下Z~N(0,1),即Z的分布已知,因而Z可以做检验统计量,偏小等价于Z偏小,从而得到拒绝域的形式如下其中k待定,称之为临界值.当前第23页\共有38页\编于星期三\11点α=0.05,为求显著水平0.05的检验,只需选取k使得查表可得因而得到水平0.05检验的拒绝域代入数据得Z=-2.74,显然小于临界值-1.645,因而依据检验规则应该拒绝H0,即该盒装广告又不是广告行为.当前第24页\共有38页\编于星期三\11点第二节显著水平检验法与正态总体检验2).方差未知时总体均值的双侧假设检验当前第25页\共有38页\编于星期三\11点第二节显著水平检验法与正态总体检验当前第26页\共有38页\编于星期三\11点第二节显著水平检验法与正态总体检验找临界值tα/2示意图0a/2a/2-ta/2(n-1)ta/2(n-1)当前第27页\共有38页\编于星期三\11点第二节显著水平检验法与正态总体检验当前第28页\共有38页\编于星期三\11点其中σ未知.今用S*代替σ,得到t的统计量例4.在例3中,若盒装饼干重量服从正态分布N(μ,σ2),μ与σ2均未知,已知样本平均,修正样本标准差为S*=1.8,求解相同的问题.解:此时不能使用Z作为统计量,因为标准化变量为由正态总体抽样分布基本定理可知,在H0下可得到拒绝域的形式如下其中k待定,称之为临界值.当前第29页\共有38页\编于星期三\11点α=0.05,为求显著水平0.05的检验,只需选取k使得因而得到水平0.05检验的拒绝域代入数据得t=-3.044,显然小于临界值-1.699,因而依据检验规则应该拒绝H0,即该盒装广告又不是广告行为.当前第30页\共有38页\编于星期三\11点第二节显著水平检验法与正态总体检验2两个正态总体的假设检验当前第31页\共有38页\编于星期三\11点第二节显著水平检验法与正态总体检验1).方差已知时均值的双侧假设检验因为当H0成立时,统计量当前第32页\共有38页\编于星期三\11点第二节显著水平检验法与正态总体检验从而,对于给定的显著性水平α,拒绝域为当前第33页\共有38页\编于星期三\11点第二节显著水平检验法与正态总体检验2).方差未知时均值的双侧假设检验当前第34页\共有38页\编于星期三\11点第二节显著水平检验法与正态总体检验当前第35页\共有38页\编于星期三\11点第二节显著水平检验法与正态总体检验当前第36页\共有38页\编于星

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论