概率论与数理统计 第7章 假设检验课件_第1页
概率论与数理统计 第7章 假设检验课件_第2页
概率论与数理统计 第7章 假设检验课件_第3页
概率论与数理统计 第7章 假设检验课件_第4页
概率论与数理统计 第7章 假设检验课件_第5页
已阅读5页,还剩136页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章假设检验第七章假设检验假设检验的一般理论正态总体均值与方差的假设检验分布拟合检验置信区间与假设检验之间的关系有许多实际问题,需要通过部分信息量,对某种看法进行判定或估计.

例7.1

某企业生产一种零件,以往的资料显示零件平均长度为4cm,标准差为0.1cm.工艺改革后,抽查100个零件发现其平均长度为3.94cm.问:工艺改革后零件长度是否发生了显著变化?假设检验问题的提出在本节中,我们将讨论不同于参数估计的另一类重要的统计推断问题.这就是根据样本的信息检验关于总体的某个假设是否正确.

这类问题称作假设检验问题.所谓假设检验,就是事先对总体参数或总体分布形式作出一个假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定是否接受或否定原假设.假设检验参数假设检验总体分布已知,检验关于未知参数的某个假设非参数假设检验总体分布未知时的假设检验问题把每一罐都打开倒入量杯,看看容量是否合于标准.这样做显然不行!生产流水线上罐装可乐不断地封装,然后装箱外运.怎么知道这批罐装可乐的容量是否合格呢?例7.3

罐装可乐的容量按标准应在350毫升和360毫升之间.7.1假设检验的一般理论

如每隔1小时,抽查5罐,得5个容量的值x1,…,x5,根据这些值来判断生产是否正常.每隔一定时间,抽查若干罐.如发现不正常,就应停产,找出原因,排除故障,然后再生产;如没有问题,就继续按规定时间再抽样,以此监督生产,保证质量.通常的办法是进行抽样检查.在正常生产条件下,由于种种随机因素的影响,每罐可乐的容量应在355毫升上下波动.这些因素中没有哪一个占有特殊重要的地位.因此,根据中心极限定理,假定每罐容量服从正态分布是合理的.罐装可乐的容量按标准应在350毫升和360毫升之间.那么,如何判断原假设H0是否成立呢?较大、较小是一个相对的概念,合理的界限在何处?应由什么原则来确定?由于是正态分布的期望值,它的估计量是样本均值,因此可以根据与的差距来判断H0

是否成立.较小时,可以认为H0是成立的;当生产已不正常.当较大时,应认为H0不成立,即然而,这种随机性的波动是有一定限度的,如果差异超过了这个限度,则我们就不能用抽样的随机性来解释了.必须认为这个差异反映了事物的本质差别,即反映了生产已不正常.这种差异称作“系统误差”.问题是,根据所观察到的差异,如何判断它究竟是由于偶然性在起作用,还是生产确实不正常?即差异是“抽样误差”还是“系统误差”所引起的?这里需要给出一个量的界限.问题是:如何给出这个量的界限?这里用到人们在实践中普遍采用的一个原则:小概率事件在一次试验中基本上不会发生.小概率事件在一次试验中基本上不会发生.下面我们用一例说明这个原则.这里有两个盒子,各装有100个球.99个白球一个红球…99个…99个99个红球一个白球现从两盒中随机取出一个盒子,问这个盒子里是白球99个还是红球99个?小概率事件在一次试验中基本上不会发生.现在我们从中随机摸出一个球,发现是此时你如何判断这个假设是否成立呢?小概率事件在一次试验中基本上不会发生.我们不妨先假设:这个盒子里有99个白球.…99个概率反证法它不同于一般的反证法概率反证法的逻辑是:如果小概率事件在一次试验中居然发生,我们就以很大的把握否定原假设.一般的反证法要求在原假设成立的条件下导出的结论是绝对成立的,如果事实与之矛盾,则完全绝对地否定原假设.现在回到我们前面罐装可乐的例中:在提出原假设H0后,如何作出接受和拒绝H0的结论呢?在假设检验中,我们称这个小概率为显著性水平,用表示.的选择要根据实际情况而定.常取提出假设选检验统计量~N(0,1)H0:=355H1:≠355由于已知,它能衡量差异大小且分布已知.对给定的显著性水平

,可以在N(0,1)表中查到分位点的值,使故我们可以取拒绝域为:也就是说,“”是一个小概率事件.C:如果由样本值算得该统计量的实测值落入区域C,则拒绝H0;否则,不能拒绝H0.如果显著性水平

取得很小,则拒绝域也会比较小.其产生的后果是:H0难于被拒绝.如果在很小的情况下H0仍被拒绝了,则说明实际情况很可能与之有显著差异.基于这个理由,人们常把时拒绝H0称为是显著的,而把在时拒绝H0称为是高度显著的.例7.4某工厂生产的一种螺钉,标准要求长度是32.5毫米.实际生产的产品,其长度X假定服从正态分布未知,现从该厂生产的一批产品中抽取6件,得尺寸数据如下:32.56,29.66,31.64,30.00,31.87,31.03问这批产品是否合格?…下面,我们结合另一个例子,进一步说明假设检验的一般步骤.即

是一个小概率事件.

第三步:对给定的显著性水平,查表确定临界值,使得否定域(拒绝域)C:|t|>4.0322故不能拒绝H0.第四步:将样本值代入,算出统计量t的实测值|t|=2.997<4.0322没有落入拒绝域假设检验会不会犯错误呢?由于作出结论的依据是小概率原理:小概率事件在一次试验中基本上不会发生.不是一定不发生如果H0成立,但统计量的实测值落入否定域,从而作出否定H0的结论,那就犯了“以真为假”的错误.如果H0不成立,但统计量的实测值未落入否定域,从而没有作出否定H0的结论,即接受了错误的H0,那就犯了“以假为真”的错误.假设检验的两类错误H0为真实际情况决定拒绝H0接受H0H0不真第一类错误正确正确第二类错误两类错误是互相关联的,当样本容量固定时,一类错误概率的减少导致另一类错误概率的增加.要同时降低两类错误的概率,或者要在不变的条件下降低,或者需要增加样本容量.犯两类错误的概率显著性水平为犯第一类错误的概率.P{拒绝H0|H0为真}=,P{接受H0|H0不真}=.例:某厂生产的螺钉,标准强度为68克/mm2,而实际生产的螺钉强度X服从

,若

,则认为这批螺钉符合要求,

否则认为不符合要求.为此提出如下假设:现从该厂生产的螺钉中抽取容量为36的样本,其样本均值为,问原假设是否正确?若原假设正确,则拒绝域为落入接受域,则接受原假设.犯第一类错误的概率=P(拒绝H0|H0为真)若H0为真,则

所以,拒绝H0的概率为,又称为显著性水平,越大,

犯第一类错误的概率越大,即越显著.H0不真,即68,可能小于68,

也可能大于68,的大小取决于的真值的大小.设

=66,n=36,犯第二类错误的概率=P(接受H0|H0不真)若

=69,

n=36,取伪的概率较大./2/2H0

真H0

不真仍取=0.05,则由可以确定拒绝域为

(,67.118)与(68.882,+)因此,接受域为(67.118,68.882)现增大样本容量,取n=64,=66,则命题:当样本容量确定后,犯两类错误的概率不可能同时减少.此时犯第二类错误的概率为证设,在水平给定下,检验假设又由此可见,当

n固定时1)若2)若7.2正态总体均值与方差的假设检验抽样分布回顾:若(x)/2/21-0xz/2-z/2为样本,则单个正态总体均值的假设检验假设设

为样本,

为已知数(1)

(双侧)1.已知的情形(z

检验)2.

未知的情形(t

检验)(3)

(左单侧)(2)

(右单侧)相同点(1)平均数值在中央且等于0,以纵轴为对称轴.(2)曲线由中央向两侧逐渐降低,两尾部无限延伸与横轴相靠始终不相交.(3)面积为1.

t分布与正态分布的区别不同点(1)标准正态曲线的形状不随n(自由度)的大小而改变.t分布曲随着n的不同而变化,曲线不是一条,而是多条(一簇),即不同的自由度有不同的曲线.(2)n愈小,t分布曲线愈平坦,曲线中间愈低,两侧尾部翘得愈高.n愈大,t分布曲线愈接近正态分布曲线.为∞时,分布曲线与标准正态分布曲线完全重合.分布就可由标准正态分布来取代.双边z

检验设取自正态总体的一个样本,为已知常数.(1)检验假设分析比较集中的反映总体均值信息,所以检验函数从样本均值着手考虑1.已知的情形(z

检验)H0成立时,可选用z统计量做为检验函数因此,应在0的周围随机摆动,远离0的可能性较小,拒绝域选在两侧.(2)选用z

统计量(3)给定显著性水平,查正态分布表,使即则寻找上侧分位点,使确定拒绝域(4)计算样本实测值值,判断其是否落入拒绝域.若,即,拒绝原假设.否则接受原假设.解:总体分布为例7.6某产品指标服从正态分布,均方差已知,为150小时.今在一批产品中随机抽取了26个样本,测得指标的平均值为1637小时,问在5%的显著性水平下,能否认为这批产品的指标为1600小时?提出假设代入,并由样本值计算得统计量u的实测值z0

=1.2578<1.96故接受原假设H0.没有落入否定域取统计量否定域为C:不能否认这批产品的指标为1600小时.设取自正态总体的一个样本,为已知常数.单边z

检验(1)检验假设为小概率事件查正态分布表,拒绝域确定拒绝域,分两种情况:(2)假设检验(a),拒绝域(b),选统计量H0成立时,z0远大于0的可能性较小,拒绝域应在右侧由于z0分布未知,考虑即因此,在给定条件下,使事件所以H0成立时,对假设H0,为小概事件,拒绝域仍为C.(3)检验假设拒绝域(4)检验假设拒绝域解:提出假设:例7.7某织物强力指标X的均值公斤.改进工艺后生产一批织物,今从中取30件,测得公斤.假设强力指标服从正态分布且已知公斤,问在显著性水平下,新生产织物比过去的织物强力是否有提高?代入,并由样本值计算得统计量z的实测值z0=2.51>2.33故拒绝原假设H0.落入否定域此时可能犯第一类错误,犯错误的概率不超过0.01.取统计量否定域为C

:

是一小概率事件例7.8

已知某炼铁厂的铁水含碳量(%)在正常情况下服从正态分布N(4.55,0.112),今测得5炉铁水含碳量如下:4.28,4.40,4.42,4.35,4.37.若标准差不变,铁水的含碳量是否有明显的降低?(

)

解此为方差

时的左边单侧检验,由题设知n=5,

,又由样本观察值计算出其假设为所以拒绝H0接受H1,即认为铁水的含碳量有显著下降.设取自正态总体的一个样本,为未知数.双边t检验(1)检验假设(2)构造t统计量

2.

2

未知的情形(t

检验)其中(3)给定显著性水平,确定拒绝域由查t-分布表,自由度取n-1,确定分位点拒绝域单边t检验(1)检验假设拒绝域(2)检验假设拒绝域(3)检验假设拒绝域(4)检验假设拒绝域例7.9

假设粮食产量服从正态分布.某县在秋收时随机抽查了20个村的产量(单位:kg),平均产量为981kg,

=50kg,问该县已达到吨粮县的结论是否成立?(

)

解本题是

未知的左边单侧检验由于

未知,用t检验.由题设n=20,=50,则所以接受H0,认为该县已经达到了吨粮县的标准.若取

=0.06,由于t0<-t0.06(19)=-1.6280,则应当拒绝H0,认为该县尚未达到吨粮县的标准.

双正态总体均值的假设检验欲检验假设:设1.

已知时的z检验2.

但未知时的t检验(3)左边单侧检验

(1)双侧检验(2)右边单侧检验(1)检验假设(2)构造z

统计量设和分别为取自正态总体和的样本,在方差

已知的条件下1.

已知时的z

检验查正态分布表,拒绝域

(3)给定显著性水平,确定拒绝域(4)求样本观测值的z值,判断与否.(1)检验假设(2)构造t统计量2.

但未知时的t检验设和分别为取自正态总体和的样本,在方差的条件下其中特别时,可以推广至检验此时将t统计量分子换成查t-分布表拒绝域

(3)给定显著性水平,确定拒绝域(4)求样本观测值的t-值,判断与否.例7.10

为比较两种农药残留时间的长短,现分别取12块地施甲种农药,10块地施乙种农药,经一段时间后,分别测得结果为:假设两药的残留时间均服从正态分布且方差相等,试问两种农药的残留时间有无显著差异?(

)解此为

但未知时,两个正态总体均值差的t检验.

所以在显著性水平=0.05下接受H0,认为两种农药的残留时间无显著差异.若=0.052,拒绝H0

.单个正态总体方差假设检验检验假设设1.已知时,2的2检验2.未知时,2的2检验(1)双侧检验(2)右边单侧检验(3)左边单侧检验(1)检验假设设取自正态总体的一个样本,为已知常数双边2检验

1.已知时,2的2检验比较集中的反映了的信息(2)选取统计量做为检验函数H0成立时,因此,远离n的可能性较小拒绝域选在两侧.

(3)给定显著性水平,确定拒绝域,使拒绝域为了计算方便,取查-分布表知,上侧分位点使分位点使单边2检验(1)检验假设拒绝域(2)检验假设拒绝域(1)检验假设拒绝域选统计量H0成立时,

远大于n的可能性较小,拒绝域应在右侧由于

分布未知,考虑即因此,在给定条件下,使事件所以H0成立时,对假设H0,为小概事件,拒绝域仍为C.(1)检验假设(2)构造统计量设取自正态总体的一个样本,未知.双边2检验2.未知时,2的2检验

(3)给定显著性水平,确定拒绝域,使拒绝域查-分布表知,上侧分位点使分位点使为了计算方便,取单边2检验(1)检验假设拒绝域(2)检验假设拒绝域

例11

已知某种棉花的纤度服从N(,0.0482),现从中任取8个样品,测得纤度为1.36,1.40,1.38,1.32,1.42,1.36,1.44,1.32.问棉花纤度的方差与已知纤度的方差是否相同?(=0.10)解这是未知情况下,对总体方差的双侧检验.由于

,

且由样本观察值计算得对=0.10,查

2

分布表得由于所以接受H0,认为棉花纤度的方差与0.0482无显著不同.

例12

在进行工艺改革时,一般若方差显著增大,可作相反方向的改革以减小方差.若方差变化不显著,可试行别的改革方案.今进行某项工艺改革,加工23个活塞,测量其直径,,设改革前活塞直径方差为0.0004,问进一步改革的方向应如何(假设改革前后活塞直径服从正态分布,=0.10)解这是未知情况下,对总体方差的单侧检验.对=0.05,查

2

分布表得由于所以拒绝H0,认为改革后的直径方差大于改革前,下一步改革朝相反方向进行.选择统计量两个正态总体方差检验假设且它们相互独立设1.1,2已知时方差齐性的F检验2.1,2未知时方差齐性的F检验(1)双侧检验(2)右边单侧检验(3)左边单侧检验(1)检验假设

(2)构造F统计量设和分别为取自正态总体和的样本,在均值

已知的条件下1.1,2已知时方差齐性的F检验(3)给定显著性水平,确定拒绝域注意:(1)检验假设(2)构造F统计量2.1,2未知时方差齐性的F检验设和分别为取自正态总体和的样本,在方差

未知的条件下

(3)给定显著性水平,确定拒绝域例12为比较两台自动机床的精度,分别取容量为10和8的两个样本,测量某个指标的尺寸(假定服从正态分布),得到下列结果:在时,问这两台机床是否有同样的精度?车床甲:1.08,1.10,1.12,1.14,1.15,1.25,1.36,1.38,1.40,1.42车床乙:1.11,1.12,1.18,1.22,1.33,1.35,1.36,1.38

解:设两台自动机床的方差分别为在下检验假设:取统计量否定域为C:或由样本值可计算得F的实测值为:F0=1.51查表得由于0.304<1.51<3.68,故接受H0.这时可能犯第二类错误.若含氮量都服从正态分布,问其含氮量是否相同?(=0.05)解此题是两正态总体方差未知,亦不知是否齐性的情况下对两总体均值差的检验.须先作方差齐性检验,再用t

检验.例13

甲乙两种氮肥,其含氮量的抽样数据分别为:(1)假设所以接受H0,即认为方差是齐性的.

已得到方差齐性的结论,已经满足t检验的条件.进而检验

所以接受H0,认为两种氮肥的含氮量基本相同(无显著差异).

统计量成对数据假设检验

前面讨论的用于两个正态总体均值的比较检验中,我们假设了来自这两个正态总体的样本是相互独立的.但是,在实际中,有时候情况不总是这样.可能这两个正态总体的样本是来自同一个总体上的重复测量,它们是成对出现的且是相关的.例如,为了考察一种降血压药的效果,测试了n个高血压病人服药前后的血压分别为和

.这里

是第i个病人服药前和服药后的血压.它们是有关系的,不会相互独立.另一方面,

是n个不同病人的血压,由于各人体质诸方面的条件不同,这n个观测值也不能看成来自同一个正态总体的样本.也一样.这样的数据称为成对数据.就消除了人的体质诸方面的条件差异,仅剩下降血压的效果.从而我们可以把

看成来自正态总体的样本.其中

就是降血压药的平均效果.降血压药是否有效,就归结为检验如下假设

即为来自正态总体

的随机样本.H0为真时,检验函数为拒绝域为令例14

为了检验A、B两种测定铁矿石含铁量的方法是否有明显差异,现用这两种方法测定了取自12个不同铁矿的矿石标本的含铁量(%),结果列于表.问这两种测定方法是否有显著差异?解将方法A和方法B的测定分别记为和.由于这12个标本来自不同铁矿,因此,不能看成来自同一个总体的样本,也一样.故需用成对t检验.拒绝域为计算实测值没有落入拒绝域,接受原假设,认为两种测定方法无显著差异.假设检验中的大样本方法

问题:总体不是服从正态分布,而是0-1分布,怎么样对0-1分布的参数p进行假设检验?当样本容量n足够大时,总体X~B(1,p),p为未知参数,为事件成功的频数,检验H0为真时,检验函数为拒绝域为(x)/2/21-0xz/2-z/2一般说来,按照检验所用的统计量的分布,分为F检验用F分布z检验用正态分布t检验用t分布检验用分布在大样本的条件下,若能求得检验统计量的极限分布,依据它去决定临界值C.按照对立假设的提法,分为单侧检验,它的拒绝域取在左侧或右侧.双侧检验,它的拒绝域取在两侧;

1.据往年统计,某杏园中株产杏服从N(54,0.752),2010年整枝施肥后,收获时任取10株单收,算得平均株产量为56.22.如果方差不变,问2010年株产量是否有显著提高?(=0.05)

2.某内服药有使病人血压增高的副作用,已知血压增量服从均值22的正态分布,现就一种新药品,测得10名服用者的血压增量平均值为17.9,问能否得出副作用小的结论?练习题

3.杜鹃总是把蛋生在别的鸟巢中,现有从两种鸟巢中得到的蛋共24只,测量其长度.试鉴别杜鹃蛋的长度与它们被发现的鸟巢不同是否有关?(设两个样本来自同方差的正态总体)

z检验

t检验

t检验7.3分布拟合检验在前面的课程中,我们已经了解了假设检验的基本思想,并讨论了当总体分布为正态时,关于其中未知参数的假设检验问题.然而可能遇到这样的情形,总体服从何种理论分布并不知道,要求我们直接对总体分布提出一个假设.例如,从1500到1931年的432年间,每年爆发战争的次数可以看作一个随机变量,椐统计,这432年间共爆发了299次战争,具体数据如下:战争次数X01234

22314248154

发生X次战争的年数在概率论中,大家对泊松分布产生的一般条件已有所了解,容易想到,每年爆发战争的次数,可以用一个泊松随机变量来近似描述.也就是说,我们可以假设每年爆发战争次数分布X近似泊松分布.上面的数据能否证实X具有泊松分布的假设是正确的?现在的问题是:又如,某钟表厂对生产的钟进行精确性检查,抽取100个钟作试验,拨准后隔24小时以后进行检查,将每个钟的误差(快或慢)按秒记录下来.问该厂生产的钟的误差是否服从正态分布?再如,某工厂制造一批骰子,声称它是均匀的.为检验骰子是否均匀,要把骰子实地投掷若干次,统计各点出现的频率与1/6的差距.也就是说,在投掷中,出现1点,2点,…,6点的概率都应是1/6.得到的数据能否说明“骰子均匀”的假设是可信的?问题是:K.皮尔逊这是一项很重要的工作,不少人把它视为近代统计学的开端.解决这类问题的工具是英国统计学家K.皮尔逊在1900年发表的一篇文章中引进的所谓

检验法.

检验法是在总体X的分布未知时,根据来自总体的样本,检验关于总体分布的假设的一种检验方法.

H0:总体X的分布函数为F(x)

然后根据样本的经验分布和所假设的理论分布之间的吻合程度来决定是否接受原假设.使用

对总体分布进行检验时,我们先提出原假设:检验法这种检验通常称作拟合优度检验,它是一种非参数检验.在用

检验法检验假设H0时,若在H0下分布类型已知,但其参数未知,这时需要先用极大似然估计法估计参数,然后作检验.分布拟合的

检验法的基本原理和步骤如下:3.根据所假设的理论分布,可以算出总体X

的值落入每个Ai的概率pi,于是npi就是落入Ai的样本值的理论频数.1.将总体X的取值范围分成k个互不重迭的小区间,记作A1,A2,…,Ak.2.把落入第i个小区间Ai的样本值的个数记

作fi,称为实测频数.所有实测频数之和

f1+f2+…+fk等于样本容量n.标志着经验分布与理论分布之间的差异的大小.皮尔逊引进如下统计量表示经验分布与理论分布之间的差异:统计量的分布是什么?在理论分布已知的条件下,npi是常量实测频数理论频数皮尔逊证明了如下定理:若原假设中的理论分布F(x)已经完全给定,那么当时,统计量分布渐近为(k-1)个自由度的分布.如果理论分布F(x)中有r个未知参数需用相应的估计量来代替,那么当时,统计量分布渐近为

(k-r-1)个自由度的分布.是k个近似正态的变量的平方和.这些变量之间存在着一个制约关系:故统计量渐近(k-1)个自由度的分布.

在理论分布F(x)完全给定的情况下,每个pi

都是确定的常数.由棣莫佛-拉普拉斯中心极限定理,当n充分大时,实测频数fi

渐近正态,因此在F(x)尚未完全给定的情况下,每个未知参数用相应的估计量代替,就相当于增加一个制约条件,因此,自由度也随之减少一个.若有r个未知参数需用相应的估计量来代替,自由度就减少r个.此时统计量渐近(k-r-1)个自由度的分布.如果根据所给的样本值X1,X2,…,Xn算得统计量的实测值落入拒绝域,则拒绝原假设,否则就认为差异不显著而接受原假设.得拒绝域:(不需估计参数)(估计r个参数)查分布表可得临界值,使得根据这个定理,对给定的显著性水平,皮尔逊定理是在n无限增大时推导出来的,因而在使用时要注意n要足够大,以及npi

不太小这两个条件.根据计算实践,要求n不小于50,以及npi

都不小于5.否则应适当合并区间,使npi满足这个要求.让我们回到开始的一个例子,检验每年爆发战争次数分布是否服从泊松分布.提出假设H0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论