概率论与数理统计 第八章 假设检验_第1页
概率论与数理统计 第八章 假设检验_第2页
概率论与数理统计 第八章 假设检验_第3页
概率论与数理统计 第八章 假设检验_第4页
概率论与数理统计 第八章 假设检验_第5页
已阅读5页,还剩89页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

概率论与数理统计主讲教师陈争第7章假设检验§7.1假设检验的基本概念§7.2单个正态总体的假设检验§7.3两个正态总体的假设检验第7章假设检验§7.1假设检验的基本概念、假设检验问题

假设检验是统计推断的基本问题之一.它根据历史

资料和实际经验,首先对总体的某种统计特征作出推断

或假设,然后利用样本值所提出的信息,运用统计分析

方法来检验假设是否正确,最后作出接受或拒绝原假设

的决定.假设检验是对总体的概率分布及参数而言的.如果

是检验总体是否具有某种已知类型的分布,则称这种检

验为分布的假设检验.如果是检验总体某参数是否具有某种特征,则称这种检验为参数的假设检验.§7.1假设检验的基本概念例1

抛掷一枚硬币100次,“正面”出现了60次,问这枚硬币是否均匀?这是一个总体的检验问题.若用X

描述抛掷一枚“X=1”及“X=0”分别表示“正面朝上”和“正面朝下”,上述问题就是要检验X是否服从的0-1分布.是概率分布的检验问题.

硬币的试验,

例2

从2005年的新生儿(女)中随机地抽取20个,

测得其平均体重为3160克,样本标准差为300克.而根据过去统计资料,新生儿(女)平均体重为3140克.问现在与过去新生儿(女)体重有无显著差异(假定新生儿体重服从正态分布)?

这是一个总体的检验问题,是关于随机变量的参数的判断,叫做一个总体的参数检验问题.若把所有2005年新生儿(女)体重视为一个总体,用X表示,问题就是判断E(X)=3140是否成立.

例3

在10个相同的地块上对甲、乙两种玉米进行品比试验,得如下资料(单位:公斤):

甲951,966,1008,1082,983乙730,864,742,774,990假定农作物产量服从正态分布,问这两种玉米产量有无显著差异?这是两个总体的参数检验问题.从直观上看,两者差异显著.但是一方面由于抽样的随机性,我们不能以个别值进行比较就得出结论;另一方面直观的标准可能因人而异.因此,这实际上需要比较两个正态总体的期望值是否相等?关于总体的假设通常是提出两个相互对立的假设,把需要检验是否为真的假设称为原假设或零假

这里所说的“假设”只是一个设想,至于它是否成立,在建立假设时并不知道,需要进行考察.通过样本对一个假设作出“是”或“否”的判断程序,称为检验这个假设.

具体的判断规则称为该假设的一个检验.检验的结果若是肯定该命题,则称接受这个假设,否则称否定或拒绝这个假设.

表示.表示,而把与之对立的另一个假设称为备设,用选假设,用二、假设检验的基本思想与方法

1.小概率原理小概率事件在一次试验中几乎是不可能发生的.小概率事件是指概率很小的事件.

倘若某事件A发生的概率α=0.001,则可认为大体在1000次试验中A才出现一次.因此,概率很小的事件在一次试验中实际上不大可能出现,这个原理称为小概率原理.

例如“飞机失事”、“优秀生高考落榜”、“从废品率极低的产品中抽到一件废品”都被视为小概率事件.小概率原理是人们在长期实践中总结出来的.2.小概率原理是假设检验的理论依据定这个“假设”是真的,然后根据样本提供的信息为了检验一个“假设”如果抽得的样本使小概率事件发生了,我不真,从而拒绝原假设;如果抽得样本没有从而接受来判断.们认为这是一种不合理的现象,有理由怀疑原假设导致小概率事件发生,则没有足够理由否定原假设,是否为真,我们先假3.显著性水平

至于什么算“概率很小”,这要根据具体情况而定.在检验之前都事先指定.

比如概率为5%,1%等.

一般记作α,即α是一个事先指定的正数,称为显著性水平或检验水平.三、假设检验的形式对总体的分布或分布函数的某些参数作出“假设”称为待检假设(也称为零假设),通常记作例如

(对总体均值

)对立面称为备择假设,用单侧检验.第一个式子称为双侧检验,二、三两个式子称为的表示.

在显著水平下,根据统计量的分布将样本空间划分成互不相交的两个区域:其中一个是接受零假设的

样本值全体组成的,称为接受域;反之称为拒绝域

(也称临界域).

双侧检验的拒绝域位于概率分布图形的两端,单侧检验的拒绝域位于概率分布图形的一端.四、假设检验的两类错误

由于人们作出判断的依据是一个样本,也就是由

部分来推断整体,因而假设检验不可能绝对准确,它也可能犯错误.其可能性的大小,也是以统计规律性为依据的,所可能犯的错误有两类.

第一类错误是:原假设符合实际情况,而检验结果把它否定了,这称为弃真错误.第二类错误是:原假设不符合实际情况,而检验结果把它肯定下来了,这称为取伪错误.五、假设检验的一般步骤根据实际问题提出原假设构造适当的统计量,并在假设确定该统计量的分布或渐进分布.给定检验水平拒绝域(和接受域).由样本的观测值计算出统计量的数值.1234为真的条件下查表确定临界值,从而确定和备择假设作出判断:若统计量的观测值落入拒绝域,则若统计量的值落入接受域,则接受假设5拒绝假设

提出假设

根据统计调查的目的,提出原假设H0

和备选假设H1作出决策抽取样本检验假设

对差异进行定量的分析,确定其性质(是随机误差还是系统误差.为给出两者界限,找一检验统计量T,在H0成立下其分布已知.)拒绝还是不能拒绝H0显著性水平P(TW)=-----犯第一类错误的概率,W为拒绝域小结设总体为的假设检验,本节介绍下列几种:已知方差未知方差

未知均值μ,已知均值μ,其中关于总体参数检验假设检验假设检验假设检验假设都是已知数.中的§7.2单个正态总体参数的假设检验§7.2单个正态总体的假设检验1.总体方差例1

根据长期经验和资料的分析,某砖瓦厂生产砖的“抗断强度”X服从正态分布,方差从该厂产品中随机抽取6块,测得抗断强度如下:32.56,29.66,31.64,30.00,31.87,31.03检验这批砖的平均抗断强度为32.50是否成立?一、单个总体均值的假设检验(1)双侧检验原假设备择假设已知时,总体均值μ的假设检验一、正态总体均值的假设检验建立假设基本思想:如果来自正态总体解正确,即样本即与存在着差异,若比较大的可能性小,而比较小的可能性大.

成立,则这个差异因此,可以根据的大小来判断是否成立,这就需要分析说大于一个什么值,这是一个小概率事件.的分布来求,如果这个值找到了,比如为那么根据观测值计算大到什么程度,或者成立时,若即小概率事件发生了,则可以认为,就不能否定

不成立;若即原假设成立.

这要根据而成立时,关键在于找出成立时,总体服从

得其统计量给定检验水平

,为了求值方便,将其标准化,的分布,当所以服从构造一个小概率事件,使得其中然后计算U

的观察值,若可由标准正态分满足则小概率事件发生,拒绝若小概率事件没有发生,接受布表查到.(2)当(3)

(4)计算统计量观察值:认为这批产品的平均抗断强度是32.50

综合以上分析,有以下解题步骤:成立时,拒绝域为∴拒绝即不能(1)建立假设即U—检验法的检验步骤为:

提出原假设当

给定的检验水平

,根据样本观察值计算统计量U

的值观察值;若若1243成立时,查表确定临界值使则否定则接受备选假设5从而得拒绝域:(2)右侧检验原假设备选假设已知对于给定的α,查表确定使得:中含有未知参数μ,所以它不是统计量,在原假设成立时,有从而即当时,小概率事件发生,拒绝时,接受原假设当例2

已知某正态总体的方差为50,抽取容量n=25的样本,样本均值为56.7,问总体均值小于55是否成立?解已知n=25,(1)建立假设

(2)构造检验函数(3)

拒绝域为(4)计算所以,接受(3)左侧检验原假设备择假设类似于右侧检验,当统计量时,拒绝原假设时,接受原假设当统计量练习1

设在正常情况下,某包装机包装出来的奶粉净重.现从包装好的奶粉中随机随机抽取9袋,测得其净重(单位:g)为:504496512490520505508499511问每包奶粉净重是否为500g?(2)当(3)(4)计算解∴接受拒绝域为成立时,(1)假设总体方差未知,可用样本方差代替,这时统计量利用T统计量进行检验的方法称为T检验法.2.总体方差未知时,总体均值μ的假设检验一般步骤为:

提出原假设当

给定α,查表确定临界值根据样本观察值计算统计量T的值,若若1243成立时,使则否定则接受备择假设(1)双侧检验5未知,所以用

分析:

例3从2005年的新生儿(女)中随机抽取20个,测得其平均体重为3160克,样本标准差为300克.而根据过去统计资料,新生儿(女)平均体重为3140克.问现在与过去新生儿(女)体重有无显著差异(假定新生儿体重服从正态分布)?(α=0.05)已知解选统计量

代替由于给定检验水平α,

成立时,即具有19个自由度的t

分布.然后计算T

的观察值,接受拒绝时,统计量服从在构造一个小概率事件,使若若(2)当(3)

(4)计算即可认为现在与过去的新生儿(女)体重没有显著差异.解题步骤为:成立时,∴接受(1)假设拒绝域为

(2)右侧检验原假设备择假设已知对于给定的μ,查表确定使中含有未知参数μ,所以它不是统计量.在原假设成立时,有从而即当时,小概率事件发生,拒绝时,接受原假设当(3)左侧检验原假设备择假设类似于右侧检验,当统计量时,拒绝原假设时,接受原假设当统计量(2)构造统计量例4某部门对当前市场的鸡蛋价格情况进行调查,抽查了20个集市,计算得如下数据:解(3)

已知鸡蛋的售价服从正态分布,且往年的售价一直稳定在3.25元/500克左右,能否认为当前鸡蛋的售价明显高于往年?拒绝域为,(1)假设(4)由样本计算(5)因为即鸡蛋的价格较往年明显上涨.

故拒绝

练习2

根据长期资料分析,钢筋强度服从正态分布,今测得六炉钢生产出钢的强度分别为

48.549.053.549.556.052.5能否认为其强度的均值为52.0?(2)当

解成立时,即认为钢筋强度的均值为52.0.

∴接受(1)假设拒绝域为(4)计算课外作业:总习题七2,31.总体均值μ已知时,总体方差的假设检验二、单个正态总体方差的检验假设(1)双侧检验一般步骤为:

提出原假设当

给定检验水平α,查表确定临界值123成立时,和备择假设使二、单个正态总体方差的假设检验利用样本观察值计算若若4的值,则接受则拒绝或5(2)右侧检验提出原假设备择假设

给定检验水平α,查表确定临界值使计算统计量的值,时,拒绝时,接受当当(3)左侧检验提出原假设备择假设

给定检验水平α,查表确定临界值使计算统计量的值,时,拒绝时,接受当当2.总体均值μ未知时,总体方差的假设检验(1)双侧检验一般步骤为:

提出原假设当

给定检验水平α,查表确定临界值123成立时,和备择假设使或利用样本观察值计算若若4的值,则接受则拒绝或5例4

某炼铁厂的铁水含碳量X在正常情况下服从正态分布,现对操作工艺进行了某些改进,从中抽取

5炉铁水测得含碳量数据如下:

4.4214.0524.3574.2874.683据此是否认为新工艺炼出的铁水含碳量的方差仍为

已知解成立时,计算得(1)假设工艺的方差是∴否定即不能认为新查表得:(4)计算拒绝域为练习3

某项试验中测量其温度,通常情况下,温度方差保持在.现在某天里抽测了25次,计算得.问该天的试验温度方差与要求比有无显著差异?(该温度值服从正态分布,)成立时,∴接受解(1)假设(4)计算(2)右侧检验原假设备择假设已知对于给定的α,查表确定临界值使中含有未知参数所以它不是统计量,在原假设成立时,有从而即当时,小概率事件发生,拒绝时,接受原假设当(3)左侧检验提出原假设备择假设

给定检验水平α,查表确定临界值使计算统计量的值,时,拒绝时,接受当当例5

打包机包装水泥,现规定每袋水泥标准重量重量为100公斤,标准差不超过2公斤,为了检查打包机工作是否正常,抽取了9袋水泥,其假定水泥的重量服从正态分布,问该天打包机工作是否

正常?

(2)成立时∴接受解(1)假设(4)计算拒绝域为(2)构造检验函数∴接受综上,该天打包机工作正常.检验方差即认为方差不超过成立时,有(1)假设(4)计算练习4

某种导线,要求其电阻的标准差不得超过0.005(欧姆)。今在生产的一批导线中取样品8根,测得s=0.007(欧姆),设总体为正态分布,问在α=0.05下能否认为这批导线的标准差显著地偏大?(2)构造检验函数∴接受解(4)计算(1)假设练习5

设某次考试的学生成绩服从正态分布,从

中随机抽取30位考生的成绩,算得平均成绩为66.5,标准差为15分.问:(1)是否可认为这次考试全体考生的平均成绩为70分?(2)是否可认为这次考试考生的成绩的方差为?解设该次考试考生的成绩为ξ,则ξ服从正态分布,且均为未知参数。1.检验均值(1)假设成立时,∴接受查表得(4)计算拒绝域为2.检验方差∴接受成立时,(1)假设(4)计算拒绝域为§7.3两个正态总体参数的假设检验设

的样本,且两组样本相互独立.正态总体

§7.3两个正态总体参数的假设检验分别是来自和正态总体一、两个正态总体均值的假设检验已知时均值的检验(1)双侧检验一般步骤为:

提出原假设1备择假设当

给定检验水平α,查表确定临界值23成立时,统计量满足根据样本观察值计算统计量U

的值,若若4则否定则接受5例1

从甲、乙两厂生产的钢丝总体X、Y中各取50截1米长的钢丝作拉力强度试验,得设钢丝的拉抗强度服从正态分布,且问甲、乙两厂钢丝的拉抗强度是否有显著差别?解假设1当2成立时,统计量认为两厂钢丝3查N(0,1)分布表,得计算4所以拒绝强度有显著差别.5(2)右侧检验原假设备择假设当统计量时,拒绝原假设时,接受原假设当统计量给定检验水平α,查表确定临界值满足(3)左侧检验原假设备择假设当统计量时,拒绝原假设时,接受原假设当统计量给定检验水平α,查表确定临界值满足成立时

2未知,但知道(1)双侧检验一般步骤为:

提出原假设1备择假设时均值的检验

给定α,查表确定临界值若

计算统计量T

的值,34满足则拒绝则接受若5例2

一种钢轴产品的长度服从正态分布,从两台同类型机床生产出来的两批产品中,分别取出容量的样本,测其长度得到样本均值及样本方差:若其长度方差,问在检验水平时可否认为两种产品的长度相等。成立时,解(1)假设∴拒绝即认为两种产品的长度有显著差异.(4)计算(2)右侧检验原假设备择假设拒绝原假设接受原假设给定α,查t分布表得临界值满足当当时,时,(3)左侧检验原假设备择假设类似于右侧检验,时,拒绝原假设时,接受原假设当当二、两个正态总体方差的假设检验已知时,正态总体方差的假设检验(1)双侧检验一般步骤为:

提出原假设当12成立时,备择假设二、两个正态总体方差的假设检验其中,3满足给定α,查表确定临界值计算统计量F的值,4时,接受当当和时,拒绝5(2)右侧检验提出原假设备择假设满足给定α,查表确定临界值计算统计量F

的值,

时,拒绝当时,接受当(3)左侧检验提出原假设备择假设满足给定α,查表确定临界值计算统计量F

的值,

时,拒绝当时,接受当未知时,正态总体方差的假设检验(1)双侧检验一般步骤为:

提出原假设当12成立时,统计量备择假设给定α,查表确定临界值3满足其中,计算统计量F的值,4时,接受当当和时,拒绝5例3

比较甲、乙两种枪弹的速度的稳定性,在相同条件下进行速度测定,算得样本均方差如下:

甲:

乙:

假定枪弹速度服从正态分布,问两种枪弹速度的方差

有无显著差异.

设甲、乙两种枪弹的速度分别为

且它们相互独立,假定检验两者方差是否相等.解(1)

假设成立时,∴接受(4)计算查表得:(2)右侧检验提出原假设备择假设满足给定α,查表确定临界值计算统计量F

的值,

时,拒绝当时,接受当(3)左侧检验提出原假设备择假设满足给定α,查表确定临界值计算统计量F

的值,

时,拒绝当时,接受当例4

在10个相同的地块上对甲、乙两种玉米进行品种比较试验,得如下资料(单位:公斤):甲:95196610081082983乙:730864742774990

假定农作物产量服从正态分布,问这两种玉米产量有无显著差异?

分析:记独立的,并且假设

即未知

关于两个正态总体的期望值相等的假设检验,需

要用到两个总体方差相等的条件.所以,需先检验两总体的方差是否相等.分别表示甲、乙玉米产量,它们是假设检验(1)假设成立时,∴接受解(4)计算查表得:成立时,∴拒绝即认为两种玉米的产量有显著差异.解(1)假设(4)计算成立时,练习2

甲、乙两厂生产同一零件,假定其日产量都服从正态分布,现分别在甲、乙两厂作了

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论