概率论与数理统计课件版-第8章假设检验_第1页
概率论与数理统计课件版-第8章假设检验_第2页
概率论与数理统计课件版-第8章假设检验_第3页
概率论与数理统计课件版-第8章假设检验_第4页
概率论与数理统计课件版-第8章假设检验_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第六章-第八章知识结构图数理统计抽样分布 统计推断常用的统计量四个重要分布参数估计假设检验正态总体的样本均值与方差的分布(重要统计量的分布)矩估计法点估计 区间估计极大似然估计法均值的区间估计方差的区间估计均值的检验方差的检验单个总体两个总体正态总体 第六章-第八章知识结构图数理统计抽样分布 统计推断假设检验参数假设检验非参数假设检验总体分布已知,检验关于未知参数的某个假设总体分布未知时的假设检验问题根据样本的信息检验关于总体的某个假设是否正确。 第八章 假设检验 假设检验问题: 假设检验问题分类: 假设检验参数假设检验非参数假设检验总体分布已知,总体分布未知 一. 假设检验的基本思想设总体

2、 X 含有未知参数 (或总体分布函数 F(x) 未知)检验下述假设:假设 或 是某个已知常数或 是某个已知的分布函数。 第一节 假设检验 其中:则抽取容量为 n 的样本,利用样本提供的信息对假设作出判断,从而确定是否接受 一. 假设检验的基本思想设总体 X 含有未知参数 例如:显然 是可以被接受的. 二. 判断 “假设” 的根据小概率事件原理小概率事件在一次试验中是几乎不可能发生的未知检验假设:如果在假设 成立的条件下某事件是小概率事件,不是一定不发生因为 是总体 X 的待估计参数 的无偏估计。但在一次试验中却发生了,于是就可怀疑假设的正确性从而拒绝例如:显然 是可以被接受的. 二. 判断现用

3、一个例子来说明这个原则.现有两个盒子,各装有100个球.99个白球一个红球99个例如:99个红球一个白球99个现从两盒中随机取出一个盒子问:这个盒子里是白球 99个还是红球 99 个?现用一个例子来说明这个原则.现有两个盒子,各装有100个球.若假设:这个盒子里有 99 个白球.当从中随机摸出一个球时,发现是红球:此时应如何判断这个假设是否成立呢 ?假设其中真有 99 个白球,摸出红球的概率只有 1/100 , 但此小概率事件在一次试验中 竟然发生了,这就不得不怀疑所作的假设。.这是小概率事件若假设:这个盒子里有 99 个白球.当从中随机摸出一个球时,概率反证法要求在原假设成立的条件下导出的结

4、论是绝对成立的,如果事实与之矛盾, 则完全绝对地否定原假设。这个例子中所使用的推理方法,称为是带概率性质的反证法. 在假设检验中,常称这个小概率为显著性水平, 用 表示.注如果小概率事件在一次试验中居然发生了,则就可以以很大的把握否定原假设,否则就不能否定原假设。它不同于一般的反证法一般反证法概率反证法要求在原假设成立的条件下导出的结这个例子中所使用的 三. 假设检验的两类错误 1. 第一类错误 (弃真): 如果 是正确的, 但却被错 误地否定了。 2. 第二类错误 (取伪): 如果 是不正确的, 但却被错误地接受了。若设 犯两类错误的概率分别为:P 拒绝H0 | H0为真 = P 接受 H0

5、 | H0 不真 = 则显著性水平 为犯第一类错误的概率。 三. 假设检验的两类错误 1. 第一类错误 (弃真 两类错误是互相关联的,要同时降低两类错误的概率 ,或者要在 不变的条件下降低 ,则需要增加样本容量 n先对犯第一类错误(弃真)的概率加以控制,同时再考虑使犯第二类错误(取伪)的概率尽可能的小。在实际问题中,通常的做法是:注当样本容量 n 固定时,一类错误概率的减少必导致另一类错误 概率的增加。 两类错误是互相关联的,要同时降低两类错误的概率 四. 假设检验的具体做法例1.罐装可乐容量的检验问题在一条生产可乐的流水线上罐装可乐不断地封装,然后装箱外运。试问:如何检验这批罐装可乐的容量是

6、否合格呢?分析:若把每一罐可乐都打开倒入量杯, 检验容量是否合于标准。罐装可乐的容量按标准应在 350 毫升和 360 毫升之间。这显然是不可行的。 四. 假设检验的具体做法例1.罐装可乐容量的检验每隔 1小时,抽查 5 罐,得 5个容量的值:X1,X5 ,根据这些值来判断生产是否正常.如发现不正常 则应停产,找出原因,排除故障,然后再生产;如生产正常, 则继续按规定时间再抽样,以此监督生 产,保 证质量。通常的办法是:进行抽样检查.显然:即,每隔一定时间,抽查若干罐 。如:2. 也不能总认为正常,有了问题不能及时发 现,这也同样要造成损失. 1. 不能由 5 罐容量的数据,在把握不大的情 况

7、下就判断生产 不正常,因为停产的损失 是很大的;如何处理这两者的关系?每隔 1小时,抽查 5 罐,得 5个容量的值:X1,X5 如何处理这两者的关系?现用假设检验的方法来处理这对矛盾在正常生产条件下,由于种种随机因素的影响,每罐可乐的容量应在 355 毫升上下波动. 这些因素中没有哪一个占有特殊重 注意到:故: 可以认为样本是取自正态总体 现抽查了n 罐,测得容量为:当生产比较稳定时,是一个常数. 现在要检验的假设是:假定每罐容量服从正态分布是合理的.要的地位.因此,根据中心极限定理,H0: 如何处理这两者的关系?现用假设检验的方法来处理这对矛盾它的对立假设是:称 H0 为原假设(或 零假设

8、)称 H1 为备择假设(或 对立假设).在实际问题中,往往把不轻易否定的命题作为原假设. H0:H1:那么,如何判断原假设H0 是否成立呢?由于 是正态分布的期望值,它的无偏估计量是来判断 H0 是否成立 .样本均值 ,因此可以根据 与 的差距它的对立假设是:称 H0 为原假设(或 零假设 )称 H1 而较大、较小是一个相对的概念,那么它应由什么原则来确定?对差异作定量的分析,以确定其性质.问题归结为:非本质的因素所引起的随机波动。 注意到:较小时,可以认为 H0 是成立的;当当较大时,应认为 H0 不成立 .生产已不正常当差异是由抽样的随机性引起时,则称其为“抽样误差”或 随机误差;它反映了

9、由偶然、然而,这种随机性的波动是有一定限度的,而较大、较小是一个相对的概念,对差异作定量的分析,以确定其性如果差异超过了这个限度,如何判断差异是由“抽样误差”还是“系统误差”所引起的?从而问题就转化为:解决的方法:给出一个量的界限 ,即显著性水平从而提出假设:H0:H1: 因为 已知,所以构造统计量为:则称其为“系统误差”.则就不能用抽样的随机性来解释了。此时可认为这个差异反映了事物的本质差别,如果差异超过了这个限度,如何判断差异是由“抽样误差”从而问题检验统计量: N ( 0, 1 )对给定的显著性水平 ,查正态分布的上分位点的值 ,使:即是一个小概率事件故可以取拒绝域 C为:如果由样本值算

10、得该统计量的实测值落入区域C, 则拒绝 H0 ;否则就接受 H0 .检验统计量: N ( 0, 1 )对给定的显著性水平 如果H0 是对的,那么衡量差异大小的某个统计量落入区域 C (拒绝域) 是个小概率事件。这里所依据的逻辑是:如果该统计量的实测值落入C,即 H0 成立下的小概率事件发生了,那么就认为 H0 不可信而否定它;否则就不能否定 H0 而只好接受 H0不否定 H0并不是肯定 H0一定对,而只是说差异还不够显著,还没有达到足以否定 H0 的程度 。故假设检验又称为“显著性检验”注如果H0 是对的,那么衡量差异大小的某个统这里所依据的逻辑是如果在 很小的情况下H0基于这个理由,人们常把

11、 时拒绝 H0 称为是显著的。如果显著性水平 取得很小,则拒绝域也会比把在 时拒绝 称为是 高度显著的。难于被拒绝。较小。其产生的后果是:则说明实际情仍被拒绝了,况很可能与之有显著差异。如果在 很小的情况下H0基于这个理由,人们常把 某工厂生产的一种螺钉,标准要求长度是 32.5 毫米. 实际生产的产品,其长度 X 假定服从正态分布 其中 未知,现从该厂生产的一批产品中抽取 6 件, 得尺寸数据如下:32.56, 29.66, 31.64, 30.00, 31.87, 31.03问:这批产品是否合格?这批产品(螺钉长度)的全体组成问题的总体为 X 例2 解:则问题是要检验 E(X) 是否为32

12、.5.由已知,设:某工厂生产的一种螺钉,标准要求长度是 32.5 32.56,提出原假设和备择假设 第一步:因为已知 未知. 第二步:能衡量差异大小且分布已知故取检验统计量为:在 成立下求出它的分布为:提出原假设和备择假设 第一步:因为已 第三步:即“ ”是一个小概率事件 . 小概率事件在一次试验中基本上是不会发生 .使得:故得否定域为:对给定的显著性水平 查 分布表得临界值: 第三步:即“ 故不能拒绝H0 ,即应接受H0 第四步:没有落入拒绝域 接受 H0 这并不意味着 H0一定对,只是差异还不够显著,不足以否定 H0 将样本值代入,计算出统计量 的实测值:可认为这批产品是合格的。 结论:注

13、故不能拒绝H0 ,即应接受H0 第四步: 接受 H例3.设某异常区磁场强度服从正态分布 ,由以前观察知道 ,现有一台新型号的仪器,用它对该区进行磁测,抽取了41个点,其样本均值与方差为:问:此仪器测出的结果是否符合要求?解:以 分别表示用这台机器测出的异常区的磁场强度 X 的均值和均方差(标准差)。于是:这里 是未知的.根据长期实践的经验表明异常区磁场强度的标准差比较稳定,所以可设 例3.设某异常区磁场强度服从正态分布 提出假设: 第一步: 第二步:由已知条件取检验统计量为: 第三步:对给定的显著性水平 查正态分布表得临界值:提出假设: 第一步: 第二步:由已知条件取检验统计量为: 第 使得:

14、故得否定域为:即:是一个小概率事件 . 使得:故得否定域为:即:是一个小概率事件 . 第四步:将样本值代入,计算出统计量 的实测值:没有落入拒绝域故不能拒绝H0 ,即应接受H0 结论:可认为这台仪器测出的结果是符合要求的, 即这台机器是基本正常的 第四步:将样本值代入,计算出统计量 的实测值:故不能拒备择假设 表示 可能大于 也可故称其为 双边备择假设。拒绝域与临界点当统计量取某个区域 C 中的值时,拒绝原假 设 ,则称区域 C 为 拒绝域。(2) 拒绝域的边界点称为 临界点 .单边检验(1) 右边检验:(2) 左边检验:注从而对应的假设检验称为 双边假设检验。能小于备择假设 表示 可能大于

15、则称 与 的差异显著.在正态分布中针对显著性水平 ,一般有:则称 与 的差异不显著.例如,当当则称 与 的差异显著.在正态分布中针对 五. 假设检验问题的步骤3. 确定检验统计量及拒绝域的形式1. 根据实际问题要求,提出原假设 及备择假设2. 给定显著性水平 及样本容量4. 按 ,求出拒绝域5. 取样本,根据样本观察值确定接受 还是拒绝 五. 假设检验问题的步骤3. 确定检验统计量及拒绝域某编织物强力指标 X 的均值 公斤。 改进工艺后生产了一批编织物,今从中取 30 件,测得 公斤。 假设强力X 指标服从正态分布 ,且已知 公斤。提出假设: 取统计量:否定域 C 为: 是一小概率事件例4问:

16、在显著性水平 下,新生产编织物比 过去的编织物强力是否有提高 ?解:某编织物强力指标 X 的均值 并由样本值计算,得统计量 U 的实测值为:故拒绝原假设 H0 ,可认为新生产编织物比过去的编织物强力是有提高的 落入否定域此时可能会犯第一类错误,但犯错误的概率不会超过 0.01.由已知,注并由样本值计算,得统计量 U 的实测值为:故拒绝原假设 H01. 已知,关于 的检验 ( U 检验 )在 已知条件下用服从 的统计量检验正态总体 的方法为 U 检验法(1) 检验假设:取检验统计量: 第二节 正态总体均值的假设检验 一. 单个正态总体 均值 的检验1. 已知,关于 的检验 ( U 检验 则在显著

17、性水平 下, 的拒绝域:的拒绝域的接受域(2) 检验假设:或取检验统计量:则在显著性水平 下, 的拒绝域:的拒绝则在显著性水平 下, 的拒绝域:的接受域的拒绝域或的接受域的拒绝域则在显著性水平 下, 的拒绝域:的接受例1.已知某钢铁厂的铁水含碳量在正常情况下服从正态分布 现又测了5 炉铁水,其含碳量分别为:问:当总体标准差没有改变时,现在生产是否正常?解:假设总体标准差没有改变,即 已知的情况统计量例1.已知某钢铁厂的铁水含碳量在正常情况下服从正态分布 现给定显著性水平从而: 经计算 则:拒绝 ,可认为现在的生产是不正常的。给定显著性水平从而: 经计算 则:拒绝 ,可例2已知某正态总体的方差为

18、 49,抽测 24个样本值的均值为问:总体均值 是否成立解:显然它与检验时的讨论是一样的。 取统计量因为是单边检验,所以:假设给定显著性水平例2已知某正态总体的方差为 49,抽测 24个样本值的均值为接受 ,即可以认为总体均值 是成立的(1) 对于与的讨论均可归为如下统一形式的讨论: 因为它们的拒绝域是一致的 经计算或注接受 ,即可以认为总体均值 (2) 对于与检验过程中唯一不同的是在查正态分布表时,前者是利用概率关系式:而后者是利用概率关系式: 或(2) 对于与检验过程中唯一不同的是在查正态分布表时,而后2. 未知,关于 的检验 ( t 检验 )(1) 检验假设:在 未知条件下用服从 的统计

19、量检验正态总体 的方法为 检验法因为 未知,所以可以考虑用 的无偏估计 来代替,故有: 取检验统计量 则有:2. 未知,关于 的检验 ( t 检(2) 检验假设:则在显著性水平 下, 的拒绝域:的拒绝域的接受域或(2) 检验假设:则在显著性水平 下, 或 同(1)讨论类似,则在显著性水平 下, 的拒绝域:的拒绝域 的接 受域 的接 受域的拒绝域 或 同(1)讨论类似,则在显著性水平 下, 例3某库房要验收大批同类物质,根据以往的经验,这批物质每件的重量服从正态分布。按规定这批物质平均每件重量应为 100 公斤,今抽取10 件,测得其均值问:能否接受这批物质 ?解:未知,所以用 t 检验。经计算

20、设 取统计量为:例3某库房要验收大批同类物质,根据以往的经验,这批物质每件的接受 ,即可认为该库房应接受这批物质。 二. 两个正态总体均值差的检验设 是来自 的样本, 是来自 的样本,它们相互独立分别是两个总体的均值与方差1. 当 未知时 ( t 检验 ) 为已知常数,显著水平为而检验假设:接受 ,即可认为该库房应接受这批物质。 二. 两检验统计量 同单个总体的讨论类似,有:其中:检验统计量 同单个总体的讨论类似,有:其中:在显著性水平 下, 的拒绝域: 当 未知时 检验假设或其讨论同前类似 ,在显著性水平 下, 的拒绝域:注在显著性水平 下, 的拒绝域: 或2. 当 均已知时 ( U 检验

21、)检验假设: 为已知常数,显著水平为 或2. 当 均已知时 ( U 检检验统计量同单个正态总体的讨论类似,有:在显著性水平 下, 的拒绝域:检验统计量同单个正态总体的讨论类似,有:在显著性水平 当 均已知时检验假设 : 或 或注其讨论同前类似 ,在显著性水平 下, 的拒绝域:当 均已知时检验假设 : 或 或注其3. 基于成对数据的假设检验 ( t 检验)逐对比较法为了比较两种性能之间的差异,在相同的条件下作对比试验,得到一批成对的观察值。对观察值进行分析,作出推断的方法。例4现要比较甲、乙两种橡胶制成的轮胎的耐磨性。今从甲、乙两种轮胎中各随机的取 8 个,又从两组中各取一个组成一对,共 8 对

22、;再随机的取 8 架飞机,将 8 对轮胎随机地搭配给这 8 架飞机作耐磨性试验,当飞机飞行了一定时间后测得轮胎的磨损量的数据(单位:毫克)如下:3. 基于成对数据的假设检验 ( t 检验)逐对比较法为了比甲乙4900 5220 5500 6020 6340 7660 8650 48704930 4900 5140 5700 6110 6880 7930 5010试问:这两种轮胎的耐磨性有无显著的差别?解:设 X,Y:甲、乙两种轮胎的磨损量并设 X,Y 均服从正态分布,即:方法一:数据不配对分析将所观察的两行数据分别作为 X,Y 的样本依题意,检验假设:甲乙4900 5220 5500 6020

23、 6340因为已知所以在给定的显著性水平下的拒绝域为:经计算 取统计量为:因为已知所以在给定的显著性水平下的拒绝域为:经计算 取统计量因为:所以接受 ,可认为这两种轮胎的耐磨性无显著差异。方法二:数据配对分析在方法一中是将所观察的两行数据分别作为X,Y 的样本,而没有去区别它们是否来自于同一架飞机。注意到:事实上:不同的飞机其试验的条件是不完全一致的,有的甚至于有很大的差异,的试验条件的不同会对试验数据产生干扰.所以飞机之间因为:所以接受 ,可认为这两种轮胎的耐磨性无显著差容易将飞机之间的试验条件的差异与轮胎之间耐磨性的差异交织在一起,分辨不出轮胎之间真正的差异。方法一的不足:方法二的做法:观

24、察分析同一架飞机上两种轮胎的磨损量的差异,作出推断。今令:并令是总体的样本从而将原问题转化为单个正态总体中当未知时关于的假设检验问题。 检验假设:容易将飞机之间的试验条件的差异方法一的不足:方法二的做法:观按单个正态总体中当 未知时,关于 的假设检验的计算公式,可得 的拒绝域为:经计算 因为: 取统计量为:所以拒绝 ,可认为这两种轮胎的耐磨性有显著差异。按单个正态总体中当 未知时,关于 的假设检用两种不同的方法得到了两种不同的结论,那么究竟应该采取哪一个结论比较合理呢?显然,应该采取第二种方法得出的结论是合理的因为数据配对的方法是针对同一架飞机的,它是排除了因飞机之间的试验条件的不同而对数据产

25、生的干扰,注所以它是直接反映了这两种轮胎的耐磨性的显著差异的情况.可认为这两种轮胎的耐磨性有显著差异方法得出的结论, 即因此,应采取第二种用两种不同的方法得到了两种不同的结论,显然,应该采取第二种方基于成对数据的假设检验的一般提法:设有 对相互独立的观察结果:令则相互独立。又由于是由同一因素所引起的,所以可认为它们服从同现假设未知即是来自正态总体的一个样本。其样本均值与样本方差的观察值为一分布。基于成对数据的假设检验的一般提法:设有 对相互独立检验假设由单个正态总体均值的 t 检验,可得检验问题(1)、(2)、(3) 的拒绝域分别为:检验假设由单个正态总体均值的 t 检验,可得检验问题是来自总体的样本。 检验假设( 为已知常数) 取检验统计量 第三节 正态总体方差的假设检验 一. 单个正态总体 方差 的检验 ( 检验)总体均未知,是来自总体的样本。 检验假设( 为已知常数) 取 其中:使得:P 当 为真时拒绝 为计算方便,习惯上取: 其中:使得:P 当

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论