




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 第4章 统计假设检验 第1节 统计假设检验的基本概念 例1 某工厂生产60W灯泡,灯泡寿命服从正态分布,改进灯丝配料方案以后,又生产了一批灯泡,假定灯泡寿命仍服从正态分布,其标准差不变。从新配料方案生产的一批灯泡中抽取20个,测试寿命值,经计算得样本均值为(单位:h),试问新的灯丝配料方案生产的灯泡寿命比以往的是否有显著差异?或问是否有显著提高? 例2 某工厂生产的一批产品,按规定标准,出厂的次品率不得超过3%。今从中随机抽取200件样品进行检查,发现有9件不合格品,试问这批产品能否出厂? 例3 对甲乙两种玉米进行品比试验,得到如下资料: 甲:951 966 1008 1082 983 乙:
2、730 864 742 774 990问这两种玉米产量是否有显著差异? 例4 抛一枚硬币100次,正面出现60次,问这枚硬币是否均匀? 对随机分布中未知参数的假设,称为参数假设。作为检验对象的假设称为待检假设或零假设。一般用表示。 和原假设对立的任何一个假设称为备择假设,记为。原假设和备择假设主要有以下几种形式:(1)简单原假设对简单备择假设, (2)简单原假设对复合备择假设, 或或(3)复合原假设对复合备择假设, 或, 或, 双边检验:, 单边检验:,或,并约定等号放在原假设上。 一般来说,原假设是受到保护的,没有充分的根据是不能拒绝的。 假设只是一种设想,至于这种设想是否成立我们并不知道,
3、我们的任务就是对这个设想进行考察,依据的东西自然就是样本和总体的分布这两个信息,从而决定实际问题能否合理的被认为与假设相符,这一过程就是假设检验。 假设检验的方法是用置信区间的方法,基本思想是小概率事件在一次实验中是不可能发生的。 例5 某车间用一台自动包装机包装葡萄糖,根据长期积累的资料知道,包得的袋装葡萄糖的重量是一个随机变量,且服从的正态分布,某日开工后为检验包装机工作是否正常,随机地抽取9袋,称得净重为(单位:千克)0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512,问包装机工作是否正常?假设检验的基本步骤:第1步:根据实际问题,
4、提出原假设和备择假设第2步:根据的内容,选取检验统计量,并在成立的条件下确定统计量的分布;第3步:根据检验水平,确定临界值或拒绝域;第4步:由样本观察值,计算统计量的值,并与临界值相比较,做出拒绝或接受的判断。 由于我们判断的依据是样本,即由部分来推断总体,因而假设检验不可能绝对正确,也可能犯错误,这种错误大致可以分成两类:第一类:原假设是正确的(真),而检验结果却错误地拒绝了,这叫“弃真”错误,通常称为第一类错误。由于仅当小概率事件发生时,才否定,所以 拒绝为真=第二类:原假设是错误的(不真,伪),而检验结果却错误地接受了,这叫“取伪”错误,通常称为第二类错误。犯第二类错误的概率记为。 例6
5、 假设是连续型随机变量,是对的(一次)观测值,关于其概率密度有如下假设: ,检验规则:当事件出现时,否定接受,求检验犯第一类错误和第二类错误的概率和。 例7 关于泊松随机质点流的强度有两个二者必居其一的假设,和,以表示10分钟出现的随机质点数。检验规则是:当时否定接受,求检验犯第一类错误和第二类错误的概率和。 第2节 参数假设检验的方法一、正态检验法(检验法)1、单正态总体的数学期望的假设检验 设为取自总体的样本,未知,已知,关于的假设检验第一步:提出假设, 第二步:选取统计量第三步:对检验水平,确定拒绝域为(或)第四步:计算统计量的值,若(或)拒绝,否则接受。 例1 某工厂生产的某种型号的电
6、子元件,其平均使用寿命不得低于1000h。今从中任取25件,测试其寿命,经计算得样本均值,假定原件寿命,给定显著性水平,试问这批元件是否合格?解:(1) (2)选取统计量(3)对检验水平,拒绝域为(4)由于落在拒绝域中,所以拒绝,即认为这批元件不合格。2、非正态总体参数的假设检验适用于大样本()情形假定总体服从非正态分布, 当为真时 特别的,若总体分布,参数为, 由中心极限定理,可得拒绝域(或) 例2 某工厂生产的一批产品,按规定标准,出厂的次品率不得超过3%。今从中随机抽取200件样品进行检查,发现有9件不合格品,试问这批产品能否出厂?已知解:本问题是在下检验假设 , 选取统计量检验的拒绝域
7、为,由于,未落入拒绝域中,从而接受,即认为这批产品可以出厂。3、双正态总体的数学期望的假设检验 设是来自于总体的简单随机样本,和分别是样本均值和样本方差;是来自于总体的简单随机样本,和分别是样本均值和样本方差。两样本相互独立。 , 当已知时,选取统计量当未知时,大样本情况下,即,当为真时,选取统计量相应的拒绝域为(或)。当总体,假设 , 当为真时,选取统计量由于,统计量 例3 在由机器A生产的200只螺栓和由机器B生产的100只螺栓的随机样品中,分别发现有19只和5只有缺陷的螺栓。试问在显著性水平下,(1)两台机器呈现不同的性能吗?(2)机器B操作的比机器A好些吗?假定机器A、B生产的螺栓总体
8、均值分别为解:(1)是在下检验假设 , 当为真时,选取统计量,由于统计量的值没有落在拒绝域中,所以接受,即不能认为两台机器性能不同。(2)是在下检验假设 , 当为真时,选取统计量,由于统计量的值没有落在拒绝域中,所以接受,即不能认为机器A比机器B好。二、检验法1、单正态总体的数学期望的假设检验 设为取自总体的样本,、未知,关于的假设检验 , 选取统计量对检验水平,拒绝域为(或) 例4 某食品厂生产的袋装花生米。每袋净重服从正态分布,其中标准差未知。今开箱任意抽取10袋,称得样本均值克,样本标准差为克,试问在显著性水平下,是否可以认为该箱袋装花生米每袋净重不小于150克?解:本问题是在下检验假设
9、 , 选取统计量,临界值由于 说明统计量的值落在拒绝域中,所以拒绝,即不可以认为该箱袋装花生米每袋净重不小于150克。2、双正态总体的数学期望的假设检验 设是来自于总体的简单随机样本,和分别是样本均值和样本方差;是来自于总体的简单随机样本,和分别是样本均值和样本方差。两样本独立。 , 当未知时,选取统计量 对检验水平,确定拒绝域为(或) 例5 从两家工商银行分别独立地对21个储户和16个储户的年存款余额进行抽样调查,测得平均存款余额分别为,样本标准差,假设两家银行存款余额分别服从正态分布,试问在显著性水平下,是否可以认为两家银行储户的平均年存款余额有显著性差异?解:本问题是在下检验假设, 选取
10、统计量 给定,检验的拒绝域为而 由于 说明统计量的值落在拒绝域中,所以拒绝,即不可以认为两家银行储户的平均年存款余额有显著性差异。3、数据成对出现的情况有对试验结果, ,与相互独立,且假定未知,检验假设 , 即, 此时常作,即,则,于是,其中,对检验水平,检验的拒绝域为(或)例6 某货运公司欲实验两种不同品牌的卡车轮胎的耐磨性,以便选择耐磨性较好的加以采购,各购买了A种和B种轮胎8个,各抽取一个组成一对,再用随机抽样的方法按装在8辆卡车上,行驶一定的里程后,测量轮胎磨损量(单位:mg),试在显著性水平下,检验两种品牌轮胎的耐磨性是否有显著性差异?4900 5220 5500 6020 6340
11、 7660 8650 48704930 4900 5140 5700 6110 6880 7930 5010-30 320 360 320 230 780 720 -140解:本问题是在下检验假设, 或, 选取统计量给定,检验的拒绝域为而,由于 说明统计量的值落在拒绝域中,所以拒绝,即可以认为两种品牌轮胎的耐磨性有显著性差异。 三、检验法设为取自总体的样本,检验假设 , 若已知,则选取统计量对检验水平,检验的拒绝域为或(或)若未知,则选取统计量对检验水平,检验的拒绝域为或(或)例7 某工厂生产的铜丝的折断力(单位:N)服从正态分布,某日抽取10根,测得折断力为578 572 570 568 5
12、72 570 572 596 584 570(1)若已知,试在显著性水平下,检验是否成立?(2)若未知,试在显著性水平下,检验是否成立?解:(1), 选取统计量对检验水平,检验的拒绝域为或,由于说明统计量的值未落在拒绝域中,所以接收,即可以认为成立。(2), 选取统计量对检验水平,检验的拒绝域为或,由于说明统计量的值未落在拒绝域中,所以接收,即可以认为成立。四、检验法设是来自于总体的简单随机样本,和分别是样本均值和样本方差;是来自于总体的简单随机样本,和分别是样本均值和样本方差。检验, (1)若已知,选取统计量对检验水平,检验的拒绝域为或(或)(2)若未知,选取统计量对检验水平,检验的拒绝域为
13、或(或)例8 为了减少发动机的装配时间,起草了A、B两种改进方案。分别用A方案装配10台,用B方案装配9台,记录装配时间列入下表:n1 2 3 4 5 6 7 8 9 10方案A83 79 72 85 70 76 78 81 95 82方案B68 76 81 73 66 70 73 76 80假设A、B两种方案装配时间分别服从正态分布,试在显著性水平下,检验A、B两种方案装配时间是否有显著性差异?解:, 选取统计量对检验水平,检验的拒绝域为或,由于说明统计量的值未落在拒绝域中,所以接收,即可以认为A、B两种方案装配时间的方差没有显著性差异。若选取统计量 则,得出同样的结论,但减少了计算量。(2
14、), 选取统计量 给定,检验的拒绝域为 由于 说明统计量的值未落在拒绝域中,所以接收,即可以认为A、B两种方案装配时间没有显著性差异。 第3节 非参数的假设检验一、单总体分布的检验1、拟合优度检验例1 在实验室里观察某种铀放射出来的粒子到达计数器上的个数,每隔一定时间观察一次实验结果,共观察了100次,数据列表如下0 1 2 3 4 5 6 7 8 9 10 1 5 16 17 26 11 9 9 2 1 2 1 100其中为观察到有个粒子的个数。从理论上考虑应服从泊松分布,试在显著性水平下,检验设想是否正确?解:总体服从泊松分布,即 利用极大似然估计,得参数的估计值为151617261199
15、21210.0150.0630.1320.1850.1940.1630.1440.0690.0360.0170.0070.00513.218.519.416.314.46.9-1.82.8-1.56.6-5.3-2.42.1-0.50.4150.5940.1222.2451.7230.5050.6390.03851006.2815即,因为,统计量的值没有落入拒绝域中,从而接受,即可以认为总体服从泊松分布。例2 一自动化车床连续用刀具加工某种零件,从换上新刀具到损坏为止加工的零件数称为刀具的寿命。现记录100把刀具的寿命,经计算,频率分布列表如下:组号1 2 3 4 5 6 7 寿命区间(336
16、.5, (339.5, (342.5, (345.5, (348.5, (351.5, (354.5 339.5 342.5 345.5 348.5 351.5 354.5 357.5频数 1 5 11 18 24 20 12组号8 9 10 寿命区间(357.5, (360.5, (363.5, 360.5 363.5 366.5 频数 6 2 1 100通过画直方图,粗略知道刀具寿命服从正态分布。试在显著性水平下,检验刀具寿命是否服从正态分布?解:本问题是在下,检验假设 :总体服从正态分布 1511182420126210.01450.0460.10930.18580.22770.1981
17、0.12950.05970.01970.05910.9318.5822.7719.8112.95-0.050.07-0.581.230.19-0.950.470.00041320.0004480.01810550.06644270.00182230.06969110.02589681000.1828即,因为,即统计量的值没有落入拒绝域中,从而接受,即认为总体服从正态分布。2、戈尔莫哥洛夫(Kolmogorov)检验法-单个连续型总体分布的检验法 是给定的某个连续型分布函数。设是来自于总体的简单随机样本,由戈列文科定理知,经验分布函数依概率收敛于分布函数,即定义与的距离为,Glivenko Ca
18、ntelli证明了选取统计量当为真,应该较小,戈尔莫哥洛夫(Kolmogorov)证明了的极限分布为若记,的值在附表8中。对给定的检验水平,检验的拒绝域为例3 从连续分布总体抽取容量为25的样本,其观察值为-2.46 -2.11 -1.23 -0.99 -0.42 -0.39 -0.21 -0.15 -0.10 -0.07 -0.02 0.27 0.40 0.42 0.44 0.70 0.81 0.88 1.07 1.39 1.40 1.47 1.62 1.64 1.76,试在显著性水平下,检验样本来自于标准正态分布解:将样本按照从小到大的顺序排序,得经验分布函数 当为真时,计算相应的标准正态
19、分布的函数值结果列表如下 12345678910111213141516171819202122232425-2.46 0.04 0.0069 0.0069 0.0331-2.11 0.08 0.0174 0.0226 0.0626-1.23 0.12 0.1093 0.0293 0.0107-0.99 0.16 0.1611 0.0411 0.0011-0.42 0.2 0.3372 0.1772 0. 1372-0.39 0.24 0.3483 0.1483 0.1083-0.21 0.28 0.4168 0.1768 0.1368-0.15 0.32 0.4404 0.1604 0.12
20、04-0.10 0.36 0.4602 0.1402 0.1002-0.07 0.40 0.4721 0.1121 0.0721-0.02 0.44 0.4920 0.0921 0.05200.27 0.48 0.6064 0.1664 0.12640.40 0.52 0.6554 0.1754 0.13540.42 0.56 0.6628 0.1428 0.10280.44 0.60 0.6700 0.1100 0.07000.70 0.64 0.7580 0.1580 0.11800.81 0.68 0.7910 0.1510 0.11100.88 0.72 0.8106 0.1306 0
21、.09061.07 0.76 0.8577 0.1397 0.09771.39 0.80 0.9197 0.1577 0.11771.40 0.84 0.9192 0.1192 0.07921.47 0.88 0.9292 0.0892 0.04921.62 0.92 0.9474 0.0674 0.02741.64 0.96 0.9495 0.0295 0.01051.76 1 0.9608 0.0520 0.0392给定,检验的拒绝域为,这里,即统计量的值没有落入拒绝域中,从而接受,即可以认为总体服从标准正态分布。二、双总体的检验1、斯米尔诺夫(Smirnov)检验法戈尔莫哥洛夫给出的是单
22、总体分布的检验法。假设两个总体和都服从连续分布,分布函数分别为和,斯米尔诺夫(Smirnov)给出的是两个总体分布的检验问题,即检验假设 设是来自于总体的简单随机样本, 是来自于总体的简单随机样本,和分别是两个样本的经验分布函数,和之间的差异反映了和之间的差异,选取统计量,当为真,应该较小,GlivenkoCantelli证明了,斯米尔诺夫(Smirnov)证明了对给定的检验水平,检验的拒绝域为,的值可以从附表8中查得。2、秩和检验法 秩和检验由FWilcoxon,HBMann和DRWhitney提出。定义 设是来自于总体的简单随机样本,将其观察值按从小到大的顺序排列,得,如果,则称为的秩。例4 设从总体中抽取容量为4的样本,其观察值为,按从小到大的顺序排列,得,则, 假设和是两个随机变量,分布函数分别为和,从中抽取容量为的样本,其顺序统计量为;从中抽取容量为的样本,其顺序统计量为,将两个样本混合起来,并将混合后的个样本值按从小到大的顺序排序,若检验 当为真,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 山东省威海乳山市2024-2025学年九年级上学期期末化学试题(含答案)
- 2025年消防设施操作员之消防设备基础知识基础试题库和答案要点
- 景观桥分析面试题及答案
- 2023-2024学年广东省广州市越秀区执信中学七年级(下)期中数学试卷(含答案)
- 广东省广州市中大附中2023-2024学年八年级下学期期中物理试题(含答案)
- 采购合同范本(2篇)
- 电器知识技能培训班课件
- 关于调整工作时间与资源配置的通知
- 租赁协议合同
- 山东省青岛莱西市(五四制)2024-2025学年八年级上学期期末生物学试题(含答案)
- 《关于费尔巴哈的提纲》
- 人力资源管理参考文献(汇总112个最新),参考文献
- 学宪法讲宪法-课件
- 基于PLC的邮件分拣机控制系统设计
- DB11-T 950-2022水利工程施工资料管理规程
- 购物卡购销合同
- 变配电室巡视检查记录
- 现场谈单的流程与技巧(学大教育内部培训资料)
- 法人授权委托书
- 印萌打印平台合作协议VIP
- 中国建设银行信贷业务申请书
评论
0/150
提交评论