统计学假设检验_第1页
统计学假设检验_第2页
统计学假设检验_第3页
统计学假设检验_第4页
统计学假设检验_第5页
已阅读5页,还剩86页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第 五 章 假设检验,假设检验在统计方法中的地位,学习目标,假设检验的基本思想和原理 假设检验的步骤 一个总体参数的检验 P值的计算与应用,.,5.1 假设检验的基本问题,一、假设的陈述 二、两类错误与显著性水平 三、统计量与拒绝域 四、利用P值进行决策,什么是假设?(hypothesis), 对总体参数的具体数值所作的陈述 总体参数包括总体均值、比率、方差等 分析之前必须陈述,我认为这种新药的疗效比原有的药物更有效!,假设的陈述,什么是假设检验? (hypothesis test),先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程 有参数检验和非参数检验 逻辑

2、上运用反证法,统计上依据小概率原理,假设检验的基本思想,. 因此我们拒绝假设 = 50,样本均值,m,= 50,抽样分布,H0,假设检验的过程(提出假设抽取样本作出决策),原假设和备择假设, 什么是原假设?(Null Hypothesis) 1.待检验的假设,又称“0假设” 2.如果错误地作出决策会导致一系列后果 3.总是有等号 , 或 4.表示为 H0 H0: 某一数值 指定为 = 号,即 或 例如, H0: 3190(克),研究者想收集证据予以支持的假设 也称“研究假设” 总是有符号 , 或 表示为 H1 H1 : 某一数值,或 某一数值 例如, H1 : 10cm,或 10cm, 什么是

3、备择假设 (alternative hypothesis),【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设。,提出假设 (例题分析),解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为 H0 : 10cm H1 : 10cm,【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产

4、品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设,提出假设 (例题分析),解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述 。建立的原假设和备择假设为 H0 : 500 H1 : 500,【例】一家研究机构估计,某城市中家庭拥有汽车的比率超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设,提出假设 (例题分析),解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比率超过30%”。建立的原假设和备择假设为 H0 : 30% H1 : 30%,原假设和备择假设是一个完备事件组,而且相互

5、对立 在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立 先确定备择假设,再确定原假设 等号“=”总是放在原假设上 因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论),说明,备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailed test) 备择假设具有特定的方向性,并含有符号“”或“”,称为右侧检验,双侧检验与单侧检验,双侧检验与单侧检验 (假设的形式),H0: 无罪,假设检验中的两类错误 (决策结果),假设检验就好像 一场审判过程,统计检验过程,假设检验中的两类错误,1.第类错误(弃真错误) 原假设为真时拒绝原假设

6、第类错误的概率记为 被称为显著性水平 2.第类错误(取伪错误) 原假设为假时未拒绝原假设 第类错误的概率记为, 错误和 错误的关系,你不能同时减少两类错误!,和 的关系就像翘翘板,小 就大, 大 就小,影响 错误的因素,1.总体参数的真值 随着假设的总体参数的减少而增大 2.显著性水平 当 减少时增大 3.总体标准差 当 增大时增大 4.样本容量 n 当 n 减少时增大,显著性水平 (significant level),1.是一个概率值 2.原假设为真时,拒绝原假设的概率 被称为抽样分布的拒绝域 3.表示为 (alpha) 常用的 值有0.01, 0.05, 0.10 4.由研究者事先确定,

7、假设检验中的小概率原理, 什么小概率? 1.在一次试验中,一个几乎不可能发生的事件发生的概率 2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设 3.小概率由研究者事先确定,根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量 对样本估计量的标准化结果 原假设H0为真 点估计量的抽样分布,检验统计量 (test statistic),标准化的检验统计量,显著性水平和拒绝域(双侧检验 ),抽样分布,显著性水平和拒绝域(双侧检验 ),显著性水平和拒绝域(双侧检验 ),显著性水平和拒绝域(双侧检验 ),显著性水平和拒绝域(单侧检验 ),显著性水平和拒绝域(左侧检验 )

8、,显著性水平和拒绝域(左侧检验 ),显著性水平和拒绝域(右侧检验 ),显著性水平和拒绝域(右侧检验 ),决策规则,给定显著性水平,查表得出相应的临界值z或z/2, t或t/2 将检验统计量的值与 水平的临界值进行比较 作出决策 双侧检验:I统计量I 临界值,拒绝H0 左侧检验:统计量 临界值,拒绝H0,利用 P 值 进行决策,什么是 P 值?(P-Value)是一个概率值 如果我们假设原假设为真,P-值是观测到的样本均值不同于(实测值的概率 左侧检验时,P-值为曲线上方小于等于检验统计量部分的面积 右侧检验时,P-值为曲线上方大于等于检验统计量部分的面积 被称为观察到的(或实测的)显著性水平

9、H0 能被拒绝的的最小值,利用 P 值进行决策,单侧检验 若p-值 ,不能拒绝 H0 若p-值 , 拒绝 H0 双侧检验 若p-值 /2, 不能拒绝 H0 若p-值 /2, 拒绝 H0,双侧检验的P 值,左侧检验的P 值,右侧检验的P 值,假设检验步骤的总结,陈述原假设和备择假设 从所研究的总体中抽出一个随机样本 确定一个适当的检验统计量,并利用样本数据算出其具体数值 确定一个适当的显著性水平,并计算出其临界值,指定拒绝域 将统计量的值与临界值进行比较,作出决策 统计量的值落在拒绝域,拒绝H0,否则不拒绝H0 也可以直接利用P值作出决策,.,5.2 一个总体参数的检验,一、总体均值的检验 二、

10、总体比率的检验,总体均值的检验(作出判断),样本容量n,一个总体参数的检验,总体均值的检验 (大样本),1.假定条件 正态总体或非正态总体大样本(n30) 使用z检验统计量 2 已知: 2 未知:,均值的双侧 Z 检验 (2 已知),1.假定条件 总体服从正态分布 若不服从正态分布, 可用正态分布来近似(n30) 原假设为:H0: =0; 备择假设为:H1: 0 3使用z统计量,总体均值的检验( 2 已知)(例题分析),【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为

11、255.8ml。取显著性水平=0.05 ,检验该天生产的饮料容量是否符合标准要求?,双侧检验,总体均值的检验( 2 已知)(例题分析),H0 : = 255 H1 : 255 = 0.05 n = 40 临界值(c):,检验统计量:,决策:,结论:,不拒绝H0,样本提供的证据表明:该天生产的饮料符合标准要求,均值的双侧 Z 检验(实例),【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为= 0.025 。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与

12、以前有无显著差异?(0.05),均值的双侧Z 检验(计算结果),H0: = 0.081 H1: 0.081 = 0.05 n = 200 临界值(s):,检验统计量:,决策:,结论:,拒绝H0,有证据表明新机床加工的零件的椭圆度与以前有显著差异,均值的单侧Z 检验 (2 已知),假定条件 总体服从正态分布 若不服从正态分布,可以用正态分布来近似 (n30) 备择假设有符号 使用z统计量,均值的单侧Z检验 (实例),【例1】根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水

13、平下判断这批产品的使用寿命是否有显著提高?(0.05),均值的单侧Z检验 (计算结果),H0: 1020 H1: 1020 = 0.05 n = 16 临界值(s):,检验统计量:,在 = 0.05的水平上拒绝H0,有证据表明这批灯泡的使用寿命有显著提高,决策:,结论:,【例2】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低? (=0.01),左侧检验,总体均值

14、的检验( 2 未知)(例题分析),H0 : 1.35 H1 : 1.35 = 0.01 n = 50 临界值(c):,检验统计量:,拒绝H0,新机床加工的零件尺寸的平均误差与旧机床相比有显著降低,决策:,结论:,总体均值的检验(z检验) (P 值的图示),总体均值的检验( 2 未知)(例题分析),【例3】某一小麦品种的平均产量为5200kg/hm2 。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/hm2,标准差为120/hm2 。试检验改良后的新品种产量是否有显著提高? (=0.05),右侧

15、检验,总体均值的检验( 2 未知)(例题分析),H0 : 5200 H1 : 5200 = 0.05 n = 36 临界值(c):,检验统计量:,拒绝H0 (P = 0.000088 = 0.05),改良后的新品种产量有显著提高,决策:,结论:,总体均值的检验(z检验) (P 值的图示),总体均值的检验 (大样本检验方法的总结),总体均值的检验 (小样本),1.假定条件 总体服从正态分布 小样本(n 30) 检验统计量 2 已知: 2 未知:,总体均值的检验 (小样本检验方法的总结),注: 已知的拒绝域同大样本,总体均值的检验 (例题分析),【例】一种汽车配件的平均长度要求为12cm,高于或低

16、于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?,总体均值的检验 (例题分析),H0 : = 12 H1 : 12 = 0.05 df = 10 - 1 = 9 临界值(c):,检验统计量:,不拒绝H0,该供货商提供的零件符合要求,决策:,结论:,均值的双侧 t 检验 (实例),【例】某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克。

17、某日随机抽查9包,测得样本平均重量为986克,样本标准差为24克。试问在0.05的显著性水平上,能否认为这天自动包装机工作正常?,均值的双侧 t 检验 (计算结果),H0: = 1000 H1: 1000 = 0.05 df = 9 - 1 = 8 临界值(s):,检验统计量:,在 = 0.05的水平上接受H0,有证据表明这天自动包装机工作正常,决策:,结论:,均值的单侧 t 检验(实例),【例】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎

18、寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?( = 0.05),均值的单侧 t 检验 (计算结果),H0: 40000 H1: 40000 = 0.05 df = 20 - 1 = 19 临界值(s):,检验统计量:,在 = 0.05的水平上接受H0,有证据表明轮胎使用寿命显著地大于40000公里,决策:,结论:,总体比率检验,假定条件 总体服从二项分布 可用正态分布来近似(大样本) 检验的 z 统计量, 0为假设的总体比率,总体比率的检验 (检验方法的总结),总体比率的检验 (例题分析),【例】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%

19、为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平 =0.05和=0.01 ,检验该杂志读者群中女性的比率是否为80%?它们的值各是多少?,双侧检验,总体比率的检验 (例题分析),H0 : = 80% H1 : 80% = 0.01 n = 200 临界值(c):,检验统计量:,不拒绝H0 (P = 0.013328 = 0.01),该杂志的说法属实,决策:,结论:,一个总体比例的 Z 检验 (实例),【例】某研究者估计本市居民家庭的电脑拥有率为30%。现随机抽查了200的家庭,其中68个家庭拥有电脑。试问研究者的估

20、计是否可信? ( = 0.05),一个样本比例的 Z 检验 (结果),H0: P = 0.3 H1: P 0.3 = 0.05 n = 200 临界值(s):,检验统计量:,在 = 0.05的水平上接受H0,有证据表明研究者的估计可信,决策:,结论:,利用置信区间进行假设检验(双侧检验),求出双侧检验均值的置信区间,2已知时:,2未知时:,若总体的假设值0在置信区间外,拒绝H0,利用置信区间进行假设检验(左侧检验),1. 求出单边置信下限,若总体的假设值0小于单边置信下限,拒绝H0,利用置信区间进行假设检验(右侧检验),1. 求出单边置信上限,若总体的假设值0大于单边置信上限,拒绝H0,利用置

21、信区间进行假设检验 (例子),【例】一种袋装食品每包的标准重量应为1000克。现从生产的一批产品中随机抽取16袋,测得其平均重量为991克。已知这种产品重量服从标准差为50克的正态分布。试确定这批产品的包装重量是否合格?( = 0.05),属于决策的假设!,香脆蛋卷,利用置信区间进行假设检验(计算结果),H0: = 1000 H1: 1000 n = 16 = 0.05 临界值(s):,置信区间为,决策:,结论:,假设的0 =1000在置信区间内,接受H0,表明这批产品的包装重量合格,【例】某电视机厂声称其显象管平均使用寿命超过规定标准1200小时,随机抽查100件产品后测得均值为1245小时

22、,已知总体标准差为300小时,问该厂产品质量是否显著高于规定标准? ( = 0.05),假设检验的P值,假设检验的P值,H0 : 1200 H1 : 1200,接受H0,现在换一个角度,假设总体均值 求样本均值 的可能性有多大?即求,决策:,样本均值不低于1245小时的可能性仍有6.7%,这个概率大于给定显著性水平,P值就是指 这个概率,说明,我们可以将P值概括为: 它是原假设H0为真时,样本可能结果不低于实际观测值(右侧检验),或样本可能结果不高于实际观测值(左侧检验)的概率。 P值可以提供更多的信息,不仅可以用它与给定的显著性水平做比较,进行检验决策,且还显示了样本值在一定范围内出现的概率,这有助

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论