统计学课件:第五章 假设检验_第1页
统计学课件:第五章 假设检验_第2页
统计学课件:第五章 假设检验_第3页
统计学课件:第五章 假设检验_第4页
统计学课件:第五章 假设检验_第5页
已阅读5页,还剩87页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第五章假 设 检 验假设检验在统计方法中的地位统计方法描述统计推断统计参数估计假设检验假设检验预备知识(一)实际反证法:在假定原假设成立的条件下从其理论上推翻原假设。逻辑反证法:在假定原假设成立的条件下,以一定的概率从逻辑上推翻原假设例题: 某接待站在某一周曾接待过12次来访,已知所有这12次接待都是在周二和周四进行的,问是否可以推断接待时间是有规定的(规定周二和周四接待)。 假设:接待时间无规定 令:事件“恰好所有来访都在周二和周四进行接待”若原假设成立,则:分析: 从逻辑上讲,概率很小的事件在一次试验中是几乎不可能发生的,这是人们从实际经验中总结的,称为实际推断原理,现在概率很小的事件在

2、一次试验中居然发生了,因此有理由怀疑假设的正确性。从而认为接待时间是有规定的。 注意:虽然推翻了原假设,并不是说原假设一定是错误的,仅仅是有理由怀疑而已,因为小概率事件虽然在一次试验中几乎不可能发生,并不等价于不发生,所以,推翻原假设可能是一种错误的选择,但犯这种错误的概率是很小的,这就是逻辑反证法的实质所在。假设检验预备知识(二)显著性差异:当两个数值间的差异超过了人们事先按照某种统计学规则确定的标准,则认为两数值之间存在统计学差异,或者是存在显著性差异。第一节 假设检验的一般问题 第二节 一个总体的参数检验第三节 两个总体的参数检验第一节 假设检验的一般问题一、假设检验的概念二、假设检验的

3、基本原理三、相关概念四、假设检验中的两类错误五、双侧检验和单侧检验什么是假设? -对总体参数的一种看法总体参数包括总体均值、比例、方差等在分析之前必需先陈述 例如高血压病人例题中我认为这种新药的疗效比原有的药物更有效!一、什么是假设检验?1、概念事先对总体参数或分布形式作出某种假设然后利用样本信息来判断原假设是否成立2、类型参数假设检验非参数假设检验3、特点采用逻辑上的反证法依据统计上的小概率原理总体假设检验的过程(提出假设抽取样本作出决策)抽取随机样本均值 X = 20我认为人口的平均年龄是50岁 提出假设 拒绝假设! 别无选择.作出决策二、假设检验的基本原理(思想) 引例:某车间用一台包装

4、机包装葡萄糖,包得的袋装葡萄糖重量是一个随机变量,它服从正态分布。当机器正常时,其均值为0.5公斤,标准差为0.015公斤。某日开工后为检验包装机是否正常,随机的抽取所包装的糖9袋,称得净重为: 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512 (公斤) 问:若显著性差异水平为0.05,机器是否正常工作?(总体标准差稳定)分析:1、样本均值为:0.511公斤,不等于机器正常工作时的均值;2、我们希望了解0.511与0.5是否属于存在显著差异;3、如果属于显著差异,则说明机器工作不正常,包装的葡萄糖显著偏重;4、如果不属于显著差异,则说明

5、机器工作正常,包装的葡萄糖落在0.5公斤左右正常范围内;5、是否显著差异的标准是事先给定的显著性水平。假设检验的基本问题叙述为: 在显著性水平 下,检验所提出的假设: 其中:前者为零假设,后者为备择假设,根据样本,运用抽样分布和检验统计量做出决定,在二者之间选其一,以便做出统计决策互相对立的假设提出假设:给定法则:做出判断:作出分析: 若原假设成立,则有:解决方案:本例中:若取给定法则中的小概率事件居然发生了,只能拒绝原假设,认为这天包装机工作不正常图形显示在给定的显著性水平下,这不象我们应该得到的样本均值. 如果这是总体的真实均值样本均值m = 0.5抽样分布H00.511. 因此我们拒绝原

6、假设 = 0.5总结:假设检验的基本思想假设检验中的小概率原理:1.在一次试验中,一个几乎不可能发生的 事件称为小概率事件2.在一次试验中小概率事件一旦发生,我们就有理由不接受原假设3.此小概率由研究者事先确定三、相关概念 什么是原假设?(Null Hypothesis) 1、待检验的假设,又称“零假设”,表示为 H0 2、研究者想要收集证据予以反对的假设,(拒绝H0时,表示予以反对,但可能拒绝错了) 3、如果错误地作出决策会导致一系列后果 4、总是有等号 , 或(假定H0成立时,将以等号的位置作为抽样分布的对称轴)什么是备择假设?(Alternative Hypothesis) 1、与原假设

7、对立的假设,表示为 H1 2、研究者想要收集证据予以证明(予以支 持)的假设 3、通常为样本所显示的结论,以样本的结论作备选 4、总是有不等号: , 或 练习:学会提假设,见书P146-148什么是检验统计量?1、根据样本观测结果计算得到的,用于对原假设和备择假设做出判断的某个样本统计量,称为检验统计量 2、检验统计量的基本形式为: 3、选择统计量的方法与参数估计相同,需考虑 是大样本还是小样本 总体方差已知还是未知 (以抽样分布为基础)什么是显著性水平?1、用于检验样本统计量与总体参数之间是否存在显著的差异2、由研究者事先确定,给定3、表示为 ,原假设为真时,拒绝原假设的概率,常用的 为0.

8、01, 0.05, 0.10抽样分布H0值临界值临界值a/2 a/2 样本统计量拒绝域拒绝域接受域1 - 置信水平什么是拒绝域?由此看出,= 号通常在H0上什么是决策规则?1.给定显著性水平 ,查表得出相应的临界值z或 , t或2.将检验统计量的值与 水平对应的临界值进行比较3.作出决策双侧检验:I统计量I 临界值,拒绝H0左侧检验:统计量 临界值,拒绝H0 四、假设检验中的两类错误 (决策风险)1.第一类错误(弃真错误)原假设为真时拒绝原假设会产生一系列后果第一类错误的概率为(生产者风险)被称为显著性水平2.第二类错误(取伪错误)原假设为假时接受原假设第二类错误的概率为(消费者风险)案例:辛

9、普森案中的两类错误 辛普森案中,他实际上是有罪的,但陪审团确认它无罪。这里的零假设是:一个人是无罪的,除非你能在一些怀疑之外证明他有罪。则在此案中陪审团犯的是第一类错误还是第二类错误? 你能够设想出一个陪审团犯了与以上错误不同的另一类错误的案例么?这两种错误中的哪一种是我们法律系统更情愿容忍的?H0: 无罪假设检验中的两类错误陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0 检验决策实际情况H0为真H0为假接受H01 - a第二类错误(b)拒绝H0第一类错误(a)检验功效(1-b)统计检验过程 错误和 错误的关系当样本容量固定时,不能同时减少两类错误!只有增大样本容量才能同时减小两类

10、错误和的关系就像翘翘板,小就大, 大就小思考:什么时候宁愿“弃真”? 什么时候宁愿“取伪”?两类错误 的关系 1、二者互为消长。2、在检验中,对 的选择取决于犯两类错误所要付出的代价。通常的做法是先确定3、若要同时减少 ,或给定而使减少,就必须增大样本容量 n 。 统计学中把(1-) 称为检验功效。(1-) 较高,意味着检验做得较好。给定的情况下,使最小或 (1-) 最大的检验叫做最佳检验。由于取伪错误的概率 是不确定的,一般情况下,尽量避免犯此错误。这也就解释了为什么我们通常会愿意将样本的信息(研究者想搜集证据予以支持的结论)设为备择假设,即通过拒绝 H0 来接受 H1 ,尽量避免直接以 错

11、误为代价接受H0 。五、双侧(双尾)检验与 单侧(单尾)检验假设研究的问题双侧检验左侧检验右侧检验H0m = m0m m0m m0H1m m0m m0双侧检验拒绝域与接受域抽样分布H0值临界值临界值a/2 a/2 样本统计量拒绝域拒绝域接受域1 - 置信水平左侧检验拒绝域抽样分布H0值临界值a样本统计量拒绝域接受域1 - 置信水平右侧检验拒绝域H0值临界值a样本统计量接受域抽样分布1 - 置信水平拒绝域总结:假设检验的步骤1、提出原假设和备择假设2、规定显著性水平3、确定适当的检验统计量并查表推算临 界值4、计算检验统计量的值5、与临界值对比,作出统计决策第二节 一个总体的检验大样本小样本大样

12、本均值一个总体比例方差Z 检验大样本(单尾和双尾) t 检验小样本(单尾和双尾)Z 检验大样本(单尾和双尾) 2检验(单尾和双尾)均值一个总体比例方差总体均值的检验大样本情形 1.假定条件:总体服从正态分布若不服从正态分布, 但满足(n 30)2、类型:双尾检验,左侧检验,右侧检验 3、使用z 统计量: (总体方差已知) (总体方差未知)均值的双尾 Z 检验【例1】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为= 0.025 。今换一种新机床进行加工,抽取n =200个零件进行检验,得到的椭圆度为0.076mm。试问新机床

13、加工零件的椭圆度的均值与以前有无显著差异?(0.05)解析:提出假设: H0: = 0.081 H1: 0.081给定显著性水平: = 0.05给定样本容量: n = 200查找临界值(Z):Z01.96-1.960.025拒绝 H0拒绝 H00.025决策:拒绝 H0 有证据表明新机床加工的零件的椭圆度与以前有显著差异结论: 检验统计量:练习1 某企业生产一种零件,过去的大量资料表明,零件的平均长度为4厘米,标准差为0.1厘米。改革工艺后,抽查了100个零件,测的样本平均长度为3.94厘米。问:工艺改革前后零件的长度是否发生了显著的变化?(显著性水平为0.01)均值的单尾 Z 检验左侧:H0

14、: 0 H1: 0必须显著地 大于 0,Z0拒绝 H0均值的单尾Z检验(左侧) (实例) 【例1】某批发商欲从生产厂家购进一批灯泡,根据合同规定,灯泡的使用寿命平均不能低于1000小时。已知灯泡使用寿命服从正态分布,标准差为200小时。在总体中随机抽取100只灯泡,测得样本均值为960小时。批发商是否应该购买这批灯泡? (0.05)计算结果:提出假设: H0: 1000 H1: 1020给定显著性水平: = 0.05给定样本容量: n = 16查找临界值(Z):Z0拒绝域0.051.645检验统计量: 在 = 0.05的水平上拒绝H0有证据表明这批灯泡的使用寿命有显著提高决策:结论: 【例2】

15、一个食品加工者关心500克的切片菠萝罐头是否装得太满。质量部门随机抽取了一个容量为50的随机样本,发现平均重量是510克,样本标准差是8克。试根据5%的显著性水平 检验切片菠萝罐头是否装得太满?拒绝域1.6450.05总体均值的检验小样本情形1.假定条件:总体为正态分布(总体方差未知), n 30如果不是正态分布, 只有轻微偏斜和小样本 (n 30)条件下2.使用t 统计量:双侧检验实例 【例】某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克。某日随机抽查9包,测得样本平均重量为986克,样本标准差为24克。试问在0.05的显著性水平上,能否认为这天自动包装

16、机工作正常?均值的双侧 t 检验 (计算结果)H0: = 1000H1: 1000 = 0.05df = 9 - 1 = 8临界值(t):检验统计量: 在 = 0.05的水平上接受H0有证据表明这天自动包装机工作正常决策:结论:t02.306-2.3060.025拒绝 H0拒绝 H00.025 练习1:某乡统计员报告,其乡平均每个农户的家庭年收入为5000元,为核实其说法,县统计局从该乡随机抽取25户,得到平均年收入为4650元,标准差为150元,假定农户的家庭年收入服从正态分布。试在5%的显著性水平 下检验乡统计员报告是否正确。单侧检验实例 【例】一个汽车轮胎制造商声称,某一等级的轮胎的平均

17、寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?( = 0.05)均值的单侧 t 检验 (计算结果)H0: 40000H1: 40000 = 0.05df = 20 - 1 = 19临界值(t): t=1.7291检验统计量: 在 = 0.05的水平上接受H0表明轮胎使用寿命并没有显著地大于40000公里决策: 结论: 练习1: 某厂生产的一种金属线,其抗拉强度的均值为10620千克。据说经过工艺改

18、进后其抗拉强度有所提高。为检验,从新生产的产品中随机抽取了10根,测得平均抗拉强度为10631千克,标准差为81千克,设抗拉强度服从正态分布,问:在 的显著性水平下,可否认为抗拉强度比过去提高了? 总体比例的检验大样本情形1.假定条件:有两类结果总体服从二项分布抽样分布为正态分布2.比例检验的 z 统计量: 为假设的总体比例一个总体比例的 Z 检验 (双侧实例) 【例】某研究者估计本市居民家庭的电脑拥有率为30%左右。现随机抽查了200的家庭,其中68个家庭拥有电脑。试问研究者的估计是否可信? ( = 0.05)一个样本比例的 Z 检验 (结果)H0: = 0.3H1: 0.3 = 0.05n

19、 = 200临界值(z):检验统计量:在 = 0.05的水平上接受H0有证据表明研究者的估计可信决策:结论:Z01.96-1.960.025拒绝 H0拒绝 H00.025 例题2: 某机构声称5年来各种新发行债券的承销价高于面值的比例没有超过50%。为检验此说法,随机抽选了60只新发行债券,其中有24只的承销价高于面值,试以 的显著性水平进行检验。一个总体比例的 Z 检验 (左侧实例) 例题3:某公司收购一塑料厂生产的防水手套,为了保证质量,允许次品率为10%,双方协议如下:每次收购时,抽样检验100副手套,规定犯第一类错误的概率为9%,当次品率超过临界值时,就要拒收。按此协议: 1、假设检验中如何建立原假设和备择假设 2、次品比例拒收的临界值是多少?一个总体比例的 Z 检验 (右侧实例) 3、若有6批产品,它们的样本的次品率分别为12%,25%,8%,16%,24%和21%,哪些批次应该拒收? 4、在这样的检验中,什么情况属于犯第二类错误?3、12%14% 8%14% 16%14% 24%14% 21%14% 拒收 4、当 10%,而接收时,属于犯第二类错误。补充: 第三节 假设检验中的其它问题一、区间估计与假设检验的关系 1、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论