第5章假设检验(讲稿)_第1页
第5章假设检验(讲稿)_第2页
第5章假设检验(讲稿)_第3页
第5章假设检验(讲稿)_第4页
第5章假设检验(讲稿)_第5页
已阅读5页,还剩136页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

STATISTICS统计学统计学原理统计学原理统计学原理第五章假设检验(HypothesisTesting)推断统计推断统计:研究如何利用样本数据来推断总体特征的统计方法内容参数估计假设检验(本章)相同之处都是利用样本信息对总体特征进行某种推断4.不同之处推断的角度不同总体样本开篇案例--正常人的平均体温是37oC吗?

开篇案例--正常人的平均体温是37oC吗?

根据样本数据计算的平均值是x=36.8oC,标准差为s=0.36oC根据参数估计方法得到的健康成年人平均体温的95%的置信区间为(36.7,36.9)。研究人员发现这个区间内并没有包括37oC因此提出“不应该再把37oC作为正常人体温的一个有任何特定意义的概念”我们应该放弃“正常人的平均体温是37oC”这个共识吗?本章的内容就将提供一套标准统计程序来检验这样的观点本章主要内容一、假设检验的基本原理二、总体均值的检验三、总体比例的检验四、假设检验的其它问题学习目标与要求理解假设检验的基本原理掌握假设检验的步骤掌握总体均值的检验掌握总体比例的检验一、假设检验的基本原理1、假设检验问题的提出---引例2、假设检验的基本思想3、假设检验的几个基本概念4、假设检验的临界值方法及其工作步骤5、假设检验的p值方法及其工作步骤6、假设检验中的两类错误(决策风险)1、假设检验问题的提出---引例假如你口渴了,到超市买了一瓶某公司生产的饮料,迫不急待一饮而尽,还渴!怎么一瓶这么少?仔细一看,饮料瓶的标签上标明容量为250毫升,标准差为4毫升。有这么多吗?俗话说,无商不奸。不行,我要亲自调查一下,看一看厂商是不是有欺骗行为。赶快动手,从市场上随机抽取50瓶,一瓶一瓶检测,发现其平均含量为248毫升。这50瓶的平均含量确实不到250毫升。那么,据此,到底可否断定饮料厂商欺骗了消费者?1、假设检验问题的提出---引例对出现上述样本平均含量低于厂商声称的平均含量的情况,分析原因,不外乎有两种:一是可能由饮料厂商短斤少两引起的,即饮料厂商存在欺诈行为。二是可能由抽样误差引起的,厂商没有缺斤少两。因为抽样具有随机性和波动性,即使厂商没有短斤少两,样本均值也可能低于总体参数值。那么,怎么确定到底是哪一种情况了?1、假设检验问题的提出---引例那么,我们不妨先假设厂商未欺诈(做无罪假设),即假设每瓶饮料含量≥250毫升。然后通过抽样去寻找是否与当前假设相悖的证据。由抽样分布理论可知,若该假设成立,又是大样本抽样,因此样本均值(抽取50瓶饮料的平均含量)的抽样分布服从均值(数学期望)为μ(总体均值),标准差为的正态分布。1、假设检验问题的提出---引例若μ≥250ml为真,大样本抽样,样本均值的抽样分布250X248在这种情况下,抽到均值为248的样本的概率是多大呢?如何认识这个小概率事件?也就是说,如果厂商未欺诈,即μ≥250ml为真,那么抽到均值为248的样本的概率为0.0002。1、假设检验问题的提出---引例0.0002这个数字意味着,假若我们反复抽取n=50的样本,在10000次的反复抽样中才有可能出现2次使样本均值等于或小于248毫升的样本。如此小概率的事件,在一次抽样中竟然发生了?你会怎么看待这个问题?能否断定饮料厂商欺骗了消费者?是看做厂商未欺骗,仅仅是由抽样的随机性引起的呢?还是认为厂商有欺骗行为,恐怕不是由抽样的随机性引起的?如何决策?运用假设检验的方法来进行决策。1、假设检验问题的提出---引例问题:某种大量生产的袋装食品,按规定每袋重量不得少于250g。今从一批该种食品中任意抽取50袋,发现有6袋低于250g。若规定不符合标准的比例达到5%,食品就不得出厂,问该批食品能否出厂。问题:某飞机制造厂经理拟购一批共计10000张的铝板,规定厚度为0.04寸(厚度过大将增加机身重量,过薄则影响应有的强度)。经检测100张铝板,其平均厚度为0.0408寸。这样,经理就面临着是否相信该批铝板的平均厚度与0.04寸无异的问题,从而面临接收或拒收这批铝板的两种对立行动的抉择。1、假设检验问题的提出---引例问题:某企业生产一种零件,以往的资料显示零件平均长度为4cm,标准差为0.1cm。工艺改革后,抽查100个零件发现其平均长度为3.94cm。问:工艺改革后零件长度是否发生了显著变化?问题:某厂有一日共生产了200件产品,按国家标准,次品率不得超过3%才能出厂。现从该批产品中随机抽取10件,发现其中有2件次品,问这批产品能否出厂。问题:正常人的平均体温是37oC吗?(教材案例)2、假设检验的基本思想假设检验的基本思想可以用小概率原理来解释。小概率原理:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但在多次重复试验中几乎是必然发生的。那么,概率小到多少的事件为小概率事件?这个概率是在假设检验之前由人们事先主观选定的,用α表示。α究竟取多大为宜,应视具体情况而定,通常取0.05、0.01或0.10。只要是小于或等于α的事件,称为小概率事件。2、假设检验的基本思想看前例:如果厂商未欺诈,即饮料平均含量μ≥250ml为真,那么抽到均值为248的样本的概率为0.0002。如此小概率的事件,在一次抽样中竟然发生了?你会怎么看待这个问题?能否断定饮料厂商欺骗了消费者?是看做厂商未欺骗,仅仅是由抽样的随机性引起的呢?还是认为厂商有欺骗行为,恐怕不是由抽样的随机性引起的?根据小概率原理,在假设为真,即认为厂商未欺骗时,纯粹由于抽样随机性而在一次抽样中“抽到均值为248的样本”这个事件几乎不发生,其发生的话,我们宁愿相信后者,即厂商欺骗了消费者。(这个决策有风险吗?)2、假设检验的基本思想这个决策是有风险的?也就是说可能会犯错误?因为,当假设为真,即厂商未欺骗时,由于抽样的随机性,尽管概率很小,也有可能抽到均值为248的样本,但是,实际处理时,根据小概率原理,我们不这样认为,而是认为厂商有欺骗行为。这样的话,我们在做“厂商有欺骗行为”这个决策时,就把“厂商未欺骗时,由于抽样的随机性,也有可能抽到均值为248的样本。”这样的情况拒绝了。(弃真错误)(犯这种错误的概率是多少呢?)2、假设检验的基本思想上述决策过程实际上就是一个假设检验过程,它相当于一个带有概率性质的反证法。再一例:有一厂家生产了10000只灯泡,并声称该批灯泡的次品率为万分之一,这批灯泡准备卖给某一商场,可商场从这批灯泡中任抽一只发觉是坏的,于是拒绝买下这批货物。商场拒买的理由是什么呢?2、假设检验的基本思想商场拒买的理由是:假设这批灯泡是好的(次品率为万分之一),那么“任抽一只是坏的”这样的随机事件发生的概率应是万分之一,这样小的概率在一次抽样中几乎不可能发生,而今任抽一只是坏的,这样的事件居然发生了,于是拒绝接受“该批灯泡次品率为万分之一”的假设(次品率可能很高),于是坚决拒买。或许有人要问,如果厂家的这批灯泡的次品率确实是万分之一,而恰好抽取的是那仅有的一只坏灯泡呢?3、假设检验的几个基本概念(1)什么是假设检验(2)什么是假设、原假设与备择假设(3)什么是检验统计量(4)什么是显著性水平(1)什么是假设检验所谓假设检验,就是事先对总体参数或总体分布形式提出某种假设,然后利用样本信息判断假设是否成立。假设检验分类①对总体参数(均值、比例、方差等)所作的假设进行检验称为参数假设检验,简称参数检验;②对总体分布形式的假设进行检验一般称为非参数检验或自由分布检验。我们只讨论总体参数的假设检验,即参数检验。(2)什么是假设、原假设与备择假设假设:对总体参数的数值所作的某种陈述。假设检验的首要工作就是从关于某一总体参数的理论、主张或断言开始的。假设检验中的假设必须同时给出两种陈述:一个是原假设(nullhypothesis),也叫零假设,一般用H0表示;一个是备择假设(alternativehypothesis),也叫研究假设、备选假设,一般用H1表示。(2)什么是假设、原假设与备择假设一般而言,原假设H0总是表示现状或无差别,同时也是研究者想收集证据予以反对的假设。备择假设H1是当原假设不成立时供选择的假设,是研究者想收集证据予以支持的假设。二者是一个完备事件组,而且相互对立,确定一个另外一个就出来了,通常可以先确定备择假设。P147(2)什么是假设、原假设与备择假设【例5.1】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设P146解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为

H0:

10cmH1:

10cm(2)什么是假设、原假设与备择假设【例5.2】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设。解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为

H0:

500H1:

<500(2)什么是假设、原假设与备择假设【例5.3】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%”。建立的原假设和备择假设为

H0:

30%H1:

30%(2)什么是假设、原假设与备择假设需要注意的是:原假设表达式中总是包含,或。这样才便于在原假设成立的假定下讨论检验统计量的分布。惯例是只写“=”。虽然依据前述定义,通常就能确定两个假设的内容,但是假设的确定本质上带有一定的主观色彩,由于研究者的目的不同,对同一个问题有可能会提出截然相反的原假设和备择假设。在一些应用中,如何建立原假设和备择假设并不是显而易见的。需谨慎应对并加强训练。(2)什么是假设、原假设与备择假设假设检验的目的主要是搜集证据拒绝原假设。原假设最初被假设是成立的,之后就是要根据样本数据,确定是否有足够的不符合原假设的证据以拒绝原假设。定罪问题:被告人在审判前被认为是无罪的(原假设被认为是真),审判中需要提供证据。如果有足够的证据与原假设(被告无罪)不符,则拒绝原假设(被告被认为有罪)。如果没有足够的证据证明被告有罪,就不能认定被告有罪(不拒绝原假设)。但这里也没有证明被告就是清白的。(2)什么是假设、原假设与备择假设假设检验得出的统计结论都是根据原假设进行阐述的。我们要么拒绝原假设,要么不拒绝原假设。当不能拒绝原假设时,从来不说“接受原假设”,因为没有证明原假设是真的(如果采用接受原假设的说法,则意味着你证明了原假设是正确的)。原假设在开始进行检验时被认定是真的,当我们没有足够的证据拒绝原假设时,并不等于证明原假设是真的,它仅仅意味着:我们没有足够的证据拒绝原假设,因此不能拒绝原假设。但是,当我们拒绝原假设时,得出的结论是清楚的。(2)什么是假设、原假设与备择假设另外,对原假设和备择假设而言,原假设往往处于受保护地位,根据小概率原理,在一次试验中,要想推翻原假设(拒绝原假设)是不容易发生的。因此,在确定假设时,往往把需要保护、没有充分理由不能轻易否定或者一经否定会产生重大影响的命题作为原假设。(你可以对其怀疑,但没有充分证据时,不能轻易推翻,总是被假定正确)(2)什么是假设、原假设与备择假设原假设和备择假设的三种形式(分别对应三种检验形式):

(1)双侧检验:

H0:0;H1:0

(2)左侧检验:

H0:0;H1:<0

H0:≥0;H1:<0

(3)右侧检验:

H0:0;H1:>0

H0:≤0;H1:>0

右侧检验和左侧检验统称为单侧检验。采用双侧检验还是单侧检验,应视所研究的问题的性质而定。

(2)什么是假设、原假设与备择假设对某型汽车,在一定条件下,其燃油效能为每升最多30公里,现开发了一种新型燃料喷射器,通过行车实验,想寻找证据来证明新的系统确实能提高每升油料的效能。一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上。检验这一结论是否成立。continued(2)什么是假设、原假设与备择假设某飞机制造厂经理拟购一批共计10000张的铝板,规定厚度为0.04寸(厚度过大将增加机身重量,过薄则影响应有的强度)。经检测100张铝板,其平均厚度为0.0408寸。这样,经理就面临着是否相信该批铝板的平均厚度与0.04寸无异的问题,从而面临接收或拒收这批铝板的两种对立行动的抉择。(2)什么是假设、原假设与备择假设一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。检验这一结论是否成立。某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上。如果你准备进一批货,怎样进行检验?(2)什么是假设、原假设与备择假设某企业生产一种零件,以往的资料显示零件平均长度为4cm,标准差为0.1cm。工艺改革后,抽查100个零件发现其平均长度为3.94cm。问:工艺改革后零件长度是否发生了显著变化?某厂有一日共生产了200件产品,按国家标准,次品率不得超过3%才能出厂。现从该批产品中随机抽取10件,发现其中有2件次品,问这批产品能否出厂。(3)什么是检验统计量在参数的假设检验中,如同在参数估计中一样,要借助于样本统计量进行统计推断。用于假设检验问题的样本统计量称为检验统计量。若μ≥250ml成立,大样本抽样,样本均值的抽样分布250X2482、假设检验的基本思想2500ZX248一般来说,检验统计量是样本统计量的标准化形式。(3)什么是检验统计量检验统计量的基本形式有Z统计量和t统计量。(3)什么是检验统计量在具体问题里,选择什么统计量作为检验统计量,需要考虑的因素与参数估计相同。例如,用于进行检验的样本是大样本还是小样本,总体方差已知还是未知,等等。在不同的条件下应选择不同的检验统计量,然后计算检验统计量的值。并通过这个值进行检验判断。(4)什么是显著性水平从假设检验所应用的小概率定理看,显著性水平就是研究者事先给定的一个小概率事件的概率。在原假设为真时,做实际抽样,通过检验统计量的值来确定该次抽样的结果在不在这个小概率范围内,在的话,就拒绝原假设,但这种判定是有风险的,有可能会犯错误,因为小概率事件不是绝对不可能出现,而是出现的可能性很小,这个可能性就是我们已经给定的小概率。也就是说,小概率事件发生时,原假设也能为真,但我们都给拒绝了,这样的话,势必就会犯错误,犯错误的概率就等于事先设定的小概率。(4)什么是显著性水平因此,显著性水平就是指当原假设为真时人们却把它拒绝了的概率或风险。表示为,常用的值有0.01,0.05,0.10。的选择与决策者的风险偏好有关。一般由研究者事先确定4、假设检验的临界值方法及其工作步骤所谓临界值方法,就是根据检验统计量的分布形式,找出显著性水平α对应的临界值,然后计算检验统计量之值,最后把二者之值相比较来判断是否拒绝原假设。看前面例子:假如某品牌饮料瓶的标签上标明的容量为250毫升,标准差为4毫升。(厂商声称是这么样的)如果你从市场上随机抽取50瓶,发现其平均含量为248毫升。据此,可否断定饮料厂商欺骗了消费者?(显著性水平α=0.01)。(用临界值法进行规范的假设检验分析)4、假设检验的临界值方法及其工作步骤0Z250X248临界值a=0.01-2.33检验统计量的值-3.54拒绝域1-接受域4、假设检验的临界值方法及其工作步骤从图形上看,运用这种方法时,也就是临界值把检验统计量的概率分布区域分成了两部分:不超过临界值的区域(大概率区域)和超过临界值的区域(小概率区域)。把不超过临界值的区域称为接受域,把超过临界值的区域(含临界值点)称为拒绝域。临界值:根据给定的显著性水平确定的拒绝域的边界值。拒绝域:能够拒绝原假设的检验统计量的所有可能取值的集合。(检验统计量的值落在拒绝域即相当于小概率事件发生了,从而拒绝原假设。)4、假设检验的临界值方法及其工作步骤检验统计量的值的绝对值3.54大于临界值的绝对值2.33,也就是说检验统计量的值落入了拒绝域,小概率事件发生了,因此在0.01的显著性水平上,拒绝原假设,接受备择假设,也就是说有证据显示饮料厂商欺骗了消费者。4、假设检验的临界值方法及其工作步骤

双侧检验时接受域与拒绝域示意图原假设为真时,检验统计量的抽样分布(假定为正态分布)0临界值临界值a/2a/2检验统计量Z拒绝域拒绝域1-接受域4、假设检验的临界值方法及其工作步骤左侧检验时接受域与拒绝域示意图0临界值检验统计量Z拒绝域1-接受域a显著性水平原假设为真时,检验统计量的抽样分布(假定为正态分布)4、假设检验的临界值方法及其工作步骤右侧检验时接受域与拒绝域示意图H0值临界值a显著性水平检验统计量Z拒绝域1-接受域原假设为真时,检验统计量的抽样分布(假定为正态分布)4、假设检验的临界值方法及其工作步骤临界值方法下的检验准则(如何判断检验统计量的值是否落在了拒绝域):(一定要记牢)若检验统计量之值的绝对值小于的绝对值,那么就不拒绝原假设;即,若︱检验统计量之值︱<︱临界值︱,不拒绝原假设若检验统计量之值的绝对值大于或等于临界值的绝对值,那么就拒绝原假设。即︱检验统计量之值︱≥︱临界值︱,拒绝原假设4、假设检验的临界值方法及其工作步骤再看前面例子:假如某品牌饮料瓶的标签上标明的容量为250毫升,标准差为4毫升。(厂商声称是这么样的)如果你从市场上随机抽取50瓶,发现其平均含量为248毫升。据此,可否断定饮料厂商欺骗了消费者?(显著性水平α=0.01)。(写出完整步骤)4、假设检验的临界值方法及其工作步骤解:(1)先写出零假设和备择假设:

H0:μ≥250;H1:μ<250

(2)确定适当的检验统计量:在零假设为真时,由于是大样本抽样,样本均值服从正态分布,总体标准差σ已知,因此选定的检验统计量为(3)规定显著性水平并确定临界值(区分拒绝域和接受域):α=0.01,由于是左侧检验,临界值为-2.33

(4)应用样本数据计算检验统计量的值:4、假设检验的临界值方法及其工作步骤

(5)比较检验统计量的值与临界值的大小,也就是确定检验统计量的值落入的区域并做出推断与结论。检验统计量的值的绝对值3.54大于临界值的绝对值2.33,也就是说检验统计量的值落入了拒绝域,小概率事件发生了,因此在0.01的显著性水平上,拒绝原假设,接受备择假设,也就是说有证据显示饮料厂商欺骗了消费者。4、假设检验的临界值方法及其工作步骤

图形表示检验统计量Z的分布0Z临界值a=0.01-2.33检验统计量的值-3.54拒绝域1-接受域4、假设检验的临界值方法及其工作步骤上述解题过程显示了运用临界值方法时,假设检验的工作步骤。即,①提出原假设和备择假设(关键步骤→涉及到是应用双侧检验还是单侧检验)②确定适当的检验统计量(关键步骤→涉及到如何确定临界值和检验统计量的值)③规定显著性水平并确定临界值(第一个需要确定的值)(区分拒绝域和接受域)④应用样本数据计算检验统计量的值(第二个需要确定的值)⑤比较检验统计量的值与临界值并作出推断和结论。5、假设检验的P值方法及其工作步骤P值检验法是另一种进行假设检验的方法。基本原理与前一种方法一样。看前面例子:假如某品牌饮料瓶的标签上标明的容量为250毫升,标准差为4毫升。(厂商声称是这么样的)如果你从市场上随机抽取50瓶,发现其平均含量为248毫升。据此,可否断定饮料厂商欺骗了消费者?(显著性水平α=0.01)。(用P值法进行假设检验分析)5、假设检验的P值方法及其工作步骤0Za=0.01-2.33-3.54拒绝域1-接受域0Za=0.01-2.33-3.54拒绝域1-接受域P值=0.00025、假设检验的P值方法及其工作步骤在P值法中,检验的基本准则是:(一定要牢记)如果P值≥给定的显著性水平α,则不拒绝原假设。如果P值<给定的显著性水平α,则拒绝零假设。P假设检验的工作步骤:①提出原假设和备择假设②确定适当的检验统计量③应用样本数据计算检验统计量的值④计算P值⑤将P值与给定的显著性水平α相比较,做出判断。5、假设检验的P值方法及其工作步骤解:(1)先写出零假设和备择假设:

H0:μ≥250;H1:μ<250

(2)确定适当的检验统计量:在零假设为真时,由于是大样本抽样,样本均值服从正态分布,总体标准差σ已知,因此选定的检验统计量为(3)应用样本数据计算检验统计量的值:5、假设检验的P值方法及其工作步骤

(5)将P值与给定的显著性水平α相比较,做出判断。由于0.0002<0.01,拒绝原假设,接受备择假设,也就是说有证据显示饮料厂商欺骗了消费者。(4)应用样本数据计算检验统计量的值5、假设检验的P值方法及其工作步骤双侧检验的P值原假设为真时,检验统计量的抽样分布(假定为正态分布)/

2/

2Z拒绝域拒绝域0临界值计算出的检验统计量值计算出的检验统计量值临界值1/2P值1/2P值P值是当原假设为真时,检验统计量大于或等于根据实际观测样本数据计算得到的检验统计量值绝对值的概率的两倍。5、假设检验的P值方法及其工作步骤左侧检验的P值0临界值az拒绝域1-计算出的检验统计量值P值原假设为真时,检验统计量的抽样分布(假定为正态分布)P值是当原假设为真时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率。5、假设检验的P值方法及其工作步骤左侧检验的P值0临界值a拒绝域1-计算出的检验统计量值P值Z原假设为真时,检验统计量的抽样分布(假定为正态分布)P值是当原假设为真时,检验统计量大于或等于根据实际观测样本数据计算得到的检验统计量值的概率。5、假设检验的P值方法及其工作步骤对P值法的进一步理解:P值也称为观察到的显著性水平,是实际算出来的显著性水平。利用P值进行检验能提供更多的信息。也可以直接使用P值进行决策。P值法的决策准则易记易用。但手工计算P比较麻烦。统计软件在分析时会输出P值。6、假设检验中的两类错误(决策风险)假设检验是依据样本提供的信息进行判断的,也就是由部分来推断整体,因而假设检验不可能绝对准确,它也可能犯错误。第一类错误是原假设H0为真却被我们拒绝了。犯第一类错误的概率就是显著性水平,用α表示。因此第一类错误也称α错误或弃真错误。第二类错误是原假设H0为假却被我们接受了。犯第II类错误的概率常用表示。因此第二类错误也称错误或取伪错误。这两类错误可以从假设检验所运用的小概率原理去理解。6、假设检验中的两类错误(决策风险)假设检验决策结果表决策实际情况H0为真H0为假没有拒绝H0正确决策(1–a)第二类错误(b)拒绝H0第一类错误(a)正确决策(1-b)6、假设检验中的两类错误(决策风险)α和β的关系对于一定的样本容量,你不能同时减少两类错误!和的关系就像翘翘板,小就大,大就小6、假设检验中的两类错误(决策风险)若要同时减少与,须增大样本容量n。但样本容量不可能没有限制,否则就会使抽样调查失去意义。因此,在假设检验中,就有一个对两类错误进行控制的问题。一般地说,哪一类错误所带来的后果越严重,危害越大,在假设检验中就应当把哪一类错误作为首要的控制目标。6、假设检验中的两类错误(决策风险)但在假设检验中,大家都在执行这样一个原则,即首先控制犯α错误原则,也就是说,在控制犯第一类错误的概率α的条件下,尽可能使犯第Ⅱ类错误的概率β减小。在假设检验实践中,该原则的含义是,原假设要受到保护,使它不致被轻易否定,若要否定原假设,必须有充分的理由。这样做的原因主要有两点,一是大家都遵循一个统一的原则,讨论问题就比较方便。二是从实用的观点看,原假设是什么常常是明确的,而备择假设是什么则常常是模糊的。6、假设检验中的两类错误(决策风险)假设检验中的两类错误也可以用法庭对被告进行审判的过程来说明。由于法庭采用无罪推定的审判准则,在证明被告有罪之前先假定他是无罪的,即原假设:被告无罪;备择假设:被告有罪。法庭可能犯的第Ⅰ类错误是:被告无罪但判他有罪,即冤枉了好人;第Ⅱ类错误是:被告有罪但判他无罪,即放过了坏人。为了减少冤枉好人的概率α,应尽可能接受原假设,判被告无罪,而这有可能增大了放过坏人的概率;反过来,为了不放过坏人,减少放过坏人的概率β,相应地就又增加了冤枉好人的可能性。当然,这只是在一定的证据下的两难选择。如果进一步收集有关的证据,在充分的证据下,就有可能做到既不冤枉好人,又不放过坏人。实践中,在现有证据不充分的情况下,法庭会如何控制这两类错误?(根据案件的性质)6、假设检验中的两类错误(决策风险)审判结果的几种情况陪审团审判裁决实际情况H0:无罪H1:有罪无罪正确错误有罪错误正确6、假设检验中的两类错误(决策风险)注意:如果样本数据与原假设一致,则我们得出“不能拒绝H0”而不是“接受H0”的结论,因为接受H0会发生第二类错误。二、总体均值的检验二、总体均值的检验主要涉及检验统计量的确定,其它方面:如检验形式(单侧和双侧)及检验的工作步骤基本都是一样的。主要根据样本容量的大小、总体分布形态、总体σ是否已知来确定检验统计量。检验统计量:Z检验统计量(1)大样本,总体σ已知检验统计量:Z检验统计量(2)大样本,总体σ未知式中:S为样本标准差。二、总体均值的检验该情况下也可以用t检验统计量。检验统计量:Z检验统计量(3)正态总体,小样本,总体σ已知检验统计量:t检验统计量(4)正态总体,小样本,总体σ未知式中:S为样本标准差。自由度为:n-1二、总体均值的检验二、总体均值的检验如果是小样本且非正态总体,则没有适当的检验统计量进行假设检验,唯一的解决办法是增大样本,以使样本均值趋向于正态分布,从而再采用Z检验统计量。二、总体均值的检验二、总体均值的检验三种检验形式:双侧检验0a/2a/2Z或t拒绝域拒绝域1-接受域左侧检验0a

Z或t拒绝域1-接受域二、总体均值的检验右侧检验0aZ或t拒绝域1-接受域二、总体均值的检验假设双侧检验左侧检验右侧检验假设形式H0

:m=m0H1:mm0H0:mm0H1:m<m0H0:m

m0H1:m>m0统计量

已知

未知拒绝域P值决策拒绝H0(大样本检验方法的总结)二、总体均值的检验(小样本检验方法的总结)二、总体均值的检验P158二、总体均值的检验二、总体均值的检验二、总体均值的检验二、总体均值的检验二、总体均值的检验二、总体均值的检验二、总体均值的检验二、总体均值的检验开篇案例:二、总体均值的检验解:

①提出零假设和备择假设

H0:μ=370C;H1:μ≠370C

②确定适当的检验统计量

③规定显著性水平并确定临界值(区分拒绝域和接受域)

α=0.05,双侧检验,α/2=0.025,临界值Zα/2=±1.96

④应用样本数据计算检验统计量的值

⑤比较检验统计量的值与临界值并作出推断和结论。

4>1.96,因此拒绝原假设,接受被择假设,有证据表明正常人的体温与370C显著不同。二、总体均值的检验例1:某企业生产一种零件,以往的资料显示零件平均长度为4cm,标准差为0.1cm。工艺改革后,抽查100个零件发现其平均长度为3.94cm。问:工艺改革后零件长度是否发生了显著变化?(α=0.05)哪一类型:大样本,总体σ已知使用哪一个检验统计量?二、总体均值的检验解:

①提出零假设和备择假设

H0:μ=4cm;H1:μ≠4cm

②确定适当的检验统计量

“Z检验统计量”

③规定显著性水平并确定临界值(区分拒绝域和接受域)

α=0.05,双侧检验,α/2=0.025,临界值Zα/2=±1.96

④应用样本数据计算检验统计量的值

⑤比较检验统计量的值与临界值并作出推断和结论。

-6<-1.96,因此拒绝原假设,接受被择假设,有证据表明工艺改革后零件长度发生了显著变化。二、总体均值的检验例2:某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。样本标准差为0.025试问新机床加工零件的椭圆度的均值与以前有无显著差异?(=0.05)哪一类型:大样本,总体σ未知使用哪一个检验统计量?二、总体均值的检验例3:某钢铁公司生产钢筋。如果生产过程运行正常,那么生产出来的钢筋的平均长度至少为28英尺,并且假定钢筋长度总体服从正态分布,标准差为0.20英尺。更长一点的钢筋仍可以使用或改动,但比这短的钢筋只能当做废料处理。从生产线抽取25根钢筋作为作为一个样本,样本的平均长度为2.73英尺。公司想知道生产设备是否需要调整?(α=0.05)哪一类型:正态总体,小样本,总体σ已知使用哪一个检验统计量?二、总体均值的检验例4:某企业从长期实践得知,其产品直径X服从正态分布N(15,0.22)。从某日产品中随机抽取10个,测得其直径分别为14.8,15.3,15.1,15.0,14.7,15.1,15.6,15.3,15.5,15.1(单位:厘米)。问在显著性水平=0.05时,该产品直径是否符合直径为15.0厘米的质量标准?例5:一家食品加工公司的质量管理部门规定,某种包装食品每包的净重不得少于20克。经验表明,重量近似服从标准差为1.5克的正态分布。假定一个由15包食品构成的随机样本产生的平均重量为19.5克,有无充分证据说明这些包装食品的平均重量减少了?二、总体均值的检验例6:一家经营小礼品的函购公司不管邮件的重量如何,均按统一价格来收邮费。这种政策是根据几年前的一项研究成果采取的。这项研究表明,邮件的平均重量为17.5克,标准差为3.6克。总邮费等于现行的每克邮费乘17.5。该公司管理部门认为,从长远的观点来看,公司甚至会由于邮费的损失而破产。但是,会计部门认为,目前邮件的平均重量可能已经不是17.5克,因而统一价格也许应当改变。于是,建议对这一假设进行检验。由于营业量已增长到如此之大,以致要像过去那样进行全面调查就太复杂了。于是,决定取100个邮件重量作随机样本,并根据样本的结果来作出决策。假定邮件重量近似服从正态分布。二、总体均值的检验例7:随着我国加入WTO,我国的企业面临着异常严重的挑战,汽车行业的形势尤为严峻。是挑战也是机遇,为了迎接挑战,国内汽车行业纷纷采取各种应对措施。A汽车集团公司对本公司的A1型号汽车的发动机系统进行了一系列改进,提高了启动速度,降低了噪音,改称为A2型。其中,公司关心的一个重要问题是汽车的节能性。节油是汽车的一个卖点,改进前的A1型汽车油耗较高,每百公里油耗为8.48升,公司希望改进后的车型比改进前节油,至少不比改进前更废油。二、总体均值的检验为此,随机抽取了15辆A2型汽车做试验,测得15辆汽车的每百公里耗油量的数据如下表:

15辆汽车每百公里耗油量(单位:升)8.508.758.338.218.528.308.318.198.408.868.418.018.208.268.39其平均数为8.377。对此数据,技术部经理认为可以肯定改进后的汽车更省油。二、总体均值的检验公司质量部经理对此结论有不同看法,他认为这个现象有可能是由抽样的随机性造成的,现在就下结论说改进后的汽车更省油还为时过早,应该对此问题作统计上的假设检验。质量部的张工程师刚通过国家质量工程师从业资格认证考试,学会了不少统计方法,质量部经理就派张工解决这个问题。通过简单的计算,很快张工就得到结论,他说,以现有的数据并不能认为改进前后汽车的油耗有明显变化。那么,张工是怎样作出他的统计分析结论的呢?二、总体均值的检验例8:根据美国高尔夫球协会的准则,只有射程和滚动距离平均不超过280码的高尔夫球可在比赛中使用。假定某公司最近开发了一种高技术生产方法,用这种方法生产的高尔夫球的射程和滚动距离平均为280码。现在抽取一个有36个高尔夫球的随机样本来检验该公司的陈述是否为真。数据如下表。(假定在显著性水平为0.05的条件下进行)。269301296275282276284272263300295265282263286260285264268288271260270293299293273278278279266269274277281291二、总体均值的检验例9:尼尔森调查公司报到了2004每个家庭观看电视的平均时间是每天7.25个小时假定尼尔森调查公司抽取了200个家庭的样本,样本标准差为2.5个小时。据报道,10年前,每个家庭观看电视的平均时间是每天6.7个小时。用μ表示在2004年每个家庭观看电视的平均小时数。检验下列假设(α=0.01):二、总体均值的检验例11:某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了150件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准?(=0.05)二、总体均值的检验例12:某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。例13:一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?(α=0.05)二、总体均值的检验例14:一家正在研究市场情况的公司对某居民区内的家庭每周花费在食品上的钱数感兴趣。该公司的一个分析员相信每户每周平均花费在食品上的钱数少于40元。一个由100个家庭组成的随机样本所给出的平均值为38元,标准差为10元。这些数据是否支持这个分析员的看法?三、总体比例的检验三、总体比例的检验总体比例假设检验的原理及步骤与总体均值假设检验的原理及步骤相同,不同之处主要在于检验统计量的构造和选择。如何构造检验统计量涉及到样本比例的抽样分布。根据前面所学知识,我们知道在大样本(即nπ≥5且n(1-π)≥5)情况下,p的抽样分布近似服从正态分布。否则,p服从二项分布)。三、总体比例的检验因此关于一个总体比例假设检验的统计量为:Z检验统计量其中:为假设的总体比例,p为样本比例三、总体比例的检验假设双侧检验左侧检验右侧检验假设形式H0:=0H1:0H0

:0H1:<0H0

:0H1:>0统计量拒绝域P值决策拒绝H0三、总体比例的检验三、总体比例的检验三、总体比例的检验三、总体比例的检验例:一项统计结果声称,某市老年人口(年龄在65岁以上)的比重为14.7%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为14.7%的看法?(=0.05)双侧检验什么检验形式?三、总体比例的检验H0:=14.7%H1:

14.7%=0.05n

=400临界值(s):检验统计量:在

=0.05的水平上不拒绝H0该市老年人口比重为14.7%决策:结论:Z01.96-1.96.025拒绝H0拒绝H0.025continued三、总体比例的检验例:在过去的一年内,某公司的生意有30%是赊账交易,70%是现金交易,最近一个含有100笔交易的样本显示有40笔是赊账交易,若取显著性水平为0.05,问该公司的赊账交易政策是否有所变化?例:某公司负责人发现开出去的发票有大量笔误,而且断定这些发票中,错误的发票占20%以上。随机检查400张,发现错误的发票占25%。这是否可以证明负责人的判断正确(显著性水平为0.05)?(双侧检验)(右侧检验)三、总体比例的检验例:某公司的董事长为了研究该公司雇员的安全记录,每年拨出15000元的经费用于安全教育和安全宣传。这家公司的会计认为有75%以上的同类公司每年花在安全教育和安全宣传上的经费超过15000元。当董事长请这个会计提出证据来支持他的看法时,该会计就以如下假设检验作回答。(右侧检验)三、总体比例的检验例:某企业的产品畅销国内市场。据以往调查,购买该产品的顾客有50%是30岁以上的男子。该企业负责人关心这个比例是否发生了变化,而无论是增加还是减少。于是,该企业委托了一家咨询机构进行调查,这家咨询机构从众多的购买者中随机抽选了400名进行调查,结果有210名为30岁以上的男子。该厂负责人希望在显著性水平0.05下检验“50%的顾客是30岁以上的男子”这个假设。(双侧检验)三、总体比例的检验例:某西红柿酱生产厂向供应商购一批西红柿,规定若优质西红柿的比例在40%及以上按一般市场价格收购,若达不到此标准,应低于市场价格收购,现随机抽取了100个西红柿作检验,只有34个优质西红柿,样本比例p=34%因而欲按低于市场价格收购,但供应商认为样本比例不到40%,是随机原因引起的,试用显著性水平a=0.05进行检验并加以说明。(左侧检验→下面深入分析)三、总体比例的检验因为西红柿中优质的比例愈高愈好,主要是把不够标准的检验出来,因此是一个单侧检验问题。其次是根据研究的目的来建立原假设和备择假设,通常是想加以证实的问题放在备择假设H1,因为这时犯错误的概率α是可以知道的。这个例子中供应商相当于生产者,而西红柿酱生产厂相当于消费者,生产方总是怕将合格品当作不合格品而被拒绝,因此要把产品显著低于标准才检验出来,把p<40%放在H1

。三、总体比例的检验例:某公司收到某企业发运来的一批产品,合同规定产品合格率不低于95%,该公司随机抽取11件进行检验,结果合格率91%。问在0.05的显著性水平下,该公司是否应该接收这批产品?例:从某地区人口有限总体中用简单随机放还的方式抽取一个4900人的样本,其中具有大学毕业文化程度的为60人。我们猜测,在该地区人口随机试验中任意一人具有大学毕业文化程度的概率是11‰。要求检验上述猜测。(α=0.05)(左侧检验)(双侧检验)四、假设检验的其它问题1、关于检验结果的解释2、单侧检验中假设的建立3、用置信区间进行检验1、关于检验结果的解释1、关于检验结果的解释1.对于显著性水平α的检验准则而言,如果出现拒绝H0的结果,我们可以说“结论H0为真出错的概率不超过α”。2.我们把假设检验中出现不能拒绝H0的结果解释为“在显著性水平α下没有发现充足的证据拒绝H0”,而不用“接受原假设H0”,因为我们无法证明原假设是真的。2、单侧检验中假设的建立2、单侧检验中假设的建立先看一个例子:某种灯泡的质量标准是平均燃烧寿命不得低于1000小时。已知灯泡批量产品的燃烧寿命服从正态分布,且标准差为100小时。商店欲从工厂进货,随机抽取81个灯泡检查,测得平均燃烧寿命为990小时,问商店是否决定购进这批灯泡?(

=0.05

)用两种不同的假设情况(H0:μ≥1000;H0:μ≤1000)做一做,你会发现什么问题?(第一种情况左侧检验临界值Zα=-1.645,第二种情况右侧检验临界值Zα=1.645;检验统计量值Z=-0.9)是不是两种情况下的推断相互矛盾?原因何在?2、单侧检验中假设的建立原因在于假设的背景不同。前者对生产方有利;后者对生产方不利。为什么?第一种情况是,商店相信该厂的质量一贯是不错的。原假设为H0:μ≥1000,这样的话达到质量标准的产品被拒收的概率就很低(α)。虽然,商店会面临接受不合格产品的风险,但厂家良好的历史记录显示这种情况的可能性很小。第二种情况是,历史记录表明,厂家的产品质量并不是很好。原假设H0:μ≤1000,这样做,表明商店要求有较强的证据(显著的进步)才能相信该批产品质量达到了标准。这样做,就达到了至少吧100(1-α)%的不合格产品据之门外的目的。continued2、单侧检验中假设的建立由此可见,同一个问题,由于对背景

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论