第五章参数估计与假设检验_第1页
第五章参数估计与假设检验_第2页
第五章参数估计与假设检验_第3页
第五章参数估计与假设检验_第4页
第五章参数估计与假设检验_第5页
已阅读5页,还剩100页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2023/2/41第五章参数估计与假设检验2023/2/42学习目标掌握估计量的优良标准参数区间估计的思想与方法参数假设检验的临界值法与P值法一定条件下,样本容量确定的方法2023/2/43重点与难点参数区间估计的统计思想估计的可靠程度、平均误差及极限误差的关系临界值检验法的统计思想P值的计算方法及其含义的理解参数抽样检验中的两类错误及其关系2023/2/44

第一节总体参数估计

一、点估计点估计的定义点估计量的优良标准二、区间估计区间估计的定义总体均值的区间估计三、样本容量的确定2023/2/45一、点估计参数估计按是否考虑估计误差的大小及发生的概率,估计方法分为点估计和区间估计两大类。(一)点估计的定义2023/2/46点估计就是根据总体参数与样本统计量之间的内在联系,直接用作为总体相应参数的估计量,用样本统计量的某个取值作为总体参数的估计值。点估计不考虑估计误差的大小,故不需确定估计量的概率分布。点估计的主要作用是寻找参数的估计量。点估计有很多具体方法,其中矩估计法、最大似然估计法是最经典的方法。矩估计法是用样本矩来估计总体矩的方法,如用样本一阶原点矩(样本均值)估计总体一阶原点矩(总体均值)。最大似然估计法是利用总体分布信息构造出似然函数,然后对似然函数求解,估计出总体参数的方法。2023/2/47(二)估计量的评价标准—无偏性

P(

)BA无偏有偏对于参数,若有估计量满足:,则称为的无偏估计量。2023/2/48

(二)估计量的评价标准—有效性若有,且,则

相对来说,是的有效估计量。

AB

的抽样分布的抽样分布P(

)2023/2/49

(二)估计量的评价标准—一致性当任意给定时,有即当时,依概率收敛于,则称为的一致估计量,具有一致性。对经常使用的点估计量来说,可以证明,它们分别是总体的无偏、有效且满足一致性要求的优良估计量。(一)区间估计的含义(二)总体均值的区间估计(三)总体成数的区间估计(四)总体方差的区间估计二、区间估计2023/2/411(一)区间估计的含义在概率意义下计算参数的变化范围,即区间估计中的两个基本要求:置信度:表明估计结果的可靠性,我们自然希望随机区间包含被估参数的概率越大越好,即随机区间的平均长度越长越好。精确度:表明估计结果的误差大小。我们自然希望包含被估计参数的随机区间的平均长度越短越好。(一)区间估计的含义2023/2/412Neyman原则即在保证置信度的前提下,尽可能提高估计的精确度。区间估计中的一些概念(对于)置信区间:置信限:显著性水平:置信水平:区间估计时应考虑的一些具体问题,在对总体均值进行区间估计时,常常需要考虑总体是否为正态总体、总体方差是否已知、用于构造估计量的样本是大样本(n≥30)还是小样本(n<30)等几种情况。正态总体、总体方差已知;或非正态总体、大样本条件正态总体、总体方差未知、小样本条件

(二)总体均值的区间估计2023/2/4141.正态总体、总体方差已知;或非正态总体、大样本条件当总体服从正态分布时(已知),来自该总体的所有容量为n的样本的均值也服从正态分布,的数学期望为,方差为,即

使用正态分布统计量z标准化

2023/2/415总体均值

在置信水平下的置信区间为

总体标准差未知时,可用样本标准差代替1.正态总体、总体方差已知;或非正态总体、大样本条件抽样平均误差抽样极限误差2023/2/4160临界值-z值a/2

a/2

统计量1-置信水平1.正态总体、总体方差已知;或非正态总体、大样本条件置信区间图解2023/2/41790%的样本-1.65+1.6599%的样本-2.58+2.58

95%的样本-1.96x+1.96xx1.正态总体、总体方差已知;或非正态总体、大样本条件样本均值分布图2023/2/418【例】某审计人员对一家货运公司8042张收款账单进行抽样,从而估计这批账单的平均账面金额,该审计人员随机抽取100份账单,得样本平均账面金额为500元,方差为100,给定显著性水平,检验这批账单的账面金额均值的置信区间。【解】已知,置信度,查标准正态分布表,得即有95%的把握认为区间(498.04,501.96)包含总体均值。1.正态总体、总体方差已知;或非正态总体、大样本条件2.正态总体、总体方差未知、小样本2023/2/419使用t分布统计量估计总体均值

总体均值在1-置信水平下的置信区间为重复抽样

不重复抽样2023/2/420【例】某时装专卖店的管理人员想估计其顾客的平均年龄,随机抽取了16位顾客进行调查,得到样本均值岁,样本标准差S=8岁。假定顾客的年龄近似服从正态分布,试求该店全部顾客平均年龄置信度为95%的置信区间。2.正态总体、总体方差未知、小样本2023/2/421【解】因为总体X近似服从正态分布,未知且n=16,为小样本,对进行区间估计须构造t统计量。根据,查t分布表得,故总体均值的95%的置信区间为:即有95%的把握估计顾客的平均年龄在(28,37)之中。2.正态总体、总体方差未知、小样本2023/2/422(三)总体成数的区间估计在大样本条件下(或大于等于5),有:

则可利用正态统计量估计总体成数的置信区间。版权所有BY统计学课程组(重复抽样)(不重复抽样)(重复抽样)2023/2/423(三)总体成数的区间估计总体比例在1-置信水平下的置信区间为:重复抽样时:不重复抽样时:版权所有BY统计学课程组2023/2/424(三)总体成数的区间估计【例】一所大学的保健医生想了解学生戴眼睛的成数,随机抽选100名学生,调查发现其中31名戴眼睛,试求全校学生戴眼镜成数的置信度为90%的置信区间。【解】已知,为大样本,由中心极限定理知:(三)总体成数的区间估计2023/2/425总体成数未知,样本方差P代替,根据,查标准正态概率分布表,得,则有即有90%的把握估计全校学生戴眼镜的成数在(23.4%,38.6%)之间。2023/2/426(四)总体方差的区间估计估计一个总体的方差或标准差假设总体服从正态分布总体方差的点估计量为,且总体方差在1-置信水平下的置信区间为版权所有BY统计学课程组2023/2/427总体方差的区间估计(图示)221-2总体方差1-的置信区间自由度为n-1的22023/2/428【例】假定A品牌25公斤袋装大米的重量服从正态分布。现随机抽取13袋大米,测得重量分别为24.0、24.2、24.4、24.6、24.7、24.8、25.0、25.1、25.1、25.2、25.3、25.4、25.6公斤,试以95%的置信度估计该品牌袋装大米重量的标准差。版权所有BY统计学课程组总体方差的区间估计(例题)2023/2/429【解】由于n-1=12,查自由度为12的分布表得:则有:由原始数据可计算得到,代入上式便有:

即以95%的置信度估计该品牌袋装大米重量的标准差在0.34-0.79公斤之间。或总体方差的区间估计(例题)2023/2/430(五)单侧置信区间在某些实际问题中,人们可能仅仅关心参数的下限或上限,就提出了单侧置信区间的问题。单侧置信区间就均值而言,有两种表示,即:;单侧置信区间就成数而言,有两种表示,即:;单侧置信区间就方差而言,有两种表示,即:;将双侧置信区间的上限与下限对应的分位值按或确定后,计算出下限或上限,即可获得单侧置信区间的估计。2023/2/431

(六)区间估计的基本步骤根据上述例子,区间估计的步骤可归纳为:依题意确定待估参数;依题设条件构造与待估参数相对应的估计量;确定估计量的抽样分布;依估计量的抽样分布,由给定的置信度计算待估参数置信区间的上、下限。2023/2/432三、样本容量的确定(一)问题的提出(二)处理问题的原则(三)样本容量确定的方法从推断来看,要达到估计所要求的精确程度,自然要求样本容量越大越好;从抽样来看,增大样本容量,势必增加人力、物力,从而导致调查成本增大,这无疑是不经济的做法。在抽样推断中,势必要在统计推断的精确度与调查成本这一对矛盾间进行权衡。(一)问题的提出2023/2/434(二)处理问题的原则从抽样角度来看,处理推断目标实现的精确度与调查成本间矛盾的原则是:在保证达到推断目标的要求下,尽量使调查成本最低。从推断角度来看,处理统计推断精确度与调查成本间矛盾的原则是:在调查成本一定的情况下,尽量使推断目标实现的效果好,即估计的精度更高。版权所有BY统计学课程组2023/2/435(三)样本容量的确定(简单随机抽样)在费用既定的条件下,从精度要求出发,考虑样本容量的大小。总体要求是,抽样极限误差不能超过给定的允许误差。样本容量的确定,根据抽样推断的目的不同,有估计总体均值与估计总体成数时的不同的估计公式。2023/2/4361、估计总体均值时,样本容量的确定抽样极限误差不能超过给定的允许误差的要求,在置信水平的条件下,有:由于

或,将其代入上式有:(重复抽样)(不重复抽样)【例】一家塑料公司想估计其产品的平均抗拉强度,要求以95%的置信度使估计值在真值附近1公斤/平方厘米的范围内。问该公司应抽多少个样品?经验表明,的估计值可取12.25。1、估计总体均值时,样本容量的确定2023/2/437【解】已知根据估计式有:

则该公司至少应抽取48个样品作试验。2023/2/438版权所有BY统计学课程组2023/2/4382、估计总体成数时,样本容量的确定抽样极限误差不能超过给定的允许误差的要求,在置信水平的条件下,有:由于或,将其代入上式有:

(不重复抽样)(重复抽样)

2、估计总体成数时,样本容量的确定【例】一家市场调查公司欲估计某地区有小汽车的家庭所占的比重。要求估计误差不超过0.05,置信度取95%,问应抽取多大容量的样本?公司调查人员认为实际的比重不可能大于20%。2023/2/439【解】由于,故有,即该市场调查公司应至少抽取246户。2023/2/440

第二节总体参数检验一、假设检验的一般性问题二、几种常用、具体的参数检验方法版权所有BY统计学课程组2023/2/441一、假设检验的一般性问题问题的提出解决问题的统计思想单、双侧检验问题统计结论的两类错误如何确定原假设与备择假设P值检验法统计检验的显著性假设检验的步骤2023/2/442

1、问题的提出在许多情况下,总体的分布形式可能是已知的,总体参数却是未知的,如果欲知道总体参数的取值状态,可对其进行参数估计;如果欲知道总体参数是否大于或小于某个假定或给定的值,如食品中农药残留物是否超过标准等类似问题,可运用假设检验的方法进行推断。实际上,假设检验是从另外一个角度对总体参数进行估计。2023/2/4432.假设的建立所谓假设,就是对总体参数的具体数值所作的陈述。假设检验就是运用样本信息判断假设是否成立的过程。假设检验中需要建立原假设和备择假设。原假设通常是研究者想搜集证据予以反对的假设,也称零假设,用表示。备择假设通常是研究者想搜集证据予以支持的假设,也称研究假设或替换假设、对立假设,用表示。2023/2/4442.假设的建立原假设与备择假设是对立的。在假设的命题中,需要使用数学关系符号“=,≠,≥,≤,>,<”。规定:=,≥或≤用在原假设上;≠,>或<用在备择假设上。示例:2023/2/4452.假设的建立【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设。【解】:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为

H0:

10cmH1:

10cm2023/2/4462.假设的建立【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设。【解】:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为

H0:

500H1:

<5002.假设的建立【例】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设。【解】研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%”。建立的原假设和备择假设为:

2023/2/4483.假设检验的基本思想根据样本信息对参数进行检验,采用的是一种判断的方法。以正态总体的参数为例,若要判断其是否等于某个给定的值,直观的想法就是:首先依样本构造出一个能反映总体参数的统计量。通过第四章有关内容的论述,我们知道,合适的统计量为样本均值。由于我们对总体的情况并不了解,所以实际上可能是下列三种情况之一:显然,在每一种情况下,样本均值的分布都不同,现把的分布分别记为,如图5.5所示:2023/2/449如此一来,对μ的检验问题就转化为:要根据样本信息来判断样本均值究竟来自图5.5中的哪一个分布进而才能确定μ是多少。3.假设检验的基本思想图5.5样本均值分布示意图3.假设检验的基本思想2023/2/450版权所有BY统计学课程组样本均值为一随机变量,取值于整个横轴,故它来自图5.5中任一分

布的可能性都是存在的。不难理解,可能性大小需用概率来描述,即要计算来自某分布的概率。

问题是:来自于哪一个分布的概率必须在确定的分布下才能计算。如

此,既然是问:是否等于某个给定值,那么,不妨就假设等于

该给定值,当这一假设成立时,用参数区间估计法,易计算出样本均

值在一定概率下的可能范围,即有2023/2/451版权所有BY统计学课程组从而:,如图5.5中的区间如果样本均值落在这个区间,则承认原来的假设是可以接受的,即等于给定值;反之,样本均值落在区间之外,则否定这个假设,即认为大于或小于。此例中,我们之所以接受原假设,是因为样本均值落在区间内的概率为(1-α),有充分地把握;如果样本均值落在区间外,则拒绝原假设,这是因为样本

均值落在区间外的概率α小,无充分的理由接受原假设。3.假设检验的基本思想2023/2/452我们将以很大的概率落在的区间称为原假设

显著性水平为的接受域;将以很小的概率落在的区间称为原假设显著性水平为的拒绝域;拒绝域与接受域之间临界点根据估计量的分布特征、给定的显著性水平、检验的类型查表获得。通过比较检验统计量的值与原假设临界值之间的大小,进而对原假设H0作决策的假设检验方法称为临界值检验法。3.假设检验的基本思想2023/2/4530临界值临界值a/2a/2样本统计量拒绝H0拒绝H0置信水平3.假设检验的基本思想临界值检验法示意图(以双侧检验为例)2023/2/454上述的判断实际上体现着反证法的思想。判断的基础是样本信息,判断的理论依据是小概率原理,即小概率事件在一次试验(或抽样)中几乎不发生。直观来想,在所做假设是正确的情况下,那么一次试验(或抽样)中人们期望的结果出现的概率应该较大。然而现在的事实却不是这样的,期望的结果出现的概率不仅不大,反而很小,即所谓的小概率事件居然发生了,这就很不正常了,意味着一次试验(或抽样)中出现了出人意料的结果,也意味着给了我们做出否定原假设的充分证据。可见假设检验的思想是从不利于原假设的角度来对原假设做决策的。3.假设检验的基本思想2023/2/455因此,当我们拒绝原假设时,并不意味着原假设一定是错误的,只是说概率意义下接受原假设的理由很不充分,而否定原假设的证据却非常强。这与数学家“证明”某个结论的方式不同,而有点儿类似于法院里法官的判案方式。并且只要小概率α不等于零,对原假设做决策就可能错判,存在做出错误选择的风险。3.假设检验的基本思想2023/2/4564.单、双侧检验问题备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailedtest)

备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验(one-tailedtest)备择假设的方向为“<”,称为左侧检验

备择假设的方向为“>”,称为右侧检验

2023/2/457双侧检验与单侧检验的假设形式

假设双侧检验单侧检验左侧检验右侧检验原假设H0:μ

=μ0H0:μ

μ0H0:μ

μ0备择假设H1:μ

≠μ0H1:

μ<μ0H1:μ>μ0注:研究者感兴趣的是备择假设,单侧假设的方向是按备择假设的方向来说的。2023/2/4585.统计结论的两类错误第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设第Ⅰ类错误的概率记为,被称为显著性水平第Ⅱ类错误(纳伪错误)原假设为假时未拒绝原假设第Ⅱ类错误的概率记为2023/2/459假设检验中的两类错误的决策结果陪审团审判H0检验裁决实际情况决策实际情况无罪有罪H0为真H0为假无罪正确错误未拒绝H0正确决策第Ⅱ类错误(β

)有罪错误正确拒绝H0第Ⅰ类错误(α)正确决策2023/2/460

错误和错误的关系同时减少两类错误惟一办法增加样本容量!和的关系就像翘翘板,小就大,大就小2023/2/461

5.统计结论的两类错误

两类错误的关系当其他条件不变时,α大则β小;反之,α小必导致β大。换句话说,在其他条件不变的情况下,要同时减小犯两类错误的概率是不可能的。在规定的显著性α下,单侧检验犯第二类错误的可能性小于双侧检验。故统计检验中,凡能进行单侧检验时就不做双侧检验,以便控制β。其他情况不变时,增加样本容量n,β值将有效地的减小。其他情况不变,假设下的μ0与μ1之间的距离将直接影响β值。版权所有BY统计学课程组2023/2/462

5.统计结论的两类错误两类错误的控制原则通过以上分析,我们应该在合适的α及β的要求下进行统计检验。通常α值控制在1%-5%之间,β值多控制在10%-30%之间。统计学家Neyman和Pearson提出的原则是:版权所有BY统计学课程组2023/2/4635.统计结论的两类错误在控制犯第一类错误的概率α的条件下,使犯第二类错误的概率β尽量减小,其含义是:原假设要受到维护,使它不至于轻易被否定(因为假设检验时从不利于原假设的角度来对原假设作决策的);若检验结果否定了原假设,则说明否定的理由是充分的;同时,犯第一类错误的概率α受到控制,亦即作出否定判断的可靠程度(1-α)得到了保证。版权所有BY统计学课程组2023/2/4645.统计结论的两类错误版权所有BY统计学课程组本书中的假设检验问题只对犯第一类错误的概率α加以限制,而不考虑犯第二类错误的概率β,这种方式的假设检验又称为显著性检验,犯第一类错误的概率α称为显著性水平,其取值通常需考虑:对原假设的信心,以及对原假设作出决策后可能造成的损失,实际运用中,α通常取一些标准化的值,如:0.01、0.05、0.10等。2023/2/465

6.P值检验法(概率值检验法)在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率双侧检验为分布中两侧面积的总和反映实际观测到的数据与原假设之间不一致的程度被称为观察到的(或实测的)显著性水平决策规则:若p值<,拒绝版权所有BY统计学课程组6.P值检验法/

2/

2Z拒绝H0拒绝H00临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值双侧检验的P值662023/2/42023/2/467

0临界值a样本统计量拒绝H0左侧检验的P值置信水平计算出的样本统计量P值6.P值检验法2023/2/4680临界值a拒绝H0右侧检验的P值1-置信水平计算出的样本统计量P值6.P值检验法2023/2/469

6.P值检验法P值拒绝H0的力度一般认为P值的大小与拒绝H0的力度有如下的关系:如果P值小于:(1)0.10,有微弱的证据表明H0是应拒绝的;(2)0.05,有显著的证据表明H0是应拒绝的;(3)0.01,有很强的证据表明H0是应拒绝的;(4)0.001,有极强的证据表明H0是应拒绝的。当P值小于事先设定的显著性水平α时,就会认为概率如此小的事件居然发生了,很可能是原假设有问题,就应该拒绝原假设;否则,就只能接受原假设。版权所有BY统计学课程组2023/2/470

6.P值检验法P值检验法的决策规则为:若P值≤α,则拒绝H0,接受H1;若P值>α,则接受H0,拒绝H1。

版权所有BY统计学课程组2023/2/471

7.统计检验的显著性“显著”一词的一般意思不是“重要的”,而是“非偶然”;但在同级检验中,该词的意思是“只靠抽样的随机性不容易出现这样的结果”,其中的“不容易”用显著性水平来具体描述,可见显著性水平是用来评估检验结果的显著性的,拒绝原假设,意指检验结果是显著的;接受原假设,意指检验结果是不显著的。版权所有BY统计学课程组2023/2/472显著性水平和拒绝域(双侧检验)0临界值临界值a/2a/2

样本统计量拒绝H0拒绝H01-置信水平H0:μ=μ0,H1:μ≠μ02023/2/473显著性水平和拒绝域(左侧检验)

0临界值a样本统计量拒绝H01-置信水平H0:m

m0,H1:m

<m02023/2/474显著性水平和拒绝域(右侧检验)

0临界值a样本统计量拒绝H01-置信水平H0:m

m0,H1:m

>m02023/2/475

8.假设检验的步骤根据实际情况,建立原假设H0和备择假设H1;根据备择假设H1的设定情况,确定检验时单侧检验还是双侧检验;确定样本量和显著性水平的大小;选择一个合适的统计量做检验量,要求有两个:一是与原假设H0有关;二是能确定其抽样分布;根据给定的显著性水平α,在原假设H0成立时,通过查表得到H0的临界值,给出H0的拒绝域;8.假设检验的步骤抽取样本,收集数据,并依样本观察值计算检验量w的值(用w’表示);根据w’计算原假设H0的P值;作出是否拒绝H0的决策。如果是用临界值法进行检验,则不需要做第(7)步的工作,接受或拒绝原假设的规则是:若w’落入H0的拒绝域内,则拒绝H0。如果用P值法,则不需要做第(5)步的工作,接受或拒绝原假设的规则是:若P值小于认定的显著性水平,则拒绝原假设。762023/2/42023/2/477

二、几种常用的参数检验方法版权所有BY统计学课程组统计上假设检验的方法很多,若按检验量服从的分布来划分,最基本的检验方法有四种,即Z检验(或U检验)、t检验法、检验法和F检验法。考虑到手工计算P值的麻烦,以及绝大部分统计软件在输出检验结果时都有P值,故这里主要介绍临界值检验法。2023/2/478(一)Z检验法Z检验法是指以服从正态分布的统计量构造检验统计量的检验方法。主要应用场合:已知总体分布的方差时,对一个正态总体的均值或两个正态总体均值的关系(均值之差)进行检验。大样本下(n>50)只有轻微偏斜的非正态总体均值和成数检验。大样本下未知总体方差时的均值和成数检验。版权所有BY统计学课程组2023/2/479假设形式:所构造的检验量为:1.一个正态总体均值的检验应用条件:正态总体,方差已知;或大样本下的非正态总体;或大样本下方差未知的正态总体2023/2/480版权所有BY统计学课程组【例5.7】完成生产线上某件工作的平均时间不少于15.5分钟,标准差为3分钟。随机抽选的9名职工讲授一中心方法,训练期结束后这9名职工完成此项工作的平均时间为13.5分钟。这个结果是否说明用新方法所需时间比用老方法所需时间短?设α=0.05,并假定完成这项工作的时间服从正态分布。1.一个正态总体均值的检验1.一个正态总体均值的检验2023/2/481【解】根题意,要检验的假设为:H0:μ≥15.5,H1:μ<15.5由于总体服从正态分布且总体方差已知,所以选取检验统计量检验统计量的值为:

查表得Z0.05=1.65,由于Z<-Z0.05,所以拒绝原假设H0,说明用新方法所需时间明显较短。2023/2/482假设形式:构造检验统计量2.两个正态总体均值之差的检验应用条件:两个正态总体,方差已知2023/2/483版权所有BY统计学课程组【例5.8】有两种方法可用于制造某种产品。经验表明,这两种方法生产的产品的抗拉强度都近似服从正态分布。方法1和方法2给出的标准差分别为3公斤和4公斤。从方法1和方法2生产的产品分别随机抽取10个和14个,所得样本均值分别为20公斤和17公斤。试问,这种方法生产的产品的平均抗拉强度是否不同(α=0.05)?

2.两个正态总体均值之差的检验2.两个正态总体均值之差的检验2023/2/484【解】按题意,建立假设:H0:μ1=μ2,H1:μ1≠μ2由于两个总体都近似服从正态分布,且总体方差已知,所以选取检验统计量:其观测值为:查表得Z0.025=1.96,由于Z>Z0.025,所以拒绝原假设H0,即认为这两种方法不能生产出抗拉强度相同的产品。2023/2/485假设形式构造的检验统计量:3.大样本下总体成数的检验应用条件:总体服从二项分布,大样本3.大样本下总体成数的检验【例5.9】某公司负责人发现开出去的发票有大量笔误,而且断定这些发票中,错误的发票占20%以上。随机抽取400张检查,发现错误的发票有100张,即占25%,这是否可以证明负责人的判断正确(α=0.05)?

3.大样本下总体成数的检验2023/2/487【解】按题意建立假设:选取检验统计量为:其观测值为:查表得Z0.05=1.65,由于Z>Z0.05,所以拒绝H0,也即认为这些数据可以证明负责人的判断是正确的。2023/2/488(二)t检验法t检验法是在未知总体方差而且小样本时,对一个正态总体的均值或两个正态总体均值的关系(均值之差)进行检验的方法。2023/2/489假设形式:所构造的检验量1.一个正态总体均值的检验应用条件:正态总体,方差未知,小样本2023/2/490【例5.10】某汽车轮胎厂声称,该厂一等品轮胎的平均寿命在一定的重量和正常行驶条件下,高于25000公里的国家标准。厂家对一个由15个轮胎组成的随机样本进行试验,得到的平均值和标准差分别为27000公里和5000公里。假定轮胎寿命近似服从正态分布,试问可否相信产品质量同厂家所说的情况相符?(α=0.05)1.一个正态总体均值的检验1.一个正态总体均值的检验2023/2/491【解】依题意,建立假设H0:μ≤25000,H1:μ>25000由于总体近似服从正态分布,总体方差未知,且为小样本;所以选取检验统计量:其观测值为:查自由度为(n-1)=14的t分布表得t0.05(14)=1.7613,由于t<t0.05(14),所以只能接受H0。2.两个正态总体均值之差的检验应用条件:两个总体均为正态总体,方差未知但相等,两个小样本2023/2/492假设形式

所构造的检验量2.两个正态总体均值之差的检验2023/2/493【例5.11】有甲、乙两台机床加工同样的产品。从它们所生产的产品中分别抽取8件和6件。,假定两个总体都服从正态分布,且方差相等,试问甲、乙两台机床加工的产品平均直径有无显著差异?(α=0.05)2.两个正态总体均值之差的检验2023/2/494【解】按题意建立假设:H0:μ1=μ2,H1:μ1≠μ2根据题意,选取检验统计量其观测值为:查t分布表得t0.025(12)=2.1788。由于t<t0.025(12),所以接受H0,即甲、乙两台机床加工的产品平均直径无显著差异。2023/2/495

Z检验法与t检验法的总结综上所述:Z检验法与t检验法都针对均值进行检验。正态分布总体下,已知总体方差时用Z检验法;未知总体方差且小样本时用t检验法;非正态分布总体但大样本下的均值或成数检验用Z检

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论