参数估计与假设检验_第1页
参数估计与假设检验_第2页
参数估计与假设检验_第3页
参数估计与假设检验_第4页
参数估计与假设检验_第5页
已阅读5页,还剩114页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章参数估计与假设检验样本总体样本统计量如:样本均值、比例、方差总体均值、比例、方差等2/1/20231统计推断(Statisticalinference)

统计推断就是根据随机样本的实际数据,对总体的数量特征作出具有一定可靠程度的估计和判断。统计推断的基本内容有参数估计和假设检验两方面。概括地说,研究一个随机变量,推断它具有什么样的数量特征,按什么样的模式来变动,这属于估计理论的内容,而推测这些随机变量的数量特征和变动模式是否符合我们事先所作的假设,这属于检验理论的内容。参数估计和假设检验的共同点是它们都对总体无知或不很了解,都是利用样本观察值所提供的信息,对总体的数量特征作出估计和判断,但两者所要解决问题的着重点及所用方法有所不同。█2/1/20232主要内容5.1

参数估计的一般问题

5.2一个总体参数的区间估计5.3必要抽样数目的确定5.4假设检验的基本问题5.5一个总体参数的假设检验2/1/202335.1参数估计的一般问题

5.1.1参数估计的含义5.1.2估计量与估计值5.1.3点估计与区间估计5.1.4评价估计量的标准2/1/20234所谓参数估计,就是以样本统计量(即样本数字特征)来估计未知的总体参数(或参数的函数)。实际工作中一般首先进行概率抽样得到随机样本,然后通过对样本单位的实际观察取得样本数据,最后计算样本统计量的取值对未知的总体参数进行估计。5.1.1参数估计的含义1、什么是参数估计2/1/202352、参数估计的特点和逻辑思想(1)以随机样本为基础;(2)以分布理论为依据;(3)推断的只是一种可能的结果;(4)是归纳推理和演绎推理的结合。

归纳推理

从样本总体

大前提小前提(分布规律)(样本信息)结果演绎推理5.1.1参数估计的含义2/1/202363、参数估计的主要问题(1)如何得到总体参数的估计值?(解决估计方法问题)(2)如何在保证样本对总体具有充分代表性的前提下,使样本的调查成本最低?(解决样本容量问题)5.1.1参数估计的含义2/1/20237

1)估计量:用于估计总体参数的统计量如样本均值,样本比例、样本方差等例如:样本均值就是总体均值的一个估计量

2)参数用表示,估计量用表示

3)估计值:估计参数时计算出来的估计量的具体数值如果样本均值x=80,则80就是的估计值1、什么是估计量与估计值

(estimator&estimatedvalue)5.1.2估计量与估计值2/1/202382、统计估计的基本过程

1)首先对所要研究的总体进行概率抽样,通过随机样本获取相关统计量,然后利用这些统计量与总体参数之间的联系(获得统计量的分布),利用有关统计方法计算估计量,估计总体参数。

2)由此可以看出,统计量与总体参数、估计量的不同:总体参数通常是未知的常数,是待估计的量;统计量是根据样本计算的函数,通常是随机变量(对于总体而言);估计量是用来对总体参数进行估计的统计量。5.1.2估计量与估计值2/1/202391、参数估计的方法矩估计法最小二乘法最大似然法顺序统计量法估计方法点估计区间估计5.1.3点估计量与区间估计2/1/2023102、点估计(pointestimate)用样本统计量的某个取值直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计例如:用两个样本均值之差直接作为总体均值之差的估计2) 没有给出估计值接近总体参数程度的信息点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等5.1.3点估计量与区间估计2/1/2023113、区间估计(intervalestimate)

(1)有关概念点估计是通过样本估计量的某一次估计值来推断总体参数的可能取值;区间估计则是根据样本估计量以一定的可靠程度推断总体参数所在的区间范围。人们在得到点估计值的同时,自然希望知道与到底相差多少?这就引出了区间估计问题。即希望对的取值估计出一个范围,并希望知道这个范围包含的可靠程度。即P{}=1-

其中[]是置信区间;是置信区间下、上限;1-

是置信水平、置信度或置信系数;是估计不准的概率,通常取=0.05,或0.01。由上式可知,要想求出被估计参数的置信区间,必须找到一个和被估计参数相关联的统计量,并知其概率分布。5.1.3点估计量与区间估计2/1/202312

(2)置信区间的构造

当总体服从正态分布N(μ,σ2)时(σ2已知),来自该总体的所有容量为n的样本的均值x也服从正态分布,x

的数学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)

0临界值-z值a/2a/2

统计量1-置信水平5.1.3点估计量与区间估计3、区间估计2/1/202313(3)区间估计的图示x95%的样本-1.96x+1.96x99%的样本-2.58x+2.58x90%的样本-1.65x+1.65x5.1.3点估计量与区间估计3、区间估计2/1/202314

2)

1-

可以认为是用样本估计值代替总体真值时误差在某一范围内的“可能性”,则可认为是用代替时误差超过这一范围的“可能性”。

3)用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值。我们只能希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个。总体参数以一定的概率落在这一区间的表述是错误的。

1)置信区间的直观意义为:n次抽样形成的n个置信区间中,有n(1-)

个区间包含总体参数真值。5.1.3点估计量与区间估计3、区间估计注意:(3)区间估计的图示2/1/202315

5.1.3点估计量与区间估计3、区间估计(3)区间估计的图示2/1/202316(4)影响区间宽度的因素1. 总体数据的离散程度,用来测度样本容量n置信水平(1-),影响

z/2的大小抽样方法抽样的组织方式5.1.3点估计量与区间估计3、区间估计2/1/202317置信区间与置信水平(1-)的关系70%80%90%95%99%置信区间宽度5.1.3点估计量与区间估计3、区间估计(4)影响区间宽度的因素Neyman原则:即在保证置信度的前提下,尽可能提高估计的精确度。2/1/2023181、点估计以样本指标直接估计总体参数。评价准则的数学期望等于总体参数,即该估计量称为无偏估计。无偏性有效性当为的无偏估计时,方差越小,无偏估计越有效。一致性对于无限总体,如果对任意,则称的一致估计。是充分性估计量如能包含样本中关于未知参数的全部信息,即为充分量。估计量5.1.4评价估计量的标准2/1/2023192、区间估计估计未知参数所在的可能区间。评价准则随机区间置信度精确度随机区间包含(即可靠程度)越大越好。的概率的平均长度(误差范围)越小越好。5.1.4评价估计量的标准█2/1/202320

5.2一个总体参数的区间估计

5.2.1一个总体均值的区间估计5.2.2一个总体比例的区间估计5.2.3一个总体方差的区间估计2/1/2023211、有关符号总体参数样本统计量均值比例方差5.2.1一个总体均值的区间估计2/1/202322(1)总体服从正态分布,且方差(2)

已知;或者总体不是正态分布但大样本(n30)时总体均值的区间估计该条件下使用标准正态分布统计量z下面通过标准正态分布构造总体均值的置信区间5.2.1一个总体均值的区间估计2、一个总体均值的置信区间2/1/202323给定置信度1-,可由标准正态分布表查得临界值Z/2,使得从而可得置信度为1-时总体均值的置信区间:

在大样本(n≥30)条件下,不论总体分布形式如何,均可用上述方法进行总体均值的区间估计。如果总体方差未知,则直接用样本方差代替。

▼注意:5.2.1一个总体均值的区间估计2/1/202324

(2)小样本下总体方差未知时,正态分布总体均值的区间估计

如果是小样本,但总体为正态分布,在总体方差未知而需用样本方差代替时,则下式服从自由度为n-1的t分布。5.2.1一个总体均值的区间估计2、一个总体均值的置信区间2/1/202325

▼注意:如果小样本下总体分布非正态,则无法进行区间估计,唯一的解决方法就是增大样本。从而可得置信度为1-时总体均值的置信区间:

于是,给定置信度为1-,可由t分布表查得临界值t/2(n-1),使得5.2.1一个总体均值的区间估计2/1/202326指在一定的置信水平下,抽样误差不允许超过的最大给定范围,也称作允许误差、误差范围等。5.2.1一个总体均值的区间估计3、极限误差(允许误差)(1)含义(大样本条件下)(2)极限误差的计算公式样本平均数的极限误差:①边际误差样本成数的极限误差:②2/1/202327

Z与相应的置信水平存在一一对应关系,常用的置信水平及相应的Z值如下:

z值置信水平

1.000.68271.650.90001.960.95002.000.95452.580.99003.000.99735.2.1一个总体均值的区间估计3、极限误差2/1/202328计算样本统计量确定样本统计量分布由置信水平求临界值确定置信区间4、区间估计步骤(以大样本下估计为例)其中:5.2.1一个总体均值的区间估计2/1/202329【例】某企业生产某种产品的工人有1000人,某日采用不重复抽样从中随机抽取100人调查他们的当日产量(数据见下张幻灯片),要求在95﹪的置信水平下,估计该厂全部工人的日平均产量和日总产量的置信区间。5.2.1一个总体均值的区间估计5、例题分析2/1/202330按日产量分组(件)工人数(人)组中值(件)110~114114~118118~122122~126126~130130~134134~138138~14237182321186411211612012412813213614033681221602852268823768165605887006489284648600784合计100—126004144100名工人的日产量分组资料5.2.1一个总体均值的区间估计5、例题分析2/1/2023315.2.1一个总体均值的区间估计5、例题分析2/1/202332即在95﹪置信水平下,该企业工人人均产量在124.80至127.20件之间,其日总产量在124797至127303件之间。则该厂全部工人日平均产量和日总产量的置信区间分别为5.2.1一个总体均值的区间估计5、例题分析2/1/202333例:由532名《商业周刊》订阅者组成的样本表明,其每周使用因特网的平均时间为6.7小时。如果总体标准差为5.8小时,求该周刊订阅者总体每周平均花费在因特网上时间的95%置信区间。则该置信区间为:5.2.1一个总体均值的区间估计5、例题分析2/1/2023345、例题分析8.2.1一个总体均值的区间估计从某证券市场抽取一个由10只股票组成的样本,其市盈率分别为:

5791014232015326试求该市场全部股票平均市盈率的置信度为95%的置信区间(假定股票市盈率近似服从正态分布)。查表总体均值95%置信区间为:即:2/1/202335n是否为大样本是否已知是否正态总体是否已知用S估计用S估计增大样本容量到30以上是是是是否否否否5.2.1一个总体均值的区间估计6、小结2/1/2023361)假定条件总体服从二项分布当样本容量很大时,可以由正态分布来近似使用正态分布统计量z3)总体比例在1-置信水平下的置信区间为5.2.2一个总体比例(成数)的区间估计1、一个总体比例(成数)的置信区间2/1/202337

【例】某城市想要估计职工中女性所占的比例,随机地抽取了100名职工,其中65人为女性职工。试以95%的置信水平估计该城市职工中女性比例的置信区间。该城市职工中女性比例的置信区间为55.65%~74.35%

解:已知n=100,p=65%,1-=95%,z/2=1.965.2.2一个总体比例的区间估计2、例题分析2/1/2023381)估计一个总体的方差或标准差2)假设总体服从正态分布3)总体方差

2

的点估计量为S2,且4)总体方差在1-置信水平下的置信区间为1、一个总体方差的置信区间5.2.3一个总体方差的区间估计2/1/202339221-2总体方差1-的置信区间自由度为n-1的2分布2、一个总体方差置信区间图示5.2.3一个总体方差的区间估计2/1/202340【例】一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布,以95%的置信水平建立该种食品重量标准差的置信区间。25袋食品的重量

112.5101.0103.0102.0100.5102.6107.5

95.0108.8115.6100.0123.5102.0101.6102.2116.6

95.4

97.8108.6105.0136.8102.8101.5

98.4

93.33、例题分析5.2.3一个总体方差的区间估计2/1/202341解:已知n=25,1-=95%,根据样本数据计算得

s2=93.21

2置信度为95%的置信区间为

该种食品总体重量标准差的置信区间为7.54~13.43g3、例题分析5.2.3一个总体方差的区间估计2/1/202342一、从某一总体中随机抽取一个容量为100的样本,其均值为81,标准差为12。要求:1、构造总体均值95%置信水平下的置信区间;2、构造总体均值99%置信水平下的置信区间。二、一个容量为400的随机样本取自均值和标准差均未知的总体。已经计算出下列值:

=38532要求:1、构造总体均值95.45%置信水平下的置信区间;2、构造总体均值99.73%置信水平下的置信区间。

4、区间估计练习5.2.3一个总体方差的区间估计█2/1/2023435.3必要抽样数目的确定

5.3.1确定样本容量的意义5.3.2推断总体均值所需的样本容量5.3.3推断总体成数所需的样本容量5.3.4必要样本容量的影响因素2/1/202344样本容量调查误差调查费用小样本容量节省费用但调查误差大大样本容量调查精度高但费用较大找出在规定误差范围内的最小样本容量找出在限定费用范围内的最大样本容量5.3.1确定样本容量的意义2/1/202345确定方法⑴重复抽样条件下:通常的做法是先确定置信度,然后限定抽样极限误差。通常未知。一般按以下方法确定其估计值:①过去的经验数据;②试验调查样本的S。计算结果通常向上进位5.3.2推断总体均值所需的样本容量2/1/202346⑵不重复抽样条件下:确定方法5.3.2推断总体均值所需的样本容量2/1/202347【例】某食品厂要检验本月生产的10000袋某种产品的重量,根据上月资料,这种产品每袋重量的标准差为25克。要求在95.45﹪的置信水平下,平均每袋重量的误差范围不超过5克,应抽查多少袋产品?5.3.2推断总体均值所需的样本容量例题分析2/1/2023485.3.2推断总体均值所需的样本容量例题分析2/1/202349确定方法⑴重复抽样条件下:通常的做法是先确定置信度,然后限定抽样极限误差。计算结果通常向上进位通常未知。一般按以下方法确定其估计值:①过去的经验数据;②试验调查样本的;③取方差的最大值0.25。5.3.3推断总体成数所需的样本容量2/1/202350⑵不重复抽样条件下:确定方法5.3.3推断总体成数所需的样本容量2/1/202351【例】某企业对一批总数为5000件的产品进行质量检查,过去几次同类调查所得的产品合格率分别为93﹪、95﹪、96﹪,为了使合格率的允许误差不超过3﹪,在99.73﹪的置信水平下,应抽查多少件产品?【分析】因为共有三个过去的合格率的资料,为保证推断的把握程度,应选择其中方差最大者,即P=93﹪。例题分析5.3.3推断总体成数所需的样本容量2/1/202352例题分析5.3.3推断总体成数所需的样本容量2/1/202353总体方差的大小;极限误差的大小;置信水平;抽样方法;抽样的组织方式。重复抽样条件下:不重复抽样条件下:5.3.4必要样本容量的影响因素█2/1/202354一、假设检验(HypothesisTesting)问题的提出二、假设检验的基本思想三、有关概念四、两类错误与显著性水平五、检验统计量与拒绝域六、利用P值进行决策

七、假设检验的步骤5.4假设检验的基本问题2/1/202355有许多实际问题,需要通过部分信息量,对某种看法进行判定或估计。

例1、某企业生产一种零件,以往的资料显示零件平均长度为4cm,标准差为0.1cm。工艺改革后,抽查100个零件发现其平均长度为3.94cm。问:工艺改革后零件长度是否发生了显著变化?

例2、某厂有一天共生产了2000件产品,按国家标准,次品率不得超过3%才能出厂。现从该批产品中随机抽取100件,发现其中有2件次品,问这批产品能否出厂。

一、假设检验(HypothesisTesting)问题的提出2/1/202356例1要判明工艺改革后零件平均长度是否仍为4cm;

例2要判明该批产品的次品率是否低于3%。进行这种判断的信息来自所抽取的样本这两个例子中都是要对某种“陈述”做出判断:所谓假设检验,就是事先对总体参数或总体分布形式作出一个假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定是否拒绝原假设。

假设检验分两类:(1)参数假设检验;(2)非参数检验或自由分布检验。一、假设检验(HypothesisTesting)问题的提出2/1/202357

通过提出假设,利用“小概率原理”和“概率反证法”,论证假设真伪的一种统计分析方法。

1、小概率原理:也就是实际推断原理,它认为在一次实验中,概率很小的事件,实际上几乎是不可能发生的。

2、概率反证法:如果在其他因素给定的前提下,要证明某一事实(比如对总体参数的假定)是否成立,首先假设该事实成立,然后在该事实成立的前提下,计算由该事实和样本构造的统计量的取值,再根据该统计量的分布,判断已经观测到的样本信息出现的概率是否为小概率,以此来证明该事实是否成立。二、假设检验的基本思想2/1/202358因此,置信度大小的不同,有可能做出不同的判断。

3、假设检验是基于样本资料来推断总体特征的,而这种推断是在一定概率置信度下进行的,而非严格的逻辑证明。在例1中,要判断工艺改革后零件平均长度是否仍为4cm,可先假设仍为4cm,根据样本平均数的抽样分布理论,则样本点应以较大的可能性(置信度)落在以4为中心的某一范围内。二、假设检验的基本思想2/1/202359在给定置信度1-下(比如99%):其中:0为所要检验的假设(这里为4cm)

为总体标准差(这里为0.1cm)n为样本容量(这里为100)Z/2为置信度1-下,标准正态分布对应的右尾临界值二、假设检验的基本思想2/1/202360

如果取置信度为0.99,则显著性水平=0.01,对应的临界值为Z/2=2.58

换言之,如果原假设为真,则样本测算值将以99%的可能性落在[-2.58,2.58]区间内。

通过一组(实际)样本计算得:说明小概率事件(标准化后的样本均值只有1%的可能性落在[-2.58,2.58]区间外)发生了。

这是不合理的,应拒绝原假设。二、假设检验的基本思想2/1/202361(一)原假设(nullhypothesis)研究者想收集证据予以反对的假设又称“零假设”总是有符号,或表示为H0H0:

=某一数值指定为符号=,或例如,H0:

10cm三、有关概念2/1/202362研究者想收集证据予以支持的假设也称“研究假设”总是有符号

,

或表示为

H1H1:

<某一数值,或某一数值例如,H1:

<10cm,或

10cm(二)备择假设(alternativehypothesis)三、有关概念2/1/202363原假设和备择假设是一个完备事件组,而且相互对立在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立先确定备择假设,再确定原假设

含有等号“=”的符号总是放在原假设上因研究目的不同,对同一问题可能提出不同的假设如何提出假设三、有关概念2/1/202364【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设如何提出假设(例题分析)解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为

H0:

500H1:

<500500g三、有关概念2/1/202365【例】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%”。建立的原假设和备择假设为

H0:π30%H1:π30%如何提出假设(例题分析)三、有关概念2/1/2023661、备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailedtest)

2、备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验(one-tailedtest)备择假设的方向为“<”,称为左侧检验

备择假设的方向为“>”,称为右侧检验

(三)双侧检验与单侧检验三、有关概念2/1/202367注:研究者感兴趣的是备择假设,单侧假设的方向是按备侧假设的方向来说的。假设双侧检验单侧检验左侧检验右侧检验原假设H0:m

=m0H0:m

m0H0:m

m0备择假设H1:m

≠m0H1:m

<m0H1:m

>m0(三)双侧检验与单侧检验三、有关概念2/1/202368

由于假设检验是根据有限的随机样本信息来推断总体特征,而样本的随机性可能致使判断出错。

1、第I类错误当原假设为真时,而拒绝原假设所犯的错误,称为第I类错误或弃真错误。易知犯第I类错误的概率就是显著性水平:

2、第II类错误当原假设为假时,不拒绝原假设所犯的错误,称为第II类错误或采伪错误。犯第II类错误的概率常用表示:四、假设检验中的两类错误与显著性水平2/1/2023691)犯第I类错误与犯第II类错误的概率存在此消彼长的关系;

2)若要同时减少与,须增大样本容量n;

3)通常的作法是,取较小显著性水平,即控制犯第I类错误的概率在较小的范围内;

4)在犯第II类错误的概率不好控制时,将“接受原假设”更倾向于说成“不拒绝原假设”。注意:四、假设检验中的两类错误与显著性水平2/1/2023703、假设检验中的四种可能情况

H0为真H0不真不拒绝H0GoodBad/TypeIIerror

拒绝H0Bad/TypeIerrorGood4、影响错误的因素1.显著性水平当减少时增大2.总体标准差当增大时增大3.样本容量n当n减少时增大4.总体参数的真值四、假设检验中的两类错误与显著性水平2/1/2023715、检验能力(poweroftest)拒绝一个错误的原假设的能力根据的定义,是指没有拒绝一个错误的原假设的概率。这也就是说,1-

则是指拒绝一个错误的原假设的概率,这个概率被称为检验能力,也被称为检验的势或检验的功效(power)可解释为正确地拒绝一个错误的原假设的概率四、假设检验中的两类错误与显著性水平2/1/2023726、显著性水平(significantlevel)1)是一个概率值2)原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3)表示为

(alpha)常用的

值有0.01,0.05,0.104)由研究者事先确定四、假设检验中的两类错误与显著性水平2/1/202373significant(显著的)一词的意义在这里并不是“重要的”,而是指“非偶然的”在假设检验中,如果样本提供的证据拒绝原假设,我们说检验的结果是显著的,如果不拒绝原假设,我们则说结果是不显著的一项检验在统计上是“显著的”,意思是指:这样的(样本)结果不是偶然得到的,或者说,不是靠机遇能够得到的在假设检验时,如果拒绝原假设,则称检验结果“在统计上是显著的”;如果不拒绝原假设,则称检验结果“在统计上是不显著的”。7、统计显著性

(significant)四、假设检验中的两类错误与显著性水平2/1/202374五、检验统计量与拒绝域1、根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量,称为检验统计量2、样本估计量标准化的依据:①原假设H0为真②点估计量的抽样分布

3、对于一个总体均值和比例的检验,标准化的检验统计量可表示为2/1/2023753、显著性水平和拒绝域(1)

双侧检验

H0:m

=m0H1:m

≠m0抽样分布0临界值临界值a/2a/2

样本统计量拒绝H0拒绝H01-置信水平五、检验统计量与拒绝域2/1/2023763、显著性水平和拒绝域(2)

左侧检验

H0:m

m0H1:m

<m00临界值a样本统计量拒绝H0抽样分布1-置信水平五、检验统计量与拒绝域2/1/2023773、显著性水平和拒绝域(3)

右侧检验

H0:m

m0H1:m

>m00临界值a样本统计量拒绝H0抽样分布1-置信水平五、检验统计量与拒绝域2/1/2023785、总结决策规则给定显著性水平,查表得出相应的临界值z或z/2,t或t/2将检验统计量的值与水平的临界值进行比较作出决策双侧检验:I统计量I≥临界值,拒绝H0左侧检验:统计量≤临界值,拒绝H0右侧检验:统计量≥临界值,拒绝H0五、检验统计量与拒绝域2/1/202379在零假设为真的条件下,检验统计量取其计算值或更加极端值(沿着备择假设的方向)的概率称为p值(p-value)。反映实际观测到的数据与原假设H0之间不一致的程度也称为观察到的(或实测的)显著性水平决策规则:若p值≤,拒绝H0六、利用P值进行决策1、P值及决策规则2/1/202380/

2

/

2

Z拒绝H0拒绝H00临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值六、利用P值进行决策2、各种检验的P值(1)双侧检验的P值2/1/2023810临界值a样本统计量拒绝H0抽样分布1-置信水平计算出的样本统计量P值六、利用P值进行决策2、各种检验的P值(2)左侧检验的P值2/1/2023820临界值a拒绝H0抽样分布1-置信水平计算出的样本统计量P值六、利用P值进行决策2、各种检验的P值(3)右侧检验的P值2/1/202383有了P值,我们并不需要用5%或1%这类传统的显著性水平。P值提供了更多的信息,它让我们可以选择任意水平来评估结果是否具有统计上的显著性,从而可根据我们的需要来决定是否要拒绝原假设只要你认为这么大的P值就算是显著了,你就可以在这样的P值水平上拒绝原假设传统的显著性水平,如1%、5%、10%等等,已经被人们普遍接受为“有足够证据拒绝原假设”的标准,我们大概可以说:10%代表有“一些证据”不利于原假设;5%代表有“适度证据”不利于原假设;1%代表有“很强证据”不利于原假设。六、利用P值进行决策3、固定显著性水平是否有意义2/1/202384用P值进行检验比根据统计量检验提供更多的信息统计量检验是我们事先给出的一个显著性水平,以此为标准进行决策,无法知道实际的显著性水平究竟是多少比如,根据统计量进行检验时,只要统计量的值落在拒绝域,我们拒绝原假设得出的结论都是一样的,即结果显著。但实际上,统计量落在拒绝域不同的地方,实际的显著性是不同的。比如,统计量落在临界值附近与落在远离临界值的地方,实际的显著性就有较大差异。而P值给出的是实际算出的显著水平,它告诉我们实际的显著性水平是多少。六、利用P值进行决策4、

P值决策与统计量的比较2/1/202385拒绝H0拒绝H0的两个统计量的不同显著性Z拒绝H00统计量1

P1

值统计量2

P2

值拒绝H0临界值六、利用P值进行决策4、

P值决策与统计量的比较2/1/202386

1、提出原假设和备择假设

原假设(或称零假设)为正待检验的假设:H0

备择假设(研究假设)为可供选择的假设:H1

一般地,假设有三种形式:

(1)双侧检验:

H0:0;H1:0

(2)左侧检验:

H0:0;H1:<0

(3)右侧检验:

H0:≤0;H1:>0

七、假设检验的步骤2/1/202387

2、选择适当的统计量,并确定其分布形式

统计量是根据所涉及的问题而定的,如总体均值、比例可选取正态分布的Z统计量等。

3、选择显著性水平或置信度,确定临界值

显著性水平为原假设为真时,样本点落在临界值外的概率(即抽样结果远离中心点的概率,它为小概率),也是原假设为真时,拒绝原假设所冒的风险。

临界值将样本点所落区域分为拒绝域与非拒绝域,临界值“外”为拒绝域,“内”为非拒绝域。七、假设检验的步骤2/1/202388通过样本计算统计量的具体值,与临界值比较,根据是否落入拒绝域来拒绝或不拒绝原假设。—统计量的值落在拒绝域,拒绝H0,否则不拒绝H0—也可以直接利用P值作出决策

4、作出结论2a

2a

a

a

拒绝域

拒绝域

拒绝域

(a)双侧检验

(b)左侧检验

(c)右侧检验七、假设检验的步骤█2/1/2023895.5一个总体参数的假设检验一、一个总体参数检验主要内容二、一个总体均值的假设检验三、一个总体比例的假设检验四、一个总体方差的假设检验2/1/202390z检验(单尾和双尾)

t检验(单尾和双尾)z

检验(单尾和双尾)

2检验(单尾和双尾)均值一个总体比例方差一、一个总体参数检验主要内容2/1/202391① 假定条件正态总体或非正态总体大样本(n30)②使用z检验统计量2

已知:2

未知:二、一个总体均值的假设检验1、大样本的检验方法(1)假定条件及检验统计量2/1/202392【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05,检验该天生产的饮料容量是否符合标准要求?双侧检验绿色健康饮品绿色健康饮品255255二、一个总体均值的假设检验1、大样本的检验方法(2)例题分析(2

已知)2/1/202393H0

=255H1

255=0.05,n

=40临界值(c):检验统计量:z01.96-1.960.025拒绝H0拒绝H00.025决策:结论:

不拒绝H0样本提供的证据表明:该天生产的饮料符合标准要求

解:作假设二、一个总体均值的假设检验1、大样本的检验方法(2)例题分析(2

已知)2/1/202394第1步:进入Excel表格界面,直接点击“f(x)”(粘贴函数)第2步:在函数分类中点击“统计”,并在函数名的菜单下选择“NORMSDIST”,然后确定第3步:将z的绝对值1.01录入,得到的函数值为

0.843752345

P值=2(1-0.843752345)=0.312495

P值远远大于,故不拒绝H0二、一个总体均值的假设检验1、大样本的检验方法(2)例题分析(用Excel计算正态分布P值

)2/1/202395【例】一种机床加工的零件尺寸绝对平均误差允许值为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?(=0.01)左侧检验50个零件尺寸的误差数据(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86二、一个总体均值的假设检验1、大样本的检验方法(2)例题分析(2

未知)2/1/202396H0

1.35H1

<1.35=0.01,n

=50临界值(c):检验统计量:

拒绝H0新机床加工的零件尺寸的平均误差与旧机床相比有显著降低决策:结论:-2.33z0拒绝H00.01解:作假设左侧检验二、一个总体均值的假设检验1、大样本的检验方法(2)例题分析(2

未知)2/1/202397第1步:进入Excel表格界面,直接点击“f(x)”(粘贴函数)第2步:在函数分类中点击“统计”,并在函数名的菜单下选择“ZTEST”,然后确定第3步:在所出现的对话框Array框中,输入原始数据所在区域;在X后输入参数的某一假定值(这里为1.35);在

Sigma后输入已知的总体标准差(若总体标准差未知则可忽略不填,系统将自动使用样本标准差代替)第4步:用1减去得到的函数值0.995421023

即为P值

P值=1-0.995421023=0.004579

P值<=0.01,拒绝H0二、一个总体均值的假设检验1、大样本的检验方法(2)例题分析(用Excel计算正态分布P值

)2/1/2023980-2.33a=0.05z拒绝H0抽样分布1-计算出的样本统计量——-2.6061P值P=0.004579

二、一个总体均值的假设检验1、大样本的检验方法(2)例题分析(拒绝域与P值图示

)2/1/202399【例】某一小麦品种的平均产量为5200kg/hm2

。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/hm2,标准差为120kg/hm2

。试检验改良后的新品种产量是否有显著提高?(=0.05)右侧检验二、一个总体均值的假设检验1、大样本的检验方法(2)例题分析(2

未知)2/1/2023100H0

5200H1

>5200=0.05,n

=36临界值(c):检验统计量:

拒绝H0(P=0.000088<

=0.05)改良后的新品种产量有显著提高决策:结论:z0拒绝H00.051.645解:作假设右侧检验二、一个总体均值的假设检验1、大样本的检验方法(2)例题分析(2

未知)2/1/2023101P=0.000088

01.645a=0.05拒绝H01-计算出的样本统计量=3.75P值右侧检验二、一个总体均值的假设检验1、大样本的检验方法(2)例题分析(拒绝域与P值图示

)抽样分布2/1/2023102假设双侧检验左侧检验右侧检验假设形式H0:m=m0H1:

mm0H0:mm0H1:m<m0H0:

m

m0

H1:

m>m0统计量已知:未知:拒绝域P值决策拒绝H0二、一个总体均值的假设检验1、大样本的检验方法(3)大样本检验方法小结2/1/20231031. 假定条件总体服从正态分布小样本(n<

30)检验统计量2

已知:2

未知:二、一个总体均值的假设检验2、小样本的检验方法(1)假定条件及检验统计量2/1/2023104【例】一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个零件进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?10个零件尺寸的长度(cm)12.210.812.011.811.912.411.312.212.012.3样本二、一个总体均值的假设检验2、小样本的检验方法(2)例题分析2/1/2023105H0

=12H1

12=0.05df

=10-1=9临界值(c):检验统计量:

不拒绝H0该供货商提供的零件符合要求

决策:结论:t02.262-2.2620.025拒绝

H0拒绝H00.025解:二、一个总体均值的假设检验2、小样本的检验方法(2)例题分析2/1/2023106第1步:进入Excel表格界面,直接点击“f(x)”(粘贴函数)第2步:在函数分类中点击“统计”,并在函数名的菜单下选择“TDIST”,然后确定第3步:在出现对话框的X栏中输入计算出的t的绝对值

0.7053,在Deg-freedom(自由度)栏中输入本例的自由度9,在Tails栏中输入2(表明是双侧检验,如果是单侧检验则在该栏输入1)第4步:P值=0.498469786

P值>=0.05,故不拒绝H0

二、一个总体均值的假设检验2、小样本的检验方法(2)例题分析(用Excel计算t分布P值)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论