第8章 区间估计_第1页
第8章 区间估计_第2页
第8章 区间估计_第3页
第8章 区间估计_第4页
第8章 区间估计_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1

一家食品生产企业以生产袋装食品为主,每天的产量约为8000袋左右。按规定每袋的重量应不低于100克,否则即为不合格。为对产量质量进行检测,企业设有质量检查科专门负责质量检验,并经常向企业高层领导提交质检报告。质检的内容之一就是每袋重量是否符合要求。由于产品的数量大,进行全面的检验是不可能的,可行的办法是抽样,然后用样本数据估计平均每袋的重量。质检科从某天生产的一批食品中随机抽取了25袋,下表1是对每袋食品重量的检验结果。实践中的统计2

根据表1的数据,质检科估计出该天生产的食品每袋的平均重量在101.44~109.28克之间,其中,估计的可信程度为95%,估计误差不超过4克。产品的合格率在73.93%~96.07%之间,其中,估计的可信程度为95%,估计误差不超过16%。表125袋食品的重量(克)112.5102.6100.0116.6136.8101.0107.5123.595.4102.8103.095.0102.097.8101.5102.0108.08101.6108.498.4100.5115.6102.2105.093.3本章要点:第8章区间估计边际误差与区间估计总体均值的区间估计:总体方差已知情形、总体方差未知情形总体比例的区间估计别生气

你认识很容易生气的人吗?大自然有办法让这些人平静下来:他们比较容易得心脏病。好几项观测研究都发现生气和心脏病之间的相关性,最好的一项研究观察了12986个人,随机选自四个地区,而且都没有心脏病,我们把焦点集中在这个样本当中血压正常的人身上。有个简短的心理测验叫做“斯皮尔伯格发怒量表”,度量了每个人容易发怒的程度,结果有633个人,被归类在发怒量表的高水平,4731人在中水平,3110人在低水平。然后追踪这些人将近6年并比较了高水平和低水平得心脏病的比率,最爱生气的和最不爱生气的组比起来,得心脏病的机会是2.2倍,而心脏病猝发的概率是2.7倍。

别生气

听起来生气似乎是很严重的事。对于所有正常血压的人士来说不会是完全正确的。有关这项研究的新闻报道引用这两个数字。但是医学期刊“循环”中的全文中提出了置信区间

。在95%置信水平之下,高水平组得心脏病的慨率,是低水平组的1.36—3.55倍之间,心脏病猝发概率则在1.48—4.90倍之间。区间提醒我们,因为我们只有样本的数据,所以我们对总体的所有叙述都是不确定的。对样本来说,我们可以说:“机会恰好是2.2倍”,对整个总体来说,样本数据只能让我们说:“机会在1.36—3.55倍之间”,而只有95%的信心。要探讨新闻背后的真相,不论是有关医药行业还是其他领域,我们都必须使用置信区间这种表示方法。置信水平区间估计的概念如前所述,点估计是用一个点(即一个数)去估计未知参数。顾名思义,区间估计就是用一个区间去估计未知参数,即把未知参数值估计在某两个界限之间。例如,估计明年GDP增长在7%~8%之间,比说增长8%更容易让人们相信,因为给出7%~8%已把可能出现的误差考虑到了。所谓区间估计,就是在点估计的基础上,用一个具有一定可靠程度的区间范围来估计总体参数。区间估计的形式我们通过把点估计值减去和加上一个被称为边际误差的值,可以构建总体参数的一个区间估计。形式如下:

点估计值±边际误差边际误差是指以样本统计量估计总体参数时所允许的最大误差范围。体现了估计精度的高低。边际误差的确定以及所构造区间的可靠程度的分析就需要借助统计量的抽样分布这方面的重要知识。

9忆:抽样误差抽样误差:一个估计量与其对应的总体参数之差的绝对值。抽样误差:

(实际未知)根据中心极限定理可知:样本容量很大时,近似有:

抽样误差的概率陈述

区间估计

10

11下面考虑一个相反的问题:

抽样误差的图示μ

3.923.92

13

现考虑从3个容量为100的不同的样本的样本均值分别构建的区间情况:区间估计的图示

(未知)x3.9295%3.92x2±x1±x3±3.923.923.92边际误差边际误差说明:由于所有可能的样本均值有95%处在阴影区域内,故样本均值加减3.92所形成的所有区间中也有95%的区间会包括总体均值在内。区间与置信水平均值的抽样分布(1-

)%区间包含了

%的区间未包含

1-aa/2a/2置信区间(95%置信水平下的置信区间)重复构造出

的20个置信区间

点估计值

置信水平统计图表18落在总体均值某一区间内的样本

x_XX=

Z

x95%的样本

-1.96

x

+1.96

x99%的样本

-2.58

x

+2.58x90%的样本

-1.65

x

+1.65

x置信区间是由样本估计量构造出的总体参数在一定置信水平下的估计区间。区间的最小值称为置信下限,最大值称为置信下限。如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,那么,用该方法构造的区间称为置信水平为95%的置信区间。置信区间总体参数的真值是固定的,而置信区间是一个随机区间,它会因样本的不同而变化,而且不是所有的区间都包含总体参数。实际估计时往往只抽取一个样本,此时所构造的是一定置信水平(比如95%)下的一个置信区间,这是一个特定区间,而不是一个随机区间,所以无法知道这个样本所产生的区间是否包含总体参数的真值。我们只能希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个。注意:总体均值的置信区间(

2已知)1.假定条件总体服从正态分布,且总体方差(

2)已知如果不是正态分布,可以由正态分布来近似(n

30)使用正态分布统计量Z:

3.区间估计的形式:

【例2】:

一家食品生产企业以生产袋装食品为主,为对食品质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为95%。25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3总体均值的区间估计(例题分析)总体均值的区间估计(例题分析)

总体均值的区间估计(例题分析)解:已知

x=26,=6,n=100,1-=0.95,Z

/2=1.96,总体均值90%的置信区间为:我们可以90%的把握保证平均每天参加锻炼的时间在25.013~26.987分钟之间【例3】某大学从该校学生中随机抽取100人,调查到他们平均每天参加体育锻炼的时间为26分钟。试以90%的置信水平估计该大学全体学生平均每天参加体育锻炼的时间(已知总体方差为36小时)。

总体均值的置信区间(

2未知大样本情形)假定条件大样本(n

30)2.区间估计的形式:

28【例4】斯泰特怀特保险公司每年都需对人寿保险单进行审查,现公司抽取36个寿保人作为一个简单随即样本,得到关于、投保人年龄、保费数量、保险单的现金值、残废补偿选择等项目的资料。为了便于研究,某位经理要求了解寿险投保人总体平均年龄的90%的区间估计。投保人年龄投保人年龄投保人年龄投保人年龄123456789325040243344454844101112131415161718473136394645393845192021222324252627274354363448233642282930313233343536343934354253284939

29上表是一个由36个投保人组成的简单随机样本的年龄数据。现求总体的平均年龄的区间估计。分析:区间估计包括两个部分——点估计和误差边际,只需分别求出即可到的总体的区间估计。解:已知(1)样本的平均年龄(2)边际误差

30

t分布

0标准正态分布t分布(自由度为20)t分布(自由度为10)图8-4标准正态分布与t分布的比较总体均值的置信区间(

2未知小样本情形)t分布上侧分位数

总体均值的置信区间(

2未知小样本情形)假定条件

2未知2.有关结论:

3.区间估计的形式:

34【例5】谢尔工业公司拟采用一项计算机辅助程序来培训公司的维修支援掌握及其维修的操作,以减少培训工人所需要的时间。为了评价这种培训方法,生产经理需要对这种程序所需要的平均时间进行估计。以下是利用新方对15名职员进行培训的培训天数资料。根据上述资料建立置信度为95%的总体均值的区间估计。(假定培训时间总体服从正态分布)。职员时间职员时间职员时间152659115424475012583558541360444962146254510461563总体均值的区间估计(例题分析)

35解:依题意,总体服从正态分布,n=15(小样本),此时总体方差未知。可用自由度为(n-1)=14的t分布进行总体均值的区间估计。样本平均数样本标准差边际误差95%的置信区间为53.87±3.78即(50.09,57.65)天。

区间估计的形式:使用范围:

正态总体or大样本小样本练习

1.已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(单位:h)如下。建立该批灯泡平均使用寿命95%的置信区间16灯泡使用寿命的数据1510152014801500145014801510152014801490153015101460146014701470

计算可得:

39【例4】斯泰特怀特保险公司每年都需对人寿保险单进行审查,现公司抽取36个寿保人作为一个简单随即样本,得到关于、投保人年龄、保费数量、保险单的现金值、残废补偿选择等项目的资料。为了便于研究,某位经理要求了解寿险投保人总体平均年龄的90%的区间估计。投保人年龄投保人年龄投保人年龄投保人年龄123456789325040243344454844101112131415161718473136394645393845192021222324252627274354363448233642282930313233343536343934354253284939

40上表是一个由36个投保人组成的简单随机样本的年龄数据。现求总体的平均年龄的区间估计。分析:区间估计包括两个部分——点估计和误差边际,只需分别求出即可到的总体的区间估计。解:已知(1)样本的平均年龄(2)边际误差

41

练习

2.为估计美国家庭信用卡债务的总体均值,随机抽取了70个家庭,记录他们的信用卡债务数据(单位:美元)如下。建立美国全部家庭中信用卡债务的均值95%的置信区间。943014661715990719691110327535121958137360611448652540781054494671680482795239560413659125951347956496195517970617917140441129812584441662451134668174353154151067613021128066845346715917162797194972104936191125911011222001135661512851974365671074671171362753371032413627127449465125578372

1871957421926362327445

计算可得:

统计图表43课堂练习:P189:11、12(a)44

样本容量的确定(抽样之前确定的)

期中E=所希望的边际误差.45

样本容量的确定(抽样之前确定的)

期中E=所希望的边际误差.

估计时样本量的确定(例题分析)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论