版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、教学重点教学过程教学总结第七章第七章 区间估计区间估计STATSTAT 一家食品消费企业以消费袋装食品为主,每天的产量约为8000袋左右。按规定每袋的分量应不低于100克,否那么即为不合格。为对产量质量进展检测,企业设有质量检查科专门担任质量检验,并经常向企业高层指点提交质检报告。质检的内容之一就是每袋分量能否符合要求。 由于产品的数量大,进展全面的检验是不能够的,可行的方法是抽样,然后用样本数据估计平均每袋的分量。质检科从某天消费的一批食品中随机抽取了25袋,下表1是对每袋食品分量的检验结果。实际中的统计STAT 根据表1的数据,质检科估计出该天消费的食品每袋的平均分量在101.38109.
2、34克之间,其中,估计的可信程度为95%,估计误差不超越4克。产品的合格率在96.07%73.93%之间,其中,估计的可信程度为95%,估计误差不超越16%。表1 25袋食品的重量(克)112.5102.6100.0116.6136.8101.0107.5123.595.4102.8103.095.0102.097.8101.5102.010808101.6108.498.4100.5115.6102.2105.093.3STAT 质检报告提交后,企业高层指点人提出几点意见:一是抽取的样本大小能否适宜?能不能用一个更大的样本进展估计?二是能否将估计的误差在减少一点?比如,估计平均分量时估计误差
3、不超越3克,估计合格率时误差不超越10%。三是总体平均分量的方差是多少?由于方差的大小阐明了消费过程的稳定性,过大或过小的方差都意味着应对消费过程进展调整。STATSTAT点估计的缺陷:不能反映估计的误差和准确程度区间估计:利用样本统计量和抽样分布估计总体参数的能够区间【例1】CJW公司是一家专营体育设备和附件的公司,为了监控公司的效力质量, CJW公司每月都要随即的抽取一个顾客样本进展调查以了解顾客的称心分数。根据以往的调查,称心分数的规范差稳定在20分左右。最近一次对100名顾客的抽样显示,称心分数的样本均值为82分,试建立总体称心分数的区间。8.1.1抽样误差抽样误差:一个无偏估计与其对
4、应的总体参数之差的绝对值。抽样误差 = 实践未知8.1总体均值的区间估计大样本n30 xxSTAT要进展区间估计,关键是将抽样误差 求解。假设 知,那么区间可表示为: 此时,可以利用样本均值的抽样分布对抽样误差的大小进展描画。 上例中,知,样本容量n=100,总体规范差 ,根据中心极限定理可知,此时样本均值服从均值为 ,规范差为 的正态分布。即:xxxxxx,20210020nx)2 ,82(2NxSTAT8.1.2抽样误差的概率表述抽样误差的概率表述 由概率论可知,由概率论可知, 服从规范正态分布,即,服从规范正态分布,即,有以下关系式成立:有以下关系式成立:普通称,普通称, 为置信度,可靠
5、程度等,反映估计结果的可信程度。假为置信度,可靠程度等,反映估计结果的可信程度。假设事先给定一个置信度,那么可根据规范正态分布找到其对应设事先给定一个置信度,那么可根据规范正态分布找到其对应的临界值的临界值 。进而计算抽样误差。进而计算抽样误差)2 ,82(2NxxxZ) 1 , 0( NZ1)(2ZxPx12ZxxZx2STAT假设,那么查规范正态分布表可得,抽样误差 此时抽样误差的意义可表述为:以样本均值为中心的3.92的区间包含总体均值的概率是95%,或者说,样本均值产生的抽样误差是3.92或更小的概率是0.95。 常用的置信度还有90%,95.45%,99.73%,他们对应的临界值分别
6、为1.645,2和3,可以分别反映各自的估计区间所对应的准确程度和把握程度。%95196. 12Z92. 32*96. 196. 12xxxZSTAT8.1.3计算区间估计:计算区间估计: 在在CJW公司的例子中,样本均值产生的抽样误差是公司的例子中,样本均值产生的抽样误差是3.92或更或更小的概率是小的概率是0.95。因此,可以构建总体均值的区间为,。因此,可以构建总体均值的区间为,由于,从一个总体中抽取到的样本具有随机性,在一次偶尔的由于,从一个总体中抽取到的样本具有随机性,在一次偶尔的抽样中,根据样本均值计算所的区间并不总是可以包含总体均抽样中,根据样本均值计算所的区间并不总是可以包含总
7、体均值,它是与一定的概率相联络的。如以下图所示:值,它是与一定的概率相联络的。如以下图所示:92.85,08.7892. 382,92. 382,xxxx已知时的大样本情况STATx 的抽样分布2x95%x的所有 的值3.923.923x1x x2 13.92x 基于的 区间23.92x 基于的 区间33.92x基于的区间(该区间不包含 )图1 根据选择的在 、 、 位置的样本均值建立的区间1x x2 3xSTAT 上图中,有95%的样本均值落在阴影部分,这个区域的样本均值3.92的区间可以包含总体均值。 因此,总体均值的区间的含义为,我们有95%的把握以为,以样本均值为中心的3.92的区间可
8、以包含总体均值。 通常,称该区间为置信区间,其对应的置信程度为 置信区间的估计包含两个部分:点估计和描画估计准确度的正负值。也将正负值称为误差边沿或极限误差,反映样本估计量与总体参数之间的最大误差范围。总结:1已知时的大样本下的区间估计nZx2值。的为侧尾部中所提供的面积为在标准正态分布的右)为置信系数;式中,(Z212ZSTAT8.1.4计算区间估计:计算区间估计: 在大多数的情况下,总体的规范差都是未知的。根据抽样在大多数的情况下,总体的规范差都是未知的。根据抽样分布定理,在大样本的情况下,可用样本的规范差分布定理,在大样本的情况下,可用样本的规范差s作为总体规作为总体规范差的点估计值,依
9、然采用上述区间估计的方法进展总体参数范差的点估计值,依然采用上述区间估计的方法进展总体参数的估计。的估计。未知时的大样本下的区间估计nZx2值。的为侧尾部中所提供的面积为在标准正态分布的右)为置信系数;式中,(Z212Z未知时的大样本情况STAT【例2】 斯泰特怀特保险公司每年都需对人寿保险单进展审查,现公司抽取36个寿保人作为一个简单随即样本,得到关于、投保人年龄、保费数量、保险单的现金值、残废补偿选择等工程的资料。为了便于研讨,某位经理要求了解寿险投保人总体平均年龄的90%的区间估计。投保人投保人年龄年龄投保人投保人年龄年龄投保人投保人年龄年龄投保人投保人年龄年龄1234567893250
10、4024334445484410111213141516171847313639464539384519202122232425262727435436344823364228 2930313233343536343934354253284939STAT上表是一个由36个投保人组成的简单随机样本的年龄数据。现求总体的平均年龄的区间估计。分析:区间估计包括两个部分点估计和误差边沿,只需分别求出即可到的总体的区间估计。解:知1样本的平均年龄2误差边沿645. 1%901362Zn,(大样本),5 .393636405032 nxxs2样本标准差(未知)总体标准差nZxSTAT样本规范差误差边沿39
11、0%的置信区间为39.5 2.13 即37.37,41.63岁。 留意1置信系数普通在抽样之前确定,根据样本所建立的区间能包含总体参数的概率为2置信区间的长度准确度在置信度一定的情况下,与样本容量的大小呈反方向变动,假设要提高估计准确度,可以扩展样本容量来到达。77. 71)(2nxxs13. 23677. 7*645. 122nsZnZxSTAT8.2总体均值的区间估计:小样本的情况在小样本的情况下,样本均值的抽样分布依赖于总体的抽样分布。我们讨论总体服从正态分布的情况。t分布的图形和规范正态分布的图形类似,如以下图示:)(30nstxx分布服从未知总体标准差服从正态分布已知总体标准差小样本
12、STAT0规范正态分布t分布自在度为20t分布自在度为10图2规范正态分布与t分布的比较STAT在分布中,对于给定的置信度,同样可以经过查表找到其对应的临界值,利用临界值也可计算区间估计的误差边沿因此,总体均值的区间估计在总体规范差未知的小样本情况下可采用下式进展:假定总体服从正态分布;2tnst2nsZx2值。的供的面积为分布的右侧尾部中所提)的自由度为(为在为样本的标准差;)为置信系数;式中,(t2t1-n12tsSTAT【例3】谢尔工业公司拟采用一项计算机辅助程序来培训公司的维修援助掌握及其维修的操作,以减少培训工人所需求的时间。为了评价这种培训方法,消费经理需求对这种程序所需求的平均时
13、间进展估计。以下是利用新方对名职员进展培训的培训天数资料。根据上述资料建立置信度为的总体均值的区间估计。假定培训时间总体服从正态分布。职员时间职员时间职员时间职员时间职员时间职员时间STAT解:依题意,总体服从正态分布,小样本,此时总体方差未知。可用自在度为n-1=14的t分布进展总体均值的区间估计。样本平均数样本规范差误差边沿95%的置信区间为87.531563554452 nxx82. 61473.6511)(2nxxs78. 31582. 6*145. 22nstx53.87 3.78 即50.09,57.65天。STAT8.3确定样本容量误差边沿其计算需求知假设我们选择了置信度由此,得
14、到计算必要样本容量的计算公式:nZx2。和样本容量n,2Z2,1Z就可以确定2Zn在已知 和后,我们可以求出误差边际为任何数值时的样本容量等于期望的误差边际。令E)(222222EZnEZnnZESTAT【例4】在以前的一项研讨美国租赁汽车破费的研讨中发现,租赁一辆中等大小的汽车,其破费范围为,从加利福尼亚州的奥克兰市的每天36美圆到康涅狄格州的哈特福德市的每天73.50美圆不等,并且租金的规范差为9.65美圆。假定进展该项研讨的组织想进展一项新的研讨,以估计美国当前总体平均日租赁中等大小汽车的支出。在设计该项新的研讨时,工程主管指定对总体平均日租赁支出的估计误差边沿为2美圆,置信程度为95%
15、。解:依题意,可得将以上结果取下一个整数90即为必要的样本容量。2,65. 9,96. 1%,9512EZ43.89265. 996. 1)(2222222EZnSTAT 阐明: 由于总体规范差 在大多数情况下 是未知的,可以有以下方法获得 的值。1运用有同样或者类似单元的以前样本的样本规范差;2抽取一个预备样本进展实验性研讨。用实验性样本的规范差作为 的估计值。3运用对 值的判别或者“最好的猜测,例如,通常可用全距的作为 的近似值。STAT8.4总体比例的区间估计8.4.1区间估计 对总体比例 的区间估计在原理上与总体均值的区间估计一样。同样要利用样本比例 的抽样分布来进展估计。假设, 那么
16、样本比例近似服从正态分布。同样,抽样误差类似的,利用抽样分布正态分布来计算抽样误差pp5)1 (, 5,30pnnpnppp222(1)ppppppZZZnn STAT上式中, 是正待估计的总体参数,其值普通是未知,通常简单的用 替代 。即用样本方差 替代总体方差 。那么, 误差边沿的计算公式为:ppp)1 (pp)1 (ppnppZp)1 (2的置信区间则为:1nppZp)1 (2值。的为侧尾部中所提供的面积为在标准正态分布的右)为置信系数;式中,(Z212ZSTAT【例5】2019年菲瑞卡洛通讯公司对全国范围每内的902名女子高尔夫球手进展了调查,以了解美国女子高尔夫球手对本人如何在场上被
17、对待的看法。调查发现,397名女子高尔夫球手对得到的球座开球次数感到称心。试在95%的置信程度下估计总体比例的区间。分解:解:依题意知,1样本比例2误差边沿误差边际点估计区间96. 1%9519022Zn,(大样本),44. 0902397nmp0324. 090256. 044. 096. 1)1 (2nppZpSTAT 395%的置信区间0.44 0.0324 即0.4076,0.4724。 结论:在置信程度为95%时,一切女子高尔夫球手中有40.76%到47.24%的人对得到的球座开球数感到称心。 8.4.2 确定样本容量 在建立总体比例的区间估计时,确定样本容量的原理与8.3节中运用的
18、为估计总体均值时确定样本容量的原理相类似。22222(1)E(1)(1)()ppEZnppppnZnZEE令 等于期望的误差边际STAT【例6】在例中,该公司想在2019年结果的根底上进展一项新的调查,以重新估计女子高尔夫球手的总体中对得到的球座开球此数感到称心的人数所占的比例。调查主管希望这项新的调查在误差边沿为0.025、置信程度为95%的条件下来进展,那么,样本容量应该为多大?解:依题意,可得将以上结果取下一个整数1515即为必要的样本容量。025. 0,44. 0,96. 1%,9512EpZ51.1514025. 056. 044. 096. 1)1 ()(22222EppZnSTA
19、T 阐明:阐明: 由于总体比例由于总体比例 在大多数情况下是未知的,在大多数情况下是未知的,可以有以下方法获得可以有以下方法获得 的值。的值。1 1运用有同样或者类似单元的以前样本的样本比例;运用有同样或者类似单元的以前样本的样本比例;2 2抽取一个预备样本进展实验性研讨。用实验性样抽取一个预备样本进展实验性研讨。用实验性样本的比例作为本的比例作为 的估计值。的估计值。3 3运用对运用对 值的判别或者值的判别或者“最好的猜测;最好的猜测;4 4假设上面的方法都不适用,采假设上面的方法都不适用,采用用 。0.5p ppppSTAT8.5其他抽样方法下总方差的计算 在第六章中学习到,除简单随机抽样
20、方法外,在现实中还可运用分层抽样、整群抽样、系统抽样等抽样方法,每一次抽样都涉及到对总体参数的估计过程。 经过前面的知识,可知对总体参数的估计过程中比较关键的要素是计算总体方差。假设知总体方差,总体参数区间估计的过程与前面引见的方法一样。STAT8.5.1分层抽样分层抽样在简单随机抽样中,我们计算总方差是采用的公式是在简单随机抽样中,我们计算总方差是采用的公式是在分层抽样中,我们事先将总体按一定的标志进展分层,所构在分层抽样中,我们事先将总体按一定的标志进展分层,所构成的数据实践等同于组距式数列,在组距式数列中,总方差需成的数据实践等同于组距式数列,在组距式数列中,总方差需求运用方差加法定理来
21、计算。求运用方差加法定理来计算。22()xxn222i方差加法定理:总方差组间方差平均组内方差STAT 这就是说,假设要计算总方差,那么需分别将组间方差和平均组内方差先计算出来。在分层抽样下,能否真的需求由组间方差和平均组内方差相加来计算总方差呢? 我们来调查一下分层抽样的实施过程: 层间抽样:在每一层抽取 全面调查 层间方差 层内抽样:抽取部分样本单位 抽样调查 层内方差 我们说抽样误差是抽样调查这种调查方式所特有的误差,因此上述两部分误差中只需由于抽样调查所构成的层内方差才是抽样误差的组成部分,而由于全面调查所构成的层间方差不是抽样误差的组成部分。STAT因此,22i总方差平均组内方差22
22、22:n:n :iiiiiiiNs nsNniN:总体单位数;N各层的总体单位数;样本容量;各层的样本单位数;当总体方差未知时,用相应的样本方差替代。22ixZn 此时,误差边际【例7】某厂有甲、乙两个车间消费保温瓶,乙车间产量是甲车间的2倍。现按产量比例共抽查了60支,结果如下。试以95.45%的可靠程度推断该厂消费的保温瓶的平均保温时间的能够范围。车间车间代码代码平均保温时间平均保温时间标准差标准差 s s甲甲乙乙1 12 22525(小时)(小时)2828(小时)(小时)1.21.2(小时)(小时)0 0.8.8(小时)(小时))(276040282025小时nnxxii64. 0,44
23、. 1,28,25,40,20:22212121ssxxnn解91. 0604064. 02044. 122nnssiii222220.12()0.24()iixsZZnn小时小时)24.27,76.26(),(xxxx【例8】某地一万住户,按城乡比例抽取一千户,进展彩电拥有量调查,结果如下。试以95.45%的概率推断该地彩电拥有户比率的范围。14. 0100070085. 015. 03002 . 08 . 0)1 ()1 (nnppPPiii代码代码抽样户数抽样户数比重比重(% %)城城乡乡1 12 2300300(n(n1 1) )700700(n(n2 2) ) 8080)(1p1515)(2p%5
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人防工程与消防安全联动方案
- 地方医院抗菌素管理规定
- 环保企业厂房租赁合同条款
- 2024年合成氨项目立项申请报告
- 2024年墙画式终端装置项目规划申请报告
- 工程承包与材料购销合同
- 二手车辆过户合同的详细说明
- 旧房改造装修合同要素
- 胫腓骨骨折术后护理
- 农村电商产业行业现状分析及未来三至五年行业发展报告
- 系统性红斑狼疮护理查房课件
- 心脏标志物(诊断学)课件
- 混凝土氯离子含量试验检测记录表(选择性电极法)
- 白内障手术前后眼内炎的预防诊断与治疗医学课件
- 风湿相关血小板减少
- 部编高中语文教材文言篇目
- 公司用车审批单
- 2023年1月1日《铁路旅客运输服务质量规范》
- 铁路线路工钢轨切割钻孔作业指导书
- 《经济法》课程思政教学案例(一等奖)
- 新闻写作的基本知识与常见问题
评论
0/150
提交评论