参数估计课件_第1页
参数估计课件_第2页
参数估计课件_第3页
参数估计课件_第4页
参数估计课件_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第5章 参数估计第一节 参数估计概述第二节 一个总体参数的区间估计第三节 样本容量的确定231. 1.定义:定义:452221(),1xxxnxsXPpnnns-=-邋67都是无偏估计量都是无偏估计量2, x s ,p82112qqss00,有,有 1limnPqqe-=10解:通过样本的合格率来估计企业产品的合格率。解:通过样本的合格率来估计企业产品的合格率。样本合格率样本合格率p p=95/100=95%=95/100=95%,我们估计该企业产品,我们估计该企业产品的合格率是的合格率是95%95%。 P=p=95%P=p=95%112( ,)XN 2, 2, 1222211.801.681

2、.691.72()12()1iixxxsn解:米ms=+=-=-12一、区间估计概述一、区间估计概述二、总体平均数的区间估计二、总体平均数的区间估计三、总体成数的区间估计三、总体成数的区间估计1314151617点估计值、点估计值、允许的抽样误差范围、置信水平(概率保证允许的抽样误差范围、置信水平(概率保证程度)。程度)。点估计值:点估计值:一般为样本平均数或样本成数一般为样本平均数或样本成数p p允许误差范围(抽样极限误差)允许误差范围(抽样极限误差) : ( (x x ) )就是置信区间就是置信区间置信水平:置信水平:F(z) 18xxxxXxXxXx-D + D-D + D()()( )

3、xxxxP XxXP xXxF z-D + D=-D + D=()()()xxxxxxxXP xPzFXFmmm-DD=- D()xP xX- DxxX- D19样本样本和总体参数的点估计值和总体参数的点估计值给定给定F F(z z)z = z/= z给定给定 F F(z z)nsm=抽样平均误差抽样平均误差2021( (二二) )总体平均数的区间估计总体平均数的区间估计总体方差总体方差( )已知已知()2,xxN Xs()2,xxN Xs(0,1)xxXzNs-=2223 给出给出,求,求F F(z z) 抽取样本,计算样本指标(样本平均数、样抽取样本,计算样本指标(样本平均数、样本方差、抽

4、样平均误差);本方差、抽样平均误差); 根据给定的抽样误差根据给定的抽样误差允许误差允许误差 ,计算,计算估计区间的上、下限;估计区间的上、下限; 求出概率度求出概率度z z,查表得到,查表得到F(z),对总体参,对总体参数作区间估计。数作区间估计。z=mD24 给出概率保证程度给出概率保证程度 ,求估计区间,求估计区间 抽取样本,计算样本指标(样本平均数、抽取样本,计算样本指标(样本平均数、样本方差、抽样平均误差);样本方差、抽样平均误差); 根据给定的根据给定的 ,查表求出,查表求出z z; 求出抽样极限误差求出抽样极限误差 ( )和估计)和估计区间的上、下限区间的上、下限 ,对总体参数作

5、,对总体参数作区间估计。区间估计。zmD =(,)xx- D+ D( )F z( )F z25首先确定被估计总体指标的种类,首先确定被估计总体指标的种类,是平均数是平均数还是成数还是成数;其次确定抽样方法,是其次确定抽样方法,是重置抽样还是不重置重置抽样还是不重置抽样抽样;然后再根据给定的样本资料和抽样条件(然后再根据给定的样本资料和抽样条件(给给定概率保证程度还是给定抽样极限误差定概率保证程度还是给定抽样极限误差),),确定计算步骤,进行计算。确定计算步骤,进行计算。26例例5.35.3 某学校进行一次英语测验,为了解学生的考试情况,某学校进行一次英语测验,为了解学生的考试情况,随机抽选部分

6、学生进行调查,所得资料如下:随机抽选部分学生进行调查,所得资料如下: 试以试以95.45%95.45%的可靠性估计该校学生英语考试的的可靠性估计该校学生英语考试的平均平均成绩成绩的范围及该校学生成绩在的范围及该校学生成绩在8080分以上的学生分以上的学生所占的所占的比重比重的范围。的范围。考试成绩 60 以下 60-70 70-80 80-90 90- 90-100 学生人数 10 20 22 40 8 27解:解:(1 1)估计该校学生英语考试的平均成绩的)估计该校学生英语考试的平均成绩的范围:范围:分析:分析: 考试成绩考试成绩是是平均数平均数,应选用关于,应选用关于 的抽的抽样计算公式;

7、资料样计算公式;资料没有没有给出给出总体单位数总体单位数N N,抽样方,抽样方法应选用法应选用重置抽样重置抽样。当资料中没有指出抽样方法,同时也没有给出总当资料中没有指出抽样方法,同时也没有给出总体单位数体单位数N N时,默认为重置抽样。时,默认为重置抽样。x28计算样本指标计算样本指标样本平均成绩样本平均成绩样本标准差样本标准差抽样平均误差抽样平均误差766076.6100 xfxf=2()1294411.3771100 1xxfSf-=-11.3771.1377100 xnsm=29根据给定的根据给定的F F(z z),查表求),查表求z z F F(z z)=95.45% =95.45%

8、 查表查表 z=2z=2求出抽样极限误差求出抽样极限误差和估计区间的上、下限和估计区间的上、下限 估计区间下限估计区间下限 :76.676.62.2754=74.322.2754=74.32估计区间上限估计区间上限 :76.676.62.2754=78.892.2754=78.892 1.13772.2745xzmD=xx- Dxx + D30以以95.45%95.45%的概率保证程度估计该校学生考试平均的概率保证程度估计该校学生考试平均成绩的区间范围是:成绩的区间范围是:74.32 78.8974.32 78.89(2)(2)已知已知 ,由,由X48100,48%,2100npz=(1)0.

9、48(10.48)0.04996100pppnm-=2 0.049960.09992ppzmD = =pppPp- D + D0.48 0.099920.48 0.099920.380.58PP-+,即学生成绩在80分以上所占比重的范围为为:31例例5.45.4 某地区的电视台委托调查公司估计地区内居民平某地区的电视台委托调查公司估计地区内居民平均每日的看电视时间。调查公司随机抽取了均每日的看电视时间。调查公司随机抽取了100100名名居民进行调查,样本数据显示平均每人每天看电视居民进行调查,样本数据显示平均每人每天看电视时间是时间是4 4个小时。如果已知总体的标准差个小时。如果已知总体的标准

10、差 =1.5=1.5小时。小时。 试求:试求:(1)(1)该地区内居民每天看电视的平均时间的该地区内居民每天看电视的平均时间的置信区间置信区间( (置信度是置信度是95%)95%);(2)(2)如果要求估计的误差如果要求估计的误差不超过不超过2727分钟,这时置信度是多少?分钟,这时置信度是多少?32解:解:(1)(1)已知已知 =4=4小时,小时,n n=100=100, =1.5=1.5小时,小时,F(z)=95%F(z)=95%。这时查标准正态分布表,可得。这时查标准正态分布表,可得z=1.96z=1.96,由抽样平均误差由抽样平均误差 因此,以因此,以95%95%置信度,估计该地区内居

11、民每天置信度,估计该地区内居民每天看电视的平均时间在看电视的平均时间在3.7063.706到到4.2944.294个小时之间。个小时之间。x1.5.10 xnsm=015(小时)1.960.150.2940.2940.2943.7064.294xzxXxXmD=-+(小时),即33(2 2)要求极限误差等于)要求极限误差等于2727分钟,即分钟,即 =0.45=0.45小时。小时。这时概率度这时概率度 :查概率表知这时的概率是查概率表知这时的概率是99.73%99.73%0.4530.15xzmD=34,pppppPpPpp- D+ D轾- D+ D犏臌或其中,其中, 为抽样极限误差为抽样极限

12、误差ppZmD=351npn=()1ppppnnsm-=或=()2111ppppnnnNnNsm骣骣-鼢珑=-鼢珑鼢珑桫桫或 =36ppZmD=,pppppPpPpp- D+ D轾- D+ D犏臌,或37接平均数区间估计的例子接平均数区间估计的例子(2 2)估计该校学生成绩在)估计该校学生成绩在8080分以上的学生分以上的学生所占的比重的范围所占的比重的范围分析:分析:学生所占比重学生所占比重是是成数成数,应选用关于,应选用关于P P的抽样计算公式;抽样方法仍为的抽样计算公式;抽样方法仍为重置抽样重置抽样。38计算样本指标计算样本指标样本成数:样本成数:抽样平均误差:抽样平均误差:14848%

13、100npn=(1)0.48(10.48)0.04996100pppnm-=39根据给定的根据给定的F F(z z),查表求),查表求z z F F(z z)=95.45% =95.45% 查表查表 z=2z=2求出抽样极限误差求出抽样极限误差和估计区间的上、下限和估计区间的上、下限 估计区间下限:估计区间下限:估计区间上限:估计区间上限: 20.049960.09992ppzmD=0.48 0.099920.3801pp- D=0.48 0.099920.5799pp+ D=40 以以95.4595.45概率保证程度估计,该校学概率保证程度估计,该校学生成绩在生成绩在8080分以上的学生所占

14、的比重的分以上的学生所占的比重的范围在:范围在:38.01%38.01%57.99%57.99%之间。之间。4142按按 日产量分组日产量分组(件)(件)组中值(件)组中值(件)工人数(人)工人数(人)110114114118118122122126126130130134134138138142112116120124128132136140371823211864合计合计100 xf43()1011000,100,90,10,1.96,900.9,10010.9 0.11001110010000.0291.96 0.0290.0568pppNnnnZnpnppnnNZmm=骣骣-鼢珑=-=

15、-鼢珑鼢珑桫桫=D= =己知则44PNP()()0.90.05680.90.0568,1000 0.90.05681000 0.90.0568PNP-+-+45总结总结 在简单抽样条件下进行区间估计的例题。在简单抽样条件下进行区间估计的例题。从上面的解法中,我们可以总结出这一类计从上面的解法中,我们可以总结出这一类计算题的基本做法:算题的基本做法:先计算出样本指标先计算出样本指标,然后然后根据所给条件(重置抽样或不重置抽样)进根据所给条件(重置抽样或不重置抽样)进行抽样平均误差的计算,抽样极限误差的计行抽样平均误差的计算,抽样极限误差的计算算,最后根据样本指标和极限误差进行区间最后根据样本指标

16、和极限误差进行区间估计估计。46例例5.65.6 从某年级学生中按简单随机抽样方式抽取从某年级学生中按简单随机抽样方式抽取4040名学生,对公共理论课的考试成绩进行检名学生,对公共理论课的考试成绩进行检查,得知其平均分数为查,得知其平均分数为78.5678.56分,总体标准差分,总体标准差为为12.1312.13分,试以分,试以95.45%95.45%的概率保证程度推断的概率保证程度推断全年级学生考试成绩的区间范围。全年级学生考试成绩的区间范围。4712.131.92402 1.923.8478.563.8478.563.8474.7282.4xxxnzxxXxxXXsmm=D=- D+ D-

17、+全年级学生考试成绩的区间范围是:即解:解:40, 78.56,12.13, z=2x48第三节第三节 样本容量的确定样本容量的确定在前面讨论中我们都是假定样本容量在前面讨论中我们都是假定样本容量n n是已知的,是已知的,但是在实际问题中,需要自己动手设计调查方案,但是在实际问题中,需要自己动手设计调查方案,这是如何决定样本容量就是很大的学问。如果这是如何决定样本容量就是很大的学问。如果n n选选的过大,会增加费用;如果的过大,会增加费用;如果n n选的过小,会使估计选的过小,会使估计误差增大。误差增大。这个问题的关键是这个问题的关键是: :第一第一 ,要求什么样的精度?即我们想构造多宽的区间

18、。,要求什么样的精度?即我们想构造多宽的区间。第二,对于我们的置信区间来说,想要多大的置信度?第二,对于我们的置信区间来说,想要多大的置信度?即我们想要多大的可靠称度?即我们想要多大的可靠称度?49x DznsD =, nzsD2n=zs骣桫D重置抽样重置抽样xzns贝5051不重置抽样抽样平均误差为:不重置抽样抽样平均误差为: 所以所以2(1)nnNsm=-不重置抽样不重置抽样2(1)nznNsD =-22222NznNzss=D+525354估计成数时,允许误差为估计成数时,允许误差为:必要样本单位数必要样本单位数n n为:为:p(1p)nz-D =22p(1p)n=z -D重置抽样重置抽样

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论