《Lecture5参数估计》PPT课件.ppt_第1页
《Lecture5参数估计》PPT课件.ppt_第2页
《Lecture5参数估计》PPT课件.ppt_第3页
《Lecture5参数估计》PPT课件.ppt_第4页
《Lecture5参数估计》PPT课件.ppt_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Lecture 5 参数估计,5.1 参数估计的基本原理 5.2 一个总体参数的区间估计 5.3 两个总体参数的区间估计 5.4 样本容量的确定,学习目标,估计量与估计值的概念 点估计与区间估计的区别 评价估计量优良性的标准 一个总体参数的区间估计方法 两个总体参数的区间估计方法 样本容量的确定方法,参数估计在统计方法中的地位,统计推断的过程,为什么要做参数估计?why,降低成本 破坏性试验,5.1 参数估计的基本原理,一、估计量与估计值 二、点估计与区间估计 三、评价估计量的标准,一、估计量与估计值(estimator & estimated value) 估计量:用于估计总体参数的随机变量 如样本均值,样本比率、样本方差等 例如: 样本均值就是总体均值 的一个估计量 参数用 表示,估计量用 表示 估计值:估计参数时计算出来的统计量的具体值 如果样本均值 x =80,则80就是的估计值,5.1 参数估计的基本原理,参数估计的方法,估 计 方 法,点 估 计,区间估计,5.1 参数估计的基本原理,二、点估计和区间估计 (一)点估计(point estimate) 用样本统计量直接作为总体参数的估计量 例如:用样本均值直接作为总体均值的估计 例如:用两个样本均值之差直接作为总体均值之差的估计 没有给出估计值接近总体参数程度的信息 点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等,5.1 参数估计的基本原理,(二)区间估计(interval estimate) 在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到的 根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 比如,某班级平均分数在7585之间,置信水平是95%,区间估计的图示,(三)置信区间(confidence interval) 由样本统计量所构造的总体参数的估计区间称为置信区间 统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值 我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个,5.1 参数估计的基本原理,(四)置信水平(confidence level) 将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比率称为置信水平 表示为 (1 - 为是总体参数未在区间内的比率 常用的置信水平值有 99%, 95%, 90% 相应的 为0.01,0.05,0.10,5.1 参数估计的基本原理,置信区间与置信水平,5.1 参数估计的基本原理,(五)影响置信区间宽度的因素 1. 总体数据的离散程度,用 来测度 样本容量 3. 置信水平 (1 - ),影响 z 的大小,5.1 参数估计的基本原理,三、评价估计量的标准 (一)无偏性(unbiasedness) 估计量的数学期望等于被估计的总体参数,即,5.1 参数估计的基本原理,(二)有效性(efficiency) 对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效,即,5.1 参数估计的基本原理,(三)一致性(consistency) 随着样本容量的增大,估计量的值越来越接近被估计的总体参数,即,5.2 一个总体参数的区间估计,一、总体均值的区间估计 二、总体比率的区间估计 三、总体方差的区间估计,5.2 一个总体参数的区间估计,总体均值的区间估计 (例题),【 引例 】一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为95%,抽样分布与总体分布的关系,总体分布,正态分布,非正态分布,大样本,小样本,正态分布,正态分布,非正态分布,抽样分布与总体分布的关系,正态分布,t 分布,正态分布,2 分布,样本均值,统计量,样本比例,样本方差,正态总体 (小样本),正态总体或大样本,二项总体 (大样本),正态总体,5.2 一个总体参数的区间估计,一、总体均值的估计 (一)利用Z统计量对总体均值进行区间估计 1. 假定条件 总体服从正态分布,且方差() 已知 总体不是正态分布或 未知,当 n 30时,可由正态分布来近似代替 2. 使用正态分布统计量 z,总体均值 在1- 置信水平下的置信区间为,已知:,未知:,标准正态分布的上侧分为点 (图示),总体均值的区间估计 (例题分析),解:已知N(,102),n=25, 1- = 95%,z/2= z0.025=1.96。根据样本数据计算得: 总体均值在1-置信水平下的置信区间为,该食品平均重量的置信区间为101.44g109.28g,总体均值的区间估计 (例题分析),【例】一家保险公司收集到由36投保个人组成的随机样本,得到每个投保人的年龄(周岁)数据如下表。试建立投保人年龄90%的置信区间,总体均值的区间估计 (例题分析),解:已知n=36, 1- = 90%,z/2=z0.051.645。根据样本数据计算得: 总体均值在1- 置信水平下的置信区间为,投保人平均年龄的置信区间为37.37岁41.63岁,5.2 一个总体参数的区间估计,(二)利用t 统计量对总体均值进行区间估计 1. 假定条件 总体服从正态分布,方差() 未知,小样本 (n 30) 使用 t 分布统计量,总体均值 在1-置信水平下的置信区间为,t 分布的上侧分位点 (图示),总体均值的区间估计 (例题分析),【例】已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(小时)如下。建立该批灯泡平均使用寿命95%的置信区间,总体均值的区间估计 (例题分析),解:已知N(,2),n=16,1- = 95%,t/2(n-1)= t0.025(15) = 2.131,根据样本数据计算得:,该种灯泡平均使用寿命的置信区间为1476.8小时1503.2小时,总体均值在1-置信水平下的置信区间为,习题,例:某小型汽车轮胎厂要估计其轮胎的平均行驶里程,随机抽取400个轮胎,其平均行驶里程为20000公里,标准差为6000公里,试在95%的置信度下,对小汽车轮胎的平均使用寿命做一个区间估计.,解:大样本,总体方差未知,用正态分布,1、为调查某单位每个家庭每天看电视的平均时间是多长,总体服从正态分布;现从该单位随机抽取了16户,得样本均值为6.75小时,样本标准差为2.25小时. (1)试对家庭每天平均看电视时间进行区间估计 (2)若已知该市每个家庭看电视时间的标准差为2.5小时,此时若再进行区间估计,并且将边际误差控制再第一问的水平上,问此时需调查多少户才能满足要求?置信度均为0.95,2、某工厂生产一批滚珠, 其直径 X 服从正态分布 ,现从某天的产品中随机抽取 6 件, 测得直径为 15.1 14.8 15.2 14.9 14.6 15.1 (1) 若方差为0.06 ,求均值的置信区间; (2) 若方差未知,求均值的置信区间; (3) 求标准差 的置信区间. (注:置信度均为0.95),3、某车间负责在某种零件的标定位置上打孔 .一次从一批此种零件中随机抽出 10 个零件,量得孔径如下: 14 .7 15 .1 14 .6 15 .2 15 .0 15 .0 14 .7 14 .9 15 .2 15 .1 如果孔径服从正态分布,总体方差 = 0 .05,求置信水平为 95% 的孔径均值的置信区间,4、在一次测验中,抽取某学校 150 名学生的成绩,平均成绩78,s= 9,试求该校全体学生的平均成绩的 95% 的置信区间 .,5、对某种飞机的飞行速度作了 15 次独立试验,测得飞机的最大飞行速度(m s)如下: 422 .2 431 .5 413 .5 418 .7 428 .2 441 .3 425 .6 438 .3 423 .0 420 .3 434 .0 411 .3 425 .8 423 .1 417 .2 假设最大飞行速度服从正态分布,试求最大飞行速度均值的置信水平为 95%的置信区间,1、样本比例的抽样分布: 当样本容量n足够大时(即np5,n(1-p) 5),样本比例p近似服从均值为 、方差为(1-)/n的正态分布,其中 为总体比例。即,5.2 一个总体参数的区间估计,二、总体比例的区间估计,2. (1)验证假定条件 总体服从二项分布,当样本容量充分大,即 np5,n(1-p) 5时,可由正态分布来近似 (2) 使用正态分布统计量 z,(3) 总体比率在1-置信水平下的置信区间为,总体比例的区间估计,总体比率的区间估计 (例题分析),【例】某城市想要估计下岗职工中女性所占的比率,随机地抽取了100名下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比率的置信区间,解:已知 n=100,p65% , np=655, n(1-p)=355,1- = 95%,z/2=z0.025=1.96,该城市下岗职工中女性比率的置信区间为55.65%75.35%,在市级教育主管部门评估期间,某职业学校对领导班子成员的民意测验中,156 人中有120 人回答合格,试求该职业学校领导班子成员的“合格率“的95% 的置信区间 .,5.2 一个总体参数的区间估计,三、总体方差的区间估计 1. 估计一个总体的方差或标准差 2. 假设总体服从正态分布 3. 总体方差 2 的点估计量为s2,且,4. 总体方差在1- 置信水平下的置信区间为, 2分布的上侧分位点 (图示), 2, 21- , 2 ,总体方差 1- 的置信区间,自由度为n-1的2分布,/2,/2,总体方差的区间估计 (例题分析),【例】一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布。以95%的置信水平建立该种食品重量方差的置信区间,总体方差的区间估计 (例题分析),解:已知n25,1-95% ,根据样本数据计算得 s2 =93.21,该企业生产的食品总体重量标准差的的置信区 间为7.54g13.43g, 2置信度为95%的置信区间为,5.3 两个总体参数的区间估计,一、两个总体均值之差的区间估计 二、两个总体比率之差的区间估计 三、两个总体方差比的区间估计,5.3 两个总体参数的区间估计,5.3 两个总体参数的区间估计,一、两个独立样本总体均值之差的区间估计 (一)利用Z统计量对两总体均值差进行区间估计 1. 假定条件 两个总体都服从正态分布,1、 2已知,两个样本是独立的随机样本 若不是正态分布或1、 2未知,两个样本是独立的随机样本,当n130和n230时,可用正态分布来近似 2. 使用正态分布统计量 z,(1)当1、 2已知时:,(2)当1、 2未知时:,5.3 两个总体参数的区间估计,3. 1, 2已知时,两个总体均值之差1-2在1- 置信水平下的置信区间为,4. 1、 2未知,当n130,n2 30时,两个总体均值之差1-2在1- 置信水平下的置信区间为,两个总体均值之差的估计 (例题分析),【例】某地区教育委员会想估计两所中学的学生高考时的英语平均分数之差,为此在两所中学独立抽取两个随机样本,有关数据如右表 。建立两所中学高考英语平均分数之差95%的置信区间,两个总体均值之差的估计 (例题分析),解: 由1-=95%得z/2=z0.025=1.96,故两个总体均值之差在1-置信水平下的置信区间为,两所中学高考英语平均分数之差的置信区间为 5.03分10.97分,5.3 两个总体参数的区间估计,(二)利用t 统计量对两总体均值差的区间估计 1. 当 1=2时 (1) 假定条件 两个总体都服从正态分布,两个总体方差未知但相等:1=2,两个独立的小样本(n130和n230) (2) 总体方差的合并估计量,(3)估计量x1-x2的抽样标准差,5.3 两个总体参数的区间估计,(4) 两个样本均值之差的标准化,(5)两个总体均值之差1-2在1- 置信水平下的置信区间为,两个总体均值之差的估计 (例题分析),【例】为估计两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排12名工人,每个工人组装一件产品所需的时间(分钟)下如表。假定两种方法组装产品的时间服从正态分布,且方差相等。试以95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间。,两个总体均值之差的区间估计 (例题分析),解: 由1-=95%得t/2(n1+n2-2)=t0.025(22)= 2.0739,根据样本数据计算得,两种方法组装产品所需平均时间之差的置信区间为 0.14分钟7.26分钟,合并估计量为:,5.3 两个总体参数的区间估计,2. 当12 22 但n1=n2=n时 (1) 假定条件 两个总体都是正态分布,独立小样本,12, 22未知且不相等:即1222,样本容量相等:即n1=n2=n (2) 检验统计量,自由度:,5.3 两个总体参数的区间估计,(3)两个总体均值之差1-2在1- 置信水平下的置信区间为,两个总体均值之差的区间估计 (例题分析),【例】为检验两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排12个工人,每个工人组装一件产品所需的时间(分钟)下如表。假定两种方法组装产品的时间服从正态分布,但方差未知且不相等。取显著性水平0.05,能否认为方法1组装产品的平均数量明显地高于方法2?,两个总体均值之差的区间估计 (例题分析),解: 由1-=95%得t/2(n1+n2-2)=t0.025(22)= 2.0739,根据样本数据计算得,两种方法组装产品所需平均时间之差的置信区间为 0.14分钟7.26分钟,所求的置信区间为:,5.3 两个总体参数的区间估计,3. 当 12,n1n2时 (1) 假定条件 两个总体都服从正态分布,两个总体方差未知且不相等:即12,两个样本容量不等: 即n1n2,两个独立的小样本(n130和n230) (2) 使用统计量,5.3 两个总体参数的区间估计,(3)两个总体均值之差1-2在1- 置信水平下的置信区间为,两个总体均值之差的估计 (例题分析),【例】沿用前例。假定第一种方法随机安排12名工人,第二种方法随机安排名工人,即n1=12,n2=8 ,所得的有关数据如表。假定两种方法组装产品的时间服从正态分布,且方差不相等。以95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间,两个总体均值之差的估计 (例题分析),解: 根据样本数据计算得,两种方法组装产品所需平均时间之差的置信区间为 0.192分钟9.058分钟,自由度为:,由1-=95%得t/2(v)=t0.025(13)= 2.1604,故所求的置信区间为:,5.3 两个总体参数的区间估计,(三)匹配样本的总体均值差的区间估计 1. 利用Z统计量对匹配样本的总体均值差的区间估计 (1)假定条件 两个匹配的大样本(n1 =n2 =n 30) 两个总体各观察值的配对差服从正态分布,d已知 (2)两个总体均值之差d =1-2在1- 置信水平下的置信区间为,d 已知:,d 未知:,5.3 两个总体参数的区间估计,2. 利用t 统计量对匹配小样本的总体均值差的区间估计 (1)假定条件 两个总体各观察值的配对差服从正态分布,两个匹配的小样本(n1 30和n2 30) (2)两个总体均值之差d=1-2在1- 置信水平下的置信区间为,两个总体均值之差的估计 (例题分析),【例】由10名学生组成一个随机样本,分别采用A和B两套试卷进行测试,结果如下表,服从正态,试建立两种试卷分数之差d=1-2 95%的置信区间,两个总体均值之差的估计 (例题分析),解:由1-=95%得t/2(n-1)=t0.025(9)= 2.2622,根据样本数据计算得,两种试卷所产生的分数之差的置信区间为6.33分 15.67分,二、两个总体比例之差的区间估计 1. 假定条件 两个总体服从二项分布,两个样本是独立的,且n1、n2充分大:即n1p15,n1(1-p1)5,n2p25,n2(1-p2)5,可以用正态分布来近似 2. 两个总体比率之差1- 2在1- 置信水平下的置信区间为,5.3 两个总体参数的区间估计,两个总体比率之差的估计 (例题分析),【例】在某个电视节目的收视率调查中,农村随机调查了400人,有32%的人收看了该节目;城市随机调查了500人,有45%的人收看了该节目。试以90%的置信水平估计城市与农村收视率差别的置信区间,两个总体比率之差的估计 (例题分析),解: 已知 n2=400, p1=45%, p2=32%, n1p1=2255, n1(1-p1)=2755, n2p2=1285, n2(1-p2)=272 5 1- =95%, z/2=z0.025=1.96 1- 2置信度为95%的置信区间为,城市与农村收视率差值的置信区间为6.68%19.32%,5.3 两个总体参数的区间估计,三、两个总体方差之比的区间估计 1. 比较两个总体的方差比 用两个样本的方差比来判断 如果S12/ S22接近于1,说明两个总体方差很接近 如果S12/ S22远离1,说明两个总体方差之间存在差异 总体方差比在1-置信水平下的置信区间为,两个总体方差比的区间估计 (图示),/2,/2,两个总体方差比的区间估计 (例题分析),【例】为了研究男女学生在生活费支出(元)上的差异,在某大学各随机抽取25名男学生和25名女学生,得到下面的结果: 男学生: 女学生: 试以90%置信水平估计男女学生生活费支出方差比的置信区间,两个总体方差比的区间估计 (例题分析),解:根据自由度 n1=25-1=24 ,n2=25-1=24,查得 F/2(n1-1,n2-1)=F0.025(24,24)=1.98, F1-/2(n1-1,n2-1) = F0.975(24,24) = 1/F0.025(24,24) = 1/1.98 = 0.505 12 /22置信度为90%的置信区间为,男女学生生活费支出方差比的置信区间为0.471.84,5.4 样本容量的确定,一、估计总体均值时样本容量的确定 二、估计总体比率时样本容量的确定 三、估计总体均值之差时样本容量的确定 四、估计总体比率之差时样本容量的确定,一、估计总体均值时样本容量的确定 (一)估计总体均值时样本容量n为,5.4 样本容量的确定,其中:,(二)样本容量n与总体方差 2、允许误差E、可靠性系数Z 或t 之间的关系为 1. 与总体方差成正比 2. 与允许误差成反比 3. 与可靠性系数成正比,估计总体均值时样本容量的确定 (例题分析),【例】拥有工商管理学士学位的大学毕业生年薪的标准差大约为2000元,假定想要估计年薪95%的置信区间,希望允许误差为400元,应抽取多大的样本容量?,估计总体均值时样本容量的确定 (例题分析),解: 已知 =2000,E=400, 1-=95%, z/2 = z0.025 = 1.96 应抽取的样本容量为,即应抽取97人作为样本,二、估计总体比例时样本容量的确定 根据比率区间估计公式可得样本容量n为,5.4 样本容量的确定,E的取值一般小于0.1 未知时,可取最大值0.5,其中:,估

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论