统计学课件:第四章 参数估计_第1页
统计学课件:第四章 参数估计_第2页
统计学课件:第四章 参数估计_第3页
统计学课件:第四章 参数估计_第4页
统计学课件:第四章 参数估计_第5页
已阅读5页,还剩95页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第四章 参 数 估 计参数估计在统计方法中的地位统计方法描述统计推断统计参数估计假设检验第一节:参数估计的一般问题第二节:一个总体参数的区间估计第三节:两个总体参数的区间估计第四节:样本容量的选择第一节 参数估计的一般问题一、估计量与估计值二、判断估计量的优良性原则三、估计方法 1.用于估计总体某一参数的随机变量如样本均值,样本比例、样本中位数等例如: 样本均值就是总体均值的一个估计量如果样本均值 x = 3 ,则 3 就是对总体均值的估计值 2、理论基础是抽样分布 一、估计量与估计值二、判断估计量优良性原则无偏性:估计量的数学期望等于被估计 的总体参数P( X )XCA无偏有偏AB中位数的

2、抽样分布均值的抽样分布XP(X )有效性:一个方差较小的无偏估计量称为一个更有效的估计量。如:与其他估计量相比,样本均值是一个更有效的估计量一致性:随着样本容量的增大,估计量越来越接近被估计的总体参数AB较小的样本容量较大的样本容量P(X )X三、参数估计的方法估 计 方 法点 估 计区间估计估计方法点估计1、从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计 例如: 用样本均值作为总体未知均值的估计值就是一个点估计2、点估计没有给出估计值接近总体未知参数程度的信息,很难控制误差3、点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等思考:点估计实际上只有一

3、个取值,怎样的估计会更科学?引例1 盖洛普公司就消费者对美国产品质量的看法,对美国、德国、日本的消费者分别进行调查,结果表明:有55%的美国人相信美国产品的质量非常好,而持同样看法的德国人和日本人的比例分别是26%和17%,美联社在报道这项调查结果时曾提到“抽样误差在正、负三个百分点之间”,在报道中,“正、负三个百分点”这句话有什么作用?引例2 销售经理想估计一下明年的出口总值,甲估计是53万美元,乙估计是5056万美元之间,并可以确切地说“有95%的把握”。哪一个更可信,为什么? 5056万美元的范围是如何计算的?“有95%的把握”是什么意思?区间估计1.根据一个样本的观察值给出总体参数的估

4、计范围并给出总体参数落在这一区间的可信度例如: 总体均值落在5070之间,置信度为95%样本统计量 (点估计)置信区间置信下限置信上限 区间估计就是根据样本估计量以一定可靠程度推断总体参数所在的区间范围。 分别称为置信下限和置信上限,通称为置信限。 为显著性水平, 则称为置信度。区间估计中几个常用的概念置信度、显著性水平置信区间、置信限置信度1、置信度(置信系数):总体未知参数落在所估计区间内的可信度(可靠度)2 、置信度用1-表示。置信度越大,估计区间内所包含总体参数的可信度越高。(称为显著性水平:与总体参数存在显著差异的比例) 3 、常用的置信度有 99%, 95%, 90% 95.45%

5、,99.73%(事先给定的)x95.45%的 - 2x +2x99.73%的 - 3x +3x90%的 -1.65 x +1.65x均值的抽样分布:例如:教材第16题(3)若从该种电池中随机抽取25个电池检验,该样本电池的平均寿命在200小时左右多大的范围内概率不小于0.9?(4)若已知该样本电池的平均寿命为198小时,标准差为30小时,而总体平均寿命未知,那么总体平均寿命在198左右多大的范围内可信度不小于0.9呢?但实际估计时,情况恰好相反。 是已知的,而 是未知的,也正是我们想要估计的。由于 与 的距离是对称的,如果某个 落在 的1.65倍标准差的范围之内,那么反过来, 也落在以 为中心

6、、两侧1.65倍标准差的范围之内,这意味着,有90%的样本均值所构造的1.65倍标准差的区间会包括 。理论基础:抽样分布置信度的图示x90%的样本 -1.65 x +1.65x均值的抽样分布:在电池寿命的例题中,若样本的平均使用寿命为198,标准差为30,以0.9的置信度建立总体均值的置信区间会如何?置信度的图示x90%的样本 -1.65 x +1.65x均值的抽样分布:根据抽样分布理论得:抽样分布为正态分布,按90%的置信度区间半径应为每一个可能样本都可以建立一个90%置信度的半径相同的区间 对置信度的理解 均值的抽样分布:(1 - ) % 区间包含了, % 的区间未包含1 - aa/2a/

7、2 置信度是表示多次抽样得到的区间中大概有多少区间包含总体参数,也可以理解为某个样本有多大的概率是这些包含总体参数的区间中的一个 对置信区间的理解 置信区间是由样本统计量所构造的总体参数的估计区间 用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值 我们只能希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个置信区间与置信限 置信区间: 与一个“置信度”相联系的估计值的取值范围。用 表示置信限:与置信区间相联系的界限,包括上限和下限。思考: 置信区间与置信度的关系? 置信度与估计的精度的关系?第二节

8、 一个总体参数的估计大样本小样本均 值方 差比 例置 信 区 间大样本大样本【引例】 某食品进出口公司向东南亚出口一批花生制品,管理人员从中抽取50包作为样本,计算其平均数为250克。另外,合同规定总体标准差为6克。 分析: “这个估计量的平均误差是多少?” “总体平均数可能落入样本平均数上、下多大范围内?” “这个估计值的可靠程度是多少?” 确定抽样分布 (2)抽样平均误差(3)若用250克这个估计值估计总体平均数,其平均误差 为0.8487。 (4)总体平均数在2500.8487克之间的可信度为68.26%。总体平均数在25020.8487克之间的可信度为95.45%。总体平均数在2503

9、0.8487克之间的可信度为99.73%。解析过程:总结做区间估计的必要条件影响区间宽度(半径)的因素1. 总体数据的离散程度,用 来测度2. 样本容量,影响3.置信水平 (1 -),影响 z 的大小68.26%180%1.2890%1.64595%1.9695.45%299%2.5899.73%3总体均值的置信区间 (大样本的估计方法)1.假定条件总体服从正态分布,且总体方差()已知如果不是正态分布,但为大样本 (n 30)使用正态分布统计量总体均值 在1- 置信水平下的置信区间即当已知样本均值:其中抽样极限误差为:(一)正态总体、方差已知 (大、小样本) 总体均值 在1- 置信水平下的置信

10、区间为:例题1: 某种零件长度服从正态分布,从该批产品中随机抽取件,测得其平均长度为21.4 mm。已知总体标准差 =0.15mm,试建立该种零件平均长度的置信区间,给定置信水平为0.95。解:已知N(,0.152),x21.4, n=9, 1- = 0.95/2=1.96 总体均值的置信区间为:结论: 我们可以95的置信度保证该种零件的平均长度在21.302 - 21.498 mm之间例题2: 某企业从长期实践得知,其产品直径X是一随机变量,服从标准差为0.05的正态分布。从某日产品中随机抽取6个,测得其直径分别为14.8,15.3, 15.1, 15, 14.7, 15.1 (单位:厘米)

11、。在0.95的置信度下,试求该产品直径的均值的置信区间。(二)大样本(总体分布未知) 1、方差已知 例题3: 某大学从该校学生中随机抽取100人,调查到他们平均每天参加体育锻炼的时间为26分钟。试以95的置信水平估计该大学全体学生平均每天参加体育锻炼的时间(已知总体方差为36)。解:已知 x26, =6,n=100, 1- = 0.95,/2=1.96总体均值区间为:结论:我们可以95的置信度保证平均每天参加锻炼的时间在24.824 - 27.176 分钟之间 例题4: 某企业购进一批部件,这批部件的质量取决于平均每件的缺陷数。根据以往的经验,平均每件产品的缺陷数为1,标准差为0.2,如果缺陷

12、数超过1就应该拒收。现随机抽取64件,其平均缺陷数为1.1,要求以95%的置信系数构造缺陷数的置信界限,并决定是否拒收。 2、方差未知 分析:大样本情形下,当方差未知时,用样本标准差代替总体标准差 例题5: 某药厂在生产过程中改换了一种新的酵素,测定了36批的产出率与理论产出率的比值: 1.28 1.31 1.48 1.10 0.99 1.25 1.22 1.65 1.40 0.95 1.25 1.32 1.23 1.43 1.24 1.73 1.35 1.31 0.92 1.10 1.05 1.39 1.16 1.19 1.41 0.98 0.82 1.22 0.91 1.26 1.32 1

13、.71 1.29 1.17 1.74 1.51 要求:(1)计算这一比值95%的置信区间; (2)得出上述结论时作了什么假设; (3)能否以95%的置信水平说明新酵素的产出率提高了。(2)假设36批的样本是随机的。(3)置信区间(1.194,1.342)1,说明新酵素的产出率提高了。例题6: 某企业生产某种产品的工人有1000人,某日采用非重复抽样 抽取100人调查他们的当日产量,样本人均产量为35件,产量的样本标准差为4.5件,试以95.45%的置信度估计平均产量的抽样极限误差和置信区间。(一)t分布介绍(二)如何用t分布做区间估计总体均值的置信区间(小样本的估计方法)t分布 小样本理论 t

14、分布也称“学生分布” 。19081909年,英国统计学家戈塞特(Gosset),以笔名(Student)陆续在生物计量学杂志上发表了三篇文章:“平均数的概差”、“相关系数的概差”、“论非随机样本平均数的分布”,从而奠定了“小样本理论”的基础,并使他获得了崇高的荣誉。因此t分布也称“学生分布”。小样本理论的先驱称其为服从自由度为n-1的t分布t 分布图形特征 t分布也是对称分布,形状比正态分布更平缓些,当n30时t分布与正态分布很接近。 t分布特征: (1)t分布平均数所处的曲线峰顶低于正态分布; (2)t分布两个尾端的面积按一定比例比正态分布多起来; (3)如果包含曲线下相同的面积,t分布的界

15、限离开平均数更远些。t00.051.7291t02.093-2.0930.0250.025当=0.05,n=20 df=19时,t=1.7291t分布表当=0.05,n=20 df=19时,t=1.7291 =0.10, n=15 t=? =0.05, n=10 t=? =0.025,n=10 t=?(二)如何用t分布进行区间估计正态总体、方差未知、小样本( ) 例题1: 某商场从一批袋装食品中随机抽取10袋,测得每袋重量(单位:克)分别为789、780、794、762、802、813、770、785、810、806,要求以95%的把握程度,估计这批食品的平均每袋重量的区间范围及其允许误差。

16、例题2: 为管理的需要,银行要测定在业务柜台上每笔业务平均所需的时间。假设每笔业务所需时间服从正态分布,现随机抽取样本量为16,测得平均时间为13分钟,标准差为5.6分钟,要求以99%的置信系数确定置信界限。若置信系数改为90%,其置信界限有什么区别? 样本比例的区间估计理论基础:抽样分布总体比例的置信区间1.假定条件两类结果(交替标志或二项总体)大样本条件下可以由正态分布来近似使用正态分布统计量3. 总体比例 的置信区间为:重复抽样:不重复抽样:例题1: 某企业在一项关于职工流动原因的研究中,从该企业前职工的总体中随机选取了200人组成一个样本。在对其进行访问时,有140人说他们离开该企业是

17、由于同管理人员不能融洽相处。试对由于这种原因而离开该企业的人员的真正比例构造95%的置信区间。解:已知 n=200 , p0.7 , 1-= 0.95,/2=1.96结论:我们可以95的置信度保证该企业职工由于同管理人员不能融洽相处而离开的比例在63.6%76.4%之间 例题2: 某厂对一批产品的质量进行抽样检验,采用重复抽样抽取样品200只,样本优质品率为85%,试计算把握程度为90%时优质品率的区间范围。第四节: 样本容量的确定满足条件: 给定的置信度 最大允许误差一、抽样极限误差 抽样极限误差也称允许误差,是指在一定置信度下抽样误差的可能范围。思考:抽样极限误差与估计精度的关系其中抽样极

18、限误差为:二、样本容量的确定 所谓必要的抽样数目,也就是指为了使抽样误差不超过给定的允许范围至少应抽取的样本单位数目。根据均值区间估计公式可得样本容量n为估计总体均值时样本容量的确定 样本容量n与总体方差2、允许误差、可靠性系数Z 之间的关系为与总体方差成正比与允许误差成反比与可靠性系数成正比其中: 例题1: 一家广告公想估计某类商店去年所花的平均广告费用有多少。经验表明,总体方差约为1800000元。如置信度取95%,并要使估计处在总体平均值附近500元的范围内,这家广告公司应抽多大的样本?解:已知2=1800000,=0.05, Z/2=1.96,=500 应抽取的样本容量为: 例题2: 某食品厂要检验本月生产的10000袋产品的重量,根据上月资料,这种产品每袋重量的标准差为25克。要求在95.45%的概率保证程度下,平均每袋重量的误差范围不超过5克,应抽查多少袋产品?不重复抽样:估

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论