统计学-参数估计-课件_第1页
统计学-参数估计-课件_第2页
统计学-参数估计-课件_第3页
统计学-参数估计-课件_第4页
统计学-参数估计-课件_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学--参数估计统计学-从典型案例到问题和思想

经济管理类“十三五”规划教材引言第一节点估计第二节区间估计第六章

参数估计统计推断的过程总体样本样本统计量例如:样本均值、比例、方差总体均值、比例、方差等参数估计假设检验统计方法描述统计推断统计参数估计在统计方法中的地位

【引言】先看一个参数估计应用的案例:二战中苏军是如何破解了德军坦克产量?二战期间,希特勒单方撕毁《苏德互不侵犯条约》,向前苏联的整个西线发动了蓄谋已久的“闪电战”侵略,战场上德军坦克战斗力强,为了保家卫国和打败侵略者,苏军非常想知道:德军总共生产了多少辆坦克?

第六章

参数估计

为解决此问题,苏军了解到德国人在生产坦克方面是从1开始连续编号,即坦克编号服从均匀分布。在战争过程中,苏军缴获了一些德军坦克,并收集了它们的生产编号。苏联统计专家发现:德国坦克生产总数N用最大似然法无偏性后(费歇尔,1925)的点估计结果较好,即N=(1+1÷n)×缴获坦克的最大编号,n是缴获的坦克数。

第六章

参数估计如缴获了50辆坦克,它们的最大生产编号是3000,那么坦克生产总数的点估计是N=(1+1÷50)×3000=3060。以此类推,苏军知道了德军飞机、大炮、枪支数量,并由此推知了德国军事力量的规模。于是,苏军积蓄了充足的军力,联合盟军一起打败了二战中疯狂的德军并占领了柏林。从战后发现的德军记录来看,苏军的这些估计值非常接近真实值。第六章

参数估计

这就是统计学帮助了苏军并打败德军的典型案例,是军事问题、点估计相结合的成果!点估计迄今是统计学的重要方法,本章主要介绍参数估计的基本的内容。第六章

参数估计

一、什么是点估计?我们用样本均值作为总体均值的估计,用样本比例作为总体比例的估计,用样本方差作为总体方差的估计等,这就是点估计。一般地,点估计是用对应的估计量的某个取值直接作为相应总体参数θ的估计值。第一节点估计

估计量:用于估计总体参数的随机变量如样本均值,样本比例、样本方差等例如:样本均值就是总体均值的一个估计量参数用表示,估计量用表示估计值:估计参数时计算出来的统计量的具体值如果样本均值x=80,则80就是的估计值估计量与估计值

点估计举例:例如:对某大学一年级新生的平均月消费μ进行估计,随机抽取100名学生,测得其平均月消费

=1200元,用1200元作为该大学一年级新生的平均月消费μ的一个估计值,即是点估计。再比如:若要估计一批产品的合格率,根据抽样结果合格率为96%,将96%直接作为这批产品合格率的估计值,这也是一个点估计。

第一节点估计

点估计的求解方法主要有

:矩估计法最大似然估计法

第一节点估计

一、矩估计法矩估计法是一种常用的估计方法,其基本思想是,用样本原点矩作为总体原点矩的估计。

第一节点估计

设k个参数

,求k个参数

矩估计

需要建立k个方程,方法是:设总体的一个样本观测值是

,其l阶原点矩

,总体观测量X的l阶原点矩,用样本原点矩Al作为总体原点矩ml的估计,得出k个方程Al=ml(θ)(l=1,…,k),解此方程组得出的

即为参数

的矩估计。

第一节点估计

【例6-1】设总体

的均值

及方差

都存在但均未知,设来自总体

的一个样本是

,求

的矩估计

第一节点估计

解:是两个参数,故需要建立两个方程。因为

即即总体均值的矩估计是样本均值,而总体方差(即总体的二阶中心矩)矩估计是样本二阶中心矩。上述结果表明,求总体均值与方差的矩估计无需知道总体服从什么分布。

第一节点估计

二、最大似然估计法最大似然方法的基本思想是,固定样本观测值

,在可能的取值中,挑选使似然函数达到最大(从而概率p达到最大)的

作为参数θ的估计。这样得到的

称之为参数θ的最大似然估计。因此,求参数θ的最大似然估计问题就转化为求似然函数

的最大值问题了。

第一节点估计

【例6-2】设

未知,

是来自总体的一个样本观测值,求

的极大似然估计。解:是两个参数,故需要建立两个方程。所以似然函数为:

第一节点估计

取对数后,分别对,求偏导数并令其为0,将取为,得两个方程,解此方程组得的最大似然估计:上述结果表明,求总体均值与方差的最大似然估计需要知道总体分布。

第一节点估计

二、估计量的优良性标准对同一参数,用不同的估计方法,可以得到不同的估计量,如典型案例6中德国坦克生产总数N的矩估计量、最大似然估计量就不同。那么,那个估计方法更好呢?这里给出参数估计量的评价标准:无偏性、有效性和一致性,我们称之为估计量的优良性标准。

第一节点估计

1.无偏性设

为总体参数,

的一个估计量,如果

,则称

的无偏估计量。即

重心,

的距离最近。

第一节点估计P(

)BA无偏有偏2.有效性设

为θ的两个无偏估计量,如果有:

,则称

。即对于同一总体参数的两个无偏估计量来说,方差越小的估计量越有效。

第一节点估计AB的抽样分布的抽样分布P(

)3.一致性设

的一个估计量,若当

时,

依概率收敛于

,则称

的一致估计量。此即随着样本容量n的增大,点估计量

越来越接近被估总体参数

第一节点估计AB较小的样本容量较大的样本容量P(

)

可以证明,估计量样本平均

、样本比例p、样本方差

分别是总体平均

、总体比例π、总体方差

的无偏、有效、一致估计量。即满足优良性标准。

第一节点估计

点估计的优点是简洁明了,给出了具体的估计值;缺点是无法提供估计的精度和估计的可靠程度,因此,不能完全依赖于一个点估计值,而是围绕点估计值构造总体参数的一个区间,这就是区间估计。

第二节区间估计

一、区间估计的概念

区间估计就是总体参数θ落在区间估计量内的概率为1-α,即

。称区间

为总体参数θ的置信度为的置信区间。第二节区间估计

对于给定的抽样方法,不同的抽样,就有不同的估计区间在用同样方法构造的总体参数的多个估计区间中,包含总体参数真值的区间所占的比例称为置信水平,表示为(1-。2.为是未包含总体参数的区间所占的比例。常用的置信水平值有99%,95%,90%相应的为0.01,0.05,0.10置信度(置信水平)

置信区间由样本统计量所构造的总体参数的估计区间称为置信区间。其中区间的最小值称为置信下限,最大值称为置信上限。统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间。用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值。

构造参数的区间估计时,要权衡以下两个方面,一是估计量的精度要求,二是估计量的可靠性程度。所谓精度要求就是要把估计误差控制在一定的范围内,我们用极限误差来反映。△越小,表示估计的精度越高;△越大,表示估计的精度越低。所谓可靠性是指区间估计结果正确的概率保证。用置信度来反映。第二节区间估计

在其它条件不变的情况下,置信度与精度二者呈反方向变化,要想提高置信度,置信区间就会增大,精度就会下降;要想提高精度,置信度就会下降。在实际中,通常根据实际问题和研究的需要,选择合适的置信度和精度。第二节区间估计

总体参数符号表示样本统计量均值比例方差一个总体参数的区间估计二、总体均值的区间估计总体均值的区间估计是本章的重点,我们分以下四种情况来讨论。第二节区间估计

1.总体服从正态分布,总体方差

已知根据正态分布再生定理,样本均值

,将

标准化,记

。对于概率可靠程度,有:

第二节区间估计

代入上式,经过不等式的等价变形,得:总体均值在置信度

下的置信区间为:

(6.3)其中:为抽样极限误差。第二节区间估计

影响极限误差的因素1. 总体数据的离散程度,用来测度样本容量,置信水平(1-),影响z的大小

常用置信水平的值置信水平90%95%95.45%99%0.100.050.04550.010.050.0250.022750.0051.6451.9622.58

亦可查标准正态分布表得到。【例6-4】假定某地区企业总经理的年收入服从正态分布,随机抽取n=25个企业,得到25个企业总经理的年平均收入

=135000元。已知总体的标准差为

=55000元,试求该地区企业总经理的年平均收入

在置信度

=95%的置信区间。第二节区间估计

解:总体服从正态分布,且方差

已知,因此,总体均值

在置信度95%下的置信区间为:=。即在95%的概率可靠程度下,此次抽样得该地区企业总经理的年平均收入的置信区间为(113440,156560)元。

第二节区间估计2.对于总体分布未知,大样本(

),根据中心极限定理,样本均值近似服从

,因而同样可以用式(6.3)得出估计区间。

第二节区间估计

3.总体分布未知,方差

未知,大样本此时,我们用总体方差

的无偏估计量

代替,运用中心极限定理,与式(6.3)的证法同理有:总体均值

在置信度

下的置信区间为:

第二节区间估计【例6-5】在一项对大学生资助贷款的研究中,从全国各地随机抽取n=100名贷款的大学生作为样本,得到毕业前的平均欠款余额

=20000元,标准差s=3000元。试求贷款学生总体中平均欠款额μ的

95%的置信区间。

第二节区间估计解:该题为总体分布未知,方差

未知,大样本情形,因此,总体均值μ

在置信度

95%下的置信区间为:=即在置信度95%下,此次抽样得全国贷款学生平均欠款额的置信区间为(19412,20588)元。

第二节区间估计4.总体服从正态分布,总体方差

未知,小样本情况下,总体均值

在置信度下的置信区间见式(6.2)。

第二节区间估计【例6-3】已知某企业生产的灯管寿命服从正态分布,现从一大批灯管中随机抽取n=16只,分别测得寿命(单位:小时)如下:3510345034803460352034963490346034643526353034703516352034943470在概率可靠程度1-α=95%下,求这批灯管平均寿命μ的区间估计。第二节区间估计

解:可算得总体均值点估计:且

查t分布表得:

总体均值

在概率

=95%下的区间估计:=(3476.8,3503.2)即在概率可靠程度95%下,此次抽样得该批灯管平均寿命的区间估计为(3476.8,3503.2)小时之间。第二节区间估计

三、总体比例的区间估计总体比例,是指总体中,具有某种特征的单位个数与全部单位数之比,记为

。现实中,这种问题很多。比如,产品的合格率问题、考试及格率、市场占有率问题等。样本比例,是指样本中,具有某种特征的单位个数与样本容量之比,记为

总体比例是一种特殊的总体均值

第二节区间估计当样本量

充分大(

)时,

近似服从正态分布,将

标准化后有:

与式(6.3)的证法同理有:总体比例

在置信度

下的置信区间为:

(6.4)

第二节区间估计总体比例是未知的,通常用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论