应用统计学：第5章参数估计

上传人：窝*** IP属地：安徽上传时间：2023-10-23 格式：PPT 页数：121 大小：6.21MB 积分：60 举报 版权申诉

已阅读5页，还剩116页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

安徽工程大学第五章参数估计安徽工程大学5.1参数估计的基本概念5.2点估计5.3区间估计5.4必要样本容量的确定安徽工程大学5.1参数估计的基本概念总体样本算术平均数统计量用来推断总体参数的统计量称为估计量（estimator),其取值称为估计值（estimate)。同一个参数可以有多个不同的估计量。参数是唯一的，但估计量（统计量）是随机变量，取值是不确定的。

参数安徽工程大学点估计点估计:用估计量的数值作为总体参数的估计值。一个总体参数的估计量可以有多个

。例如，在估计总体方差时，和都可以作为估计量。安徽工程大学点估计量的常用评价准则：无偏性无偏性：估计量的数学期望与总体待估参数的真值相等：P(

)BA无偏有偏安徽工程大学点估计量的常用评价准则：有效性

在两个无偏估计量中方差较小的估计量较为有效。AB

的抽样分布

的抽样分布P(

)安徽工程大学估计量的常用评价准则：一致性指随着样本容量的增大，估计量越来越接近被估计的总体参数。AB较小的样本容量较大的样本容量

P(X)X安徽工程大学区间估计根据事先确定的置信度1-

给出总体参数的一个估计范围。置信度1-

的含义是：在同样的方法得到的所有置信区间中，有100(1-

)%的区间包含总体参数。

抽样分布是区间估计的理论基础。估计值(点估计)置信下限置信上限置信区间抽样分布SamplingDistribution从总体中抽取一个样本量为n的随机样本，我们可以计算出统计量的一个值。如果从总体中重复抽取样本量为n的样本，就可以得到统计量的多个值。统计量的抽样分布就是这一统计量所有可能值的概率分布。安徽工程大学抽样分布：几个要点抽样分布是统计量的分布而不是总体或样本的分布。在统计推断中总体的分布一般是未知的，不可观测的（常常被假设为正态分布）。样本数据的统计分布是可以直接观测的，最直观的方式是直方图，可以用来对总体分布进行检验。抽样分布一般利用概率统计的理论推导得出，在应用中也是不能直接观测的。其形状和参数可能完全不同于总体或样本数据的分布。安徽工程大学样本均值的抽样分布

=50

=10X总体分布n=4抽样分布Xn=16

一般的，当总体服从

N(μ,σ2)时，来自该总体的容量为n的样本的均值

X也服从正态分布，

X的期望为μ，方差为σ2/n。即

X～N(μ,σ2/n)。安徽工程大学运用EXCEL模拟抽样分布和中心极限定理安徽工程大学安徽工程大学安徽工程大学安徽工程大学安徽工程大学安徽工程大学安徽工程大学安徽工程大学与抽样分布有关的几个定理

切贝谢夫不等式注意：

返回主目录安徽工程大学返回主目录安徽工程大学返回主目录安徽工程大学返回主目录安徽工程大学返回主目录安徽工程大学返回主目录安徽工程大学返回主目录安徽工程大学二、大数定律返回主目录安徽工程大学返回主目录安徽工程大学

贝努里大数定律说明：当独立重复试验进行多次时，随机事件发生的频率是稳定的，在其概率附近摆动，而摆动中心就是概率，即随机事件发生的频率依概率收敛于它的概率。它为概率的统计定义提供了理论依据。根据贝努里大数定律大数定律，若某随机事件发生的概率很小，则其发生的频率也是很小的。返回主目录安徽工程大学返回主目录安徽工程大学

切贝谢夫大数定律说明：对于n个相互独立且具有具有相同的有限的数学期望与方差的随机变量，当n充分大时，经过算术平均所得到随机变量的离散程度是很小的，其取值密集在数学期望附近。它为测量工作中以实际观测值的算术平均值作为测量精确值的近似值这一测量方法提供了理论依据。

返回主目录安徽工程大学为什么叫“中心极限定理”

棣莫弗-拉普拉斯中心极限定理是棣莫弗于1730年给出的概率论历史上第一个中心极限定理.在此后的大约200年中，有关对独立随机变量和的极限分布的讨论一直是概率论研究的中心，故称为“中心极限定理”.问？安徽工程大学三、林德伯格—莱维中心极限定理返回主目录安徽工程大学林德伯格-莱维定理表明:返回主目录安徽工程大学由题意得到数学期望根据随机变量数学期望的性质，计算数学期望返回主目录安徽工程大学返回主目录安徽工程大学返回主目录安徽工程大学例2、袋装食糖用机器装袋，每袋食糖净重的数学期望为100g，标准差为4g，一盒内装100袋，求一盒食糖净重大于10100g的概率。返回主目录安徽工程大学根据随机变量数学期望的性质，计算数学期望返回主目录安徽工程大学所以一盒食糖净重大于10100g的概率为0.0062。返回主目录安徽工程大学四、德莫佛—拉普拉斯定理定理4.22表明:

正态分布是二项分布的极限分布,当n充分大时,可以利用该定理来计算二项分布的概率.德莫佛拉普拉斯返回主目录安徽工程大学下面的图形表明:正态分布是二项分布的逼近.返回主目录安徽工程大学对于一列二项分布r.v，有近似近似的图形为棣莫弗-拉普拉斯中心极限定理的应用于是当

充分大时，可以认为

近似安徽工程大学Ox-8-7

-6

-5

-4

-3

-2

-1

12345678记则近似高尔顿钉板试验？什么曲线共15层小钉小球碰第层钉后向右落下小球碰第层钉后向左落下高尔顿(FrancisGalton,1822-1911)英国人类学家和气象学家安徽工程大学解由定理四,随机变量Z近似服从正态分布N(0,1),例1返回主目录安徽工程大学其中返回主目录安徽工程大学返回主目录安徽工程大学

某保险公司的老年人寿保险有1万人参加,每人每年交200元.若老人在该年内死亡,公司付给家属1万元.设老年人死亡率为0.017,试求保险公司在一年内的这项保险中亏本的概率.解设X为一年中投保老人的死亡数,由德莫佛－拉普拉斯定理知,例2返回主目录安徽工程大学保险公司亏本的概率返回主目录安徽工程大学德莫佛资料AbrahamdeMoivreBorn:26May.1667inVitry(nearParis),France

Died:27Nov.1754inLondon,England返回主目录安徽工程大学拉普拉斯资料Pierre-SimonLaplaceBorn:23Mar.1749inBeaumont-en-Auge,Normandy,France

Died:5Mar.1827inParis,France返回主目录安徽工程大学一、点估计问题的提法

设总体的分布函数形式已知,但它的一个或多个参数为未知,借助于总体的一个样本来估计总体未知参数称为点估计问题.5.2点估计安徽工程大学二、估计量的求法

由于估计量是样本的函数,是随机变量,故对不同的样本值,得到的参数值往往不同,求估计量的问题是关键问题.点估计的求法:(两种)矩估计法和最大似然估计法.安徽工程大学一、

矩估计法

其基本思想是用样本矩估计总体矩.

理论依据:

它是基于一种简单的“替换”思想建立起来的一种估计方法.是英国统计学家K.皮尔逊最早提出的.大数定律安徽工程大学

安徽工程大学矩估计法的具体步骤:安徽工程大学矩估计量的观察值称为矩估计值.例

设总体服从泊松分布，

求参数的估计量.解：设是总体的一个样本,由于,可得

安徽工程大学解例2安徽工程大学解方程组得到a,b的矩估计量分别为安徽工程大学解解方程组得到矩估计量分别为例3安徽工程大学上例表明:

总体均值与方差的矩估计量的表达式，不因不同的总体分布而异.一般地:安徽工程大学

矩法的优点是简单易行,

缺点是，当总体类型已知时，没有充分利用分布提供的信息.一般场合下,矩估计量不具有唯一性.安徽工程大学

例4设总体的分布密度为

为总体的样本,求参数的矩估计量.

解：由于只含有一个未知参数，一般只需求出便能得到的矩估计量，但是安徽工程大学

即不含有,故不能由此得到的矩估计量.为此,求

故令

于是解得的矩估计量为

安徽工程大学二、最大（极大）似然估计法最大似然法是在总体类型已知条件下使用的一种参数估计方法.

它首先是由德国数学家高斯在1821年提出的,然而，GaussFisher这个方法常归功于英国统计学家费歇

费歇在1922年重新发现了这一方法，并首先研究了这种方法的一些性质.安徽工程大学1.最大似然估计法最大似然估计法，是建立在最大似然原理的基础上的求点估计量的方法。最大似然原理的直观想法是：总体的分布形式已知的情况下，未知参数可以取很多值，在一次抽样中获得一组观测值，说明该组观测值出现的概率最大，因此参数的取值应该是所有可能取值中使样本观测值出现的概率最大。

安徽工程大学（或分2.似然函数设总体的分布律为，其中是未知参数，是总体的一个样本,为

布密度为）则样本，当给定样本值后，它只是参数的函数，记为即的分布律安徽工程大学则称为似然函数。似然函数实质上是样本的分布律或分布密度。安徽工程大学定义设总体的分布密度（或分布律）为，其中为未知参数。又设是总体的一个样本值，如果似然函数（6.1）安徽工程大学

替换成样本分别为似然估计值。需要注意的是，最大似然估计值依赖于样本值，即若将上式中样本值则所得的

的最大安徽工程大学

称为参数的最大似然估计量。

由于而与在同一处达到最大值，为最大似然估计的必要条件为称它为似然方程，其中（6.2）因此，安徽工程大学求最大似然估计量的一般步骤为：（1）求似然函数（2）一般地，求出及似然方程

（3）解似然方程得到最大似然估计值

（4）最后得到最大似然估计量

安徽工程大学解似然函数例1安徽工程大学这一估计量与矩估计量是相同的.安徽工程大学解

似然函数为例2安徽工程大学安徽工程大学它们与相应的矩估计量相同.安徽工程大学解例3安徽工程大学安徽工程大学安徽工程大学三、小结两种求点估计的方法:矩估计法最大似然估计法

在统计问题中往往先使用最大似然估计法,

在最大似然估计法使用不方便时,

再用矩估计法.安徽工程大学费希尔资料RonaldAylmerFisherBorn:17Feb1890inLondon,England

Died:29July1962inAdelaide,Australia安徽工程大学5.3区间估计区间估计的具体做法是，构造两个统计量及且，用区间来估计未知参数的可能取值范围，要求落在区间的概率尽可能的大。通常，我们事先给定一个很小的数按概率估计总体参数可能落入区间的概率。称为置信度或置信水平,称为检验水平(估计不成功的概率),区间称为置信度为的置信区间。安徽工程大学1．标准差已知时，均值的区间估计一、正态总体数学期望的区间估计对于正态分布总体（对其他分布的总体，当容量

30时，可近似看成正态分布）如果已知总体标准差为，样本均值为，则在置信度下总体均值的置信区间为

（8.16）其中：为样本容量，为标准正态分布的双侧分位点，即安徽工程大学中心在置信区间中，为点估计值。置信区间实际上是以为中心，以为半径的区间。我们将称为边际误差。边际误差安徽工程大学案例5.3CJW公司是一家专营体育设备和器材的邮购公司.为了跟踪服务质量,CJW每个月选取100位顾客的邮购订单组成简单随机样本.每位顾客对公司的服务水平在0(最差等级)到100(最好等级)间打分,然后计算样本平均值.根据以往的资料显示,每个月顾客满意得分的平均值都在变动,但满意得分的样本标准差趋于稳定的数值20附近.所以我们假定总体标准差为20.又最近一次顾客对CJW满意程度的平均值为82.试求置信度为95%的总体均值的置信区间。安徽工程大学

样本容量大于30，近似按正态分布处理。总体方差，样本均值。置信度为，则。通过查正态分布表得，代入公式（10.1）得置信度为95%时，顾客满意度的边际误差为，所以置信区间为即。即有95%的把握认为顾客的满意分数落在区间内。解：安徽工程大学案例5.4在一批包装商品中，抽取100个小包装袋，已知样本的质量平均数是21克，总体标准差为6克，在置信度为95%的要求下，计算置信区间。解：计算平均误差：

置信区间的上限是：

置信区间的下限是：

即这批小包装的质量平均在22.18至19.82之间，可信度为95%。

安徽工程大学2．标准差未知时，均值的区间估计对于正态分布总体（对其它分布的总体，当样本容量30时，可近似看成正态分布）如果已知样本均值为，但总体标准差为未知，则总体均值在置信度下的置信区间为

（**）其中，为自由度为的分布的双侧分位点，为样本容量，为样本标准差即。安徽工程大学（**

）式说明，总体标准差为未知时，总体均值的置信区间为以为中心，以为边际误差的区间。中心边际误差安徽工程大学案例5.5斯切尔公司对培训企业维修工的计算机辅助程序感兴趣.为了了解这种计算机辅助程序能缩短多少培训时间,需要评估这种程序在95%置信水平下培训时间平均值的置信区间。已知培训时间总体是正态分布，管理者对15名维修工进行了测试，所得培训时间如表6-2所示，试估计95%置信水平下总体均值的置信区间。维修工编号

123456789101112131415培训天数

524455444559505462465458606263表6-215名维修工的培训天数

返回案例6.10

安徽工程大学解：已知总体是正态分布，但总体方差未知，应用（**

）式进行计算，首先计算样本均值和样本方差.置信水平为95%，则,自由度为,查表得所以边际误差：

安徽工程大学因而由（**

）式在应用辅助程序后该公司培训维修工时间在95%置信度下的置信区间为即：安徽工程大学案例5.6表5-3列出了选取36名投保人组成的简单随机样本的年龄数据。在90%置信水平下，求总体年龄均值的置信区间。表5-3投保人样本的年龄安徽工程大学解：总体分布未知，但样本量为，大于30。近似看成正态分布处理。由于总体的方差未知，所以应用(**)式来求总体的置信区间从表6-3中通过计算可得，样本均值为39.5岁，这是总体均值的点估计。在置信度为90%时:

另可算得样本标准差:安徽工程大学所以在90%的置信度下，总体年龄均值的置信区间为，即：安徽工程大学案例5.7

《纽约时报1988年年鉴》公布了各行业每人每周的平均工作收入。在服务行业，假如由36名服务业人士组成的样本的个人周收入均值为369美元，样本标准差为50美元。计算服务业人士周收入总体均值的95%置信区间。解：总体分布未知，样本容量，可近似为正态分布抽样。由于总体方差未知，应用（**

）式处理。置信度为95%，，自由度

安徽工程大学所以服务业人士总体均值的95%置信区间为

即（352.0825，385.9175）.安徽工程大学二、正态总体方差的区间估计对于未知方差的正态分布总体，因统计量所以对给定的置信度，由分布有成立，即有成立。安徽工程大学而均方差的置信区间为故的置信区间为安徽工程大学案例5.8

计算案例5.7中服务业人士总体标准差的95%置信区间。解：将以上数据代入公式得总体标准差的95%置信区间为(44.5542,65.2225).由案例6.7已知样本容量，样本标准差，置信度，查表得安徽工程大学三、两个总体均值之差的

区间估计(独立大样本)

2在1-

置信水平下的置信区间独立大样本(n1

30，n2

30)(

)±分位数值×(x1-

x2)的标准误差安徽工程大学两个总体均值之差的区间估计

(独立小样本:

12=

)两个正态总体，未知但相等：

1２=

2２两个独立小样本(n1<30和n2<30)估计量

x1-x2的标准化总体方差的合并估计量安徽工程大学两个总体均值之差的估计

(例题分析—独立小样本)【例】为估计两种方法组装产品所需时间的差异，分别对两种不同的组装方法各随机安排12名工人，每个工人组装一件产品所需的时间(单位：分钟)下如表。假定两种方法组装产品的时间服从正态分布，且方差相等。试以95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间两个方法组装产品所需的时间方法1方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.521安徽工程大学两个总体均值之差的估计

(例题分析—独立小样本)解:根据样本数据计算得合并估计量为两种方法组装产品所需平均时间之差的置信区间为0.14分钟~7.26分钟安徽工程大学四、一个总体比例的区间估计(传统方法)设总体服从二项分布，即X~(n，p)，P为n次独立伯努利试验成功的概率试验次数n非常大(np≥10；n(1-p)≥10)，否则该方法不能用当样本很小时，传统方法计算出的1-

置信水平下的置信区间能够覆盖总体真实比例的概率小于小于1-

传统方法仍被广泛使用当样本量非常大时，传统方法与现代方法的结果几乎相同。小样本情况下，现代方法更适用总体比例

在1-

置信水平下的置信区间样本比例±分位数值×样本比例的标准误差安徽工程大学一个总体比例的区间估计

(传统方法)总体比例在1-

置信水平下的置信区间样本比例p的标准化安徽工程大学一个总体比例的区间估计

(传统方法)【例】某城市想要估计下岗职工中女性所占的比例，随机地抽取了100名下岗职工，其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间解：已知

n=100，p＝65%,1-=95%，z/2=1.96该城市下岗职工中女性比例的置信区间为55.65%~74.35%

安徽工程大学设两总体都服从二项分布，即X1~(n1，p1)，X2~(n2，p2)。x1为n1次独立伯努利试验成功的次数，P1位成功的概率概率，x2

为n2次独立伯努利试验成功的次数，P2为成功的概率试验次数n1和n2都非常大(n1p1≥10，n1(1-p1)≥10；n2p2≥10，n2(1-p2)≥10)，否则该方法不能用对于大样本，传统方法的结果与现代方法比较接近，但对于小样本，传统方法计算出的1-

置信水平下的置信区间能够覆盖总体真实比例的概率小于小于1-

两个总体比例之差的区间估计

(传统方法)比例之差

1-2在1-

置信水平下的置信区间(p1-p2)±分位数值×(p1-p2)的标准误差安徽工程大学p1-p2的标准化两个总体比例之差的区间估计

(传统方法)

1-2在1-

置信水平下的置信区间安徽工程大学五、正态总体在对均值的区间估计中所需的样本容量在对方差已知的正态分布总体均值进行区间估计时，边际误差为

和样本容量共同确定了边际误差。一旦确定了置信水平，也就确定了。此时影响边际误差的唯一因素就是样本容量。如果对边际误差水平（用表示）有约定，则需要的样本容量也就唯一确定了。两个未知变量

和样本容量共同确定了边际误差。一旦确定了置信水平，也就确定了。此时影响边际误差的唯一因素就是样本容量。如果对边际误差水平（用表示）有约定，则需要的样本容量也就唯一确定了。安徽工程大学样本容量的公式推导如下：令代表希望的边际误差解出样本容量的表达式

在给定的置信水平下，该样本容量满足所希望的边际误差。安徽工程大学案例5.10在案例5.5所述斯切尔公司的培训安排中，计划总体标准差为。如果希望的边际误差为2天，置信度为95%，样本容量应该为多大？解：由题意知：则。查表得，代入（6.21）式有：

所以，应该抽取至少45个样本。安徽工程大学注意：公式要求总体标准差是已知的。当未知时。通常用样本标准差代替总体标准差。

案例5.11在《华尔街日报》的纽约股票交易所(NewYorkStockExchange)版面上，给出了每支股票52周以来每股最高价、最低价、分红率、价格/收益(P/E)比率、日成交量、日最高价、日最低价、收盘价等信息。每支股票的P/E比率由公司最近四个季度公布的每股收益除价格得到。在一次大样本的抽查中，样本方差（theWallStreetJoural,1998.3.19）。假定我们要求对纽约股票交易列示的所有股票P/E比率的总体均值进行估计，要求95%置信度下的边际误差，则样本容量应包含多少支股票？安徽工程大学解：由于是大样本抽样，可将总体视为正态分布。总体标准差未知，用样本标准差代替，即。置信度则，通过查表得，代入公式有：所以按要求，样本容量应包含26支股票。安徽工程大学六、正态总体在对总体比率的区间估计中所需的样本容量现在考虑在给定边际误差时，应选用的多大的样本容量来估

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

应用统计学：第5章参数估计

文档简介

温馨提示

最新文档

评论

应用统计学：第5章 参数估计

文档简介

温馨提示

最新文档

评论

相关文档

应用统计学：第5章参数估计