第六讲 参数估计.ppt_第1页
第六讲 参数估计.ppt_第2页
第六讲 参数估计.ppt_第3页
第六讲 参数估计.ppt_第4页
第六讲 参数估计.ppt_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六讲 参数估计,山东工商学院计算机学院,参数估计,2-1,通过子样对总体未知参数进行估计,内 容,参数的点估计,参数的区间估计,什么是参数估计?,参数是刻画总体某方面概率特性的数量.,当此数量未知时,从总体抽出一个子样, 用某种方法对这个未知参数进行估计就 是参数估计.,例如,X N ( , 2),若, 2未知, 通过构造样本的函数, 给出 它们的估计值或取值范围就是参数估计 的内容.,参数估计的类型,点估计 估计未知参数的值,区间估计 估计未知参数的取值范围, 并使此范围包含未知参数 真值的概率为给定的值.,最大似然估计法,思想方法:一次试验就出现的 事件有较大的概率,例如: 有两外形相同

2、的箱子,各装100个球 一箱 99个白球 1 个红球 一箱 1 个白球 99个红球,现从两箱中任取一箱, 并从箱中任取一球, 结果所取得的球是白球.,答: 第一箱.,7-17,问: 所取的球来自哪一箱?,最大似然法,称这样得到的,为参数 的极大似然估计值,称统计量,为参数 的极大似然估计量,7-22,最大似然法的思想,若 X 连续, 取 f (xi, )为Xi 的密度函数,似然函数为,7-23,注1,注2,未知参数可以不止一个, 如1, k,设X 的密度(或分布)为,则定义似然函数为,若,关于1, , k可微,则称,为似然方程组,若对于某组给定的样本值 x1, x2, xn, 参数 使似然函数

3、取得最大值, 即,则称,为1, k 的极大似然估计值,7-24,点估计用一个确定的值去估计未知的参数,具有较大的风险。 因为估计量来自于一个随机抽取的样本,结果也就带有随机性。,区间估计,一置信区间概念 对于未知参数 ,除了得到它的点估计 外,我们还希望估计出一个范围,并希望知道 这个范围包含参数真值 的可信程度这样的范围通常以区间的形式给出,而可信程度由概率给出这种估计称为区间估计或置信区间,以下先给出置信区间概念,定义 设 为总体X的一个未知参数, 是预先给定一个数, , 是 两个估计量,如果 (7-10) 则称随机区间 为未知参数 的一个置信度为 的置信区间(Confidence Int

4、erval)置信度也常称为置信水平(confidence level)或置信系数(confidence coefficient)通常 取0.05,0.01,0.10,视具体需要而定,6.1 常见分布的参数估计,命令 二项分布的参数P的点估计值和置信区间 函数 binofit 格式,p、pci分别是二项分布中参数 的点估计及区间估计值。,p,pci=binofit(x,alpha) 二项分布的估计函数,案例1 对一大批产品进行质量检验时,从100个样本中检得一级品60个,求这批产品的一级品率p的置信区间(设置信度为0.95%)。,解:,在MATLAB命令窗口输入 R=60;n=100; alph

5、a=0.05; phat,pci=binofit(R,n,alpha),回车键,显示:,phat =0.6000,pci =0.4972 0.6967,一级品率p是二项分布分布 的参数,我们可用二项分布的命令求解。同时,由于样本容量 ,我们还可将总体分布近似看成正态分布。在本例中,我们选用二项分布的命令来求解。,所以的p的置信度为0.95的置信区间为(0.50,0.70)。,案例2 调查某电话呼叫台的服务情况发现:在随机抽取的200个呼叫中,有40%需要附加服务(如转换分机等),以p表示需附加服务的比例,求出p的置信度为0.95的置信区间。,解:,在MATLAB窗口中输入 R=200*0.4;

6、n=200;alpha=0.05; phat,pci=binofit(R,n,alpha),回车键,显示:,phat =0.4000 ,pci =0.3315 0.4715,总体 服从二项分布 , 参数n200, 。,所以得p的置信度为0.95的置信区间为(0.332,0.472),6.1 常见分布的参数估计,命令 均匀分布的参数估计 函数 unifit 格式,a、b、aci、bci分别是均匀分布中参数a,b的点估计及区间估计值。,a,b,aci,bci=unifit(x,alpha) 均匀分布的估计函数,案例3 产生 100 行 2 列服从区间(10, 12)上的均匀分布的随机数, 计算区间

7、端点“a”和“b” 的极大似然估计值 解 在命令窗口中输入: r = unifrnd(10, 12, 100, 2); ahat, bhat = unifit(r) 回车后显示: ahat = 10.0154 10.0060 bhat = 11.9989 11.9743 结果表明: 以第一列随机数为例, 区间端点a和b的极大似然估计值分别是 10.0154(比“10”略大)和 11.9989(比“12”略小).,6.1 常见分布的参数估计,命令 指数分布的参数估计 函数 expfit 格式 lambdahat=expfit(x) %根据指数分布样本数据x, 计算并返回指数分布 参数 lambd

8、a 的极大似然估计值;,lam,lamci=expfit(x,alpha) 指数分布的估计函数,lam、lamci分别是指数分布中参数 的点估计及区间估计值,案例4 产生 1 行100 列的参数为 3的指数分布的随机数, 计算 “”的极大似然估计值. 解 在命令窗口中输入: r=exprnd(3,1,100); lambdahat=expfit(r) 回车后显示: lambdahat= 2.6787,案例5 设电池的寿命服从指数分布,其概率密度为,随机地取50只电池投入寿命试验, 规定试验进行到其中有15只失效时结束试验, 测得失效时间(小时)为115, 119, 131, 138, 142,

9、 147, 148, 155, 158, 159, 163, 166, 167, 170, 172. 试求电池的平均寿命的极大似然估计值和置信水平为98%的置信区间, x=115 119 131 138 142 147 148 155 158 159 163 166 167 170 172; lamdahat,lambdaci=expfit(x,0.02) lamdahat = 150 lambdaci = 88.4222 300.9338 结果表明:平均寿命的极大似然估计值为150小时,置信水平为0.98的平均寿命的置信区间为88.4222 , 300.9338,6.1 常见分布的参数估计,

10、命令 正态分布的参数估计 函数 normfit 格式 muhat,sigmahat,muci,sigmaci = normfit(X) muhat,sigmahat,muci,sigmaci = normfit(X,alpha),mu,sig,muci,sigci=normfit(x,alpha),Muci、sigci分别为分布参数 、 的区间估计。,x为向量或者矩阵,为矩阵时是针对矩阵的每一个列向量进行运算的。,alpha为给出的显著水平 (即置信度 ,缺省时默认 ,置信度为95),mu、sig分别为分布参数 、 的点估计值。,案例6 从某超市的货架上随机抽取9包0.5千克装的食糖,实测其重

11、量分别为(单位:千克):0.497,0.506,0.518,0.524,0.488,0.510,0.510,0.515,0.512,从长期的实践中知道,该品牌的食糖重量服从正态分布 。根据数据对总体的均值及标准差进行点估计和区间估计。,解:,在MATLAB命令窗口输入 x=0.497,0.506,0.518,0.524,0.488,0.510,0.510,0.515,0.512; alpha=0.05; mu,sig,muci,sigci=normfit(x,alpha),mu =0.5089,回车键,显示:,sig =0.0109,muci = 0.5005 0.5173,sigci =0.

12、0073 0.0208,结果显示,总体均值的点估计为0.5089,总体方差为0.109。在95%置信水平下,总体均值的区间估计为(0.5005,0.5173),总体方差的区间估计为 (0.0073,0.0208)。,案例7 某厂用自动包装机包装糖,每包糖的质量 某日开工后,测得9包糖的重量如下:99.3,98.7,100.5,101.2,98.3,99.7,102.1,100.5,99.5(单位:千克)。分别求总体均值 及方差 的置信度为0.95的置信区间。,解:,在MATLAB命令窗口输入 x=99.3,98.7,100.5,101.2,98.3,99.7,102.1,100.5,99.5;

13、 alpha=0.05; mu,sig,muci,sigci=normfit(x,alpha),mu = 99.9778,回车键,显示:,sig =1.2122,muci = 99.0460 100.9096,sigci =0.8188 2.3223,所以得,总体均值 的置信度为0.95的置信区间为 (99.05,100.91),总体方差 的置信度为0.95的置信区间为(0.81882,2.32232)=(0.67,5.39),案例8,分别使用金球和铂球测定引力常数 (1)用金球测定观察值为:6.683 6.681 6.676 6.678 6.679 6.672 (2)用铂球测定观察值为:6.

14、661 6.661 6.667 6.667 6.664 设测定值总体为,和为未知。对(1)、(2)两种情况分别求和的置信度为0.9的置信区间。,X=6.683 6.681 6.676 6.678 6.679 6.672; Y=6.661 6.661 6.667 6.667 6.664; mu,sigma,muci,sigmaci=normfit(X,0.1) %金球测定的估计 MU,SIGMA,MUCI,SIGMACI=normfit(Y,0.1) %铂球测定的估计,对于X mu = 6.6782 sigma = 0.0039 muci = 6.6750 6.6813 sigmaci = 0.

15、0026 0.0081,对于Y MU = 6.6640 SIGMA = 0.0030 MUCI = 6.6611 6.6669 SIGMACI = 0.0019 0.0071,结果表明,金球测定的均值估计值为6.6782 ,置信区间为6.6750, 6.6813,标准差估计值为 0.0039,置信区间为0.0026,0.0081, 而铂球的均值估计值为6.6640 ,置信区间为6.6611, 6.6669,标准差估计值为 0.0030,置信区间为0.0019,0.0071, 可见铂球测定的精确度高(标准差小, 关于总体期望和总体标准差置信区间长度相对要小),命令 利用mle函数进行参数估计 函

16、数 mle 格式 phat=mle(dist, X) dist为分布函数名,如:beta(分布)、bino(二项分布)等, X为数据样本 返回用dist指定分布的最大似然估计值 phat, pci=mle (dist, X) 置信度为95% phat, pci=mle (dist, X, alpha) 置信度由alpha确定,alpha为显著水平,(1-)x100%为置信度 phat, pci=mle (dist, X, alpha, pl) 仅用于二项分布,pl为试验次数。,参数估计函数表,案例9 产生200个概率p为0.75的实验次数N=50的二项分布的随机数,求出置信度为0.95的参数p的置信区间 解:在命令窗口输入: X=binornd(50,0.75,200,1); p,pci=mle(bino,X,o.05,50) p = 0.7525 pci = 0.7439 0.7609,结论与总结,参数估计是数理统计中一个基本的重要问题, 就是用样本对总体的未知参数做出估计, 分为点估计和区间估计; 参数估计方法在各个方面具有广泛的应用. 本试验用 MATLAB软件工具箱中提供的参数估计函数 normfit, exp

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论