概率论与数理统计第四章统计估值_第1页
概率论与数理统计第四章统计估值_第2页
概率论与数理统计第四章统计估值_第3页
概率论与数理统计第四章统计估值_第4页
概率论与数理统计第四章统计估值_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章统计估值学习要求掌握参数点估计之概念;掌握矩法估计和极大似然估计之求解方法,理解矩法估计、极大似然估计的基本思想,了解矩法估计、极大似然估计的性质;掌握估计量评价标准的定义,能判断估计量是否满足相应性质;掌握区间估计问题(置信区间,置信度)的定义,了解置信区间的一般求解方法;掌握单、双正态总体参数的置信区间的求解。重点难点重点:点估计的概念;矩法估计和极大似然估计的求解方法;估计量评价标准的定义;单正态总体参数的置信区间的求解。难点:极大似然估计的求解方法;矩法估计和极大似然估计的性质;置信区间的一般求解方法。内容提要统计估值就是利用样本所提供的信息,对总体的未知参数或数字特征做出估计或推断的方法,又称参数估计。参数估计有点估计和区间估计两种基本形式。所谓点估计,是指用一个适当的统计量的值作为参数的近似值,称该统计量为该参数的估计量;而区间估计是指用两个统计量所界定的区间来指出真实参数值的大致范围。统计质量控制指使用统计技术进行质量控制,控制图是质量控制中最重要的方法,确定控制图的上下限要用到区间估计的基本思想。第一节参数的点估计一、点估计的概念设…是来自总体的一个样本,(…)为样本…的观察值,为了估计未知参数,我们构造一个统计量g(…),然后用g(…)的值g(…)来估计的真值。称g(…)为的估计量,记作(…),(…)为的估计值,记作(…)。我们把估计量和估计值统称为点估计。应特别注意,(…)为的估计量,为随机变量;(…)为的估计值,为一个具体的数值。二、矩法估计1、基本思想以样本矩估计相应总体矩,用样本矩的相应函数估计总体矩的函数,通过方程解出未知参数的方法称为矩法,所得的估计量称为矩估计量。其基本思想是:如果总体中有k个未知参数,通常用前k阶样本矩估计相应的前k阶总体矩,然后利用未知参数与总体矩的函数关系,求出参数的估计量,即为矩估计量。2、基本步骤设总体X的分布函数含有个未知参数,且分布的前阶矩存在,它们是的函数,此时求出的矩估量的具体步骤如下:①求出,并假设 ②解上面的方程组③在②中,用代替(j=1,2,…k),则得的矩估计量。④如果有样本值,则将他们带入③得到的矩估计值。特别注意:如果①和②中出现总体的中心矩等,这时可用代替。矩法估计的优点是计算简单,且在总体分布未知场合也可使用。缺点是不唯一,例如泊松分布,由于其均值和方差都是,因而可以用其样本均值去估计,也可以用样本方差去估计;此外样本各阶矩的观测值受异常值影响较大,从而不够稳健。三、极大似然估计在已知总体的概率分布时,对总体进行次观测,得到一个样本,选取使样本值出现概率最大的那个作为未知参数的真值的估计是最合理的(这里是一参数族)。离散分布场合,似然函数为连续分布场合,似然函数为求极大似然估计的一般步骤:1、由总体分布导出样本的联合概率函数(或联合密度);2、把样本联合概率函数(或联合密度)中自变量看成已知常数,而把参数看作自变量,得到似然函数;3、求似然函数的最大值点(常转化为求对数似然函数的最大值点);4、在最大值点的表达式中,用样本值代入就得参数的极大似然估计值.极大似然法是参数估计问题中最重要的一种点估计方法,其主要优点是:有优良的统计性质和好的近似分布,可用来作参数的区间估计和假设检验;有一整套完整、成熟的数值算法;基于似然原理的似然比检验是一种理论上和应用上都非常重要的检验方法。极大似然法的思想和方法渗透到统计学的各个分支,与各种各样的统计推断方法有直接或间接的联系。第二节点估计优劣的评价标准对于同一个未知参数,用不同的估计法得到的点估计量一般是不相同的,那么哪一个估计量更好呢?为此我们需要建立判别估计量好坏的标准,而参数的所谓“最佳估计量”应当是在某种意义下最接近于。最佳估计量应具有下列性质:一、无偏性由于未知参数的点估计量是一个随机变量,点估计量与未知参数之间有误差,我们希望在的真值附近摆动,即希望估计量的期望值等于参数的真值。若的数学期望E()=,则称是参数的无偏估计量。设样本观测值为,则称为参数的无偏估计值。二、有效性一个未知参数可能有许多无偏估计量,在这些无偏估计量中哪个更好些?我们希望估计量的取值能集中在被估参数的附近,即估计量的方差越小越好。设=与=都是参数的无偏估计量,若<则称较有效。当样本容量一定时,若的所有无偏估计量中,的方差最小,则称是参数的有效估计量。三、一致性估计量的无偏性和有效性都是在样本容量固定的情况下考虑的。而当增大时,估计量会怎样变化也是我们关心的问题。设是的估计量,若对任意正数,有或恒成立,则称是的一致估计量。对于未知参数的估计量,我们可以运用无偏性、有效性、一致性来判断其优劣,以便选择出较好的估计量。第三节参数的区间估计如前所述,点估计是用一个点(即一个数)去估计未知参数。顾名思义,区间估计就是根据样本求出未知参数的一个估计区间,并使这个区间包含未知参数的可靠程度达到预定的要求。例如,估计明年的GDP增长在9%-10%之间,比说增长9.5%更容易让人相信,因为给出9%-10%已把可能出现的误差考虑到了。一、区间估计的概念(一)置信区间的概念设总体的分布中有未知参数,,由样本确定两个样本函数、,如果对于给定的有则称随机区间称为参数的置信度为的双侧置信区间,称为置信下限,称为置信上限。一旦有了样本值,区间的端点也随之确定,即区间(,)。几点说明:1、为一个随机区间,它的两个端点、是两个统计量。2、的含义:如取=95%,就是说若对某一参数取100个容量为100的样本,用相同的方法做100个置信区间,,那么其中有95个区间包含。因此当我们实际上只做一次区间估计时,我们有理由认为它包含了真参数。这样判断当然也可能犯错误,但犯错误的概率只有5%.3、置信度(可信度),根据研究目的而确定,一般取4、置信区间的分类:(1)双侧置信区间(2)单侧置信区间:下侧置信区间上侧置信区间(二)求双侧置信区间的一般步骤如下:1.构造合适的包含待估参数的估计量(不含其它未知参数),的分布必须已知。2.给定置信度,定出两个常数,,使,一般定法是由定出,。注意:这里的U2就是U的分布的上分位点,若U的密度函数为偶函数,则=即有称为的分布的双侧分位点。3.若能从得到等价的不等式,其中,都是统计量,那么就是的一个置信度为的双侧置信区间。估计量(或样本函数)的构造,通常可以从的点估计着手考虑。二、一个正态总体参数的区间估计1、总体均值的置信区间:(1)已知时,(2)未知时,2、总体方差的置信区间:第四节产品质量统计控制一、产品质量统计控制的一般问题统计质量控制指使用统计技术进行质量控制,这些技术包括频率分布的应用、主要趋势和离散的度量、控制图、回归分析、显著性检验等。质量管理理论与实践的发展通常是三个阶段:质量检验阶段、统计质量控制阶段和全面质量管理阶段。质量检验阶段从操作者质量管理发展到检验员质量管理,对提高产品质量有很大的促进作用。但随着社会科技、文化和生产力的发展,显露出质量检验阶段存在的许多不足:事后检验、全数检验、。“事后检验”、“全数检验”、“破坏性检验”存在的不足引起了人们的关注,一些质量管理专家、数学家开始注意质量检验中的弱点,并设法运用数理统计的原理来解决这些问题。统计质量控制阶段的特点是把过去的以事后检验和把关为主转变为以预防和改进为主,依靠科学的管理理论、程序和方法,使生产过程处于受控制状态,以达到保证和提高产品质量或服务质量的目的。一个具体产品,常需用多个指标来反映它的质量。根据质量指标性质的不同,质量特性值可分为计数值和计量值两大类。当质量指标可以取某范围内的任何一个可能的数值时,这样的特性值称之为计量值。如用各种计量工具测量的数据如长度、重量、温度等就是计量值。当质量特性值只能取一组特定的数值,而不能取这些数值之间的数值时,这样的特性称为计数值。计数值可进一步分为计件值和计点值。计件值是指产品进行按件检查时所产生的属性,如一批产品中的合格数、废品数等;计点值是指每件产品中质量缺陷的个数,如棉布上的疵点数,铸件上的砂眼数等。不同类的质量特性值所形成的统计规律不同,从而形了不同的控制方法。二、计量控制计量控制所确定的控制对象即质量指标应能够定量,所控制的过程必须具有重复性,即表现出统计规律性,

所确定的控制对象的数据应为连续值。计量型数据服从正态分布。

三、计件控制和计点控制计件和计点控制对象只能定性不能而不能定量,

只有两个取值。计件型数据服从二项分布,计点型数据服从泊松分布。四、控制图的观察分析CLLCLUCL1 5样本序号质量特CLLCLUCL1 5样本序号质量特性图4-4-1控制图控制图的基本样式如图4-4-1所示。横坐标为样本序号,纵坐标为产品质量特性,图上三条平行线分别为:实线CL——中心线,虚线UCL——上控制界限线,虚线LCL——下控制界限线。在生产过程中,定时抽取样本,把测得的数据点一一描在控制图中。如果数据点落在两条控制界限之间,且排列无缺陷,则表明生产过程正常,过程出于控制状态,否则表明生产条件发生异常,需要对过程采取措施,加强管理,使生产过程恢复正常。例题分析1.设总体的概率密度函数为其中,为未知参数。是取自总体的一个简单随机样本。(1)求未知参数的极大似然估计量。(2)求未知参数的矩估计量。解:(1)其似然函数为:当时,。令,即。解之得。故为的极大似然估计量。(2),为总体一阶原点矩。,为样本一阶原点矩,即样本均值。令,即解之,得的矩估计量为:2.有n道判断对错的测验题,一人随意猜答,答对的概率记为p,求出参数、的矩法估计量。解:

答对题数记为X,则~,从总体中获取样本,因为总体的一阶原点矩为,二阶中心矩为。样本的一阶原点矩为,二阶中心矩为,则令

解得参数、的矩法估计量为,。3.设每天上午10:00-11:00点来到某公共汽车站等候公共汽车的人数服从参数为的泊松分布,求的极大似然估计。解:

因为总体,分布列为则似然函数为对数似然函数为求关于的导数,得解得

4.设是取自下列指数分布的一个样本:

证明是的无偏、一致估计,并求出的方差。证:

因为

所以是的无偏估计。而的方差为

又因为,对于任意的,有

成立,故是的一致估计。5.在某社区随机抽取40名男子的身高进行调查,得其平均身高为168厘米,已知该社区全体男子身高的标准差为8厘米,试求总体均值(该社区全体男子平均身高)u的0.95的置信区间。(注:)解:设总体平均值为的置信度为0.95的置信区间是:即为:165.52170.48的置信度为0.95的置信区间为[165.52,170.48]练习题一、填空题1、设总体~是来自的样本,则的最大似然估计量是2、设总体,为未知参数,为来自总体的一个样本,则的矩估计量是,极大似然估计量是,的矩估计量是,极大似然估计量是。3、在总体均值的所有线性无偏估计中,_______是总体均值的最有效估计量。4.设总体~,是容量为的简单随机样本,均值,则未知参数的置信水平为的置信区间是5、测得自动车床加工的10个零件的尺寸与规定尺寸的偏差(微米)如下:+2,+1,-2,+3,+2,+4,-2,+5,+3,+4则零件尺寸偏差的数学期望的无偏估计量值是6、在上题的条件下,零件尺寸偏差的方差的无偏估计值是二、单项选择题1、设是取自于总体的一个样本,总体分布的数学期望为,方差为,则()是的无偏估计量。A.B.C.D.2、设总体的数学期望为,是取自于总体的简单随机样本,则下列命题中正确的是()。A.是的无偏估计量B.是的极大似然估计量C.是的一致(相合)估计量D.不是的估计量3、正态总体均值已知时,对取定的样本观察值及给定的,要求总体方差的置信区间,使用的统计量服从()。A.标准正态分布B.分布C.分布D.分布4、设总体,分别服从正态分布,,其中均为未知参数,且.则两总体均值差的置信区间为()。A.B.,其中C.D. 5、设是取自总体的一个简单样本,则的矩估计是(A)(B)(C)(D)6、总体~,已知,时,才能使总体均值的置信水平为的置信区间长不大于。(A)/(B)/(C)/(D)7、设总体服从正态分布是来自的样本,则的最大似然估计为(A)(B)(C)(D)8、设样本来自N(0,4),常数c为以下何值时,统计量服从t分布。()A.B.C.D.-9、,为总体的样本,下列哪一项是的无偏估计()A.B.C.D.10、在一元线性回归模型中,对回归系数进行参数估计,最常用的点估计方法是()。A.矩法B.极大似然法C.最小二乘法D.其它三、多项选择题1.最常用的点估计方法是()A.矩法估计B.极大似然估计C.最小二乘估计D.区间估计2.评价估计量好坏的标准主要有()A.无偏性B.一致性C.有效性D.渐进性3.对一个正态总体均值进行区间估计,可能用到的统计量是()。A.T统计量B.U统计量C.F统计量D.统计量4.参数估计主要有哪两种形式。()A.点估计B.矩法估计C.极大似然估计D.区间估计5.参数估计利用样本所提供的信息,主要对总体的哪些信息做出估计或推断。()A.分布B.数字特征C.密度函数D.未知参数6.我们所说的点估计,主要指()。A.估计值B.置信区间C.置信度D.估计量四、判断题1.矩法估计在总体分布未知的场合也可使用。()2.矩法估计量一定是无偏估计量。()3.样本均值是总体均值无偏、一致、有效估计量。()4.极大似然估计法由于充分利用了样本所提供的信息,所得到的估计量一般具有较好的统计性质。()5.对一个正态总体均值进行区间估计,方差未知时用到的是T统计量。()6.如果是未知参数的无偏估计量,那么。7.对同一未知参数估计,使用矩估计法与极大似然法估计,所得结果一定一样。()8.对区间估计,1—是估计的置信度。()五、计算分析题1、设样本取自服从几何分布的总体,其分布列为

,

=1,2,……其中未知,0<<1,求的矩法估计量。2、设总体的密度函数为,从中获得样本,求的矩法估计量。3、设是取自服从均匀总体服从均匀分布的样本,证明,

都是的无偏估计。4、设总体的密度函数为,,从中获得样本,求参数的极大似然估计与矩估计,它们是否一致?今获得样本观测值为:0.3,0.8,0.27,0.35,0.62,0.55,分别求出的两个估计值。5、某商场每天每百元投资的利润率服从正态分布,均值为,方差为,长期以来稳定于0.4,现随机抽取的五天的利润率为:,,,,试求的置信水平为0.95的置信区间。6、设样本取自,试求常数,使统计量服从分布,并指出其自由度是多少。7、某行业职工的月收入服从,现随机抽取30名职工进行调查,求得他们的月收入的平均值元,标准差元,试求的置信水平为0.95的置信区间。8、在某饮料厂的市场调查中,在1000名被调查者中有650人喜欢含有酸味的饮料,请作出喜欢酸味饮料的人的比率的置信水平为0.95的区间估计。练习题答案一、填空题1、2、SS3、4、5、26、5.78二、单项选择题1、B2、A3、C4、B5、C6、B7、A8、C9、A10、C三、多项选择题1、ABC2、ABC3、AB4、AD5、BD6、AD四、判断题1、√2、×3、√4、√5、√6、√7、×8、√五、计算题1、解

因为总体服从参数为的几何分布,故,令解得参数的矩法估计量为2、解

因为总体的数学期望为令解得参数的矩法估计量为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论