第四章 参数估计与假设检验_第1页
第四章 参数估计与假设检验_第2页
第四章 参数估计与假设检验_第3页
第四章 参数估计与假设检验_第4页
第四章 参数估计与假设检验_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章参数估计与假设检验

第一节参数估计的一般问题参数估计的意义何在?◆人们往往先假定某数据来自一个特定的总体族(比如正态分布族);◆而要确定是总体族的哪个成员(也就是其具体分布)则需要知道总体参数值(比如总体均值和总体方差);◆于是,人们希望用相应的样本统计量(比如样本均值和样本方差)来估计出相应的总体参数,从而能够确定总体的分布形态。一、统计量、估计量、估计值

估计:根据现有信息对现实世界进行某种判断。估计量:样本的(不包含未知总体参数的)函数称为统计量;用于估计总体参数的统计量称为估计量(estimator,估计子),如用于估计总体参数的样本均值、样本比率(成数)、样本方差等。由于一个统计量对于不同的样本取值不同,所以估计量也是随机变量,并有其分布。第一节参数估计的一般问题估计值:如果样本已经得到,把数据带入之后,估计量就有了一个数值,称为该估计量的一个实现(realization)或取值,也称为一个估计值(estimate)。可见,统计量是样本的函数,是对样本的一个变换。我们之所以进行这种变换,是希望用这个统计量去估计总体的某个参数,或者实现我们的其他目的,比如要检验某一个假设。不过,在实际转换的过程中,一般来说,会有一定的信息损失,也就是说,统计量包含的信息比原始样本本身包含的信息要少。第一节参数估计的一般问题这样,就可能出现两种结果:

一种结果是,抓住了问题的实质,删繁就简,只丢掉了一些无关要旨的东西,保存了样本中关于所要估计的总体参数的全部信息;另一种结果是,把样本中关于所要估计的总体参数的信息丧失了或丧失很多,因此从这个统计量出发对总体参数进行推断,还不如从样本本身对总体进行推断。如果这个统计量满足第一种情况,我们就说它是充分统计量。第一节参数估计的一般问题二、点估计与区间估计点估计(pointestimation):用估计量的实现值来近似相应的总体参数。区间估计(intervalestimation):给出包括估计量在内(有时是以估计量为中心)的一个区间;该区间被认为很可能包含总体参数。点估计给出一个数字,用起来很方便;而区间估计给出一个区间,说起来留有余地;不像点估计那么绝对。第一节参数估计的一般问题三、点估计用什么样的估计量来估计参数呢?没有限制。任何统计量,只要人们觉得合适就可以当成估计量。比如,一位专家来学校进行评估,想了解《概率论与数理统计》的考试情况,在食堂碰到你,问:你们班这门课的平均成绩大概是多少?你说:不太清楚。他只好又问:那你考了多少?你说:38。第一节参数估计的一般问题三、点估计那么,什么样的估计量才算合适呢?从理论上来说,一个合适的估计量至少要具备如下特点:

1、要能够知道其概率分布;

2、要能够根据现有条件算出估计量的值。那么,怎么样比较不同估计量之间的好坏呢?第一节参数估计的一般问题1、无偏性(unbiasedness)

所谓无偏性,就是指我们所选定的估计量的数学期望等于被估计量,这时统计量的值才能在真实值上下摆动,从而保证用它来估计被估计参数在理论上没有偏差。在统计中,人们一般不用样本方差S2n来估计总体方差,正是因为用样本方差S2n来估计总体方差是有偏(差)的,而用样本修正方差S2n-1来估计总体方差是没有偏(差)的。第一节参数估计的一般问题样本修正方差的无偏性:一个统计实验第一节参数估计的一般问题第一节参数估计的一般问题

2、一致性(consistency,相合性)

随着样本容量的增大,估计量越来越接近被估计的总体参数。即:

设为未知参数θ的估计量,当n→∞时,要求依概率收敛于θ,即第一节参数估计的一般问题

2、一致性(consistency)第一节参数估计的一般问题

3、有效性(efficiency)

若和均为的无偏估计,且,则称无偏估计比更有效。若是的无偏估计的最有效者,即具有最小方差,则称是的最小方差无偏估计。有效性要求估计量的方差要尽可能地小。第一节参数估计的一般问题四、区间估计(IntervalEstimation)

当描述一个人的体重时,你一般可能不会说这个人是76.35公斤,你会说这个人是七八十公斤,或者是在70公斤到80公斤之间。这个范围就是区间估计的例子。第一节参数估计的一般问题置信度与置信区间:置信度的概念是大量重复抽样时的一个渐近概念。类似于“我们目前得到的置信度为95%的置信区间以概率0.95覆盖总体真值”的说法是错误的。实际上应该说“重复类似的抽样所得到的大量区间中有大约95%的覆盖总体真值(该真值可能永远未知)。第一节参数估计的一般问题

这里的置信区间(如72,78)是固定的,而总体真值也是固定的值。因此只有两种可能:或者该区间包含总体比例,或者不包含;这当中没有任何概率可言。至于区间(72,78)是否覆盖总体真值,除非一个不漏地调查所有的人,否则永远也无法知道。第一节参数估计的一般问题一、总体方差已知时对总体均值进行区间估计例

CJW公司是一家专营体育设备和附件的邮购公司。该公司竭尽全力向顾客提供最优质的服务。为了监控公司的服务质量,CJW公司每月都要随机地抽取一个邮购顾客的样本,并与被抽到的样本中的每个顾客进行联系,询问他们一系列有关CJW公司服务水平的问题,根据顾客给出的答案计算出该顾客的满意分数,这些分数的范围从0分(可能的最差等级)到100分(可能的最好等级)。在此基础上,公司进一步计算出满意分数的样本均值作为CJW公司所有顾客总体的满意分数均值的点估计。第二节总体指标的区间估计

前面每个月的调查显示:尽管各个月的样本满意分数的均值都有变化,但是,满意分数的标准差却稳定在20分左右。因此,我们就假定总体的标准差为20分。最近,CJW公司对100名顾客进行了调查,结果表明:顾客满意分数的样本均值为82。试给出满意分数总体均值的区间估计(置信度95%)。

解:根据题意可知,n=100,总体标准差σ=20,样本均值为82。根据中心极限定理可知,。因此可反查标准正态分布表求解。第二节总体指标的区间估计第二节总体指标的区间估计

第二节总体指标的区间估计二、总体方差未知时对总体均值进行区间估计当总体服从正态分布、方差б2未知时,则用样本方差代替б2。考虑到样本方差S2的有偏性和样本修正方差的无偏性,为提高推断的准确性,用样本修正方差S2n-1来代替б2进行估计。第二节总体指标的区间估计考察统计量

在T中,分子,分母。因此,T~t(n-1)。因此,要以95%的置信度求出μ的置信区间,只需借鉴б2已知的做法,反查t分布表,找到一个对称区间[-t,t],使P(-t﹤T﹤t)=0.95即可。第二节总体指标的区间估计经整理,总体均值μ的置信区间为:在大样本情况下,也可以用正态分布代替t分布,也就是用Zα/2代替上式中的tα/2即可。第二节总体指标的区间估计

练习:下表是工商07级1班、2班某门课的考试成绩。试根据该样本数据求管理学院2007级学生该门课程成绩均值的置信区间(置信度为95%)。第二节总体指标的区间估计

思考:如果这样做正确的话,隐含的前提假设是什么?第二节总体指标的区间估计总体方差未知时对总体均值进行区间估计:当总体服从正态分布、方差б2未知时,则用样本方差代替б2。考虑到样本方差S2的有偏性和样本修正方差的无偏性,为提高推断的准确性,用样本修正方差S2n-1来代替б2进行估计。

考虑:在这里,我们为什么要加“总体服从正态分布”这个条件,要是总体不服从正态分布呢?会有什么问题?第二节总体指标的区间估计三、正态总体方差的区间估计

1、总体均值μ已知时的区间估计

2、总体均值μ未知时的区间估计第二节总体指标的区间估计

例从自动机床加工的零件中抽取10件,测得其长度为(单位:mm):12.5,12.12,12.01,12.28,12.09,12.03,12.01,12.11,12.06,12.14。设零件长度服从正态分布,求零件长度的方差的置信区间(置信度95%)。解:第二节总体指标的区间估计四、两正态总体均值差的区间估计对于两个相互独立的正态总体N(μ1,σ12)、N(μ2,σ22),其样本均值差

1、σ12、σ22都已知时μ1-μ2的区间估计

第二节总体指标的区间估计

2、σ12=σ22=σ2,但σ2未知时μ1-μ2的区间估计

第二节总体指标的区间估计

同理,在大样本条件下,。因此,总体比例也可参照总体均值的方法进行估计。第二节总体指标的区间估计一、假设检验的基本思想第三节假设检验的一般问题一、假设检验的基本思想

参数估计和假设检验是统计推断的两种方法,只不过角度不同。假设检验的基本思路是:事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断是否能推翻原假设。我认为该企业生产的零件的平均长度为4厘米!第三节假设检验的一般问题一、假设检验的基本思想假设检验的特点:

采用逻辑上的反证法;

依据统计上的小概率原理。第三节假设检验的一般问题

例:某厂生产一种标准件,其长度为4厘米,标准差为0.1厘米。进行工艺改革后,抽查了100个零件,测得样本平均长度为3.94厘米。试以95%的把握程度,检验该厂进行工艺改革前后生产的标准件的长度是否发生了显著变化。

解:1、区间估计的方法~Z(0,1);P(-1.96<<1.96)=0.95

即:-1.96<μ<+1.963.94-1.96×0.1/10<μ<3.94+1.96×0.1/10

计算得:3.9204<μ<3.9596

可见,工艺改革后该厂的标准件长度发生了显著变化。第三节假设检验的一般问题

解:2、假设检验的方法假设工艺改革后标准件长度没有明显变化,也即μ=4厘米。应有:

即P(-1.96<<1.96)=0.95

此为小概率事件。小概率事件发生说明原假设是错误的,工艺改革前后标准件长度发生了显著变化。第三节假设检验的一般问题二、假设检验的过程均值

X=20

总体

我认为人口的平均年龄是50岁1、提出假设

拒绝假设别无选择3、作出决策

2、抽取随机样本

第三节假设检验的一般问题二、假设检验的过程假设检验的具体步骤:第一,提出原假设(nullhypothesis)和备择假设(alternativehypothesis);第二,确定合适的检验统计量;第三,规定显著性水平α;第四,根据数据计算检验统计量的实现值;第五,统计决策。第三节假设检验的一般问题原假设的设定原则:在假设检验中,一般要设立一个原假设(nullhypothesis);而设立该假设的动机主要是企图利用人们掌握的反映现实世界的数据来找出假设和现实的矛盾,从而否定这个假设。也就是说,假设检验都是以否定原假设为目标。如否定不了,那就说明证据不足,无法否定原假设。但这不等于原假设正确,而是“没有足够证据拒绝原假设”,因此不能“接受原假设”。第三节假设检验的一般问题需要注意的问题:

1、零假设和备择假设在我们设计的假设检验中并不对称。检验统计量的分布是从零假设导出的。第三节假设检验的一般问题第三节假设检验的一般问题需要注意的问题:

2、多数软件直接给出p值,而不给出α。p值(p-value)是在零假设下,检验统计量取其实现值及(沿着备择假设的方向)更加极端值的概率。如果p值很小,意味着在零假设下小概率事件发生。给定p值有很多方便之处。比如α=0.05,而假定所得到的p值等于0.001。这时如果采用p值作为新的显著性水平,即新的α=0.001,于是就可以说,在显著性水平为0.001时,拒绝零假设。这样,拒绝零假设时犯错误的概率实际只是α=0.001而不是原来的α=0.05。在这个意义上,p值又称

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论