第四章参数估计与假设检验_第1页
第四章参数估计与假设检验_第2页
第四章参数估计与假设检验_第3页
第四章参数估计与假设检验_第4页
第四章参数估计与假设检验_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章参数估计与假设检验第1页,共58页,2023年,2月20日,星期三第一节参数估计的一般问题参数估计的意义何在?◆人们往往先假定某数据来自一个特定的总体族(比如正态分布族);◆而要确定是总体族的哪个成员(也就是其具体分布)则需要知道总体参数值(比如总体均值和总体方差);◆于是,人们希望用相应的样本统计量(比如样本均值和样本方差)来估计出相应的总体参数,从而能够确定总体的分布。第2页,共58页,2023年,2月20日,星期三一、统计量、估计量、估计值

估计:根据现有信息对现实世界进行某种判断。估计量:样本的(不包含未知总体参数的)函数称为统计量;用于估计总体参数的统计量称为估计量(estimator,估计子),如用于估计总体参数的样本均值、样本比率(成数)、样本方差等。由于一个统计量对于不同的样本取值不同,所以估计量也是随机变量,并有其分布。第一节参数估计的一般问题第3页,共58页,2023年,2月20日,星期三估计值:如果样本已经得到,把数据带入之后,估计量就有了一个数值,称为该估计量的一个实现(realization)或取值,也称为一个估计值(estimate)。可见,统计量是样本的函数,是对样本的一个变换。我们之所以进行这种变换,是希望用这个统计量去估计总体的某个参数。不过,在实际转换的过程中,一般来说,会有一定的信息损失,也就是说,统计量包含的信息比原始样本本身包含的信息要少。第一节参数估计的一般问题第4页,共58页,2023年,2月20日,星期三这样,就可能出现两种结果:

一种结果是,抓住了问题的实质,删繁就简,只丢掉了一些无关要旨的东西,保存了样本中关于所要估计的总体参数的全部信息;另一种结果是,把样本中关于所要估计的总体参数的信息丧失了或丧失很多,因此从这个统计量出发对总体参数进行推断,还不如从样本本身对总体进行推断。如果这个统计量满足第一种情况,我们就说它是充分统计量。第一节参数估计的一般问题第5页,共58页,2023年,2月20日,星期三二、点估计与区间估计点估计(pointestimation):用估计量的实现值来近似相应的总体参数。区间估计(intervalestimation):给出包括估计量在内(有时是以估计量为中心)的一个区间;该区间被认为很可能包含总体参数。点估计给出一个数字,用起来很方便;而区间估计给出一个区间,说起来留有余地;不像点估计那么绝对。第一节参数估计的一般问题第6页,共58页,2023年,2月20日,星期三三、点估计用什么样的估计量来估计参数呢?没有限制。任何统计量,只要人们觉得合适就可以当成估计量。比如,一位专家来学校进行评估,想了解《概率论与数理统计》的考试情况,在食堂碰到你,问:你们班这门课的平均成绩大概是多少?你说:不太清楚。他只好又问:那你考了多少?你说:38。第一节参数估计的一般问题第7页,共58页,2023年,2月20日,星期三三、点估计那么,什么样的估计量才算合适呢?从理论上来说,一个合适的估计量至少要具备如下特点:

1、要能够知道其概率分布;

2、要能够根据现有条件算出估计量的值。那么,怎么样比较不同估计量之间的好坏呢?第一节参数估计的一般问题第8页,共58页,2023年,2月20日,星期三1、无偏性(unbiasedness)

所谓无偏性,就是指我们所选定的估计量的数学期望等于被估计量,这时统计量的值才能在真实值上下摆动,从而保证用它来估计被估计参数在理论上没有偏差。在统计中,人们一般不用样本方差S2n来估计总体方差,正是因为用样本方差S2n来估计总体方差是有偏(差)的,而用样本修正方差S2n-1来估计总体方差是没有偏(差)的。第一节参数估计的一般问题第9页,共58页,2023年,2月20日,星期三第一节参数估计的一般问题第10页,共58页,2023年,2月20日,星期三

2、一致性(consistency)

随着样本容量的增大,估计量越来越接近被估计的总体参数。即:

设为未知参数θ的估计量,当n→∞时,要求依概率收敛于θ,即第一节参数估计的一般问题第11页,共58页,2023年,2月20日,星期三

2、一致性(consistency)第一节参数估计的一般问题第12页,共58页,2023年,2月20日,星期三

3、有效性(efficiency)

若和均为的无偏估计,且,则称无偏估计比更有效。若是的无偏估计的最有效者,即具有最小方差,则称是的最小方差无偏估计。第一节参数估计的一般问题第13页,共58页,2023年,2月20日,星期三四、区间估计(IntervalEstimation)

当描述一个人的体重时,你一般可能不会说这个人是76.35公斤,你会说这个人是七八十公斤,或者是在70公斤到80公斤之间。这个范围就是区间估计的例子。第一节参数估计的一般问题第14页,共58页,2023年,2月20日,星期三置信度与置信区间:置信度的概念是大量重复抽样时的一个渐近概念。类似于“我们目前得到的置信度为95%的置信区间以概率0.95覆盖总体真值”的说法是错误的。实际上应该说“重复类似的抽样所得到的大量区间中有大约95%的覆盖总体真值(该真值可能永远未知)。第一节参数估计的一般问题第15页,共58页,2023年,2月20日,星期三

这里的置信区间(如72,78)是固定的,而总体真值也是固定的值。因此只有两种可能:或者该区间包含总体比例,或者不包含;这当中没有任何概率可言。至于区间(72,78)是否覆盖总体真值,除非一个不漏地调查所有的人,否则永远也无法知道。第一节参数估计的一般问题第16页,共58页,2023年,2月20日,星期三一、总体方差已知时对总体均值进行区间估计例

CJW公司是一家专营体育设备和附件的邮购公司。该公司竭尽全力向顾客提供最优质的服务。为了监控公司的服务质量,CJW公司每月都要随机地抽取一个邮购顾客的样本,并与被抽到的样本中的每个顾客进行联系,询问他们一系列有关CJW公司服务水平的问题,根据顾客给出的答案计算出该顾客的满意分数,这些分数的范围从0分(可能的最差等级)到100分(可能的最好等级)。在此基础上,公司进一步计算出满意分数的样本均值作为CJW公司所有顾客总体的满意分数均值的点估计。第二节总体指标的区间估计第17页,共58页,2023年,2月20日,星期三

前面每个月的调查显示:尽管各个月的样本满意分数的均值都有变化,但是,满意分数的标准差却稳定在20分左右。因此,我们就假定总体的标准差为20分。最近,CJW公司对100名顾客进行了调查,结果表明:顾客满意分数的样本均值为82。试给出满意分数总体均值的区间估计(置信度95%)。

解:根据题意可知,n=100,总体标准差σ=20,样本均值为82。根据中心极限定理可知,。因此可反查标准正态分布表求解。第二节总体指标的区间估计第18页,共58页,2023年,2月20日,星期三第二节总体指标的区间估计第19页,共58页,2023年,2月20日,星期三二、总体方差未知时对总体均值进行区间估计当总体服从正态分布、方差б2未知时,则用样本方差代替б2。考虑到样本方差S2的有偏性和样本修正方差的无偏性,为提高推断的准确性,用样本修正方差S2n-1来代替б2进行估计。第二节总体指标的区间估计第20页,共58页,2023年,2月20日,星期三考察统计量

在T中,分子,分母中。因此,T~t(n-1)。因此,要以95%的置信度求出μ的置信区间,只需借鉴б2已知的做法,反查t分布表,找到一个对称区间[-t,t],使P(-t﹤T﹤t)=0.95即可。第二节总体指标的区间估计第21页,共58页,2023年,2月20日,星期三经整理,总体均值μ的置信区间为:在大样本情况下,也可以用正态分布代替t分布,也就是用Zα/2代替上式中的tα/2即可。第二节总体指标的区间估计第22页,共58页,2023年,2月20日,星期三

练习:下表是工商07级1班、2班某门课的考试成绩。试根据该样本数据求管理学院2007级学生该门课程成绩均值的置信区间(置信度为95%)。第二节总体指标的区间估计第23页,共58页,2023年,2月20日,星期三

思考:如果这样做正确的话,隐含的前提假设是什么?第二节总体指标的区间估计第24页,共58页,2023年,2月20日,星期三总体方差未知时对总体均值进行区间估计:当总体服从正态分布、方差б2未知时,则用样本方差代替б2。考虑到样本方差S2的有偏性和样本修正方差的无偏性,为提高推断的准确性,用样本修正方差S2n-1来代替б2进行估计。

考虑:在这里,我们为什么要加“总体服从正态分布”这个条件,要是总体不服从正态分布呢?会有什么问题?第二节总体指标的区间估计第25页,共58页,2023年,2月20日,星期三三、正态总体方差的区间估计

1、总体均值μ已知时的区间估计

2、总体均值μ未知时的区间估计第二节总体指标的区间估计第26页,共58页,2023年,2月20日,星期三

例从自动机床加工的零件中抽取10件,测得其长度为(单位:mm):12.5,12.12,12.01,12.28,12.09,12.03,12.01,12.11,12.06,12.14。设零件长度服从正态分布,求零件长度的方差的置信区间(置信度95%)。解:第二节总体指标的区间估计第27页,共58页,2023年,2月20日,星期三四、两正态总体均值差的区间估计对于两个相互独立的正态总体N(μ1,σ12)、N(μ2,σ22),其样本均值差

1、σ12、σ22都已知时μ1-μ2的区间估计

第二节总体指标的区间估计第28页,共58页,2023年,2月20日,星期三

2、σ12=σ22=σ2,但σ2未知时μ1-μ2的区间估计

第二节总体指标的区间估计第29页,共58页,2023年,2月20日,星期三

同理,在大样本条件下,。因此,总体比例也可参照总体均值的方法进行估计。第二节总体指标的区间估计第30页,共58页,2023年,2月20日,星期三一、假设检验的基本思想第三节假设检验的一般问题第31页,共58页,2023年,2月20日,星期三一、假设检验的基本思想

参数估计和假设检验是统计推断的两种方法,只不过角度不同。假设检验的基本思路是:事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断是否能推翻原假设。我认为该企业生产的零件的平均长度为4厘米!第三节假设检验的一般问题第32页,共58页,2023年,2月20日,星期三一、假设检验的基本思想假设检验的特点:

采用逻辑上的反证法;

依据统计上的小概率原理。第三节假设检验的一般问题第33页,共58页,2023年,2月20日,星期三

例:某厂生产一种标准件,其长度为4厘米,标准差为0.1厘米。进行工艺改革后,抽查了100个零件,测得样本平均长度为3.94厘米。试以95%的把握程度,检验该厂进行工艺改革前后生产的标准件的长度是否发生了显著变化。

解:1、区间估计的方法~Z(0,1);P(-1.96<<1.96)=0.95

即:-1.96<μ<+1.963.94-1.96×0.1/10<μ<3.94+1.96×0.1/10

计算得:3.9204<μ<3.9596

可见,工艺改革后该厂的标准件长度发生了显著变化。第三节假设检验的一般问题第34页,共58页,2023年,2月20日,星期三

解:2、假设检验的方法假设工艺改革后标准件长度没有明显变化,也即μ=4厘米。应有:

即P(-1.96<<1.96)=0.95

此为小概率事件。小概率事件发生说明原假设是错误的,工艺改革前后标准件长度发生了显著变化。第三节假设检验的一般问题第35页,共58页,2023年,2月20日,星期三二、假设检验的过程均值

X=20总体

我认为人口的平均年龄是50岁1、提出假设

拒绝假设别无选择3、作出决策2、抽取随机样本第三节假设检验的一般问题第36页,共58页,2023年,2月20日,星期三二、假设检验的过程假设检验的具体步骤:第一,提出原假设(nullhypothesis)和备择假设(alternativehypothesis);第二,确定合适的检验统计量;第三,规定显著性水平α;第四,根据数据计算检验统计量的实现值;第五,统计决策。第三节假设检验的一般问题第37页,共58页,2023年,2月20日,星期三原假设的设定原则:在假设检验中,一般要设立一个原假设(nullhypothesis);而设立该假设的动机主要是企图利用人们掌握的反映现实世界的数据来找出假设和现实的矛盾,从而否定这个假设。也就是说,假设检验都是以否定原假设为目标。如否定不了,那就说明证据不足,无法否定原假设。但这不等于原假设正确,而是“没有足够证据拒绝原假设”,因此不能“接受原假设”。第三节假设检验的一般问题第38页,共58页,2023年,2月20日,星期三需要注意的问题:

1、零假设和备择假设在我们涉及的假设检验中并不对称。检验统计量的分布是从零假设导出的。第三节假设检验的一般问题第39页,共58页,2023年,2月20日,星期三需要注意的问题:

2、多数软件直接给出p值,而不给出α。p值(p-value)是在零假设下,检验统计量取其实现值及(沿着备择假设的方向)更加极端值的概率。如果p值很小,意味着在零假设下小概率事件发生。给定p值有很多方便之处。比如α=0.05,而假定所得到的p值等于0.001。这时如果采用p值作为新的显著性水平,即新的α=0.001,于是就可以说,在显著性水平为0.001时,拒绝零假设。这样,拒绝零假设时犯错误的概率实际只是α=0.001而不是原来的α=0.05。在这个意义上,p值又称为观测的显著性水平(observedsignificantlevel),或者一个原假设可被拒绝的最低(最小)显著性水平。第三节假设检验的一般问题第40页,共58页,2023年,2月20日,星期三需要注意的问题:

3、对于同一个假设检验问题,往往都有多个检验统计量;而且人们还在构造更优良的检验统计量。人们不可能把所有的目前存在的和将来可能存在的检验都实施。因此,只能够说,按照目前的证据,不足以拒绝零假设而已。后面将会用例子说明“接受零假设”的说法是不妥当的。第三节假设检验的一般问题第41页,共58页,2023年,2月20日,星期三三、假设检验的两类错误(决策风险)第一类错误:拒真错误。原假设为真,但由于样本的随机性落入拒绝区域,使我们做出错误决策。小概率事件只是发生的概率很小,但并非绝对不发生。犯这类错误的概率就是小概率事件发生的概率。第二类错误:纳伪错误。原假设为假,但由于样本的随机性落入接受区域,使我们做出错误决策。在样本容量一定时,降低犯第一类错误的概率,就会增大犯第二类错误的概率。要同时降低犯第一类错误和第二类错误的概率,必须增大样本容量。第三节假设检验的一般问题第42页,共58页,2023年,2月20日,星期三陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假接受H01-a第二类错误(b)拒绝H0第一类错误(a)功效(1-b)假设检验就好像一场审判过程假设检验过程H0:无罪第三节假设检验的一般问题第43页,共58页,2023年,2月20日,星期三一、总体均值的假设检验(一)总体方差已知时总体均值的假设检验

例:公司欲购进一批零件。根据合同规定,零件使用寿命平均不能低于1000天。为检验零件质量,公司随机抽取100个,测得平均寿命为960天。若零件使用寿命服从正态分布,标准差为60天。公司是否该购买这批零件?(显著性水平=0.05)第四节总体指标的假设检验第44页,共58页,2023年,2月20日,星期三

解:假设H0:≥1000;H1:<1000。则~Z(0,1)查表可知,P(>-1.645)=1-0.05

经计算,可见该厂的零件平均寿命低于1000天,不应购买。第四节总体指标的假设检验第45页,共58页,2023年,2月20日,星期三一、总体均值的假设检验(二)总体方差未知时总体均值的假设检验

当总体服从正态分布、方差б2未知时,则用样本方差S2代替б2。考虑到S2的有偏性和样本修正方差S2n-1=

的无偏性,为提高推断的准确性,用S2n-1代替б2进行检验。第四节总体指标的假设检验第46页,共58页,2023年,2月20日,星期三

在大样本情况下,变量T的分子,分母服从。因此,有T~t(n-1)。

同时,对上式进行变形,还有:

因此,也可以直接用样本方差的数据来进行检验。第四节总体指标的假设检验第47页,共58页,2023年,2月20日,星期三

例:自动装车系统装车的重量服从正态分布,每车标准重量为1000吨。某日随机抽查9车,测得样本平均重量为986吨,样本标准差为24吨。试问在0.05的显著性水平上,能否认为这天自动装车系统工作不正常?

解:假设H0:=1000;H1:≠1000。则~t(n-1)计算得:==-1.65

查表知,当自由度为8时,P(-2.306≤T≤2.306)=1-0.05。可见,没有理由认为自动装车系统工作不正常。第四节总体指标的假设检验第48页,共58页,2023年,2月20日,星期三

例:一个大米加工厂卖给超市一批标明10kg重的大米。而该超市怀疑该厂家缺斤短两,对10包大米进行了称重,得到下列数据(单位:千克):9.93,9.83,9.76,9.95,10.07,9.89,10.03,9.97,9.89,9.87。这里假定打包的大米重量服从正态分布。由于发生分歧,于是大米加工厂老板、大米加工厂律师、超市分别对大米重量的均值进行了检验。第四节总体指标的假设检验第49页,共58页,2023年,2月20日,星期三1、加工厂老板取了样本的头两个数—9.93和9.83进行t检验,通过计算得:样本均值9.88kg,p=0.1257,因此在α=0.05的水平上“接受零假设”;

2、超市用样本全部数据进行t检验,计算得到:样本均值9.92kg,p=0.0106,因此在α=0.05的水平上“拒绝零假设”;第四节总体指标的假设检验第50页,共58页,2023年,2月20日,星期三3、加工厂律师用了全部数据,但使用中位数符号检验(注意对于正态分布,对中位数的检验等价于对均值的检验),通过计算得到:p=0.0547,因此在α=0.05的水平上“接受零假设”。并认为,“既然三个检验中有两个都接受零假设,就应该接受”。第四节总体指标的假设检验第51页,共58页,2023年,2月20日,星期三评价:

1、加工厂老板实际上减少了作为证据的数据,因此使得“证据不足,无法拒绝零假设”,而不应该“接受零假设”;

2、律师虽用了全部数据,但用了不同的方法。他也只能够说“在这个检验方法下,证据不足以拒绝零假设”而不能说“接受零假设”;第四节总体指标的假设检验第52页,共58页,2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论