第四章统计推断:估计与假设检验_第1页
第四章统计推断:估计与假设检验_第2页
第四章统计推断:估计与假设检验_第3页
第四章统计推断:估计与假设检验_第4页
第四章统计推断:估计与假设检验_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第4章统计推断:估计与假设检验4.1统计推断的含义4.2点估计及估计量的特征4.3区间估计方法4.4假设检验4.1统计推断的含义统计推断研究的是总体与来自总体的样本之间的关系,根据来自总体的样本对总体的种种特征做出判断。参数估计和假设检验是统计推断的两个孪生分支参数估计问题包括点估计(pointestimation)和区间估计(intervalestimation).假设检验包括显著性检验和置信区间法4.2点估计及估计量的特征一、点估计的含义所谓点估计就是给出被估计参数的一个特定的估计值。例如随机变量X服从某一未知均值和方差的正态分布,若有来自该正态总体的一随机样本,则这些样本数据的平均值就为总体的均值ux的点估计值,为点估计量。4.2点估计及估计量的特征一、点估计的含义点估计量是一个随机变量,因为其值随样本的不同而不同。常用的点估计方法有三种:矩法、最大似然法、最小二乘法。对同一样本根据三种方法估计同一参数,所获得的估计结果可能互不相同。然而由于各种建立原则的合理性,所以三种方法在研究中都经常使用。二、点估计方法(1)矩法矩法是求估计量最古老的方法。具体作法是:以一样本矩作为相应总体矩的估计量;以样本矩的函数作为相应的总体矩同样函数的估计量。这种方法最常见的应用是用样本平均数估计总体数学期望,用样本方差S2估计总体的方差。矩法比较直观,求估计量时有时也比较直接,但它求出的估计量往往不够理想。矩法点估计的例题

例4-1某灯泡厂某天生产了一大批灯泡,从中抽取了10个进行寿命试验,获得数据如下(单位:小时),问该天生产的灯泡的平均寿命是多少?计算得样本算术平均数=1147,作为总体数学期望的估计值(2)最大似然法(MaximumLikelihoodEstimation)

a、一个重要的事实不同的总体会产生不同的样本,对于某一特定的样本,在不了解产生它的总体究竟为何物的观察者眼中,它来自一些总体的可能性要比来自另一些总体的可能性大,即一些总体更容易产生出我们所观察到的样本。举例说假定我们抽取到(x1,x2,……,x8),知道它来自正态总体,且总体的方差是了解的,但是总体的均值未知。如下图所示。二、点估计方法

假定样本不是来自B就是来自A。如果样本来自B,观察到它的可能性非常小;真正的母体若是A,得到样本的可能性很大。显然我们宁愿承认样本来自A。是样本“替”我们“选择”了A。

x1x2x3x4x5x6x7x8分布B分布A概率xb、最大似然法的概念上述事实诱导我们宁愿作出这样的抉择:将样本最容易来自的总体当作产生样本的总体。现在要根据从总体中抽取得到的样本(x1,……,xn)对总体中的未知数进行估计。最大似然法是选择这样的估计量^作为的估计值,以便使观察结果(x1,……,xn)出现的可能性(概率)最大。对于离散型变量,就是要选择

使p(x1)p(x2)…p(xn)最大。(连乘——表示一次独立地抽取各个样本观察值)对于连续型变量,就是要选择

使(x1)(x2)...(xn)最大。注意(xi)是随机变量在xi附近取值的概率,相当于离散型的p(xi)。c、似然法函数

d、最大似然法的定义和估计方法

定义如果L(x1,x2,…,xn;θ)在处达到最大值,则称

是θ的最大似然估计。为了取得的最大似然估计,必须使似然函数L达到最大值。由于对数函数是单增的,L达到最大亦即LnL达到最大。这样使LnL达到最大来估计为计算带来了许多方便。根据拉格朗日定理,对未知参数求条件极值,令LnL对的一阶导数等于0,即dLnL/d=0==>得到似然方程,所求的就是似然方程中的解。注意:当不只一个参数需要估计时,应将LnL分别对不同参数求偏导,然后解似然方程组最大似然估计法对方差的估计往往是有偏估计量,以后对线性模型估计时也是如此。(3)最小二乘法

(LeastSquareEstimationMethod)最小二乘法是计量经济学中应用最广泛的一种估计方法。这是本课程研究的重点问题,在以后各章中将详尽地阐述它的原理、步骤、特性和优越处。二、点估计方法三点估计量的特征所谓估计量的特性指的是衡量一个统计量用以估计总体参数的好坏标准。点估计量的一些统计性质(1)线性;(2)无偏性;(3)有效性;(4)最优线性无偏估计量(BLUE);(5)一致性(1)线性若估计量是样本观察值的线性函数,则称该估计量是线性估计量样本均值是一个线性估计量(2)无偏性无偏性的直观意义根据样本推得的估计值和真值可能不同,然而如果有一系列抽样依据同一估计方法就可以得到一系列估计值,很自然会要求这些估计的期望值与未知参数的真值相等。这就是无偏性的概念,无偏性的直观意义是:样本估计量的数值在真值周围摆动,即无系统误差。无偏性的定义

的真值的真值有偏无偏例4-3

无偏性是估计量最重要的优良性,是一个重复抽样的性质,它只能保证估计量的期望等于真值。而且,对于总体某个待定参数,其无偏估计量不只一个。(3)最小方差性如果其方差比其他任何估计量的方差都要小,那么这个估计量就称为最小方差估计量。(4)有效性

总体某个参数的无偏估计量往往不只一个,而且无偏性仅仅表明的所有可能的取值按概率平均等于,它的可能取值可能大部分与相差很大。为保证的取值能集中于附近,必须要求的方差越小越好。所以,提出有效性标准。有效性的定义

例4-4比较总体均值两个无偏估计的有效性

无偏有效估计量的意义(1)一个无偏有效估计量的取值在可能范围内最密集于附近。换言之,它以最大的概率保证估计量的取值在真值附近摆动。(2)可以证明,样本均值是总体数学期望的有效估计量。(5)最优线性无偏估计量

如果一个估计量是线性的和无偏的,并且在参数的所有线性无偏估计量中,这个估计量的方差最小,则称这个估计量是最优线性无偏估计量(bestlinearunbiasedextimator,BLUE)。(6)一致性“依概率收敛”的定义若存在常数a,使对于任何ε>0,有则称随机变量序列{ξn}依概率收敛于a.一致性一致性既是从概率又是从极限性质来定义的,因此只有样本容量较大时才起作用。一致性作为评价估计量好坏的一个标准,计量经济学家在无偏性和一致性之间更偏重选择一致性。虽然一个一致估计量可能在平均意义上与真值不同,但是当样本容量加大时,它会变得与真值十分接近,即有偏的一致估计量具有大样本下的无偏性。同时,根据大数定律,当n增大时,方差会变得很小,所以一致估计量具有大样本下的“无偏性”和“有效性”。4.3区间估计区间估计就是以一定的可靠性给出被估计参数的一个可能的取值范围。一般的,假定随机变量X服从某一概率分布,若要对其参数进行估计,选取容量为n的随机样本,找出两个统计量1(x1,…,xn)与2(x1,…,xn),使P(1<<2)=1-

其中(1,2)称为置信区间,1-称为置信系数(置信度),称为显著性水平或犯第一类错误的概率,一般取5%或1%。如果建立一个置信系数为95%的置信区间,那么重复建立这样的区间100次,预期有95次包括了真实的ux。对区间估计的形象比喻我们经常说某甲的成绩“大概80分左右”,可以看成一个区间估计问题。(某甲的成绩为被估计的参数)

P(1<<2)=大概的准确程度(1-)

如:P(75<<85)=95%=1-5%“大概80分左右”冒险率(假设检验中叫显著水平)下限上限例4-5利用t分布来求前面所讲的纽约股票交易市场的价值收益值一例中的均值ux的区间估计值。注意:该置信区间是随机的,它依赖于样本的取值,但总体均值取某一固定值,是非随机的,所有不能说ux位于区间的概率是0.95,只能说这个区间包括真实ux的概率是0.95.一、对总体期望值的估计(1)已知方差,对总体数学期望E=进行区间估计(正态总体)/2/21-例4.6:某灯泡厂某天生产了一大批灯泡,从中抽取了10个进行寿命试验,获得数据如下(单位:小时),假设总体服从正态分布,总体方差为8,求电子管寿命的置信区间(=5%)。(2)方差未知,对数学期望E进行区间估计大样本下根据中心极限定理,V可以用S2代替,所以仍按已知方差正态分布的方法进行的置信区间估计。小样本下例4-7新生儿体重的置信区间

假设新生儿(男)的体重服从正态分布。随机抽取12名新生儿,测得体重如下表,试以95%的置信度估计新生儿(男)的平均体重。二、对总体方差的估计

(未知u时对总体方差进行区间估计)

总体方差区间估计的例题例4-8

冷拔丝的抗拉强度服从正态分布N(μ,σ2),现从一批铜丝中任取10根,测的抗拉强度数据(单位:N)如下:578、572、570、568、572、570、570、596、584、572,求σ2

的置信度为90%的置信区间.三、关于区间估计的几点说明在进行区间估计时,应针对不同的情况,采用不同的方法。例如分清分布的形式是已知或是未知;是大样本或是小样本;小样本(估计总体数学期望时)又分清是已知方差或是未知方差等。充分利用分布信息可以得到较精确的估计。一般地,越大置信度越低,置信区间越长;越小置信度越高,置信区间越短。4.4假设检验一、假设检验的概念二、显著性检验三、置信区间法四、假设检验的应用

一、假设检验的概念定义:称对任何一个随机变量未知分布的假设为统计假设,简称假设。一个仅涉及到随机变量分布中未知参数的假设称为参数假设。一个仅涉及到随机变量分布的形式而不涉及到未知参数的假设称为非参数假设。提出一个统计假设的关键是将一个实际的研究问题用数学语言转换为统计假设。例4-9.检验一个硬币是否均匀

抛掷一个硬币100次,“正面”出现60次,问此硬币是否均匀?分析:若用X描述抛掷硬币的试验,“X=1”和“X=0”分别表示“出现正面”和“出现反面”。上述问题就是检验X是否可以被认为服从p=0.5的0-1分布。问题是分布形式已知,检验参数p=0.5的假设。记作,H0:p=0.5H1:p≠0.5零假设与备择假设在统计假设——H0:p=0.5H1:p≠0.5中,H0称为零假设或原假设,是进行统计假设检验欲确定其是否成立的假设——体现我们进行假设检验的目的。H1称为备择假设,备择假设是对立于零假设的,如果不支持零假设,则接受备择假设。假设检验包括置信区间法和显著性检验法例4-10检验新生女婴体重是否等于某个既定值从2003年出生的女婴中随机地抽取20名,测得平均体重=3160克,标准差=300克,根据已有的统计资料新生女婴的体重=3140克,问现在与过去新生女婴的体重是否有变化?分析:把2003年出生的女婴视为一个总体,用X描述,问题就是判断:

H0:EX=3140H1:EX≠3140

因为通常可以假定经过量测得到的资料是服从正态分布的,无须检验总体的分布形式,显然这是一个关于参数的假设检验问题。二、显著性检验(1)两类错误的概念(2)Neyman-Pearson方法(3)显著性水平与P值(4)几类特殊的显著性检验(1)两类错误的概念

由于假设检验是从样本到总体,因而结果不可能绝对正确,它有可能是错误的;而且出现错误可能性的大小,也是以统计规律(小概率原理)为依据的。所以可能犯的错误有两类:第一类—弃真,原假设符合实际情况,而检验结果把它否定了。设犯这类错误的概率为,那么

=p(否定H0/H0实际上为真)。为显著性水平第二类—取伪,原假设不符合实际情况,而检验结果却把它肯定下来。设犯这类错误的概率为,那么=p(接受H0/H0实际上不正确)。1-称为检验的功效(2)Neyman-Pearson方法自然希望犯两类错误的概率都越小越好。但对一定的样本容量n,一般都不能做到犯这两类错误的概率同时都小。由于减小

=>增大,或者减小

=>增大。一般愿意使犯”第一类错误“的概率较小,则拒绝错了的概率就较小

,而不考虑。Neyman-Pearson提出了一种方法:先固定犯“第一类错误”的概率,再考虑如何减小犯“第二类错误”的概率,也称Fix,Min方法。当确定以后,让尽量的小,1-就越大,称不犯“第二类错误”的概率为“检验的功效(Poweroftest)。(3)显著性水平与P值

显著水平指的是犯“第一类错误”的可能性,在给定的小概率下,零假设几乎是不可能发生的,可以认为零假设H0是错的,必须抛弃它。同时,即使抛弃零假设H0,这时也只需冒的风险,<==>抛弃H0的可靠性则为1-

。检验(统计量)是统计显著的一般是指能够拒绝零假设,即观察到的样本值与假设值不同的概率非常小,小于(犯第一类错误的概率);检验是统计不显著的,是指不能拒绝零假设。为了避免在选择显著性水平时的任意性,可以计算检验的p值。检验的p值(p-value)是指给定t统计量的观测值,能拒绝虚拟假设的最小显著性水平。小的p值是拒绝虚拟假设的证据。如果用α表示检验的显著性水平(小数形式),那么p值<α时,则拒绝虚拟假设,否则在100α%显著性水平下,不能拒绝H0。注意(1)对于线性回归方程,一般软件包报告了回归系数及标准误,并且给出了针对双侧对立假设的p值,将其除以2,即可得到单侧对立假设的p值;(2)随着样本容量的扩大,一般使用较小的显著性水平,以作为抵偿标准误越来越小的一种办法;对于小样本容量,可以接受较大的显著性水平,可以扩大到0.20(4)几类特殊的显著性检验t检验:未知总体方差,检验总体均值单侧检验(one-tailtest)或双边检验

关于t检验的两种类型比较见377页卡方显著性检验:检验总体方差随机样本来自方差为σ2的正态总体,其样本容量为n,样本方差为S2,则卡方显著性检验小结(P378)例4-12:假定随机样本来自正态总体,样本容量为31,样本方差为12,零假设为真实的方差为9;备择假设为真实的方差不等于9,显著性水平为5%。进行卡方显著性检验。F显著性检验:检验两个正态总体方差是否相等如果X、Y是来自两正态总体的随机样本,自由度分别为m和n,则变量F显著性检验小结见P379

例4-13:假设男女学生分数的方差分别为46.61和83.88,其样本观察值为24、23,假设这些方差代表了来自于一更大总体的样本。检验假设:男女学生数学分数总体同方差,显著性水平为1%。解答:这里,F值为83.88/46.62=1.80(近似值)。该F值服从自由度均为23的F分布,根据F分布表,自由度为24(表中未给出自由度为23的值),在1%的显著水平下,临界的F值为2.66。由于计算的F值为1.80,小于2.66,故它不是统计显著的。也即,在显著性水平为1%时,不能拒绝两总体同方差。三、置信区间法

置信区间法提供某一置信度(例如95%)的真实的ux的取值范围,比如10.63≤ux≤12.36,如果这个区间不包括零假设中的值,比如ux=13,那么我们说以95%的置信度拒绝该零假设。

用假设检验的语言,不等式描述的置信区间称为接受区域(acceptanceregion),接受区域以外的称为零假设的临界区域(criticalregion)或拒绝区域(regionofrejection),接受区域的上界和下界称为临界值(criticalvalues)。如果参数值在零假设下位于接受区域内,则不拒绝零假设,但如果落在接受区域以外,则拒绝零假设。三、置信区间法通过求置信区间进行假设检验的例子

例4-14根据长期经验和资料分析,某砖厂生产的砖的“抗断强度”服从正态分布,方差=1.21,今从该厂生产的砖中随机地抽取6块砖,测得强度如下(单位千克/cm2):检

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论