版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计量经济学重点知识整理
1一般性定义
计量经济学是以经济理论和经济数据的事实为依据,运用数学和统计学的方法,通过建立数
学模型来研究经济数量关系和规律的一门经济学科。
研究的主体(出发点、归宿、核心):
经济现象及数量变化规律
研究的工具(手段):
模型数学和统计方法
必须明确:
方法手段要服从研究对象的本质特征(与数学不同),方法是为经济问题服务
2注意:计量经济研窕的三个方面
理论:即说明所研究对象经济行为的经济理论一一计量经济研究的基础
数据:对所研究对象经济行为观测所得到的信息一一计量经济研究的原料或依据
方法:模型的方法与估计、检验、分析的方法一一计量经济研究的工具与手段
三者缺一不可
3计量经济学的学科类型
•理论计量经济学
研究经济计量的理论和方法
・应用计量经济学:应用计量经济方法研究某些领域的具体经济问题
4区别:
・经济理论重在定性分析,并不对经济关系提供数量上的具体度量
•计量经济学对经济关系要作出定量的估计,对经济理论提出经验的内容
5计量经济学与经济统计学的关系
联系:
・经济统计侧重于对社会经济现象的描述性计量
•经济统计提供的数据是计量经济学据以估计参数、验证经济理论的基本依据
・经济现象不能作实验,只能被动地观测客观经济现象变动的既成事实,只能依赖于经济统
计数据
6计量经济学与数理统计学的关系
联系:
・数理统计学是计量经济学的方法论基础
区别:
・数理统计学是在标准假定条件下抽象地研究一
般的随机变量的统计规律性;
・计量经济学是从经济模型出发,研究模型参数
的估计和推断,参数有特定的经济意义,标准
假定条件经常不能满足,需要建立一些专门的
经济计量方法
3、计量经济学的特点:
计量经济学的一个重要特点是:它自身并没有固定的经济理论,而是根据其它经济理论,应
用计量经济方法将这些理论数量化。
4、计量经济学为什么是一门单独的学科
计量经济学是经济理论、数理经济、经济统计与数理统计的混合物。
1、经济理论所作的陈述或假说大多数是定性性质的,计量经济学对大多数经济理论赋予经
验内容。
2、经济统计学的问题主要是收集、加工并通过图或表的形式以展现经济数据,他们不考虑
怎样用所收集的数据来检验经济理论。
3、虽然数理统计学提供了这一行业中使用的许多工具,但由于大多数经济数据的独特性,
计量经济学家常常需要有特殊的方法。
§2、计量经济学的方法论
1、用计量经济学来分析问题的一般方法;
(1)理论或假说的陈述
(2)理论的数学模型的设定
(3)理论的计量模型的设定
(4)获取数据
(5)计量经济模型的参数估计
(6)模型检验(假设检验)
(7)模型的应用:A、预报或预测B、利用模型进行控制或制定政策
2、应用举例(消费函数):
(1)理论或假说的陈述:
凯恩斯认为:随着收入的增加,消费也会增加,但是消费的增加不及收入增加的多。即边
际消费倾向递减。
(2)理论的数学模型设定:Y=a+bX
其中y为消费支出,x为收入,ab为模型的参数,分别代表截距和斜率系数。斜率系
数b就是消费边际倾向MPC的度量。
其中左边的Y称为应变量,方程右边的X称为自变量或解释变量。
该方程表明消费和收入之间存在准确的一一对应关系。
(3)计量模型的设定:
考虑到经济变量间的非准确关系,则消费函数的计量模型可以设定为:Y=a+Bx+u
其中U被称为干扰项,或误差项,是一个随机变量,它有良好定义的概率性质。
u是从模型中省略下来的而又集体影响着Y的全部变量的替代物(就是除了收入外,其
它可能影响消费的所有因素)。
(4)数据的获得
各种统计年鉴,企业报表和相关职能部门公布的统计数据。(该例中我们可以通过中
国统计年鉴获取相关数据)
(5)参数估计(利用各种统计或计量软件来进行如:Eviews)
以美国1980-1991年的数据,通过Eviews5.0的计算,
我们可得如下消费函数方程:y=-231.8+0.7196
其中a=-231.8b=0.7196
它表明在1980-1991年间,实际收入每增加一元,美国人的平均消费增加0.72元。
(6)模型检验(假设检验)
A、对理论或假说的检验
弗里德曼认为凡是不能通过经验数据检验(实证检验)的理论或假设,都不能作为科学
探索的一部分。
0<0.7196<1
B、对模型的检验
统计推断检验:模型的拟合优度检验、变量的显著性检验
计量经济学检验:平稳性、多重共线性、自相关、异方差等方面的检验、
(7)预报或预测
(8)利用模型进行控制或制定政策
4.计量经济学模型的应用
一、结构分析
经济学中的结构分析是对经济现象中变量之间相互关系的研究。
结构分析所采用的主要方法是弹性分析、乘数分析与比较静力分析。
计量经济学模型的功能是揭示经济现象中变量之间的相互关系,即通过模型得到弹性、乘数
等。
应用举例
二、经济预测
计量经济学模型作为一类经济数学模型,是从用于经济预测,特别是短期预测而发展起来的。
计量经济学模型是以模拟历史、从已经发生的经济活动中找出变化规律为主要技术手段。
对于非稳定发展的经济过程,对于缺乏规范行为理论的经济活动,计量经济学模型预测功能
失效。
模型理论方法的发展以适应预测的需要。
三、政策评价
政策评价的重要性。
经济政策的不可试验性。
计量经济学模型的“经济政策实验室”功能。
四、理论检验与发展
实践是检验真理的唯一标准。
任何经济学理论,只有当它成功地解释了过去,才能为人们所接受。
计量经济学模型提供了一种检验经济理论的好方法。
对理论假设的检验可以发现和发展理论。
§3变量数据参数与模型
1,计量经济模型中的变量
(1)从变量的因果关系分:
自变量因(应)变量
解释变量被解释变量
(2)从变量的性质分
内生变量:模型求解的结果
外生变量:
2、计量经济学中应用的数据
(1)时间序列数据
(2)截面数据
(3)混合数据
(4)虚拟变量数据:一些定性的事实,不能直接用一般的数据去计量。
3、参数及其估计准则
(1)无偏性
(2)最小方差性(最优无偏估计)
(3)一致性
4、计量模型的基本函数形式
(1)线性模型
(2)非线性模型(可变为线性形式的非线性模型)
双对数模型
半对数模型
倒数变换模型
第二章一元回归模型概述
回归分析的性质
回归分析的一些基本概念
对线性的几点说明
§2.1回归分析的性质
一、变量间的关系及回归分析的基本概念
1>变量间的关系
经济变量之间的关系,大体可分为两类:
(1)确定性关系或函数关系:研究的是确定现象非随机变量间的关系。
(2)统计依赖或相关关系:研究的是非确定现象随机变量间的关系。(以一定的统计规律呈
现出来的关系)
例如:
函数关系:圆面积=/(肛半径)=»・半径2
统计依赖关系/统计相关关系:
农作物产量=/(气温,降雨量,阳光,施肥量)
摒物1关]不相关卜关系就,
黜献系][通关,。户1产因联系->目的折
产相关I确联系■►糊扮析
将性相斗稗关J
〔负相关
▲注意:
①不线性相关并不意味着不相关;
②有相关关系并不意味着一定有因果关系;
③回归分析/相关分析研究一个变量对另一个(些)变量的统计依赖关系,但它们并不意味
着一定有因果关系。
④相关分析对称地对待任何(两个)变量,两个变量都被看作是随机的。回归分析对变量的
处理方法存在不对称性,即区分应变量(被解释变量)和自变量(解释变量):前者是随机
变量,后者不是。
回归与因果关系
虽然回归分析研究一个变量对另一(些)变量的依赖关系,但它并不意味着因果关系。Kendall
和Stuart认为一个统计关系式不管多么强,也不管多么有启发性,却永远不能确立因果方面
的联系,对因果关系方面的理念必须来自统计学之外,最终来自这种或那种理论。
从逻辑上说,统计关系式本身不可能意味着任何因果关系。要谈因果关系,必须诉诸先验
或理论上的思考。
§2.2回归分析的基本思想:
一、利用样本来推断总体
1、总回归函数(PRF)
2、样本回归函数(SRF)
3、样本回归函数对总回归函数的进行拟合:
(1)最小二乘法(OLS)
(2)最小二乘法的基本假定
(3)最小二乘估计的精度或标准误
(4)最小二乘估计量的性质
(5)拟合优度的度量
(6)区间估计或假设检验
4、利用回归方程进行分析、评价及预测。
二、回归分析的基本概念
1、回归分析(regressionanalysis)是研究一个变量关于另一个(些)变量的具体依赖关系的
计算方法和理论。
其用意:在于通过后者的已知或设定值,去估计和(或)预测前者的(总体)均值.
这里:前一个变量被称为被解释变量或因变量对变量测量尺度的注解:分类尺度(名
义尺度)、顺序尺度(序数尺度)、间隔尺度(区间尺度)、比率尺度(比率尺度)
三、总体回归函数
由于变量间关系的随机性,回归分析关心的是根据解释变量的己知或给定值,考察被解释变
量的总体均值,即当解释变量取某个确定值时,与之统计相关的被解释变量所有可能出现的
对应值的平均值。
例2.1:一个假想的社区有100户家庭组成,要研究该社区每月家庭消费支出Y与每月家庭
可支配收入X的关系。
即如果知道了家庭的月收入,能否预测该社区家庭的平均月消费支出水平。
为达到此目的,将该100户家庭划分为组内收入差不多的10组,以分析每一收入组的家庭
消费支出。
分析:(1)由于不确定因素的影响,对同一收入水平X,不同家庭的消费支出不完全相同;
(2)但由于调查的完备性,给定收入水平X的消费支出Y的分布是确定的,即以X的给
定值为条件的Y的条件分布(Conditionaldistribution)是已知的,如:
P(Y=561|X=800)=1/4。
因此,给定收入X的值Xi,可得消费支出Y的条件均值(conditionalmean)或条件期望
(conditionalexpectation):E(Y|X=Xi)
该例中:E(Y|X=800)=561
描出散点图发现:随着收入的增加,消费“平均地说”也在增加,且Y的条件均值均落在
一根正斜率的直线上。这条直线称为总体回归线。
概念:
在给定解释变量Xi条件下被解释变量Yi的期望轨迹称为总体回归线,或更一般地称为总体
回归曲线。
相应的函数:E(Y|X,)=/(XJ称为(双变量)总体回归函数。
含义:回归函数(PRF)说明被解释变量Y的平均状态(总体条件期望)随解释变量X变
化的规律。
函数形式:可以是线性或非线性的。
例2.1中,将居民消费支出看成是其可支配收入的线性函数时:'J=0。+^X,
为一线性函数。其中,曲夕1是未知参数,称为回归系数(regressioncoefficients)»。
四、随机扰动项
总体回归函数说明在给定的收入水平Xi下,该社区家庭平均的消费支出水平。
但对某一个别的家庭,其消费支出可能与该平均水平有偏差。
记:〃产x-E(y|xj
称"为观察值Yi围绕它的期望值E(Y|Xi)的离,是一个不可观测的随机变量,又称为随机干
扰项或随机误差项。
例2.1中,个别家庭的消费支出为:
I=E(y1乂)+4=A+AX+四(*)
即,给定收入水平Xi,个别家庭的支出可表示为两部分之和:
(1)该收入水平下所有家庭的平均消费支出E(Y|Xi),称为系统性(systematic)或确定性
(deterministic)部分。
(2)其他随机或非确定性(nonsystematic)部分i。
(*)式称为总体回归函数PRF的随机设定形式。表明被解释变量除了受解释变量的系统性影
响外,还受其他因素的随机性影响。
由于方程中引入了随机项,成为计量经济学模型,因此也称为总体回归模型。
随机误差项主要包括下列因素的影响:
随机误差项是指从模型中省略下来的而又集体地影响着Y的全部变量的替代物。
1)在解释变量中被忽略的因素的影响;
2)变量观测值的观测误差的影响;
3)其它随机因素的影响。
产生并设计随机误差项的主要原因:
1)理论的含糊性;2)数据的欠缺(糟糕的替代变量)
3)核心变量与周边变量:4)节省原则:
5)人类行为的内在随机性;6)错误的函数形式;
35五、样本回归函数(SRF)
问题:能从一次抽样中获得总体的近似的信息吗?如果可以,如何从抽样中获得总体的近似
信息?
例2.2:在例2.1的总体中有如下一个样本,
总体的信息往往无法掌握,现实的情况只能是在一次观测中得到总体的一个样本。
问:能否从该样本估计总体回归函数PRF?
回答:能
表2.1.3家庭消费支出与可支配收入的一个随机样本
Y800110014001700200023002600290032003500
X59463811221155140815951969207825852530
核样本的散点图(scatterdiagram):
每
月
消
费3000
支2500
00
出20
Y1500
15000
7U)00
0
800110014001700200023002600290032003500
每月可支§蚣工:元)样本散点图近似于一条直线,画一条直线以尽好
地拟合该散点图,由于样本取自总体,可以该线近似地代表总体回归线。该线称为样本回归
线。
记样本回归线的函数形式为:
g=/(X,)=A+«X,
称为样本回归函数。
注意:这里将样本回归线看成总体回归线的近似替代
E=A。+。国
X=E(WXJ+〃f
=A+4工+四
Y,为EQ"')的估计量;
则自为自的估计量,i=(O,l)
样本回归函数的随机形式/样本回归模型:
A八人
同样地,样本回归函数也有如下的随机形式:匕=匕+2=A+4X,.+e,
式中,弓称为《样本》残差(或剜余》项(residual),代表
了其他影响匕的随机因素的集合,可看成是的估计埔c
由于方程中引入了随机项,成为计量经济模型,因此也称为样本回归模型。
▼回归分析的主要目的:根据样本回归函数SRF,估计总体回归函数PRF。
即,根据匕=£+“=&)+6/+令
估计K=E(y|x,)+4=z7o+片x,+〃j
YJ
图总体回归线与样本回归线的基本关系
2.1.3注意:这里PRF可能永远无法知道。
§2.3对线性的几点说明
一、对变量之间关系为线性
二、对参数为线性
三、本身为非线性,但通过变形可以变为线性关系
经典回归分析主要考虑对参数是线性的形式,对变量之间的关系不作线性要求。
第三章一元回归模型的参数估计
一、参数的普通最小二乘估计(OLS)
二、最小二乘估计量的数值性质
三、一元线性回归模型的基本假设
四、最小二乘估计量的统计性质
五、参数估计量的概率分布及随机干
扰项方差的估计
六、最小二乘估计(OLS)的精度或标准误
单方程计量经济学模型分为两大类:
线性模型和非线性模型
线性模型中,变量之间的关系呈线性关系
非线性模型中,变量之间的关系呈非线性关系
一元线性回归模型:只有一个解释变量匕=4>+4Xj+〃,i=],2,..,n
Y为被解释变量,X为解释变量,⑶与⑶为待估参数,〃为随机干扰项
回归分析的主要目的是要通过样本回归函数(模型)SRF尽可能准确地估计总体回归函数(模
型)PRFo
估计方法有多种,其中最广泛使用的是普通最小二乘法。因为OLS具有良好的数值性质和
统计性质。同时,在一系列假定下OLS估计量具有BLUE性质,能满足我们用样本推断总
体的要求。
注:实际这些假设与所采用的估计方法紧密相关。
一、参数的普通最小二乘估计(OLS)
给定一组样本观测值(Xi,Yi)(i=l,2,…n)要求样本回归函数尽可能好地拟合这组值.
离差
要求样本函数仅可能好的拟合这组数值,我们可以考虑
使观测值Yi与样本回归值之差(残差ei)尽可能的小,
使之尽可能的接近PRF,即:.、
注:在统计分析中,如没有殍藻加的磁一般是指观测值与其均值的差,即
这种方法尽管有直观上的说服力,却不是一个很好的准则,如果采用
miny(y;.-y)即minZei
那么卷超和(el+e2+e3+e4+...ei)中,无
论残差离样本回归函数SRF远还是近,都
得到同样的权重。结果很可能ei离开SRF
散布得很远,但代数和很小甚至为零。
nn
普通最小二乘法给出的判断标准是:二者之差的平方和。"9"最小。
为什么要用两者之差平方和最小:
1、它根据各观测值离SRF的远近不同分别给予不同的权重。从而ei越大,Eei2也越大。
2、Eei2=f(pO,pl),即残差平方和是估计量能的某个函数。八八
3、用OLS原理或方法选出来的的,引,将使得对于给定的样本或数据残差平方和尽可能的
小。
根据微分运算,可推得用「估泡、1的下列方程组:
|£区+41:-];)工=0'
戊I线=收+5国
包工=及以+6M
方程组(*)称为正规方程组(normalequations)o
ZxM=z(x,-T)&-F)=zx1-1Zx,Zy;
自告
上述参数估计量可以写成:〔瓦=’-自无
称为OLS估计量的离差形式
由于参数的估计结果是通过最小二乘法得到的,故称为普通最小二乘估计量。
二、OLS估计量的数值性质
OLS数值性质是指运用最小二乘法而得以成立的那些性质,而不管这些数据是怎样产生的。
1、OLS估计量纯粹是用可观测的量(即样本)来表达的,因此这些量是容易计算的。
2、这些量是点估计量。
3、一旦从样本数据得到OLS估计值,便容易画出样本回归线,这样得到的回归线有如下性
质:
(1)它通过Y和X的样本均值。即..
(2)估计的Y均值等于实测的Y均由。=隔平向林
(3)残差ei的均值为零。即Eei=0。据此,我们可以
推出样本回归函数的离差形式。即打=4下
注意:在计量经济学中,往往以小写字母表示对均值的离差。
记y,=y,-Y
力=(瓦+自x,)-(6°+AK+a)
则有=81(x「又)一二%
可得%=夕归(**)
(**)式为样本回归函数的离差形式。
(4)残差ei和预测的Yi值不相关.即
Z(*)=0
(5)残差ei和Xi不相关。即EeiXi=O
三、线性回归模型的基本假设
为什么要做出假定:
AA
1,虽然通过OLS,我们可以获得同,Pi1的估计值,但我们的目的不仅仅是为了得到它们
的值。
2、更为重要的是对叩,小与真实的。0,pi之间的替代性进行推断。
3、对Yi与E(Y|X=Xi)之间的差距到底有多大进行推断。
4、在模型匕=£+%=&>+禽中,山
是一随机变量,如果我们不知道xi、ei是怎样产生的,就无法对Yi做出任何推断,也无法
对的,。1做出任何推断。
5、在一系列假定下,OLS具有良好的统计性质,能够满足我们对pO,R作出推断的
要求。
线性回归模型的基本假设
假设1、线性回归模型,回归模型对参数而言是线性的;
假设2、解释变量X是确定性变量,不是随机变量;
假设3、随机误差项具有零均值、同方差和不序列相关性:
E(pi)=0i=l,2,...,n
Var(gi)=O]j2i=l,2,...,n
Cov(gi,pj)=Oi#jij=1,2,...,n
假设4、随机误差项与解释变量X之间不相关:
Cov(Xi,pi)=0i=l,2,...,n
假设5、服从零均值、同方差、零协方差的正态分布
pi~N(0,a2)i=l,2,...,n
假设6、观测次数n必须大于待估的参数个数;
假设7、X值要有变异性;
假设8、正确的设定了回归模型;也被称为模型没有设定偏误(specificationerror);
假设9、在多元回归模型中没有完全的多重共线性.
注意:
1、如果假设2、3满足,则假设4也满足;
2、如果假设5满足,则假设3也满足。
以上假设也称为线性回归模型的经典假设或高斯(Gauss)假设,满足该假设的线性回归模
型,也称为经典线性回归模型。
另外,在进行模型回归时,还有一个暗含的假设:
假设10:随着样本容量的无限增加,解释变量X的样本方差趋于一有限常数。即
Z(Xj-又)2/〃f2,〃f8
假设5旨在排除时间序列数据出现持续上升或下降的变量作为解释变量,因为这类数据不仅
使大样本统计推断变得无效,而且往往产生所谓的伪回归问题。
四、假定条件下的最小二乘估计量的统计性质
当模型参数估计出后,需考虑参数估计值的精度,即是否能代表总体参数的真值,或者说需
考察参数估计量的统计性质。
一个用于考察总体的估计量,可从如下几个方面考察其优劣性:
(1)线性性,即它是否是另一随机变量的线性函数;
(2)无偏性,即它的均值或期望值是否等于总体的真实值;
(3)有效性,即它是否在所有线性无偏估计量中具有最小方差。
(4)渐近无偏性,即样本容量趋于无穷大时,是否它的均值序列趋于总体真值;
(5)一致性,即样本容量趋于无穷大时,它是否依概率收敛于总体的真值;
(6)渐近有效性,即样本容量趋于无穷大时,是否它在所有的一致估计量中具有最小的渐
近方差。
这三个准则也称作估计量的小样本性质。
拥有这类性质的估计量称为最佳线性无偏估计量(bestlinerunbiasedestimator,BLUE)。
当不满足小样本性质时,需进一步考察估计量的大样本或渐近性质:
高斯一马尔可夫定理
在给定经典线性回归的假定下,最小二乘估计量是具有最小方差的线性无偏估计量。
1、线性性,即估计量为、A是号的线性组合。
证讥ZxZWTZ*士
歹一~E7--夕一夕
令尢因=故仃
2-'«
=汐-=£,,•,1;
2,无偏性,即估计量瓦、总的均值(期望)等于总体回归
参数真值岛与用
=yp-=0'kX=1
易知z怎乙is-1
故+E1kM
m)=E5+2>附)=A+=A
同样地,容易得出
3、有效性(最小方差性),即在所有线性无偏估计量
中,最小二乘估计量自、A具有最小方差。
(1)先求A与其的方差
var(4)=var(^^耳)=2叶var(4+f3xXi+//,.)=k;var(w.)
的皿(工MF-双>
var)"w/)=£;var(^0-"J.c?
E(乐)=E(儿+Z%从)=E(夕。)+工吗E(〃,)=Bo咕备卜崎—行(2)
证明最小方差性
假设"是其他估计方法得到的关于小的线性无偏估计量:
/;=2*
其中,ci=ki+di,di为不全为零的常数
则容易证明vW京)Nvar(后)
普通最小二乘估计量称为最佳线性无偏估计量
由于最小二乘估计量拥有一个“好”的估计量所应具备的小样本特性,它自然也拥有大样本
特性。
J蛾整的二赘%+£kM)=Plim(M)+Plim(半詈)
।-link2
M(X0=+9=4
五、参数估计量的概率分布及随机干扰项方差的估计
1、参数估计量力和a的^率分布
普通坡小二乘估计量一抠分就是1;的线性组合,
因此,A,和a的概率分俏取决JT的分命特征
在〃足正态分办的假设卜..r是正态分布,则
也服从正态分布,闪此
A"3*京)BLN电,逛。b
瓦和A的标准差
2、随机误差项〃的方差。2的估计
在估计的参数&和。的方左表达式中,部含仃随机
扰动项〃的方芥<7:。d又称为总体方差。
由「▼:实际k是未知的,因此&和自的方力次际
I:无法计算,这就需要时其进行估计。
由于随机项3不可观测,只能从〃的估计——残差ei出发,对总体方差进行估计。
2又称为总体方差。
可以证明,。2的最小二乘估计量为〃-2它是关于°2的无偏估计量。
在随机误差项N的方差,估计出后,参颇
和A的方差和标准差的估计量分别是:
A的样本方差:SA=
A的样本标准差:%=同回
A的样本方差:s3住X;
A的样本标准差:sa=64心;
六、最小二乘估计的精度或标准误差
最小二乘估计是样本数据的函数,当样本发生变化时,估计
值也会发生变化.因此需要对估计量瓦、A的可靠性或精密
(1)尺的方差与人成正比,与成反比拯表明在给定的/
度进行某种度量。在统计学中,一个统计量的精度是由它的
条件下,X值的变化越大,区的的方差越小,A得以更大
标准误(se)来衡量的.所谓的标准误实质上是估计量尺、A
的精密度得以估计:解量”的增加,的精度也将增加.
的标准差。A
通过前面的计算,我们知道:(2)A的方差与合和£X:成正比与和样本大小成反比,
7
砥瓦)=/薪se(^)=-=3)由于月、自是估计量,它们不仅从l个样本变到另一个
Jx;样本,而且对于给定的样本,它们还可能是礴的。第四
章一元线性回归模型的统计检验
一、拟合优度检验
二、变量的显著性检验
三、参数的置信区间
回归分析是要通过样本所估计的参数来代替总体的真实参数,或者说是用样本回归线代替总
体回归线。
尽管从统计性质上已知,如果有足够多的重复抽样,参数的估计值的期望(均值)就等于其
总体的参数真值,但在一次抽样中,估计值不一定就等于该真值。
那么,在一次抽样中,参数的估计值与真值的差异有多大,是否显著,这就需要进一步进
行统计检验。
主要包括拟合优度检验、变量的显著性检验及参数的区间估计。
一、拟合优度检验
拟合优度检验:对样本回归直线与样本观测值之间拟合程度的检验。
度量拟合优度的指标:判定系数(可决系数)r2(二元回归)或R2(多元回归)
问题:采用普通最小二乘估计方法,已经保证了模型最好地拟合了样本观测值,为什么还要
检验拟合程度?
1、总离差平方和的分解
已知由一组样本观测值(Xi,Yi),i=l,2-,n得到如下样本回归直线
已知由一组样本观测值(葛MP,i=12…n
得到如下样本回归直线
工=氐+//
而Y的笫/•个观测值与样本均值的离差反=(£-"是样本回归拟合值与观测值的平均值之差,可
可分解为两部分之和认为是由回归直线解释的部分;
,,”>•一小是实际观测值与回归拟合值之差,是回归克线
yt=Yl-Y=(Yl-Yt)^(yt-y)=et+yi不能解释的部分.
如果Yi=Vi即实际观测值落在样本回归“线”上,则拟合最好。
可认为,“离差”全部来自回归线,而与“残差”无关。
对于所有样本点,则需考虑这些点与样本均值离差的平方和。
记
根据样本回归方程和样本回归函数的离差形式:TSS=2>;=2(X-F)2总体平方和(I
ofSquares)
yi=^lxi+ei
贵=6%
我们可以得到:]必=2+eiESS=£/;=£(X-F)2回归平方和(]
方程两边同时平方.求和得:|SumofSquarf
起S=»e;=Za-Z)2残差平方和
我们可以得到:
方程两边同时平方,求和得:
TSS=ESS+RSS
Y的观测值围绕其均值的总离差(totalvaria可分解为两部分:一部分来自回归线(ESS),另一
部分则来自随机势力(RSS)。
在给定样本中,TSS不变,
如果实际观测点离样本回归线越近,则ESS在TSS中占的比重越大,因此,拟合优度:
回归平方和ESS/Y的总离差TSS
2、可决系数R2统计量
记1=黑RSS
Tss
称R2为(样本)可决系数/判定系数(coefficientofdetermination)o
可决系数的取值范围:[0,1J
R2越接近1,说明实际观测点离样本线越近,拟合优度越高。
在实际计算可决系数时,的:已经估计出后:
在例2.L1的收入-消费支出例中,
R:=在二=(。刀7):X7425000
0.9766
~,£>;4590020-
注:可决系数是一个善负的统计里。它也是
着抽样的不同而不同。为此,对可决系救的统计
可靠性也应进行检蛉,这将在下章中进行。
二、回归系数的区间估计
用。ZS法得到的模型参数估讨g,尽管在重复抽样
中可预计它的期望会鼾参数的真值,题(给=4
但还是不能说明斫得缴点估计值的可靠性。虽然
我们在前面已确定了缴的标准品嫉)和s":),
但标准误只能说明估灌与其均值的离散程度
还不能说明参数真实f勤可能范围。
为此,我们要设法找到可能包含参数真实值的一个
范围,并且确定这个范围包含真实值的可靠程度。
这就需要对参数进行区间估计和假设检脸。
要判断估计的参数值P离口实的参数值夕有多“近”,
可预先选择•个概率a«Ka<l),并求一个正数B,使得
随机区间桢包含参数的真值的概定为1-,即:
P(jB-8<p<p+8)=l-a
如果存在这样一个区间,称之为置信区间;1-a称为置信系数(置信度),a称为显著性水平;
置信区间的端点称为置信限或临界值。
从定义我们可以看出,区间估计量是一个构造出来的区间,要使得它把参数的真值包括在区
间的界限内有一个特定的概率:1—a
在给定a=0.05或5%的情况下,置信(随机)
区间包含真实P的概率为0.95或95%o
它表示使用我们所描述的方法构造出来的
众多区间中包含P真值的概率为0.95或95%。
我们能不能构造出这样的区间呢??
依据什么来构造呢???
依据概率知识我们知道,如果估计量的抽样或概率分布已知,我们就可以构造出以一定概率
包含真实B值的区间。
.古曲假定条件下,“和样本向归樟型的扮加M服从
正态分布,为此%也服从正态分布。由璐、自为耳的线
生函数,所以即使在小样本情况下向、a也服从正态分
市,在大样本条件下,即使不不服从正态分布,禽、a也
会趋于正态分布。由于河、自是万°、丹的无偏估计,因而
急)
对回归系数B的区间估计可归纳为三种情况
(1)在总体方差cr记知时,在4服从正态分布的假设下
已知:Z=氏-f~N(0,l)其中:
阳㈤
品(月)=之可以确定。显著性水平通常采用三个标准
a=0.05,即1-a=0.95
a=0.01,即1-a=0.99
a=0.001,即1-a=0.999
例如:取a=0.05,即1-a=0.95,查标准正态分布表可知
Z值在(-1.96,1.96)区间的概率为0.95。即P(-1.96<Z<1.96)=0.95
(2)当总体方和未知,且样本容量充分:时,可以用N
的无偏估i廿=Z岂来代替此时由于样本容量箱大
M-2
仍可认为:Z=&二&〜N(O,D
$明)
(3以总体方差。沫知,且样本容量小时,若用无偏估计
:、旁来代替内此时
左蓼~«"-2汾布,此时幽置信区间不再利用标准正
se(用
态分布,而用分布。P(-%Yi%)=l-a
三、假设检验:
回归分析是要判断解释变量X是否是被解释变量Y的一个显著性的影响因素。
在一元线性模型中,就是要判断X是否对Y具有显著的线性性影响。这就需要进行
变量的显著性检验。
变量的显著性检验所应用的方法是数理统计学中的假设检验。
计量经计学中,主要是针对变量的参数真值是否为零来进行显著性检验的。
1、假设检验
所谓假设检验,就是事先对总体参数或总体分布形式作出一个假设,然后利用样本信息来判
断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定是否接受或否定原
假设。
当我们拒绝原假设(虚拟假设)时,我们说发现统计上是显著的。当我们不拒绝原假设
时,我们说发现不是统计上显著的。
假设检验采用的逻辑推理方法是反证法。
先假定原假设正确,然后根据样本信息,观察由此假设而导致的结果是否合理,从而判
断是否接受原假设。
判断结果合理与否,是基于“小概率事件不易发生”这一原理的
2、变量的显著性检验
对「一元线性回归方程中的八,己经知道它服
从正惑分布
…但昼)
III「真实的£未知,在用它的无偏估计量
6=2e:/m-2)替代时,可构造如F统计量
~t(n-2)
检验步骤:
(1)对总体参数提出假设
HO:pl=O,Hl:pl^O
(2)以原假设HO构造t统计量,并由样本计算其值
,A-AA
(3)给定显著硬嫉语s。质祢t分布表,得临界值ta/2(n-2)
(4)比较,判断
若|t|>ta/2(n-2),则拒绝HO,接受Hl;
对于一元线性回归方程中的自,可构造如下t
统计里进行显著性检验:
r-身---且〜*“_2)
FEE/吃=s*
在上述收入-消费支出例中,首先计算七的估计值
£,:4590020-0777,7425000匹5
°-E-----0-------------g--------13403
广是&和A的标准):的估计值分别是:
:
Ss-/yx:-713402.「42580-J0.0018-0.0425
若|t区ta/2(n-2),则拒绝Hl,接受HO;s一屋无桁-病匹而两5TE迎加1
t统计量的计算结果分别为:
t.=耶公=0.777/0.0425=18.29
r0==-103117/98.41=-1.048
给定显著性水平a=0.05,查t分布表得临界值10.05/2(8)=2.306
|tl|>2.306,说明家庭可支配收入在95%的置信度下显著,即是消费支出的主要解释变
量;
|⑵<2.306,表明在95%的置信度下,无法拒绝截距项为零的假设。
3、变量的置信区间检验
回!11分析希望通过样本所估计出的参数后来
代替总体的参数加
要判断样本参数的估计值在多大程度上可以“近似”地替代总体参数的真值,往往需要通过
构造一个以样本参数的估计值为中心的“区间”,来考察它以多大的可能性(概率)包含着
真实的参数值。这种方法就是参数检验的置信区间估计。
在置信区间检验程序中,我们试图建立一个以某种概率包含有真实,但未知的B的一个范围
区间;而在显著性检验步骤中,我们假设B为某值,然后看所计算的值,是否位于该假设
值周围某个合理的范围内。
一元线性模型中,色(41,2)的盥餐区间:
在变星的显著性检蛤中已经知道:
sl
意味着,如果给定置信度(1-a),从分布
表中查得自由度为8-2)的临界值,那么t值处在
(-ta/2,的概率是(1-a)。表示为:
P(-r.<:<:.)=1-a
&-B,
即P(-r.<
Tsi-
-q*q<月(&)=i-a
于是得到:(1-a)的置信度下,内的置信区间是
(4Yxs”4+/xs-
ITA
在上述收入-消费支出例中,如果给定a
=0.01,查表得:
%("-2)=%0M(8)=3.355
由于Sit=0.042=98.41
于是,瓦、区的置信区间分别为:
(0.6345,0.9195)
(-433.32,226.98)
由于置信区间一定程度地给出了样本参数估计值与总体参数真值的''接近”程度,因此置信
区间越小越好。
要缩小置信区间,需
(1)增大样本容量n,因为在同样的置信水平下,n越大,t分布表中的临界值越小;同
时,增大样本容量,还可使样本参数估计量的标准差减小;
(2)提高模型的拟合优度,因为样本参数估计量的标准差与残差平方和呈正比,模型拟
合优度越高,残差平方和应越小。
第六章双变量线性回归模型的延伸
6.1过原点的回归
过原点的回归
截距项不存在或为0.过原点的回归
如,工二月%+%估计的模型:
y=4乂
或Y=p,Xi+ui
运用OLS方法:a
B-X丫和的(1>会-
2yx,-2
和£2_2苏
N-1
//过原点的回归
无截距模型的性质
y=&+/x+〃,Y=。20u'i
LWX不必要
-T.XY
p=
2乙*再一z*
2R2A82
,人可能为负值.
Yar(P2)=q―2A
1.X-
整盘
3,df不必包括常数项,ie,(女k)成江
n-1
实际上:n-1
:2
•1.除非有非常强的先验性或理论预期.否则回归中应该包含_IZGC-XXY-^
d2_工(")'
截距项.Z(X一kZ(Y;骨
•2.如果回归模型包含截距项,但结果不显著则我们需要除主orn2-(Z孙Y
R
截距项作回归.
例1:资本资产定价模型(CAPM)证券期望风险溢价二期望市场风险溢价
但
月
2m"r/
.
无
险
风
望
的
回
率
第I种证报
场
组
券的期市
证
券
合
望回报回
报
的证券市场线
率率
A不可分散风险的度量.
A>i=>波动性或进攻型证券.
片VI=>防御性证券.E&-f
例2:覆盖的平价利率
国际利率差等于汇率预期升水
例2:(Cont.)
回归:20/)=0
^)+«,
e
1
例如果利率平价,//则预期为零.
6.2尺度与测量单位
改变X和Y的测量单位
Y=Pl+p,X+u1
P,:回归直线的斜率又二小+凤天+4
回归结果中
P=Y的单位变化=丝成@
;-x的单位变化-AX或怒,
P2R2,t,F/k=(Pi/k)+(P)X/k+uA
统计量不变,i2i
如果Y'=1000Y
但SEE,RSSY:=p:+02冷福
X*=1000X和其它统计
则1000Y=1000+^lOOOX+100CU,量发生变化.这里Y:=Y/ku*=UjZk
=>V=众+^X+u'
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年沪科版九年级地理下册阶段测试试卷含答案
- 2025年新科版必修2历史下册月考试卷
- 二零二五版模具维修与翻新服务合同4篇
- 二零二五年度智慧城市建设年薪制合同4篇
- 2025年度养老康复派遣员工康复治疗合同4篇
- 2025年度面包烘焙原料绿色认证采购合同3篇
- 2025年度设施农业专用化肥农药定制配送合同4篇
- 2024版离婚债务解决方案合同范例一
- 二零二五年度煤炭期货交易居间代理合同3篇
- 2025年度农业科技园区建设与管理合同范例4篇
- 撂荒地整改协议书范本
- 国际贸易地理 全套课件
- GB/T 20878-2024不锈钢牌号及化学成分
- 诊所负责人免责合同范本
- 2024患者十大安全目标
- 印度与阿拉伯的数学
- 会阴切开伤口裂开的护理查房
- 实验报告·测定鸡蛋壳中碳酸钙的质量分数
- 部编版小学语文五年级下册集体备课教材分析主讲
- 电气设备建筑安装施工图集
- 《工程结构抗震设计》课件 第10章-地下建筑抗震设计
评论
0/150
提交评论