计量经济学第二章2014上_第1页
计量经济学第二章2014上_第2页
计量经济学第二章2014上_第3页
计量经济学第二章2014上_第4页
计量经济学第二章2014上_第5页
已阅读5页,还剩115页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

什么是计量经济学?计量经济学能帮助我们什么?什么是计量经济学模型?怎么建模?计量经济学的地位数据

计量经济学是一门根据现实的统计数据,具体地估计由经济理论给出的变量之间的关系式,进而根据估计结果进行预测和政策评价的科学。经济理论、统计学和数学的结合

计量经济学能做什么?量化经济变量之间的关系

——商品房的需求价格弹性是多少?

——菲利普斯曲线的斜率有多陡峭?为经济理论提供了检验的工具

——经济政策变化时,菲利普斯曲线稳定吗?

——大学教育一定能提高一生的收入吗?预测未来经济事件的工具

——下一年的GDP会是多少?

——东风公司明年会卖掉多少汽车?政策评价

计量经济学模型计量经济学模型揭示经济活动中各个因素之间的定量关系,并用随机性的数学方程加以描述。

建立计量经济学模型的起点:经济模型(描述各种关系的数理方程)

——规范的经济模型

——不规范的推理计量经济模型化过程分析理论的计量经济模型不合格

模型的检验

估计模型的参数

收集适当的资料(数据)合格政策评价预测经典计量经济学在理论方法方面特征是:⑴模型类型—随机模型⑵模型导向—经济理论导向⑶模型结构—线性或者可以化为线性⑷数据类型—正态分布的连续随机变量;⑸估计方法—最小二乘方法△经济学的一个分支学科几类常用的样本数据类型横截面数据时间序列数据混合截面数据面板数据第二章简单线性回归模型(1)ChapterOutline

本章大纲DefinitionoftheSimpleRegressionModel

简单回归模型的定义DerivingtheOrdinaryLeastSquaresEstimates

普通最小二乘法的推导准备

(1)确定性关系或函数关系:研究的是确定现象非随机变量间的关系。(2)统计依赖关系:研究的是非确定现象随机变量间的关系。一、变量间的关系及回归分析的基本概念

1、变量间的关系经济变量之间的关系,大体可分为两类:对变量间统计依赖关系的考察主要是通过相关分析(correlationanalysis)或回归分析(regressionanalysis)来完成的:例如:

函数关系:统计依赖关系:

①不线性相关并不意味着不相关;

②有相关关系并不意味着一定有因果关系;③回归分析/相关分析研究一个变量对另一个(些)变量的统计依赖关系,但它们并不意味着一定有因果关系。

▲注意:

回归分析(regressionanalysis)是研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论。

其用意:在于通过后者的已知或设定值,去估计和(或)预测前者的(总体)均值。

2、回归分析的基本概念

回归分析构成计量经济学的方法论基础,其主要内容包括:

(1)根据样本观察值对经济计量模型参数进行估计,求得回归方程;(2)对回归方程、参数估计值进行显著性检验;(3)利用回归方程进行分析、评价及预测。简单回归模型:y=b0+b1x+e或y=b1+b2x+e

等式中只有一个非常数解释变量。我们称之为简单回归模型,一元线性回归模型.SomeTerminology

术语注解SomeTerminology

术语注解简单回归模型:y=b0+b1x+e或y=b1+b2x+e

y通常被称为-因变量(DependentVariable)

-左边变量(Left-HandSideVariable)-被解释变量(ExplainedVariable)-回归子(Regressand)-响应变量(responsevariable)-被预测变量(predictedvariable)术语注解简单回归模型:y=b0+b1x+e或y=b1+b2x+e

x通常被称为-自变量(independentVariable)

-右边变量(right-HandSideVariable)-解释变量(explanatoryVariable)-回归元(regressor)-控制变量(controlvariable)-预测变量(predictorvariable)术语注解在简单回归模型:y=b1+b2x+eb1,b2被称为回归系数(regressioncoefficients

)。b1也被称为常数项或截矩项(interceptterm),或截矩参数(interceptparameter)。b2代表了解释变量x的边际效果,也被成为斜率参数(slopeparameter

)。术语注解在简单回归模型:y=b1+b2x+ee

为误差项(errorterm)或扰动(disturbance)它代表了除了x之外可以影响y的因素。随机误差项主要包括下列因素的影响:1)在解释变量中被忽略的因素的影响;2)变量观测值的观测误差的影响;3)模型关系的设定误差的影响;4)其它随机因素的影响。产生并设计随机误差项的主要原因:1)理论的含糊性;2)数据的欠缺;3)节省原则。术语注解线性回归的含义:y和x之间并不一定存在线性关系,但是,只要通过转换可以使y的转换形式和x的转换形式存在相对于参数的线性关系,该模型即称为线性模型。Forexample,y=eb1+b2x+e.

转化为:log(y)=b1+b2x+eForexample,Forexample,简单回归模型例子(1)

wage=b1+b2educ+e

上述简单工资函数描述了受教育年限和工资之间的关系,educ用受教育的年限来度量e:包含了其他非观测因素,如劳动经验、天生素质、任现职时间等。b2:衡量了在其他条件不变的情况下,多接受一年教育,工资可以增加多少.简单回归模型例子(2)食品支出和收入之间的关系: 食品支出=b1+b2收入+e

e:包含了其他非观测因素,如年龄、生活习惯(是否素食主义)等。b2:衡量了在其他条件不变的情况下,收入增加100美元,食品支出的变化.2.1经济模型以收入与食品支出为例(food.wfl)对于周收入为1000美元的家庭,食品支出情况。

食品支出y为一个随机变量。收入x为固定的值(1000)图2.1(a)给定收入x=1000美元,食品支出y的概率分布条件期望令(X,Y)代表一个工人总体,X是受教育程度,Y为小时工资。则:E(Y|x=12):是总体中所有受了12年教育的工人的平均小时工资。E(Y|x=16):是总体中所有受了16年教育的工人的平均小时工资。那么E(Y|X)可能=f(X)图2.1(b)给定收入x=1000、2000美元,食品支出y的概率分布经济理论:食品支出取决于家庭收入x,用条件均值表示:计量经济模型的基础2.2计量经济模型食品支出和收入之间的关系:

y=E(y|x)+e=b1+b2x+eASimpleAssumption

关于e的假定我们假定总体中误差项e的平均值为零.:

E(e)=0 思考:该假定是否一定成立呢?ASimpleAssumption

关于e的假定Ifforexample,E(e)=5.Then y=(b0+5)+b1x+(e-5),

therefore,E(e’)=E(e-5)=0.上述推导说明我们总可以通过调整常数项来实现误差项的均值为零.ZeroConditionalMeanAssumption

条件期望零值假定

y=b1+b2x+e

E(e|x)=E(y-(b1+b2x

)|x)=E(y|x)-E(b1+b2x

|x)=b1+b2x

–(b1+b2x)=0

E(e|x)=E(e)=0ZeroConditionalMeanAssumption

条件期望零值假定

思考:该假定是何含义?我们需要对e和x之间的关系做一个关键假定。理想状况是对x的了解并不增加对u的任何信息。换句话说,我们需要u和x相互独立。

如果遗漏重要变量,则违法了该假定。导致严重后果(有偏)。ZeroConditionalMeanAssumption

条件期望零值假定

教育年限和工资的关系

wage=b0+b1educ+ee:包含了其他非观测因素,如劳动经验、内在能力、任现职时间等。

假定u代表内在能力,条件期望零值假定说明不管解释教育的年限如何,该能力的平均值相同。E(ability|edu=6)=E(ability|edu=18)=0.所有受教育的人都有相同的平均能力(后面评价)思考:为什么有这种条件期望的假定,而不直接给出cov(x,u)=0的形式?思考:为什么有这种条件期望的假定,而不直接给出cov(x,u)=0的形式?cov(x,u)=0表示不相关,但在统计学中其含义是无线性相关,不能保证无非线性相关。ZeroConditionalMeanAssumption

条件期望零值假定

简单回归模型:y=b1+b2x+eE(u|x)=E(u)=0.说明总体回归函数应满足

E(y|x)=b1+b2x.E(y|x)是x的线性函数,y的分布以它为中心。..x1=5x2=10E(y|x)=b0+b1xyf(y)给定x时y的条件分布在一篇论文中,Galton发现:虽然有一个趋势,父母高,儿女也高;父母矮,儿女也矮,但给定父母的身高,儿女辈的平均身高却趋向于或者“回归”到全体人口的平均身高。换言之,尽管父母双亲都异常高或异常矮,而儿女的身高则有走向人口总体平均身高的趋势。--Galton的普遍回归定律在Carter教材中:x被认为是非随机的,我们不再需要条件记号“|”。不再使用E(e|x)=0,而直接使用E(e)=0简单线性回归模型的假设

(SR1-SR6)SR1.在总体模型中,因变量y和自变量x和误差e

的关系可写作

y=b1+b2x+e,

其中b1和b2分别是总体的截距参数和斜率参数(关于参数是线性的)SR2.随机误差项的均值为0E(e)=0,则E(y)=b1+b2xSR3.随机误差项的方差为(同方差):

SR4.无序列相关性

..x1x2HomoskedasticCase同方差的情形E(y|x)=b1+b2xyf(y|x).x

x1x2yf(y|x)HeteroskedasticCase异方差的情形x3..E(y|x)=b1+b2xVar(wage|educ)随educ增加SR5.x非随机,必须至少取两个不同的值SR6.正态分布假定

下标的使用惯例:横截面数据--

i时间序列数据--t一个假想的社区有100户家庭组成,要研究该社区每月家庭消费支出Y与每月家庭可支配收入X的关系。

PopulationRegressionFunction,PRF

总体回归函数

为达到此目的,将该100户家庭划分为组内收入差不多的10组,以分析每一收入组的家庭消费支出。

(1)由于不确定因素的影响,对同一收入水平X,不同家庭的消费支出不完全相同;(2)但由于调查的完备性,给定收入水平X的消费支出Y的分布是确定的,即以X的给定值为条件的Y的条件分布(Conditionaldistribution)是已知的,如:P(Y=561|X=800)=1/4。因此,给定收入X的值Xi,可得消费支出Y的条件期望(conditionalexpectation):

E(Y|X=Xi)该例中:E(Y|X=800)=605分析:

描出散点图发现:随着收入的增加,消费“平均地说”也在增加,且Y的条件均值均落在一根正斜率的直线上。这条直线称为总体回归线。05001000150020002500300035005001000150020002500300035004000每月可支配收入X(元)每月消费支出Y(元)

概念:

在给定Xi条件下Yi的期望轨迹称为总体回归线(populationregressionline),或总体回归曲线(populationregressioncurve)。称为(双变量)总体回归函数(populationregressionfunction,PRF)。

相应的函数:例中,个别家庭的消费支出为:

(*)式称为总体回归函数(方程)PRF的随机设定形式。表明被解释变量除了受解释变量的系统性影响外,还受其他因素的随机性影响。又称为总体回归模型。

(1)该收入水平下所有家庭的平均消费支出E(Y|Xi),称为系统性(systematic)或确定性(deterministic)部分。(2)其他随机或非确定性(nonsystematic)部分ui。即,给定收入水平Xi,个别家庭的支出可表示为两部分之和:(*)SampleRegressionFunction,SRF

样本回归函数

问题:能从一次抽样中获得总体的近似的信息吗?如果可以,如何从抽样中获得总体的近似信息?

问:能否从该样本估计总体回归函数PRF?回答:能

假设在上例的总体中有如下一个样本,

总体的信息往往无法掌握,现实的情况只能是在一次观测中得到总体的一个样本。核样本的散点图(scatterdiagram):

样本散点图近似于一条直线,画一条直线以尽好地拟合该散点图,由于样本取自总体,可以该线近似地代表总体回归线。该线称为样本回归线(sampleregressionlines)。

记样本回归线的函数形式为:称为样本回归函数(sampleregressionfunction,SRF)。

这里将样本回归线看成总体回归线的近似替代

注意:

样本回归函数的随机形式/样本回归模型:同样地,样本回归函数也有如下的随机形式:

由于方程中引入了随机项,成为计量经济模型,因此也称为样本回归模型(sampleregressionmodel)。

▼回归分析的主要目的:根据样本回归函数SRF,估计总体回归函数PRF。注意:这里PRF可能永远无法知道。即,根据

估计四个概念总体回归模型总体回归函数样本回归模型样本回归函数四个概念总体回归模型总体回归函数样本回归模型样本回归函数估计DerivingtheOrdinaryLeastSquaresEstimates普通最小二乘法的推导

回归的基本思想是从样本去估计总体参数。

我们用{(xi,yi):i=1,…,n}来表示一个随机样本,并假定每一观测值满足

yi=b1+b2xi+ei。。

估计方法有多种,其种最广泛使用的是普通最小二乘法(ordinaryleastsquares,OLS)。....y4y1y2y3x1x2x3x4}}{{e1e2e3e4xyPopulationregressionline,sampledatapointsandtheassociatederrorterms总体回归线,样本观察点和相应误差E(y|x)=b1+b2xDerivingOLSEstimates

普通最小二乘法的推导假定:E(e|x)=E(e)=0可以得到:

Cov(x,e)=E(xe)=0sincee=y–

b1

b2x,所以有:

E(y–

b1

b2x)=0E[x(y–

b1

b2x)]=0Thesearecalledmoment(矩)restrictionsDerivingOLSusingM.O.M.

使用矩方法推导普通最小二乘法

矩方法是将总体的矩限制应用于样本中。目标是通过选择参数值,使得在样本中矩条件也可以成立。Thesampleversionsareasfollows:DerivationofOLS

普通最小二乘法的推导

根据样本均值的定义以及加总的性质,可将第一个条件写为DerivationofOLS

普通最小二乘法的推导第二个条件:SotheOLSestimatedslopeis

因此OLS估计出的斜率为思考:条件说明什么?斜率估计量等于样本中x

和y

的协方差除以x的方差。若x

和y

正相关则斜率为正,反之为负。Alternateapproachtoderivation

推导方法二

给定一组样本观测值(Xi,Yi)(i=1,2,…n)要求样本回归函数尽可能好地拟合这组值.

普通最小二乘法(Ordinaryleastsquares,OLS)给出的判断标准是:二者之差的平方和最小方程组2A.3和2A.4称为正规方程组(normalequations)为什么不是残差的其他某个函数的最小化?UsingEviewsforOLSregressions

使用Eviews进行OLS回归我们已经推导出公式计算参数的OLS估计值,所幸的是我们不必亲手去计算它们。在Eviews中进行回归非常简单,例子:食品支出和收入(food.wfl)40个家庭的随机样本描述性统计线性回归例工资和受教育程度526个样本的OLS估计结果:

Example:CEOSalaryandReturnonEquity

例:首席执行官的薪水和资本权益报酬率Example:CEOSalaryandReturnonEquity

例:CEO的薪水和资本权益报酬率变量salary衡量了以1000美元为单位的年薪,其最小值,均值和最大值分别如下:

(min,mean,max)=(223,1281,14822).

Roe=净收入/所有者权益,为三年平均值。其最小值,均值和最大值分别为:(0.5,17.18,56.3)

salary对roe的回归方程为:

Example:CEOSalaryandReturnonEquity

例:CEO的薪水和资本权益报酬率对估计量的解释:963.19:常数项的估计值衡量了当roe为零时CEO的薪水。18.5:b2

的估计值反应了ROE若增加一个百分点工资将平均增加18500美元。Ifroe=30,whatistheestimatedsalary?思考:两条线分别代表什么意思?拟合值和残差Salaryhat是拟合值,uhat是残差补充:抽样与抽样分布参数估计假设检验统计方法描述统计推断统计什么是推断统计?

ThepurposeofStatisticsinference(统计推断)istoobtaininformationaboutapopulationfrominformationcontainedinsample.

例1

一汽车轮胎制造商生产一种被认为寿命更长的新型轮胎。120个样本测试平均里程:36,500公里推断新轮胎平均寿命:36,500公里400个样本

支持人数:160推断支持该候选人的选民占全部选民的比例:160/400=40%例2:某党派想支持某一候选人参选美国某州议员,为了决定是否支持该候选人,该党派领导需要估计支持该候选人的民众占全部登记投票人总数的比例。由于时间及财力的限制:主要用在下列两种情况:

主要内容:

1、抽样估计(estimation)2、假设检验(hypothesistesting)

注意:

●抽样估计只得到对总体特征的近似测度,因此,抽样估计还必须同时考察所得结果的“可能范围”与“可靠程度”。

1、对所考查的总体不可能进行全部测度;

2、从理论上说可以对所考查的总体进行全部测度,但实践上由于人力、财力、时间等方面的原因,无法(不划算)进行全部测度。第一节抽样随机样本第二节点估计与抽样分布例

某大公司人事部经理整理其2500个中层干部的档案。其中一项内容是考察这些中层干部的平均年薪及参加过公司培训计划的比例。总体:2500名中层干部(population),

如果:上述情况可由每个人的个人档案中得知,可容易地测出这2500名中层干部的平均年薪及标准差。假如有1500人参加了公司培训,得到了如下的结果:

总体均值(populationmean):

=51800

总体标准差(Populationstandarddeviation):

=400

参加公司培训计划的比例为:P=1500/2500=0.60参数是总体的数值特征

Aparameterisanumericalcharacteristicofapopulation一、点估计假如随机抽取了一个容量为30的样本:

AnnualSalaryManagementTrainingProgram?49094.3Yes53263.9Yes49643.5Yes……

根据该样本求得的年薪样本平均数、标准差及参加过培训计划人数的比例分别为:(一)点估计

上述估计总体参数的过程被称为点估计(pointestimation);

由于点估计量是由样本测算的,因此也称为样本统计量。估计量和估计值样本的(不包含未知总体参数的)函数称为统计量;由于一个统计量对于不同的样本取值不同,所以,估计量也是随机变量,并有其分布。如果样本已经得到,把数据带入之后,估计量就有了一个数值,称为该估计量的一个实现(realization),也称为一个估计值(estimate)。二、抽样分布

在上述某公司30个中层干部的简单随机抽样中,如果再一次抽样的样本与前一次的不同,则可得到另外的平均年薪样本均值、标准差以及受训干部的比例。同样地,如果多次抽样,则可得到多个不同的结果。

下表是一个假设的经过500次抽样后的情况表。500个的频数分布与相对频数分布,图500个的相对频数分布

这里,的相对频数分布,就称为的抽样分布。样本统计量的概率分布,是一种理论分布在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布随机变量是样本统计量样本均值,样本比例,样本方差等结果来自容量相同的所有可能样本 抽样分布

(samplingdistribution)抽样分布的形成过程

(samplingdistribution)总体计算样本统计量如:样本均值、比例、方差样本1、样本均值的抽样分布

1、样本均值的抽样分布(SamplingDistributionof)样本均值的抽样分布【例】设一个总体,含有4个元素(个体)

,即总体单位数N=4。4

个个体分别为x1=1,x2=2,x3=3,x4=4

。总体的均值、方差及分布如下总体分布14230.1.2.3均值和方差样本均值的抽样分布

现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为3,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)3,4样本均值的抽样分布

计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)x样本均值的抽样分布1.000.10.20.3P

(x)1.53.04.03.52.02.5样本均值的分布与总体分布的比较

=2.5σ2=1.25总体分布14230.1.2.3抽样分布P(x)1.00.1.2.31.53.04.03.52.02.5x

考察样本均值的概率分布形式。分两种况:

1)总体分布已知且为正态分布;

2)总体分布未知;(1)当总体分布已知且为正态分布或接近正态分布时,则无论样本容量大小如何,样本均值都为正态分布。样本均值的抽样分布

=50

=10X总体分布n=4抽样分布xn=16当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值

x也服从正态分布,

x

的数学期望为μ,方差为σ2/n。即

x~N(μ,σ2/n)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论