多元线性回归模型-课件_第1页
多元线性回归模型-课件_第2页
多元线性回归模型-课件_第3页
多元线性回归模型-课件_第4页
多元线性回归模型-课件_第5页
已阅读5页,还剩101页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章经典单方程计量经济学模型:多元线性回归模型

MultipleLinearRegressionModel1第三章经典单方程计量经济学模型:多元线性回归模型

Mul一元回归分析

总体回归函数

线性总体回归函数:总体回归模型或总体回归函数的随机设定形式样本回归函数样本回归模型或样本回归函数的随机设定形式2

一元回归分析

总体回归函数2

回归分析的主要目的:根据样本回归函数SRF,估计总体回归函数PRF。3回归分析的主要目的:根据样本回归函数SRF,估计总体回归函数2.3一元线性回归模型的参数估计

一、参数的普通最小二乘估计(OLS)二、参数估计的最大似然法(ML)三、参数估计的距估计法42.3一元线性回归模型的参数估计

一、参数的普通最小二乘2.3一元线性回归模型的参数估计

5四、最小二乘估计量的性质2.3一元线性回归模型的参数估计

5四、最小二乘估计量的一元线性回归模型的统计检验

一、拟合优度检验

二、变量的显著性检验F检验、t检验、Z检验

三、参数的置信区间

6一元线性回归模型的统计检验

一、拟合优度检验6多元线性回归模型内容

多元线性回归模型概述多元线性回归模型的参数估计多元线性回归模型的统计检验案例7多元线性回归模型内容多元线性回归模型概述73.1多元线性回归模型概述

(RegressionAnalysis)一、多元线性回归模型二、多元线性回归模型的基本假设83.1多元线性回归模型概述

(RegressionAn一、多元线性回归模型

9一、多元线性回归模型

9总体回归模型(i=1,2…,n)

总体回归模型:k为解释变量的数目;习惯上,把常数项看成为虚变量的系数,该虚变量的样本观测值始终取1。于是,模型中解释变量的数目为(k+1)。;

j称为回归参数(regressioncoefficient)。10总体回归模型还可以写成:

总体回归模型(i=1,2…,n)总体回归模型:k为解释变量总体回归函数:描述在给定解释变量Xi条件下被解释变量Yi的条件均值。

j也被称为偏回归系数(partialregressioncoefficients),表示在其他解释变量保持不变的情况下,Xj每变化1个单位时,Y的均值E(Y)的变化。或者说

j给出了Xj的单位变化对Y均值的“直接”或“净”(不含其他变量)影响。总体回归函数11总体回归函数:描述在给定解释变量Xi条件下被解释变量Yi的条总体回归模型的矩阵表示12总体回归模型的矩阵表示12样本回归函数与样本回归模型从一次抽样中获得的总体回归函数的近似,称为样本回归函数(sampleregressionfunction)。样本回归函数的随机形式,称为样本回归模型(sampleregressionmodel)。

13样本回归函数与样本回归模型从一次抽样中获得的总体回归函数的近样本回归函数的矩阵表示14样本回归函数的矩阵表示14二、多元线性回归模型的基本假设

15二、多元线性回归模型的基本假设

151、关于模型关系的假设(与一元回归模型基本相同)假设1.回归模型设定是正确的。假设2.解释变量具有变异性假设3.各自变量之间不存在严格线性相关性(无完全多重共线性)假设4.随机干扰项具有条件零均值性假设5.随机干扰项具有条件同方差及不序列相关性假设6.随机干扰项满足正态分布16

1、关于模型关系的假设(与一元回归模型基本相同)假设1.回3.2多元线性回归模型的估计

一、普通最小二乘估计二、最大似然估计三、矩估计四、参数估计量的性质五、样本容量问题六、估计实例

173.2多元线性回归模型的估计一、普通最小二乘估计17说明估计方法:三大类方法:OLS、ML或者MM在经典模型中多应用OLS在非经典模型中多应用ML或者MM18说明估计方法:18一、普通最小二乘估计(OLS)19一、普通最小二乘估计(OLS)191、普通最小二乘估计最小二乘原理:根据被解释变量的所有观测值与估计值之差的平方和最小的原则求得参数估计量。201、普通最小二乘估计最小二乘原理:根据被解释变量的所有观测值已知假定

步骤:21已知假定步骤:212222正规方程组的矩阵形式条件?23正规方程组的矩阵形式条件?23

OLS估计的矩阵表示

24OLS估计的矩阵表示242、正规方程组的另一种表达252、正规方程组的另一种表达253、随机误差项

的方差

2的无偏估计

M为等幂矩阵263、随机误差项的方差2的无偏估计M为等幂矩阵262727二、最大似然估计28二、最大似然估计281、最大似然法最大似然法(MaximumLikelihood,ML),也称最大或然法,是不同于最小二乘法的另一种参数估计方法,是从最大或然原理出发发展起来的其它估计方法的基础。基本原理:当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得从模型中抽取该n组样本观测值的概率最大。ML必须已知随机项的分布。291、最大似然法最大似然法(MaximumLikelihoo2、估计步骤:以一元模型为例Yi的分布Yi的概率函数

Y的所有样本观测值的联合概率—似然函数

302、估计步骤:以一元模型为例Yi的分布Yi的概率函数Y的所对数似然函数

对数似然函数极大化的一阶条件结构参数的ML估计量31对数似然函数对数似然函数极大化的一阶条件结构参数的ML估计分布参数的ML估计量32分布参数的ML估计量323、似然函数

333、似然函数334、ML估计量由对数似然函数求极大,得到参数估计量结果与参数的OLS估计相同344、ML估计量由对数似然函数求极大,得到参数估计量结果与参数分布参数估计结果与OLS不同35分布参数估计结果与OLS不同35注意:ML估计必须已知Y的分布。只有在正态分布时ML和OLS的结构参数估计结果相同。如果Y不服从正态分布,不能采用OLS。例如:选择性样本模型、计数数据模型等。36注意:36三、矩估计

MomentMethod,MM37三、矩估计

MomentMethod,MM371、参数的矩估计参数的矩估计就是用样本矩去估计总体矩。用样本的一阶原点矩作为期望的估计量。用样本的二阶中心矩作为方差的估计量。从样本观测值计算样本一阶(原点)矩和二阶(原点)矩,然后去估计总体一阶矩和总体二阶矩,再进一步计算总体参数(期望和方差)的估计量。381、参数的矩估计参数的矩估计就是用样本矩去估计总体矩。38样本的一阶矩和二阶矩

总体一阶矩和总体二阶矩的估计量

总体参数(期望和方差)的估计量

39样本的一阶矩和二阶矩总体一阶矩和总体二阶矩的估计量总体参2、多元线性计量经济学模型的矩估计

如果模型的设定是正确,则存在一些为0的条件矩。矩估计的基本思想是利用矩条件估计模型参数。一组矩条件,等同于OLS估计的正规方程组。402、多元线性计量经济学模型的矩估计如果模型的设定是正确,则四、参数估计量的性质41四、参数估计量的性质41说明在满足基本假设的情况下,多元线性模型结构参数

的普通最小二乘估计、最大或然估计及矩估计具有线性性、无偏性、有效性。同时,随着样本容量增加,参数估计量具有渐近无偏性、渐近有效性、一致性。利用矩阵表达可以很方便地证明,注意证明过程中利用的基本假设。42说明在满足基本假设的情况下,多元线性模型结构参数的普通最小1、无偏性这里利用了假设:E(X’)=0431、无偏性这里利用了假设:E(X’)=0432、有效性(最小方差性)442、有效性(最小方差性)44五、样本容量问题45五、样本容量问题451、最小样本容量

所谓“最小样本容量”,即从最小二乘原理和最大或然原理出发,欲得到参数估计量,不管其质量如何,所要求的样本容量的下限。

样本最小容量必须不少于模型中解释变量的数目(包括常数项),即

n

k+1461、最小样本容量所谓“最小样本容量”,即从最小二乘原理和最2、满足基本要求的样本容量

从统计检验的角度:

n

30时,Z检验才能应用;

n-k8时,t分布较为稳定。

一般经验认为:

当n

30或者至少n3(k+1)时,才能说满足模型估计的基本要求。

模型的良好性质只有在大样本下才能得到理论上的证明。472、满足基本要求的样本容量从统计检验的角度:一般经验认六、例题48六、例题48地区城镇居民消费模型被解释变量:地区城镇居民人均消费Y解释变量:地区城镇居民人均可支配收入X1前一年地区城镇居民人均消费X2样本:2006年,31个地区49地区城镇居民消费模型被解释变量:地区城镇居民人均消费Y49数据50数据50变量间关系51变量间关系51变量间关系52变量间关系52OLS估计53OLS估计53OLS估计结果54OLS估计结果54ML估计55ML估计55ML估计结果56ML估计结果56MM估计57MM估计57MM估计结果58MM估计结果583.3多元线性回归模型的统计检验

StatisticalTestofMultipleLinearRegressionModel

一、拟合优度检验二、方程的显著性检验(F检验)

三、变量的显著性检验(t检验)四、参数的置信区间

593.3多元线性回归模型的统计检验

Statistica一、拟合优度检验

GoodnessofFit60一、拟合优度检验

GoodnessofFit602、可决系数与调整的可决系数

总离差平方和的分解612、可决系数与调整的可决系数总离差平方和的分解61

可决系数(CoefficientofDetermination

)该统计量越接近于1,模型的拟合优度越高。

从R2的表达式中发现,如果在模型中增加解释变量,

R2往往增大。

这就给人一个错觉:要使得模型拟合得好,只要增加解释变量即可。

但是,由增加解释变量引起的R2的增大与拟合好坏无关,所以R2需调整。62可决系数(CoefficientofDetermi

调整的可决系数(adjustedcoefficientofdetermination)

其中:n-k-1为残差平方和的自由度,n-1为总体平方和的自由度。调整的可决系数多大才是合适的?63调整的可决系数(adjustedcoefficient二、方程的显著性检验(F检验)

TestingtheOverallSignificanceofaMultipleRegression(theFtest)64二、方程的显著性检验(F检验)

TestingtheOv1、假设检验(HypothesisTesting)所谓假设检验,就是事先对总体参数或总体分布形式作出一个假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定是否接受或否定原假设。假设检验采用的逻辑推理方法是反证法。先假定原假设正确,然后根据样本信息,观察由此假设而导致的结果是否合理,从而判断是否接受原假设。判断结果合理与否,是基于“小概率事件不易发生”这一原理的。651、假设检验(HypothesisTesting)所谓假设2、方程显著性的F检验

方程的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。在多元模型中,即检验模型中的参数j是否显著不为0。662、方程显著性的F检验方程的显著性检验,旨在对模型中被解释

F检验的思想来自于总离差平方和的分解式

TSS=ESS+RSS

如果这个比值较大,则X的联合体对Y的解释程度高,可认为总体存在线性关系,反之总体上可能不存在线性关系。

因此,可通过该比值的大小对总体线性关系进行推断。67F检验的思想来自于总离差平方和的分解式如果这个比值地区城镇居民消费模型拒绝0假设,犯错误的概率为068地区城镇居民消费模型拒绝0假设,犯错误的概率为068

3、关于拟合优度检验与方程显著性检验关系的讨论

693、关于拟合优度检验与方程显著性检验关系的讨论69

对于一般的实际问题,在5%的显著性水平下,F统计量的临界值所对应的R2的水平是较低的。所以,不宜过分注重R2值,应注重模型的经济意义;在进行总体显著性检验时,显著性水平应该控制在5%以内。70对于一般的实际问题,在5%的显著性水平下,F统计量的临三、变量的显著性检验(t检验)

TestingtheSignificanceofVariables(thettest)71三、变量的显著性检验(t检验)

TestingtheS方程的总体线性关系显著不等于每个解释变量对被解释变量的影响都是显著的。必须对每个解释变量进行显著性检验,以决定是否作为解释变量被保留在模型中。这一检验是由对变量的t检验完成的。72方程的总体线性关系显著不等于每个解释变量对被解释变量的影响都1、t统计量

以cii表示矩阵(X’X)-1

主对角线上的第i个元素731、t统计量以cii表示矩阵(X’X)-1主对角线上的第2、t检验

设计原假设与备择假设:

H1:

i0

给定显著性水平

,可得到临界值t/2(n-k-1),由样本求出统计量t的数值,通过

|t|

t/2(n-k-1)或|t|

t/2(n-k-1)判断拒绝或不拒绝原假设H0,从而判定对应的解释变量是否应包括在模型中。

H0:

i=0

(i=1,2…k)

742、t检验设计原假设与备择假设:H1:i0地区城镇居民消费模型75地区城镇居民消费模型75四、参数的置信区间

ConfidenceIntervalofParameter76四、参数的置信区间

ConfidenceInterval1、区间估计回归分析希望通过样本得到的参数估计量能够代替总体参数。假设检验可以通过一次抽样的结果检验总体参数可能的假设值的范围(例如是否为零),但它并没有指出在一次抽样中样本参数值到底离总体参数的真值有多“近”。要判断样本参数的估计值在多大程度上“近似”地替代总体参数的真值,需要通过构造一个以样本参数的估计值为中心的“区间”,来考察它以多大的可能性(概率)包含着真实的参数值。这种方法就是参数检验的置信区间估计。771、区间估计回归分析希望通过样本得到的参数估计量能够代替总体

如果存在这样一个区间,称之为置信区间;1-

称为置信系数(置信度)(confidencecoefficient),

称为显著性水平;置信区间的端点称为置信限(confidencelimit)。78如果存在这样一个区间,称之为置信区间;1-称为2、参数的置信区间在(1-)的置信水平下792、参数的置信区间在(1-)的置信水平下793、如何才能缩小置信区间?

增大样本容量n,因为在同样的样本容量下,n越大,t分布表中的临界值越小,同时,增大样本容量,还可使样本参数估计量的标准差减小。提高模型的拟合优度,因为样本参数估计量的标准差与残差平方和呈正比,模型优度越高,残差平方和应越小。提高样本观测值的分散度,一般情况下,样本观测值越分散,(X’X)-1的分母的|X’X|的值越大,致使区间缩小。803、如何才能缩小置信区间?增大样本容量n,因为在同样的样81GPA=1.392-0.0135hsper+0.00148sat例题:

Hsper:在高中班上的名次的百分数Sat:学习能力测验中数学与英语的综合成绩问题1:hsper的系数为负数能讲得通?问题2:评论各变量之间关系81GPA=1.392-0.0135hsper+0.00143.4回归模型的其他函数形式

823.4回归模型的其他函数形式82说明在实际经济活动中,经济变量的关系是复杂的,直接表现为线性关系的情况并不多见。如著名的恩格尔曲线(Englecurves)表现为幂函数曲线形式、宏观经济学中的菲利普斯曲线(Pillipscuves)表现为双曲线形式等。但是,大部分非线性关系又可以通过一些简单的数学处理,使之化为数学上的线性关系,从而可以运用线性回归模型的理论方法。83说明在实际经济活动中,经济变量的关系是复杂的,直接表现为一、模型的类型与变换

1、倒数模型、多项式模型与变量的直接置换法

例如,描述税收与税率关系的拉弗曲线:抛物线

s=a+br+cr2c<0s:税收;r:税率设X1=r,X2=r2,则原方程变换为

s=a+bX1+cX2c<0

84一、模型的类型与变换1、倒数模型、多项式模型与变量的直接置2、幂函数模型、指数函数模型与对数变换法

例如,Cobb-Dauglas生产函数:幂函数

Q=AK

L

Q:产出量,K:投入的资本;L:投入的劳动

方程两边取对数:

lnQ=lnA+lnK+lnL852、幂函数模型、指数函数模型与对数变换法例如,Co生产函数(productionfunction)是指在一定时期内,在技术水平不变的情况下,生产中所使用的各种生产要素的数量与所能生产的最大产量之间的关系。

86生产函数(productionfunction)是指在一定1、生产从经济学角度来讲,生产含义是十分广泛的,它不仅仅意味着制造了一台机器或生产出一些钢材等,它还包含了各种各样的经济活动。如:律师为他人打官司,商场的经营,医生为病人看病等等。这些活动都涉及到某个人或经济实体提供产品或服务。因此,简单讲,任何创造价值的活动都是生产。2、生产要素在西方经济学中,生产要素一般被划分为劳动、土地、资本和企业家才能这四种类型。1)劳动:指人们在生产过程中提供的体力和脑力的总和。2)土地:不仅指土地本身,还包括地上和地下的一切自然资源,如森林、江河湖泊、海洋和矿藏等。3)资本:资本可以表现为实物形态或货币形态。资本的货币形态又称为货币资本;资本的实物形态又称资本品或投资品,如厂房、机器、原材料等。4)企业家才能:指企业家组织建立和经营管理企业的才能。871、生产87假定X1、X2……Xn顺次表示某产品生产过程中所使用的n种生产要素的投入数量,Q表示所能生产的最大产量。Q=f(L,K,N,E)式中,各变量分别代表产量、投入的劳动、资本、土地、企业家才能。其中N是固定的,E难以估算。

在经济学分析中,通常只使用劳动(L)和资本(K)这两种生产要素,所以生产函数可以写成:Q=f(L,K)88假定X1、X2……Xn顺次表示某产品生产过程中所使用的n种生生产函数分一种可变投入生产函数和多种可变投入生产函数。

在微观经济学中,一种可变投入的生产函数通常用来考察短期生产理论,两种(或以上)可变投入的生产函数用来考察长期生产函数。1、一种可变投入生产函数对既定产品,技术条件不变、固定投入(通常是资本)一定、一种可变动投入(通常是劳动)与可能生产的最大产量间的关系,通常又称作短期生产函数。89生产函数分一种可变投入生产函数和多种可变投入生产函数。892、多种可变投入生产函数在考察时间足够长时,可能两种或两种以上的投入都可以变动、甚至所有的投入都可以变动,通常称为长期生产函数。在这里,长短期的划分是以生产者能否变动所有的要素投入量来作为标准的,而不同的产品的生产,长短期的划分是不固定的(纺织厂-1年,豆腐坊-3月)。所以对于长短期的区分,有如下标准:短期是指生产者来不及调整所有生产要素的数量,至少有一种生产要素的数量是固定不变的时间周期。长期是生产者可以调整全部生产要素的数量的时间周期。

902、多种可变投入生产函数901、固定替代比例生产函数固定替代比例生产函数是指在每一产量水平上任何两种要素之间的替代比例都是固定的。

91函数的通常形式是Q=aL+bK,其中Q是产量,L、K分别表示劳动和资本,常数a、b>0。1、固定替代比例生产函数91函数的通常形式是2、固定投入比例生产函数(也被称为里昂剔夫生产函数)固定投入比例生产函数是指在每一个产量水平上任何一对要素投入量之间的比例都是固定的。

92函数的通常形式为Q=min{cL,dK},其中Q是产量,L、K分别表示劳动和资本,常数c、d>0,分别为劳动和资本的生产技术系数,它们分别表示生产每一单位的产品所需要的固定的劳动投入量和资本投入量。L2、固定投入比例生产函数(也被称为里昂剔夫生产函数)92函数3、柯布-道格拉斯生产函数

933、柯布-道格拉斯生产函数

933、柯布-道格拉斯生产函数柯布—道格拉斯生产函数被认为是一种很实用的生产函数,因为该函数以其简单的形式具备了经济学家所关心一些性质,它在经济理论的分析和应用中都具有一定意义。

943、柯布-道格拉斯生产函数94

95

95增加技术因素之后,可变为:

96增加技术因素之后,可变为:

96从这个模型看出,决定工业系统发展水平的主要因素是投入的劳动力数、固定资产和综合技术水平(包括经营管理水平、劳动力素质、引进先进技术等)。根据α和β的组合情况,它有三种类型:①α+β>1,称为递增报酬型,表明按技术用扩大生产规模来增加产出是有利的。②α+β<1,称为递减报酬型,表明按技术用扩大生产规模来增加产出是得不偿失的。③α+β=1,称为不变报酬型,表明生产效率并不会随着生产规模的扩大而提高,只有提高技术水平,才会提高经济效益。97从这个模型看出,决定工业系统发展水平的主要因素是投

98

98案例:

表1列出了2010年中国39个制造业的工业总产值(Y)与固定资产净值(K1)、流动资产(K2)以及年均的从业人员(L)。建立2010年中国制造业的生产函数。99案例:99100Y(亿元)K(亿元)L(万人)编号行业YKL1煤炭开采和洗选业22109217855272石油和天然气开采业9917129041063黑色金属矿采选业59994182674有色金属矿采选业37992317555非金属矿采选业30931424576其他矿采选业31140.57木材及竹材采运业34928143733698食品加工业1135061141769食品制造业9153652713010饮料制造业584245702111烟草加工业285081625364712纺织业12331604544713服装及其他纤维制品制造业7897341127614皮革、毛皮、羽绒及其制品业7393303814215木材加工及竹、藤、棕、草制品业4415226111216家具制造业10434794915817

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论