




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1多元回归分析:估计(1)
MultipleRegressionAnalysis:Estimation(1)y=b0+b1x1+b2x2+...bkxk+u多元回归分析:估计共85页,您现在浏览的是第1页!2本章大纲使用多元回归的动因普通最小二乘法的操作和解释估计量的期望值OLS估计量的方差OLS的有效性:高斯-马尔可夫定理多元回归分析:估计共85页,您现在浏览的是第2页!3课堂大纲使用多元回归的动因
普通最小二乘法的操作和解释假定MLR.1–MLR.4OLS估计值的无偏性多元回归分析:估计共85页,您现在浏览的是第3页!4
动因:优点经验研究中使用简单回归模型的主要缺陷是:它很难得到在其它条件不变的情况下,x对y的影响。多元回归分析更适合于其它条件不变情况下的分析,因为多元回归分析允许我们明确地控制其它许多也同时影响因变量的因素。多元回归模型能容纳很多可能相关的解释变量,所以在简单回归分析可能误导的情况下,可以寄希望于多元回归模型来推断因果关系。多元回归分析:估计共85页,您现在浏览的是第4页!5
动因:优点可以解释更多的因变量变动。它可以表现更一般的函数形式。多元回归模型是实证分析中最广泛使用的工具。多元回归分析:估计共85页,您现在浏览的是第5页!6
动因:一个例子考虑一个模型:家庭消费是家庭收入的二次方程。Cons=b0+b1inc+b2inc2+u现在,边际消费倾向可以近似为MPC=b1+2b2
多元回归分析:估计共85页,您现在浏览的是第6页!7
类似于简单回归模型b0仍是截距b1到bk都称为斜率参数u仍是误差项(或干扰项)仍需作零条件期望的假设,所以现在假设E(u|x1,x2,…,xk)=0仍然最小化残差平方和,所以得到k+1个一阶条件多元回归分析:估计共85页,您现在浏览的是第7页!8如何得到OLS估计值……k+1个一阶条件:多元回归分析:估计共85页,您现在浏览的是第8页!9OLS拟合值和残差的性质残差项的均值为零每个自变量和OLS协残差之间的样本协方差为零。点总位于OLS回归线上。多元回归分析:估计共85页,您现在浏览的是第9页!10
例子:大学GPA的决定因素两个解释变量的回归pcolGPA:大学成绩预测值hsGPA:高中成绩绩ACT:成绩测验分数(achievementtestscore)pcolGPA=1.29+0.453hsGPA+0.0094ACT一个解释变量的回归 pcolGPA=2.4+0.0271ACTACT的系数大三倍。如果这两个回归都是对的,它们可以被认为是两个不同实验的结果。多元回归分析:估计共85页,您现在浏览的是第10页!11
对“排除其它变量影响”的解释考虑回归线的一种表达式为:是由以下回归得出的残差:多元回归分析:估计共85页,您现在浏览的是第11页!12
“排除其它变量影响”(一般情况)在一个含有k个解释变量的一般模型中,仍然可以写成
但残差来自x1对x2…,xk的回归。于是度量的是,在排除x2…,xk等变量的影响之后,x1对y的影响。多元回归分析:估计共85页,您现在浏览的是第12页!13
比较简单回归和多元回归估计值这是因为存在一个简单的关系
这里,是x2对x1的简单回归得到的斜率系数。多元回归分析:估计共85页,您现在浏览的是第13页!14
简单回归和多元回归估计值的比较多元回归分析:估计共85页,您现在浏览的是第14页!拟合优度每一个观察值可被视为由解释部分和未解释部分构成:定义:SST=SSE+SSR15多元回归分析:估计共85页,您现在浏览的是第15页!16拟合优度(续)我们也可以认为R2等于实际的yi与估计的之间相关系数的平方多元回归分析:估计共85页,您现在浏览的是第16页!17
更多关于R2考虑从一个解释变量开始,然后加入第二个。OLS性质:最小化残差平方和。如果OLS恰好使第二个解释变量系数取零,那么不管回归是否加入此解释变量,SSR相同。如果OLS使此解释变量取任何非零系数,那么加入此变量之后,SSR降低了。实际操作中,被估计系数精确取零是极其罕见的,所以,当加入一个新解释变量后,一般来说,SSR会降低。多元回归分析:估计共85页,您现在浏览的是第17页!18
假定MLR.1(线性于参数)总体模型可写成y=b0+b1x1+b2x2+…+bkxk+u
其中,b1,
b2…,bk是我们所关心的未知参数(常数),而u则是无法观测的随机误差或随机干扰。上述方程规范地表述了总体模型或真实模型。由于因变量y与自变量都可以为任意函数,所以上式是灵活多变的。
多元回归分析:估计共85页,您现在浏览的是第18页!19假定MLR.3(不存在完全共线性)在样本(因而在总体)中,没有一个自变量是常数,自变量之间也不存在严格的线性关系。如果方程中一个自变量是其它自变量的一个线性组合时,我们说此模型遇到完全共线性(perfectcollinearity)问题,此时不能用OLS估计参数。多元回归分析:估计共85页,您现在浏览的是第19页!20假定MLR.4(条件均值为零)给定自变量的任何值,误差u的期望值为零。换句话说,E(u|x1,x2…,xk)=0.
当该假定成立时,我们说具有外生解释变量(exogenousexplanatoryvariables);若出于某种原因xj仍与u相关,则称xj为内生解释变量(endogenousexplanatoryvariables)。我们将特别注意当重要变量缺省时导致假定3不成立的情况。多元回归分析:估计共85页,您现在浏览的是第20页!21
定理3.1(OLS的无偏性)无偏性是估计量的特性,而不是估计值的特性。估计量是一种方法(过程),该方法使得给定一个样本,我们可以得到一组估计值。我们评价的是方法的优劣。不正确的说法:“5%是教育汇报率的无偏估计值。”多元回归分析:估计共85页,您现在浏览的是第21页!22
多元回归分析:估计(2)
MultipleRegressionAnalysis:Estimation(2)y=b0+b1x1+b2x2+...bkxk+u多元回归分析:估计共85页,您现在浏览的是第22页!23课堂大纲模型设定不足或过度设定遗漏变量的偏误OLS斜率估计量的抽样方差多元回归分析:估计共85页,您现在浏览的是第23页!24
变量太多还是太少了?如果我们在设定中排除了一个本属于真实模型的变量会如何?如果一个实际上属于真实模型的变量被遗漏,我们说此模型设定不足。此时OLS通常有偏。推导由遗漏重要变量所造成的偏误,是模型设定分析的一个例子。多元回归分析:估计共85页,您现在浏览的是第24页!25
遗漏变量的偏误(续)回想真实模型:所以分子为:多元回归分析:估计共85页,您现在浏览的是第25页!26
遗漏变量的偏误(续)考虑x2对x1的回归,因此:多元回归分析:估计共85页,您现在浏览的是第26页!27
偏误方向总结Corr(x1,x2)>0Corr(x1,x2)<0b2>0偏误为正偏误为负b2<0偏误为负偏误为正多元回归分析:估计共85页,您现在浏览的是第27页!28
例3.6:小时工资方程假定模型log(wage)=b0+b1educ
+b2abil+u,在估计时遗漏了abil。b1的偏误方向如何?因为一般来说ability对y有正的局部效应,并且ability和educationyears正相关,所以我们预期b1上偏。多元回归分析:估计共85页,您现在浏览的是第28页!29
更一般的情形假设总体模型满足假定MLR.1~MLR.4。但我们遗漏了变量x3,并估计了模型假设X2和X3无关,
X1和X3相关。是β1的一个有偏估计量,但是否有偏?多元回归分析:估计共85页,您现在浏览的是第29页!30
更一般的情形多元回归分析:估计共85页,您现在浏览的是第30页!31OLS估计量的方差现在我们知道估计值的样本分布是以真实参数为中心的。我们还想知道这一分布的分散状况。在一个新增假设下,度量这个方差就容易多了:多元回归分析:估计共85页,您现在浏览的是第31页!32
OLS估计量的方差(续)用x表示(x1,x2,…xk)假定Var(u|x)=s2,也就意味着Var(y|x)=s2假定MLR.1-5共同被称为高斯-马尔可夫假定(Gauss-Markovassumptions)
多元回归分析:估计共85页,您现在浏览的是第32页!33
对定理3.2的解释定理3.2显示:估计斜率系数的方差受到三个因素的影响:误差项的方差总的样本变异解释变量之间的线性相关关系多元回归分析:估计共85页,您现在浏览的是第33页!34
对定理3.2的解释(2):总的样本变异更大的SSTj意味着更小的估计量方差,反之亦然。其它条件不变情况下,x的样本方差越大越好。增加样本方差的一种方法是增加样本容量。参数方差的这一组成部分依赖于样本容量。多元回归分析:估计共85页,您现在浏览的是第34页!35
对定理3.2的解释(3):多重共线性(续)多重共线性是一个数据问题可以通过适当的地舍弃某些变量,或收集更多数据等方法来降低。注意:虽然某些自变量之间可能高度相关,但与模型中其它参数的估计程度无关。多元回归分析:估计共85页,您现在浏览的是第35页!36多元回归分析:估计(3)
MultipleRegressionAnalysis:Estimation(3)y=b0+b1x1+b2x2+...bkxk+u多元回归分析:估计共85页,您现在浏览的是第36页!37课堂大纲误设模型中偏误和方差间的替代关系估计误差项方差高斯-马尔可夫定理多元回归分析:估计共85页,您现在浏览的是第37页!38
误设模型中的方差考虑误设模型是
估计的方差是
当x1和x2不相关时否则多元回归分析:估计共85页,您现在浏览的是第38页!39
误设模型中的方差如果,一些计量经济学家建议,将因漏掉x2而导致的偏误的可能大小与方差的降低相比较以决定漏掉该变量是否重要。现在,我们更喜欢包含x2,因为随着样本容量的扩大,增加x2导致的多重共线性变得不那么重要,但舍弃x2导致的遗漏变量误偏却不一定有任何变化模式。多元回归分析:估计共85页,您现在浏览的是第39页!40估计误差项方差我们希望构造一个s2的无偏估计量如果我们知道u,通过计算u
2的样本平均可以构造一个s2的无偏估计量我们观察不到误差项ui,所以我们不知道误差项方差s2。多元回归分析:估计共85页,您现在浏览的是第40页!41
估计误差项方差上式中除以n-k-1是因为残差平方和的期望值是(n-k-1)s2.
为什么自由度是n-k-1
因为推导OLS估计时,加入了k+1个限制条件。也就是说,给定n-k-1个残差,剩余的k+1个残差是知道的,因此自由度是n-k-1。多元回归分析:估计共85页,您现在浏览的是第41页!42
OLS的有效性:高斯-马尔可夫定理问题:在假定MLR.1.5下有许多bj的估计量,为什么选OLS?在假定MLR.1.5下,OLS是最优线性无偏估计量(BLUE)。最优(Best):方差最小线性(Linear):因变量数据的线性函数无偏(Unbiased):参数估计量的期望等于参数的真值。估计量(Estimator):产生一个估计量的规则多元回归分析:估计共85页,您现在浏览的是第42页!43
高斯-马尔可夫定理的重要性当标准假定成立,我们不需要再去找其它无偏估计量了。如果有人向我们提出一个线性无偏估计量,那我们就知道,此估计量的方差至少和OLS估计量的方差一样大。多元回归分析:估计共85页,您现在浏览的是第43页!44OLS估计量为线性的一些细节多元回归分析:估计共85页,您现在浏览的是第44页!45
动因:优点在实证工作中使用简单回归模型的主要缺陷是:要得到在其它条件不变的情况下,x对y的影响非常困难。在其它条件不变情况假定下我们估计出的x对y的影响值是否可信依赖,完全取决于条件均值零值假设是否现实。如果影响y的其它因素与x不相关,则改变x可以保证u不变,从而x对y的影响可以被识别出来。多元回归分析:估计共85页,您现在浏览的是第45页!46
动因:一个例子考虑一个简单版本的解释教育对小时工资影响的工资方程。exper:在劳动力市场上的经历,用年衡量在这个例子中,“在劳动力市场上的经历”被明确地从误差项中提出。 多元回归分析:估计共85页,您现在浏览的是第46页!47含有k个自变量的模型一般的多元线性回归模型可以写为多元回归分析:估计共85页,您现在浏览的是第47页!48如何得到OLS估计值普通最小二乘法选择能最小化残差平方和的估计值,多元回归分析:估计共85页,您现在浏览的是第48页!49在估计之后,我们得到OLS回归线,或称为样本回归方程(SRF)得到OLS回归式之后,对每次观测都得到一个拟合值或预测值,对观测点i,其拟合值就是第i个观测的残差为:如何得到OLS估计值多元回归分析:估计共85页,您现在浏览的是第49页!50
对多元回归的解释由可知所以,保持不变意味着:即,每一个βj都有一个偏效应(partialeffect),或其他情况不变(ceterisparibus)的解释。多元回归分析:估计共85页,您现在浏览的是第50页!51
“保持其它因素不变”的含义多元回归分析的优势在于它使我们能在非实验环境中去做自然科学家在受控实验中所能做的事情:保持其它因素不变。多元回归分析:估计共85页,您现在浏览的是第51页!52
“排除其它变量影响”(续)上述方程意味着:将y同时对x1和x2回归得出的x1的影响与先将x1对x2回归得到残差,再将y对此残差回归得到的x1的影响相同。
这意味着只有x1中与x2不相关的部分与y有关,所以在x2被“排除影响”之后,我们再估计x1对y的影响。多元回归分析:估计共85页,您现在浏览的是第52页!53
比较简单回归和多元回归估计值比较简单回归模型和多元回归模型一般来说,,除非:或样本中x1和x2不相关。多元回归分析:估计共85页,您现在浏览的是第53页!54多元回归分析:估计共85页,您现在浏览的是第54页!55
简单回归和多元回归估计值的比较在k个自变量的情况下,简单回归和多元回归只有在以下条件下才能得到对x1相同的估计(1)对从x2到xk的OLS系数都为零(2)x1与x2…,xk中的每一个都不相关。多元回归分析:估计共85页,您现在浏览的是第55页!56拟合优度(续)我们怎样衡量我们的样本回归线拟合样本数据有多好呢?可以计算总平方和(SST)中被模型解释的部分,称此为回归R2R2=SSE/SST=1–SSR/SST多元回归分析:估计共85页,您现在浏览的是第56页!57
更多关于R2当回归中加入另外的解释变量时,R2通常会上升。例外:如果这个新解释变量与原有的解释变量完全共线,那么OLS不能使用。此代数事实成立,因为当模型加入更多回归元时,残差平方和绝不会增加。多元回归分析:估计共85页,您现在浏览的是第57页!58
OLS估计量的期望值我们现在转向OLS的统计特性,而我们知道OLS是估计潜在的总体模型参数的。统计性质是估计量在随机抽样不断重复时的性质。我们并不关心在某一特定样本中估计量如何。多元回归分析:估计共85页,您现在浏览的是第58页!59假定MLR.2(随机抽样性)我们有一个包含n次观测的随机样本{(xi1,xi2…,xik;yi):i=1,…,n},它来自假定MLR。1中的总体模型。有时我们将模型写为
yi=b0+b1xi1+b2xi2+…+bkxik+ui其中,i表示观测次数,j=1,…,k代表第j个回归元(变量序号)多元回归分析:估计共85页,您现在浏览的是第59页!60假定MLR.3完全共线性的例子: y=b0+b1x1+b2x2+b3x3+u,x2=3x3 y=b0+b1log(inc)+b2log(inc2)+u y=b0+b1x1+b2x2+b3x3+b4x4+u,x1+x2+x3+x4=1当y=b0+b1x1+b2x2+b3x3+u,n<(k+1)也发生完全共线性的情况。在完全共线性情况下,OLS估计量的分母为零,因此OLS估计量不能得到。多元回归分析:估计共85页,您现在浏览的是第60页!61
定理3.1(OLS的无偏性)在假定MLR.1~MLR.4下,下式对总体参数的任意值都成立,即OLS估计量是总体参数的无偏估计量。多元回归分析:估计共85页,您现在浏览的是第61页!62总结在本次课中,我们介绍了多元回归。重要概念:解释多元回归中OLS估计值的意义偏效应(Partiallingeffect,其它情况不变效应)OLS的性质什么时候简单回归和多元回归的估计值相同OLS的无偏性多元回归分析:估计共85页,您现在浏览的是第62页!63本章大纲使用多元回归的动因普通最小二乘法的操作和解释OLS估计量的期望值OLS估计量的方差OLS的有效性:高斯-马尔科夫定理多元回归分析:估计共85页,您现在浏览的是第63页!如果我们在设定中包含了不属于真实模型的变量会怎样?尽管一个(或多个)自变量在总体中对y没有局部效应,但却被放到了模型中,则此模型被过度设定。过度设定对我们的参数估计没有影响,OLS仍然是无偏的。但它对OLS估计量的方差有不利影响。64
变量太多还是太少了?多元回归分析:估计共85页,您现在浏览的是第64页!65
遗漏变量的偏误假设真实模型如下:但我们估计的是所以多元回归分析:估计共85页,您现在浏览的是第65页!66
遗漏变量的偏误(续)对上式取期望,由于E(u)=0,所以得到多元回归分析:估计共85页,您现在浏览的是第66页!67
遗漏变量的偏误总结两种偏误为零的情形b2=0,也就是,x2实际上不属于模型样本中x1与x2不相关如果x2与x1间相关性和x2与y间相关性同方向,偏误为正。如果x2与x1间相关性和x2与y间相关性反方向,偏误为负。当,我们说上偏。当,我们说下偏。多元回归分析:估计共85页,您现在浏览的是第67页!68遗漏变量偏误但是,通常我们不能观测到b2,而且,当一个重要变量被缺省时,主要原因也是因为该变量无法观测,换句话说,我们无法准确知道Corr(x1,x2)的符号。怎么办呢?我们将依靠经济理论和直觉来帮助我们对相应符号做出较好的估计。多元回归分析:估计共85页,您现在浏览的是第68页!69
更一般的情形从技术上讲,要推出多元回归下缺省一个变量时各个变量的偏误方向更加困难。注意:若有一个对y有局部效应的变量被缺省,且该变量至少和一个解释变量相关,那么所有系数的OLS估计量都有偏。多元回归分析:估计共85页,您现在浏览的是第69页!更一般的情形此时,我们通常假设X1和X2无关。当X1和X2无关时,可以证明:70多元回归分析:估计共85页,您现在浏览的是第70页!71
更一般的情形多元回归分析:估计共85页,您现在浏览的是第71页!72假定MLR.5(同方差性)(Homoskedasticity)同方差性假定:Var(u|x1,x2,…,xk)=s2.意思是,不管解释变量出现怎样的组合,误差项u的条件方差都是一样的。如果这个假定不成立,我们说模型存在异方差性。多元回归分析:估计共85页,您现在浏览的是第72页!73
定理3.2(OLS斜率估计量的抽样方差)给定高斯-马尔可夫假定多元回归分析:估计共85页,您现在浏览的是第73页!74
对定理3.2的解释(1):误差项方差更大的s2意味着更大的OLS估计量方差。更大的s2意味着方程中的“噪音”越多。这使得得到自变量对因变量的准确局部效应变得更加困难。引入更多的解释变量可以减小方差。但这样做不仅不一定可能,而且也不一定总令人满意。s2不依赖于样本大小多元回归分析:估计共85页,您现在浏览的是第74页!75
对定理3.2的解释(3):多重共线性更大的Rj2意味着更大的估计量方差。如果Rj2较大,就说明其它解释变量解释可以解释较大部分的该变量。当Rj2非常接近1时,xj与其它解释变量高度相关,被称为多重共线性。严重的多重共线性意味着被估计参数的方差将非常大。多元回归分析:估计共85页,您现在浏览的是第75页!76总结本堂课重要的几点:高斯-马尔科夫假定模型过度设定和设定不足的后果遗漏变量偏差是什么被估计参数方差的三个组成部分是什么,以及它们如何影响被估计参数方差的大小。多元回归分析:估计共85页,您现在浏览的是第76页!77本章大纲使用多元回归的动因普通最小二乘法的操作和解释OLS估计量的期望OLS估计量的方差OLS的有效性:高斯-马尔可夫定理多元回归分析:估计共85页,您现在浏览的是第77页!78
误设模型中的方差在考虑一个回归模型中
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学生课外阅读指南经典影片观后感
- 知识产权培训在办公文化中的价值体现
- 深度解析如何通过沟通提升婚姻生活幸福感
- 品牌形象塑造设计方案合同
- 智慧校园建设及运营服务合同
- 物联网技术连接万物的未来网络
- 二零二五年度绿色建筑项目信托借款合同大全
- 科技与商业的融合-成果展览策略
- 电子商务在商业领域的应用与趋势
- 三年级下学期语文多媒体教学计划
- 《中外新闻传播史》课件第三章 大众化报纸的兴起
- 出纳收入支出记账表Excel模板
- D502-15D502等电位联结安装图集
- 奥迪原厂手绘设计图
- 一规定两守则题库563题
- 2021年春新青岛版(五四制)科学四年级下册全册教学课件
- 班级管理(课件).ppt
- 秋装校服供货售后保障方案
- 铜杆生产线设备安装工程施工方案62p
- 恶性肿瘤化疗后重度骨髓抑制病人的护理论文
- cmu200_中文使用详细说明
评论
0/150
提交评论