




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
清华大学五道口金融学院潘文卿第三章多元线性回归模2024/3/26清华大学五道口金融学院潘文卿第三章多元线性回归模多元线性回归模型是我们课程的重点,原因在于:
多元线性回归模型应用非常普遍;原理和方法是理解更复杂计量经济学模型的基础;内容较为丰富。从而,我们应不遗余力地学,甚至是不遗余力地背!!!清华大学五道口金融学院潘文卿第三章多元线性回归模本章主要内容多元线性回归模型的描述参数的OLS估计OLS估计量的有限样本性质参数估计量的方差-协方差矩阵和随机误差项方差2的估计单方程模型的统计检验多元线性回归模型实例清华大学五道口金融学院潘文卿第三章多元线性回归模§3.1多元线性回归模型的描述清华大学五道口金融学院潘文卿第三章多元线性回归模1、多元线性回归模型的形式由于在实际经济问题中,一个变量往往受到多个原因变量的影响;“从一般到简单”的建模思路。所以,在线性回归模型中的解释变量有多个,至少开始是这样。这样的模型被称为多元线性回归模型。多元线性回归模型参数估计的原理与一元线性回归模型相同,只是计算更为复杂。清华大学五道口金融学院潘文卿第三章多元线性回归模
以多元线性回归模型的一般形式——K元线性回归模型入手进行讲解,其模型结构如下:Y=x1
1
+x2
2+…+xk
k
+(1)
其中,Y是被解释变量(因变量、相依变量、内生变量),x是解释变量(自变量、独立变量、外生变量),
是随机误差项,
i,i=1,…,k是回归参数。线性回归模型的意义在于把Y分成两部分:确定性部分和非确定性部分。清华大学五道口金融学院潘文卿第三章多元线性回归模
在研究中,我们根本无法了解式(1)所示的总体模型的特征,而只能通过样本特征来近似考察。设经过n次试验,得到n个样本,如下所示:
y1
x11x12
…x1k
y2
x21x22
…x2k
……yn
xn1xn2
…xnk
从而得到表达式如下:Yi=xi1
1
+xi2
2+…+xik
k
+i(2)其中,式(1)称为总体线性模型;式(2)称为样本线性模型。清华大学五道口金融学院潘文卿第三章多元线性回归模
在计量经济学分析中,通常会借助矩阵工具,在此亦将多元线性模型表示成矩阵形式,以便于下一步的数学运算。(3)
写成一般形式为:
Y
=X
+
(4)
针对式(4),在这里主要讲参数估计和统计推断,但在此之前,我们要先回顾一下什么模型才是多元线性回归模型,即了解线性回归模型的6大假设,这一点十分重要。清华大学五道口金融学院潘文卿第三章多元线性回归模(1)线性性。即要求模型关于参数是线性的,关于扰动项是可加的。
(2)满秩。说明解释变量之间是线性无关的,这一假设很重要,在后面会经常受到。(3)回归性。x与
不相关。(4)x的DGP是外生的。x相对于y是外生的,是非随机的。(5)球形扰动。同方差性和非自相关性。(6)正态假设。清华大学五道口金融学院潘文卿第三章多元线性回归模2、多元回归方程及偏回归系数的含义称为多元回归方程(函数)。
多元回归分析(multipleregressionanalysis)是以多个解释变量的固定值为条件的回归分析,并且所获得的是诸变量X值固定时Y的平均值。诸
i称为偏回归系数(partialregressioncoefficients)。在经典回归模型的诸假设下,对(1)式两边求条件期望得E(Y|X1,X2,…Xk)=
x1
1
+x2
2+…+xk
k
清华大学五道口金融学院潘文卿第三章多元线性回归模偏回归系数的含义如下:
1度量着在X2,X3,…,Xk保持不变的情况下,X1每变化1个单位时,Y的均值E(Y)的变化,或者说
1给出X1的单位变化对Y均值的“直接”或“净”(不含其他变量)影响。其他参数的含义与之相同。清华大学五道口金融学院潘文卿第三章多元线性回归模例:
其中,Ct=消费,Dt=居民可支配收入Lt=居民拥有的流动资产水平β2的含义是,在流动资产不变的情况下,可支配收入变动一个单位对消费额的影响。这是收入对消费额的直接影响。收入变动对消费额的总影响=直接影响+间接影响。(间接影响:收入
流动资产拥有量
消费额)但在模型中这种间接影响应归因于流动资产,而不是收入,因而,β2只包括收入的直接影响。在下面的模型中:这里,β是可支配收入对消费额的总影响,显然β和β2的含义是不同的。偏回归系数bj就是xj本身变化对y的直接(净)影响。
清华大学五道口金融学院潘文卿第三章多元线性回归模
需要说明的是,如果令x1≡1,则
1便是常数项。习惯上把常数项看成为一个虚变量的系数,在参数估计过程中该虚变量的样本观测值始终取1。通常,一定要假设在模型中有常数项,即尽量让模型包含常数项,以中心化误差。清华大学五道口金融学院潘文卿第三章多元线性回归模§3.2
参数的OLS估计参数的OLS估计
附录:极大似然估计和矩估计
投影和投影矩阵
分块回归和偏回归
偏相关系数
清华大学五道口金融学院潘文卿第三章多元线性回归模我们的模型是:
残差为:一、参数的OLS估计普通最小二乘估计原理:使样本残差平方和最小Y=x1
1
+x2
2+…+xk
k
+
关键问题是选择的估计量b(或),使得残差平方和最小。清华大学五道口金融学院潘文卿第三章多元线性回归模要使残差平方和于是得到关于待估参数估计值的K个方程(即正规方程组):为最小,则应有:清华大学五道口金融学院潘文卿第三章多元线性回归模按矩阵形式,上述方程组可表示为:清华大学五道口金融学院潘文卿第三章多元线性回归模即清华大学五道口金融学院潘文卿第三章多元线性回归模
上述结果,亦可从矩阵表示的模型出发,完全用矩阵代数推导出来。
其中:残差可用矩阵表示为:清华大学五道口金融学院潘文卿第三章多元线性回归模残差平方和
清华大学五道口金融学院潘文卿第三章多元线性回归模注意到上式中所有项都是标量,且与采用标量式推导所得结果相同。因为x是满秩的(假设2),所以(X‘X)-1存在。所以,得到
的估计为用向量展开或矩阵微分法(前导不变后导转置),我们可得到关于待估参数估计值的正规方程组:令故清华大学五道口金融学院潘文卿第三章多元线性回归模注:这只是得到了求极值的必要条件。到目前为止,仍不能确定这一极值是极大还是极小。接下来考察求极值充分条件。清华大学五道口金融学院潘文卿第三章多元线性回归模
注意到上述条件只是极小化问题的必要条件,为了判断充分性,我们需要求出目标函数的Hessian矩阵
:如果这个Hessian矩阵是正定的,则可以判断所得到的解是唯一的最小二乘解。显然,根据正定矩阵的定义或者正定矩阵的判断准则,可知当矩阵的满秩条件满足时,矩阵是正定的,因此最小二乘解的充分性成立。从而,OLS估计量为:清华大学五道口金融学院潘文卿第三章多元线性回归模样本回归线的数值性质需要注意的是,上述命题成立的前提是线性模型中包含常数项,也就是第一个解释变量是“哑变量”形式。这样一个思考题目就是,当线性模型中不包含常数项时,结论是什么样的?清华大学五道口金融学院潘文卿第三章多元线性回归模清华大学五道口金融学院潘文卿第三章多元线性回归模清华大学五道口金融学院潘文卿第三章多元线性回归模(3)的证明方法1因为Σei=0,所以对两边求和即可。清华大学五道口金融学院潘文卿第三章多元线性回归模附录:极大似然估计清华大学五道口金融学院潘文卿第三章多元线性回归模回忆一元线性回归模型清华大学五道口金融学院潘文卿第三章多元线性回归模
将该或然函数极大化,即可求得到模型参数的极大或然估计量。清华大学五道口金融学院潘文卿第三章多元线性回归模
由于或然函数的极大化与或然函数的对数的极大化是等价的,所以,取对数或然函数如下:清华大学五道口金融学院潘文卿第三章多元线性回归模同理,分析多元线性回归模型Y的随机抽取的n组样本观测值的联合概率
清华大学五道口金融学院潘文卿第三章多元线性回归模对数似然函数为参数的极大似然估计
结果与参数的普通最小二乘估计相同
清华大学五道口金融学院潘文卿第三章多元线性回归模附录:矩估计(MomentMethod,MM)矩估计是基于实际参数满足一些矩条件而形成的一种参数估计方法。随机变量的均值和方差如何得到?
例:总体:E(Y-μ)=0样本矩(用样本矩估计总体矩):满足相应的矩条件:清华大学五道口金融学院潘文卿第三章多元线性回归模同理,方差的估计量是样本的二阶中心矩。现在,考虑一元线性回归模型中的假设条件:其所对应的样本矩条件分别为:清华大学五道口金融学院潘文卿第三章多元线性回归模可见,与OLS估计量的正规方程组是相同的。多元线性回归模型矩估计的矩条件通常是这样构造的:对于多元线性回归模型Y=Xβ+ε两边分别左乘,即得到上式称为总体回归方程的一组矩条件。现在,我们随机抽取样本,用样本矩代替总体矩,得到:清华大学五道口金融学院潘文卿第三章多元线性回归模解此正规方程组即得参数的估计量,这种估计方法称为矩估计。其参数估计结果与OLS一致。样本形式:用每个解释变量分别乘以模型的两边,并对所有样本点求和,即得到:
清华大学五道口金融学院潘文卿第三章多元线性回归模对每个方程的两边求期望,有:
清华大学五道口金融学院潘文卿第三章多元线性回归模得到一组矩条件求解这组矩条件,即得到参数估计量与OLS、ML估计量等价清华大学五道口金融学院潘文卿第三章多元线性回归模矩方法是工具变量方法(InstrumentalVariables,IV)和广义矩估计方法(GeneralizedMomentMethod,GMM)的基础在矩方法中关键是利用了如果某个解释变量与随机项相关,只要能找到1个工具变量,仍然可以构成一组矩条件。这就是IV。如果存在>k+1个变量与随机项不相关,可以构成一组方程数>k+1的矩条件。这就是GMM。清华大学五道口金融学院潘文卿第三章多元线性回归模广义矩估计中,矩条件的个数大于参数个数,会出现什么问题呢?
过度识别则必须想办法调和出现在过度识别系统中相互冲突的估计。那如何解决呢?
广义矩估计的思想是使得样本矩与总体矩的加权距离(即马氏距离)最小。主要是考虑到不同的矩所起的作用可能不同。清华大学五道口金融学院潘文卿第三章多元线性回归模清华大学五道口金融学院潘文卿第三章多元线性回归模注意:GMM估计是一个大样本估计。在大样本的情况下,GMM估计量是渐进有效的,在小样本情况下是无效的。所以,只有在大样本情况下,才能使用GMM方法进行参数估计。清华大学五道口金融学院潘文卿第三章多元线性回归模二、投影和投影矩阵
——OLS估计的几何性质获得最小二乘估计以后,可以获得下述最小二乘残差:将最小二乘估计的表达式代入,得到:
其中定义的矩阵在回归分析中是非常基础和重要的。显然,这个矩阵是对称幂等矩阵:
其次,还有一些重要的性质需要注意,例如对称幂等矩阵的特征根非0即1(对称矩阵的特征根均为实数),因此矩阵具有性质:矩阵的迹等于矩阵的秩。
清华大学五道口金融学院潘文卿第三章多元线性回归模显然,矩阵M的作用是,它乘积作用在某个向量y上,就可以得到这个向量y基于数据变量的最小二乘回归的残差向量,因此经常将这个矩阵称为“残差生成矩阵”(residualmaker)。这里需要注意M的定义和所作用的变量,是所作用变量关于M定义中数据矩阵的回归残差。即清华大学五道口金融学院潘文卿第三章多元线性回归模显然,X基于自己的线性回归的最小二乘残差一定为零,则必然有(即使验证也十分显然):根据此性质,我们来考察最小二乘估计的性质。已知:这说明最小二乘回归将变量y分解成为两个部分,一个部分是拟合值,另一个部分是残差e,由于
清华大学五道口金融学院潘文卿第三章多元线性回归模这说明最小二乘回归与残差是正交的。因此,这样的分解是正交分解,也就是说最小二乘的拟合值向量和残差向量是正交的(意味着这两个向量之间的夹角为垂角)。这时也可以得到:这里矩阵也是一个对称幂等矩阵,我们称其为投影矩阵(projectmatrix),它是由矩阵X构成的,并且它如果乘积作用到向量y上,则可以得到y基于变量X的最小二乘回归的拟合值。这也是向量y在矩阵X的各列生成的线性空间上的投影。清华大学五道口金融学院潘文卿第三章多元线性回归模注释:假设y在矩阵X的各列生成的线性空间上的投影是yp,则yp的定义是:且选择使得
由于上述向量之间的模与最小二乘距离是一致的,因此投影值便是最小二乘估计的拟合值,即清华大学五道口金融学院潘文卿第三章多元线性回归模为了更好地理解上述定义和公式,我们将一些有用的结论归纳为下述命题:命题1在线性模型的最小二乘估计中,可以得到:(1)P+M=I(显然)(2)PM=MP=0,即矩阵P与M是正交的。
证明:因为P=I-M,所以PM=(I-M)M=M-M2=0
(3)矩阵P具有自投影不变性,即PX=X。(4)向量y可以通过投影进行正交分解,即分解为投影和残差:y=Py+My。
证明:y=Iy=(P+M)y=Py+My,投影和残差是正交的
清华大学五道口金融学院潘文卿第三章多元线性回归模(5)平方和分解公式成立:
证明:因为所以
(6)残差平方和可以表示为:
证明:因为e=My,且M是对阵幂等矩阵,所以
清华大学五道口金融学院潘文卿第三章多元线性回归模(7)残差平方和也可以表示为:
证明:根据(5)式,可得而且可推知,又因为e=y-Xb,则有
清华大学五道口金融学院潘文卿第三章多元线性回归模三、分块回归与偏回归
(partitionedregressionandpartialregression
)通常在进行线性回归时我们假定了完全的回归变量,但事实上我们只对其中的部分变量感兴趣。这时我们就需要考虑将一部分变量从回归变量中删除所导致的结果。假设回归方程中涉及到两部分变量X1和X2,这时有:由于X=(X1,X2),k1k2清华大学五道口金融学院潘文卿第三章多元线性回归模请问:根据模型得到的b1,是否与根据模型得到的b1相等?思考清华大学五道口金融学院潘文卿第三章多元线性回归模则有:清华大学五道口金融学院潘文卿第三章多元线性回归模从而,正规方程组X‘Y=X’Xb变成:从而得到清华大学五道口金融学院潘文卿第三章多元线性回归模上述四块矩阵可以通过下述分块逆矩阵公式得到:利用该公式可得到:清华大学五道口金融学院潘文卿第三章多元线性回归模以上结果也可以直接计算得到:
由正规方程组得到:根据第一个方程得到清华大学五道口金融学院潘文卿第三章多元线性回归模上述解的公式表明,系数的最小二乘估计是y基于X1的回归系数,减去一个修正向量。上述获得参数估计的过程具有典型的统计意义,首先,是被解释变量中剔除变量X2的剩余部分;其次,将剩余部分基于X1再进行回归,因此,参数估计是剔除变量X2所剩余的部分。一种特殊情形是,这时,正好是y基于X1的回归系数。更为一般的结果可以由下述定理给出:清华大学五道口金融学院潘文卿第三章多元线性回归模定理1:正交分块回归
在变量y基于两部分变量X1和X2进行多元线性回归时,如果这两个变量之间是正交的,则X1和X2的回归系数可以通过单独进行y基于X1的回归系数和基于X2的回归系数得到。清华大学五道口金融学院潘文卿第三章多元线性回归模清华大学五道口金融学院潘文卿第三章多元线性回归模清华大学五道口金融学院潘文卿第三章多元线性回归模上述结论对于回归分析来说是一个基础结论,非常重要。可以进一步归纳成为下述定理:定理(Frisch-WaughTheorem):在向量Y基于两部分变量X1和X2的最小二乘回归中,系数最小二乘估计的部分估计可以通过Y基于变量X1的残差,再基于X2的每列基于变量X1回归的残差,进行回归的回归系数得到。清华大学五道口金融学院潘文卿第三章多元线性回归模这个过程一般被称为变量X1作用的“挤出”或者“分离”过程。出于这个原因,多元回归系数经常被称为偏回归系数(partialregressioncoefficients)。对于这个情形的一种特例,我们考虑向量Y基于一组变量X和一个附加变量Z的最小二乘回归问题。这时最小二乘系数表示为b和c。这种情形下的结果可以由下述推论得到:
清华大学五道口金融学院潘文卿第三章多元线性回归模
例子:这个命题的一个直接应用是,可以考虑采用时间趋势脱离后的残差向量进行替代,以求出包含时间变量的多元回归系数。这与将时间T作为解释变量放入模型中的效果是等同的。清华大学五道口金融学院潘文卿第三章多元线性回归模例子:在下列模型中Earnings=a+b*education+c*age+d*age2+e第二个系数b如何得到?清华大学五道口金融学院潘文卿第三章多元线性回归模作为这些结论的一个应用,我们考虑矩阵X的第一列全为1的包含常数项的情形。清华大学五道口金融学院潘文卿第三章多元线性回归模通常将
称为中心化矩阵。从矩阵结构可以看出,其与变量X无关,只是一个数据转换工具,其中的矩阵Jn被称为列求和矩阵。例子:
中心化矩阵是对称幂等矩阵吗?其是否满秩?
清华大学五道口金融学院潘文卿第三章多元线性回归模清华大学五道口金融学院潘文卿第三章多元线性回归模四、偏回归与偏相关系数
(partialregressionandpartialcorrelation
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 招聘活动数据挖掘与应用-深度研究
- 知识产权保护策略-第1篇-深度研究
- 船舶维修质量控制-深度研究
- 2025年公共场所厕所清洁承包合同
- 2025年加工中心购买合同分析
- 2025年个人抵质押合同年
- 属性识别与关联规则-深度研究
- 2025年上海住宅互换合同模板
- 2025年单位融资策划合同书正式版
- 兴义民族师范学院《Matlab基础与应用》2023-2024学年第二学期期末试卷
- 肋骨骨折护理个案查房
- 分布式网络处理方案
- CNAS-CL02-A001:2023 医学实验室质量和能力认可准则的应用要求
- 铁路机车检修坑施工方案
- 数字化转型中的知识管理
- 看不见的森林
- 安全用梯专题培训
- 中小学教师专业标准解读
- cw3-2500m万能式断路器说明书
- 大学生心理健康教育第四章大学生学习心理课件
- 企业实际控制人的协议书
评论
0/150
提交评论