版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1第三章多元回归分析2第一节 定义及假设前提多元回归的定义多元回归模型研究地是被解释变量y和一系列解释变量x1 x2 xk之间的关系。一般模型写作 yi= 0+1x1i +2x2i + +kxki +i 3多元回归的假设前提关于误差项的假设前提与简单回归相同。但是增加了一项即:假设所有的x之间不存在线性关系。如果解释变量中存在线性关系,估计的模型就会发生变化。例如,y= 0+1x1i +2x2i +i 如果x1、x2之间存在线性关系, 假设: 2x1 + x2 =4,即x2= 4-2x1, 带入上述模型,变成Y= 0+1x1i +2 ( 4-2x1) +i 4这样我们的回归模型变成Y= (0+
2、 42 )+(1 -22 )x1i +所以y对x1回归估计的是0+ 42 和1 -22 而不是初始模型中的参数了。5第二节多元回归模型的估计方法最小二乘法一,以双变量的模型为例使用和简单回归模型中相同的参数估计方法 最小二乘法,即使残差平方和最小,然后利用求极值的方法求出所估计的参数。在二元回归模型中,要估计的参数有三个。常数项和两个解释变量前的系数。详细推导见板书。6二,使用最小二乘法,但是将多元回归模型表示成矩阵的形式。下面我们来进行推导。 假设模型为: yi= 1x1i +2x2i + +kxki +i 为简单起见,先省略常数项。可以把上述模型写成矩阵形式: Y =X+ 7其中,Y是n1
3、矩阵, X是 nk矩阵 是k1矩阵 是n1矩阵假设:i服从于正态分布,期望是0,方差是2,x为非随机的,与干扰项不相关。 x之间不存在线性关系, xx秩与x的秩相等,均为k,这表明xx的逆矩阵存在。该假设事实上要求k3.49 1.4/20所以,拒绝H0,即不能接受11,20,412, H0: 1/25/3(即20.61) H1: 1/2 5/31)首先估计初始模型,即y对x1 和x2回归,计算出残差平方和,就是URSS。2)假设待检假设成立,则把限制条件20.61代入初始模型yi=+ 1x1i +2 x2i +i = +1 (x1i +0.6 x2i ) +i新的模型相当于y对x1 +0.6x
4、2回归42新的回归模型是一个简单回归模型,被解释变量没有变化,因此只要估计出解释变量前的参数,就可以算出残差平方和了。Sxx= ( x1i +0.6 x2i )2 - n( x1i +0.6 x2i )/n 2 = ( x1i ) 2 +1.2 x1i x2i +0.36 ( x2i ) 2 -nx1bar 2 -1.2nx1barx2bar - 0.36 nx2bar 2 = ( x1i ) 2 - nx1bar 2 + 1.2( x1i x2i -nx1barx2bar) +0.36( x2i ) 2 - nx2bar 2 =S11+1.2S12+0.36S22=12+1.2*8+0.36
5、*12=25.9243Sxy= ( x1i +0.6 x2i )y n* ( x1i +0.6 x2i )/n * ybar=S1y+0.6S2y=10+0.6*8=14.8所以1 hat =14.8/25.92=0.57RRSS=Syy - 1 hat Sxy =10- 8.45 =1.5544 RRSS URSS/rF = _ URSS/n-k-1 = (1.55-1.4)/1/1.4/20 =2.1 4.35所以不拒绝待检假设,可以认为1/25/345关于生产函数模型规模收益不变的检验log Y= + K logK + L logL+H0: K + L =1首先估计初始模型,计算出残差平
6、方和,即为URSS。假设H0成立,则初始模型变为:log Y= + K logK + L logL+ = + K logK + (1- K )logL+46logY -logL = + K (logK -logL)+即logY -logL 对logK logL回归可以计算出新的残差平方和,即RRSS代入 RRSS URSS/1F = _ URSS/n-3将计算结果与查表所得的临界值比较就可以下结论了47练习yi=+ 1x1i +2 x2i + 3x3i +i1,检验1+2 + 3=1, 2 -23=02,检验1=2 ,3=048纳洛夫(Nerlove)估计的电力行业成本函数模型为:Y=AXP1
7、 1 P 22 P 33 其中Y为总成本X为小时产出P1 为劳动投入价格P2 为资本投入价格P 3燃料价格理论上预期价格弹性应为1,即1+ 2+ 3=149引进这一限制条件( 3=1 - 1- 2 ),上述模型变为:Y/P3=AX (P1 /P3) 1(P2 /P3) 2 估计上述两个模型,分别是:lnYi= -4.93 +0.94lnXi +0.31lnP1 -0.26lnP2 +0.44lnP3 RSS=0.33650Ln(Yi/P3)=-6.55+0.91lnXi+0.51ln(P1 /P3) +0.09ln(P2 /P3)RSS=0.364F=(0.364-0.336)/1/0.336
8、/29-4-1=2 4.26所以可以接受预期价格弹性之和为1 的假设。51对于生产函数模型:log Y= + K logK + L logL+H0: K + L =1可以使用t检验 (Khat + Lhat )-(K + L )t= SE(Khat + Lhat )52SE (Khat + Lhat ) = var( Khat + Lhat )= var(Khat )+ var(Lhat )+2cov(Khat ,Lhat )计算t值和临界值比较,就可以下结论了.例题:LnY = -3.015 + 1.341lnL + 0.292lnK已知:var(Lhat )=0.00853, var(Kh
9、at )=0.003581cov(Khat ,Lhat)= - 0.001552SE (Khat + Lhat ) = var( Khat + Lhat )= var(Khat )+ var(Lhat )+2cov(Khat ,Lhat )= 0.008353+0.003581 -2*0.001552所以:t=(1.341+0.292) - 1/ 0.008353+0.003581 -2*0.001552大家同样可以推导两个系数相等的公式.53使用R2进行联合检验 (RRSS URSS)/rF = _ URSS/n-k-1如果加了限制条件后模型中的被解释变量没有发生改变,上述公式可以改写成:
10、Syy(1- RRR2) Syy(1- RUR2)/rF = Syy(1- RUR2)/n-k-154化检变成:(RR2- RR2)/rF = (1- RUR2)/n-k-155例题lny = + 1 lnx1+ 2 lnx2 + 3 lnx3 + 4 lnx4, +其中y为人均鸡肉消费量(磅)x1为人均实际可支配收入x2为鸡肉单价(美分/磅)x3为猪肉单价(美分/磅)x4为牛肉单价(美分/磅)56假如某人认为鸡肉与主肉和牛肉的价格无关,应该进行3 4的检验即估计模型lny = + 1 lnx1+ 2 lnx2 +可以估计这两个模型,并计算各自的残差平方和,进行检验。由于模型中被解释变量没有发
11、生改变,因此也可以使用刚推导出的公式。57根据美国年实际数据估计的结果如下:lny= 2.1848 + 0.3245 lnx1 - 0.5046 lnx2 (0.1557) (0.0833) (0.1109) +0.1485 lnx3 +0.0911 lnx4, R2 =0.9823 (0.0997) (0.1007)有约束回归:lny=2.0328 + 0.4515 lnx1 0.3772 lnx2, R2 =0.9801 (0.1162) (0.0247) (0.0635)F=(0.9823-0.9801)/2/(1-0.9823)/(23-4-1)=1.11863.01拒绝零假设,即结构
12、发生了变化,是不稳定的,不能将两组数据合起来估计合预测。6419461963年英国储蓄和个人收入的数据。根据观察发现战后重建时期和重建后时期储蓄函数有所不同,是否真的发生了结构性变化呢?回归的模型如下:19461963Yt= -1.0821+0.1178xt (0.1452) (0.0088)R2=0.9185 RSS=0.57221946-1954Yt=-0.2622+0.0470 xt (0.3054) (0.0266)R2=0.3092 RSS1=0.1396651955-1963Yt=-1.7502+0.1504xt (0.3570) (0.0175)R2=0.9131 RSS2=0.
13、1931其中RSS相当于RRSS0.5722,RSS1+RSS2URSS0.1396+0.19310.332766 RRSS-URSS/k+1F_ URSS/18-2-2 (0.5722-0.3327)/2 =_ 0.3327/14=5.043.74所以结构发生了变化。67第六节多元回归模型的预测问题一,以双变量模型为例yi=+ 1x1i +2 x2i +iy0=+ 1x10 +2 x20 +0y0hat=+ 1hatx10 +2 hatx20预测误差= y0 -y0hat预测误差的方差化简后=2 (1+1/n) +(x10-x1bar) 2var(1hat )+2(x10-x1bar)(x2
14、0-x2bar)cov(1hat, 2hat)+(x20-x2bar) 2var(2hat )68y= 4 + 0.7 x1+ 0.2 x2 ,x10=12, x20=7, 以95%的概率预测y的置信区间y0hat=4+0.7*12+0.2*7=13.8x1bar=10, x2bar=5预测误差的方差=0.07(1+1/23)+4(3/20+3/20-2/20)0.07=0.101标准差为0.318所以置信区间为(13.8-2.086*0.318, 13.8+2.086*0.318)69二,多元回归的预测Y= X+Y0= X0+0,其中X0=(1, x10, x20, xk0)0为预测期的误差
15、项,仍然满足古典回归的假设前提。E(0)=0Var(0)= 2 Cov(0, t)=0 0 N ( 0, 2 )701,关于Y0的置信区间为了得到Y0的预测区间,首先要计算预测误差(Y0 -Y0hat)的方差。Y0= X0+0 , Y0hat=X0hatY0 -Y0hat= X0 (-hat) + 0 ,Var(Y0 -Y0hat)=E X0 (-hat) + 0 X0 (-hat) + 0 = E X0 (-hat) + 0 (-hat) X0 + 0 = E X0 (-hat) (-hat) X0 +E 0 0 +E0 (-hat) X0 + E X0 (-hat) 0 因为X0 (-ha
16、t) 0 是标量,所以X0 (-hat) 0 =X0 (-hat) 0 = 0 (-hat) X0 hat-= (xx)-1 x 71Var(Y0 -Y0hat)= E X0 (-hat) (-hat) X0 +E (0 0 ) +E0 (-hat) X0 + E X0 (-hat) 0 = X0 2(xx)-1 X0 +2-2 X0 E( hat- ) 0 = 2 1+ X0 (xx)-1 X0 -2 X0 (xx)-1 E( 0 )= 2 1+ X0 (xx)-1 X0 Y0置信区间Y0hat - t* 2 1+ X0 (xx)-1 X0 , Y0hat + t* 2 1+ X0 (xx)
17、-1 X0 722,关于E (Y0)的置信区间与Y0相比,方差只少了一个2 ,即为2 X0 (xx)-1 X0 E (Y0)的置信区间Y0hat - t* 2 X0 (xx)-1 X0 , Y0hat + t* 2 X0 (xx)-1 X0 73例题收入决定模型 5 25 50 xx= 25 510 40.825 4.375 -6.25(xx)-1= 4.375 0.625 -0.75 -6.25 -0.75 1 74现在假设受教育年限为7年,工作年限为5年,以95%的概率估计年收入和平均年收入的置信区间。X0 =(1,7,5)首先计算方差。Var(Y0 -Y0hat)= 2 1+ X0 (x
18、x)-1 X0 =0.75 1+ X0 (xx)-1 X0 以及 Var(Y0hat) =0.75 X0 (xx)-1 X0 75习题1,下表是以进出车站的乘客为主要服务对象的10家便利店的数据, y是 日均销售额,x1为店铺面积,x2为店铺距车站的距离。 (1)估计多元回归模型: yi= 0+1x1i +2x2i +i 计算决定系数和经过校正的决定系数。 (2)假设其他条件不变,店铺面积增加1平方米,日均销售额能增加多少?(3)假设其他条件不变,店铺离车站距离比现在远100米,日均销售额 会减少多少? 76日均销售额 店铺面积 离车站距离(万日元)y (平方米)x1 (百米)x2 40 60
19、 3 45 100 5 80 85 2 60 50 1 50 75 3 20 55 4 15 70 6 90 95 1 30 45 3 70 65 2 500 700 3077y2=30650 x12=52150 x22=114yx1=37050 yx2=1205 x1x2=2125S11=3150 , S12=25 , S22=24S1y=2050, S2y= -295 ,Syy=5650 1hat=0.75458、2hat = -13.078 0hat=36.412R2=0.75458*2050+(-13.078)*(-295)/5650=0.9566经过校正的R2 =1-(1-0.9566)*10-1/10-2-1=0.9442782,在多元回归模型中,y= 0+1 x1i +2x2i +i 回答如何进行 1 2 , 3 1,描述检验的过程即可3,y = 2.20 + 0.104x1 + 3.48x2 + 0.34x3 (3.4) (0.005) (2.2) (0.15) ESS=112.5 RSS=19.5 n=80哪个斜率系数显著不为零?(0.05)计算多重决定系数及经过校正的决定系数 进行总体回归显著性检验(0.05)794,下面模型是根据10个家庭的月均储蓄(y).月收入(x1)及家庭人
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 年南京市劳务合同范本
- 绩效助理季度工作计划
- 2024年度饭店厨房烧烤食材检测服务合同3篇
- 2024年度云计算服务与技术转让合同2篇
- 宅基地流转合同(2篇)
- 小学教学综合楼专用合同(2篇)
- 居民不配合下水改造的合同(2篇)
- 婚姻承诺合同(2篇)
- 2024年度品牌授权使用合同协议范本2篇
- 2024版服装加工厂生产外包合同3篇
- 《大学》读书题库
- 世界社会主义五百年
- 表观遗传学-课件
- 小学数学二年级上册《认识时间》单元作业设计
- 铁路道岔基础
- 新中国史(大连海事大学)智慧树知到网课章节测试答案
- 英语听力高三北师大第1-26套
- GB 31644-2018食品安全国家标准复合调味料
- 2023年学校音乐器材管理室工作总结
- 丙酮的产品包装说明和使用说明书
- 人身保护令申请书范文精选5篇
评论
0/150
提交评论