版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章多元线性回归模型复制第1页,课件共54页,创作于2023年2月2引子:中国已成为世界汽车产销第一大国
2009年,为应对国际金融危机、确保经济平稳较快增长,国家出台了一系列促进汽车消费的政策,有效刺激了汽车消费市场,汽车产销呈高增长态势,首次成为世界汽车产销第一大国。2009年,汽车产销分别为1379.1万辆和1364.5万辆,同比增长48.3%和46.15%。是什么因素导致中国汽车数量的增长?
影响中国汽车行业发展的因素并不是单一的,经济增长、消费趋势、市场行情、业界心态、能源价格、道路发展、内外环境,都会使中国汽车行业面临机遇和挑战。第2页,课件共54页,创作于2023年2月3分析中国汽车行业未来的趋势,应具体分析这样一些问题:中国汽车市场发展的状况如何?(用销售量观测)影响中国汽车销量的主要因素是什么?
(如收入、价格、费用、道路状况、能源、政策环境等)各种因素对汽车销量影响的性质怎样?(正、负)各种因素影响汽车销量的具体数量关系是什么?所得到的数量结论是否可靠?中国汽车行业今后的发展前景怎样?应当如何制定汽车的产业政策?很明显,只用一个解释变量已很难分析汽车产业的发展,还需要寻求有更多个解释变量情况的回归分析方法。
怎样分析多种因素的影响?第3页,课件共54页,创作于2023年2月4
本章主要讨论:●多元线性回归模型及古典假定●多元线性回归模型的估计●多元线性回归模型的检验●多元线性回归模型的预测第4页,课件共54页,创作于2023年2月5第一节多元线性回归模型及古典假定
一、多元线性回归模型的意义
一般形式:对于有K-1个解释变量的线性回归模型
注意:模型中的(j=1,2,---k)是偏回归系数样本容量为n
偏回归系数:
控制其它解释量不变的条件下,第j个解释变量的单位变动对被解释变量平均值的影响,即对Y平均值“直接”或“净”的影响。
5第5页,课件共54页,创作于2023年2月6多元线性回归中的“线性”指对各个回归系数而言是“线性”的,对变量则可以是线性的,也可以是非线性的例如:生产函数取对数这也是多元线性回归模型,只是这时变量为lnY、lnL、lnK第6页,课件共54页,创作于2023年2月7
多元总体回归函数
条件期望表现形式:将Y的总体条件期望表示为多个解释变量的函数,如:注意:这时Y总体条件期望的轨迹是K维空间的一条线个别值表现形式:引入随机扰动项或表示为
第7页,课件共54页,创作于2023年2月8
多元样本回归函数
Y的样本条件均值可表示为多个解释变量的函数或回归剩余(残差):
其中
第8页,课件共54页,创作于2023年2月9多个解释变量的多元线性回归模型的n组样本观测值,可表示为
用矩阵表示
9第9页,课件共54页,创作于2023年2月10总体回归函数或样本回归函数或
其中:都是有n个元素的列向量是有k个元素的列向量(
k=解释变量个数+1)
是第一列为1的n×k阶解释变量数据矩阵,
(截距项可视为解释变量总是取值为1)
矩阵表示方式第10页,课件共54页,创作于2023年2月11
假定1:零均值假定
(i=1,2,---n)或
E(u)=0
假定2和假定3:同方差和无自相关假定:
或用方差-协方差矩阵表示为:
(i=j)(i≠j)0第11页,课件共54页,创作于2023年2月12假定5:无多重共线性假定
(多元中增加的)
假定各解释变量之间不存在线性关系,或各个解释变量观测值之间线性无关。或解释变量观测值
矩阵X的秩为K(注意X为n行K列)。
Ran(X)=k
Rak(X'X)=k
即(X'X)
可逆
假定6:正态性假定12假定4:随机扰动项与解释变量不相关第12页,课件共54页,创作于2023年2月一、普通最小二乘法(OLS)原则:寻求剩余平方和最小的参数估计式
即求偏导,并令其为0其中即13第13页,课件共54页,创作于2023年2月14用矩阵表示的正规方程偏导数因为样本回归函数为两边左乘根据最小二乘原则则正规方程为第14页,课件共54页,创作于2023年2月15OLS估计式
由正规方程多元回归的OLS估计量为当只有两个解释变量时为:注意:为X、Y的离差对比简单线性回归中第15页,课件共54页,创作于2023年2月16
●回归线通过样本均值
●估计值的均值等于实际观测值的均值
●剩余项的均值为零
●被解释变量估计值与剩余项不相关
●解释变量与剩余项不相关(j=1,2,---k)16第16页,课件共54页,创作于2023年2月17
1、
线性特征
是Y的线性函数,因是非随机或取固定值的矩阵
2、
无偏特性
(证明见教材P101附录3.1)3、
最小方差特性
在所有的线性无偏估计中,OLS估计具有最小方差
(证明见教材P101或附录3.2)
结论:在古典假定下,多元线性回归的OLS估计式是最佳线性无偏估计式(BLUE)第17页,课件共54页,创作于2023年2月18
三、OLS估计的分布性质基本思想:
●是随机变量,必须确定其分布性质才可能进行区间估计和假设检验●是服从正态分布的随机变量,决定了Y也是服从正态分布的随机变量●是Y的线性函数,决定了也是服从正态分布的随机变量第18页,课件共54页,创作于2023年2月19●的期望(由无偏性)
●的方差和标准误差:可以证明的方差—协方差矩阵为(见下页)
这里的
(其中是矩阵中第j行第j列的元素)所以(j=1,2,---k)
的期望与方差第19页,课件共54页,创作于2023年2月20其中:(由无偏性)(由同方差性)(由OLS估计式)20注意
是向量的方差-协方差第20页,课件共54页,创作于2023年2月21
一般未知,可证明多元回归中的无偏估计为:(证明见P103附录3.3)
或表示为
将作标准化变换:
21对比:一元回归中第21页,课件共54页,创作于2023年2月22因是未知的,可用代替去估计参数的标准误差:●当为大样本时,用估计的参数标准误差对作标准化变换,所得Z统计量仍可视为服从正态分布●当为小样本时,用估计的参数标准误差对作标准化变换,所得的t统计量服从t分布:22第22页,课件共54页,创作于2023年2月23五、回归系数的区间估计
由于给定,查t分布表的自由度为n-k的临界值或或表示为23第23页,课件共54页,创作于2023年2月24一、多元回归的拟合优度检验
多重可决系数:在多元回归模型中,由各个解释变量联合起来解释了的Y的变差,在Y的总变差中占的比重,用表示
与简单线性回归中可决系数的区别只是不同多元回归中多重可决系数可表示为
(注意:红色字体是与一元回归不同的部分)24第24页,课件共54页,创作于2023年2月25
多重可决系数的矩阵表示
可用代数式表达为
特点:多重可决系数是模型中解释变量个数的不减函数,这给对比不同模型的多重可决系数带来缺陷,所以需要修正。
第25页,课件共54页,创作于2023年2月26修正的可决系数思想:可决系数只涉及变差,没有考虑自由度。如果用自由度去校正所计算的变差,可纠正解释变量个数不同引起的对比困难。回顾:
自由度:统计量的自由度指可自由变化的样本观测值个数,它等于所用样本观测值的个数减去对观测值的约束个数。第26页,课件共54页,创作于2023年2月27可决系数的修正方法
总变差TSS自由度为n-1
解释了的变差ESS自由度为k-1
剩余平方和RSS自由度为n-k
修正的可决系数为
第27页,课件共54页,创作于2023年2月28
修正的可决系数与可决系数的关系
已经导出:
注意:
可决系数必定非负,但所计算的修正可决系数有可能为负值
解决办法:若计算的,规定取值为0
第28页,课件共54页,创作于2023年2月2929基本思想:
在多元回归中包含多个解释变量,它们与被解释变量是否有显著关系呢?
当然可以分别检验各个解释变量对被解释变量影响的显著性。
但是我们首先关注的是所有解释变量联合起来对被解释变量影响的显著性,或整个方程总的联合显著性,需要对方程的总显著性在方差分析的基础上进行F检验。第29页,课件共54页,创作于2023年2月3030在讨论可决系数时已经分析了被解释变量总变差TSS的分解及自由度:
TSS=ESS+RSS注意:Y的样本方差=总变差/自由度即显然,Y的样本方差也可分解为两部分,可用方差分析表分解301.方差分析第30页,课件共54页,创作于2023年2月31
变差来源平方和自由度方差归于回归模型ESS=k-1归于剩余RSS=n-k总变差TSS=n-1基本思想:
如果多个解释变量联合起来对被解释变量的影响不显著,“归于回归的方差“比“归于剩余的方差”显著地小应是大概率事件。方差分析表
第31页,课件共54页,创作于2023年2月32原假设:(所有解释变量联合起来对被解释变量的影响不显著)备择假设:
不全为0建立统计量(可以证明):
给定显著性水平,查F分布表中自由度为k-1和n-k的临界值,并通过样本观测值计算F值32第32页,课件共54页,创作于2023年2月33F检验方式
▼如果计算的F值大于临界值,则拒绝,说明回归模型有显著意义,
即所有解释变量联合起来对Y确有显著影响。▼如果计算的F值小于临界值,则不拒绝,说明回归模型没有显著
意义,即所有解释变量联合起来对Y没有显著影响。第33页,课件共54页,创作于2023年2月34注意:
在一元回归中F检验与t检验等价,且
(见教材P87证明)但在多元回归中,F检验显著,不一定每个解释变量都对Y有显著影响。还需要分别检验当其他解释变量保持不变时,各个解释变量X对被解释变量Y是否有显著影响。
方法:
原假设(j=1,2,……k)备择假设统计量t为:
第34页,课件共54页,创作于2023年2月35给定显著性水平α,查t分布表的临界值为如果
就不拒绝,而拒绝即认为所对应的解释变量对被解释变量Y的影响不显著。如果
就拒绝而不拒绝即认为所对应的解释变量对被解释变量Y的影响是显著的。讨论:在多元回归中,可以作F检验,也可以分别对每个回归系数逐个地进行t检验。
F
检验与t检验的关系是什么?对各回归系数假设检验的作法第35页,课件共54页,创作于2023年2月36
一、被解释变量平均值预测1.Y平均值的点预测
方法:将解释变量预测值代入估计的方程:多元回归时:
或注意:预测期的是第一个元素为1的行向量,不是矩阵,也不是列向量
第36页,课件共54页,创作于2023年2月37
2.Y平均值的区间预测
基本思想:(与简单线性回归时相同)
●由于存在抽样波动,预测的平均值不一定等于真实平均值,还需要对作区间估计。●为了对Y作区间预测,必须确定平均值预测值的抽样分布。●
必须找出与和都有关的统计量,
并要明确其概率分布性质。37第37页,课件共54页,创作于2023年2月38区间预测的具体作法当未知时,只得用代替,这时简单线性回归中(回顾简单线性回归)38第38页,课件共54页,创作于2023年2月39
多元回归时,与预测的平均值和真实平均值
都有关的是二者的偏差:服从正态分布,可证明用代替,可构造t统计量区间预测的具体作法(多元时)第39页,课件共54页,创作于2023年2月40
服从正态分布,可证明
即标准化当用代替时,可构造t统计量40第40页,课件共54页,创作于2023年2月41
给定显著性水平α,查t分布表,得自由度为n-k的临界值,则或区间预测的具体作法第41页,课件共54页,创作于2023年2月42
基本思想:(与简单线性回归时相同)
●由于存在随机扰动的影响,Y的平均值并不等于Y的个别值。●为了对Y的个别值作区间预测,需要寻找与预测值和个别值有关的统计量,并要明确其概率分布性质。第42页,课件共54页,创作于2023年2月43
已知剩余项是与预测值和个别值都有关的变量并且已知服从正态分布,且多元回归时可证明
当用代替时,对标准化的变量t为:
个别值区间预测具体作法第43页,课件共54页,创作于2023年2月给定显著性水平,查t分布表得自由度为n-k的临界值则
因此,多元回归时Y的个别值的置信度1-α的预测区间的上下限为44第44页,课件共54页,创作于2023年2月45
第五节案例分析研究的目的要求为了研究影响中国税收收入增长的主要原因,分析中央和地方税收收入增长的数量规律,预测中国税收未来的增长趋势,需要建立计量经济模型。研究范围:1978年-2007年全国税收收入理论分析:为了全面反映中国税收增长的全貌,选择包括中央和地方税收的“国家财政收入”中的“各项税收”(简称“税收收入”)作为被解释变量;选择国内生产总值(GDP)作为经济整体增长水平的代表;选择中央和地方“财政支出”作为公共财政需求的代表;选择“商品零售价格指数”作为物价水平的代表。第45页,课件共54页,创作于2023年2月46年份
税收收入(亿元)(Y)
国内生产总值(亿元)(X2)财政支出(亿元)(X3)商品零售价格指数(%)(X4)1978519.283624.11122.09100.71979537.824038.21281.79102.01980571.704517.81228.83106.01981629.894862.41138.41102.41982700.025294.71229.98101.91983775.595934.51409.52101.51984947.357171.01701.02102.819852040.798964.42004.25108.819862090.7310202.22204.91106.019872140.3611962.52262.18107.319882390.4714928.32491.21118.519892727.4016909.22823.78117.819902821.8618547.93083.59102.119912990.1721617.83386.62102.919923296.9126638.13742.20105.4第46页,课件共54页,创作于2023年2月4719934255.3034634.44642.30113.219945126.8846759.45792.62121.719956038.0458478.16823.72114.819966909.8267884.67937.55106.119978234.0474462.69233.56100.819989262.8078345.210798.1897.4199910682.5882067.513187.6797.0200012581.5189468.115886.5098.5200115301.3897314.818902.5899.220022003200420052006200717636.4520017.3124165.6828778.5434804.3545621.97104790.6135822.8159878.3183217.4211923.5249529.922053.1524649.9528486.8933930.2840422.7349781.3598.799.9102.8100.8101103.8第47页,课件共54页,创作于2023年2月48序列Y、X2、X3、X4的线性图可以看出Y、X2、X3都是逐年增长的,但增长速率有所变动,而且X4在多数年份呈现出水平波动。说明变量间不一定是线性关系,可探索将模型设定为以下对数模型:注意这里的“商品零售价格指数”(X4)未取对数。第48页,课件共54页,创作于2023年2月49
三、估计参数模型估计的结果为:(0.6397)(0.1355)(0.1557)(0.0055)
t=(-4.4538)(3.0420)(4.2788)(2.0856)
F=673.7521df=30第49页,课件共54页,创作于2023年2月501、经济意义检验:模型估计结果说明,在假定其它变量不
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 股权转让分红协议(3篇)
- 全国儿童预防接种宣传日演讲稿(3篇)
- Lactose-Standard-生命科学试剂-MCE
- JNJ-1930942-生命科学试剂-MCE
- 燃油泵房土方开挖施工方案
- 环氧树脂施工方案
- 智慧灯杆-智慧城市道路智慧照明云平台综合解决方案
- 亲子乐园装饰项目管理合同
- 紧急工程砂石供应运输协议
- VR体验馆改造包工协议
- MOOC 跨文化交际通识通论-扬州大学 中国大学慕课答案
- EDA实验报告1组合逻辑电路的设计
- 球磨机设计说明书
- 餐饮美学餐饮空间格局设计
- 有效初三英语课堂教学ppt课件
- 幸福在哪里作文800字高中范文
- 五人制足球比赛记录表.doc
- 整式的乘法与因式分解所有知识点总结
- 《运动生理学》教案
- 陈春花管理学著作精华解读之《管理的常识》
- 钻孔灌注桩试桩施工方案
评论
0/150
提交评论