6第六章多元线性回归模型课件_第1页
6第六章多元线性回归模型课件_第2页
6第六章多元线性回归模型课件_第3页
6第六章多元线性回归模型课件_第4页
6第六章多元线性回归模型课件_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章多元线性回归模型第六章多元线性回归模型1多元回归模型多元回归模型2计算各收入组的条件均值,绘制散点图900/201000/301100/40…………550550600…………550600650…………600650700650700750650750800X1/x2Y计算各收入组的条件均值,绘制散点图900/2010003目录第一节多元线性回归的模型的表示方法和基本假定第二节多元线性回归的参数的OLS估计及其性质第三节多元线性回归的统计检验专题:eviews软件入门目录第一节多元线性回归的模型的表示方法和基本假定4第一节多元线性回归的模型的表示和基本假定一、多元线性回归的基本表示方法二、偏回归系数的含义三、模型的基本假定返回第一节多元线性回归的模型的表示和基本假定一、多元线性回归的基5一、一般线性回归模型的基本表示方法函数形式:矩阵形式:返回一、一般线性回归模型的基本表示方法函数形式:矩阵形式:返回6二、偏回归系数返回二、偏回归系数返回7

假定1:随机扰动项的零均值假定

三、古典(经典)假定或假定2:随机扰动项的零均值假定的同方差假定返回假定1:随机扰动项的零均值假定三8假定3:无自相关假定(多元线性回归模型)假定3:无自相关假定(多元线性回归模型)9假定4、随机扰动项与解释变量不相关(相互独立)或假定5、正态性:随机扰动项服从正态分布

线性回归模型:例:一元线性回归模型:假定4、随机扰动项与解释变量不相关(相互独立)或假定5、正态106、无多重共线性,即假定各解释变量之间不存在线性关系

(注:多元线性回归模型才有无多重共线性的假定)

该式成立,X至少有K阶子行列式不为零,表明解释变量之间不存在线性相关关系。

返回6、无多重共线性,即假定各解释变量之间不存在11第二节多元线性回归的参数的OLS估计及其性质一、参数的OLS估计二、OLS估计量的性质三、OLS估计量的概率分布返回第二节多元线性回归的参数的OLS估计及其性质一、参数的OL12例如:多元线性回归模型的“残差平方和”为:

要使“残差平方和”达到最小,其充分条件是即:一、参数的OLS估计

基本思想(原则):寻找实际值与拟合值的离差平方和为最小的回归直线。

例如:多元线性回归模型的“残差平方和”为:要使“残差平方13

化简得正规方程组

化简得正规方程组14二、参数估计量的性质在满足基本假设的情况下,总体参数的普通最小二乘估计具有:线性性、无偏性、有效性。即高斯-马尔可夫定理一样成立1、线性性2、无偏性3、最小方差性4、小结返回二、参数估计量的性质在满足基本假设的情况下,总体参数的151、线性性:返回1、线性性:返回162、无偏性返回2、无偏性返回17返回返回18

4、小结:估计量的统计性质3)最小方差性:4、小结:估计量的统计性质3)最小方差性:19返回返回20三、ols估计量的概率分布假设检验需要指明总体参数(即总体回归系数)的估计量(即样本回归系数)服从何种分布如同需要指明样本均值服从何种分布,才可对总体均值进行统计推断一样。样本回归系数是Y的线性函数,因此其概率分布取决于Y,而Y的概率分布取决于随机误差项三、ols估计量的概率分布假设检验需要指明总体参数(即总体回21有了样本回归系数的OLS估计量的分布信息,就可以利用它进行总体回归系数的统计推断1、正态性假定:随机误差项服从正态分布,随机扰动项代表了未引入模型的随机影响之和,依据中心极限定理,大量独立同分布的随机变量之和趋向于正态分布返回有了样本回归系数的OLS估计量的分布信息,就可以利用它进行总22第三节多元线性回归的统计检验一、拟合优度检验二、参数显著性检验三、对联合假设的检验:F检验返回第三节多元线性回归的统计检验一、拟合优度检验23一、拟合优度检验p1581、多元判定系数R22、调整后的多元判定系数返回一、拟合优度检验p1581、多元判定系数R2241、多元判定系数R2多元判定系数和一元判定系数的计算方法是一样的:因为判定系数的计算只和被解释变量Y有关,和解释变量X无关1、多元判定系数R2多元判定系数和一元判定系数的计算方法是一252、调整后的多元判定系数(p165)多元判定系数R2存在一个问题:当解释变量个数增多时候,离差平方和RSS至少不会增大,则多元判定系数R2一般会随着增大解释变量个数增多而增大1)可决系数随解释变量个数的增加而增大。易造成错觉:要模型拟合得越好,就应增加解释变量。然而增加解释变量会降低自由度,减少可用的样本数。并且有时增加解释变量是不必要的;2)导致解释变量个数不同模型之间对比困难;可决系数只涉及变差,没有考虑自由度。因此在比较同一被解释变量,但又不同个数的解释变量的模型的时候,R2存在不合理的地方2、调整后的多元判定系数(p165)多元判定系数R2存在一个26调整后的多元判定系数性质调整后的多元判定系数性质27二、对回归参数进行假设检验:显著性检验法(p135)多元线性回归的参数的显著性检验同为稻草人假设自由度为n-k-1,k为解释变量个数得到t值后和临界值比较,当t值大于临界值,则拒绝零假设返回二、对回归参数进行假设检验:显著性检验法(p135)多元线性28葡萄酒价格预测数据应变量:ln(price):1952~1980年间共10批,用来自六个葡萄种植场的的葡萄酿造的60种不同葡萄酒的价格,取其对数形式自变量:Age:葡萄酒存放年数Temp:葡萄生长期平均气温Rain:8/9月份降雨量Wrain:葡萄生长期前一年10月到次年3月降雨量葡萄酒价格预测数据29回归结果(括号里数据为标准误差)回归结果(括号里数据为标准误差)30三、对联合假设的检验(p161)三、对联合假设的检验(p161)31回归方程的显著性检验—F检验(检验因变量和诸自变量之间是否存在显著的线性关系)

1、检验的假设:3、根据样本数据,计算F统计量的值变差来源平方和自由度方差

回归残差

总变差回归方程的显著性检验—F检验(检验因变量和诸自变量之间是否存32拟合优度检验和F检验的对比拟合优度检验和F检验都是对回归方程显著性的检验,都是把总离差TSS分解成回归平方和ESS与残差平方和RSS,并在此基础上构造统计量进行检验。F检验零假设成立等价于判定系数为零模型对观测值的拟合程度越高,模型总体线性关系的显著性就越高。区别:F检验有精确的分布。返回拟合优度检验和F检验的对比拟合优度检验和F检验都是对回归方程33Eviews软件入门Eviews软件入门34

启动软件包

(双击“Eviews”,进入Eviews主页)

一、创建工作文件(点击“File/New/Workfile/Ok”)

出现“WorkfileRange”,目的:

1、选择数据频率(类型):

Annual(年度)Quartely(季度)┆Undatedorirrequar(未注明日期或不规则的)

2、确定Startdate和Enddate出现“Workfile对话框(子窗口)”中已有两个变量:

c-----常数项

resid----模型将产生的残差项

二、输入(编辑)数据:

法1:键入:

“datayx”(一元)或“datayx1x2…”(多元)/回车。启动软件包(双击“Eviews”,进入Evi35法2:用鼠标单击“Quick”;在出现的下拉菜单中单击“EmptyGroup”;在出现Group窗口:数据表第一序列取名y,键入y的数据;再将数据表第二序列取名x,键入x的数据;…/存盘(或最小化)。

注:1)存盘点“File/save”,删除原文件名,输入“自命名”/ok;

2)读取(数)点“File/open”,点自命名文件/ok;

三、作图(对数据进行浏览)

法1:单击“Quick/Graph”在出现的对话框中键入yx/ok

;或yx1x2---/ok;在出现的菜单中点击LineGrap;在下拉菜单中选类型(如ScatterDiagram(散点图)/OK,出现图形;---)

法2:

键入graphyx/ok

四、回归分析(用OLS估计未知参数)法1:点击“Quick/EstimateEquation”;在估计对话框中,键入ycx/ok法2:在命令框键入LSYCX;或LSYCX1X2…/回车注:在Equation框中,点击Resids,可以出现Residual、Actual、Fitted的图形

点击Stats,返回法2:用鼠标单击“Quick”;在出现的下拉36

五、计算描述统计量

点击:Quick/Groupstatistics/Descriptivestatistics/CommonSample如:五、计算描述统计量37六、预测

在Equation框中,点击“Forecast/ok”,得样本期内被解释变量的拟合值YF(拟合值与实际值的对比图、表)。(键入:“ShowYYF,可以对照比较其结果)1、内插预测

2、外推预测(如:资料为1978-1998,外推到1978-2000年)键入:expand19782000/回车(Range扩大)键入:smpl19782000/回车(sample扩大)键入:datax/回车/yes,输入X的1999、2000年资料/最小化

在Equation框中,点击“Forecast”,得对话框。对话框主要有Forecastname(预测值序列名)S.E.(预测值标准差)YF

se3、区间预测:利用描述统计,可以先计算:六、预测在Equation框中,点击“F38七、非线性模型的线性化

genrX2=X*X……

genrLQ=log(Q)……七、非线性模型的线性化genrX2=X*Xgenr39讨论和作业讨论:8.3作业8.128.138.18讨论和作业讨论:8.340第六章多元线性回归模型第六章多元线性回归模型41多元回归模型多元回归模型42计算各收入组的条件均值,绘制散点图900/201000/301100/40…………550550600…………550600650…………600650700650700750650750800X1/x2Y计算各收入组的条件均值,绘制散点图900/20100043目录第一节多元线性回归的模型的表示方法和基本假定第二节多元线性回归的参数的OLS估计及其性质第三节多元线性回归的统计检验专题:eviews软件入门目录第一节多元线性回归的模型的表示方法和基本假定44第一节多元线性回归的模型的表示和基本假定一、多元线性回归的基本表示方法二、偏回归系数的含义三、模型的基本假定返回第一节多元线性回归的模型的表示和基本假定一、多元线性回归的基45一、一般线性回归模型的基本表示方法函数形式:矩阵形式:返回一、一般线性回归模型的基本表示方法函数形式:矩阵形式:返回46二、偏回归系数返回二、偏回归系数返回47

假定1:随机扰动项的零均值假定

三、古典(经典)假定或假定2:随机扰动项的零均值假定的同方差假定返回假定1:随机扰动项的零均值假定三48假定3:无自相关假定(多元线性回归模型)假定3:无自相关假定(多元线性回归模型)49假定4、随机扰动项与解释变量不相关(相互独立)或假定5、正态性:随机扰动项服从正态分布

线性回归模型:例:一元线性回归模型:假定4、随机扰动项与解释变量不相关(相互独立)或假定5、正态506、无多重共线性,即假定各解释变量之间不存在线性关系

(注:多元线性回归模型才有无多重共线性的假定)

该式成立,X至少有K阶子行列式不为零,表明解释变量之间不存在线性相关关系。

返回6、无多重共线性,即假定各解释变量之间不存在51第二节多元线性回归的参数的OLS估计及其性质一、参数的OLS估计二、OLS估计量的性质三、OLS估计量的概率分布返回第二节多元线性回归的参数的OLS估计及其性质一、参数的OL52例如:多元线性回归模型的“残差平方和”为:

要使“残差平方和”达到最小,其充分条件是即:一、参数的OLS估计

基本思想(原则):寻找实际值与拟合值的离差平方和为最小的回归直线。

例如:多元线性回归模型的“残差平方和”为:要使“残差平方53

化简得正规方程组

化简得正规方程组54二、参数估计量的性质在满足基本假设的情况下,总体参数的普通最小二乘估计具有:线性性、无偏性、有效性。即高斯-马尔可夫定理一样成立1、线性性2、无偏性3、最小方差性4、小结返回二、参数估计量的性质在满足基本假设的情况下,总体参数的551、线性性:返回1、线性性:返回562、无偏性返回2、无偏性返回57返回返回58

4、小结:估计量的统计性质3)最小方差性:4、小结:估计量的统计性质3)最小方差性:59返回返回60三、ols估计量的概率分布假设检验需要指明总体参数(即总体回归系数)的估计量(即样本回归系数)服从何种分布如同需要指明样本均值服从何种分布,才可对总体均值进行统计推断一样。样本回归系数是Y的线性函数,因此其概率分布取决于Y,而Y的概率分布取决于随机误差项三、ols估计量的概率分布假设检验需要指明总体参数(即总体回61有了样本回归系数的OLS估计量的分布信息,就可以利用它进行总体回归系数的统计推断1、正态性假定:随机误差项服从正态分布,随机扰动项代表了未引入模型的随机影响之和,依据中心极限定理,大量独立同分布的随机变量之和趋向于正态分布返回有了样本回归系数的OLS估计量的分布信息,就可以利用它进行总62第三节多元线性回归的统计检验一、拟合优度检验二、参数显著性检验三、对联合假设的检验:F检验返回第三节多元线性回归的统计检验一、拟合优度检验63一、拟合优度检验p1581、多元判定系数R22、调整后的多元判定系数返回一、拟合优度检验p1581、多元判定系数R2641、多元判定系数R2多元判定系数和一元判定系数的计算方法是一样的:因为判定系数的计算只和被解释变量Y有关,和解释变量X无关1、多元判定系数R2多元判定系数和一元判定系数的计算方法是一652、调整后的多元判定系数(p165)多元判定系数R2存在一个问题:当解释变量个数增多时候,离差平方和RSS至少不会增大,则多元判定系数R2一般会随着增大解释变量个数增多而增大1)可决系数随解释变量个数的增加而增大。易造成错觉:要模型拟合得越好,就应增加解释变量。然而增加解释变量会降低自由度,减少可用的样本数。并且有时增加解释变量是不必要的;2)导致解释变量个数不同模型之间对比困难;可决系数只涉及变差,没有考虑自由度。因此在比较同一被解释变量,但又不同个数的解释变量的模型的时候,R2存在不合理的地方2、调整后的多元判定系数(p165)多元判定系数R2存在一个66调整后的多元判定系数性质调整后的多元判定系数性质67二、对回归参数进行假设检验:显著性检验法(p135)多元线性回归的参数的显著性检验同为稻草人假设自由度为n-k-1,k为解释变量个数得到t值后和临界值比较,当t值大于临界值,则拒绝零假设返回二、对回归参数进行假设检验:显著性检验法(p135)多元线性68葡萄酒价格预测数据应变量:ln(price):1952~1980年间共10批,用来自六个葡萄种植场的的葡萄酿造的60种不同葡萄酒的价格,取其对数形式自变量:Age:葡萄酒存放年数Temp:葡萄生长期平均气温Rain:8/9月份降雨量Wrain:葡萄生长期前一年10月到次年3月降雨量葡萄酒价格预测数据69回归结果(括号里数据为标准误差)回归结果(括号里数据为标准误差)70三、对联合假设的检验(p161)三、对联合假设的检验(p161)71回归方程的显著性检验—F检验(检验因变量和诸自变量之间是否存在显著的线性关系)

1、检验的假设:3、根据样本数据,计算F统计量的值变差来源平方和自由度方差

回归残差

总变差回归方程的显著性检验—F检验(检验因变量和诸自变量之间是否存72拟合优度检验和F检验的对比拟合优度检验和F检验都是对回归方程显著性的检验,都是把总离差TSS分解成回归平方和ESS与残差平方和RSS,并在此基础上构造统计量进行检验。F检验零假设成立等价于判定系数为零模型对观测值的拟合程度越高,模型总体线性关系的显著性就越高。区别:F检验有精确的分布。返回拟合优度检验和F检验的对比拟合优度检验和F检验都是对回归方程73Eviews软件入门Eviews软件入门74

启动软件包

(双击“Eviews”,进入Eviews主页)

一、创建工作文件(点击“File/New/Workfile/Ok”)

出现“WorkfileRange”,目的:

1、选择数据频率(类型):

Annual(年度)Quartely(季度)┆Undatedorirrequar(未注明日期或不规则的)

2、确定Startdate和Enddate出现“Workfile对话框(子窗口)”中已有两个变量:

c-----常数项

resid----模型将产生的残差项

二、输入(编辑)数据:

法1:键入:

“datayx”(一元)或“datayx1x2…”(多元)/回车。启动软件包(双击“Eviews”,进入Evi75法2:用鼠标单击“Quick”;在出现的下拉菜单中单击“EmptyGroup”;在出现Group窗口:数据表第一序列取名y,键入y的数据;再将数据表第二序列取名x,键入x的数据;…/存盘(或最小化)。

注:1)存盘点“File/save”,删除原文件名,输入“自命名”/ok;

2)读取(数)点“File/open”,点自命名文件/ok;

三、作图(对数据进行浏览)

法1:单击“Quick/Graph”在出现的对话框中键入yx/ok

;或yx1x2---/ok;在出现的菜单中点击LineGrap;在下拉菜单中选类型(如ScatterDiagram(散点图)/OK,出现图形;---)

法2:

键入graphyx/ok

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论