试验一一元线性回归_第1页
试验一一元线性回归_第2页
试验一一元线性回归_第3页
试验一一元线性回归_第4页
试验一一元线性回归_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实验一 一元线性回归一 实验目的: 掌握一元线性回归的估计与应用,熟悉 EViews 的基本操作。二 实验要求: 应用教材 P59第 12 题做一元线性回归分析并做预测。三 实验原理: 普通最小二乘法。四 预备知识: 最小二乘法的原理、 t 检验、拟合优度检验、点预测和区间预测。 五 实验容:第 2 章练习 12下表是中国 2007 年各地区税收 Y 和国生产总值 GDP的统计资料。单位:亿元地区 Y GDP 地区 Y GDP北京1435.79353.3天津438.45050.4河北618.313709.5山西430.55733.4347.9 6091.1辽 宁815.711023.5吉 林2

2、37.45284.7江1894.825741.2浙江1535.418780.4安徽401.97364.2福建594.09249.1江西281.95500.3335.0 7065.0上 海 1975.5 12188.9山 东 1308.4 25965.9河 南 625.0 15012.5北南东西南庆川州南藏西肃海夏湖湖广广海重四贵云西陕甘青宁434.0410.72415.5282.788.0294.5629.0211.9378.69230.79200.031084.45955.71223.34122.510505.32741.94741.311.7 342.2355.5 5465.8142.1

3、2702.443.3 783.658.8 889.2220.6 3523.2要求,以手工和运用 Eviews 软件:(1) 作出散点图,建立税收随国生产总值 GDP变化的一元线性回归方程,并 解释斜率的经济意义;(2) 对所建立的回归方程进行检验;(3) 若 2008 年某地区国生产总值为 8500亿元,求该地区税收收入的预测值 及预测区间。六 实验步骤1. 建立工作文件并录入数据:(1) 双击桌面快速启动图标,启动 Microsoft Office Excel,如图 1,将题目的数据输入到 excel 表格中并保存。(2) 双击桌面快速启动图标,启动 EViews6 程序(3) 点击 Fil

4、e/New/ Workfile ,弹出 Workfile Create 对话框。在 Workfile Create 对话框左侧 Workfile structure type栏中选择 Unstructured/Undated选项,在右侧 Data Range中填入样本个数 31.在右下方输入 Workfile 的名称 P53.如图 2 所示。图 2(4) 下面录入数据,点击 File/Import/Read Text-Lotus-Excel.选中第 (1)步保存的 excel 表格,弹出 Excel Spreadsheet Import 对话框,在 Upper-left data cell 栏

5、输入数据的起始单元格 B2,在 Excel 5+sheet name 栏中输入数据 所在的工作表 sheet1 ,在 Names for series or Number if named in file栏中输入变量名 Y GDP,如图 3所示,点击 OK,得到如图 4 所示界面。图 3(5) 按住 Ctrl 键同时选中 Workfile 界面的 gdp 表跟 y 表,点击鼠标右键选Open/as Group 得到完整表格如图 5,并点击 Group 表格上菜单命令 Name,在弹 出的对话框中命名为 group01.图 5图 62. 数据的描述性统计和图形统计:以上建立的序列 GDP和 Y之

6、后,可对其做描述统计和统计以把握该数据的一 些统计属性。(1) 描述属性:点 View/Descriptive StatsCommon Sample ,得描述统计结果,如图 6 所 示,其中: Mean为均值, Std.Dev 为标准差。(2) 图形统计:双击序列 GDP,打开 GDP的表格形式, 点击表格左边 View/Graph,可得图 7。 同样可查看序列 Y 的线形图。很多时候需要把两个序列放在一个图形中来查看两者的相互关系, 用线图或 散点图都可以。在命令栏键入: scat GDP Y ,然后回车,就可以得到用散点图来查看GDP和 Y 的关系,如图 8 所示。图 73. 设定模型,用

7、最小二乘法估计参数:设定模型为 Yi 1 2Xi ui按住 Ctrl 键,同时选中序列 Y 和序列 GDP,点击右键,在所出现的右键菜 单中,选择 Open/as Equation 后弹出一对话框,在框中一次输入“ y c gdp ”, (注意被解释变量在最前,变量间要空格,如图 9)点击其下的确定,即可得到 回归结果(如图 10)。图 10由图 10 数据结果,可得到回归分析模型为:Yi 10.62963 0.071047 Xi( 0.123500) (9.591245)R2 0.760315 , F 9199198, DW. . 1.570523 其中,括号的数为相应的 t 检验值。 R2

8、是可决系数, F 与 D.W .是有关的两个检 验统计量。4. 模型检验:(1) 经济意义检验。 斜率 ?2 0.071047为边际可支国生产总值 GDP,表明 2007 年,中国地各省区 GDP每增加 1 亿元时,税收平均增加 0.071047 亿元。(2) t 检验和拟合优度检验。 在显著性水平下,自由度为 31-2=29 的 t 分布的临界值 t0.025(29) 2.05 。因此,从参数的 t 检验值看,斜率项显然不为零,但不 拒绝截距项为零的假设。另外,拟合优度 R2 0.760315 表明,税收的 76%的变化也以由 GDP的变化来解释,因此拟合情况较好。在 Eqution 界面点

9、击菜单命令View/Actual,Fitted,Residual/Actual,Fitted.Residual Graph 可得到图 11, 可直观看到实际观测站和拟合值非常接近。图 12图 115. 应用:回归预测:(1) 被解释变量 Y 的个别值和平均值的点预测:由第二章第五节知道,个别值和平均值点预测的预测公式均为YF?2X插预测:在 Equation 框中,点击“ Forecast ”,在 Forecast name 框中可以为所预 测的预测值序列命名,计算机默认为 yf ,点击“ OK”,得到样本期被解释变量的 预测值序列 yf (也称拟合值序列)的图形形式(图 12)。同时在 Wo

10、rkfile 中出 现一个新序列对象 yf 。外推预测: 录入 2008年某地区国生产总值 GDP为 8500 亿元的数据。双击 Workfile 菜单下的 Range所在行,出现将 Workfile structured 对话 框,讲右侧 Observation 旁边的数值改为 32,然后点击 OK,即可用将 Workfile的 Range以及 Sample 的 Range改为 32;双击打开 GDP序列表格形式,将编辑状态切换为“可编辑” ,在 GDP序列中 补充输入 GDP=850(0 如图 13 所示)。图 14图 13 进行预测在 Equation 框中,点击“ Forecast ”

11、,弹出一对话框,在其中为预测的序 列命名,如 yf2 。点击 OK即可用得到预测结果的图形形式(如图 14 所示)。点击 Workfile 中新出现的序列 yf2 ,可以看到预测值为 593.2667 (图 15) (注意:因为没有对默认预测区间 1-32 做改变,这时候得到的是所有插预测与 外插预测的值,若将区间改为 32 32 ,则只会得到外推预测结果) 。.图 16图 15 结果查看按住 Ctrl 键,同时选中 y、yf 、resid ,点击右键,在右键菜单中选 Open/as Group 可打开实际值、预测值、残差序列,在 view 菜单选择 Graph. ,画折线 图(如图 16 所

12、示)。(2) 区间预测原理:当 2007 年中国某省区 GDP为 8500 亿元时,预测的税收为Y? 10.63 0.071 8500 593.2667 亿元被解释变量 Y 的个别值区间预测公式为:Y?f ? t /2 1 1/ n (GDPf GDP)2/ gdpi2 ,被解释变量 Y 的均值区间预测公式为:Y?f ? t /2 1/ n (GDPf GDP)2/ gdpi2 。具体地说, Y?f 可以在前面点预测序列 yf2 593.2667 中找到; t /2 =2.045 可 以查 t 分布表得到;样本数 n=31为已知; GDPf GDP中的GDP f =8500为已知,GDP 88

13、91.126 , gdpi2 55957878.6可以在序列 GDP的描述统计中找到,(GDPf GDP)2=( 391.126)2 =152979.5 ;ei 2 RSS 2760310 , 从 而2?2ei2760310 95183.1 ; 由 X 总 体 方 差 的 无 偏 估 计 式n k 1 31 1 12GDPgdpi2 /(n 1) 619.58032 383879.74814809 , 可 以 计 算gdpi2 (n 1) 11900272.19259079 ( GDP 可在序列 X 的描述统计中找到 )(3) 区间预测的 Eviews 操作:个别值置信区间的计算: 在命令栏输

14、入:( yfu 为个别值的置信上界, yfl 为个别值的置信下界) “scalaryfu=593.2667+2.045*sqrt(95183.1* (1+1/31+152979.5/55957878.6) ” “scalaryfl=593.2667- 2.045*sqrt(95183.1*(1+1/31+152979.5/55957878.6) ” 得到:yfu=1235.12876632 yfl=-48.5953663235于是 95%的置信度下预测的 2008 年某省区税收入个值的置信区间为:(-48.5953663235,1235.12876632 )。均值的置信区间的计算:在命令栏输入

15、:( eyfu 为均值的置信上界, eyfl 为均值的置信下界) “scalareyfu=593.2667+2.045*sqrt(95183.1*(1/31+152979.5/55957878.6) ” “scalareyfl=593.2667- 2.045*sqrt(95183.1*(1/31+152979.5/55957878.6) ” 得到:eyfu=711.287072849 eyfl=475.246327151于是在 95%的置信度下, 预测省区的 2008 年的税收收入均值的置信区间为:(475.246327151,711.287072849)。实验二 多元线性回归一 实验目的 :

16、(1) 掌握多元线性回归模型的估计方法(2) 模型方程的 F 检验,参数的 t 检验(3) 模型的外推预测与置信区间预测二 实验要求: 应用教材 P107习题 14 做多元线性回归模型估计,对回归方程和回归参数进行检验并做出单点预测与置信区间预测实验原理 :最小二乘法四 预备知识 :最小二乘法估计原理、 t 检验、 F 检验、点预测和置信区间预测五 实验容 :在一项对某社区家庭对某种消费品的消费需要调查中, 得到书中的表所示的资料序号对某商品的 消费支出 Y商品单价 家庭月收序号对某商品的 消费支出 Y商品单价 家庭月收X1入 X2X1入 X21591.923.5676206644.434.1

17、4129202654.524.4491207680.035.3143403623.632.07106708724.038.7159604647.032.46111609757.139.63180005674.031.151190010706.846.6819300请用手工与软件两种方法对该社区家庭对该商品的消费需求支出作二元线性回 归分析。图 16.2 建立二元线性回归模型0 1X1 2X2点击主界面菜单 QuickEstimate Equation 选项,在弹出的对话框中输入: Y C X1 X2 点击确定即可得到回归结果,如图 2 所示图 2根据图 2 的信息,得到回归模型的估计结果为:Y

18、626.51939.7906 X 10.0286 X 2(15.61)( 3.06)(4.90)2R2 0.9022182R0.874281DW. . 1.6508042ei2 2116.847F32.29408df (2,7)2 2116.847302.4067随机干扰项的方差估计值为76.3 结果的分析与检验6.3.1 方程的 F 检验 回归模型的 F 值为:F 32.29408因为在 5%的显著性水平下, F 统计量的临界值为F0.05 (2,7) 4.74所以有F F0.05 (2,7)所以回归方程通过 F 检验,方程显著成立。6.3.2 参数的 t 检验由图 2 的估计结果,常数项、

19、 X1、X2系数的参数估计的 t 值分别为:t0 15.61195t1 3.061617t2 4.902030在 5%的显著性水平下, t 统计量的临界值为: t0.025(7) 2.3646显然有ti t0.025 (7),i 0,1,2所以拒绝原假设 H 0,即回归方程的三个估计参数均显著,通过 t 检验。6.4 参数的置信区间 由图 2 的结果,可以看到 :40.13010 3.197843 0.005838又因为在所以得: ?ita/2S?,0.05的显著性水平下,?0 ta/2 S?0ta/2 S? , i 0,1,2it0.025(7) 2.3646626.5093 2.3646*

20、40.13010因为参数的区间估计为:于是,常数项的 95%的置信区间为:531.6177,721.4009同样的有:?1 ta/2 S?9.790570 2.3646*3.1978431于是, X1项的系数的95%的置信区间为: 17.3522 , 2.2290同样的有:?2 ta/2 S? 0.028618 2.3646*0.005838于是, X2项的系数的95%的置信区间为:0.0148 , 0.04246.5 回归预测6.5.1 插预测在 Equation 框中,点击“ Forecast ”,在 Forecast name 框中可以为所预 测的预测值序列命名,计算机默认为 yf ,点

21、击“ OK”,得到样本期被解释变量的 预测值序列 yf (也称拟合值序列)的图形形式,如图 3 所示。同时在 Workfile 中出现一个新序列对象 yf 。6.5.2 外推预测(1) 录入数据双击 Workfile 菜单下的 Range所在行,出现将 Workfile structured 对话 框,将右侧 Observation 旁边的数值改为 11,然后点击 OK,即可用将 Workfile 的Range以及Sample的Range改为 11;双击打开 group01 序列表格形式, 将编辑状态切换为 “可编辑”,在 X1 序列 中补充输入 X1=35.同样的方法录入 X2=20000

22、(2) 进行预测在 Equation 框中,点击“ Forecast ”,弹出一对话框,在其中为预测的序列命名,如 yf2 。点击 OK即可用得到预测结果的图形形式,如图 4所示。点击 Workfile 中新出现的序列 yf2 ,可以看到预测值为 856.2025 (如图 5 所示)图 5 图 6(3) 结果查看按住 Ctrl 键,同时选中 y、yf 、resid ,点击右键, 在右键菜单中选 Open/as Group 可打开实际值、预测值、残差序列,在 view 菜单选择 Grap/Line ,画折线 图,如图 6 所示。6.6 置信区间的预测消费支出 Y 的个别值的预测置信区间为 :ta/2 SY?0其中, SY? 为 Y的个别值预测的标准差为Y0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论