实验一一元线性回归_第1页
实验一一元线性回归_第2页
实验一一元线性回归_第3页
实验一一元线性回归_第4页
实验一一元线性回归_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实验一一元线性回归一实验目的:掌握一元线性回归的估计与应用,熟悉EViews的基本操作。二实验要求:应用教材P59第12题做一元线性回归分析并做预测。三实验原理:普通最小二乘法。四预备知识:最小二乘法的原理、t检验、拟合优度检验、点预测和区间预测。五实验容:第2章练习12下表是中国2007年各地区税收Y和国生产总值GDP的统计资料。单位:亿元地区YGDp~地区YGDp京津北西宁林海江徽建西东南北天河山辽吉上江浙安福江山河1435.79353.3438.4京津北西宁林海江徽建西东南北天河山辽吉上江浙安福江山河1435.79353.3438.45050.4618.313709.5430.55733.4347.96091.1815.711023.5237.45284.7335.07065.01975.512188.91894.825741.21535.418780.4401.97364.2594.09249.1281.95500.31308.425965.9625.015012.5北南东西南庆川州南藏西肃海夏疆湖湖广广海重四贵云西陕甘青宁新434.09230.7410.79200.02415.531084.4282.75955.788.01223.3294.54122.5629.010505.3211.92741.9378.64741.311.7342.2355.55465.8142.12702.443.3783.658.8889.2220.63523.2作出散点图,建立税收随国生产总值GDP变化的一元线性回归方程,并解释斜率的经济意义;对所建立的回归方程进行检验;若2008年某地区国生产总值为8500亿元,求该地区税收收入的预测值及预测区间。六实验步骤建立工作文件并录入数据:双击桌面快速启动图标,启动MicrosoftOfficeExcel,如图1,将题目的数据输入到excel表格中并保存。双击桌面快速启动图标,启动EViews6程序。

点击File/New/Workfile…,弹出WorkfileCreate对话框。在WorkfileCreate对话框左侧Workfilestructuretype栏中选择Unstructured/Undated选项,在右侧DataRange中填入样本个数31.在右下方输入Workfile的名称P53.ABC1地区YGDF■.2.北京143579建3喙438.450504ABC1地区YGDF■.2.北京143579建3喙438.4505044河北研&313709.55山B430.6F733.4&内蒙古34/1!6091.17迁宁’81671102158声淋237.45284.79黑龙江33570B5上海10'/JoHifikCreate111975.51894.B■1A12188.925741.2■1口7■口nJdarkfilesbuduie也依DatarancebnsuudupBCi/UndatHjtObservatais:五Nxies加S旧;俯向:rreg庇Fm国endPwework^sberadshmLhslnjctijredAork^esglaterspading也叵眦oroth=rben埔甘seris.Pace:如图2所示。下面录入数据,点击File/Import/ReadText-Lotus-Excel...选中第(1)步保存的excel表格,弹出ExcelSpreadsheetImport对话框,在Upper-leftdatacell栏输入数据的起始单元格B2,在Excel5+sheetname栏中输入数据所在的工作表sheetl,在NamesforseriesorNumberifnamedinfile栏中输入变量名YGDP,如图3所示,点击OK,得到如图4所示界面。EwrelSpr?ad£lie^tl?npnrtDaiaorderUpper4eftdaiaod54d-eetEwrelSpr?ad£lie^tl?npnrtDaiaorderUpper4eftdaiaod54d-eetnameB^ObsEn^tion-ffinesrnocbnic■EC血出.即河壬Ygnnoi曜fkmsforsefcswFijnkriFnarndinfle项*,匚S足归咬MEVueKEdatBfMTTBtFhtjalcndardaYLaftr^Brdarday_WritEEEnEEnarTKfi口WorfcfilE!-361-l't:\u5era\admini^5rataF\dcirurrierts^.a-0国

|View|PrM|Dhjcct|Prink|Sgve|D曲Showl&tdi|StordfelelEGmr|Saqjk

Range:131-31obsDispIsQ-FillErsSample:131--31ubs■Ijs.^lEQjnerrtEanpbQ'Akxkflerarige-Tooidofrarae按住Ctrl键同时选中Workfile界面的gdp表跟y表,点击鼠标右键选Open/asGroup得到完整表格如图5,并点击Group表格上菜单命令Name,在弹出的对话框中命名为group01.口Gratif口Gratifi:UNDTLfD^61::Un^ed\1|¥iewPiOCOfajed.PrintJ顿eJ⑥企DefadL■|渤tT顽神叫SitH■卜|5即X口瞻YGDPODEYGDPj-11435.7009151300z2-13S40D050504003618300044305000573J.4Q05347.90000091.1006815.700011023.507237.0052Sd.7G0&3150000706600091975.50012189.901D1094.8DQ2&741.Z0111&3E.4D0187SO.4O12401.9000735d.20O135940000物9100142B19000550030015WB40025365.901E625.DOOO15012.5017434.D0D09130.700IB4""FlfiMM1041E」!•□urou^.GSOUP3:Wfj舟恒网PnK:|Qb」KtPrutHuegeeiEIsanufe5曰缶VGDPMeanfi21映8的1126kl&dan40190006091.100MERilmum2415-MO31Q84.40Mrimum1170CO03I2.2DOOSilDm.619.58037604.152SEowii嘴&1.&230101.4S3D70Kuricsis4.2901844.55S904Jarqus-fera141345914.04796Protabilr^0.0W53ooooasoSum19G52.7Q2T56249SumStiDm.115163911.73E-09Dbs&Pi'aibns3131rn数据的描述性统计和图形统计:以上建立的序列GDP和Y之后,可对其做描述统计和统计以把握该数据的一些统计属性。描述属性:点View/DescriptiveStats\CommonSample,得描述统计结果,如图6所示,其中:Mean为均值,Std.Dev为标准差。图形统计:双击序列GDP,打开GDP的表格形式,点击表格左边View/Graph,可得图7。同样可查看序列Y的线形图。很多时候需要把两个序列放在一个图形中来查看两者的相互关系,用线图或散点图都可以。在命令栏键入:scatGDPY,然后回车,就可以得到用散点图来查看GDP和Y的关系,如图8所示。OGDPWnHcfiBP£l:AJnti%led\ula曲|g|Bb|gil|propg/|PtinE:Nane:斤能ae|SaiWaGar回前匚臼做;5151£|岳

图7设定模型,用最小二乘法估计参数:设定模型为r=。+px+u。i12ii按住Ctrl键,同时选中序列Y和序列GDP,点击右键,在所出现的右键菜单中,选择Open/asEquation…后弹出一对话框,在框中一次输入“ycgdp”,(注意被解释变量在最前,变量间要空格,如图9)点击其下的确定,即可得到回归结果(如图10)。EquationEstmation□Equal:.mLNTTilECWorkiilt:|u'EquationEstmation□Equal:.mLNTTilECWorkiilt:|u'回,同:fllrrt;iNaneIrbseI『EilmHlE[horajaetlSiartslRaaddIqnbtLD^Depea,il':DLl7-iri-iljle/□llan>:dbylistq£rcgrcsLDTLandJ1LIsria,DEulsMpLcaiequa.1]onInkeyL£flpaDependentvanaaie-yklethcd:Le^stSquaresDate-fl9/27d1Time-flV11Sample:131Induedobser^bns.31CoeffltientSilError佬记PfOt.c-10.62963B6.0B992■0.1235000.9026GDP0.071Di7D.0074D79.5912450.0000R-squarad0.760315瞄n坐靛nd就L鸵『621.0543.AJjLtstesR-sqLiared0752050SDtepencertuar6195303s.Ealregression303.517BPKaiKginwjjttsrlon1J§.3fi373Sumsquaredr&sid2750310.Schwarzcritericn1445fiSLoQiiKellhoofl-220.63B5Hannan-Quinnenter1^.39393F-slaU£lic91.9919BDurtin-Walsonslat1.57D523Prn&lF-statishcJ0OQOOOO由图10数据结果,可得到回归分析模型为:Y=—10.62963+0.071047X(-0.123500)(9.591245)R2=0.760315,F=9199198,DW.=1.570523其中,括号的数为相应的t检验值。R2是可决系数,F与DW.是有关的两个检验统计量。模型检验:经济意义检验。斜率P=0.071047为边际可支国生产总值GDP,表明20072年,中国地各省区GDP每增加1亿元时,税收平均增加0.071047亿元。t检验和拟合优度检验。在显著性水平下,自由度为31-2=29的t分布的临界值roo2529)=Z°5。因此,从参数的t检验值看,斜率项显然不为零,但不拒绝截距项为零的假设。另外,拟合优度夫2=0.760315表明,税收的76%的变化也以由GDP的变化来解释,因此拟合情况较好。在Eqution界面点击菜单命令View/Actual,Fitted,Residual/Actual,Fitted.ResidualGraph可得到图11,可直观看到实际观测站和拟合值非常接近。图11图12应用:回归预测:图11图12(1)被解释变量Y的个别值和平均值的点预测:由第二章第五节知道,个别值和平均值点预测的预测公式均为r=B+BxF12F插预测:在Equation框中,点击“Forecast”,在Forecastname框中可以为所预测的预测值序列命名,计算机默认为yf,点击“OK”,得到样本期被解释变量的预测值序列yf(也称拟合值序列)的图形形式(图12)。同时在Workfile中出现一个新序列对象yf。外推预测:录入2008年某地区国生产总值GDP为8500亿元的数据。双击Workfile菜单下的Range所在行,出现将Workfilestructured对话框,讲右侧Observation旁边的数值改为32,然后点击OK,即可用将Workfile

的Range以及Sample的Range改为32;双击打开GDP序列表格形式,将编辑状态切换为“可编辑”,在GDP序列中补充输入GDP=8500(如图13所示)。独|Rdc|的时:|心oper丽F¥TYt|NamB独|Rdc|的时:|心oper丽F¥TYt|NamBiFreezeDefadt*回什|司卜£叫山■卜SiGDP1515D12.90■IT92307001S9200.0001331DM.402059557DQ21'西幻00224122S002]10505.3024274150025」"300263i230CO27E4B5.800202702JOO29701600030069.30003135232CQ□22E5DOJOOO■in卜3SeriK!GDPWtwlcfile!P61!!Untrtlecl\OlEquatiDn!UNT1TLEEWorfcfilp:PfelHUnritledV|m|回[|VfeM|froc|ObjEri|Wht|M3mE|FreeM|Eciimafe!|FcreesI:|StatE|RadsFDranasI:YRS:Fwksh汨W3ZIrsitdtdct«r&<wis:SIES.3SK175.255S隹浜0RoeMssrsajaradEmrIrfeai耳wh符Eira-LkanAha七res代EmrThe!0U洌Bi£=FTOKMtiWlaMMaL免典s图13图图13进行预测在Equation框中,点击"Forecast”,弹出一对话框,在其中为预测的序列命名,如yf2。点击OK即可用得到预测结果的图形形式(如图14所示)。点击Workfile中新出现的序列yf2,可以看到预测值为593.2667(图15)(注意:因为没有对默认预测区间1-32做改变,这时候得到的是所有插预测与外插预测的值,若将区间改为3232,则只会得到外推预测结果)。□Series:YF2Wkfile:PfiMUntitlgcK161D55.95B17645.1BMIB642.9393192197.012204125027217B.2817D22161D55.95B17645.1BMIB642.9393192197.012204125027217B.2817D222S22601237157385241B4.173125325223T2613.632^527377.^97D28101-3659294油2S03052.54503312396018□:翌59326674II!.的;UNT1TLESV/orkfilftP&:l!!Untrtled,i1图16结果查看按住Ctrl键,同时选中y、yf、resid,点击右键,在右键菜单中选Open/asGroup可打开实际值、预测值、残差序列,在view菜单选择Graph...,画折线图(如图16所示)。区间预测原理:当2007年中国某省区GDP为8500亿元时,预测的税收为Y=—10.63+0.071x8500=593.2667(亿元)被解释变量Y的个别值区间预测公式为:七mJ'■t.J1+1/n+(GDPf-GDP)2/£gd萨,被解释变量Y的均值区间预测公式为:YmS■tv;1/n+(GDP—GDP)2/£gdp2。fa/2*fi具体地说,匕可以在刖面点预测序列yf2=593-2667中找到;W2.045可以查t分布表得到;样本数n=31为已知;GDP-GDP中的GDPf=8500为已知,GDP=8891.126,£gdp2=55957878.6可以在序列GDP的描述统计中找到(GDP-GDP)2=(—391.126)2=152979.5;£弟=RSS=2760310£e22760310。"2=n—k—1=祟皆=95183」;由x总体方差的无偏JGD;=£gdp2/(n—1)=619.5803^=383879.74814809,可以£gdp:=(n—1)=11900272.19259079(jgd可在序列X的描述统计中找到)。区间预测的Eviews操作:①个别值置信区间的计算:在命令栏输入:(yfu为个别值的置信上界,yfl为个别值的置信下界)“scalaryfu=593.2667+2.045*sqrt(95183.1*(1+1/31+152979.5/55957878.6))”“scalaryfl=593.2667-2.045*sqrt(95183.1*(1+1/31+152979.5/55957878.6))”得到:yfu=1235.12876632yfl=-48.5953663235

于是95%的置信度下预测的2008年某省区税收入个值的置信区间为:

(-48.5953663235,1235.12876632)。②均值的置信区间的计算:在命令栏输入:(eyfu为均值的置信上界,eyfl为均值的置信下界)“scalareyfu=593.2667+2.045*sqrt(95183.1*(1/31+152979.5/55957878.6))”“scalareyfl=593.2667-2.045*sqrt(95183.1*(1/31+152979.5/55957878.6))”得到:eyfu=711.287072849eyfl=475.246327151于是在95%的置信度下,预测省区的2008年的税收收入均值的置信区间为:(475.246327151,711.287072849)。实验二多元线性回归一实验目的:掌握多元线性回归模型的估计方法模型方程的F检验,参数的t检验模型的外推预测与置信区间预测二实验要求:应用教材P107习题14做多元线性回归模型估计,对回归方程和回归参数进行检验并做出单点预测与置信区间预测三实验原理:最小二乘法四预备知识:最小二乘法估计原理、t检验、F检验、点预测和置信区间预测五实验容:在一项对某社区家庭对某种消费品的消费需要调查中,得到书中的表所示的资料。序号对某商品的商品单价家庭月收序号对某商品的商品单价家庭月收消费支出YX1入乂2消费支出YX1入乂21591.923.5676206644.434524.4491207680.035.3143403623.632.07106708724.038.7159604647.032.46111609757.139.63180005674.031.151190010706.846.6819300请用手工与软件两种方法对该社区家庭对该商品的消费需求支出作二元线性回归分析。估计回归方程的参数及及随机干扰项的方差)2,计算R2及R2。对方程进行F检验,对参数进行t检验,并构造参数95%的置信区间.如果商品单价变为35元,则某一月收入为20000元的家庭的消费支出估计是多少?构造该估计值的95%的置信区间。六实验步骤:6.1建立工作文件并录入全部数据如图1所示:

□Group:UNTITLEDWorkfile:P105...I□]|巨I||益务|P「oc?|Object]printjlN^mejF「史已企|Default▼|%rt|~Trsns|obsYX1X2I1691.900023.5600076200002654.600024.440009120.0003623.GOOO32.0700010670.00I4647.000032.46000111G0005674.0000311500011900.006644.400034.1400012920007G80000036.3000014340.00&ra.OOOQ38.7000015950009767100039.630001800000:10706.800046.&80001930000—[:二%|i二图16.2建立二元线性回归模型Y=P+PX+PX01122点击主界面菜单Quick\EstimateEquation选项,在弹出的对话框中输入:YCX1X2点击确定即可得到回归结果,如图2所示QEquation:EQO1WorkfilesPL-05M\Untitledu||43^|Rem|Pip匚ObjectjPnn:jrianprsinidteForecast|statsR&sidsDeDendentVariasle:YMethod:LeastSquaresDwE10/11/11Time1151Sample:11DIncludedDbseivaticn^:10VariableCoefficientStd.Errort-SlatislicProb.c626.50934G.13010■5.61195O.DOQCXI-9.7^0570土19形3-3.0615170.D183X2C.0286100005636490?D3000017R-equared0-90221BMeandependentv^irfi70_330QAdjusiedR-squaredC.674201S.D.dependentva「49.045WS.E.ofregression17.38985Akaikeinfocrrtarian8792975Sumsquared暗sid2116847SchwarzcriterionB8B3751Loglikelihood■4O.&64BBF-statistic32.29403Durbin-Watsonstat1.6E08D4PrcibfF-statistk:)D.0DD292图2根据图2的信息,得到回归模型的估计结果为:Y=626.5193-9.7906X1+0.0286X2(15.61)(-3.06)(4.90)R2=0.902218R2=0.874281DW.=1.650804£e=2116.847F=32.29408df=(2,7)随机干扰项的方差估计值为£2=2"6.847_302.406776.3结果的分析与检验6.3.1方程的F检验回归模型的F值为:F=32.29408因为在5%的显著性水平下,F统计量的临界值为F005(2,7)=4.74所以有F>F005(2,7)所以回归方程通过F检验,方程显著成立。6.3.2参数的t检验由图2的估计结果,常数项、X1、X2系数的参数估计的t值分别为:七=15.61195t=-3.0616171t2=4.902030在5%的显著性水平下,t统计量的临界值为:t0025(7)=2.3646显然有|tj>t0盛⑺,i=0,1,2所以拒绝原假设H,即回归方程的三个估计参数均显著,通过t检验。06.4参数的置信区间由图2的结果,可以看到:S=40.13010B。S=3.19784331S=0.005838底因为参数的区间估计为:[B-1-S,3+1-S],i=0,1,2

ia/2仗ia/2仗又因为在a=0.05的显著性水平下,t0025(7)=2.3646一…,一八所以得:3土t-S=626.5093土2.3646*40.130100a/230于是,常数项的95%的置信区间为:

[531.6177,721.4009]同样的有:P土t-S=—9.790570土2.3646*3.197843a/2印于是,X1项的系数的95%的置信区间为:[—17.3522,—2.2290]同样的有:P土t-S=0.028618土2.3646*0.005838a/2^2于是,X2项的系数的95%的置信区间为:[0.0148,0.0424]6.5回归预测6.5.1插预测在Equation框中,点击“Forecast”,在Forecastname框中可以为所预测的预测值序列命名,计算机默认为yf,点击“OK”,得到样本期被解释变量的预测值序列yf(也称拟合值序列)的图形形式,如图3所示。同时在Workfile中出现一个新序列对象yf。□EquadcnsEQ01Werkfik:-'K'SM'-.UrrtrtledgEw|prMob总&血〔!由板IheezpI国)顽^[][6;顽|丽15而咄二P□EquadcnsEQ01Werkfik:-'K'SM'-.UrrtrtledgEw|prMob总&血〔!由板IheezpI国)顽^[][6;顽|丽15而咄二P:阳由,r期".&新=.若•傩d8itodfroc|Objed:|片顽由丧|Freasi&kma:a|耳睥由]腐|Rasiifc|Ri»lUa.iSqundVqji=jtw1111443UfenAtsE','顽滴Tl^l强TY跑lMh宓:iuFropalwiD.sjxoa哉so勒g•3翊HE=TOErtWlQ.9T4ZBIFn™si:VF2「珥*siumsta'111MzbJed口腴心®既idRmts虹-M.浜SkksiAdmiJii1113143仙Ri!-3fTl='WT博|r菖启ty照j:DCI3K3沁Flglin:二二二VawseProiKrtii"n.wiBCfivsfiiDNFnspatknD.9742Bi双击Workfile菜单下的Range所在行,出现将Workfilestructured对话框,将右侧Observation旁边的数值改为11,然后点击OK,即可用将Workfile的Range以及Sample的Range改为11;双击打开group01序列表格形式,将编辑状态切换为“可编辑”,在X1序列中补充输入X1=35.同样的方法录入X2=20000进行预测在Equation框中,点击"Forecast”,弹出一对话框,在其中为预测的序

列命名,如yf2。点击OK即可用得到预测结果的图形形式,如图4所示。点击Workfile中新出现的序列yf2,可以看到预测值为856.2025(如图5所示)7D0-300-□Series;YF2WcrkiilsPLO5M\Unt^ed|口||曰VjEw|Pr。匚淌7D0-300-□Series;YF2WcrkiilsPLO5M\Unt^ed|口||曰VjEw|Pr。匚淌EctjEikpcrM]Primt|NmeFraezc613.91388562025狒.2254617.9915628.086066?0891662

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论