多元线性回归分析法_第1页
多元线性回归分析法_第2页
多元线性回归分析法_第3页
多元线性回归分析法_第4页
多元线性回归分析法_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

KUNMINGUNIVERSITYOFSCIENCEANDTECHNOLOGY院一系:院一系:专业:年级:学生姓名:学号:任课教师:软测量技术与应用信息工程与自动化学院模式识别与智能系统2011级* *****冯老师2012年6月26日多元线性回归分析法预测商品零售价格一、 引言在市场的经济活动中,经常会遇到某一市场现象的发展和变化取决于几个影响因素的情况,也就是一个因变量和几个自变量有依存关系的情况。而且有时几个影响因素主次难以区分,或者有的因素虽属次要,但也不能略去其作用。例如,某一商品的零售价格既与人口的增长变化有关,也与商品的销售量有关。这时采用一元回归分析预测法进行预测是难以奏效的,需要采用多元回归分析预测法。二、 多元线性回归分析法介绍多元回归分析预测法,是指通过对两上或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。当自变量与因变量之间存在线性关系时,称为多元线性回归分析。1.1多元线性回归的计算模型设y为因变量,X,x,…x为自变量,并且自变量与因变量之间为线性关系时,则多TOC\o"1-5"\h\z1 2k元线性回归模型为:y=b+bx+bxH bx+e0 11 22 kk其中,b为常数项,b,b,…b为回归系数,b为x,x,…x固定时,x每增加一个0 1 2k 1 2 3k 1单位对y的效应,即x对y的偏回归系数;同理如为x,x,…x固定时,x每增加一个单1 2 2 3k 2位对y的效应,即x2对y的偏回归系数,等等。如果两个自变量气x2同一个因变量y呈线相关时,可用二元线性回归模型描述为:y=b+bx+bx+—bx+e0 11 22 kk建立多元性回归模型时,为了保证回归模型具有优良的解释能力和预测效果,应首先注意自变量的选择,其准则是:自变量对因变量必须有显著的影响,并呈密切的线性相关;自变量与因变量之间的线性相关必须是真实的,而不是形式上的;自变量之彰应具有一定的互斥性,即自变量之彰的相关程度不应高于自变量与因变量之因的相关程度;自变量应具有完整的统计数据,其预测值容易确定。1.2多元线性回归模型的检验多元性回归模型与一元线性回归模型一样,在得到参数的最小二乘法的估计值之后,也需要进行必要的检验与评价,以决定模型是否可以应用。(1)拟合程度的测定。与一元线性回归中可决系数R2相对应,多元线性回归中也有多重可决系数R2,它是在因变量的总变化中,由回归方程解释的变动(回归平方和)所占的比重,R2越大,回归方各对样本数据点拟合的程度越强,所有自变量与因变量的关系越密切。计算公式为:N_2 ,人、2£(y-y)£(y-y)R2= =1 2 2£(y-y) £(y-y)其中v(y-y)2=£y2-(b£y+b£"+b£”+b£”)£'J, 0 1122kk其中£(y-y)2=£y2-1(£y)2n(2)回归方程的显著性检验回归方程的显著性检验,即检验整个回归方程的显著性,或者说评价所有自变量与因变量的线性关系是否密切。通常采用F检验,F统计量的计算公式为/人_、2£(y-y)..•••kR」k「=£(y-y)2n-k-1=n-k-1根据给定的显著水平a,自由度(k,n-k-1)查F分布表,得到相应的临界值%,若F>七,则回归方程具有显著意义,回归效果显著;F<七,则回归方程无显著意义,回归效果不显著。三、模型的假设与说明2.1模型的假设(1) 在理想情况下,价格指数问题只与给出的因素一一利率、消费水平有关,我们只选取了一小部分而与其他部分无关。(2) 社会的发展平衡稳定,排除突发事件导致数据的突变。(3) 假设因素之间的联系较小,不存在一个因素的变化导致其他因素的剧烈变化。(4) 所给数据真实据可靠,反应实际情况。表1各因素统计表(数据来源:2008中国统计年鉴)年份199019911992199319941995199619971998年利率9.367.567.5610.0810.0810.088.325.674.59消费水平229.2249.0282.0305.8320.0345.1377.6394.6417.8商品零售价格指数207.7213.7225.2254.9310.2356.1377.8380.8370.9年份199920002001200220032004200520062007年利率2.252.252.251.981.982.252.252.523.46消费水平452.3491.0518.8552.5588.5632.3682.3747.8824.1商品零售价格指数359.8354.4351.6347.0346.7356.4359.3362.9376.7年利率——根据我国各大银行,人民银行、建设银行的随即的记录结果进行的数据处理得至U,一年中利率的调整粗略的取其均值。商品零售价格指数一一价格指数编制由国家统计局城市社会经济调查司组织实施。资料采用抽样调查和重点调查相结合的方法取得,即在全国选择不同经济区域和分布合理的地区,以及有代表性的商品作为样本,对其市场价格进行定期调查,以样本推断总体。商品零售价格指数的计算权数主要根据社会商品零售额资料确定。居民消费水平一一其调查按类别分,计算权数根据近12万户城乡居民家庭消费支出构成确定。四、模型的建立与求解Matlab上的散点图程序如下:>>x1=[9.36,7.56,7.56,10.08,10.08,10.08,8.32,5.67,4.59,2.25,2.25,2.25,1.98,1.98,2.25,2.25,2.52,;>>x2=[229.2,249.0,282.0,305.8,320.0,345.1,377.6,394.6,417.8,452.3,491.0,518.8,552.5,588.5,632.3,682.3,747.8,824.1];>>y=[207.7,213.7,225.2,254.9,310.2,356.1,377.8,380.8,370.9,359.8,354.4,351.6,347.0,346.7,;>>subplot(2,1,1);plot(x1,y,'*');subplot(2,1,2);plot(x2,y,'+')

运行结果如图1所示:4003503002501 23456789 10 114003503002501 23456789 10 11400350300250200I L. 七—+L L七4七七七L七+L4rr+-- 4-—4r•七七 「 rr 「rr200 300 400 500 600 700 800 900图1散点图由图可知:y与七有较明显的线性关系,丽与气则难以确定,做几种尝试,用统计分析决定优劣。设多元线性回归模型为y=。+Px+Px0 11 22X]为1990-2007年的利率,X为1990-2007年的消费水平,y为商品零售价格指数。模型求解的MATLAB程序如下:>>x1=[9.36,7.56,7.56,10.08,10.08,10.08,8.32,5.67,4.59,2.25,2.25,2.25,1.98,1.98,2.25,2.25,2.52,;>>x2=[229.2,249.0,282.0,305.8,320.0,345.1,377.6,394.6,417.8,452.3,491.0,518.8,552.5,588.5,632.3,682.3,747.8,824.1];>>y=[207.7,213.7,225.2,254.9,310.2,356.1,377.8,380.8,370.9,359.8,354.4,351.6,347.0,346.7,;>>x=[ones(18,1)x1'x2'];>>[b,bint,r,rint,stats]=regress(y',x)b=251.2424-2.27540.1908bint=91.9188 410.5661-14.12359.5727-0.0320 0.4136r=-65.9753-67.8489-62.6452-31.752120.838561.949573.443967.170550.386527.379614.59576.4915-5.1527-12.3214-10.3640-17.0038-25.2867-23.9057rint=-153.091921.1412-155.209619.5119-153.330528.0401-123.714160.2099-71.7544113.4315-23.4503147.3494-15.1859162.0737-25.5579159.8989-44.8588145.6319-64.4279119.1870-80.7849109.9763-90.5133103.4964-102.432792.1274-110.031585.3887-108.266887.5388-112.803378.7956-115.303264.7298-98.838951.0276stats=0.44355.97710.0123参数回归结果为P0=251.2424,。广-2.2754,P2=0.1908,对应的置信区间分别为[91.9188,410.5661]、[-14.1235,9.5727]和[-0.0320,0.4136]。其中:b为回归系数估计值;bint为置信区间;stats包括判定系数R2,显著性检验F,概率p;r为残差;rint为置信区间。其中判定系数R2是衡量拟合优度的一个重要指标,它的取值介于0与1之间,R2越接近于1,拟合度越好,反之越差。五、结果分析与预测接上面的程序继续在Matlab中输入指令:>>rcoplot(r,rint)>>set(gca,'Color','w');可得到残差图如图2所示:

ResidualCaseOrderPlot150ooooo0550S.BUQIC&HResidualCaseOrderPlot150ooooo0550S.BUQIC&H-150「--Irrrrrrrr~TOC\o"1-5"\h\z2 4 6 8 10 12 14 16 18CaseNumber图2残差图从残差图可以看出,数据的残差基本上离零点均较近,且残差的置信区间均包含零点,这说明回归模型y=251.2424-2.2754x+0.1908x能较好的符合原始数据。1 2对于若干组具体的数据(x,y.),都可算出回归系数s。,从而得到回归方程。至于y与尤之间是否真的有如回归模型所描述的关系,或者说用所得到的回归模型去拟合实际数据是否有足够好的近似,并不知道。所以必须对模型进行检验。用上述拟合结果,得到 F=5.9771,现在取/=n-2=16;取显著性水平d为0.05,查表可得相应的F分布临界值为F(1,16)=4.4940,显然有F>F(1,16),F检验通过,所以可以用前面的回归方程来0.05 0.05描述年利率及消费水平与商品零售价格指数的关系,置信度为95%。根据以下程序及图得到商品零售价格指数:>>x1=[9.36,7.56,7.56,10.08,10.08,10.08,8.32,5.67,4.59,2.25,2.25,2.25,1.98,1.98,2.25,2.25,2.52,;>>x2=[229.2,249.0,282.0,305.8,320.0,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论