数学建模之回归分析法_第1页
数学建模之回归分析法_第2页
数学建模之回归分析法_第3页
数学建模之回归分析法_第4页
数学建模之回归分析法_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、什么是回归分析冋归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系 的一种统计分析方法。运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元 回归分析和多元回归分析;按照口变量和因变量之间的关系类型,可分为线性回归分析 和非线性冋归分析。如果在冋归分析中,只包括一个自变量和一个因变量,且二者的关 系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如杲回归分析中包括 两个或两个以上的自变量,冃因变量和自变量之间是线性关系,则称为多元线性冋归分 析。回归分析之一多元线性回归模型案例解析多元线性回归,主要是研究一个因变量与多个口变量之间的相关关系

2、,跟一元回归原理差不 多,区别在于影响因素(自变量)更多些而已,例如:一元线性回归方稈 为:y =卩。七卩七£毫无疑问, 多元线性回归方程应该为:y = 00 +01 兀 1 +02兀2 + +0pxp 十£上图中的x1, x2, xp分别代表“自变量” xp截止,代表有p个自变量,如果有“n组样 本,那么这个多元线性回归,将会组成一个矩阵,如下图所示:记刃组样本分别是(兀,兀2,兀严必)(=1,2,),令那么,多元线性冋归方程矩阵形式为:y = xfl + £ .y = z =仃xn1 x2i xi2x22kj x2p ,0 =a9» £ =

3、古£2x«2np丿厲丿其中:8代表随机误差,其中随机误差分为:可解释的误差和不可解释的误差, 随机误差必须满足以下四个条件,多元线性方程才有意义(一元线性方程也一样) 1:服成正太分布,即指:随机误差£必须是服成正太分别的随机变量。2:无偏性假设,即指:期望值为03:同共方差性假设,即指,所有的随机误差变量方差都相等4:独立性假设,即指:所有的随机误差变量都相互独立,可以用协方差解释。今天跟大家一起讨论一下,spss-多元线性回归的具体操作过程,下面以教程教程数据 为例,分析汽车特征与汽车销售暈z间的关系。通过分析汽车特征跟汽车销售量的关系,建 立拟合多元线性回归

4、模型。数据如下图所示:(数据可以先用excel建立再通过spss打开)salesresaletypepriceengine_shorsepowwheelbaswidthlengthcurt16.91916.360021.5001.8140101.267.3172.439.38419.875028.4003.2225108.170.3192.914.11418.22503.2225106.970.6192.08.58829.725042.0003.5210114.671.4196.620.39722255i23.9901.8150102.668.2178.018.78023.555033.950

5、2.8200108.776.1192.01.38039.000062.0004.2310113.074.0198.219.747026.9902.5170107.368-4176.09.23128.675033.4002.8193107.368.5176.017.52736.125038.9002.8193111.470.9188.091.56112.475021.9753.1175109.072.7194.639.35013.740025.3003.8240109.072.7196.227.85120.190031.9653.8205113.874.7206.883.25713.360027

6、.8853.8205112.273.5200.063.72922.525039.8954.6275115.374.5207.215.94327.100044.4754.6275112.275.0201.06.53625.725039.6654.6275108.075.5200.611.18518 225031.0103.0200107.470.3194.814.785146.2255.7255117.577.0201.2145.5199 250013.2602.2115104.167.9180.9135.12611.22516.5353.1170107.069.4190.424.62910.3

7、10018.8903.1175107.572.5200.942.59311.525019.3903.4180110.5727197.9点击“分析”一一回归一一线性一一进入如下图所示的界面:oa 厂家【manufact model modelq新车售价(单位:. 夕4年后二手车售价 cfi vehicle type type 夕 price in thousand. 夕 engine size engi. 夕 horsepower hor. 夕 wheelbase whe. 夕车宽width 夕 车长length& 车净重curb_wgt 夕 fuel capacity fue. 3耗油

8、昼迈丿升mpg 少 cook's distance . 夕 95%lci forlnsa. 夕 95% u clforlnsa. 夕 95% l clforlnsa.因变量p):夕 log-tansfomed sales insales块的上_张v j自变量q):jj vehicle type type 夕 price in thousands price 炉 engine size engine s方法迴):逐步选择变量匡):个案标签(q):| 冷 price in thousands picewls权重旦):i统计量©) 绘制将“销售輦”作为“因变量”拖入因变量框内,将“

9、车长,车宽,耗油率,车净重等10个 自变量拖入自变量框内,如上图所示,在“方法”旁边,选择“逐步”,当然,你也可以 选择其它的方式,如果你选择“进入”默认的方式,在分析结杲屮,将会得到如下图所示的 结果:(所有的自变量,都会强行进入)输入/移去的变量b模型输入的变量移去的变量方法1耗油量迈爲, 车长,price in thousa nds. vehicle type. 车宽,engine size, fuel capacity. wheelbase. 车净重, horsepower输入乳已输入所有谙求的变量。b.因变m: log-transtormed sales如果你选择“逐步”这个方法,将

10、会得到如下图所示的结果:(将会根据预先设定的“f统 计量的概率值进行筛选,最先进入冋归方程的“自变量”应该是跟“因变量”关系最为密 切,贡献最大的,如下图可以看出,车的价格和车轴跟因变量关系最为密切,符合判断条 件的概率值必须小于0.05,当概率值大于等于0.1时将会被剔除)输入/移去的突量已模型输入的变量移去的变量方法1price in thousands步进(准则:f- to-enter 的槪 率 <=.050, f-to-remove 的槪率 >= 100) o2wheelbase步进(准则:f- to-enter 的槪 率 <=.050 y f-to-remove 的

11、槪率 >= 100)。a.因变邑 log-transformed sales“选择变量(e)”框内,我并没有输入数据,如果你需要对某个“自变量”进行条件筛选, 可以将那个白变量,移入“选择变量框”内,有一个前提就是:该变量从未在另一个目标列 表中出现!,再点击“规则”设定相应的“筛选条件”即可,如下图所示:匣线性回归:冈定义选择规则sales値电):等于 不等于小于 小于等于大于thousarids |大于等于!):点击“统计量”弹出如下所示的框,如下所示:在“回归系数”下面勾选“估计,在右侧勾选”模型拟合度“和”共线性诊断“两个选 项,再勾选“个案诊断”再点击“离群值” 一般默认值为“

12、3”,(设定异常值的依据,只有 当残差超过3倍标准差的观测才会被当做异常值)点击继续。提示:共线性检验,如果有两个或两个以上的自变量之间存在线性相关关系,就会产生多重共线性 现象。这时候,用最小二乘法估计的模型参数就会不稳定,回归系数的估计值很容易引起误 导或者导致错误的结论。所以,需要勾选“共线性诊断”来做判断通过容许度可以计算共线性的存在与否?容许度t0l=1-ri平方 或方差膨胀因子(vif): vif=1/1-ri平方,其屮ri平方是用其他自变量预测第i个变量的复相关系数,显然,vif 为tol的倒数,tol的值越小,vif的值越大,自变量xi与其他自变量之间存在共线性的 可能性越大。

13、提供三种处理方法:1:从有共线性问题的变量里删除不重要的变量2:增加样本量或重新抽取样本。3:采用其他方法拟合模型,如领回归法,逐步回归法,主成分分析法。再点击“绘制”选项,如下所示:更线性回归:图、trvs*严生所有部分图edependnt *zpred 吃resid *dresid v.djpred *sresid *sdresid标准化残差图直方图(旦)正态槪率图(旦)"继续取消帮助上图中:dependent因变量) zpred(标准化预测值)zresid(标准化残差) dresid(剔 除残差) adjpred(修正后预测值) srsid(学生化残差)sdresid(学生化剔

14、除残 差)一般我们大部分以“自变量”作为x轴,用“残差”作为y轴,但是,也不要忽略特殊 情况,这里我们以“zpred (标准化预测值)作为“x”轴,分别用“sdresid (血生化剔除 残差)”和“zresid(标准化残差)作为y轴,分别作为两组绘图变量。再点击”保存“按钮,进入如下界面:如上图所示:勾选“距离”下面的“cook距离”选项(cook距离,主要是指:把一个个 案从计算回归系数的样木中剔除时所引起的残差大小,cook距离越大,表明该个案对回归 系数的影响也越大)在“预测区间”勾选“均值”和“单值”点击“继续”按钮,再点击“确定按钮,得到如 下所示的分析结果:(此分析结果,采用的是“

15、逐步法”得到的结果)2 i哇0 cn cjl 5 52btur.304.430.300.4221.1155341.013572agwmo二ao)ko) price in thousands ob官邕崩刪二訶刪“ price in thousands- whee-base o c田whoi lo transformed sa-esanovao2 近湖回 斗 mh iffx辽湖回哇i 115.311153.072| 268.38381.720186.662 | 268.383吉192xx5 cj1i o i57.6561.02781.7201.244sy-r二fo o o bo o oojcoa+

16、0超_wnmo) price in thousands 0 b官邕禺刪-moi price in ihousands- whee-base o c田禺腳 lotransformed sa-es已緋除的变量模型beta intsig.偏相关共线性统计量容差vif最小容差1vehicle type.251a3.854.000.301.9981.002.998engine size,342a4.128.000.320.6111.636.611horsepower.25沪2.062.041.167.2933.417.293wheelbase.356a5.718.000.424.9881.012.988

17、车宽,244a3.517.001.277.8921.121.892车长.308a4.790.000.365.9761.025.976车浄重.346a4.600.000.353.7221.385.722fuel capacity,266a3.687.000.289.8201.219.820耗油量:迈供-.198a-2.584.011-.207.7581.319.7582vehicle type.129b1.928.056.157.8351.197.827engine size.145b1.576.117.128.4452.246.445horsepower.028b.229.819.019.25

18、63.910.256车宽-,025b-.275.784-.023.4702.126.470车长.027b.237.813.020.2903.448.290车浄重.105b1.028.306.084.3652.741.365fuel capacity.002b.024.981.002.4432.259.443耗油量:迈供.01 4b.164.870.014.5591.790.559a. 摸型中的预测变匿(常量).price in thousands。b. 模型中的锁赢ij变量:j常量),price in thousands, wheelbase。c. 因变m: log-transformed s

19、ales系数k模型非标准化系数标准系数tsig.共线性统计量b标准误差试用版容差vif1(常屋)price in thousands4.684-.051.194.006-.55224.0908.104.000.0001.0001.0002(常量)price in thousandswheelbase-1.822-.055.0611.151.006.011-.590.356-1.583-9.4875.718.116.000.000.988.9881.0121.012a.因变昱 log-transformed sales共线性诊断模型维数特征値条件索引方差比例(常量)price in thousa

20、ndswheelbase111.8851.000.06.062.1154.051.94.94212.8471.000.00.02.002.1504.351.01.97.013.00333.412.99.00.99a.因变董 log-transformed sales残差纯计墨'极小値极大値均値标准偏差n预测値-.245405.642043.29052.868512155标准预测値-4.0452.693.002.994155预测値的标准误差.082.354.130.057155调整的预测値-.440425.672143.28907.874840155残差-4.9711132.327782

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论