第六讲某车企汽车销量预测案例.ppt_第1页
第六讲某车企汽车销量预测案例.ppt_第2页
第六讲某车企汽车销量预测案例.ppt_第3页
第六讲某车企汽车销量预测案例.ppt_第4页
第六讲某车企汽车销量预测案例.ppt_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

某车企汽车年销量预测案例,2019/12/6,信息技术教学中心,1,学习要点,分析方法:-散点图、序列图、线性回归、曲线拟合、非线性回归分析过程转换:计算变量、个案排秩表:设定表统计图:直方图、散点图、序列图描述统计:序列图比较均值:均值回归:线性、曲线估计、非线性回归,2019/12/6,信息技术教学中心,2,案例背景,现有某汽车企业19882001年的汽车销售量数据,如下表所示。为了制定企业的长期市场发展计划,管理者希望能够预测出至2011年的汽车销量。,2019/12/6,信息技术教学中心,3,分析思路与商业理解,本研究的制约因素可用信息量少未来趋势的变化基于以上原因,预测23年内的汽车销量应当是本案例更为合适的研究目标。,2019/12/6,信息技术教学中心,4,数据理解,由于本数据比较简单,因此数据理解的重点可用放在两变量间数据关联趋势的了解上,因此首先使用散点图对数据的变化规律进行观察,步骤如下:选择“图形”“图表构建程序”菜单命令将散点图图标拖入画布将year拖入X轴框,sales拖入Y轴框确定,2019/12/6,信息技术教学中心,5,数据理解,扩展阅读简单地说,散点图在用于回归分析前的预分析时,可提供如下三类关键信息变量之间是否存在数量关联趋势。如果存在关联趋势,那么是线性的,还是曲线的数据中是否存在明显偏离散点图主体较远的散点,它们是否可能在建模时成为强影响点。,2019/12/6,信息技术教学中心,6,数据理解,2019/12/6,信息技术教学中心,7,数据理解,根据散点图的显示19881992年的数据出现异常,因此将在后面建模时把其删除,不再进入后续分析。,2019/12/6,信息技术教学中心,8,筛选数据并进行变量转换,筛选数据:数据选择个案选择“如果条件满足”如果输入“year=1993”继续输出删除未选定个案确定变量转换:转换计算变量目标变量:time数字表达式:$casenum确定,2019/12/6,信息技术教学中心,9,线性回归模型简介,线性回归指的是所有自变量对因变量的影响均呈线性关系,设希望预测因变量y的取值,诸影响因素为自变量1、2、,则自变量和因变量间存在如下关系:=a+11+22+.+,2019/12/6,信息技术教学中心,10,回归模型的适用条件,线性趋势:自变量和因变量的关系是线性的,如果不是,则不能采用线性回归来分析,可以通过散点图来判断。独立性:可表述为因变量y的取值相互独立,之间没有联系。反映到模型中,实际上就是要求残差间相互独立,不存在自相关,否则应当采用自回归模型来分析。这可以用D-W统计量来考察,另外一种常用的工具为自相关和偏相关图,它们比D-W统计量更为直观和敏感。正态性:就自变量的任何一个线性组合,因变量y均服从正态分布。方差齐性:就自变量的任何一个线性组合,因变量y的方差均相同,实质上就是要求残差的方差齐性。,2019/12/6,信息技术教学中心,11,注意:本案例使用回归模型对序列数据进行分析,数据的顺序代表了时间变化的方向,相邻数据间非常容易出现相关性。因此在本案例分析时残差有无相关时必须加以考察的。如果模型的决定系数非常高,自相关趋势非常弱,则问题影响不大,否则应当考虑使用自回归模型来分析。,2019/12/6,信息技术教学中心,12,变量变换后拟合线性回归模型,本案例需要拟合曲线回归模型,但统计学上发展最早最成熟的是线性回归模型,有无办法将其方法体系利用到曲线回归方面去呢?答案非常简单,只要可能通过变量变换,将曲线方程变换为直线方程的形式,即可利用变换后的变量来进行“线性”模型的拟合。拟合方程:=0+1X+22,2019/12/6,信息技术教学中心,13,变量变换,转换计算变量Time2=time*time,2019/12/6,信息技术教学中心,14,二次方曲线直线化拟合,分析回归线性将sales选入“因变量”列表框,将time,time2选入“自变量”列表框确定,2019/12/6,信息技术教学中心,15,01取值,越接近1越好,标准回归系数,分析结果,2019/12/6,信息技术教学中心,16,通过系数表可以写出回归方程如下:销量=138.976-5.998*time+1.821*time2当time=0,即时间为1993-1=1992时,销量的模型估计值为138.976,显然这个数值和实际值差的有点远,因为1993年之前的数据趋势并不服从现在拟合的模型,所以这个估计值没有实际的意义。销量和时间的一次项负相关,二次项正相关。,模型拟合效果的判断,预测模型建立后,模型的预测精度究竟如何是非常关心的问题,除了使用回归模型中的一些诊断指标外,也可以使用针对时间序列预测的一些专门指标加以判断。残差独立性检验:使用“统计量”子对话框中,选中“Durbin-Watson”统计量复选框,结果如下:一般地,若自变量数少于4个,统计量大于2,基本上肯定残差间相互独立。,2019/12/6,信息技术教学中心,17,取值14之间,大于上界则说明残差独立,低于下界则说明相互关联,模型拟合效果的判断,残差分布的图形观察在“绘制”子对话框中,选中“直方图”和“正态概率图”复选框。结果如下:,2019/12/6,信息技术教学中心,18,模型拟合效果的判断,2019/12/6,信息技术教学中心,19,模型拟合效果的判断,绘制残差序列图在“保存”子对话框中,选中“标准化残差”复选框确定依次单击“分析”“预测”“序列图”变量框:选入ZRE_1时间轴标签框:选入year确定,2019/12/6,信息技术教学中心,20,2019/12/6,信息技术教学中心,21,存储预测值和区间估计值,本案例建立模型,不是为了找到年代对销量的影响,而是为了对因变量进行预测,因此需要在数据集中计算出预测值、个体参考值范围等。在“保存”子对话框中,预测值、残差、预测区间等都可以作为新变量存储在数据集中。本例需要预测区间和预测值,相应的操作如下:在数据集中新增三条记录,变量id分别等于10,11,12重复执行“回归”对话框“保存”子对话框,选中“未标准化预测值”、“单值预测区间”两个复选框。,2019/12/6,信息技术教学中心,22,用曲线估计过程同时拟合多个曲线模型,依次单击“分析”“回归”“曲线估计”“因变量”列表框:sales“自变量”列表框:time模型:选中二次项、立方和指数分布选中“显示ANOVA表格”复选框确定,2019/12/6,信息技术教学中心,23,分析结果,2019/12/6,信息技术教学中心,24,三次方,2019/12/6,信息技术教学中心,25,指数,2019/12/6,信息技术教学中心,26,拟合曲线比较图,2019/12/6,信息技术教学中心,27,模型拟合效果的判断,方法一、存储残差值先将模型的残差存为新变量供分析中使用,操作如下:进入“保存”子对话框“保存变量”框:选中“残差”继续再次运行曲线拟合过程,此时会生产ERR_1ERR_3共3个新变量,分别代表二次、三次和指数模型的误差项。为了便于观察可以将他们的变量名标签分别改为二次方程、三次方程和指数方程。,2019/12/6,信息技术教学中心,28,观察模型误差项的序列图,首先绘制3个模型误差项的序列图,以观察随着年代的变化,相应预测误差的变动趋势。如下:依次单击“分析”“预测”“序列图”变量框:选入ERR_1ERR_3时间轴标签框:选入year确定,2019/12/6,信息技术教学中心,29,模型的预测,根据上面的讨论,确定应当使用三次方模型进行预测,并且预测的长度在3年以内比较恰当,为此采取和线性回归相同的操作:在数据集中新增三条记录,变量id分别等于10,11,12,然后再曲线拟合过程中操作依次单击“分析”“回归”“曲线估计”“因变量”列表框:sales“自变量”列表框:time模型:立方“保存”子对话框“保存变量”:选中“预测值”和“预测区间”确定,2019/12/6,信息技术教学中心,30,利用非线性回归进行拟合,非线性回归模型在SPSS中可以采用NLR和CNLR两个过程拟合,前者用于一般的非线性模型,后者用于带约束条件的非线性模型拟合,2019/12/6,信息技术教学中心,31,构建分段回归模型,19931998年基本呈线性趋势,然后在19982001年呈现另外一种线性趋势的模型,用公式表达如下:Sales=01+02*time1993=1998非线性回归模型中可以直接对该分段模型进行拟合,唯一的难点就是模型表达式只能写在一个公式里,具体如下:Sales=(year=1998)*(11+12*time),2019/12/6,信息技术教学中心,32,SPSS中的操作如下:依次单击“分析”“回归”“非线性”“因变量”列表框:sales“自变量”列表框:输入Sales=(year=1998)*(11+12*time)参数:在子对话框中分别将b01、b02、b11和b12的初始值设为1确定,2019/12/6,信息技术教学中心,33,分析结果,2019/12/6,信息技术教学中心,34,不同模型效果比较,进入“保存”子对话框选中“预测值”确定依次单击“分析”“预测”“序列图”“变量”列表框:选入三次方曲线的预测值FIT_1、LCL_1和UCL_1,以及非线性模型的预测值PRED_“时间轴标签”列表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论