数据模型与决策概述_第1页
数据模型与决策概述_第2页
数据模型与决策概述_第3页
数据模型与决策概述_第4页
数据模型与决策概述_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据、模型与决策丁邦ingbangjunmba@163.com

第六讲回归模型一名优秀的管理者具有的最重要的技能之一就是洞察商务数据的趋势以及基于这种趋势进行精确预测的能力。依据历史数据及行业趋势,预测销售额、盈利、成本、金融工具和金融产品的价格走势本章介绍一种强有力的基于数据的线性回归预测模型,其目标是建立一个变量(Y=生产成本)与其它相关变量(X1=劳动时间、X2=设备支出、X3=人力成本等)之间变化关系的具体公式。需要掌握Excel或SPSS软件。回归模型例

广告支出与销售额假设John对销售额与广告效果的分析感兴趣,他正在考虑把Apple-Glo产品引进到两个新区域,其中一个区域的广告费用高达200万美元,而另一个区域为150万美元,John想要预测Apple-Glo产品在这两个区域中每个区域第一年销售额的期望值。JohnBrode是J&T产品的营销经理,这是一家大型家用产品制造商,公司推出一种Apple-Glo的新产品,它是一种安全的家用清洁剂该产品已经被引进到东北销售区域,并在最近两年中花费了大量广告活动费用,见下表。广告费用与销售额数据日期区域广告支出(百万)Xi第一年销售额(百万)YiJan-94缅因州1.8104.0Feb-94新罕布什尔州1.268.0Mar-94佛蒙特州0.439.0Apr-94马萨诸塞州0.543.0May-94康涅狄格州2.5134.0Jun-94罗德岛2.5127.0Jul-94纽约州1.587.0Aug-94新泽西州1.277.0Sep-94宾夕法尼亚州1.6102.0Oct-94特拉华州1.065.0Nov-94马里兰州1.5101.0Dec-94西弗吉尼亚州0.746.0Jan-95弗吉尼亚州1.052.0Feb-95俄亥俄州0.833.0广告费用与销售额数据John想了解如下问题:第一年的广告费用和第一年的销售额之间的关系如何?存在与这两个数量值有关的等式吗?如果广告支出为150美元或200美元,那么第一年的销售额的期望值分别为多少?关于销售额估计的可靠性是多少?预测效果如何?广告费用与销售额数据利用Excel绘图功能,画出下列图形广告费用与销售额数据利用Excel回归分析功能,得到预测方程初步结论预测方程为Y=48.597x+13.824;得到x=150万,Y=86.72万;

x=200万,Y=111.02万。R2=0.9296,得出两个结论:一是模型拟合数据的效果是92.96%,话句话说,模型在多大程度上解释了数据呢,答案是92.96%,不能解释的部分为7.04%;另一个结论是,R=0.964,说明广告支出与销售额关系非常密切。一元回归理论对于一个因变量和一个自变量,先考察它们的相关系数r,在Excel中的函数是corr(X,Y)只有相关系数足够大,才去研究它们回归关系回归这个术语是由英国著名统计学家FrancisGalton在19世纪末期研究孩子及他们的父母的身高时提出来的。Galton发现身材高的父母,他们的孩子也高。但这些孩子平均起来并不像他们的父母那样高。对于比较矮的父母情形也类似:他们的孩子比较矮,但这些孩子的平均身高要比他们的父母的平均身高高。Galton把这种孩子的身高向中间值靠近的趋势称之为一种回归效应,而他发展的研究两个数值变量的方法称为回归分析。趋向中间高度的回归孩子身高与父母身高的相关系数有多大男孩成年身高=(父身高+母身高+13)÷2±7.5厘米女孩成年身高=(父身高+母身高-13)÷2±6.0厘米相关系数为0.75

两种趋势的回归模型一元线性回归模型一个自变量的简单线性回归模型可表示为

y=b0+b1

x+e模型中,y是x的线性函数(部分)加上误差项线性部分反映了由于x的变化而引起的y的变化误差e

是随机变量,通常假设服从正态N(0,σ2)b0

和b1称为模型的参数最小二乘法

最小二乘法的几何解释最小二乘解Excel-数据分析-回归回归统计

MultipleR0.964

RSquare0.930

AdjustedRSquare0.924

标准误差9.106

观测值14

方差分析

dfSSMSFSignificanceF

回归分析1.0013130.9413130.94158.352.8433E-08

残差12.00995.0682.92

总计13.0014126.00

Coefficients标准误差tStatP-valueLower95%Upper95%Intercept13.825.582.480.031.6725.98XVariable148.603.8612.580.0040.1857.01输出结果解读相关系数r=0.964,已经足够大,说明X与Y之间有很强的相关性,可以研究回归关系;误差分布N(0,σ2)中的σ=9.106;模型检验:F对应的P值=2.84×10-8<0.05,应该拒绝原假设(注意:原假设是所以系数全为0);系数检验:两个P值分别是0.03和0,说明截距和斜率都显著不等于0;回归方程为Y=13.82+48.6x最后截距的95%区间估计是[1.67,25.98];斜率的95%区间估计是[40.18,57.01]。多元回归模型多个自变量的线性回归模型可表示为

y=b0+b1

x1+b2

x2+…+

bk

xk

+e模型中,y是xi

的线性函数(部分)加上误差项线性部分反映了由于xi

的变化而引起的y的变化误差e

是随机变量,通常假设服从正态N(0,σ2)b0、b1、b2、…,bk称为模型的参数.最小二乘法

最小二乘法的几何解释最小二乘解多元线性回归模型的最小二乘解满足

该解Excel会自动给出。

一个二元回归的例子Excel输出结果Excel输出结果解读回归模型显著性检验回归模型诊断模型的线性性:通过R2的大小检查较高的R2表示线性假设是合适的。不合适合适回归模型诊断误差的正态性:残差的直方图是不是正态不合适合适回归模型诊断异方差性:残差与每个自变量的散点图不合适合适不合适合适回归模型诊断自相关性存在自相关不合适不存在自相关合适回归模型诊断多重共线性分析相关系数表X1与x3存在共线性

X1X2X3X4不良贷款率X11X20.678081X30.848420.585551X40.779600.471930.746481不良贷款率0.828640.741960.684640.499981银行不良贷款率分行编号各项贷

款余额

(x1)本年累计

应收贷款

(x2)基本建设贷

款项目个数

(x3)本年完成固定资产投资额(x4)不良贷款

(y)1.00032.440.582.006.9612.4016.0056.840.713.0010.814.8017.0046.042.984.005.054.5010.009.082.025.0012.4810.3419.0039.534.906.001.011.351.001.351.71..................22.005.982.3510.0027.810.9823.006.856.4414.0042.460.7524.0012.279.8916.0024.834.4825.006.397.5110.0060.721.99银行不良贷款率首先看看相关系数表

列1列2列3列4列5列11列20.678081列30.848420.585551列40.779600.471930.746481列50.828640.741960.684640.499981银行不良贷款率其次,分析是否存在多重共线性,X1与X3可以互相替代,X1与X4也是。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论