运筹学 数据模型与决策_第1页
运筹学 数据模型与决策_第2页
运筹学 数据模型与决策_第3页
运筹学 数据模型与决策_第4页
运筹学 数据模型与决策_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 数据 模型与决策 8/1/20221 数据 模型与决策 Data Models and Decisions ( DMD)学习内容一数据分析(Data Analysis) 简记:DA 二 线性规划(Linear Programming) 简记:LP三 动态规划 (Dynamic Programming) 简记:DP四 决策分析(Decision Analysis) 简记:DEA 8/1/20222预修课程: 线性代数 管理学 经济学教材:管理运筹学韩伯棠8/1/20223学习方式1 课堂讲授2 案例讨论、分析3 上机4 平时作业5 案例报告6 考核: 平时成绩(20%)案例成绩(30%)笔试成

2、绩(50%)上课、实验考勤成绩,作业成绩成绩分析8/1/20224一、数据分析8/1/20225背景 数据分析是研究如何收集、分析数据并从中提取有用信息、知识供决策之用的方法,属于“统计学”科学。 由于统计问题涉及的数据量都有一定规模且计算复杂,必须借助统计软件作为分析工具。 常用的统计软件(如SAS、SPSS)都是针对统计专业人员编写的,不易掌握,另一方面,非统计专业的学生,在今后的工作环境中运用专业统计软件的机会较少。因此,可充分应用 Microsoft Excel软件。8/1/20226EXCEL软件简介 Microsoft Excel是一个功能强大、使用灵活方便的电子表格软件,也是最为

3、流行的办公自动化软件,本课程主要利用EXCEL的统计分析功能和丰富的统计图表。 8/1/20227主要内容 第一章 数值型变量数据分析 1.数值型单变量数据分析 2.数值型双变量数据分析 第二章 属性变量数据分析 1.单变量属性数据分析 2.双变量属性数据分析 第三章 回归模型及分析 1.线性回归 2.简单非线性回归 3.多元回归 8/1/20228第一章 数值型变量数据分析 1.1 数值型单变量数据分析例1.1 某班DMD考试成绩如下:80 85 76 78 67 93 88 90 75 66 65 77 74 83 81 70 83 64 96 60 79 86 80 71试用相关统计量对

4、成绩进行分析。8/1/20229 Excel有3种分析工具用来描述数值型单变量数据:1.描述性统计2.直方图3.排位和百分比排位8/1/2022101.1 .1 描述性统计 该统计工具提供了反映集中趋势、离散程度以及偏移程度的统计指标共16个。步骤: 1)打开“工具”菜单; 2)选择“数据分析”; 3)选择“描述统计”; 4) 根据对话框,选择或输入相关数据。C:My Documents模拟成绩.xls8/1/202211描述统计指标说明:1.平均:一组数据的平均值。 2.中值(中位数):数据序列中位于中间的值。 3.模式(众数):发生次数最多的值。 C:My Documents模拟成绩.xl

5、s 8/1/2022124.标准差:反映数据的离散程度。C:My Documents模拟成绩.xls8/1/2022135.峰值(峰态):它是衡量对称分布陡缓程度的指标。 当分布较正态分布平坦时,该指标为正; 当分布较正态分布陡峭、尖时,该指标为负。8/1/2022146.偏斜度:它是衡量数据分布不对称程度的指标。 当某些极端值出现在正方向时,称为“向右偏离”; 当某些极端值出现在负方向时,称为“向左偏离”。8/1/202215 7.区域(全距):数据中最大值与最小值之差。 8.最小值:样本中的最小值。 9.最大值:样本中的最大值。 10.求和:样本数据的和。 11.计数:样本中数据个数。 1

6、2.最大k值:给出数据中第k个最大值。 13.最小k值:给出数据中第k个最小值。C:My Documents模拟成绩.xls8/1/2022161.1.2 直方图该统计工具提供一张频数分布表和一张直方图。步骤:1)确定直方图的区间个数,填入每个组界值; 2)打开“工具”菜单; 3)选择“数据分析”; 4)选择“直方图”; 5)在“直方图”对话框中填入数据。C:My Documents模拟成绩.xls8/1/202217输出图表的修饰:1)单击条块选中图形;2)选择“数据系列格式”;3)在对话框“图案”中,改“区域”为无;4)单击“选项”,改“分类间距”为0;5)单击“确定”。C:My Docu

7、ments模拟成绩.xls8/1/2022181.1.3 排位和百分比排位该统计工具提供一张含有升序排列的数据表格以及其排列后的序号、百分位号。步骤:1)打开“工具”菜单; 2)选择“数据分析”; 3)选择“排位与百分比排位”。 4) 根据对话框,选择或输入相关数据。数据模型课件模拟成绩.xls8/1/202219练习下列数据为15项资产的出售价格(万元),试用描述性统计、直方图、排位和百分比分析工具进行数据分析: ¥ 260 380 436 310 396 448 374 312 406 348 372 418 392 384 4528/1/2022201.2 数值型双变量数据分析对两组数值

8、型数据分析它们之间的相关关系。有两种分析工具。1.散点图2.相关系数8/1/202221例1.2某公司欲调查办公楼的租金和空置率间的关系,工作人员在10个不同的城市里,对办公楼中每平方米的月租金和空置率的数据记录如下:试作散点图,并判断两变量间的相关性。城市12345678910空置率311659257108月租金52.54.754.534.5433.252.758/1/2022221.2.1 散点图该统计工具用来描述两个变量之间的关系。通常用在直观判断基本关系或用在回归模型使用前。步骤:1)输入变量X和Y的数值; 2)选中数据; 3)打开“图表向导”; 4)对散点图进行编辑。C:My Doc

9、uments房租模拟.xls8/1/2022231.2.2 相关系数相关系数用来说明两个变量之间的相关密切程度。 步骤:1)打开“工具”菜单; 2)选择“数据分析”; 3)选择“相关系数”。 4) 根据对话框,选择或输入相关数据。C:My Documents房租模拟.xls8/1/202224相关系数的基本计算公式:两个数列的协方差:自变量数列的标准差:因变量数列的标准差: 8/1/202225相关程度判断标准:1.当 r= 1时,X与Y为线性相关;2.当r0.3时,X与Y为微弱相关;3.当 0.3r0.5时, X与Y为低度相关;4.当 0.5r0.8时, X与Y为显著相关;5.当 0.8r1

10、时, X与Y为高度相关。8/1/202226练习 下面是10家商店销售额和利润率的资料:(1) 画出散点图; (2)计算每人月平均销售额与利润率的相关系数。商店每人月平均销售额(万元)利润率(%)1612.62510.43818.5413.0548.16716.37612.3836.2936.610716.88/1/2022278/1/202228 2 属性变量数据分析 2.1单变量属性数据分析用途:对性别、职称、品牌等属性数据进行分布描述。例 2.1 对某城市饭店业进行前景调查,问卷数据如下表 所示。要求统计出各项数据的分布。 数据包括:业主类型( owner) 前途看法( outlook)

11、8/1/2022298/1/202230步骤: 1.打开“数据”菜单; 2.选择“数据透视表”,按下一步; 3.选择“版式”; 4.单击变量“owner”,拖到“行”区域中; 5.单击变量“owner”,拖到“数据”区域中; 6.双击“求和项”,在“汇总方式”中选择“计数”; 7.单击“确定”。C:My Documents饭店调查.doc8/1/202231以百分比形式表示统计结果: 1.选中“结果表”中的任一单元格 2.打开快捷菜单,选择“字段” 3.单击“选项” 4.在“数据显示方式”中选择“占总和的百分比” 5.单击“确定”C:My Documents饭店调查.doc8/1/202232

12、2.2 双变量属性数据分析 两维表格(列联表)用途:对性别、职称等属性数据进行相关关系描述。 例如 统计饭店的前途是否与店主的类型相关。8/1/202233步骤:1.打开“数据”菜单; 2.选择“数据透视表”,按下一步; 3.选择“版式”; 4.单击变量“Owner”,拖到“行”区域中; 5.单击变量“Outlook ”,拖到“列”区域中; 5.单击变量“Outlook ”,拖到“数据”区域中; 6.双击“求和项”,在“汇总方式”中选择“计数”; 7.单击“确定”。C:My Documents饭店调查.doc8/1/202234以百分比形式表示统计结果: 1.选中“结果表”中的任一单元格 2.

13、打开快捷菜单,选择“字段” 3.单击“选项” 4.在“数据显示方式”中选择“占同行数据总和的百分比” 5.单击“确定”C:My Documents饭店调查.doc8/1/202235 3 回归分析 通常用以确定两个变量之间的线性关系模型,并据此进行预测。 根据回归分析方法得出的数学表达式, 称为回归方程,它可能是直线方程,也可能是曲线方程。 3.1 线性回归 3.2 简单非线性回归 8/1/202236例某公司欲调查办公楼的租金和空置率间的关系,工作人员在10个不同的城市里,对办公楼中每平方米的月租金和空置率的数据如下:试求月租金与空置率的关系模型。城市12345678910空置率311659

14、257108月租金52.54.754.534.5433.252.758/1/2022373.1 线性回归两个变量之间存在相关关系,而且其相关的紧密程度必须是显著的,直线回归方程的基本形式为:其中:a , b是待定参数,可通过以下方法求出:1.散点图中插入趋势线2.回归分析工具8/1/2022383.1.1散点图中插入趋势线 在插入趋势线前必须绘制散点图,如果点近似分布在一直线附近,那么可用简单线性回归方法;如果点近似分布在一曲线附近,那么考虑使用非线性回归方法。8/1/202239例某公司欲调查办公楼的租金和空置率间的关系,工作人员在10个不同的城市里,对办公楼中每平方米的月租金和空置率的数据

15、如下:试求月租金与空置率的回归模型。城市12345678910空置率311659257108月租金52.54.754.534.5433.252.758/1/202240 步骤: 1)打开“图表”; 2)作出散点图; 3)点击图中任一数据点; 4)在“图表”中选择“添加趋势线”命令; 5)单击“线性图”; 6) 根据对话框,选择或输入相关数据。C:My Documents房租模拟.xls8/1/2022413.1.2 回归分析工具插入趋势线仅给出了回归线、回归方程及 ,运用回归分析工具可得到更多的信息。 步骤: 1) 打开“工具”菜单; 2)选择“数据分析”; 3)选择“回归”。 4) 根据对话

16、框,选择或输入相关数据。数据模型课件房租模拟.xls8/1/202242关于回归分析的说明: 用于衡量回归方程式优良性的工具通常是以下几种: 1.标准误差 用来说明回归方程代表性的大小。其中:y是因变量实际值, 是根据回归方程推算出来的因变量估计值。 从计算公式可以看出,标准误差实际上是一个平均误差。数值越大,说明所有点离回归线越远,则回归方程的代表性越小;数值越小,说明所有点越靠近回归线,则回归方程的代表性越大。8/1/202243 2. 判定系数 反映自变量与因变量之间线性关系的强弱程度。记实际值y的总变差为: 回归变差为: 则 : 该公式说明了回归误差占总误差的百分比,数值越大,表明总误

17、差中由回归方程来解释的部分也越大,即所有点越接近于回归直线。8/1/2022443.2 简单非线性回归 变量之间的相互关系呈某种曲线型,此时,不能用直线回归方程,需要选择适当的曲线模型,进行非线性回归分析。 常用的非线性回归模型有:对数、乘幂、指数、多项式等。1.散点图中插入趋势线2.回归分析工具8/1/2022453.2 .1散点图中插入趋势线 绘制散点图是很关键的一步,有助于我们确定变量之间存在何种非线性关系。 图形向左上凸起,可能存在乘幂关系(x1)或对数关系; 图形向左下凸起,可能存在乘幂关系,或对数关系,或指数关系; 图形向右下凸起,可能存在乘幂关系或指数关系。8/1/202246例

18、某公司在8个城市试行不同广告费的空调促销,下表中是各城市广告费(万元)与销售率(每千人为基准):1)绘制散点图;2)插入趋势线。数据模型课件空调销售.xls 城市12345678910广告费20283035384043454647销售率1.93.24.34.84.05.04.54.64.684.728/1/202247 步骤: 1)打开“图表”; 2)作出散点图; 3)点击图中任一数据点; 4)在“图表”中选择“添加趋势线”命令; 5)单击“类型”标签,选择合适的图形。 6)单击“选项”标签,选择“显示公式”和“显示R平方 值”。 数据模型课件空调销售.xls8/1/202248非线性回归模型

19、类型1:对数 模型为:y=a+b*Ln(x) 其中: Ln(x)是自然对数,以e=2.718为底数。 依据对数定义,自变量的数据必须大于零。 本例中,选择对数模型,插入趋势线后可得到如下结果。8/1/202249非线性回归模型类型2:乘幂模型为:本例中,选择乘幂模型,插入趋势线后可得到如下结果。8/1/202250非线性回归模型类型3:指数模型为:8/1/202251例某公司在8个城市试行不同售价的空调促销,下表中是各城市售价(千元)与销售率(每千人为基准):1)绘制散点图;2)插入趋势线。数据模型课件空调(售价)销售.xls 城市12345678Price2.12.32.42.52.62.7

20、2.93.0SalesRate4.64.55.04.04.84.33.21.98/1/202252本例中,选择指数模型,插入趋势线后可得到如下结果。8/1/2022533.2.2 回归分析工具插入趋势线仅给出了回归线、回归方程及 ,运用回归分析工具可得到更多的信息。 步骤: 1) 打开“工具”菜单; 2)选择“数据分析”; 3)选择“回归”。8/1/202254非线性回归模型类型1:对数模型为:y=a+b*Ln(x)例3.1中,先对变量x求其ln(x), 再选择“数据分析”,单击“回归”后可得到如下结果。8/1/202255非线性回归模型类型2:乘幂模型为:EXCEL在确定拟合关系时,需要进行

21、对数转换, Ln(y)=Ln(a)+b*Ln(x) 以此转为线性形式。例3.1中,选择“数据分析”,单击“回归”后可得到如下结果。8/1/202256非线性回归模型类型3:指数模型为:EXCEL在确定拟合关系时,需要进行对数转换, Ln(y)=Ln(a)+bx以此转为线性形式。例3.2中,选择“数据分析”,单击“回归”后可得到如下结果。8/1/202257练习:某公司在16个城市试行不同售价的电视机促销,下表中是各城市售价(千元)与销售率(每千人为基准):price1250119512001225123012751300132513501375Sales rate0.951.050.981.21.10.900.80.750.700.65price1190118512151235126512701380139014001410Sales rate0.91.051.150.980.930.880.600.580.500.401.绘制散点图,插入趋势线,给出公式和R平方值。2.运用回归分析工具,给出公式和R平方值。3.已知某一市场电视机售价为1430元,试预测销售率。8/1/202258第四章 时间序列分析 从连续性的历史资料中找出经济现象的发展规律,并据此预测其未来的发展趋势。1.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论