运筹学 数据模型与决策课件_第1页
运筹学 数据模型与决策课件_第2页
运筹学 数据模型与决策课件_第3页
运筹学 数据模型与决策课件_第4页
运筹学 数据模型与决策课件_第5页
已阅读5页,还剩127页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据模型与决策

西安理工大学工商管理学院12/19/20221数据模型与决策12/16/20221数据模型与决策

DataModelsandDecisions

(DMD)学习内容一数据分析(DataAnalysis)简记:DA二线性规划(LinearProgramming)简记:LP三动态规划(DynamicProgramming)简记:DP四决策分析(DecisionAnalysis)简记:DEA12/19/20222数据模型与决策

预修课程:

线性代数管理学经济学教材:《管理运筹学》韩伯棠12/19/20223预修课程:12/16/20223学习方式1课堂讲授2案例讨论、分析3上机4平时作业5案例报告6考核:平时成绩(20%)+案例成绩(30%)+笔试成绩(50%)上课、实验考勤成绩,作业成绩成绩分析12/19/20224学习方式上课、实验考勤成绩,作业成绩成绩分析12/16/20一、数据分析

12/19/20225一、数据分析

12/16/20225背景

数据分析是研究如何收集、分析数据并从中提取有用信息、知识供决策之用的方法,属于“统计学”科学。由于统计问题涉及的数据量都有一定规模且计算复杂,必须借助统计软件作为分析工具。常用的统计软件(如SAS、SPSS)都是针对统计专业人员编写的,不易掌握,另一方面,非统计专业的学生,在今后的工作环境中运用专业统计软件的机会较少。因此,可充分应用MicrosoftExcel软件。12/19/20226背景数据分析是研究如何收集、分析数据并从中提取有用信息EXCEL软件简介

MicrosoftExcel是一个功能强大、使用灵活方便的电子表格软件,也是最为流行的办公自动化软件,本课程主要利用EXCEL的统计分析功能和丰富的统计图表。

12/19/20227EXCEL软件简介MicrosoftExcel是一主要内容

第一章数值型变量数据分析1.数值型单变量数据分析2.数值型双变量数据分析第二章属性变量数据分析1.单变量属性数据分析2.双变量属性数据分析第三章回归模型及分析1.线性回归2.简单非线性回归3.多元回归

12/19/20228主要内容第一章数值型变量数据分析12/16/20228

第一章数值型变量数据分析

1.1数值型单变量数据分析例1.1某班《DMD》考试成绩如下:808576786793889075666577748381708364966079868071试用相关统计量对成绩进行分析。12/19/20229

第一章数值型变量数据分析

1.1数值型单变量

Excel有3种分析工具用来描述数值型单变量数据:1.描述性统计2.直方图3.排位和百分比排位12/19/202210Excel有3种分析工具用来描述数值型单变量数据:1.描述1.1.1描述性统计

该统计工具提供了反映集中趋势、离散程度以及偏移程度的统计指标共16个。步骤:1)打开“工具”菜单;2)选择“数据分析”;3)选择“描述统计”;4)根据对话框,选择或输入相关数据。C:\MyDocuments\模拟成绩.xls12/19/2022111.1.1描述性统计该统计工具提供了反映集中趋描述统计指标说明:1.平均:一组数据的平均值。

2.中值(中位数):数据序列中位于中间的值。

3.模式(众数):发生次数最多的值。

C:\MyDocuments\模拟成绩.xls

12/19/202212描述统计指标说明:1.平均:一组数据的平均值。12/16/24.标准差:反映数据的离散程度。C:\MyDocuments\模拟成绩.xls12/19/2022134.标准差:反映数据的离散程度。12/16/2022135.峰值(峰态):它是衡量对称分布陡缓程度的指标。当分布较正态分布平坦时,该指标为正;当分布较正态分布陡峭、尖时,该指标为负。12/19/2022145.峰值(峰态):它是衡量对称分布陡缓程度的指标。12/166.偏斜度:它是衡量数据分布不对称程度的指标。

当某些极端值出现在正方向时,称为“向右偏离”;

当某些极端值出现在负方向时,称为“向左偏离”。

12/19/2022156.偏斜度:它是衡量数据分布不对称程度的指标。

当某些极

7.区域(全距):数据中最大值与最小值之差。8.最小值:样本中的最小值。9.最大值:样本中的最大值。10.求和:样本数据的和。11.计数:样本中数据个数。12.最大k值:给出数据中第k个最大值。13.最小k值:给出数据中第k个最小值。C:\MyDocuments\模拟成绩.xls12/19/2022167.区域(全距):数据中最大值与最小值之差。12/16/21.1.2直方图该统计工具提供一张频数分布表和一张直方图。步骤:1)确定直方图的区间个数,填入每个组界值;2)打开“工具”菜单;3)选择“数据分析”;4)选择“直方图”;5)在“直方图”对话框中填入数据。C:\MyDocuments\模拟成绩.xls12/19/2022171.1.2直方图该统计工具提供一张频数分布表和一张直方图。输出图表的修饰:1)单击条块选中图形;2)选择“数据系列格式”;3)在对话框“图案”中,改“区域”为无;4)单击“选项”,改“分类间距”为0;5)单击“确定”。C:\MyDocuments\模拟成绩.xls12/19/202218输出图表的修饰:1)单击条块选中图形;12/16/202211.1.3排位和百分比排位该统计工具提供一张含有升序排列的数据表格以及其排列后的序号、百分位号。步骤:1)打开“工具”菜单;2)选择“数据分析”;3)选择“排位与百分比排位”。4)根据对话框,选择或输入相关数据。数据模型课件\模拟成绩.xls12/19/2022191.1.3排位和百分比排位该统计工具提供一张含有升序排列的练习下列数据为15项资产的出售价格(万元),试用描述性统计、直方图、排位和百分比分析工具进行数据分析:¥26038043631039644837431240634837241839238445212/19/202220练习12/16/2022201.2数值型双变量数据分析对两组数值型数据分析它们之间的相关关系。有两种分析工具。1.散点图2.相关系数12/19/2022211.2数值型双变量数据分析对两组数值型数据分析它们之间的相例1.2某公司欲调查办公楼的租金和空置率间的关系,工作人员在10个不同的城市里,对办公楼中每平方米的月租金和空置率的数据记录如下:试作散点图,并判断两变量间的相关性。城市12345678910空置率311659257108月租金52.54.754.534.5433.252.7512/19/202222例1.2某公司欲调查办公楼的租金和空置率间的关系,工作人员在1.2.1散点图该统计工具用来描述两个变量之间的关系。通常用在直观判断基本关系或用在回归模型使用前。步骤:1)输入变量X和Y的数值;2)选中数据;3)打开“图表向导”;4)对散点图进行编辑。房租模拟.xls房租模拟.xls12/19/2022231.2.1散点图该统计工具用来描述两个变量之间的关系。通常1.2.2相关系数相关系数用来说明两个变量之间的相关密切程度。步骤:1)打开“工具”菜单;2)选择“数据分析”;3)选择“相关系数”。4)根据对话框,选择或输入相关数据。C:\MyDocuments\房租模拟.xls12/19/2022241.2.2相关系数相关系数用来说明两个变量之间的相关密切程相关系数的基本计算公式:两个数列的协方差:自变量数列的标准差:因变量数列的标准差:

12/19/202225相关系数的基本计算公式:12/16/202225相关程度判断标准:1.当r=±1时,X与Y为线性相关;2.当│r│<0.3时,X与Y为微弱相关;3.当0.3≤│r│<0.5时,X与Y为低度相关;4.当0.5≤│r│<0.8时,X与Y为显著相关;5.当0.8≤│r│<1时,X与Y为高度相关。

12/19/202226相关程度判断标准:1.当r=±1时,X与Y为线性相关;1练习下面是10家商店销售额和利润率的资料:(1)画出散点图;(2)计算每人月平均销售额与利润率的相关系数。商店每人月平均销售额(万元)利润率(%)1612.62510.43818.5413.0548.16716.37612.3836.2936.610716.812/19/202227练习下面是10家商店销售额和利润率的资料12/19/20222812/16/202228

2属性变量数据分析

2.1单变量属性数据分析用途:对性别、职称、品牌等属性数据进行分布描述。例2.1对某城市饭店业进行前景调查,问卷数据如下表所示。要求统计出各项数据的分布。

数据包括:业主类型(owner)前途看法(outlook)12/19/202229

2属性变量数据分析

2.1单变量属性数据分12/19/20223012/16/202230步骤:1.打开“数据”菜单;2.选择“数据透视表”,按下一步;3.选择“版式”;4.单击变量“owner”,拖到“行”区域中;5.单击变量“owner”,拖到“数据”区域中;6.双击“求和项”,在“汇总方式”中选择“计数”;7.单击“确定”。C:\MyDocuments\饭店调查.doc12/19/202231步骤:12/16/202231以百分比形式表示统计结果:

1.选中“结果表”中的任一单元格2.打开快捷菜单,选择“字段”3.单击“选项”4.在“数据显示方式”中选择“占总和的百分比”5.单击“确定”C:\MyDocuments\饭店调查.doc12/19/202232以百分比形式表示统计结果:1.选中“结果表”中的任一单元格2.2双变量属性数据分析

—两维表格(列联表)用途:对性别、职称等属性数据进行相关关系描述。

例如统计饭店的前途是否与店主的类型相关。12/19/2022332.2双变量属性数据分析

—两维表格(列联表)用途步骤:1.打开“数据”菜单;2.选择“数据透视表”,按下一步;3.选择“版式”;4.单击变量“Owner”,拖到“行”区域中;5.单击变量“Outlook”,拖到“列”区域中;5.单击变量“Outlook”,拖到“数据”区域中;6.双击“求和项”,在“汇总方式”中选择“计数”;7.单击“确定”。C:\MyDocuments\饭店调查.doc12/19/20223412/16/202234以百分比形式表示统计结果:

1.选中“结果表”中的任一单元格2.打开快捷菜单,选择“字段”3.单击“选项”4.在“数据显示方式”中选择“占同行数据总和的百分比”5.单击“确定”C:\MyDocuments\饭店调查.doc12/19/202235以百分比形式表示统计结果:1.选中“结果表”中的任一单元格3回归分析通常用以确定两个变量之间的线性关系模型,并据此进行预测。根据回归分析方法得出的数学表达式,称为回归方程,它可能是直线方程,也可能是曲线方程。

3.1线性回归3.2简单非线性回归12/19/2022363回归分析通常用以确定两个变例某公司欲调查办公楼的租金和空置率间的关系,工作人员在10个不同的城市里,对办公楼中每平方米的月租金和空置率的数据如下:试求月租金与空置率的关系模型。城市12345678910空置率311659257108月租金52.54.754.534.5433.252.7512/19/202237例某公司欲调查办公楼的租金和空置率间的关系,工作人员在10个3.1线性回归

两个变量之间存在相关关系,而且其相关的紧密程度必须是显著的,直线回归方程的基本形式为:其中:a,b是待定参数,可通过以下方法求出:1.散点图中插入趋势线2.回归分析工具12/19/2022383.1线性回归

两个变量之间存在相关关系,而且其相关的紧密3.1.1散点图中插入趋势线在插入趋势线前必须绘制散点图,如果点近似分布在一直线附近,那么可用简单线性回归方法;如果点近似分布在一曲线附近,那么考虑使用非线性回归方法。12/19/2022393.1.1散点图中插入趋势线在插入趋势线前必须例某公司欲调查办公楼的租金和空置率间的关系,工作人员在10个不同的城市里,对办公楼中每平方米的月租金和空置率的数据如下:试求月租金与空置率的回归模型。城市12345678910空置率311659257108月租金52.54.754.534.5433.252.7512/19/202240例某公司欲调查办公楼的租金和空置率间的关系,工作人员在10个步骤:1)打开“图表”;2)作出散点图;3)点击图中任一数据点;4)在“图表”中选择“添加趋势线”命令;5)单击“线性图”;6)根据对话框,选择或输入相关数据。C:\MyDocuments\房租模拟.xls12/19/202241步骤:12/16/2022413.1.2回归分析工具插入趋势线仅给出了回归线、回归方程及,运用回归分析工具可得到更多的信息。步骤:1)打开“工具”菜单;2)选择“数据分析”;3)选择“回归”。4)根据对话框,选择或输入相关数据。数据模型课件\房租模拟.xls12/19/2022423.1.2回归分析工具插入趋势线仅给出了回归线、回归方程及关于回归分析的说明:

用于衡量回归方程式优良性的工具通常是以下几种:

1.标准误差

用来说明回归方程代表性的大小。其中:y是因变量实际值,是根据回归方程推算出来的因变量估计值。从计算公式可以看出,标准误差实际上是一个平均误差。数值越大,说明所有点离回归线越远,则回归方程的代表性越小;数值越小,说明所有点越靠近回归线,则回归方程的代表性越大。12/19/202243关于回归分析的说明:

用于衡量回归方程式优良性的工具通2.判定系数反映自变量与因变量之间线性关系的强弱程度。记实际值y的总变差为:

回归变差为:则:该公式说明了回归误差占总误差的百分比,数值越大,表明总误差中由回归方程来解释的部分也越大,即所有点越接近于回归直线。12/19/20224412/16/2022443.2简单非线性回归变量之间的相互关系呈某种曲线型,此时,不能用直线回归方程,需要选择适当的曲线模型,进行非线性回归分析。常用的非线性回归模型有:对数、乘幂、指数、多项式等。1.散点图中插入趋势线2.回归分析工具12/19/2022453.2简单非线性回归变量之间的相互关系呈某3.2.1散点图中插入趋势线绘制散点图是很关键的一步,有助于我们确定变量之间存在何种非线性关系。图形向左上凸起,可能存在乘幂关系(x>1)或对数关系;图形向左下凸起,可能存在乘幂关系,或对数关系,或指数关系;图形向右下凸起,可能存在乘幂关系或指数关系。12/19/2022463.2.1散点图中插入趋势线绘制散点图是很关例某公司在8个城市试行不同广告费的空调促销,下表中是各城市广告费(万元)与销售率(每千人为基准):1)绘制散点图;2)插入趋势线。数据模型课件\空调销售.xls城市12345678910广告费20283035384043454647销售率1.93.24.34.84.05.04.54.64.684.7212/19/202247例某公司在8个城市试行不同广告费的空调促销,下表中是各城市广步骤:1)打开“图表”;2)作出散点图;3)点击图中任一数据点;4)在“图表”中选择“添加趋势线”命令;5)单击“类型”标签,选择合适的图形。6)单击“选项”标签,选择“显示公式”和“显示R平方值”。数据模型课件\空调销售.xls12/19/202248步骤:12/16/202248非线性回归模型类型1:对数模型为:y=a+b*Ln(x)其中:Ln(x)是自然对数,以e=2.718为底数。依据对数定义,自变量的数据必须大于零。本例中,选择对数模型,插入趋势线后可得到如下结果。12/19/202249非线性回归模型类型1:对数模型为:y=a+b*Ln(x)非线性回归模型类型2:乘幂模型为:本例中,选择乘幂模型,插入趋势线后可得到如下结果。12/19/202250非线性回归模型类型2:乘幂模型为:12/16/202250非线性回归模型类型3:指数模型为:12/19/202251非线性回归模型类型3:指数模型为:12/16/202251例某公司在8个城市试行不同售价的空调促销,下表中是各城市售价(千元)与销售率(每千人为基准):1)绘制散点图;2)插入趋势线。数据模型课件\空调(售价)销售.xls城市12345678Price2.12.32.42.52.62.72.93.0SalesRate4.64.55.04.04.84.33.21.912/19/202252例某公司在8个城市试行不同售价的空调促销,下表中是各城市售价本例中,选择指数模型,插入趋势线后可得到如下结果。12/19/202253本例中,选择指数模型,插入趋势线后可得到如下结果。12/163.2.2回归分析工具插入趋势线仅给出了回归线、回归方程及,运用回归分析工具可得到更多的信息。步骤:1)打开“工具”菜单;2)选择“数据分析”;3)选择“回归”。12/19/2022543.2.2回归分析工具插入趋势线仅给出了回归线、回归方程及非线性回归模型类型1:对数模型为:y=a+b*Ln(x)例3.1中,先对变量x求其ln(x),再选择“数据分析”,单击“回归”后可得到如下结果。12/19/202255非线性回归模型类型1:对数模型为:y=a+b*Ln(x)12非线性回归模型类型2:乘幂模型为:EXCEL在确定拟合关系时,需要进行对数转换,Ln(y)=Ln(a)+b*Ln(x)以此转为线性形式。例3.1中,选择“数据分析”,单击“回归”后可得到如下结果。12/19/202256非线性回归模型类型2:乘幂模型为:12/16/202256非线性回归模型类型3:指数模型为:EXCEL在确定拟合关系时,需要进行对数转换,Ln(y)=Ln(a)+bx以此转为线性形式。例3.2中,选择“数据分析”,单击“回归”后可得到如下结果。12/19/202257非线性回归模型类型3:指数模型为:12/16/202257练习:某公司在16个城市试行不同售价的电视机促销,下表中是各城市售价(千元)与销售率(每千人为基准):price1250119512001225123012751300132513501375Salesrate0.951.050.981.21.10.900.80.750.700.65price1190118512151235126512701380139014001410Salesrate0.91.051.150.980.930.880.600.580.500.401.绘制散点图,插入趋势线,给出公式和R平方值。2.运用回归分析工具,给出公式和R平方值。3.已知某一市场电视机售价为1430元,试预测销售率。12/19/202258练习:某公司在16个城市试行不同售价的电视机促销,下表中是各第四章时间序列分析

从连续性的历史资料中找出经济现象的发展规律,并据此预测其未来的发展趋势。1.移动平均法

2.指数平滑法12/19/202259第四章时间序列分析从连续性的历史资料中找出经4.1移动平均法移动平均法是对原有的数列,按顺序和相等时间间隔逐步移动地计算动态平均数,然后把计算出的结果排成新的数列,目的是消除偶然因素影响的波动,揭示经济现象的固有发展趋势及规律。12/19/2022604.1移动平均法移动平均法是对原有的数列,按顺序和相移动平均法可分为一次移动平均法和二次移动平均法。一次移动平均法:x1,x2,….xm是m个历史数据,n是时间间隔(如n=3),也就是移动平均期数,则一次动态平均数为:12/19/202261移动平均法可分为一次移动平均法和二次移动平均法例:某食品厂2000年1至12月份的销售额如下表:试预测次年1月份的销售额。时期月1234567891011121次年销售额万元33343734414450464752455512/19/202262例:某食品厂2000年1至12月份的销售额如下表:时期123方法:1).用趋势线作移动平均

2).用数据分析工具作移动平均12/19/202263方法:1).用趋势线作移动平均

2).用数据分析工具作移动平1)用趋势线作移动平均步骤:1)打开“图表”;2)作出散点图;3)点击图中任一数据点;4)在“图表”中选择“添加趋势线”命令;5)单击“类型”标签,选择移动平均的图形。6)“周期”栏选定为3,单击“确定”。食品厂销售额.xls12/19/2022641)用趋势线作移动平均步骤:12/16/202264某食品厂销售额预测分析表时期(月)销售额(万元)三个月平均趋势值五个月平均趋势值13323433743434.6754135.064437.3335.875039.6738.084645.041.294746.6743.0105247.6745.6114548.3347.8125548.048.01(次年)50.6749.012/19/202265某食品厂销售额预测分析表时期(月)销售额(万元)三个月平均趋2)用数据分析工具作移动平均

步骤:1)打开“工具”菜单;2)选择“数据分析”;3)选择“移动平均”。12/19/2022662)用数据分析工具作移动平均

步骤:12/16/20数据模型与决策

西安理工大学工商管理学院12/19/202267数据模型与决策12/16/20221数据模型与决策

DataModelsandDecisions

(DMD)学习内容一数据分析(DataAnalysis)简记:DA二线性规划(LinearProgramming)简记:LP三动态规划(DynamicProgramming)简记:DP四决策分析(DecisionAnalysis)简记:DEA12/19/202268数据模型与决策

预修课程:

线性代数管理学经济学教材:《管理运筹学》韩伯棠12/19/202269预修课程:12/16/20223学习方式1课堂讲授2案例讨论、分析3上机4平时作业5案例报告6考核:平时成绩(20%)+案例成绩(30%)+笔试成绩(50%)上课、实验考勤成绩,作业成绩成绩分析12/19/202270学习方式上课、实验考勤成绩,作业成绩成绩分析12/16/20一、数据分析

12/19/202271一、数据分析

12/16/20225背景

数据分析是研究如何收集、分析数据并从中提取有用信息、知识供决策之用的方法,属于“统计学”科学。由于统计问题涉及的数据量都有一定规模且计算复杂,必须借助统计软件作为分析工具。常用的统计软件(如SAS、SPSS)都是针对统计专业人员编写的,不易掌握,另一方面,非统计专业的学生,在今后的工作环境中运用专业统计软件的机会较少。因此,可充分应用MicrosoftExcel软件。12/19/202272背景数据分析是研究如何收集、分析数据并从中提取有用信息EXCEL软件简介

MicrosoftExcel是一个功能强大、使用灵活方便的电子表格软件,也是最为流行的办公自动化软件,本课程主要利用EXCEL的统计分析功能和丰富的统计图表。

12/19/202273EXCEL软件简介MicrosoftExcel是一主要内容

第一章数值型变量数据分析1.数值型单变量数据分析2.数值型双变量数据分析第二章属性变量数据分析1.单变量属性数据分析2.双变量属性数据分析第三章回归模型及分析1.线性回归2.简单非线性回归3.多元回归

12/19/202274主要内容第一章数值型变量数据分析12/16/20228

第一章数值型变量数据分析

1.1数值型单变量数据分析例1.1某班《DMD》考试成绩如下:808576786793889075666577748381708364966079868071试用相关统计量对成绩进行分析。12/19/202275

第一章数值型变量数据分析

1.1数值型单变量

Excel有3种分析工具用来描述数值型单变量数据:1.描述性统计2.直方图3.排位和百分比排位12/19/202276Excel有3种分析工具用来描述数值型单变量数据:1.描述1.1.1描述性统计

该统计工具提供了反映集中趋势、离散程度以及偏移程度的统计指标共16个。步骤:1)打开“工具”菜单;2)选择“数据分析”;3)选择“描述统计”;4)根据对话框,选择或输入相关数据。C:\MyDocuments\模拟成绩.xls12/19/2022771.1.1描述性统计该统计工具提供了反映集中趋描述统计指标说明:1.平均:一组数据的平均值。

2.中值(中位数):数据序列中位于中间的值。

3.模式(众数):发生次数最多的值。

C:\MyDocuments\模拟成绩.xls

12/19/202278描述统计指标说明:1.平均:一组数据的平均值。12/16/24.标准差:反映数据的离散程度。C:\MyDocuments\模拟成绩.xls12/19/2022794.标准差:反映数据的离散程度。12/16/2022135.峰值(峰态):它是衡量对称分布陡缓程度的指标。当分布较正态分布平坦时,该指标为正;当分布较正态分布陡峭、尖时,该指标为负。12/19/2022805.峰值(峰态):它是衡量对称分布陡缓程度的指标。12/166.偏斜度:它是衡量数据分布不对称程度的指标。

当某些极端值出现在正方向时,称为“向右偏离”;

当某些极端值出现在负方向时,称为“向左偏离”。

12/19/2022816.偏斜度:它是衡量数据分布不对称程度的指标。

当某些极

7.区域(全距):数据中最大值与最小值之差。8.最小值:样本中的最小值。9.最大值:样本中的最大值。10.求和:样本数据的和。11.计数:样本中数据个数。12.最大k值:给出数据中第k个最大值。13.最小k值:给出数据中第k个最小值。C:\MyDocuments\模拟成绩.xls12/19/2022827.区域(全距):数据中最大值与最小值之差。12/16/21.1.2直方图该统计工具提供一张频数分布表和一张直方图。步骤:1)确定直方图的区间个数,填入每个组界值;2)打开“工具”菜单;3)选择“数据分析”;4)选择“直方图”;5)在“直方图”对话框中填入数据。C:\MyDocuments\模拟成绩.xls12/19/2022831.1.2直方图该统计工具提供一张频数分布表和一张直方图。输出图表的修饰:1)单击条块选中图形;2)选择“数据系列格式”;3)在对话框“图案”中,改“区域”为无;4)单击“选项”,改“分类间距”为0;5)单击“确定”。C:\MyDocuments\模拟成绩.xls12/19/202284输出图表的修饰:1)单击条块选中图形;12/16/202211.1.3排位和百分比排位该统计工具提供一张含有升序排列的数据表格以及其排列后的序号、百分位号。步骤:1)打开“工具”菜单;2)选择“数据分析”;3)选择“排位与百分比排位”。4)根据对话框,选择或输入相关数据。数据模型课件\模拟成绩.xls12/19/2022851.1.3排位和百分比排位该统计工具提供一张含有升序排列的练习下列数据为15项资产的出售价格(万元),试用描述性统计、直方图、排位和百分比分析工具进行数据分析:¥26038043631039644837431240634837241839238445212/19/202286练习12/16/2022201.2数值型双变量数据分析对两组数值型数据分析它们之间的相关关系。有两种分析工具。1.散点图2.相关系数12/19/2022871.2数值型双变量数据分析对两组数值型数据分析它们之间的相例1.2某公司欲调查办公楼的租金和空置率间的关系,工作人员在10个不同的城市里,对办公楼中每平方米的月租金和空置率的数据记录如下:试作散点图,并判断两变量间的相关性。城市12345678910空置率311659257108月租金52.54.754.534.5433.252.7512/19/202288例1.2某公司欲调查办公楼的租金和空置率间的关系,工作人员在1.2.1散点图该统计工具用来描述两个变量之间的关系。通常用在直观判断基本关系或用在回归模型使用前。步骤:1)输入变量X和Y的数值;2)选中数据;3)打开“图表向导”;4)对散点图进行编辑。房租模拟.xls房租模拟.xls12/19/2022891.2.1散点图该统计工具用来描述两个变量之间的关系。通常1.2.2相关系数相关系数用来说明两个变量之间的相关密切程度。步骤:1)打开“工具”菜单;2)选择“数据分析”;3)选择“相关系数”。4)根据对话框,选择或输入相关数据。C:\MyDocuments\房租模拟.xls12/19/2022901.2.2相关系数相关系数用来说明两个变量之间的相关密切程相关系数的基本计算公式:两个数列的协方差:自变量数列的标准差:因变量数列的标准差:

12/19/202291相关系数的基本计算公式:12/16/202225相关程度判断标准:1.当r=±1时,X与Y为线性相关;2.当│r│<0.3时,X与Y为微弱相关;3.当0.3≤│r│<0.5时,X与Y为低度相关;4.当0.5≤│r│<0.8时,X与Y为显著相关;5.当0.8≤│r│<1时,X与Y为高度相关。

12/19/202292相关程度判断标准:1.当r=±1时,X与Y为线性相关;1练习下面是10家商店销售额和利润率的资料:(1)画出散点图;(2)计算每人月平均销售额与利润率的相关系数。商店每人月平均销售额(万元)利润率(%)1612.62510.43818.5413.0548.16716.37612.3836.2936.610716.812/19/202293练习下面是10家商店销售额和利润率的资料12/19/20229412/16/202228

2属性变量数据分析

2.1单变量属性数据分析用途:对性别、职称、品牌等属性数据进行分布描述。例2.1对某城市饭店业进行前景调查,问卷数据如下表所示。要求统计出各项数据的分布。

数据包括:业主类型(owner)前途看法(outlook)12/19/202295

2属性变量数据分析

2.1单变量属性数据分12/19/20229612/16/202230步骤:1.打开“数据”菜单;2.选择“数据透视表”,按下一步;3.选择“版式”;4.单击变量“owner”,拖到“行”区域中;5.单击变量“owner”,拖到“数据”区域中;6.双击“求和项”,在“汇总方式”中选择“计数”;7.单击“确定”。C:\MyDocuments\饭店调查.doc12/19/202297步骤:12/16/202231以百分比形式表示统计结果:

1.选中“结果表”中的任一单元格2.打开快捷菜单,选择“字段”3.单击“选项”4.在“数据显示方式”中选择“占总和的百分比”5.单击“确定”C:\MyDocuments\饭店调查.doc12/19/202298以百分比形式表示统计结果:1.选中“结果表”中的任一单元格2.2双变量属性数据分析

—两维表格(列联表)用途:对性别、职称等属性数据进行相关关系描述。

例如统计饭店的前途是否与店主的类型相关。12/19/2022992.2双变量属性数据分析

—两维表格(列联表)用途步骤:1.打开“数据”菜单;2.选择“数据透视表”,按下一步;3.选择“版式”;4.单击变量“Owner”,拖到“行”区域中;5.单击变量“Outlook”,拖到“列”区域中;5.单击变量“Outlook”,拖到“数据”区域中;6.双击“求和项”,在“汇总方式”中选择“计数”;7.单击“确定”。C:\MyDocuments\饭店调查.doc12/19/202210012/16/202234以百分比形式表示统计结果:

1.选中“结果表”中的任一单元格2.打开快捷菜单,选择“字段”3.单击“选项”4.在“数据显示方式”中选择“占同行数据总和的百分比”5.单击“确定”C:\MyDocuments\饭店调查.doc12/19/2022101以百分比形式表示统计结果:1.选中“结果表”中的任一单元格3回归分析通常用以确定两个变量之间的线性关系模型,并据此进行预测。根据回归分析方法得出的数学表达式,称为回归方程,它可能是直线方程,也可能是曲线方程。

3.1线性回归3.2简单非线性回归12/19/20221023回归分析通常用以确定两个变例某公司欲调查办公楼的租金和空置率间的关系,工作人员在10个不同的城市里,对办公楼中每平方米的月租金和空置率的数据如下:试求月租金与空置率的关系模型。城市12345678910空置率311659257108月租金52.54.754.534.5433.252.7512/19/2022103例某公司欲调查办公楼的租金和空置率间的关系,工作人员在10个3.1线性回归

两个变量之间存在相关关系,而且其相关的紧密程度必须是显著的,直线回归方程的基本形式为:其中:a,b是待定参数,可通过以下方法求出:1.散点图中插入趋势线2.回归分析工具12/19/20221043.1线性回归

两个变量之间存在相关关系,而且其相关的紧密3.1.1散点图中插入趋势线在插入趋势线前必须绘制散点图,如果点近似分布在一直线附近,那么可用简单线性回归方法;如果点近似分布在一曲线附近,那么考虑使用非线性回归方法。12/19/20221053.1.1散点图中插入趋势线在插入趋势线前必须例某公司欲调查办公楼的租金和空置率间的关系,工作人员在10个不同的城市里,对办公楼中每平方米的月租金和空置率的数据如下:试求月租金与空置率的回归模型。城市12345678910空置率311659257108月租金52.54.754.534.5433.252.7512/19/2022106例某公司欲调查办公楼的租金和空置率间的关系,工作人员在10个步骤:1)打开“图表”;2)作出散点图;3)点击图中任一数据点;4)在“图表”中选择“添加趋势线”命令;5)单击“线性图”;6)根据对话框,选择或输入相关数据。C:\MyDocuments\房租模拟.xls12/19/2022107步骤:12/16/2022413.1.2回归分析工具插入趋势线仅给出了回归线、回归方程及,运用回归分析工具可得到更多的信息。步骤:1)打开“工具”菜单;2)选择“数据分析”;3)选择“回归”。4)根据对话框,选择或输入相关数据。数据模型课件\房租模拟.xls12/19/20221083.1.2回归分析工具插入趋势线仅给出了回归线、回归方程及关于回归分析的说明:

用于衡量回归方程式优良性的工具通常是以下几种:

1.标准误差

用来说明回归方程代表性的大小。其中:y是因变量实际值,是根据回归方程推算出来的因变量估计值。从计算公式可以看出,标准误差实际上是一个平均误差。数值越大,说明所有点离回归线越远,则回归方程的代表性越小;数值越小,说明所有点越靠近回归线,则回归方程的代表性越大。12/19/2022109关于回归分析的说明:

用于衡量回归方程式优良性的工具通2.判定系数反映自变量与因变量之间线性关系的强弱程度。记实际值y的总变差为:

回归变差为:则:该公式说明了回归误差占总误差的百分比,数值越大,表明总误差中由回归方程来解释的部分也越大,即所有点越接近于回归直线。12/19/202211012/16/2022443.2简单非线性回归变量之间的相互关系呈某种曲线型,此时,不能用直线回归方程,需要选择适当的曲线模型,进行非线性回归分析。常用的非线性回归模型有:对数、乘幂、指数、多项式等。1.散点图中插入趋势线2.回归分析工具12/19/20221113.2简单非线性回归变量之间的相互关系呈某3.2.1散点图中插入趋势线绘制散点图是很关键的一步,有助于我们确定变量之间存在何种非线性关系。图形向左上凸起,可能存在乘幂关系(x>1)或对数关系;图形向左下凸起,可能存在乘幂关系,或对数关系,或指数关系;图形向右下凸起,可能存在乘幂关系或指数关系。12/19/20221123.2.1散点图中插入趋势线绘制散点图是很关例某公司在8个城市试行不同广告费的空调促销,下表中是各城市广告费(万元)与销售率(每千人为基准):1)绘制散点图;2)插入趋势线。数据模型课件\空调销售.xls城市12345678910广告费20283035384043454647销售率1.93.24.34.84.05.04.54.64.684.7212/19/2022113例某公司在8个城市试行不同广告费的空调促销,下表中是各城市广步骤:1)打开“图表”;2)作出散点图;3)点击图中任一数据点;4)在“图表”中选择“添加趋势线”命令;5)单击“类型”标签,选择合适的图形。6)单击“选项”标签,选择“显示公式”和“显示R平方值”。数据模型课件\空调销售.xls12/19/2022114步骤:12/16/202248非线性回归模型类型1:对数模型为:y=a+b*Ln(x)其中:Ln(x)是自然对数,以e=2.718为底数。依据对数定义,自变量的数据必须大于零。本例中,选择对数模型,插入趋势线后可得到如下结果。12/19/2022115非线性回归模型类型1:对数模型为:y=a+b*Ln(x)非线性回归模型类型2:乘幂模型为:本例中,选择乘幂模型,插入趋势线后可得到如下结果。12/19/2022116非线性回归模型类型2:乘幂模型为:12/16/202250非线性回归模型类型3:指数模型为:12/19/2022117非线性回归模型类型3:指数模型为:12/16/202251例某公司在8个城市试行不同售价的空调促销,下表中是各城市售价(千元)与销售率(每千人为基准):1)绘制散点图;2)插入趋势线。数据模型课件\空调(售价)销售.xls城市12345678Price2.12.32.42.52.62.72.93.0SalesRate4.64.55.04.04.84.33.21.912/19/2022118例某公司在8个城市试行不同售价的空调促销,下表中是各城市售价本例中,选择指数模型,插入趋势线后可得到如下结果。12/19/2022119本例中,选择指数模型,插入趋势线后

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论