版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
模块七相关与回归分析任务1相关关系及相关程度的确定任务2一元线性回归分析任务3多元线性回归分析模块七相关与回归分析2模块七相关与回归分析2知识目标了解相关关系的含义了解相关关系的类型掌握相关类型及相关程度的判断方法能力目标能够正确理解相关关系能够利用Excel绘制散点图、计算相关系数,并正确判断相关关系的类型模块七相关与回归分析2任务引入一家电器销售公司的管理人员认为,每月的销售收入与广告费用有直接关系。公司将近12个月的月销售收入与广告费用(包括电视广告费用和报纸广告费用)数据收集起来,形成了下表,试图通过数据的分析认识它们之间的关系。那么,广告投入费用对月销售收入的影响程度如何呢?到底是电视广告投入对销售收入的影响大,还是报纸广告投入对销售收入的影响大呢?模块七相关与回归分析2月销售收入与广告费用资料单位:万元模块七相关与回归分析2任务分析相关分析主要涉及以下三个问题:什么是相关关系;相关关系有哪些表现形态;用什么方法来判断相关关系的形态以及相关关系的强弱程度。模块七相关与回归分析2相关知识一、相关关系的含义变量之间的关系可以分为两种类型,即函数关系和相关关系。函数关系是指变量之间存在的一种一一对应的确定性关系。相关关系是指变量之间存在的一种不确定的数量关系。模块七相关与回归分析2二、相关关系的种类相关关系的种类模块七相关与回归分析2不同类型的散点图a)完全线性正相关b)完全线性负相关c)不完全线性正相关d)不完全线性负相关模块七相关与回归分析2不同类型的散点图
e)曲线相关f)不存在线性相关模块七相关与回归分析2三、相关关系的判断方法1.散点图散点图(或称相关图)是由坐标及其散点形成的二维数据图。2.相关系数(1)相关系数的定义及取值范围相关系数是说明两个变量之间在线性相关条件下相关关系密切程度的统计分析指标,用r
表示,它的取值范围是0≤|r|≤1。模块七相关与回归分析2在判断变量之间的相关程度时,可参照如下标准:0<|r|<0.3,x
与y
弱线性相关;0.3≤|r|<0.5,x
与y低度线性相关;0.5≤|r|<0.8,x
与y
显著线性相关;0.8≤|r|<1,x
与y
高度线性相关。模块七相关与回归分析2相关程度图示模块七相关与回归分析2(2)相关系数r
的计算定义公式为:实际计算时也可采用公式:式中,n为变量x
和y
的个数,x为变量
x的实际观察值,y
为变量y
的实际观察值。模块七相关与回归分析2任务实施一、数据准备二、利用Excel
绘制散点图1.利用Excel绘制月销售收入y
与电视广告费用x1
的散点图利用“图表导向”绘制散点图的路径:“插入”→“图表”→“散点图”。选择“散点图”对话框,如图所示。首先选择A、B
列的数据,绘制成的散点图如图所示。模块七相关与回归分析2选择图表类型模块七相关与回归分析2月销售收入与电视广告费用散点图2.利用Excel绘制月销售收入y与报纸广告费用x2
的散点图模块七相关与回归分析2三、利用Excel计算相关系数首先将两个变量的数据以两列的形式输入Excel表格,然后执行如下操作:“工具”→“数据分析”→“相关系数”→“相关系数”对话框设置→输出“相关系数”。1.计算电视广告费用x1
与月销售收入y
之间的相关系数2.计算报纸广告费用x2
与月销售收入y
之间的相关系数基于上述分析得出本任务的结论是:报纸广告费用与月销售收入的相关程度较弱;而电视广告费用与月销售收入之间具有高度的正相关关系。模块七相关与回归分析2知识目标了解回归分析解决的问题掌握一元线性回归模型的配合与检验掌握一元线性回归方程的预测能力目标能够利用Excel完成一元线性回归过程能够准确解释一元线性回归的结果模块七相关与回归分析2任务引入Sdop’NGO公司试图测算特殊地段车流量对坐落在此地商店的年销售额的影响。为此,该公司选定了公司内20家分店,这些商店的共同之处是,能显著影响商店销售额的其他因素(如面积、停车量、周围居民区的人口统计特征等)是相同的。20个店址确定后,Sdop’NGO公司在一个月的时间内,对每个地点每日的车流量进行记录,而且,通过公司自己的内部记录获得了这20家店12个月的销售总额数据,见表。公司希望建立一个模型来评估这些店址,从中选出能够为公司带来最多销售额的地段。模块七相关与回归分析220家商店的年销售额与每天车流量数据模块七相关与回归分析2任务分析对于具有高度相关关系的变量,我们还需要进一步了解变量之间的数量依存关系,即一个变量取值的变化对另一个变量数值的影响,这就是回归分析解决的问题。具体到本任务就是研究商店周围车流量与商店年销售额之间的数量依存关系,即车流量的增减对商店销售额的数量影响是多少。模块七相关与回归分析2相关知识一、回归分析的含义回归分析是对具有相关关系的变量,根据其相关形式,选择一个合适的回归方程来近似地表现变量之间平均变化程度的一种统计分析方法。回归分析解决的问题,简单地说就是解释、预测和控制。所谓“解释”,就是建立回归方程,精确地解释变量之间的数量依存关系。所谓“预测”,就是通过控制自变量x
的取值范围相应地得到因变量y
的上下限。所谓“控制”,正好相反,是通过限制因变量y
的取值范围得到自变量x
的上下限。模块七相关与回归分析2
模块七相关与回归分析2
模块七相关与回归分析2最小二乘法示意图模块七相关与回归分析2四、拟合优度与显著性检验1.拟合优度回归直线与各观测点的接近程度称为回归直线对数据的拟合优度。各观测点越靠近直线,说明直线对数据的拟合度越好,反之则越差。判定系数和估计标准误差是反映拟合优度的两个指标。模块七相关与回归分析2(1)判定系数判定系数是回归方程拟合优度的测量指标之一,用R2
表示。模块七相关与回归分析2
模块七相关与回归分析2
模块七相关与回归分析22.显著性检验一元线性回归方程的显著性检验包括回归方程的
F
检验和回归系数的t检验。F检验是通过构建F
统计量,检验变量x
和y
之间的线性关系是否显著,线性关系显著意味着通过了检验。F
统计量的计算公式为:
。t检验是通过构建t
统计量,检验自变量x
对因变量y
的影响是否显著,如果通过了
t检验,则说明自变量x
对因变量y
的影响显著,可以用自变量x来解释因变量y
的变化。模块七相关与回归分析2判断方法如下:F检验:SignificanceF<α,表明自变量x
与因变量y
之间有显著的线性关系;SignificanceF>α,没有证据表明自变量x
与因变量y
之间有显著的线性关系。t检验:P-value<α,表明自变量x
对因变量y
的影响是显著的;P-value>α,没有证据表明自变量x
对因变量y
的影响是显著的。模块七相关与回归分析2
模块七相关与回归分析22.区间估计区间估计是利用回归方程,给x
一个特定值x0
,求出y
的一个估计值区间。估计区间的计算公式为:置信区间:预测区间:模块七相关与回归分析2
模块七相关与回归分析2任务实施一、回归分析的准备工作1.将数据录入Excel表格。2.首先通过散点图了解相关关系的形态。3.选择回归分析操作方法。模块七相关与回归分析2二、使用“数据分析”工具进行回归分析的Excel操作回归分析的操作步骤模块七相关与回归分析21.选择回归分析工具选择“工具”→“数据分析”→“回归”→“确定”,如图所示。选择回归分析工具模块七相关与回归分析22.“回归”对话框设置如图所示,在“Y值输入区域”输入变量y
的单元格区域“$C$2:$C$21”(或鼠标选中“C2:C21”);在“X值输入区域”输入变量x的单元格区域“$B$2:$B$21”(或鼠标选中“B2:B21”);在“标志”前不打钩(因为未选中变量x、y
的变量名);在“置信度”前不打钩,系统默认“95%”,若要改变置信度则输入置信水平;在“输出选项”选择“新工作表组”(系统默认);模块七相关与回归分析2在“残差”部分,根据需要打钩,本例不选;“正态分布”选项,本例不选;单击“确定”按钮,可得到回归结果。“回归”对话框设置模块七相关与回归分析23.回归结果输出按设置输出了回归结果的“摘要”部分,如图所示。4.回归结果解释包括回归方程拟合程度的解释、回归方程与回归系数的检验解释。回归分析输出结果1—输出摘要模块七相关与回归分析2知识目标掌握多元线性回归模型的配合与检验能力目标能够利用Excel完成多元回归过程能够对多元回归结果进行解释模块七相关与回归分析2任务引入在模块七任务2中考察影响公司20家分店销售额的因素时,主要分析了平均每天的车流量,实际上,除了车流量这个因素外,其他的因素也会对销售额产生影响。因此,只有综合考虑各种因素才能为公司开店选址提供更多有价值的信息。经过二手资料的收集,获得了20家分店所在地2平方千米内的人口数以及2平方千米内住户的年平均家庭收入资料,见表,销售额是上一年的年销售额,平均每天经过分店的车辆数目根据1个月的实际车流量计算。模块七相关与回归分析220家分店年销售额及影响因素资料模块七相关与回归分析220家分店年销售额及影响因素资料模块七相关与回归分析2任务分析本任务的实质仍然是研究变量之间的数量依存关系。实际应用中,很多情况下需要用多元回归的方法描述多个自变量与一个因变量之间的关系,因此,有必要对多元线性回归做简单介绍。模块七相关与回归分析2相关知识一、多元线性回归模型一个因变量与多个自变量的回归问题属于多元线性回归,当因变量与各个自变量之间呈线性关系时,称为多元线性回归。模块七相关与回归分析2
模块七相关与回归分析2二、回归方程的拟合优度1.多元判定系数R2多元判定系数R2
反映了在因变量y
的变差中由多元回归方程来解释的比例,其计算公式为:为避免因自变量增加而高估自变量对因变量变化的影响,可使用修正的多元判定系数R2a
。式中,n
是样本容量,k
是自变量个数,(n-1)和(n-k-1)分别是总离差平方和与残差平方和的自由度。模块七相关与回归分析2
模块七相关与回归分析2三、回归方程的显著性检验多元回归系数检验是对每个回归系数单独进行检验,如果某个回归系数没有通过检验,就意味着这个自变量对因变量的影响不显著,该自变量也许就不能进入回归模型中。如果k
个自变量中有一个自变量与因变量的线性关系显著,F
检验就能通过,但这并不意味着每个自变量与因变量的线性关系都显著。模块七相关与回归分析2判断方法如下:首先,对回归方程线性关系的检验(即F检验)结果进行判断。F检验:若SignificanceF<α,表明k
个自变量xi
与因变量y
之间有显著的线性关系;若SignificanceF>α,没有证据表明k
个自变量xi
与因变量y
之间有显著的线性关系。其次,对k
个回归系数的检验结果进行判断。模块七相关与回归分析2t检验:若某自变量的P-value值<α,表明该自变量xi
对因变量y
的影响是显著的;若某自变量的P-value值>α,没有证据表明该自变量xi
对因变量y
的影响
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 基于虚拟现实技术的房地产展示系统开发合同(2024版)
- 购物合同范本
- 电梯保养补充合同范例
- 清洗换热器合同范例
- 2024年版办公设备租赁合同2篇
- 2024年度柑橘购销合同及柑橘购销合同争议调解3篇
- 简易版钢材购销合同范文
- 施工合同延期补充协议完整版
- 合同结算的账务处理分录
- 内部承包合同协议书(2024版)
- 部编版七年级语文上册第五单元任务一体会人与动物的关系《猫》课件
- 医科大学2024年12月急危重症护理学作业考核试题答卷
- 提高脓毒性休克患者1h集束化措施落实率
- 环保设施运行维护方案
- 2024年贵州省高考生物真题试卷(含答案解析)
- 辽宁省大连市2023-2024学年高三上学期双基测试(期末考试) 物理 含解析
- 期中测试卷-2024-2025学年统编版语文六年级上册
- 初中语文2024届中考修改病句选择题练习(共15道-附参考答案和解析)
- 8.2金属的化学性质第1课时金属村趣味运动会九年级化学人教版下册
- 工程竣工验收(消防查验)报告消防专项-全套表格
- 构建水利安全生产风险管控六项机制工作指导手册
评论
0/150
提交评论