已阅读5页,还剩66页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
回归分析与相关分析 1回归与相关的概念和任务 2一元回归分析 3Excel回归分析工具 4多元回归分析 1回归与相关的概念和任务 一 相关关系的概念二 相关关系的种类三 回归分析与相关分析 一 函数关系 二 相关关系 现象之间的相互关系 可以概括为两种不同的类型 函数关系可以用一个确定的公式 即函数式来表示 相关关系 可用如下统计模型表示 例2 根据消费理论 商品需求量Q与商品价格P 居民收入I之间具有相关关系 一 依相关关系所涉及因素的多少 分为单相关与复相关 二 依相关关系的表现形式不同 分为线性相关与非线性相关 三 根据变量之间相互关系的方向 分为正相关和负相关 四 按照变量之间相互关系的密切程度 可分为完全相关 零相关和一般相关 相关关系的种类 相关系数 相关系数是在直线相关条件下说明两个变量间相关关系密切程度的统计分析指标 计算公式为 计算相关系数的公式 了解 简捷公式 掌握了平均值资料使用 掌握了平均值及标准差可使用 相关系数的性质 完全线性相关 完全没有线性相关 低度相关 显著相关 高度相关 回归分析与相关分析 一 回归分析 二 相关分析 三 相关分析与回归分析的关系 回归分析的概念 现实世界中大多数现象表现为相关关系 人们通过大量观察 将现象之间的相关关系抽象概括为函数关系 并用函数形式或模型来描述与推断现象间的具体变动关系 用一个或一组变量的变化来估计与推算另一个变量的变化 这种分析方法称为回归分析 按变量的多少 回归分析可分为一元回归分析和多元回归分析按变量之间关系的形式 回归分析可分为线性回归分析和非线性回归分析 相关分析的概念 1 确定现象之间有无相关关系 以及相关关系的表现形态 2 确定相关关系的密切程度 3 确定相关关系的数字模型 并进行参数估计和拟合优度检验 4 回归预测 并分析估计标准误差 其主要内容包括 1 两者具有互为补充关系通过回归分析可以求出一个估计的回归方程 用来反映变量之间在数量变化上的联系 相关分析通过计算出来的相关指标 反映在回归方程这种固定联系的形式下变量之间联系的密切程度 仅仅进行回归分析 回归方程的有效性便遭到怀疑 而仅仅进行相关分析 便不能由自变量来推断因变量 两者是不可偏废某一方的 1 相关分析与回归分析的联系 2 两者存在计算上的联系 回归分析和相关分析是非常相近的两种分析技术 所计算的指标不但在符号上存在联系 而且可以相互推算 2 相关分析与回归分析的区别 1 两者在关心变量性质上的不同 在回归分析中 必须将变量分为自变量和因变量 以便建立回归方程 也必须将变量分为确定性变量和随机变量 以便研究随机变量的分布以及对其进行统计推断 区分变量的性质是回归分析的前提条件 是回归分析中首先要解决的一个问题 在一元线性相关分析中 只要求变量具有随机性 两个变量具有完全对等的关系 谁对谁相关是无所谓的 它不关心变量之间的因果关系 所关心的仅仅是两个变量联系的紧密程度 倘若改变两个变量的地位也绝不会影响它们的相关关系 因此 所表现出来的相关系数也只有一个 即 2 两者的任务和目的不同 回归分析是根据现象之间关系的特点 运用一定的办法 建立最适合于变量之间关系的回归方程 而且随着变量的变换 回归方程也会随之改变 回归方程是用来反映变量之间数量的平均变动关系 进而对因变量进行估算或预测 相关分析是通过计算相关指标 用来反映回归方程所表明变量之间依存关系的密切程度 是不能进行估算和预测的 3 两者的使用范围不同 回归分析只限于研究数量标志之间或指标之间的数量关系 对于品质标志之间和等级之间的关系在没有数量化之前是无法研究的 相关分析研究范围比回归分析研究的范围要广泛得多 从研究的范围来看 可以说 凡是能够进行回归分析的 都能够也必须进行相关分析 而能够进行相关分析的 却不一定能够或不都需要进行回归分析 回归分析总需要相关分析的帮助 而相关分析却不一定需要回归分析的帮助 相关分析具有独立性 回归分析的主要内容 回归参数估计方程拟合效果评价回归参数的推断 1 回归参数估计 例如 一元线性回归模型 计算a b两个参数 用最小平方法 由得 由此方程组可解出参数a b例如 某种设备11台实际数据如下表 请据以建立回归方程 解 1 根据表中x y数据关系判断 可拟合一元线性模型 y a bx 2 列表计算 x y xy x2 如表中蓝色数字 3 代入计算得出 a 368 65 b 70 124 回归方程为 y 368 65 70 12x 2 方程拟合效果评价 任何一组数据都可以拟合一个回归模型 但这个回归模型并不一定可以用于推断 所以还需要对所拟合的方程进行评价 人们通常使用相关系数描述现象间关系的密切程度 使用估计标准误差来描述方程拟合的程度 使用方差分析评价方程回归的效果 3 回归参数的推断 总体的模型往往只是一种理论假设 还需要利用统计推断原理对其进行参数估计与假设检验 2一元回归分析 一元回归分析包括一元线性回归分析 即直线回归分析 也包括一元非线性回归分析 由于一元线性回归分析所研究的两个变量之间相关形式简单 方法易于掌握 又是多元回归和非线性回归分析的基础 所以首先介绍一元线性回归分析的理论和方法 2 1利用图表进行回归分析2 2回归方程的评价2 3Excel中的回归分析工作表函数2 4利用工作表函数进行回归分析 2 1利用图表进行回归分析 例 近年来国家教育部决定将各高校的后勤社会化 某从事饮食业的企业家认为这是一个很好的投资机会 他得到十组高校人数与周边饭店的季度销售额的数据资料 并想根据高校的数据决策其投资规模 操作过程 打开 简单线性回归 xls 工作簿 选择 饭店 工作表 如下图所示 从 插入 菜单中选择 图表 选项 打开 图表向导 对话框如下图所示 在 图表类型 列表中选择XY散点图 单击 下一步 按钮 在数据区域中输入B2 C11 选择 系列产生在 列 如下图所示 单击 下一步 按钮 打开 图例 页面 取消图例 省略标题 如下图所示 单击 完成 按钮 便得到XY散点图如下图所示 如图1所示 用鼠标激活散点图 把鼠标放在任一数据点上 单击鼠标右键 打开菜单 在菜单栏里选择 添加趋势线 选项 打开趋势线对话框如图2所示 图1 图2 打开 类型 页面 选择 线性 选项 Excel将显示一条拟合数据点的直线 打开 选项 页面如图3所示 在对话框下部选择 显示公式 和 显示R平方值 选项 单击 确定 按钮 便得到趋势回归图如图4所示 图3 图4 观察值y值的波动性表现在两个方面 2 2回归方程的评价 做上下波动 这种波动与自变量x的变动无关 做上下波动 1 y的取值围绕其平均数 2 y的取值围绕回归直线 1 自变量x的变动 2 其它因素 这种波动的原因可以归结为两个影响因素 2 2Excel中的回归分析工作表函数 自学 截距函数INTERCEPT功能 利用已知的x值与y值计算回归直线在y轴的截距 语法结构 INTERCEPT known y s known x s 斜率函数SLOPE功能 返回根据known y s和known x s中的数据点拟合的线性回归直线的斜率 语法结构 SLOPE known y s known x s 判定系数函数RSQ功能 返回根据known y s和known x s中数据点计算得出的Pearson积矩法相关系数的平方 语法结构 RSQ known y s known x s 估计标准误差函数STEYX功能 返回通过线性回归法计算y预测值时所产生的标准误差 标准误差用来度量根据单个x变量计算出的y预测值的误差量 语法结构 STEYX known y s known x s 2 3利用工作表函数进行回归分析 例某企业希望确定其产品制造过程中的每月成本支出与产量之间的关系 以制定生产计划 试根据该企业选择历年的产量 吨 和成本支出 千元 的样本 计算上面四个函数值 操作过程 打开 第11章简单线性回归 xls 工作簿 选择 成本产量 工作表 如下图所示 在单元格A19 A20 A21和A22中分别输入 截距b0 斜率b1 估计标准误差 和 判定系数 在单元格B19中输入公式 INTERCEPT C2 C15 B2 B15 单击回车键 在单元格B20中输入公式 SLOPE C2 C15 B2 B15 单击回车键 在单元格B21中输入公式 STEYX C2 C15 B2 B15 单击回车键 在单元格B22中输入公式 RSQ C2 C15 B2 B15 单击回车键 根据上述计算结果 得每月成本支出与产量之间的回归方程 该方程表明 每月产量每增加1吨 成本支出平均增加2940元 通过计算估计标准误差 知道实际成本与趋势值成本的平均离差为2 3688元 而判定系数告诉我们 在成本的总的变异中 其中 93 44 是可以用产量的变化来解释的 3Excel回归分析工具 3 1回归分析工具的主要内容3 2回归分析工具的应用3 3回归分析工具的输出解释 3 1回归分析工具的主要内容 回归分析工具是通过对一组观察值使用 最小平方法 进行直线拟合 以分析一个或几个自变量对单个因变量的影响方向与影响程度的方法 它是Excel中数据分析工具的一个内容 回归分析的对话框如图5所示 图5 3 2回归分析工具的应用 例某房地产经纪人从政府部门列举的地区中随机抽取了15户居民作为样本 记录了他们的家庭住房面积及其相应的价格 他想确认一下住房面积 平方米 与价格 千元 的关系 并想据此拟合住房价格的回归方程 操作过程 打开 第10章简单线性回归 xls 工作簿 选择 住房 工作表如下图所示 在 工具 菜单中选择 数据分析 选项 打开 数据分析 对话框如下图所示 在 分析工具 列表中选择 回归 选项 单击 确定 按钮 打开 回归 对话框如下图所示 在Y值输入区域中输入C1 C16 在X值输入区域中输入B1 B16 选择 标志 置信度选择95 在 输出选项 中选择 输出区域 在其右边的位置输入 D1 单击 确定 按钮 输出结果如下图所示 Excel的回归分析工具计算简便 但内容丰富 计算结果共分为三个模块 回归统计表方差分析表回归参数 3 3回归分析工具的输出解释 回归统计表包括以下几部分内容 MultipleR 复相关系数R R2的平方根 又称为相关系数 它用来衡量变量x和y之间相关程度的大小 上节例中 R为0 848466 表示二者之间的关系是高度正相关 RSquare 复测定系数R2 用来说明用自变量解释因变量变差的程度 以测量同因变量y的拟合效果 上节例中 复测定系数为0 719894 表明用自变量可解释因变量变差的71 99 1 回归统计表 AdjustedRSquare 调整复测定系数R2 仅用于多元回归才有意义 它用于衡量加入独立变量后模型的拟合程度 当有新的独立变量加入后 即使这一变量同因变量之间不相关 未经修正的R2也要增大 修正的R2仅用于比较含有同一个因变量的各种模型 标准误差 又称为标准回归误差或叫估计标准误差 它用来衡量拟合程度的大小 也用于计算与回归有关的其他统计量 此值越小 说明拟合程度越好 观测值 是指用于估计回归方程的数据的观测值个数 2 方差分析表方差分析表的主要作用是通过F检验来判断回归模型的回归效果 3 回归参数表如下页图所示 回归参数表是表中最后一个部分 图中 回归参数如下 Intercept 截距 0第二 三行 0 截距 和 1 斜率 的各项指标 第二列 回归系数 0 截距 和 1 斜率 的值 第三列 回归系数的标准误差第四列 根据原假设Ho 0 1 0计算的样本统计量t的值 第五列 各个回归系数的p值 双侧 第六列 0和 195 的置信区间的上下限 4多元回归分析 4 1案例研究 销售额与广告媒体的关系4 2回归输出结果解释 案例研究 销售额与广告媒体的关系 例某VCD连锁店非常想知道在电视台做广告与在广播电台做广告哪种媒体更有效 它收集了连锁店各个商店的每月销售额 万元 和每月用在以上两种媒介的广告支出 试问 在显著性水平为0 05的基础上 销售额是否同两种媒介的广告有关 每种媒介上的广告支出额对销售额的影响如何 哪种广告形式带来的成本效益更高 操作过程 打开 第1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 发电机租赁合同模板2024年
- 大学生企业实习就业合同
- 建筑领域农民工劳动合同样本
- 校园一卡通系统合作协议模板
- 刑事案件代理合同范本
- 专业工程项目居间合约合同协议书
- 房屋租赁协议合同书范本
- 二手住宅买卖协议合同
- 房地产合作合同的签订与执行
- 幼儿园办园基本设备清单(参考)
- 2024年山东省青岛中德生态园(青岛国际经济合作区)管委会选聘52人历年(高频重点复习提升训练)共500题附带答案详解
- 2023下半年四川绵阳引进高层次和急需紧缺人才14716人笔试历年典型考题及考点剖析附答案详解
- 二次函数的图象与性质说课稿 人教版
- 《土地利用规划》课件-思政铸魂:规划图里的家国情怀密码-谈家国情怀
- 江苏省第二届数据安全技术应用职业技能竞赛决赛试题库(附答案)
- DL∕T 5362-2018 水工沥青混凝土试验规程
- 期刊编辑的学术期刊内容创新实践考核试卷
- 牙列、牙合与颌位(口腔解剖生理学)
- 2024年中考物理(安徽卷)真题评析
- 2024-2030年中国专业短信行业市场发展趋势与前景展望战略分析报告
- 山洪沟防洪治理工程初步设计报告
评论
0/150
提交评论