




已阅读5页,还剩85页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
11 3变量间的相关关系 统计案例 第十一章统计与统计案例 基础知识自主学习 课时作业 题型分类深度剖析 内容索引 基础知识自主学习 1 两个变量的线性相关 1 正相关在散点图中 点散布在从到的区域 对于两个变量的这种相关关系 我们将它称为正相关 2 负相关在散点图中 点散布在从到的区域 两个变量的这种相关关系称为负相关 3 线性相关关系 回归直线如果散点图中点的分布从整体上看大致在 就称这两个变量之间具有线性相关关系 这条直线叫做回归直线 知识梳理 左下角 右上角 左上角 右下角 一条直线附近 2 回归方程 1 最小二乘法求回归直线 使得样本数据的点到它的的方法叫做最小二乘法 距离的平方和最小 2 回归方程 3 回归分析 1 定义 对具有的两个变量进行统计分析的一种常用方法 2 样本点的中心对于一组具有线性相关关系的数据 x1 y1 x2 y2 xn yn 其中称为样本点的中心 相关关系 3 相关系数当r 0时 表明两个变量 当r 0时 表明两个变量 r的绝对值越接近于1 表明两个变量的线性相关性 r的绝对值越接近于0 表明两个变量之间 通常 r 大于时 认为两个变量有很强的线性相关性 4 独立性检验 1 分类变量 变量的不同 值 表示个体所属的 像这样的变量称为分类变量 正相关 负相关 越强 几乎不存在线性相关关系 0 75 不同类别 2 列联表 列出的两个分类变量的 称为列联表 假设有两个分类变量x和y 它们的可能取值分别为 x1 x2 和 y1 y2 其样本频数列联表 称为2 2列联表 为2 2列联表 a b c d 频数表 3 独立性检验利用随机变量来判断 两个分类变量 的方法称为独立性检验 k2 有关系 题组一思考辨析1 判断下列结论是否正确 请在括号中打 或 1 相关关系与函数关系都是一种确定性的关系 也是一种因果关系 2 名师出高徒 可以解释为教师的教学水平与学生的水平成正相关关系 3 只有两个变量有相关关系 所得到的回归模型才有预测价值 基础自测 1 2 3 4 5 6 4 某同学研究卖出的热饮杯数y与气温x 之间的关系 得线性回归方程 2 352x 147 767 则气温为2 时 一定可卖出143杯热饮 5 事件x y关系越密切 则由观测数据计算得到的k2的观测值越大 1 2 4 5 6 3 题组二教材改编2 p97a组t2 为调查中学生近视情况 测得某校男生150名中有80名近视 在140名女生中有70名近视 在检验这些学生眼睛近视是否与性别有关时 用下列哪种方法最有说服力a 回归分析b 均值与方差c 独立性检验d 概率 答案 解析 近视 与 性别 是两类变量 其是否有关 应用独立性检验判断 解析 1 2 4 5 6 3 3 p97练习 下面是2 2列联表 答案 解析 a 21 73 a 52 又a 22 b b 74 解析 1 2 4 5 6 则表中a b的值分别为a 94 72b 52 50c 52 74d 74 52 3 4 p81例1 某车间为了规定工时定额 需要确定加工零件所花费的时间 为此进行了5次试验 根据收集到的数据 如下表 由最小二乘法求得回归方程 0 67x 54 9 设表中的 模糊数字 为a 则62 a 75 81 89 75 5 a 68 解析 答案 1 2 4 5 6 现发现表中有一个数据看不清 请你推断出该数据的值为 68 3 题组三易错自纠5 某医疗机构通过抽样调查 样本容量n 1000 利用2 2列联表和k2统计量研究患肺病是否与吸烟有关 计算得k2 4 453 经查阅临界值表知p k2 3 841 0 05 现给出四个结论 其中正确的是a 在100个吸烟的人中约有95个人患肺病b 若某人吸烟 那么他有95 的可能性患肺病c 有95 的把握认为 患肺病与吸烟有关 d 只有5 的把握认为 患肺病与吸烟有关 解析 答案 1 2 4 5 6 解析由已知数据可得 有1 0 05 95 的把握认为 患肺病与吸烟有关 3 6 在一次考试中 5名学生的数学和物理成绩如下表 已知学生的数学和物理成绩具有线性相关关系 解析 答案 1 2 4 5 6 73 3 1 2 4 5 6 3 题型分类深度剖析 1 观察下列各图形 解析 答案 题型一相关关系的判断 自主演练 其中两个变量x y具有相关关系的图是a b c d 解析由散点图知 中的点都分布在一条直线附近 中的点都分布在一条曲线附近 所以 中的两个变量具有相关关系 a 逐年比较 2008年减少二氧化硫排放量的效果最显著b 2007年我国治理二氧化硫排放显现成效c 2006年以来我国二氧化硫年排放量呈减少趋势d 2006年以来我国二氧化硫年排放量与年份正相关 2 2018 广州质检 根据下面给出的2004年至2013年我国二氧化硫排放量 单位 万吨 的柱形图 以下结论不正确的是 解析 答案 解析从2006年 将每年的二氧化硫排放量与前一年作差比较 得到2008年二氧化硫排放量与2007年排放量的差最大 a选项正确 2007年二氧化硫排放量较2006年降低了很多 b选项正确 虽然2011年二氧化硫排放量较2010年多一些 但自2006年以来 整体呈递减趋势 c选项正确 自2006年以来我国二氧化硫年排放量与年份负相关 d选项错误 故选d x y是负相关关系 3 x和y的散点图如图所示 则下列说法中所有正确命题的序号为 解析 答案 x y之间不能建立线性回归方程 解析在散点图中 点散布在从左上角到右下角的区域 因此x y是负相关关系 故 正确 x y之间可以建立线性回归方程 但拟合效果不好 故 错误 判定两个变量正 负相关性的方法 1 画散点图 点的分布从左下角到右上角 两个变量正相关 点的分布从左上角到右下角 两个变量负相关 2 相关系数 r 0时 正相关 r 0时 负相关 典例 2016 全国 右图是我国2008年至2014年生活垃圾无害化处理量 单位 亿吨 的折线图 注 年份代码1 7分别对应年份2008 2014 1 由折线图看出 可用线性回归模型拟合y与t的关系 请用相关系数加以说明 解答 题型二线性回归分析 师生共研 解由折线图中数据和附注中参考数据得 40 17 4 9 32 2 89 因为y与t的相关系数近似为0 99 说明y与t的线性相关程度相当高 从而可以用线性回归模型拟合y与t的关系 2 建立y关于t的回归方程 系数精确到0 01 预测2016年我国生活垃圾无害化处理量 附注 解答 所以预测2016年我国生活垃圾无害化处理量将约为1 82亿吨 线性回归分析问题的类型及解题方法 1 求线性回归方程 待定系数法 利用回归直线过样本点的中心求系数 2 利用回归方程进行预测 把线性回归方程看作一次函数 求函数值 4 回归方程的拟合效果 可以利用相关系数判断 当 r 越趋近于1时 两变量的线性相关性越强 跟踪训练某公司为确定下一年度投入某种产品的宣传费 需了解年宣传费x 单位 千元 对年销售量y 单位 t 和年利润z 单位 千元 的影响 对近8年的年宣传费xi和年销售量yi i 1 2 8 数据作了初步处理 得到下面的散点图及一些统计量的值 1 根据散点图判断 y a bx与y c 哪一个适宜作为年销售量y关于年宣传费x的回归方程类型 给出判断即可 不必说明理由 解答 2 根据 1 的判断结果及表中数据 建立y关于x的回归方程 解答 3 已知这种产品的年利润z与x y的关系为z 0 2y x 根据 2 的结果回答下列问题 年宣传费x 49时 年销售量及年利润的预报值是多少 解答 解由 2 知 当x 49时 年宣传费x为何值时 年利润的预报值最大 解答 解根据 2 的结果知 年利润z的预报值 故年宣传费为46 24千元时 年利润的预报值最大 典例 2017 全国 海水养殖场进行某水产品的新 旧网箱养殖方法的产量对比 收获时各随机抽取了100个网箱 测量各箱水产品的产量 单位 kg 其频率分布直方图如下 题型三独立性检验 师生共研 1 设两种养殖方法的箱产量相互独立 记a表示事件 旧养殖法的箱产量低于50kg 新养殖法的箱产量不低于50kg 估计a的概率 解答 解记b表示事件 旧养殖法的箱产量低于50kg c表示事件 新养殖法的箱产量不低于50kg 由题意知 p a p bc p b p c 旧养殖法的箱产量低于50kg的频率为 0 012 0 014 0 024 0 034 0 040 5 0 62 故p b 的估计值为0 62 新养殖法的箱产量不低于50kg的频率为 0 068 0 046 0 010 0 008 5 0 66 故p c 的估计值为0 66 因此 事件a的概率估计值为0 62 0 66 0 4092 2 填写下面列联表 并根据列联表判断是否有99 的把握认为箱产量与养殖方法有关 解答 解根据箱产量的频率分布直方图得列联表如下 由于15 705 6 635 故有99 的把握认为箱产量与养殖方法有关 3 根据箱产量的频率分布直方图 求新养殖法箱产量的中位数的估计值 精确到0 01 附 解答 解因为新养殖法的箱产量频率分布直方图中 箱产量低于50kg的直方图面积为 0 004 0 020 0 044 5 0 340 5 故新养殖法箱产量的中位数的估计值为 1 比较几个分类变量有关联的可能性大小的方法 通过计算k2的大小判断 k2越大 两变量有关联的可能性越大 通过计算 ad bc 的大小判断 ad bc 越大 两变量有关联的可能性越大 2 独立性检验的一般步骤 根据样本数据制成2 2列联表 比较k与临界值的大小关系 作统计推断 跟踪训练 2017 石家庄质检 微信是现代生活进行信息交流的重要工具 某公司200名员工中90 的人使用微信 其中每天使用微信时间在一小时以内的有60人 其余的员工每天使用微信的时间在一小时以上 若将员工分成青年 年龄小于40岁 和中年 年龄不小于40岁 两个阶段 那么使用微信的人中75 是青年人 若规定 每天使用微信时间在一小时以上为经常使用微信 那么经常使用微信的员工中有是青年人 1 若要调查该公司使用微信的员工经常使用微信与年龄的关系 列出2 2列联表 解答 解由已知可得 该公司员工中使用微信的有200 90 180 人 经常使用微信的有180 60 120 人 使用微信的人中青年人有180 75 135 人 故2 2列联表如下 由于13 333 10 828 所以有99 9 的把握认为 经常使用微信与年龄有关 2 根据2 2列表中的数据利用独立性检验的方法判断是否有99 9 的把握认为 经常使用微信与年龄有关 解答 解将列联表中数据代入公式可得 思想方法指导回归分析是处理变量相关关系的一种数学方法 主要解决 1 确定特定量之间是否有相关关系 如果有就找出它们之间贴近的数学表达式 2 根据一组观测值 预测变量的取值及判断变量取值的变化趋势 3 求出线性回归方程 求线性回归方程的方法技巧 思想方法 典例 12分 某地最近十年粮食需求量逐年上升 下表是部分统计数据 2 利用 1 中所求出的线性回归方程预测该地2018年的粮食需求量 思想方法指导 规范解答 规范解答解 1 由所给数据看出 年需求量与年份之间近似直线上升 下面来求线性回归方程 先将数据处理如下表 由上述计算结果 知所求线性回归方程为 2 利用所求得的线性回归方程 可预测2018年的粮食需求量大约为6 5 2018 2010 260 2 6 5 8 260 2 312 2 万吨 12分 课时作业 1 根据如下样本数据 基础保分练 解析 答案 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 2 2017 江西南城一中 高安中学等九校联考 随着国家二孩政策的全面放开 为了调查一线城市和非一线城市的二孩生育意愿 某机构用简单随机抽样方法从不同地区调查了100位育龄妇女 结果如下表 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 参照下表 正确的结论是a 在犯错误的概率不超过0 1 的前提下 认为 生育意愿与城市级别有关 b 在犯错误的概率不超过0 1 的前提下 认为 生育意愿与城市级别无关 c 有99 以上的把握认为 生育意愿与城市级别有关 d 有99 以上的把握认为 生育意愿与城市级别无关 解析 答案 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 解析 k2 9 616 6 635 有99 以上的把握认为 生育意愿与城市级别有关 故选c 解析 答案 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 解析 答案 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 a 160b 163c 166d 170 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 5 2018 湖南永州模拟 已知x与y之间的几组数据如下表 解析 答案 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 解析由两组数据 1 0 和 2 2 可求得直线方程为y 2x 2 b 2 a 2 而利用线性回归方程的公式与已知表格中的数据 6 某地2009年至2015年中 每年的人口总数y 单位 万 的数据如下表 a 3 9 b 9 3 c 6 14 d 4 11 解析 答案 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 7 2017 遵义联考 某公司为确定明年投入某产品的广告支出 对近5年的年广告支出m与年销售额t 单位 百万元 进行了初步统计 得到下列表格中的数据 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 60 解析 答案 8 以下四个命题 其中正确的序号是 从匀速传递的产品生产流水线上 质检员每20分钟从中抽取一件产品进行某项指标检测 这样的抽样是分层抽样 两个随机变量相关性越强 则相关系数的绝对值越接近于1 解析 答案 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 对分类变量x与y的统计量k2来说 k2越小 x与y有关系 的把握程度越大 解析 是系统抽样 对于 统计量k2越小 说明两个相关变量有关系的把握程度越小 9 为了判断高中三年级学生选修文科是否与性别有关 现随机抽取50名学生 得到如图所示2 2列联表 解析 答案 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 95 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 解析 答案 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 4 11 某地区2009年至2015年农村居民家庭人均纯收入y 单位 千元 的数据如下表 解答 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1 求y关于t的线性回归方程 解由所给数据计算得 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 2 利用 1 中的线性回归方程 分析2009年至2015年该地区农村居民家庭人均纯收入的变化情况 并预测该地区2018年农村居民家庭人均纯收入 解答 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 故预测该地区2018年农村居民家庭人均纯收入为7 3千元 12 2017 西安质检 某省会城市地铁将于2017年6月开始运营 为此召开了一个价格听证会 拟定价格后又进行了一次调查 随机抽查了50人 他们的收入与态度如下 解答 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1 若以区间的中点值为该区间内的人均月收入 求参与调查的人员中 赞成定价者 与 认为价格偏高者 的月平均收入的差异是多少 结果保留2位小数 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 解 赞成定价者 的月平均收入为 认为价格偏高者 的月平均收入为 赞成定价者 与 认为价格偏高者 的月平均收入的差距是x1 x2 50 56 38 75 11 81 百元 解答 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 2 由以上统计数据填下面2 2列联表 分析是否有99 的把握认为 月收入以55百元为分界点对地铁定价的态度有差异 没有99 的把握认为 月收入以55百元为分界点对地铁定价的态度有差异 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 解根据条件可得2 2列联表如下 b 残差平方和越小的模型 拟合的效果越好c 用相关指数r2来刻画回归效果 r2的值越小 说明模型的拟合效果越好d 若变量y和x之间的相关系数r 0 9362 则变量y与x之间具有线性相关关系 13 2017 通州一模 对两个变量y和x进行回归分析 得到一组样本数据 x1 y1 x2 y2 xn yn 则下列说法中不正确的是 技能提升练 解析 答案 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 解析r2的值越大 说明残差平方和越小 也就是模型的拟合效果越好 故选c 14 2018 河北保定模拟 中央政府为了应对因人口老龄化而造成的劳动力短缺问题 拟定出台 延迟退休年龄政策 为了了解人们对 延迟退休年龄政策 的态度 责成人社部进行调研 人社部从网上年龄在15 65的人群中随机调查100人 调查数据的频率分布直方图和支持 延迟退休 的人数与年龄的统计结果如下 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1 由以上统计数据填写2 2列联表 并判断是否有95 的把握认为以45岁为分界点的不同人群对 延迟退休年龄政策 的支持度有差异 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 解答 解2 2列联表如下 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 所以有95 的把握认为以45岁为分界点的不同人群对 延迟退休年龄政策 的支持度有差异 2 若以45岁为分界点 从不支持 延迟退休年龄政策 的人中按分层抽样的方法抽取8人参加某项活动 现从这8人中随机抽2人 求至少有1人是45岁及45岁以上的概率 参
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论