已阅读5页,还剩40页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六节变量的相关关系 统计案例 总纲目录 教材研读 1 两个变量的线性相关 考点突破 2 回归分析 3 独立性检验 考点二线性回归方程的求解与应用 考点一相关关系的判断 考点三相关系数的意义 考点四独立性检验 1 两个变量的线性相关 1 正相关在散点图中 点散布在从 左下角到 右上角的区域 对于两个变量的这种相关关系 我们将它称为正相关 2 负相关在散点图中 点散布在从 左上角到 右下角的区域 对于两个变量的这种相关关系 我们将它称为负相关 教材研读 3 线性相关关系 回归直线如果散点图中点的分布从整体上看大致在 一条直线附近 就称这两个变量之间具有线性相关关系 这条直线叫做回归直线 4 最小二乘法求回归直线 使得样本数据的点到它的 距离的平方和最小的方法叫做最小二乘法 5 回归方程方程 x 是两个具有线性相关关系的变量的一组数据 x1 y1 x2 y2 xn yn 的回归方程 其中 是待定参数 2 回归分析 1 回归分析是对具有 相关关系的两个变量进行统计分析的一种常用方法 2 样本点的中心对于一组具有线性相关关系的数据 x1 y1 x2 y2 xn yn 我们知道 称为样本点的中心 3 相关系数 当r 0时 表明两个变量 正相关 当r 0时 表明两个变量负相关 r的绝对值越接近于1 表明两个变量的线性相关性越强 r的绝对值越接近于0 表明两个变量之间几乎不存在线性相关关系 通常 r 大于或等于0 75时 认为两个变量有很强的线性相关性 3 独立性检验 1 分类变量 变量的不同 值 表示个体所属的不同类别 像这类变量称为分类变量 2 列联表 列出两个分类变量的频数表 称为列联表 假设有两个分类变量x和y 它们的可能取值分别为 x1 x2 和 y1 y2 其样本频数列联表 称为2 2列联表 为 则可构造一个随机变量k2 其中n a b c d为样本容量 3 独立性检验利用独立性假设 随机变量k2来确定是否有一定把握认为 两个分类变量有关系 的方法称为两个分类变量的独立性检验 1 观察下列各图 其中两个变量x y具有线性相关关系的图是 a b c d c 答案c 2 已知变量x y之间具有线性相关关系 其散点图如图所示 回归直线l的方程为 x 则下列说法正确的是 a 0 0 0c 0 d 答案d由题图可知 回归直线的斜率是正数 即 0 回归直线在y轴上的截距是负数 即 0 故选d 3 四名同学根据各自的样本数据研究变量x y之间的相关关系 并求得回归直线方程 分别得到以下四个结论 y与x负相关且 2 347x 6 423 y与x负相关且 3 476x 5 648 y与x正相关且 5 437x 8 493 y与x正相关且 4 326x 4 578 其中一定的结论的序号是 a b c d d 答案d由回归直线方程 x 知当 0时 y与x正相关 当 0时 y与x负相关 一定不正确 故选d 4 已知x y的对应取值如下表 从散点图可以看出y与x线性相关 且回归方程为 0 95x 则 a 3 25b 2 6c 2 2d 0 b 答案b由题意知 2 4 5 因为回归直线经过点 所以 4 5 0 95 2 2 6 故选b 5 某校为了研究学生的性别和对待某一活动的态度 支持和不支持两种态度 的关系 运用2 2列联表进行独立性检验 经计算k2 7 069 则所得到的统计学结论是有的把握认为 学生性别与支持该活动有关系 附 a 0 1 b 1 c 99 d 99 9 c 答案c因为7 069与附表中的6 635最接近 所以得到的统计学结论是有1 0 010 0 99 99 的把握认为 学生性别与支持该活动有关系 6 下面是一个2 2列联表 则表中a b处的值分别为 52 54 答案52 54 解析因为a 21 73 所以a 52 又因为a 2 b 所以b 54 典例1 1 2018湖南长沙质检 下列四个散点图中 变量x与y之间具有负的线性相关关系的是 考点一相关关系的判断 考点突破 答案 1 d 2 a 解析 1 观察散点图可知 只有d选项的散点图表示的是变量x与y之间具有负的线性相关关系 2 由相关系数的意义 结合散点图可知r2 r4 0 r3 r1 故选a 1 1在一组样本数据 x1 y1 x2 y2 xn yn n 2 x1 x2 xn不全相等 的散点图中 若所有样本点 xi yi i 1 2 n 都在直线y x 1上 则这组样本数据的样本相关系数为 a 1b 0c d 1 d 答案d所有样本点均在同一条斜率为正数的直线上 则样本相关系数最大 为1 故选d 1 2变量x与y相应的一组数据为 10 1 11 3 2 11 8 3 12 5 4 13 5 变量u与v相对应的一组数据为 10 5 11 3 4 11 8 3 12 5 2 13 1 r1表示变量y与x之间的线性相关系数 r2表示变量v与u之间的线性相关系数 则 a r2 r1 0b 0 r2 r1c r2 0 r1d r2 r1 c 答案c对于变量y与x而言 y随x的增大而增大 故y与x正相关 即r1 0 对于变量v与u而言 v随u的增大而减小 故v与u负相关 即r2 0 故选c 典例2随着我国经济的发展 居民的储蓄存款逐年增长 某地区城乡居民人民币储蓄存款 年底余额 如下表 1 求y关于t的回归方程 t 2 用所求回归方程预测该地区2017年 t 6 的人民币储蓄存款 附 回归方程 t 中 考点二线性回归方程的求解与应用 解析 1 列表计算如下 这里n 5 ti 3 yi 7 2 2 1从某居民区随机抽取10个家庭 获得第i个家庭的月收入xi 单位 千元 与月储蓄yi 单位 千元 的数据资料 算得xi 80 yi 20 xiyi 184 720 1 求家庭的月储蓄y对月收入x的线性回归方程y bx a 2 判断变量x与y之间是正相关还是负相关 3 若该居民区某家庭月收入为7千元 预测该家庭的月储蓄 附 线性回归方程y bx a中 其中 为样本平均值 线性回归方程也可写为 x 典例3 2017课标全国 19 12分 为了监控某种零件的一条生产线的生产过程 检验员每隔30min从该生产线上随机抽取一个零件 并测量其尺寸 单位 cm 下面是检验员在一天内依次抽取的16个零件的尺寸 考点三相关系数的意义 经计算得 xi 9 97 s 0 212 18 439 xi i 8 5 2 78 其中xi为抽取的第i个零件的尺寸 i 1 2 16 1 求 xi i i 1 2 16 的相关系数r 并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小 若 r 0 25 则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小 2 一天内抽检零件中 如果出现了尺寸在 3s 3s 之外的零件 就认为这条生产线在这一天的生产过程可能出现了异常情况 需对当天的生产过程进行检查 i 从这一天抽检的结果看 是否需对当天的生产过程进行检查 ii 在 3s 3s 之外的数据称为离群值 试剔除离群值 估计这条生产线当天生产的零件尺寸的均值与标准差 精确到0 01 附 样本 xi yi i 1 2 n 的相关系数r 0 09 解析 1 由样本数据得 xi i i 1 2 16 的相关系数为r 0 18 由于 r 0 25 因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小 2 i 由于 9 97 s 0 212 由样本数据可以看出抽取的第13个零件的尺寸在 3s 3s 以外 因此需对当天的生产过程进行检查 ii 剔除离群值 即第13个数据 剩下数据的平均数为 16 9 97 9 22 10 02 3 1 2016课标全国 18 12分 下图是我国2008年至2014年生活垃圾无害化处理量 单位 亿吨 的折线图 1 由折线图看出 可用线性回归模型拟合y与t的关系 请用相关系数加以说明 2 建立y关于t的回归方程 系数精确到0 01 预测2016年我国生活垃圾无害化处理量 附注 参考数据 yi 9 32 tiyi 40 17 0 55 2 646 参考公式 相关系数r 回归方程 t中斜率和截距最小二乘估计公式分别为 解析 1 由折线图中数据和附注中参考数据得 4 ti 2 28 0 55 ti yi tiyi yi 40 17 4 9 32 2 89 r 0 99 因为y与t的相关系数近似为0 99 说明y与t的线性相关程度相当高 从而可以用线性回归模型拟合y与t的关系 2 由 1 331及 1 得 0 10 1 331 0 10 4 0 93 所以y关于t的回归方程为 0 93 0 10t 将2016年对应的t 9代入回归方程得 0 93 0 10 9 1 83 所以预测2016年我国生活垃圾无害化处理量将约为1 83亿吨 典例4 2017课标全国 19 12分 海水养殖场进行某水产品的新 旧网箱养殖方法的产量对比 收获时各随机抽取了100个网箱 测量各箱水产品的产量 单位 kg 其频率分布直方图如下 考点四独立性检验 1 记a表示事件 旧养殖法的箱产量低于50kg 估计a的概率 2 填写下面列联表 并根据列联表判断是否有99 的把握认为箱产量与养殖方法有关 3 根据箱产量的频率分布直方图 对这两种养殖方法的优劣进行比较 附 k2 解析 1 旧养殖法的箱产量低于50kg的频率为 0 012 0 014 0 024 0 034 0 040 5 0 62 因此 事件a的概率估计值为0 62 2 根据箱产量的频率分布直方图得列联表 k2 15 705 由于15 705 6 635 故有99 的把握认为箱产量与养殖方法有关 3 箱产量的频率分布直方图表明 新养殖法的箱产量平均值 或中位数 在50kg到55kg之间 旧养殖法的箱产量平均值 或中位数 在45kg到50kg之间 且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高 因此 可以认为新养殖法的箱产量较高且稳定 从而新养殖法优于旧养殖法 2 独立性检验的一般步骤 1 根据样本数据制成2 2列联表 2 根据公式k2 计算k2的观测值k 3 比较k与临界值的大小关系 作统计推断 4 1 2017广东惠州第三次调研 在某校举行的航天知识竞赛中 参与竞赛的文科生与理科生人数之比为1 3 且成绩分布在 40 100 分数在80以上 含80 的同学获奖 按文理科用分层抽样的方法抽取200人的成绩作为样本 得到成绩的频率分布直方图如下 1 求a的值 并计算所抽取样本的平均值 同一组中的数据用该组区间
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 地下排水设施建设方案
- 2024年北京市公租房居民互助协议
- 武汉市某大型高层住宅小区消防系统工程施工组织设计方案
- 2024年外遇离婚协议书
- 港口建设BIM、CIM技术应用方案
- 2024年医院护士雇佣合同范本
- 环保企业消防安全标准方案
- 不动产登记数据共享机制方案
- 2024年地质灾害防治土石方劳务分包合同
- 内容创作者收益分配合同
- 蓝色简约风中国空军成立75周年纪念日
- 期中考试卷(试题)-2024-2025学年苏教版二年级数学上册
- 2024年全国企业员工全面质量管理知识竞赛题库(含答案)(共132题)
- 《国有企业采购操作规范》【2023修订版】
- 野生动物管理学智慧树知到答案章节测试2023年东北林业大学
- 城市经济学习题与答案
- 迅达SWE30-100K自动扶梯电路分析_图文
- 慢性病自我管理新ppt课件.ppt
- ProCAST学习操作教程ppt课件
- 唐朝服饰.ppt
- 医院保密工作总结(共5篇)
评论
0/150
提交评论