版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、10.3变量间的相关关系、统计案例 第十章统计与统计案例 基础知识自主学习 课时作业 题型分类深度剖析 内容索引 基础知识自主学习 1.相关性相关性 (1)通常将变量所对应的点描出来,这些点就组成了变量之间的一个图, 通常称这种图为变量之间的 . (2)从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一 个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样 近似的过程称为 . (3)若两个变量x和y的散点图中,所有点看上去都在一条直线附近波动, 则称变量间是 的,若所有点看上去都在某条曲线(不是一条直 线)附近波动,则称此相关是 的.如果所有的点在散点图中 没有显示 关系,
2、则称变量间是 的. 知识梳理 散点图 曲线拟合 非线性相关 线性相关 任何不相关 2.线性回归方程线性回归方程 (1)最小二乘法 如果有n个点(x1,y1),(x2,y2),(xn,yn),可以用y1(abx1)2 y2(abx2)2yn(abxn)2来刻画这些点与直线yabx的接 近程度,使得上式达到最小值的直线yabx就是所要求的直线,这 种方法称为最小二乘法. (2)线性回归方程 方程ybxa是两个具有线性相关关系的变量的一组数据(x1,y1),(x2, y2),(xn,yn)的线性回归方程,其中a,b是待定参数. b a 3.回归分析回归分析 (1)定义:对具有 的两个变量进行统计分析
3、的一种常用方法. (2)样本点的中心 对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn)中, 称为样本点的中心. 相关关系 当r0时,表明两个变量 ; 当r2.706时,有90%的把握判定变量A,B有关联; 当23.841时,有95%的把握判定变量A,B有关联; 当26.635时,有99%的把握判定变量A,B有关联. 题组一思考辨析题组一思考辨析 1.判断下列结论是否正确(请在括号中打“”或“”) (1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系. () (2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关 系.() (3)只有两个变量有相
4、关关系,所得到的回归模型才有预测价值.() 基础自测 123456 (4)某同学研究卖出的热饮杯数y与气温x()之间的关系,得线性回归方 程y2.352x147.767,则气温为2时,一定可卖出143杯热饮.() (5)事件X,Y关系越密切,则由观测数据计算得到的2值越大.() 12456 3 题组二教材改编题组二教材改编 2.为调查中学生近视情况,测得某校男生150名中有80名近视,在140名 女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下 列哪种方法最有说服力 A.回归分析 B.均值与方差 C.独立性检验 D.概率 答案 解析解析“近视”与“性别”是两类变量,其是否有关,
5、应用独立性检验 判断. 解析 12456 3 3.下面是22列联表: 答案 解析解析a2173, a52.又a22b,b74. 解析 12456 则表中a,b的值分别为 A.94,72 B.52,50 C.52,74 D.74,52 3 y1y2合计 x1a2173 x2222547 合计b46120 4.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进 行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y 0.67x54.9. 设表中的“模糊数字”为a, 则62a758189755,a68. 解析答案 12456 现发现表中有一个数据看不清,请你推断出该数据的值为
6、_. 68 3 零件数x(个)1020304050 加工时间y(min)62758189 题组三易错自纠题组三易错自纠 5.某医疗机构通过抽样调查(样本容量n1 000),利用22列联表和2 统计量研究患肺病是否与吸烟有关.计算得24.453,经查阅临界值表 知P(23.841)0.05,现给出四个结论,其中正确的是 A.在100个吸烟的人中约有95个人患肺病 B.若某人吸烟,那么他有95%的可能性患肺病 C.有95%的把握认为“患肺病与吸烟有关” D.只有5%的把握认为“患肺病与吸烟有关” 解析答案 12456 解析解析由已知数据可得,有10.0595%的把握认为“患肺病与吸烟 有关”. 3
7、 现已知其线性回归方程为y0.36xa,则根据此线性回归方程估计数 学得90分的同学的物理成绩为_.(四舍五入到整数) 6.在一次考试中,5名学生的数学和物理成绩如下表:(已知学生的数学 和物理成绩具有线性相关关系) 解析答案 12456 73 3 学生的编号i12345 数学成绩x8075706560 物理成绩y7066686462 124563 所以660.3670a,a40.8, 即线性回归方程为y0.36x40.8. 当x90时,y0.369040.873.273. 题型分类深度剖析 1.观察下列各图形, 解析答案 题型一相关关系的判断自主演练自主演练 其中两个变量x,y具有相关关系的
8、图是 A. B.C. D. 解析解析由散点图知中的点都分布在一条直线附近. 中的点都分布在一条曲线附近,所以中的两个变量具有相关关系. A.逐年比较,2008年减少二氧 化硫排放量的效果最显著 B.2007年我国治理二氧化硫排放 显现成效 C.2006年以来我国二氧化硫年排放量呈减少趋势 D.2006年以来我国二氧化硫年排放量与年份正相关 2.(2018广州质检)根据下面给出的2004年至2013年我国二氧化硫排放量 (单位:万吨)的条形统计图.以下结论不正确的是 解析答案 解析解析从2006年,将每年的二氧化硫排放量与前一年作差比较,得到 2008年二氧化硫排放量与2007年排放量的差最大,
9、A选项正确; 2007年二氧化硫排放量较2006年降低了很多,B选项正确; 虽然2011年二氧化硫排放量较2010年多一些,但自2006年以来,整体 呈递减趋势,C选项正确; 自2006年以来我国二氧化硫年排放量与年份负相关,D选项错误,故 选D. x,y是负相关关系; 在该相关关系中,若用y 拟合时的相关系数为r1,用ybxa 拟合时的相关系数为r2,则r1r2; x,y之间不能建立线性回归方程. 3.x和y的散点图如图所示,则下列说法中所有正确命题的序号为_. 解析答案 2 1e c x c 由散点图知用y 拟合比用ybxa拟合效果要好,则r1r2,故 正确; 解析解析在散点图中,点散布在
10、从左上角到右下角的区域,因此x,y是负 相关关系,故正确; 2 1e c x c x,y之间可以建立线性回归方程,但拟合效果不好,故错误. 判定两个变量正,负相关性的方法 (1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分 布从左上角到右下角,两个变量负相关. (2)相关系数:r0时,正相关;r0时,正相关;b0时,负相关. 思维升华思维升华 典例典例 (2017全国)为了监控某种零件的一条生产线的生产过程,检验 员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm). 下面是检验员在一天内依次抽取的16个零件的尽寸: 题型二线性回归分析师生共研师生共研 抽取
11、次序12345678 零件尺寸9.9510.129.969.9610.019.929.9810.04 抽取次序910111213141516 零件尺寸10.269.9110.1310.029.2210.0410.059.95 (1)求(xi,i)(i1,2,16)的相关系数r,并回答是否可以认为这一天生 产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|0.25,则可 以认为零件的尺寸不随生产过程的进行而系统地变大或变小); 解答 由于|r|0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行 而系统地变大或变小. (2)一天内抽检零件中,如果出现了尺寸在 之外的零件, 就认为
12、这条生产线在这一天的生产过程可能出现了异常情况,需对当天 的生产过程进行检查. 从这一天抽检的结果看,是否需对当天的生产过程进行检查? 解答 解答 解解剔除离群值,即第13个数据,剩下数据的平均数为 因此这条生产线当天生产的零件尺寸的均值的估计值为10.02. 剔除第13个数据,剩下数据的样本方差为 思维升华思维升华 线性回归分析问题的类型及解题方法 (1)求线性回归方程 利用公式,求出回归系数b,a. 待定系数法:利用回归直线过样本点的中心求系数. (2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值. (3)利用回归直线判断正、负相关;决定正相关还是负相关的是系数b. (4)回
13、归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时, 两变量的线性相关性越强. 跟踪训练跟踪训练 (2018惠州月考)以下是某地收集到的新房屋的销售价格y和房 屋的面积x的数据: 房屋面积x(m2)11511080135105 销售价格y(万元)24.821.618.429.222 (1)画出数据对应的散点图; 解答 解解数据对应的散点图如图所示: (2)求线性回归方程,并在散点图中画出回归直线; 解答 设所求线性回归方程为ybxa,则 故所求线性回归方程为y0.196 2x1.814 2. (3)根据(2)的结果估计当房屋面积为150 m2时的销售价格. 解答 解解根据(2),当x
14、150时,销售价格的估计值为 y0.196 21501.814 231.244 231.2(万元). 典例典例 (2017全国)海水养殖场进行某水产品的新、旧网箱养殖方法的 产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单 位:kg),其频率分布直方图如下: 题型三独立性检验师生共研师生共研 (1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率; 解答 解解旧养殖法的箱产量低于50 kg的频率为 (0.0120.0140.0240.0340.040)50.62. 因此,事件A的概率估计值为0.62. (2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱
15、产量与 养殖方法有关: 解答 箱产量6.635,故有99%的把握认为箱产量与养殖方法有关. 箱产量10.828,所以有99.9%的把握认为“经常使用微信与年龄有关”. (2)根据22列表中的数据利用独立性检验的方法判断是否有99.9%的把 握认为“经常使用微信与年龄有关”? 解答 解解将列联表中数据代入公式可得: P(2k)0.0100.001 k6.63510.828 思想方法指导思想方法指导 回归分析是处理变量相关关系的一种数学方法.主要解决: (1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学 表达式;(2)根据一组观测值,预测变量的取值及判断变量取值的变化趋 势;(3)
16、求出线性回归方程. 求线性回归方程的方法技巧 思想方法思想方法 典例典例 (12分)某地最近十年粮食需求量逐年上升,下表是部分统计数据: (1)利用所给数据求年需求量与年份之间的线性回归方程ybxa; (2)利用(1)中所求出的线性回归方程预测该地2018年的粮食需求量. 思想方法指导规范解答 年份20062008201020122014 需求量/万吨236246257276286 规范解答规范解答 解解(1)由所给数据看出,年需求量与年份之间近似直线上升,下面来求 线性回归方程,先将数据处理如下表. 年份201042024 需求257211101929 由上述计算结果,知所求线性回归方程为
17、y2576.5(x2010)3.2, 即y6.5(x2010)260.2. 8分 (2)利用所求得的线性回归方程,可预测2018年的粮食需求量大约为 6.5(20182010)260.26.58260.2312.2(万吨). 12分 课时作业 1.两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关系 数r如下,其中拟合效果最好的模型是 A.模型1的相关系数r为0.98 B.模型2的相关系数r为0.80 C.模型3的相关系数r为0.50 D.模型4的相关系数r为0.25 基础保分练 解析答案 12345678910111213141516 解析解析相关系数r越大,拟合效果越好,因此模
18、型1拟合效果最好. 2.(2018洛阳月考)为了评价某个电视栏目的改革效果,在改革前后分别 从居民点抽取了100位居民进行调查,经过计算20.99,根据这一数据 分析,下列说法正确的是 A.有99%的人认为该电视栏目优秀 B.有99%的人认为该电视栏目是否优秀与改革有关系 C.有99%的把握认为该电视栏目是否优秀与改革有关系 D.没有理由认为该电视栏目是否优秀与改革有关系 12345678910111213141516 解析答案 12345678910111213141516 解析解析只有26.635才能有99%的把握认为该电视栏目是否优秀与改革 有关系,而即使26.635也只是对“该电视栏目
19、是否优秀与改革有关系” 这个论断成立的可能性大小的结论,与是否有99%的人等无关.故只有D 正确. 解析答案 12345678910111213141516 解析答案 12345678910111213141516 12345678910111213141516 线性回归方程为y4x70. 将x24代入上式,得y42470166.故选C. 假设根据上表数据所得的线性回归方程为ybxa.若某同学根据上表中 的前两组数据(1,0)和(2,2)求得的直线方程为ybxa,则以下结论 正确的是 A.bb,aa B.bb,aa C.ba D.bb,aa 5.(2018湖南永州模拟)已知x与y之间的几组数据
20、如下表: 解析答案 12345678910111213141516 x123456 y021334 12345678910111213141516 解析解析由两组数据(1,0)和(2,2)可求得直线方程为y2x2,b2,a 2.而利用线性回归方程的公式与已知表格中的数据, 所以ba. 6.某地2009年至2015年中,每年的人口总数y(单位:万)的数据如下表: 若t与y之间具有线性相关关系,则其回归直线ybta一定过点 A.(3,9) B.(9,3) C.(6,14) D.(4,11) 解析答案 12345678910111213141516 年份20092010201120122013201
21、42015 年份代号t0123456 人口总数y888991011 所以回归直线ybta一定过点(3,9). 根据统计资料,居民家庭年平均收入的中位数是_,家庭年平均收入 与年平均支出有_相关关系.(填“正”或“负”) 7.某市居民20102014年家庭年平均收入x(单位:万元)与年平均支出y(单 位:万元)的统计资料如下表所示: 12345678910111213141516 13 解析答案 解析解析中位数是13.由相关性知识,根据统计资料可以看出,当年平均收 入增多时,年平均支出也增多,因此两者之间具有正相关关系. 年份20102011201220132014 收入x11.512.1131
22、3.315 支出y6.88.89.81012 正 8.以下四个命题,其中正确的序号是_. 从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品 进行某项指标检测,这样的抽样是分层抽样; 两个随机变量相关性越强,则相关系数的绝对值越接近于1; 在线性回归方程y0.2x12中,当自变量x每增加一个单位时,因变量 y平均增加0.2个单位; 对分类变量X与Y的统计量2来说,2越小,“X与Y有关系”的把握程 度越大. 解析答案 12345678910111213141516 解析解析是系统抽样; 对于,统计量2越小,说明两个相关变量有关系的把握程度越小. 9.为了判断高中三年级学生选修文科是否
23、与性别有关,现随机抽取50名 学生,得到如图所示22列联表: 解析答案 12345678910111213141516 95% 理科文科总计 男131023 女72027 总计203050 12345678910111213141516 因为5.0244.8443.841, 所以有95%的把握认为选修文科与性别有关. 由表中数据得线性回归方程ybxa中的b2,预测当气温为4 时, 用电量约为_度. 解析答案 12345678910111213141516 68 10.某单位为了了解用电量y(度)与气温x()之间的关系,随机统计了某4 天的用电量与当天气温,并制作了对照表: 气温()181310
24、1 用电量(度)24343864 12345678910111213141516 因为回归直线过样本点的中心,所以a40(2)1060, 所以当x4时,y(2)(4)6068,所以用电量约为68度. 11.某地区2009年至2015年农村居民家庭人均纯收入y(单位:千元)的数据 如下表: 解答 12345678910111213141516 (1)求y关于t的线性回归方程; 年份2009201020112012201320142015 年份代号t1234567 人均纯收入y2.93.33.64.44.85.25.9 解解由所给数据计算得 12345678910111213141516 1234
25、5678910111213141516 所求线性回归方程为y0.5t2.3. (2)利用(1)中的线性回归方程,分析2009年至2015年该地区农村居民家庭 人均纯收入的变化情况,并预测该地区2018年农村居民家庭人均纯收入. 解答 12345678910111213141516 12345678910111213141516 解解由(1)知,b0.50,故2009年至2015年该地区农村居民家庭人均纯 收入逐年增加,平均每年增加0.5千元. 将2018年的年份代号t10代入(1)中的线性回归方程,得y0.510 2.37.3, 故预测该地区2018年农村居民家庭人均纯收入为7.3千元. 12
26、.(2017西安质检)某省会城市地铁将于2017年6月开始运营,为此召开了一 个价格听证会,拟定价格后又进行了一次调查,随机抽查了50人,他们的收 入与态度如下: 12345678910111213141516 月收入(单 位:百元) 15,25) 25, 35) 35,45) 45,55)55,65)65,75) 赞成定价者 人数 123534 认为价格偏 高者人数 4812521 12345678910111213141516 解解 “赞成定价者”的月平均收入为 “认为价格偏高者”的月平均收入为 “赞成定价者”与“认为价格偏高者”的月平均收入的差距是x1x2 50.5638.7511.81
27、(百元). (1)若以区间的中点值为该区间内的人均月收入,求参与调查的人员中“赞成定 价者”与“认为价格偏高者”的月平均收入的差异是多少(结果保留2位小数); 解答 解答 12345678910111213141516 (2)由以上统计数据填下面22列联表,分析是否有99%的把握认为“月收 入以55百元为分界点对地铁定价的态度有差异”. 月收入不低于55百元 的人数 月收入低于55百元 的人数 总计 认为价格偏高者 赞成定价者 总计 P(2k)0.050.01 k3.8416.635 没有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有 差异”. 12345678910111213141516 解解根据条件可得22列联表如下: 月收入不低于 55百元的人数 月收入低于55百 元的人数 总计 认为价格偏高者32932 赞成定价者71118 总计104050 技能提升练 解析答案 12345678910111213141516 14.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法 从该地区调查了500位老年人,结果如下: 12345678910111213141516 性别 是否需要志愿者 男女 需要4030 不需要160270 (1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例; 解答 12345678910111213141516 (
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 女婿离婚再婚协议书范文模板
- 就业信息里的就业协议书范文
- 车祸轻伤出院后协议书范文范文
- 交易所股权认购协议书范文
- 柑橘树管理协议书范文范本
- 2023-2024学年云南省巧家县巧家第一中学高三下期末质量检查数学试题理试题
- 2022年医生个人工作总结5篇
- 2023-2024学年四川省自贡市衡水一中富顺学校高三下-第三次月考数学试题试卷
- 高中毕业离别赠言(3篇)
- 谈诚信议论文
- 福建省建筑消防设施维护保养技术规程
- (完整版)烟草题库及答案,推荐文档
- 上市公司偿债能力分析——以蒙牛公司为例
- 我的引路人中考满分作文600字5篇
- 电厂仓库物资出入库管理办法物资收发、盘点、借用流程
- 无侧限抗压强度试验方法
- 团委书记在青工委成立大会上的讲话
- Module2练习教学提纲
- 六宫格数独100题(经典实用)
- 养老护理员国家职业技能标准(2019年版)
- 成都光伏项目行业调研市场分析报告
评论
0/150
提交评论