《数学》复习人教A(新高考)-第3节 变量间的相关关系与统计案例_第1页
《数学》复习人教A(新高考)-第3节 变量间的相关关系与统计案例_第2页
《数学》复习人教A(新高考)-第3节 变量间的相关关系与统计案例_第3页
《数学》复习人教A(新高考)-第3节 变量间的相关关系与统计案例_第4页
《数学》复习人教A(新高考)-第3节 变量间的相关关系与统计案例_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章

第3节变量间的相关关系与统计案例知识分类落实考点分层突破课后巩固作业内容索引///////123//////////////知识分类落实夯实基础回扣知识1知识梳理///////1.相关关系与回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是:

;统计量有相关系数与相关指数.(1)在散点图中,点散布在从

的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)在散点图中,点散布在从

的区域,两个变量的这种相关关系称为负相关.(3)如果散点图中点的分布从整体上看大致在

附近,称两个变量具有线性相关关系.散点图左下角右上角左上角右下角一条直线2.线性回归方程(1)最小二乘法:使得样本数据的点到回归直线的

最小的方法叫做最小二乘法.距离的平方和斜率

(1)定义:对具有

的两个变量进行统计分析的一种常用方法.(2)样本点的中心:对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中

称为样本点的中心.(3)相关系数当r>0时,表明两个变量

;当r<0时,表明两个变量

.r的绝对值越接近于1,表明两个变量的线性相关性

.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于

时,认为两个变量有很强的线性相关性.3.回归分析相关关系正相关负相关越强0.75(1)利用随机变量K2来判断“两个分类变量

”的方法称为独立性检验.(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)为4.独立性检验有关系a+b

b+d

a+b+c+d

2.为调查中学生近视情况,测得某校在150名男生中有80名近视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力(

) A.回归分析 B.均值与方差

C.独立性检验 D.概率 解析

“近视”与“性别”是两类变量,其是否有关,应用独立性检验判 断.C

BCD

A.1B.1.05C.1.2D.2x1234y0.8m1.41.5A

5.(2020·全国Ⅰ卷)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图: 由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是 (

) A.y=a+bx B.y=a+bx2 C.y=a+bex D.y=a+blnx

解析由散点图可以看出,这些点大致分布在对数型函数的图象附近. 故选D.D

6.(2021·衡阳月考)某高校为调查学生喜欢“应用统计”课程是否与性别有关,随机抽取了选修课程的55名学生,得到数据如下表:喜欢“应用统计”课程不喜欢“应用统计”课程男生205女生1020附表:A

考点分层突破题型剖析考点聚焦21.下列四个散点图中,变量x与y之间具有负的线性相关关系的是(

)

解析观察散点图可知,只有D选项的散点图表示的是变量x与y之间具有负的线性相关关系. 故选D.考点一相关关系的判断///////自主演练D

2.(2020·重庆诊断)某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:月份123456人均销售额658347利润率(%)12.610.418.53.08.116.3

根据表中数据,下列说法正确的是 (

) A.利润率与人均销售额成正相关关系

B.利润率与人均销售额成负相关关系

C.利润率与人均销售额成正比例函数关系

D.利润率与人均销售额成反比例函数关系 解析由统计表可得利润率与人均销售额不是正比例关系,也不是反比例关系,排除C和D;其属于正相关关系,A正确,B错误.A

3.(多选题)(2020·淄博模拟)2019年女排世界杯是由国际排联(FIVB)举办的第13届世界杯赛事,比赛于2019年9月14日至9月29日在日本举行,共有12支参赛队伍.最终,中国女排以11战全胜且只丢3局的成绩成功卫冕本届世界杯冠军.中国女排的影响力早已超越体育本身的意义,不仅是时代的集体记忆,更是激励国人持续奋斗、自强不息的精神符号.以下是本届世界杯比赛最终结果的相关数据,记每个队的胜场数为变量x,积分为变量y(只列出了前6名).排名123456胜场数x11108766积分y322823211918ACD

判断相关关系的两种方法:(1)散点图法:如果样本点的分布从整体上看大致在某一曲线附近,变量之间就有相关关系;如果样本点的分布从整体上看大致在某一直线附近,变量之间就有线性相关关系.(2)相关系数法:利用相关系数判定,|r|越趋近于1,相关性越强.感悟升华角度1线性回归方程及应用【例1】下面给出了根据我国2012~2018年水果人均占有量y(单位:kg)和年份代码x绘制的散点图和线性回归方程的残差图.(2012年~2018年的年份代码x分别为1~7) (1)根据散点图分析y与x之间的相关关系; 解

从散点图可以看出,这些点的分布整体上在一条直线附近, 且当x由小变大时,y也由小变大, 所以y与x之间具有线性相关关系,且是正相关.考点二回归分析///////多维探究

由残差图可以看出历年数据的残差均分布在-2~2之间,且图中各点比较均匀地分布在数值0所在直线附近,带状区域很窄,说明对应的回归直线拟合效果较好.角度2非线性回归方程及应用【例2】

(2021·四川七市一诊)已知某地区某种昆虫产卵数和温度有关.现收集了一只该品种昆虫的产卵数y(个)和温度x(℃)的7组观测数据,其散点图如图所示:解由(1)可得,lny=0.255x-3.348,于是产卵数y关于温度x的回归方程为y=e0.255x-3.348.当x=26时,y=e0.255×26-3.348=e3.282≈27;当x=36时,y=e0.255×36-3.348=e5.832≈341.∵函数y=e0.255x-3.348为增函数,∴气温在26℃~36℃之间时,估计该品种一只昆虫的产卵数的范围是[27,341]内的正整数.感悟升华【训练1】(2021·榆林模拟)根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图如图所示:

(1)依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数并加以说明(若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合);【例3】

(2020·全国Ⅲ卷)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):考点三独立性检验///////师生共研锻炼人次空气质量等级[0,200](200,400](400,600]1(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;空气质量等级1234概率的估计值0.430.270.210.09【例3】(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表); 解一天中到该公园锻炼的平均人次的估计值为【例3】(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400人次>400空气质量好空气质量不好P(K2≥k)0.0500.0100.001k3.8416.63510.828解根据所给数据,可得2×2列联表:人次≤400人次>400空气质量好3337空气质量不好228根据列联表得由于5.820>3.841,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.感悟升华

【训练2】为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:理科文科男1310女7205%

解析

K2的观测值k≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立, 并且这种判断出错的可能性约为5%.课后巩固作业提升能力分层训练3一、选择题1.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是 (

) A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3 C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3A

解析

由散点图知图(1)与图(3)是正相关,故r1>0,r3>0,图(2)与图(4)是负相关, 故r2<0,r4<0,且图(1)与图(2)的样本点集中在一条直线附近,因此r2<r4<0<r3<r1, 故选A.2.有下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;②用相关指数R2来刻画回归的效果,R2值越接近于1,说明模型的拟合效果越好;③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.正确的是(

) A.①②B.②③C.①③D.①②③D

3.(多选题)(2020·枣庄模拟)某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如下所示的列联表,经计算K2的观测值k≈4.762,则可以推断出(

)满意不满意男3020女4010P(K2≥k)0.1000.0500.010k2.7063.8416.635AC

4.(多选题)(2021·武汉调研)已知某产品的销售额y(单位:万元)与广告费用x(单位:万元)之间的关系如下表:x(单位:万元)01234y(单位:万元)1015m3035ABD

5.(多选题)(2021·广东百校联考)下表是我国某城市在2019年1月份至10月份期间各月最低温度与最高温度(单位:℃)的数据一览表.月份12345678910最高温度/℃59911172427303121最低温度/℃-12-31-271719232510

已知该城市的各月最低温度与最高温度具有相关关系,根据该一览表,则下列结论正确的是 (

) A.最低温度与最高温度为正相关

B.每月最高温度与最低温度的平均值在前8个月逐月增加

C.月温差(最高温度减最低温度)的最大值出现在1月

D.1月至4月的月温差(最高温度减最低温度)相对于7月至10月,波动性更大ACD

解析将最高温度、最低温度、温差列表如下:月份12345678910最高温度/℃59911172427303121最低温度/℃-12-31-271719232510温差度/℃171281310787611由表格可知,最低温度大致随最高温度的升高而升高,A正确;每月最高温度与最低温度的平均值在前8个月不是逐月增加,B错误;月温差的最大值出现在1月,C正确;1月至4月的月温差相对于7月至10月,波动性更大,D正确.6.2018世界特色魅力城市200强新鲜出炉,包括黄山市在内的28个中国城市入选,美丽的黄山风景和人文景观迎来众多宾客.现在很多人喜欢“自助游”,某调查机构为了了解“自助游”是否与性别有关,在黄山旅游节期间,随机抽取了100人,得如下所示的列联表:赞成“自助游”不赞成“自助游”总计男性301545女性451055总计7525100P(K2≥k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828参照公式,得到的正确结论是 (

)A.有99.5%以上的把握认为“赞成‘自助游’与性别无关”B.有99.5%以上的把握认为“赞成‘自助游’与性别有关”C.在犯错误的概率不超过0.1的前提下,认为“赞成‘自助游’与性别无关”D.在犯错误的概率不超过0.1的前提下,认为“赞成‘自助游’与性别有关”D

8.在一次对人体脂肪含量和年龄的关系的研究中,研究人员获得了一组样本数据,并制成如图所示的人体脂肪含量与年龄的关系的散点图,下列结论中正确的是________(填序号). ①人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%; ②人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%; ③人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%; ④人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%.

解析

观察图形,可知人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%.②

9.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列结论中,正确结论的序号是________. ①有95%的把握认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的有效率为5%.

解析

K2≈3.918≥3.841,而P(K2≥3.814)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”.要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆.①

分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关性.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.11.某公司为了准确地把握市场,做好产品生产计划,对过去四年的数据进行整理得到了第x年与年销售量y(单位:万件)之间的关系如下表:x1234y12284256 (1)在图中画出表中数据的散点图;

(1)作出的散点图如图:(2)根据散点图选择合适的回归模型拟合y与x的关系(不必说明理由);解

根据散点图观察,可以用线性回归模型拟合y与x的关系.解

观察(1)中散点图可知各点大致分布在一条直线附近,列出表格:12.在吸烟与患肺癌这两个分类变量的独立性检验的计算中,下列说法正确的是 (

) A.若K2的观测值为k=6.635,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论