专题43变量间相关关系统计案例_第1页
专题43变量间相关关系统计案例_第2页
专题43变量间相关关系统计案例_第3页
专题43变量间相关关系统计案例_第4页
专题43变量间相关关系统计案例_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题43变量间相关关系、统计案例№专题43变量间相关关系、统计案例№考向解读➊考点精析➋真题精讲➌模拟精练➍专题训练(新高考)备战2024高考数学一轮复习(新高考)备战2024高考数学一轮复习专题43变量间相关关系、统计案例命题解读命题预测复习建议集合是历年高考的必考点,集合常出现在选择题的第一或第二次小题,题目以集合的运算为主,主要是集合的交、并、补的运算。从题目的难易度来看属于基础题,但从历年高考题来看,在集合的考察中穿查不等式的求解,因此在做集合题时要注意不等式的求解。高考注重的基础知识的灵活运用,集合题目简单,考查内容、题型稳定,考查的覆盖面会进一步加大。预计2024年的高考仍然会以考查集合间的关系、集合的基本运算为主,还是以选择题的形式出现,全国卷中与不等式结合的可能性比较大,要多注意。集合复习策略:1.掌握集合的含义以及基本关系;2.理解集合的基本运算;3.掌握不等式的求解。→➊考点精析←一回归分析1.两个变量的线性相关(1)正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.

(2)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.

(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫作回归直线.

2.回归方程(1)最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫作最小二乘法.

(2)回归方程方程是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中,是待定参数.𝐄𝐌𝐁𝐄𝐃𝐄𝐪𝐮𝐚𝐭𝐢𝐨𝐧.𝐃𝐒𝐌𝐓𝟒,3.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.

(2)样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中(x,y)称为样本点的中心.(3)相关系数当r>0时,表明两个变量正相关;

当r<0时,表明两个变量负相关.

r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.

二独立性检验独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.

(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为

2×2列联表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d构造一个随机变量K2=n(ad-bc(3)独立性检验利用随机变量K2来判断“两个分类变量有关系的方法称为独立性检验.

→➋真题精讲←1.(2023·广东湛江·统考一模)某服装生产商为了解青少年的身高和体重的关系,在15岁的男生中随机抽测了10人的身高和体重,数据如下表所示:编号12345678910身高/cm165168170172173174175177179182体重/kg55896165677075757880由表中数据制作成如下所示的散点图:由最小二乘法计算得到经验回归直线的方程为,相关系数为,决定系数为;经过残差分析确定为离群点(对应残差过大),把它去掉后,再用剩下的9组数据计算得到经验回归直线的方程为,相关系数为,决定系数为.则以下结论中正确的有(

)A. B.C. D.【答案】AC【解析】身高的平均数为,因为离群点的横坐标168小于平均值,纵坐标89相对过大,所以去掉离群点后经验回归直线的截距变小而斜率变大,所以,,所以A正确,B错误;去掉离群点后成对样本数据的线性相关程度更强,拟合效果会更好,所以,所以C正确,D错误.故选:AC.→➌模拟精练←2.(多选)(2023·辽宁沈阳·统考三模)下列命题中正确的是(

)B.已知随机变量,且,则C.已知随机变量,则D.已知经验回归方程,则y与x具有负线性相关关系【答案】ABD【详解】对于A选项,,第3个和第4个数的平均数为,故A正确;对于B选项,,故B正确;对于C选项,,则,故C错误;对于D选项,,可得y与x具有负线性相关关系,可知D正确.故选:ABD.3.(2021·河南高三其他模拟(文))由一组样本点、、、、,根据最小二乘法求得的回归方程为,则___________.【答案】【分析】求出样本中心点的坐标,代入回归直线方程即可求得的值.【详解】由已知条件可得,,将点的坐标代入回归直线方程可得,解得.故答案为:.4.(2021·黑龙江哈尔滨市·哈尔滨三中高三其他模拟(文))2021年春节,由贾玲导演的春节档电影《你好,李焕英》总票房已突破50亿元,影片的感人情节引起同学们广泛热议.开学后,哈三中团委在高二年级中(其中男生200名,女生150名),对是否观看该影片进行了问卷调查,各班男生观看人数统计记为组,各班女生观看人数统计记为组,得到如图的茎叶图.(1)根据茎叶图补全列联表;观看没观看合计男生200女生150合计350(2)判断是否有的把握认为观看该影片与性别有关?,.【答案】(1)列联表答案见解析;(2)没有的把握认为观看该影片与性别有关.【分析】(1)根据已知条件填写列联表.(2)计算的值,由此作出判断.【详解】(1)依题意得观看没观看合计男生14060200女生12030150合计26090350(2),所以没有的把握认为观看该影片与性别有关.5.(2021·四川成都市·树德中学高三其他模拟(文))某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费对年销售量(单位:)的影响.该公司对近7年的年宣传费和年销售量数据进行了研究,发现年宣传费(万元)和年销售量(单位:)具有线性相关关系,并对数据作了初步处理,得到下面的一些统计量的值.(万元)1234567(单位:)(1)根据表中数据建立年销售量关于年宣传费的回归方程(结果保留到0.001);(2)已知这种产品的年利润与,的关系为,根据(1)中的结果,估算该公司应该投入多少宣传费,才能使得年利润z最大.附:回归方程中的斜率和截距的最小二乘法估计公式分别为,,参考数据:,【答案】(1);(2)(万元).【分析】(1)由题求得,代入最小二乘估计公式,求得,从而求得回归方程;(2)根据(1)中结果,知,在对称轴处取最大值.【详解】(1)由题意,,,所以;(2)由(1)知,可知,当时,年利润最大,所以估算该公司.应该投入万元宣传费,才能使得年利润最大.6.(2023·广东江门·统考一模)某高科技公司对其产品研发年投资额x(单位:百万元)与其年销售量y(单位:千件)的数据进行统计,整理后得到如下统计表和散点图.x123456y136120(1)该公司科研团队通过分析散点图的特征后,计划分别用①和②两种方案作为年销售量y关于年投资额x的回归分析模型,请根据统计表的数据,确定方案①和②的经验回归方程;(注:系数b,a,d,c按四舍五入保留一位小数)(2)根据下表中数据,用相关指数(不必计算,只比较大小)比较两种模型的拟合效果哪个更好,并选择拟合精度更高、更可靠的模型,预测当研发年投资额为8百万元时,产品的年销售量是多少?经验回归方程残差平方和参考公式及数据:,,,,.【解析】(1)由题可得,,,,所以,,方案①回归方程,对两边取对数得:,令,是一元线性回归方程.

,,,方案②回归方程;(2)方案①相关指数;方案②相关指数,(有此结论即给分),故模型②的拟合效果更好,精度更高.当研发年投资额为8百万元时,产品的年销售量(千件).→➍专题训练←1.(2021·广西南宁三中高三其他模拟(文))英因数学家泰勒(B.Taylor,16851731)以发现泰勒公式和泰勒级数闻名于世.由泰勒公式,我们能得到(其中为自然对数的底数,,),其拉格朗日余项是.可以看出,右边的项用得越多,计算得到的的近似值也就越精确.若近似地表示的泰勒公式的拉格朗日余项,不超过时,正整数的最小值是()A.5 B.6 C.7 D.8【答案】B【分析】根据题意建立不等式,利用验证的方式求解即可.【详解】依题意得,即,,,所以的最小值是6.故选:B2.通过随机询问50名性别不同的大学生是否爱好某项运动,得到如下的列联表,计算得.参照临界值表,得到的正确结论是()爱好不爱好合计男生20525女生101525合计302050KA.有99.5%以上的把握认为“是否爱好该项运动与性别有关”B.有99.5%以上的把握认为“是否爱好该项运动与性别无关”C.有99.9%以上的把握认为“是否爱好该项运动与性别有关”D.有99.9%以上的把握认为“是否爱好该项运动与性别无关”【答案】A【解析】由,结合临界值表可得有99.5%以上的把握认为“是否爱好该项运动与性别有关”,或在犯错误的概率不超过0.5%的前提下,认为“是否爱好该项运动与性别有关”,故选:A.3.针对当下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有()附表:附:A. B. C. D.【答案】BC【解析】设男生的人数为,根据题意列出列联表如下表所示:男生女生合计喜欢抖音不喜欢抖音合计则,由于有的把握认为是否喜欢抖音和性别有关,则,即,得,,则的可能取值有、、、,因此,调查人数中男生人数的可能值为或.故选:BC.4.(2021·陕西高三其他模拟(理))某社区随机选取了部分居民,调查他们对今年春节期间社区组织文艺和体育活动的意见(每人只选择其中一项),调查结果如下表所示:文艺活动体育活动男性居民1520女性居民2510(1)判断能否有的把握认为居民选择的活动类型与性别有关;(2)用分层抽样方法,在样本中选择文艺活动的居民中按性别抽取8人,再从这8人中随机选3人,记这3人中男性居民的人数为,求的分布列和数学期望.附:,其中.【答案】(1)的把握认为居民选择的活动类型与性别有关;(2)分布列见详解,数学期望为.【分析】(1)根据独立性检验公式计算结果,再对比表格数据即可判断结果;(2)根据分层抽样计算公式求出各层人数,然后写出的可能取值,用超几何分布求解概率,从而得出分布与数学期望.【详解】(1)由所以有的把握认为居民选择的活动类型与性别有关;(2)用分层抽样方法,男性居民抽取人数为:女性居民抽取人数为:则的可能取值为:0,1,2,3.依题意得,,所以分布列为0123数学期望为.5.(2021·全国高三二模)某初中为了解学生的肥胖是否与经常饮用碳酸饮料有关,现对40名七年级学生进行了问卷调查,得到数据如表所示(平均每天喝以上为常喝,体重超过为肥胖.单位:人)经常饮用不经常饮用合计肥胖818不肥胖15合计40(1)将列联表补充完整,并回答能否有的把握认为学生是否肥胖和经常饮用碳酸饮料有关?(2)已知经常饮用碳酸饮料且肥胖的8名同学中,有5名男同学,3名女同学.现从这5名男同学和3名女同学中选5人进行家访,求被选中的男生人数的分布列和期望.参考公式及数据:,.【答案】(1)列联表答案见解析,没有的把握认为学生是否肥胖和经常饮用碳酸饮料有关;(2)分布列答案见解析,数学期望:.【详解】(1)经常饮用不经常饮用合计肥胖81018不肥胖71522合计152540由调查数据可知,的观测值没有的把握认为学生是否肥胖和经常饮用碳酸饮料有关.(2)被选中的男生人数的取值为2,3,4,5则,,,分布列为2345期望.6.(2021·全国高考真题(文))甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:k【答案】(1)75%;60%;(2)能.【分析】本题考查频率统计和独立性检验,属基础题,根据给出公式计算即可【详解】(1)甲机床生产的产品中的一级品的频率为,乙机床生产的产品中的一级品的频率为.(2),故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.7.(2021·陕西高三其他模拟(文))某社区随机选取了部分居民,调查他们对今年春节期间社区组织文艺和体育活动的意见(每人只选择其中一项),调查结果如下表所示:文艺活动体育活动男性居民女性居民(1)估计该社区男性居民中选择体育活动的概率和全体居民中选择文艺活动的概率;(2)判断能否有的把握认为居民选择的活动类型与性别有关.附:,其中.【答案】(1)该社区男性居民中选择体育活动的概率和全体居民中选择文艺活动的概率均为;(2)有,理由见解析.【分析】(1)利用表格中数据可计算得出该社区男性居民中选择体育活动的概率和全体居民中选择文艺活动的概率;(2)计算出的观测值,结合临界值表可得出结论.【详解】(1)由表格中的数据可知,该社区男性居民中选择体育活动的概率为,该社区全体居民中选择文艺活动的概率;(2)由表格中数据可得,因此,有的把握认为居民选择的活动类型与性别有关.8.(2021·四川德阳市·高三二模(文))针对时下的“网络文学热”,某班团委对“学生性别是否与喜欢网络文学有关”作了一次抽样调查,在抽取的样本中,女生人数是男生人数的,男生喜欢“网络文学”的人数占男生人数的,女生喜欢“网络文学”的人数占女生人数的.设抽取的男生人数为.(1)完成列联表,若有95%以上的把握认为喜欢“网络文学”与性别有关,求男生人数的最小值;喜欢网络文学不喜欢网络文学总计男生女生(2)已知数学科代表女生甲和语文科代表男生乙都喜欢网络文学且都在样本中,当取(1)中的最小值时,从喜欢网络文学的同学中抽取3名同学进行问卷调查,求同时抽到女生甲及男生乙的概率.附:,.【答案】(1)列联表答案见解析,男生人数的最小值为;(2).【分析】(1)根据已知条件填写列联表,计算出,由此列不等式,从而求得的最小值.(2)利用列举法,结合古典概型概率计算公式,计算出所求概率.【详解】(1)列联表为喜欢网络文学不喜欢网络文学总计男生女生总计所以.故男生人数的最小值为.(2)喜欢网络文学的同学中有男生2人(包含乙),女生4人(包含甲).分别用,乙表示男生,1,2,3,甲表示女生,则从6人中任意抽取3人的所有可能情况为乙1,乙2,乙3,乙甲,,,甲,,甲,甲,乙12,乙13,乙1甲,乙23,乙2甲,乙3甲,123,12甲,13甲,23甲,共20种,其中同时抽到女生甲及男生乙的有乙甲,乙1甲,乙2甲,乙3甲共4种情况,所以同时抽到女生甲及男生乙的概率为.9.(2021·合肥市第六中学高三其他模拟(文))树木根部半径与树木的高度呈正相关,即树木根部越粗,树木的高度也就越高.某块山地上种植了树木,某农科所为了研究树木的根部半径与树木的高度之间的关系,从这些地块中用简单随机抽样的方法抽取6棵树木,调查得到树木根部半径(单位:米)与树木高

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论