高考数学总复习《变量间的相关关系、统计案例》专项测试卷(含答案)_第1页
高考数学总复习《变量间的相关关系、统计案例》专项测试卷(含答案)_第2页
高考数学总复习《变量间的相关关系、统计案例》专项测试卷(含答案)_第3页
高考数学总复习《变量间的相关关系、统计案例》专项测试卷(含答案)_第4页
高考数学总复习《变量间的相关关系、统计案例》专项测试卷(含答案)_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第第页高考数学总复习《变量间的相关关系、统计案例》专项测试卷(含答案)学校:___________班级:___________姓名:___________考号:___________1、(2023年新高考天津卷)调查某种群花萼长度和花瓣长度,所得数据如图所示,其中相关系数,下列说法正确的是(

A.花瓣长度和花萼长度没有相关性B.花瓣长度和花萼长度呈现负相关C.花瓣长度和花萼长度呈现正相关D.若从样本中抽取一部分,则这部分的相关系数一定是2、(2021年全国新高考Ⅰ卷数学试题)(多选题)有一组样本数据,,…,,由这组数据得到新样本数据,,…,,其中(为非零常数,则()A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样数据的样本极差相同3、(2021年全国高考乙卷数学(文)试题)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.(1)求,,,;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).4、(2021年全国高考甲卷数学(理)试题)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:0.0500.0100.001k3.8416.63510.8284、(2023年全国甲卷数学(文)(理)).一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:对照组的小白鼠体重的增加量从小到大排序为15.2

18.8

20.2

21.3

22.5

23.2

25.8

26.5

27.5

30.132.6

34.3

34.8

35.6

35.6

35.8

36.2

37.3

40.5

43.2试验组的小白鼠体重的增加量从小到大排序为7.8

9.2

11.4

12.4

13.2

15.5

16.5

18.0

18.8

19.219.8

20.2

21.6

22.8

23.6

23.9

25.1

28.2

32.3

36.5(1)计算试验组的样本平均数;(2)(ⅰ)求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,完成如下列联表对照组试验组(ⅱ)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?附:,0.1000.0500.0102.7063.8416.635题组一、线性回归方程1-1、(2023·吉林通化·梅河口市第五中学校考一模)某地以“绿水青山就是金山银山”理念为引导,推进绿色发展,现要订购一批苗木,苗木长度与售价如下表:苗木长度x(cm)384858687888售价y(元)16.818.820.822.82425.8若苗木长度x(cm)与售价y(元)之间存在线性相关关系,其回归方程为,则当售价大约为38.9元时,苗木长度大约为(

)A.148cm B.150cm C.152cm D.154cm1-2、(2022·湖北江岸·高三期末)(多选题)某电子商务平台每年都会举行“年货节”商业促销狂欢活动,现在统计了该平台从2013年到2021年共9年“年货节”期间的销售额(单位:亿元)并作出散点图,将销售额y看成年份序号x(2013年作为第一年)的函数.运用excel软件,分别选择回归直线和三次函数回归曲线进行拟合,效果如下图,则下列说法正确的是()A.销售额y与年份序号x正相关B.销售额y与年份序号x线性关系不显著C.三次函数回归曲线的拟合效果好于回归直线的拟合效果D.根据三次函数回归曲线可以预测2022年“年货节”期间的销售额约为2680.54亿元1-3、(2023·黑龙江哈尔滨·哈师大附中统考三模)碳中和是指国家、企业、产品、活动或个人在一定时间内直接或间接产生的二氧化碳或温室气体排放总量,通过植树造林、节能减排等形式,以抵消自身产生的二氧化碳或温室气体排放量,实现正负抵消,达到相对"零排放."2020年9月22日,中国政府在第七十五届联合国大会上提出:"中国将提高国家自主贡献力度,采取更加有力的政策和措施,二氧化碳排放力争于2030年前达到峰值,努力争取2060年前实现碳中和.某工厂响应国家号召,随着对工业废气进行处理新技术不断升级,最近半年二氧化碳排放量逐月递减,具体数据如下表:月份序号123456碳排放量(吨)1007050352520并计算得.(1)这6个月中,任取2个月,求已知其中1个月的碳排放量低于6个月碳排放量的平均值的条件下,另1个月碳排放量高于6个月碳排放量的平均值的概率;(2)若用函数模型对两个变量月份与排放量进行拟合,根据表中数据,求出关于的回归方程.附:对于同一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为:1-4、(2023·河北唐山·统考三模)据统计,某城市居民年收入(所有居民在一年内收入的总和,单位:亿元)与某类商品销售额(单位:亿元)的10年数据如下表所示:第年12345678910居民年收入32.231.132.935.737.138.039.043.044.646.0商品销售额25.030.034.037.039.041.042.044.048.051.0依据表格数据,得到下面一些统计量的值.379.6391247.624568.9(1)根据表中数据,得到样本相关系数.以此推断,与的线性相关程度是否很强?(2)根据统计量的值与样本相关系数,建立关于的经验回归方程(系数精确到0.01);(3)根据(2)的经验回归方程,计算第1个样本点对应的残差(精确到0.01);并判断若剔除这个样本点再进行回归分析,的值将变大还是变小?(不必说明理由,直接判断即可).附:样本的相关系数,,,.题组二、独立性检验2-1、(2022·广东揭阳·高三期末)每年的毕业季都是高校毕业生求职和公司招聘最忙碌的时候,甲、乙两家公司今年分别提供了2个和3个不同的职位,一共收到了100份简历,具体数据如下:公司文史男文史女理工男理工女甲10102010乙1520105分析毕业生的选择意愿与性别的关联关系时,已知对应的的观测值;分析毕业生的选择意愿与专业关联的的观测值,则下列说法正确的是()A.有的把握认为毕业生的选择意愿与专业相关联B.毕业生在选择甲、乙公司时,选择意愿与专业的关联比与性别的关联性更大一些C.理科专业的学生更倾向于选择乙公司D.女性毕业生更倾向于选择甲公司2-2、(2023·河北沧州·校考模拟预测)(多选题)某学校为了调查学生对“只要学习够努力,成绩一定有奇迹”这句话的认可程度,随机调查了90名本校高一高二的学生,其中40名学生来自高一年级,50名学生来自高二年级,经调查,高一年级被调查的这40名学生中有20人认可,有20人不认可;高二年级被调查的这50名学生中有40人认可,有10人不认可,用样本估计总体,则下列说法正确的是(

)(参考数据:,,,)A.高一高二大约有66.7%的学生认可这句话B.高一高二大约有99%的学生认可这句话C.依据的独立性检验,认为学生对这句话认可与否与年级有关D.在犯错误的概率不超过0.01的前提下,认为学生对这句话认可与否与年级无关2-3、(2023·河南开封·统考三模)2022年国际篮联女篮世界杯在澳大利亚悉尼落下帷幕,中国女篮团结一心、顽强拼搏获得亚军.这届世界杯,中国女篮为国人留下了许多精彩瞬间和美好回忆,尤其是半决赛绝杀东道主澳大利亚堪称经典一幕.为了了解喜爱篮球运动是否与性别有关,某体育台随机抽取100名观众进行统计,得到如下列联表.男女合计喜爱30不喜爱40合计50100(1)将列联表补充完整,并判断能否在犯错误的概率不超过0.001的前提下认为喜爱篮球运动与性别有关?(2)在不喜爱篮球运动的观众中,按性别分别用分层抽样的方式抽取6人,再从这6人中随机抽取2人参加一台访谈节目,求这2人至少有一位男性的概率.附:,其中.0.0100.0050.0016.6357.87910.8282-4、(2023·湖南邵阳·统考三模)某电视台为了解不同性别的观众对同一档电视节目的评价情况,随机选取了100名观看该档节目的观众对这档电视节目进行评价,已知被选取的观众中“男性”与“女性”的人数之比为,评价结果分为“喜欢”和“不喜欢”,并将部分评价结果整理如下表所示.评价性别喜欢不喜欢合计男性15女性合计50100(1)根据所给数据,完成上面的列联表;(2)依据的独立性检验,能否认为性别因素与评价结果有关系?(3)电视台计划拓展男性观众市场,现从参与评价的男性中,按比例分层抽样的方法选取3人,进行节目“建言”征集奖励活动,其中评价结果为“不喜欢”的观众“建言”被采用的概率为,评价结果为“喜欢”的观众“建言”被采用的概率为,“建言”被采用奖励100元,“建言”不被采用奖励50元,记3人获得的总奖金为X,求X的分布列及数学期望.附:0.0100.0050.0016.6357.87910.8282-5、(2023·安徽·校联考三模)2022年卡塔尔世界杯是第二十二届世界杯足球赛,是历史上首次在卡塔尔和中东国家境内举行、也是第二次在亚洲举行的世界杯足球赛.卡塔尔世界杯后,某校为了激发学生对足球的兴趣,组建了足球社团.足球社团为了解学生喜欢足球是否与性别有关,随机抽取了男、女同学各100名进行调查,统计得出的数据如下表:喜欢足球不喜欢足球合计男生50女生25合计(1)根据所给数据完成上表,试根据小概率值的独立性检验,分析该校学生喜欢足球与性别是否有关.(2)社团指导老师从喜欢足球的学生中抽取了2名男生和1名女生示范点球,已知男生进球的概率为,女生进球的概率为,每人踢球一次,假设各人踢球相互独立,求3人进球总次数的分布列和数学期望.附:,.0.0500.0100.0013.8416.63510.828题组三、统计案例、线性回归分析与概率的综合3-1、(2022·河北张家口·高三期末)已知某区、两所初级中学的初一年级在校学生人数之比为,该区教育局为了解双减政策的落实情况,用分层抽样的方法在、两校初一年级在校学生中共抽取了名学生,调查了他们课下做作业的时间,并根据调查结果绘制了如下频率分布直方图:(1)在抽取的名学生中,、两所学校各抽取的人数是多少?(2)该区教育局想了解学生做作业时间的平均时长(同一组中的数据用该组区间的中点值作代表)和做作业时长超过小时的学生比例,请根据频率分布直方图,估计这两个数值;(3)另据调查,这人中做作业时间超过小时的人中的人来自中学,根据已知条件填写下面列联表,并根据列联表判断是否有的把握认为“做作业时间超过小时”与“学校”有关?做作业时间超过小时做作业时间不超过小时合计校校合计附表:附:.3-2、(2023·江苏南京·校考一模)2020年将全面建成小康社会,是党向人民作出的庄严承诺.目前脱贫攻坚已经进入冲刺阶段,某贫困县平原地区家庭与山区家庭的户数之比为.用分层抽样的方法,收集了100户家庭2019年家庭年收入数据(单位:万元),绘制的频率直方图如图所示,样本中家庭年收入超过1.5万元的有10户居住在山区.(1)完成2019年家庭年收入与地区的列联表,并判断是否有99.9%的把握认为该县2019年家庭年收入超过1.5万元与地区有关.超过1.5万元不超过1.5万元总计平原地区山区10总计附:,其中.0.1000.0500.0100.001k2.7063.8416.63510.828(2)根据这100个样本数据,将频率视为概率.为了更好地落实党中央精准扶贫的决策,从2020年9月到12月,每月从该县2019年家庭年收入不超过1.5万元的家庭中选取4户作为“县长联系家庭”,记“县长联系家庭”是山区家庭的户数为,求X的分布列和数学期望.1、(2023·安徽黄山·统考三模)(多选题)下列命题中,正确的是(

)A.在回归分析中,可用决定系数的值判断模型的拟合效果,越大,模型的拟合效果越好B.对分类变量与的统计量来说,值越小,判断“与有关系”的把握程度越大C.在回归模型中,残差是观测值与预测值的差,残差点所在的带状区域宽度越窄,说明模型拟合精度越高D.一组数据的第百分位数为2、(2023·云南红河·统考一模)(多选题)某校高三一名数学教师从该校高三学生中随机抽取男、女生各50名进行了身高统计,得到男、女身高分别近似服从正态分布和,并对其是否喜欢体育锻炼进行数据统计,得到如下2×2列联表:喜欢不喜欢合计男生37m50女生n3250合计5545100参考公式:α0.010.0050.0016.6357.87910.828则下列说法正确的是(

)A.,B.男生身高的平均数约为173,女生身高的平均数约为164C.男生身高的标准差约为11,女生身高的标准差约为9D.依据的独立性检验,认为喜欢体育锻炼与性别有关联3、(2023·江苏连云港·统考模拟预测)为了研究高三(1)班女生的身高x(单位;cm)与体重y(单位:kg)的关系,从该班随机抽取10名女生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为.已知,,.该班某女生的身高为170cm,据此估计其体重为________________kg.4、(2023·山西运城·统考三模)数据显示中国车载音乐已步入快速发展期,随着车载音乐的商业化模式进一步完善,市场将持续扩大,下表为2018—2022年中国车载音乐市场规模(单位:十亿元),其中年份2018—2022对应的代码分别为1—5.年份代码x12345车载音乐市场规模y2.83.97.312.017.0(1)由上表数据知,可用指数函数模型拟合y与x的关系,请建立y关于x的回归方程(a,b的值精确到0.1);(2)综合考虑2023年及2024年的经济环境及疫情等因素,某预测公司根据上述数据求得y关于x的回归方程后,通过修正,把b-1.3作为2023年与2024年这两年的年平均增长率,请根据2022年中国车载音乐市场规模及修正后的年平均增长率预测2024年的中国车载音乐市场规模.参考数据:1.9433.821.71.6其中,.参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘法估计公式分别为.5、(2023·江苏南通·统考一模)第二十二届卡塔尔世界杯足球赛(FIFAWorldCupQatar2022)决赛中,阿根廷队通过扣人心弦的点球大战战胜了法国队.某校为了丰富学生课余生活,组建了足球社团.足球社团为了解学生喜欢足球是否与性别有关,随机抽取了男、女同学各100名进行调查,部分数据如表所示:喜欢足球不喜欢足球合计男生40女生30合计(1)根据所给数据完成上表,并判断是否有的把握认为该校学生喜欢足球与性别有关?(2)社团指导老师从喜欢足球的学生中抽取了2名男生和1名女生示范点球射门.已知男生进球的概率为,女生进球的概率为,每人射门一次,假设各人射门相互独立,求3人进球总次数的分布列和数学期望.附:.6、(2022·广东清远·高三期末)某市为积极响应上级部门的号召,通过沿街电子屏、微信公众号等各种渠道对抗疫进行了深入的宣传,帮助全体市民深入了解新型冠状病毒,增强战胜疫情的信心.为了检验大家对新型冠状病毒及防控知识的了解程度,该市推出了相关的问卷调查,随机抽取了年龄在18~99岁之间的200人进行调查,把年龄在和内的人分别称为“青年人”和“中老年人”.经统计,“青年人”和“中老年人”的人数之比为2∶3,其中“青年人”中有50%的人对防控的相关知识了解全面,“中老年人”中对防控的相关知识了解全面和了解不全面的人数之比是2∶1.(1)根据已知条件,完成下面的列联表,并根据统计结果判断是否有95%的把握认为“中老年人”比“青年人”更加了解防控的相关知识.了解全面了解不全面合计青年人中老年人合计(2)用频率估计概率从该市18~99岁市民中随机抽取3位市民,记抽出的市民对防控相关知识了解全面的人数为X,求随机变量X的分布列与数学期望.附表及公式:,其中.0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828参考答案1、(2023年新高考天津卷)调查某种群花萼长度和花瓣长度,所得数据如图所示,其中相关系数,下列说法正确的是(

A.花瓣长度和花萼长度没有相关性B.花瓣长度和花萼长度呈现负相关C.花瓣长度和花萼长度呈现正相关D.若从样本中抽取一部分,则这部分的相关系数一定是【答案】C【详解】根据散点的集中程度可知,花瓣长度和花萼长度有相关性,A选项错误散点的分布是从左下到右上,从而花瓣长度和花萼长度呈现正相关性,B选项错误,C选项正确;由于是全部数据的相关系数,取出来一部分数据,相关性可能变强,可能变弱,即取出的数据的相关系数不一定是,D选项错误故选:C2、(2021年全国新高考Ⅰ卷数学试题)有一组样本数据,,…,,由这组数据得到新样本数据,,…,,其中(为非零常数,则()A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样数据的样本极差相同【答案】CD【解析】A:且,故平均数不相同,错误;B:若第一组中位数为,则第二组的中位数为,显然不相同,错误;C:,故方差相同,正确;D:由极差的定义知:若第一组的极差为,则第二组的极差为,故极差相同,正确;故选:CD3、(2021年全国高考乙卷数学(文)试题)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.(1)求,,,;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).【答案】(1);(2)新设备生产产品的该项指标的均值较旧设备有显著提高.【解析】(1),,,.(2)依题意,,,,所以新设备生产产品的该项指标的均值较旧设备有显著提高.4、(2021年全国高考甲卷数学(理)试题)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:0.0500.0100.001k3.8416.63510.828【解析】(1)甲机床生产的产品中的一级品的频率为,乙机床生产的产品中的一级品的频率为.(2),故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.4、(2023年全国甲卷数学(文)(理)).一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:对照组的小白鼠体重的增加量从小到大排序为15.2

18.8

20.2

21.3

22.5

23.2

25.8

26.5

27.5

30.132.6

34.3

34.8

35.6

35.6

35.8

36.2

37.3

40.5

43.2试验组的小白鼠体重的增加量从小到大排序为7.8

9.2

11.4

12.4

13.2

15.5

16.5

18.0

18.8

19.219.8

20.2

21.6

22.8

23.6

23.9

25.1

28.2

32.3

36.5(1)计算试验组的样本平均数;(2)(ⅰ)求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,完成如下列联表对照组试验组(ⅱ)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?附:,0.1000.0500.0102.7063.8416.635【答案】(1)(2)(i);列联表见解析,(ii)能【详解】(1)试验组样本平均数为:(2)(i)依题意,可知这40只小鼠体重的中位数是将两组数据合在一起,从小到大排后第20位与第21位数据的平均数,由原数据可得第11位数据为,后续依次为,故第20位为,第21位数据为,所以,故列联表为:合计对照组61420试验组14620合计202040(ii)由(i)可得,,所以能有的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异.题组一、线性回归方程1-1、(2023·吉林通化·梅河口市第五中学校考一模)某地以“绿水青山就是金山银山”理念为引导,推进绿色发展,现要订购一批苗木,苗木长度与售价如下表:苗木长度x(cm)384858687888售价y(元)16.818.820.822.82425.8若苗木长度x(cm)与售价y(元)之间存在线性相关关系,其回归方程为,则当售价大约为38.9元时,苗木长度大约为(

)A.148cm B.150cm C.152cm D.154cm【答案】B【分析】根据表格中的数据求出样本点中心,根据回归直线经过样本点中心求出,再将代入回归方程可求出结果.【详解】因为,,所以样本点中心为,又回归直线经过,所以,所以,所以回归方程为,当元时,厘米.则当售价大约为元时,苗木长度大约为150厘米.故选:B.1-2、(2022·湖北江岸·高三期末)(多选题)某电子商务平台每年都会举行“年货节”商业促销狂欢活动,现在统计了该平台从2013年到2021年共9年“年货节”期间的销售额(单位:亿元)并作出散点图,将销售额y看成年份序号x(2013年作为第一年)的函数.运用excel软件,分别选择回归直线和三次函数回归曲线进行拟合,效果如下图,则下列说法正确的是()A.销售额y与年份序号x正相关B.销售额y与年份序号x线性关系不显著C.三次函数回归曲线的拟合效果好于回归直线的拟合效果D.根据三次函数回归曲线可以预测2022年“年货节”期间的销售额约为2680.54亿元【答案】ACD【解析】根据图象可知,散点从左下到右上分布,销售额与年份序号呈正相关关系,故A正确;因为相关系数,靠近,销售额与年份序号线性相关显著,B错误.根据三次函数回归曲线的相关指数,相关指数越大,拟合效果越好,所以三次多项式回归曲线的拟合效果好于回归直线的拟合效果,C正确;由三次多项式函数,当时,亿元,D正确;故选:ACD1-3、(2023·黑龙江哈尔滨·哈师大附中统考三模)碳中和是指国家、企业、产品、活动或个人在一定时间内直接或间接产生的二氧化碳或温室气体排放总量,通过植树造林、节能减排等形式,以抵消自身产生的二氧化碳或温室气体排放量,实现正负抵消,达到相对"零排放."2020年9月22日,中国政府在第七十五届联合国大会上提出:"中国将提高国家自主贡献力度,采取更加有力的政策和措施,二氧化碳排放力争于2030年前达到峰值,努力争取2060年前实现碳中和.某工厂响应国家号召,随着对工业废气进行处理新技术不断升级,最近半年二氧化碳排放量逐月递减,具体数据如下表:月份序号123456碳排放量(吨)1007050352520并计算得.(1)这6个月中,任取2个月,求已知其中1个月的碳排放量低于6个月碳排放量的平均值的条件下,另1个月碳排放量高于6个月碳排放量的平均值的概率;(2)若用函数模型对两个变量月份与排放量进行拟合,根据表中数据,求出关于的回归方程.附:对于同一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为:【答案】(1);(2).【详解】(1)6个月碳排放量的平均值为,因此碳排放量低于50的有3个月,“从6个月中,任取2个月,其中一个月碳排放量低于50”为事件,“1个月碳排放量高于50”为事件,,,由条件概率公式可得所以所求概率为.(2)由,两边取对数得,而,,因此,,所以回归方程为:,即,亦即,所以关于的回归方程是.1-4、(2023·河北唐山·统考三模)据统计,某城市居民年收入(所有居民在一年内收入的总和,单位:亿元)与某类商品销售额(单位:亿元)的10年数据如下表所示:第年12345678910居民年收入32.231.132.935.737.138.039.043.044.646.0商品销售额25.030.034.037.039.041.042.044.048.051.0依据表格数据,得到下面一些统计量的值.379.6391247.624568.9(1)根据表中数据,得到样本相关系数.以此推断,与的线性相关程度是否很强?(2)根据统计量的值与样本相关系数,建立关于的经验回归方程(系数精确到0.01);(3)根据(2)的经验回归方程,计算第1个样本点对应的残差(精确到0.01);并判断若剔除这个样本点再进行回归分析,的值将变大还是变小?(不必说明理由,直接判断即可).附:样本的相关系数,,,.【答案】(1)线性相关程度很强(2)(3),变小【详解】(1)根据样本相关系数,可以推断线性相关程度很强.(2)由及,可得,所以,又因为,所以,所以与的线性回归方程.(3)第一个样本点的残差为:,由于该点在回归直线的左下方,故将其剔除后,的值将变小.题组二、独立性检验2-1、(2022·广东揭阳·高三期末)每年的毕业季都是高校毕业生求职和公司招聘最忙碌的时候,甲、乙两家公司今年分别提供了2个和3个不同的职位,一共收到了100份简历,具体数据如下:公司文史男文史女理工男理工女甲10102010乙1520105分析毕业生的选择意愿与性别的关联关系时,已知对应的的观测值;分析毕业生的选择意愿与专业关联的的观测值,则下列说法正确的是()A.有的把握认为毕业生的选择意愿与专业相关联B.毕业生在选择甲、乙公司时,选择意愿与专业的关联比与性别的关联性更大一些C.理科专业的学生更倾向于选择乙公司D.女性毕业生更倾向于选择甲公司【答案】B【解析】解:与专业关联的的观测值,明显大于,明显小于,所以有的把握认为毕业生的选择意愿与专业相关联,所以不正确;因为,故正确;根据题中的数据表列出专业与甲、乙公司的关联表可知,理科专业的学生更倾向于选择甲公司,列出性别与甲、乙公司的关联表可知,女性毕业生更倾向于选择乙公司,所以C,D均不正确.故选:B.2-2、(2023·河北沧州·校考模拟预测)某学校为了调查学生对“只要学习够努力,成绩一定有奇迹”这句话的认可程度,随机调查了90名本校高一高二的学生,其中40名学生来自高一年级,50名学生来自高二年级,经调查,高一年级被调查的这40名学生中有20人认可,有20人不认可;高二年级被调查的这50名学生中有40人认可,有10人不认可,用样本估计总体,则下列说法正确的是(

)(参考数据:,,,)A.高一高二大约有66.7%的学生认可这句话B.高一高二大约有99%的学生认可这句话C.依据的独立性检验,认为学生对这句话认可与否与年级有关D.在犯错误的概率不超过0.01的前提下,认为学生对这句话认可与否与年级无关【答案】AC【详解】随机调查了90名学生,其中一共有60名学生认可,所以认可率大约为66.7%,故A正确,B错误;,又因为,故C正确、D错误,故选:AC.2-3、(2023·河南开封·统考三模)2022年国际篮联女篮世界杯在澳大利亚悉尼落下帷幕,中国女篮团结一心、顽强拼搏获得亚军.这届世界杯,中国女篮为国人留下了许多精彩瞬间和美好回忆,尤其是半决赛绝杀东道主澳大利亚堪称经典一幕.为了了解喜爱篮球运动是否与性别有关,某体育台随机抽取100名观众进行统计,得到如下列联表.男女合计喜爱30不喜爱40合计50100(1)将列联表补充完整,并判断能否在犯错误的概率不超过0.001的前提下认为喜爱篮球运动与性别有关?(2)在不喜爱篮球运动的观众中,按性别分别用分层抽样的方式抽取6人,再从这6人中随机抽取2人参加一台访谈节目,求这2人至少有一位男性的概率.附:,其中.0.0100.0050.0016.6357.87910.828【答案】(1)列联表见解析,在犯错误的概率不超过0.001的前提下认为喜爱篮球运动与性别有关(2)【详解】(1)由题意进行数据分析,得到列联表如下:男女合计喜爱301040不喜爱204060合计5050100计算,所以在犯错误的概率不超过0.001的前提下认为喜爱篮球运动与性别有关;(2)不喜爱篮球运动的观众中,有男观众20人,女观众40人,按照分层抽样的方式抽取6人,有男观众2人,记为、,女观众4人,记为1、2、3、4,从6人中抽取2人,有:,,,,,,,,,12,13,14,23,24,34,共15个,记“所抽2人至少有一位男性”为事件,包含:,,,,,,,,,共9个.所以.2-4、(2023·湖南邵阳·统考三模)某电视台为了解不同性别的观众对同一档电视节目的评价情况,随机选取了100名观看该档节目的观众对这档电视节目进行评价,已知被选取的观众中“男性”与“女性”的人数之比为,评价结果分为“喜欢”和“不喜欢”,并将部分评价结果整理如下表所示.评价性别喜欢不喜欢合计男性15女性合计50100(1)根据所给数据,完成上面的列联表;(2)依据的独立性检验,能否认为性别因素与评价结果有关系?(3)电视台计划拓展男性观众市场,现从参与评价的男性中,按比例分层抽样的方法选取3人,进行节目“建言”征集奖励活动,其中评价结果为“不喜欢”的观众“建言”被采用的概率为,评价结果为“喜欢”的观众“建言”被采用的概率为,“建言”被采用奖励100元,“建言”不被采用奖励50元,记3人获得的总奖金为X,求X的分布列及数学期望.附:0.0100.0050.0016.6357.87910.828【答案】(1)列联表见解析(2)能认为性别因素与评价结果有关系(3)分布列见解析,【详解】(1)男性有人,女性有人,然后可得下表:评价性别喜欢不喜欢合计男性153045女性352055合计5050100(2)零假设:假设性别因素与评价结果无关,计算卡方值,小概率值对应的临界值为,所以.故推断零假设不成立,评价结果与性别有关系.(3)由题意得,选取的3人中,评价结果“喜欢”的为1人,“不喜欢”的为2人.所以的所有可能取值为.则,...150200250300数学期望为.2-5、(2023·安徽·校联考三模)2022年卡塔尔世界杯是第二十二届世界杯足球赛,是历史上首次在卡塔尔和中东国家境内举行、也是第二次在亚洲举行的世界杯足球赛.卡塔尔世界杯后,某校为了激发学生对足球的兴趣,组建了足球社团.足球社团为了解学生喜欢足球是否与性别有关,随机抽取了男、女同学各100名进行调查,统计得出的数据如下表:喜欢足球不喜欢足球合计男生50女生25合计(1)根据所给数据完成上表,试根据小概率值的独立性检验,分析该校学生喜欢足球与性别是否有关.(2)社团指导老师从喜欢足球的学生中抽取了2名男生和1名女生示范点球,已知男生进球的概率为,女生进球的概率为,每人踢球一次,假设各人踢球相互独立,求3人进球总次数的分布列和数学期望.附:,.0.0500.0100.0013.8416.63510.828【详解】(1)因为随机抽取了男、女同学各100名进行调查,男生不喜欢篮球的有50人,女生喜欢篮球的有25人,所以男生喜欢篮球的有50人,女生不喜欢篮球的有75人.列联表如下:喜欢篮球不喜欢篮球合计男生5050100女生2575100合计75125200零假设为:该校学生喜欢篮球与性别无关.根据列联表中的数据,经计算得到,∴根据小概率值的独立性检验,我们推断不成立,即认为该校学生喜欢篮球与性别有关.(2)3人进球总次数的所有可能取值为0,1,2,3.,,,.∴的分布列如下:0123P∴的数学期望:题组三、统计案例、线性回归分析与概率的综合3-1、(2022·河北张家口·高三期末)已知某区、两所初级中学的初一年级在校学生人数之比为,该区教育局为了解双减政策的落实情况,用分层抽样的方法在、两校初一年级在校学生中共抽取了名学生,调查了他们课下做作业的时间,并根据调查结果绘制了如下频率分布直方图:(1)在抽取的名学生中,、两所学校各抽取的人数是多少?(2)该区教育局想了解学生做作业时间的平均时长(同一组中的数据用该组区间的中点值作代表)和做作业时长超过小时的学生比例,请根据频率分布直方图,估计这两个数值;(3)另据调查,这人中做作业时间超过小时的人中的人来自中学,根据已知条件填写下面列联表,并根据列联表判断是否有的把握认为“做作业时间超过小时”与“学校”有关?做作业时间超过小时做作业时间不超过小时合计校校合计附表:附:.【解析】【分析】(1)设、两校所抽取人数分别为、,根据已知条件列出关于、的方程组,解出这两个量的值,即可得解;(2)将频率分布直方图中每个矩形底边的中点值乘以对应矩形的面积,可得出该区学生做作业时间的平均时长,计算出频率直方图中后三个矩形的面积之和,可得出该地区做作业时长超过小时的学生比例;(3)根据题中信息完善列联表,计算出的观测值,结合临界值表可得出结论.(1)解:设、两校所抽取人数分别为、,由已知可得,解得.(2)解:由直方图可知,学生做作业的平均时长的估计值为(小时).由,可知有的学生做作业时长超过小时.综上,估计该区学生做作业时间的平均时长为小时,该区有的学生做作业时长超过3小时.(3)解:由(2)可知,有(人)做作业时间超过3小时.故填表如下(单位:人):做作业时间超过小时做作业时间不超过小时合计校校合计,所以有的把握认为“做作业时间超过小时”与“学校”有关3-2、(2023·江苏南京·校考一模)2020年将全面建成小康社会,是党向人民作出的庄严承诺.目前脱贫攻坚已经进入冲刺阶段,某贫困县平原地区家庭与山区家庭的户数之比为.用分层抽样的方法,收集了100户家庭2019年家庭年收入数据(单位:万元),绘制的频率直方图如图所示,样本中家庭年收入超过1.5万元的有10户居住在山区.(1)完成2019年家庭年收入与地区的列联表,并判断是否有99.9%的把握认为该县2019年家庭年收入超过1.5万元与地区有关.超过1.5万元不超过1.5万元总计平原地区山区10总计附:,其中.0.1000.0500.0100.001k2.7063.8416.63510.828(2)根据这100个样本数据,将频率视为概率.为了更好地落实党中央精准扶贫的决策,从2020年9月到12月,每月从该县2019年家庭年收入不超过1.5万元的家庭中选取4户作为“县长联系家庭”,记“县长联系家庭”是山区家庭的户数为,求X的分布列和数学期望.【答案】(1)列联表见解析,有99.9%的把握认为该县2019年家庭年收入超过1.5万元与地区有关;(2)分布列见解析,数学期望.【分析】(1)由频率分布直方图求样本中收入超过1.5万元的户数,由分层抽样性质确定平原地区家庭与山区家庭的户数,根据数据关系完成列联表,由公式计算,与临界值比较大小,确定是否接受假设;(2)确定随机变量的可能取值,求取各值的概率,由此可得其分布列,判断为二项分布,利用二项分布概率公式求其期望.【详解】(1)由频率分布直方图可知,收入超过1.5万元的家庭的频率为,所以收入超过1.5万元的家庭的户数有户,又因为平原地区家庭与山区家庭的户数之比为,抽取了100户,故平原地区的共有60户,山区地区的共有40户,又样本中家庭年收入超过1.5万元的有10户居住在山区,所以超过1.5万元的有40户居住在平原地区,不超过1.5万元的有20户住在平原地区,有30户住在山区地区,故2019年家庭年收入与地区的列联表如下:超过1.5万元不超过1.5万元总计平原地区402060山区103040总计5050100则,所以有99.9%的把握认为该县2019年家庭年收入超过1.5万元与地区有关.(2)由(1)可知,选1户家庭在平原的概率为,山区的概率为,X的可能取值为0,1,2,3,4,所以,,,,,所以X的分布列为:X01234P因为X服从二项分布,所以X的数学期望.1、(2023·安徽黄山·统考三模)(多选题)下列命题中,正确的是(

)A.在回归分析中,可用决定系数的值判断模型的拟合效果,越大,模型的拟合效果越好B.对分类变量与的统计量来说,值越小,判断“与有关系”的把握程度越大C.在回归模型中,残差是观测值与预测值的差,残差点所在的带状区域宽度越窄,说明模型拟合精度越高D.一组数据的第百分位数为【答案】ACD【详解】对于A,由相关指数的定义知:越大,模型的拟合效果越好,A正确;对于B,由独立性检验的思想知:值越大,“与有关系”的把握程度越大,B错误.对于C,残差点所在的带状区域宽度越窄,则残差平方和越小,模型拟合精度越高,C正确;对于D,,第百分位数为第7位95,D正确.故选:.2、(2023·云南红河·统考一模)(多选题)某校高三一名数学教师从该校高三学生中随机抽取男、女生各50名进行了身高统计,得到男、女身高分别近似服从正态分布和,并对其是否喜欢体育锻炼进行数据统计,得到如下2×2列联表:喜欢不喜欢合计男生37m50女生n3250合计5545100参考公式:α0.010.0050.0016.6357.87910.828则下列说法正确的是(

)A.,B.男生身高的平均数约为173,女生身高的平均数约为164C.男生身高的标准差约为11,女生身高的标准差约为9D.依据的独立性检验,认为喜欢体育锻炼与性别有关联【答案】ABD【分析】A选项,根据列联表中数据分析求出,A正确;BC选项,由男、女身高分别近似服从正态分布和,得到平均数和标准差;D选项,计算出卡方,与6.635比较大小后得到结论.【详解】对于A.因为,,算得,,故A正确:对于B,在正态分布中,μ约为平均数,所以男生身高的平均数约为173,女生身高的平均数约为164,故B正确;对于C,在正态分布中,为方差,为标准差,男生身高的标准差为,女生身高的标准差为3,故C不正确;对于D,由,依据的独立性检验,认为喜欢体育锻炼与性别有关联,故D正确.故选:ABD.3、(2023·江苏连云港·统考模拟预测)为了研究高三(1)班女生的身高x(单位;cm)与体重y(单位:kg)的关系,从该班随机抽取10名女生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为.已知,,.该班某女生的身高为170cm,据此估计其体重为________________kg.【答案】54.5【分析】计算出样本中心点,代入回归直线方程,得到,从而估计出该女生的体重.【详解】,,故,解得:,故回归直线方程为,则当时,(kg).故答案为:54.5.4、(2023·山西运城·统考三模)数据显示中国车载音乐已步入快速发展期,随着车载音乐的商业化模式进一步完善,市场将持续扩大,下表为2018—2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论