![2025年高考数学二轮复习 专题五 概率与统计 第3讲 统计与成对数据的分析解析版_第1页](http://file4.renrendoc.com/view12/M00/0A/0F/wKhkGWdbvS6APh7tAADyKTyvL6k058.jpg)
![2025年高考数学二轮复习 专题五 概率与统计 第3讲 统计与成对数据的分析解析版_第2页](http://file4.renrendoc.com/view12/M00/0A/0F/wKhkGWdbvS6APh7tAADyKTyvL6k0582.jpg)
![2025年高考数学二轮复习 专题五 概率与统计 第3讲 统计与成对数据的分析解析版_第3页](http://file4.renrendoc.com/view12/M00/0A/0F/wKhkGWdbvS6APh7tAADyKTyvL6k0583.jpg)
![2025年高考数学二轮复习 专题五 概率与统计 第3讲 统计与成对数据的分析解析版_第4页](http://file4.renrendoc.com/view12/M00/0A/0F/wKhkGWdbvS6APh7tAADyKTyvL6k0584.jpg)
![2025年高考数学二轮复习 专题五 概率与统计 第3讲 统计与成对数据的分析解析版_第5页](http://file4.renrendoc.com/view12/M00/0A/0F/wKhkGWdbvS6APh7tAADyKTyvL6k0585.jpg)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3讲统计与成对数据的分析(新高考专用)目录目录【真题自测】 2【考点突破】 9【考点一】统计图表、数字特征 9【考点二】回归分析 14【考点三】独立性检验 22【专题精练】 29考情分析:高考对本讲内容的考查往往以实际问题为背景,考查随机抽样与用样本估计总体、经验回归方程的求解与运用、独立性检验问题,常与概率综合考查,中等难度.真题自测真题自测一、单选题1.(2024·全国·高考真题)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理如下表亩产量[900,950)[950,1000)[1000,1050)[1050,1100)[1100,1150)[1150,1200)频数61218302410根据表中数据,下列结论中正确的是(
)A.100块稻田亩产量的中位数小于1050kgB.100块稻田中亩产量低于1100kg的稻田所占比例超过80%C.100块稻田亩产量的极差介于200kg至300kg之间D.100块稻田亩产量的平均值介于900kg至1000kg之间2.(2023·全国·高考真题)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则不同的抽样结果共有(
).A.种 B.种C.种 D.种3.(2022·全国·高考真题)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则(
)A.讲座前问卷答题的正确率的中位数小于B.讲座后问卷答题的正确率的平均数大于C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差二、解答题4.(2022·全国·高考真题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:不够良好良好病例组4060对照组1090(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”.与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.(ⅰ)证明:;(ⅱ)利用该调查数据,给出的估计值,并利用(ⅰ)的结果给出R的估计值.附,0.0500.0100.001k3.8416.63510.8285.(2022·全国·高考真题)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:样本号i12345678910总和根部横截面积0.040.060.040.080.080.050.050.070.070.060.6材积量0.250.400.220.540.510.340.360.460.420.403.9并计算得.(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:相关系数.6.(2023·全国·高考真题)一项试验旨在研究臭氧效应.实验方案如下:选40只小白鼠,随机地将其中20只分配到实验组,另外20只分配到对照组,实验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).(1)设表示指定的两只小白鼠中分配到对照组的只数,求的分布列和数学期望;(2)实验结果如下:对照组的小白鼠体重的增加量从小到大排序为:15.2
18.8
20.2
21.3
22.5
23.2
25.8
26.5
27.5
30.132.6
34.3
34.8
35.6
35.6
35.8
36.2
37.3
40.5
43.2实验组的小白鼠体重的增加量从小到大排序为:7.8
9.2
11.4
12.4
13.2
15.5
16.5
18.0
18.8
19.219.8
20.2
21.6
22.8
23.6
23.9
25.1
28.2
32.3
36.5(i)求40只小鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于的数据的个数,完成如下列联表:对照组实验组(ii)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与正常环境中体重的增加量有差异.附:0.1000.0500.0102.7063.8416.635参考答案:题号123答案CDB1.C【分析】计算出前三段频数即可判断A;计算出低于1100kg的频数,再计算比例即可判断B;根据极差计算方法即可判断C;根据平均值计算公式即可判断D.【详解】对于A,根据频数分布表可知,,所以亩产量的中位数不小于,故A错误;对于B,亩产量不低于的频数为,所以低于的稻田占比为,故B错误;对于C,稻田亩产量的极差最大为,最小为,故C正确;对于D,由频数分布表可得,平均值为,故D错误.故选;C.2.D【分析】利用分层抽样的原理和组合公式即可得到答案.【详解】根据分层抽样的定义知初中部共抽取人,高中部共抽取,根据组合公式和分步计数原理则不同的抽样结果共有种.故选:D.3.B【分析】由图表信息,结合中位数、平均数、标准差、极差的概念,逐项判断即可得解.【详解】讲座前中位数为,所以错;讲座后问卷答题的正确率只有一个是个,剩下全部大于等于,所以讲座后问卷答题的正确率的平均数大于,所以B对;讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C错;讲座后问卷答题的正确率的极差为,讲座前问卷答题的正确率的极差为,所以错.故选:B.4.(1)答案见解析(2)(i)证明见解析;(ii);【分析】(1)由所给数据结合公式求出的值,将其与临界值比较大小,由此确定是否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异;(2)(i)根据定义结合条件概率公式即可完成证明;(ii)根据(i)结合已知数据求.【详解】(1)由已知,又,,所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.(2)(i)因为,所以所以,(ii)由已知,,又,,所以5.(1);(2)(3)【分析】(1)计算出样本的一棵根部横截面积的平均值及一棵材积量平均值,即可估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)代入题给相关系数公式去计算即可求得样本的相关系数值;(3)依据树木的材积量与其根部横截面积近似成正比,列方程即可求得该林区这种树木的总材积量的估计值.【详解】(1)样本中10棵这种树木的根部横截面积的平均值样本中10棵这种树木的材积量的平均值据此可估计该林区这种树木平均一棵的根部横截面积为,平均一棵的材积量为(2)则(3)设该林区这种树木的总材积量的估计值为,又已知树木的材积量与其根部横截面积近似成正比,可得,解之得.则该林区这种树木的总材积量估计为6.(1)分布列见解析,(2)(i);列联表见解析,(ii)能【分析】(1)利用超几何分布的知识即可求得分布列及数学期望;(2)(i)根据中位数的定义即可求得,从而求得列联表;(ii)利用独立性检验的卡方计算进行检验,即可得解.【详解】(1)依题意,的可能取值为,则,,,所以的分布列为:故.(2)(i)依题意,可知这40只小白鼠体重增量的中位数是将两组数据合在一起,从小到大排后第20位与第21位数据的平均数,观察数据可得第20位为,第21位数据为,所以,故列联表为:合计对照组61420实验组14620合计202040(ii)由(i)可得,,所以能有的把握认为小白鼠在高浓度臭氧环境中与正常环境中体重的增加量有差异.考点突破考点突破【考点一】统计图表、数字特征核心梳理:1.频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示eq\f(频率,组距),频率=组距×eq\f(频率,组距).2.在频率分布直方图中各小长方形的面积之和为1.3.利用频率分布直方图求众数、中位数与平均数.(1)最高的小长方形底边中点的横坐标即众数.(2)中位数左边和右边的小长方形的面积和相等.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.一、单选题1.(2024·四川·模拟预测)甲、乙两名运动员在一次射击训练中各射靶20次,命中环数的频率分布条形图如下.设甲、乙命中环数的众数分别为,,方差分别为,,则(
)A., B.,C., D.,2.(2024·辽宁·一模)下图是2022年5月一2023年5月共13个月我国纯电动汽车月度销量及增长情况统计图(单位:万辆),则下列说法错误的是(
)(注:同比:和上一年同期相比)
A.2023年前5个月我国纯电动汽车的销量超过214万辆B.这13个月我国纯电动汽车月度销量的中位数为61.5万辆C.这13个月我国纯电动汽车月度销量的众数为52.2万辆D.和上一年同期相比,我国纯电动汽车月度销量有增有减二、多选题3.(2024·河南·模拟预测)某地教师招聘考试,有3200人参加笔试,满分为100分,笔试成绩前20%(含20%)的考生有资格参加面试,所有考生的笔试成绩和年龄分别如频率分布直方图和扇形统计图所示,则(
)A.90后考生比00后考生多150人 B.笔试成绩的60%分位数为80C.参加面试的考生的成绩最低为86分 D.笔试成绩的平均分为76分4.(2024·广东汕头·一模)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了名学生的成绩,整理得到如图所示的频率分布直方图.为进一步分析高分学生的成绩分布情况,计算得到这名学生中,成绩位于80,90内的学生成绩方差为,成绩位于内的同学成绩方差为.则(
)参考公式:样本划分为层,各层的容量、平均数和方差分别为:、、;、、.记样本平均数为,样本方差为,.A.B.估计该年级学生成绩的中位数约为C.估计该年级成绩在分及以上的学生成绩的平均数为D.估计该年级成绩在分及以上的学生成绩的方差为三、填空题5.(2024·甘肃白银·三模)一组样本数据的众数为,中位数为.6.(2024·山东济宁·一模)2024年1月九省联考的数学试卷出现新结构,其中多选题计分标准如下:①本题共3小题,每小题6分,满分18分;②每道小题的四个选项中有两个或三个正确选项,全部选对得6分,有选错的得0分;③部分选对得部分分(若某小题正确选项为两个,漏选一个正确选项得3分;若某小题正确选项为三个,漏选一个正确选项得4分,漏选两个正确选项得2分).已知在某次新结构数学试题的考试中,小明同学三个多选题中第一小题确定得满分,第二小题随机地选了两个选项,第三小题随机地选了一个选项,则小明同学多选题所有可能总得分(相同总分只记录一次)的中位数为.7.(23-24高二上·湖北武汉·开学考试)有一组按从小到大顺序排列的数据:3,5,,8,9,10,若其极差与平均数相等,则这组数据的中位数为.8.(2023·山东聊城·模拟预测)某市统计高中生身体素质的状况,规定身体素质指标值不小于60就认为身体素质合格.现从全市随机抽取100名高中生的身体素质指标值,经计算,.若该市高中生的身体素质指标值服从正态分布,则估计该市高中生身体素质的合格率为.(用百分数作答,精确到0.1%)参考数据:若随机变量X服从正态分布,则,,.参考答案:题号1234答案ABBDBCD1.A【分析】观察给定的图表,利用众数的意义运动员命中环数的集中与分散程度判断即可.【详解】根据图表知,甲、乙命中环数的众数均为7环,则;甲运动员命中的环数比较分散,乙运动员命中的环数比较集中,则.故选:A2.B【分析】根据统计图表数据一一分析即可.【详解】2023年前5个月我国纯电动汽车的销量为万辆,即2023年前5个月我国纯电动汽车的销量超过214万辆,故A正确;将这13个月纯电动汽车的月度销量由小到大依次排列为,,则中位数为其中第个数据,即万辆,故B错误;这些数据中只有出现2次,其他数据均只出现1次,故众数为万辆,故C正确;2023年1月的同比增长率为负数,其它月份的同比增长率为正数,故和上一年同期相比,我国纯电动汽车月度销量有增有减,故D正确.故选:B.3.BD【分析】根据题意,由统计图表中的数据,结合频率分布直方图的面积和百分位数,以及平均数的计算公式,逐项判定,即可求解.【详解】对于A中,由年龄的扇形统计图,可得90后的考生有人,00后的考生有人,可得人,所以A不正确;对于B中,由频率分布直方图性质,可得,解得,则前三个矩形的面积和,所以试成绩的分位数为分,所以B正确;对于C中,设面试成绩的最低分为,由前三个矩形的面积和为,第四个矩形的面积为,则分,所以C不正确;对于D中,根据频率分布直方图的平均数的计算公式,可得考试的平均成绩为:分,所以D正确.故选:BD.4.BCD【分析】利用频率分布直方图中,所有直方图的面积之和为,列等式求出实数的值,可判断A选项;利用中位数的定义可判断B选项;利用总体平均数公式可判断C选项;利用方差公式可判断D选项.【详解】对于A选项,在频率分布直方图中,所有直方图的面积之和为,则,解得,A错;对于B选项,前两个矩形的面积之和为,前三个矩形的面积之和为,设计该年级学生成绩的中位数为,则,根据中位数的定义可得,解得,所以,估计该年级学生成绩的中位数约为,B对;对于C选项,估计成绩在分以上的同学的成绩的平均数为分,C对;对于D选项,估计该年级成绩在分及以上的学生成绩的方差为,D对.故选:BCD.5.【分析】将数据从小到大重新排成一列,根据众数及中位数的定义,即可求出结果.【详解】将样本数据,从小排到大得到,由众数及中位数的定义知:众数为,中位数为,故答案为:,.6.11【分析】列举出所有的得分情况,再结合中位数的概念求答案即可.【详解】由题意得小明同学第一题得6分;第二题选了2个选项,可能得分情况有3种,分别是得0分、4分和6分;第二题选了1个选项,可能得分情况有3种,分别是得0分、2分和3分;由于相同总分只记录一次,因此小明的总分情况有:6分、8分、9分、10分、12分、13分、14分、15分共8种情况,所以中位数为,故答案为:11.7./【分析】由极差和平均数求出,即可求出中位数.【详解】依题意可得极差为,平均数为,所以,解得,所以中位线为.故答案为:8.【分析】计算样本的平均数和方差,由此估计,再结合参考数据求.【详解】因为100个数据,,,…,的平均值,方差,所以的估计值为,的估计值为.设该市高中生的身体素质指标值为X,由,得,所以.故答案为:.规律方法:(1)对于给出的统计图表,一定要结合问题背景理解图表意义.(2)频率分布直方图中纵坐标不要误以为是频率.【考点二】回归分析核心梳理:求经验回归方程的步骤(1)依据成对样本数据画出散点图,确定两个变量具有线性相关关系(有时可省略).(2)计算出eq\x\to(x),eq\x\to(y),eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^)).(3)写出经验回归方程.一、单选题1.(2024·四川成都·模拟预测)某老师为了了解数学学习成绩得分y(单位:分)与每天数学学习时间x(单位:分钟)是否存在线性关系,搜集了100组数据,并据此求得y关于x的线性回归方程为.若一位同学每天数学学习时间约80分钟,则可估计这位同学数学成绩为(
)A.106 B.122 C.136 D.1402.(2023·四川南充·一模)某商品的地区经销商对2023年1月到5月该商品的销售情况进行了调查,得到如下统计表.发现销售量y(万件)与时间x(月)成线性相关,根据表中数据,利用最小二乘法求得y与x的回归直线方程为:.则下列说法错误的是(
)时间x(月)12345销售量y(万件)11.62.0a3A.由回归方程可知2024年1月份该地区的销售量为6.8万件B.表中数据的样本中心点为C.D.由表中数据可知,y和x成正相关二、多选题3.(21-22高三上·重庆黔江·阶段练习)下列说法中正确的是(
)A.将一组数据中的每一个数据都加上或减去同一个常数后,方差不变B.回归直线恒过样本点的中心,且至少过一个样本点C.用相关指数来刻画回归效果时,越接近1,说明模型的拟合效果越好D.在列联表中,的值越大,说明两个分类变量之间的关系越弱4.(2024·浙江·一模)为调研加工零件效率,调研员通过试验获得加工零件个数与所用时间(单位:)的5组数据为:,根据以上数据可得经验回归方程为:,则(
)A.B.回归直线必过点C.加工60个零件的时间大约为D.若去掉,剩下4组数据的经验回归方程会有变化三、填空题5.(23-24高二上·四川绵阳·期末)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价(元)销量(件)由表中数据,求得线性回归方程,若在这些样本点中任取一点,则它在回归直线右上方的概率为6.(2024·全国·模拟预测)某市一水果店为了了解柑橘的月销售量(单位:千克)与月平均气温(单位:)之间的关系,随机统计了4个月的柑橘的月销售量与当月的平均气温,其数据如下表:月平均气温x/181282月销售量千克26456277由表中数据得到关于的线性回归方程为,气象部门预测2024年4月该市的平均气温为,据此估计该水果店2024年4月柑橘的销售量为千克.四、解答题7.(2024·河南郑州·三模)按照《中华人民共和国环境保护法》的规定,每年生态环境部都会会同国家发展改革委等部门共同编制《中国生态环境状况公报》,并向社会公开发布.下表是2017-2021年五年《中国生态环境状况公报》中酸雨区面积约占国土面积的百分比:年份2017年2018年2019年2020年2021年年份代码123456.45.55.04.83.8(1)求2017—2021年年份代码与的样本相关系数(精确到0.01);(2)请用样本相关系数说明该组数据中与之间的关系可用一元线性回归模型进行描述,并求出关于的经验回归方程;(3)预测2024年的酸雨区面积占国土面积的百分比.(回归直线的斜率和截距的最小二乘法估计公式分别为:附:样本相关系数,.8.(23-24高三上·湖南衡阳·阶段练习)为了加快实现我国高水平科技自立自强,某科技公司逐年加大高科技研发投入.下图1是该公司2013年至2022年的年份代码x和年研发投入y(单位:亿元)的散点图,其中年份代码1∼10分别对应年份2013∼2022.
根据散点图,分别用模型①,②作为年研发投入y(单位:亿元)关于年份代码x的经验回归方程模型,并进行残差分析,得到图2所示的残差图.结合数据,计算得到如下表所示的一些统计量的值:752.2582.54.512028.35表中,.(1)根据残差图,判断模型①和模型②哪一个更适宜作为年研发投入y(单位:亿元)关于年份代码x的经验回归方程模型?并说明理由;(2)(i)根据(1)中所选模型,求出y关于x的经验回归方程;(ii)设该科技公司的年利润(单位:亿元)和年研发投入y(单位:亿元)满足(且),问该科技公司哪一年的年利润最大?附:对于一组数据x1,y1,x2,y2,…,参考答案:题号1234答案CAACBC1.C【分析】利用回归方程经过样本中心可求,故可估计这位同学每天数学学习时间约80分钟后的数学成绩.【详解】由题设可得,故,故,故,故当时,,故选:C.2.A【分析】根据给定数据,结合回归直线的特性逐项判断即得.【详解】依题意,,而y与x的回归直线方程为:,则,解得,,表中数据的样本中心点为,BC正确;由,得y和x成正相关,D正确;2024年1月份,即,由回归直线方程,得,因此2024年1月份该地区的销售量约为6.8万件,A错误.故选:A3.AC【分析】对A:由方差的性质即可判断;对B:由回归直线的性质即可判断;对C:利用相关指数的性质即可判断;对D:由卡方的意义即可判断.【详解】对A:将一组数据中的每一个数据都加上或减去同一个常数后,数据的波动性不变,故方差不变,故A正确;对B:回归直线恒过样本点的中心正确,但不一定会过样本点,故B错误;对C:用相关指数来刻画回归效果时,越接近1,说明模型的拟合效果越好,故C正确;对D:在列联表中,的值越大,说明两个分类变量之间的关系越强,故D错误.故选:AC.4.BC【分析】求得数据的样本中心点可判断B;结合回归方程可求出可判断A;将代入回归方程求得预测值可判断C;根据恒过,可判断D.【详解】,,所以恒过,所以,解得:,故A错误;B正确;所以,令,则,故加工60个零件的时间大约为,故C正确;因为恒过,所以剩下4组数据的经验回归方程不会有变化,故D错误.故选:BC.5./【分析】根据表中数据可得回归方程,进而确定在回归直线右上方的个数,进而可得概率.【详解】由已知,,又样本中心在回归直线上,即,解得,所以回归直线方程为,当时,,所以点在回归直线上;当时,,所以点在回归直线左下方;当时,,所以点在回归直线右上方;当时,,所以点在回归直线右上方;当时,,所以点在回归直线右上方;当时,,所以点在回归直线左下方;所以个样本点中在回归直线右上方的有个,所以在这些样本点中任取一点,则它在回归直线右上方的概率为,故答案为:.6.72【分析】求出样本中心,求出,求出线性回归方程即可求解.【详解】由题表得,,所以回归直线过点,得,解得,则线性回归方程为,所以当时,,故估计该水果店2024年4月柑橘的销售量为千克.故答案为:.7.(1)(2)(3)预测2024年的酸雨区面积占国土面积的百分比为2.15%【分析】(1)由表中数据结合题中数据,求出相关数值,代入相关系数,即可得出答案;(2)由(1)知,接近1,即可说明线性相关关系极强;根据(1)中求出的数据,即可求出,,进而得到回归直线方程;(3)将代入回归直线方程,即可预测2024年的酸雨区面积占国土面积的百分比.【详解】(1)由已知可得,,,由题可列下表:0121.30.4,.(2)由小问1知,与的相关系数接近1,所以与之间具有极强的线性相关关系,可用线性回归模型进行描述.由小问1知,,,所求经验回归方程为.(3)令,则,预测2024年的酸雨区面积占国土面积的百分比为2.15%.8.(1)选择模型②更适宜,理由见解析(2)(i);(ii)该公司2028年的年利润最大【分析】(1)根据残差图确定;(2)根据最小二乘法求非线性回归方程即可求解;【详解】(1)根据图2可知,模型①的残差波动性很大,说明拟合关系较差;模型②的残差波动性很小,基本分布在0的附近,说明拟合关系很好,所以选择模型②更适宜.(2)(i)设,所以,所以,,所以关于的经验回归方程为(ii)由题设可得,当取对称轴即,即时,年利润L有最大值,故该公司2028年的年利润最大.规律方法:(1)样本点不一定在经验回归直线上,但点(eq\x\to(x),eq\x\to(y))一定在经验回归直线上.(2)求eq\o(b,\s\up6(^))时,灵活选择公式,注意公式的推导和记忆.(3)利用样本相关系数判断相关性强弱时,看|r|的大小,而不是r的大小.(4)区分样本相关系数r与决定系数R2.(5)通过经验回归方程求的都是估计值,而不是真实值.【考点三】独立性检验核心梳理:独立性检验的一般步骤(1)根据样本数据列2×2列联表.(2)根据公式χ2=eq\f(nad-bc2,a+bc+da+cb+d),计算χ2的值.(3)查表比较χ2与临界值的大小关系,作统计判断.χ2越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.一、解答题1.(2024·安徽合肥·二模)树人中学高三(1)班某次数学质量检测(满分150分)的统计数据如下表:性别参加考试人数平均成绩标准差男3010016女209019在按比例分配分层随机抽样中,已知总体划分为2层,把第一层样本记为,其平均数记为,方差记为;把第二层样本记为,其平均数记为,方差记为;把总样本数据的平均数记为,方差记为.(1)证明:;(2)求该班参加考试学生成绩的平均数和标准差(精确到1);(3)假设全年级学生的考试成绩服从正态分布,以该班参加考试学生成绩的平均数和标准差分别作为和的估计值.如果按照的比例将考试成绩从高分到低分依次划分为四个等级,试确定各等级的分数线(精确到1).附:.2.(2024·辽宁·模拟预测)土壤食物网对有机质的分解有两条途径,即真菌途径和细菌途径.在不同的土壤生态系统中,由于提供能源的有机物其分解的难易程度不同,这两条途径所起的作用也不同.以细菌分解途径为主导的土壤,有机质降解快,氮矿化率高,有利于养分供应,以真菌途径为主的土壤,氮和能量转化比较缓慢,有利于有机质存贮和氮的固持.某生物实验小组从一种土壤数据中随机抽查并统计了8组数据,如下表所示:编号12345678细菌百万个708090100110120130140真菌百万个8.010.012.515.017.521.027.039.0其散点图如下,散点大致分布在指数型函数的图象附近.(1)求关于的经验回归方程(系数精确到0.01);(2)在做土壤相关的生态环境研究时,细菌与真菌的比值能够反映土壤的碳氮循环.以样本的频率估计总体分布的概率,若该实验小组随机抽查8组数据,再从中任选4组,记真菌(单位:百万个)与细菌(单位:百万个)的数值之比位于区间内的组数为,求的分布列与数学期望.附:经验回归方程的斜率和截距的最小二乘估计公式分别为,3.(2024·江苏南京·二模)某地5家超市春节期间的广告支出x(万元)与销售额y(万元)的数据如下:超市ABCDE广告支出x24568销售额y3040606070(1)从A,B,C,D,E这5家超市中随机抽取3家,记销售额不少于60万元的超市个数为X,求随机变量X的分布列及期望;(2)利用最小二乘法求y关于x的线性回归方程,并预测广告支出为10万元时的销售额.附:线性回归方程中斜率和截距的最小二乘估计公式分别为:,.4.(2024·黑龙江哈尔滨·一模)入冬以来,东北成为全国旅游和网络话题的“顶流”.南方的小土豆们纷纷北上体验东北最美的冬天,这个冬天火的不只是东北的美食、东北人的热情,还有东北的洗浴中心,拥挤程度堪比春运,南方游客直接拉着行李箱进入.东北某城市洗浴中心花式宠“且”,为给顾客更好的体验,推出了和两个套餐服务,顾客可自由选择和两个套餐之一,并在App平台上推出了优惠券活动,下表是该洗浴中心在App平台10天销售优惠券情况.日期12345678910销售量(千张)1.91.982.22.362.432.592.682.762.70.4经计算可得:,,.(1)因为优惠券购买火爆,App平台在第10天时系统出现异常,导致当天顾客购买优惠券数量大幅减少,现剔除第10天数据,求关于的经验回归方程(结果中的数值用分数表示);(2)若购买优惠券的顾客选择套餐的概率为,选择套餐的概率为,并且套餐可以用一张优惠券,套餐可以用两张优惠券,记App平台累计销售优惠券为张的概率为,求;(3)记(2)中所得概率的值构成数列.①求的最值;②数列收敛的定义:已知数列,若对于任意给定的正数,总存在正整数,使得当时,,(是一个确定的实数),则称数列收敛于.根据数列收敛的定义证明数列收敛.参考公式:,.参考答案:1.(1)证明见解析;(2)平均数为96分,标准差为18分;(3)将定为等级,定为等级,定为等级,定为等级.【分析】(1)利用平均数及方差公式即可求解;(2)利用平均数及方差公式,结合标准差公式即可求解;(3)根据(2)的结论及正态分布的特点即可求解.【详解】(1),同理.所以.(2)将该班参加考试学生成绩的平均数记为,方差记为,则,所以又,所以.即该班参加考试学生成绩的平均数为96分,标准差约为18分.(3)由(2)知,所以全年级学生的考试成绩服从正态分布,所以..故可将定为等级,定为等级,定为等级,定为等级.2.(1)(2)分布列见解析,2【分析】(1)令,将指数型回归方程转化为线性回归方程,利用最小二乘法的估计系数公式,即可求得答案;(2)确定真菌与细菌的数值之比位于区间内的组数,即可确定X的取值,求出每个值对应的概率,即可得分布列,即可求得数学期望.【详解】(1)由于,故,令,则,,则,,故,则关于的经验回归方程为;(2)由已知图表可知从第1组到第8组的真菌(单位:百万个)与细菌(单位:百万个)的数值之比依次为:,,故样本中比值位于内的组数有4组,则X的可能取值为:,则,,故X的分布列为:X01234P则.3.(1)X的分布列见解析,期望(2);预测广告费支出10万元时的销售额为87万元.【分析】(1)根据超几何分布的概率公式求解分布列,进而可求解期望,(2)利用最小二乘法求解线性回归方程即可.【详解】(1)从A,B,C,D,E这5家超市中随机抽取3家,记销售额不少于60万元的超市有C,D,E这3家超市,则随机变量的可能取值为1,2,3,,,的分布列为:123数学期望.(2),,,.关于的线性回归方程为;在中,取,得.预测广告费支出10万元时的销售额为87万元.4.(1)(2)(3)①最大值为,最小值为;②证明见解析【分析】(1)利用最小二乘法,结合数据分析与公式的变换即可得解;(2)利用全概率公式得到,再两次利用构造法依次求得是常数列,是等比数列,从而得解;(3)①结合(2)中结论,分类讨论为偶数与为奇数,结合数列的单调性即可得解;②理解数列收敛的定义,取,从而得证.【详解】(1)剔除第10天数据的,,,,所以,故,所以.(2)由题意可知,其中,所以,又,所以是首项为的常数列,故,所以,又,所以是以首项为,公比为的等比数列,故,即.(3)①当为偶数时,单调递减,最大值为;当为奇数时,单调递增,最小值为;综上:数列的最大值为,最小值为.②证明:对任意总存在正整数,(其中表示取整函数),当时,,所以数列收敛.【点睛】思路点睛:本题第2小问求的常见思路是,利用独立事件的概率公式、条件概率公式或全概率公式等得到关于的递推式,再利用数列的构造法即可得解.规律方法:(1)χ2越大两分类变量无关的可能性越小,推断犯错误的概率越小,通过表格查得无关的可能性.(2)在犯错误的概率不大于0.01的前提下认为两个变量有关,并不是指两个变量无关的可能性为0.01.专题精练专题精练一、单选题1.(2024·全国·模拟预测)某机构统计了中国2018—2022年全部工业增加值(单位:万亿元)及增长率数据如图所示,则下列结论错误的是(
)A.2018—2022年中国的全部工业增加值逐年增加B.2018—2022年中国全部工业增加值的增长率的极差为C.与上一年相比,2022年中国增加的全部工业增加值是2019年增加的全部工业增加值的2倍D.2018年中国全部工业增加值的增长率比2018—2022年中国全部工业增加值的增长率的最小值高2.(2024·四川遂宁·三模)某调查机构对某地快递行业从业者进行调查统计,得到快递行业从业人员年龄分布饼状图(图1)、“90后”从事快递行业岗位分布条形图(图2),则下列结论中错误的是(
)A.快递行业从业人员中,“90后”占一半以上B.快递行业从业人员中,从事技术岗位的“90后”的人数超过总人数的20%C.快递行业从业人员中,从事运营岗位的“90后”的人数比“80前”的多D.快递行业从业人员中,从事技术岗位的“90后”的人数比“80后”的多3.(2024·陕西西安·模拟预测)某校为了解在校学生对中国传统文化的传承认知情况,随机抽取了100名学生进行中国传统文化知识考试,并将这100名学生成绩整理得到如下频率分布直方图.根据此频率分布直方图(分成40,50,50,60,60,70,,80,90,90,100六组),下列结论中不正确的是(
)A.图中的B.若从成绩在,80,90,90,100内的学生中采用分层抽样抽取10名学生,则成绩在80,90内的有3人C.这100名学生成绩的中位数约为65D.若同一组中的数据用该组区间的中点值作代表,则这100名学生的平均成绩约为68.24.(23-24高三上·湖北·期末)有一组样本数据:5,6,6,6,7,7,8,8,9,9.则关于该组数据的下列数字特征中,数值最大的为(
)A.平均数 B.第50百分位数 C.极差 D.众数5.(2024·湖南·模拟预测)已知由小到大排列的个数据、、、,若这个数据的极差是它们中位数的倍,则这个数据的第百分位数是(
)A. B.6 C. D.46.(2024·浙江·二模)为了解某中学学生假期中每天自主学习的时间,采用样本量比例分配的分层随机抽样,现抽取高一学生40人,其每天学习时间均值为8小时,方差为0.5,抽取高二学生60人,其每天学习时间均值为9小时,方差为0.8,抽取高三学生100人,其每天学习时间均值为10小时,方差为1,则估计该校学生每天学习时间的方差为(
)A.1.4 B.1.45 C.1.5 D.1.557.(23-24高三下·山东·开学考试)为研究某池塘中水生植物的覆盖水塘面积(单位:)与水生植物的株数(单位:株)之间的相关关系,收集了4组数据,用模型去拟合与的关系,设与的数据如表格所示:得到与的线性回归方程,则(
)346722.54.57A.-2 B.-1 C. D.8.(21-22高二下·山东滨州·期末)针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为人,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.零假设为:喜欢短视频和性别相互独立.若依据的独立性检验认为喜欢短视频和性别不独立,则的最小值为()附:,附表:0.050.013.8416.635A.7 B.8 C.9 D.10二、多选题9.(2020·海南·高考真题)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是A.这11天复工指数和复产指数均逐日增加;B.这11天期间,复产指数增量大于复工指数的增量;C.第3天至第11天复工复产指数均超过80%;D.第9天至第11天复产指数增量大于复工指数的增量;10.(2024·安徽·三模)下列关于概率统计的说法中正确的是(
)A.某人在10次答题中,答对题数为,则答对7题的概率最大B.设随机变量服从正态分布,若,则C.已知回归直线方程为,若样本中心为,则D.两个变量的相关系数为,则越小,与之间的相关性越弱11.(2024·湖北·一模)某校为了解高一新生对数学是否感兴趣,从400名女生和600名男生中通过分层抽样的方式随机抽取100名学生进行问卷调查,将调查的结果得到如下等高堆积条形图和列联表,则(
)性别数学兴趣合计感兴趣不感兴趣女生男生合计100参考数据:本题中0.10.050.010.0050.0012.7063.8416.6357.87910.828A.表中B.可以估计该校高一新生中对数学不感兴趣的女生人数比男生多C.根据小概率值的独立性检验,可以认为性别与对数学的兴趣有差异D.根据小概率值的独立性检验,可以认为性别与对数学的兴趣没有差异三、填空题12.(2023·全国·模拟预测)某农业科研所在5块面积相同的长方形试验田中均种植了同-一种农作物,每一块试验田的施肥量x(单位:kg)与产量y(单位:kg)之间有如下关系:施肥量x/kg2040506080产量y/kg600800120010001400已知y与x满足线性回归方程,则当施肥量为80kg时,残差为.13.(2024·全国·模拟预测)记样本数据10,18,8,4,16,24,6,8,32的中位数为a,平均数为b,则=.14.(2024·广东广州·一模)某校数学建模兴趣小组收集了一组恒温动物体重(单位:克)与脉搏率(单位:心跳次数/分钟)的对应数据,根据生物学常识和散点图得出与近似满足(为参数).令,,计算得,,.由最小二乘法得经验回归方程为,则的值为;为判断拟合效果,通过经验回归方程求得预测值,若残差平方和,则决定系数.(参考公式:决定系数)四、解答题15.(2024·浙江温州·二模)红旗淀粉厂2024年之前只生产食品淀粉,下表为年投入资金(万元)与年收益(万元)的8组数据:102030405060708012.816.51920.921.521.92325.4(1)用模拟生产食品淀粉年收益与年投入资金的关系,求出回归方程;(2)为响应国家“加快调整产业结构”的号召,该企业又自主研发出一种药用淀粉,预计其收益为投入的.2024年该企业计划投入200万元用于生产两种淀粉,求年收益的最大值.(精确到0.1万元)附:①回归直线中斜率和截距的最小二乘估计公式分别为:,②1612920400109603③16.(23-24高三下·全国·开学考试)2023年11月,世界首届人工智能峰会在英国举行,我国因为在该领域取得的巨大成就受邀进行大会发言.为了研究不同性别的学生对人工智能的了解情况,我市某著名高中进行了一次抽样调查,分别抽取男、女生各50人作为样本.设事件“了解人工智能”,“学生为男生”,据统计.(1)根据已知条件,填写下列列联表,是否有把握推断该校学生对人工智能的了解情况与性别有关?了解人工智能不了解人工智能合计男生女生合计(2)①现从所抽取的女生中利用分层抽样的方法抽取20人,再从这20人中随机选取3人赠送科普材料,求选取的3人中至少有2人了解人工智能的概率;②将频率视为概率,从我市所有参与调查的学生中随机抽取20人科普材料,记其中了解人工智能的人数为X,求随机变量的数学期望和方差.参考公式:.常用的小概率值和对应的临界值如下表:0.1500.1000.0500.0250.0100.0050.0012.0722.7063.8415.0246.6357.87910.828参考答案:题号12345678910答案CDCAABCCCDAC题号11答案ACD1.C【分析】根据统计图表中的数据,结合每个选项,进行逐一分析,即可判断和选择.【详解】对A:由条形图知,2018—2022年中国的全部工业增加值逐年增加,故A正确;对B:由折线图知,2018—2022年中国全部工业增加值的增长率的极差为,故B正确;对C:由条形图知,与上一年相比,2022年中国增加的全部工业增加值为,2019年增加的全部工业增加值为,不是2倍关系,故C错误;对D:由条形图知,2018年中国全部工业增加值的增长率为,2018—2022年中国全部工业增加值的增长率的最小值为,,故D正确.故选:C.2.D【分析】根据两个图,结合选项,即可判断.【详解】由题图可知,快递行业从业人员中,“90后”占总人数的56%,超过一半,A正确;快递行业从业人员中,从事技术岗位的“90后”的人数占总人数的百分比为,超过20%,所以快递行业从业人员中,从事技术岗位的“90”后的人数超过总人数的20%;B正确;快递行业从业人员中,从事运营岗位的“90后”的人数占总人数的百分比为,超过“80前”的人数占总人数的百分比,C正确;快递行业从业人员中,从事技术岗位的“90后”的人数占总人数的百分比为22.176%,小于“80后”的人数占总人数的百分比,但“80后”从事技术岗位的人数占“80后”人数的比未知,D不一定正确.故选:D3.C【分析】根据频率分布直方图的特点逐个进行分析计算即可.【详解】由,得,所以A正确;这100名学生中成绩在,,内的频率分别为0.2,0.12,0.08,所以采用分层抽样抽取的10名学生中成绩在内的有人,故B正确;根据频率分布直方图,可知这100名学生成绩的中位数在之间,设中位数为,则,所以,故C错误;根据频率分布直方图的平均数的计算公式,可得,D正确.故选:C4.A【分析】分别求出平均数、第50百分位数、极差、众数,即可得到答案【详解】平均数为;,则第50百分位数为;极差为;众数为故平均数最大故选:A.5.A【分析】根据极差和中位数概念得到关于的方程,再利用百分位数的概念即可.【详解】由小到大排列的个数据、、、,则,这四个数为极差为,中位数为,因为这个数据极差是它们中位数的倍,则,解得,所以,这四个数由小到大依次为、、、,因为,故这个数据的第百分位数是.故选:A.6.B【分析】利用分层随机抽样的均值与方差公式即可解决.【详解】由题意可得,该校学生每天学习时间的均值为,该校学生每天学习时间的方差为.故选:B7.C【分析】根据已知条件,求得,进而代入回归方程可求得,从而得出,联立,即可求得本题答案.【详解】由已知可得,,,所以,有,解得,所以,,由,得,所以,,则.故选:C.8.C【分析】由已知数据计算,根据独立性检验的结论,列不等式求的取值范围,得最小值.【详解】根据题意,不妨设,于是,由于依据的独立性检验认为喜欢短视频和性别不独立,根据表格可知,解得,于
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 现代简约风格与科技公司办公环境的融合
- 现代物流技术与医疗物资保障体系
- 沟通技巧在教育工作中的创新应用
- 环保技术在现代城市建设中的应用
- 物流信息技术在商业领域的应用
- Unit 3 Where did you go?PartB (说课稿)-2023-2024学年人教PEP版英语六年级下册
- 2《烛之武退秦师》说课稿-2024-2025学年高一语文下学期同步说课稿(统编版必修下册)
- 2024新教材高中地理 第四章 区域发展战略 第二节 我国区域发展战略说课稿 湘教版必修第二册
- Unit3 Amazing animals(说课稿)-2024-2025学年人教PEP版(2024)英语三年级上册001
- 2024年高中化学 第三章 晶体结构与性质 章末整合说课稿 新人教版选修3
- 2025届高中数学一轮复习专练:椭圆(含解析)
- 立春气象与生活影响模板
- 中国服装零售行业发展环境、市场运行格局及前景研究报告-智研咨询(2025版)
- 初一英语阅读理解100篇七年级上册英语阅读理解及答案
- 2024年广东省深圳市中考道德与法治试题卷
- 汽车车身密封条设计指南
- DB4101-T 121-2024 类家庭社会工作服务规范
- DB53∕T 1269-2024 改性磷石膏用于矿山废弃地生态修复回填技术规范
- 2024建安杯信息通信建设行业安全竞赛题库(试题含答案)
- JBT 14727-2023 滚动轴承 零件黑色氧化处理 技术规范 (正式版)
- 术后谵妄及护理
评论
0/150
提交评论