新高考数学二轮复习讲义第二十二讲统计初步及成对数据的统计分析(含解析)_第1页
新高考数学二轮复习讲义第二十二讲统计初步及成对数据的统计分析(含解析)_第2页
新高考数学二轮复习讲义第二十二讲统计初步及成对数据的统计分析(含解析)_第3页
新高考数学二轮复习讲义第二十二讲统计初步及成对数据的统计分析(含解析)_第4页
新高考数学二轮复习讲义第二十二讲统计初步及成对数据的统计分析(含解析)_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二十二讲:统计初步及成对数据的统计分析【考点梳理】统计初步随机抽样:简单随机抽样,分层抽样用样本估计总体:频率分布直方图,样本数字特征(百分位数、平均数、众数、中位数、方差、标准差)特征数具体数字算法频率分布直方图(表)众数次数出现最多的数字频率最大或最高组的中间值中位数样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取当中两个数据的平均数作为中位数频率等于0.5时的横坐标平均数所有数字之和除以总个数每个小矩形面积乘以小矩形底边中点的横坐标之和方差SKIPIF1<0平均数反映了数据取值的平均水平,标准差、方差描述了一组数据波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定成对数据的统计分析(1)相关关系,(2)回归分析,(3)独立性检验【典型题型讲解】考点一:抽样:简单随机抽样分层抽样【典例例题】例1.某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件进行编号,001,002,……,699,700.从中抽取70个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第6个样本编号是(

)3221183429

7864540732

5242064438

1223435677

35789056428442125331

3457860736

2530073286

2345788907

23689608043256780843

6789535577

3489948375

2253557832

4577892345A.623 B.328 C.253 D.007【答案】A【解析】从第5行第6列开始向又读取数据,第一个数为253,第二个数是313,第三个数是457,下一个数是860,不符合要求,下一个数是736,不符合要求,下一个是253,重复,第四个是007,第五个是328,第六个是623.故选:A.例2.SKIPIF1<0年SKIPIF1<0月SKIPIF1<0日,搭载问天实验舱的长征五号SKIPIF1<0遥三运载火箭,在我国文昌航天发射场成功发射,我国的航天事业又上了一个新的台阶.某校现有高一学生SKIPIF1<0人,高二学生SKIPIF1<0人,高三学生SKIPIF1<0人,为了调查该校学生对我国航天事业的了解程度,现从三个年级中采用分层抽样的方式抽取SKIPIF1<0人填写问卷调查,则高三年级有多少人被抽中(

)A.16 B.18 C.20 D.24【答案】D【解析】由分层抽样原则可知:高三年级应抽取SKIPIF1<0人.故选:D.【方法技巧与总结】根据样本数据的特点要判定采用随机简单抽样和分层抽样【变式训练】1.某个年级有男生180人,女生160人,用分层抽样的方法从该年级全体学生中抽取一个容量为68的样本,则此样本中女生人数为(

)A.40 B.36 C.34 D.32【答案】D【解析】由题意得:样本中女生人数为SKIPIF1<0.故选:D2.某中学为了掌握学校员工身体状况,偶尔会采用抽检的方式来收集各部门员工的健康情况.为了让样本更具有代表性,学校对各部门采用分层抽样的方法进行抽检.已知该校部门SKIPIF1<0、部门SKIPIF1<0、部门SKIPIF1<0分别有40、60、80人,各部门员工不存在交叉任职情况,若共抽检了90人,则部门SKIPIF1<0抽检人数为______.【答案】20【解析】由题意得从部门SKIPIF1<0抽检人数为SKIPIF1<0(人),故答案为:203.某市甲、乙、丙三所学校的高三学生共有800名,其中男、女生人数如下表:甲校乙校丙校男生9790x女生153160y(1)现用分层随机抽样的方法从这三所学校的所有高三学生中抽取48人,则应从丙校抽取多少人?(2)该市模考后,市教研室准备从这三所学校的所有高三学生中利用随机数法抽取100人进行成绩统计分析,将800人按001,002,…,800进行编号,如果从第8行第7列的数开始向右读,请你依次写出最先抽取的4个人的编号.(下面摘取了随机数表第7行至第9行)8442

1753

3157

2455

0688

7704

7447

6721

7633

5026

83926301

5316

5916

9275

3816

5821

7071

7512

8673

5807

44391326

3321

1342

7864

1607

8252

0744

3815

0324

4299

7931【解析】(1)根据题意可得丙校共有SKIPIF1<0人,根据分层抽样规则可得,应从丙校抽取SKIPIF1<0人.(2)第8行第7列的数为1,从数1开始向右读,则最先抽取的4个人的编号为165,538,707,175.考点二:样本数字特征【典例例题】例1.(2022·广东中山·高三期末)甲、乙两支田径队的体检结果为:甲队体重的平均数为60kg,方差为200,乙队体重的平均数为70kg,方差为300,又已知甲、乙两队的队员人数之比为1:4,那么甲、乙两队全部队员的平均体重和方差分别是(

)A.65,280 B.68,280 C.65,296 D.68,296【答案】B【解析】设甲队有a人,甲、乙两队的队员人数之比为1:4,则乙队有4a人,因为甲队体重的平均数为60,乙队体重的平均数为70,则甲、乙两队全部队员的平均体重为SKIPIF1<0,甲队体重的方差SKIPIF1<0SKIPIF1<0SKIPIF1<0则SKIPIF1<0乙队体重的方差为SKIPIF1<0SKIPIF1<0SKIPIF1<0则SKIPIF1<0甲、乙两队全部队员体重的方差为SKIPIF1<0SKIPIF1<0+SKIPIF1<0SKIPIF1<0+SKIPIF1<0SKIPIF1<0故选:B.例2.(2022·广东深圳·高三期末)为了分析某次考试的情况,随机抽取了若干学生,将其考试成绩分组为:SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,并绘制成如下图所示的频率分布直方图,据此可估计该次考试成绩的中位数SKIPIF1<0,则整数k的值为(

)A.99 B.100 C.101 D.102【答案】B【详解】考试成绩在SKIPIF1<0内的频率为:SKIPIF1<0,则前4组考试成绩频率分别为:SKIPIF1<0,SKIPIF1<0SKIPIF1<0,SKIPIF1<0SKIPIF1<0,SKIPIF1<0SKIPIF1<0,SKIPIF1<0考试成绩的中位数为SKIPIF1<0,则SKIPIF1<0,SKIPIF1<0SKIPIF1<0故选:B.例3.(2021·广东汕头·高三期末)某中学为了解学生数学史知识的积累情况,随机抽取150名同学参加数学史知识测试,测试题共5道,每答对一题得20分,答错得0分.得分不少于60分记为及格,不少于80分记为优秀,测试成绩百分比分布图如图所示,则(

)A.该次数学史知识测试及格率超过90%B.该次数学史知识测试得满分的同学有15名C.该次测试成绩的中位数大于测试成绩的平均数D.若该校共有1500名学生,则数学史知识测试成绩能得优秀的同学大约有720名【答案】AC【详解】由图知,及格率为SKIPIF1<0,故A正确.该测试满分同学的百分比为SKIPIF1<0,即有SKIPIF1<0名,B错误.由图知,中位数为80分,平均数为SKIPIF1<0分,故C正确.由题意,1500名学生成绩能得优秀的同学有SKIPIF1<0,故D错误.故选:AC例4.2021年7月至2022年7月,我国居民消费价格保持平稳,居民消费价格涨跌幅如图所示,则(

)备注:同比增长率=SKIPIF1<0,环比增长率=SKIPIF1<0,A.2022年1月全国居民消费价格比2021年1月全国居民消费价格有所下降B.2022年5月全国居民消费价格比2022年4月全国居民消费价格有所上升C.2021年7月至2022年7月全国居民消费价格同比增长率的40%分位数为1.0%D.2021年10月至2022年7月全国居民消费价格环比增长率的平均数为0.25%【答案】D【解析】对A,从图中可以看出2022年1月全国居民消费价格的同比增长率为SKIPIF1<0,所以2022年1月全国居民消费价格有所上升,故A错误;对B,由图2022年5月全国居民消费价格环比增长率为SKIPIF1<0,所以2022年5月全国居民消费价格有所下降,故B错误;对C,将C选项中的数据由小到大排列得,SKIPIF1<0,因为SKIPIF1<0,则同比增长率的40%分位数为第6个数SKIPIF1<0,故C错误;对D,环比增长率的平均数为SKIPIF1<0,故D正确.故选:D【方法技巧与总结】1、频率分布直方图(1)利用频率分布直方图求频率、频数;(2)利用频率分布直方图估计总体.(3)频率分布直方图的纵坐标是频率除以组距,而不是频率.2、百分位数计算一组SKIPIF1<0个数据的的第SKIPIF1<0百分位数的步骤①按从小到大排列原始数据.②计算SKIPIF1<0.③若SKIPIF1<0不是整数而大于SKIPIF1<0的比邻整数SKIPIF1<0,则第SKIPIF1<0百分位数为第SKIPIF1<0项数据;若SKIPIF1<0是整数,则第SKIPIF1<0百分位数为第SKIPIF1<0项与第SKIPIF1<0项数据的平均数.【变式训练】1.(2022·广东东莞·高三期末)气象意义上从春季进入夏季的标志为“当且仅当连续SKIPIF1<0天每天日平均温度不低于SKIPIF1<0”.现有甲、乙、丙三地连续SKIPIF1<0天日平均温度的记录数据(数据均为正整数,单位SKIPIF1<0)且满足以下条件:甲地:SKIPIF1<0个数据的中位数是SKIPIF1<0,众数是SKIPIF1<0;乙地:SKIPIF1<0个数据的中位数是SKIPIF1<0,平均数是SKIPIF1<0;丙地:SKIPIF1<0个数据有SKIPIF1<0个是SKIPIF1<0,平均数是SKIPIF1<0,方差是SKIPIF1<0;根据以上数据,下列统计结论正确的是(

)A.甲地进入了夏季 B.乙地进入了夏季C.不能确定丙地进入了夏季 D.恰有2地确定进入了夏季【答案】AC【详解】甲地:5个数据由小到大排,则22,22,24,SKIPIF1<0,SKIPIF1<0,其中SKIPIF1<0,满足进入夏季的标志;乙地:将5个数据由小到大排,则SKIPIF1<0,SKIPIF1<0,27,SKIPIF1<0,SKIPIF1<0,其中SKIPIF1<0,则SKIPIF1<0,而SKIPIF1<0,故SKIPIF1<0,其中必有一个小于22,故不满足一定进入夏季的标志;丙地:设5个数据为SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,30,且SKIPIF1<0,由方差公式可知:SKIPIF1<0,则SKIPIF1<0,不妨设SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,则SKIPIF1<0,SKIPIF1<0,SKIPIF1<0均大于22,但SKIPIF1<0不确定是否大于22,故不能确定丙地进入夏天.故选:AC.2.如图1为某省2019年1~4月份快递业务量统计图,图2为该省2019年1~4月份快递业务收入统计图,对统计图理解不正确的是(

)A.2019年1~4月份快递业务量3月份最高,2月份最低,差值接近2000万件B.从1~4月份来看,业务量与业务收入有波动,但整体保持高速增长C.从两图中看,增量与增长速度并不完全一致,但业务量与业务收入变化高度一致D.2019年1~4月份快递业务量同比增长率均超过50%,在3月份最高,和春节后网购迎来喷涨有关【答案】B【解析】从图(1)的柱形图可得2019年1~4月份快递业务量3月份最高,2月份最低,3月份比2月份高4397-2411=1986,差值接近2000万件,故A正确.从1~4月份来看,业务量与业务收入有波动,结合图(1)(2)中的柱形图可得业务量与业务收入在2月份和4月份均下降,故B错误.从两图中柱状图可得业务量与业务收入变化高度一致,但业务量2月份同比增长SKIPIF1<0,而业务收入2月份同比增长SKIPIF1<0,因此增量与增长速度并不完全一致,故C正确.从图(1)中可得2019年1~4月份快递业务量同比增长率均超过50%,在3月份最高,这的确和春节后网购迎来喷涨有关,故D正确.故选:B.3.(2022·广东清远·高三期末)某学校组织了一次劳动技能大赛,共有100名学生参赛,经过评判,这100名参赛者的得分都在SKIPIF1<0内,得分60分以下为不及格,其得分的频率分布直方图如图所示(按得分分成SKIPIF1<0这五组),则下列结论正确的是(

)A.直方图中SKIPIF1<0B.此次比赛得分不及格的共有40人C.以频率为概率,从这100名参赛者中随机选取1人,其得分在SKIPIF1<0的概率为0.5D.这100名参赛者得分的中位数为65【答案】ABC【详解】因为SKIPIF1<0,所以SKIPIF1<0,所以A正确;因为不及格的人数为SKIPIF1<0,所以B正确;因为得分在SKIPIF1<0的频率为SKIPIF1<0,所以从这100名参赛者中随机选取1人,其得分在SKIPIF1<0的概率为0.5,所以C正确;这100名参赛者得分的中位数为SKIPIF1<0,所以D错误.故选:ABC.4.(2022·广东汕头·一模)在党史学习教育动员大会上,习近平总书记强调全党同志要做到学史明理、学史增信、学史崇德,学史力行.某单位对200名党员进行党史知识测试,将成绩分成6组:SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,得到如图所示的频率分布直方图,则SKIPIF1<0______.【答案】0.050【详解】由SKIPIF1<0,解得SKIPIF1<0,故答案为:0.0505.(2022·广东广东·一模)(多选)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入调查数据整理得到如下频率分布直方图(如图):根据此频率分布直方图,下面结论中正确的是(

)A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入的中位数约为7.5万元C.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间D.估计该地农户家庭年收入的平均值不超过6.5万元【答案】.ABC【详解】解:对于A,该地农户家庭年收入低于4.5万元的农户得频率为SKIPIF1<0,所以比率估计为6%,故A正确;对于B,因为SKIPIF1<0,所以该地农户家庭年收入的中位数约为7.5万元,故B正确;对于C,家庭年收入介于4.5万元至8.5万元之间频率为SKIPIF1<0,所以估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间,故C正确;对于D,该地农户家庭年收入的平均值为SKIPIF1<0SKIPIF1<0,所以估计该地农户家庭年收入的平均值超过6.5万元,故D错误.故选:ABC.6.(2022·广东韶关·一模)(多选)在一次演讲比赛中,以下表格数据是5位评委给甲、乙两名选手评出的成绩,则下列说法正确的是(

)甲乙86909592879188938895A.甲选手成绩的极差大于乙选手成绩的极差B.甲选手成绩的中位数小于乙选手成绩的中位数C.甲选手成绩的方差小于乙选手成绩的方差D.甲选手成绩的平均数小于乙选手成绩的平均数【答案】ABD【详解】对于A:根据极差的概念,可知甲选手成绩的极差为9,乙选手成绩的极差为7.故A正确;对于B:易知甲成绩的中位数是90,乙成绩的中位数是91.故B正确;对于C:甲选手成绩的平均数为SKIPIF1<0,方差为SKIPIF1<0乙选手成绩的平均数为SKIPIF1<0,方差为SKIPIF1<0.故C错误;对于D:由于甲选手成绩的平均数为90,乙选手成绩的为91.故D正确.故选:ABD.7.某市政府为了节约生活用水,实施居民生活用水定额管理政策,即确定一个居民月用水量标准x(单位:吨),用水量不超过x的部分按平价收费,超出x的部分按议价收费,并随机抽取部分居民进行调查,抽取的居民月均用水量的频率分布直方图如图所示.(同一组中的数据以该组区间的中点值为代表)(1)求频率分布直方图中a的值;(2)试估计该市居民月均用水量的众数、平均数;(3)如果希望85%的居民月均用水量不超过标准x,那么标准x定为多少比较合理?【解析】(1)由频率分布直方图中所有矩形的面积之和为1,可得SKIPIF1<0,解得SKIPIF1<0.(2)由频率分布直方图可知,该市居民月均用水量的众数约为SKIPIF1<0(吨),由频率分布直方图可知,平均数约为SKIPIF1<0SKIPIF1<0SKIPIF1<0(吨).(3)由频率分布直方图可知,月均用水量低于2.5吨的居民人数所占的百分比为SKIPIF1<0,月均用水量低于3吨的居民人数所占的百分比为SKIPIF1<0,所以SKIPIF1<0,由题意可得SKIPIF1<0,解得SKIPIF1<0.所以如果希望85%的居民月均用水量不超过标准x,那么x定为2.9吨比较合理.8.随着新冠肺炎疫情的稳定,各地的经济均呈现缓慢的恢复趋势,为了更进一步做好疫情的防控工作,避免疫情的再度爆发,A地区规定居民出行或者出席公共场合均需佩戴口罩,现将A地区20000个居民一周的口罩使用个数统计如下表所示,其中每周的口罩使用个数在6以上(含6)的有14000人.口罩使用数量SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0频率0.2m0.3n0.1(1)求m,n的值;(2)根据表中数据,完善上面的频率分布直方图;(3)计算A地区居民一周口罩使用个数的平均数以及方差.【解析】(1)由已知SKIPIF1<0,SKIPIF1<0;(2)频率分布直方图如下:(3)由频率分布直方图得一周内使用口罩的平均数为SKIPIF1<0,方差为SKIPIF1<0SKIPIF1<0.考点二:回归分析【典例例题】例1.(2022·广东汕尾·高三期末)“绿水青山就是金山银山”的生态文明发展理念已经深入人心,这将推动新能源汽车产业的迅速发展,下表是近几年我国某地区新能源汽车的年销售量与年价的统计表年份20162017201820192020年销售量(万台)812152025根据上表,利用最小二乘法,新能源汽车的年销售量y万台关于年份x的线性回归方程为______.参考数据:SKIPIF1<0SKIPIF1<0附:对于一组数据SKIPIF1<0,其回归直线SKIPIF1<0的斜率和截距的最小二乘估计分别为:SKIPIF1<0.【答案】.SKIPIF1<0【详解】SKIPIF1<0,SKIPIF1<0故SKIPIF1<0,SKIPIF1<0,所以线性回归方程为SKIPIF1<0故答案为:SKIPIF1<0例2.(2022·广东·铁一中学高三期末)SKIPIF1<0年SKIPIF1<0月底,为严防新型冠状病毒疫情扩散,有效切断病毒传播途径,坚决遏制疫情蔓延势头,确保人民群众生命安全和身体健康,多地相继做出了封城决定.某地在SKIPIF1<0月SKIPIF1<0日至SKIPIF1<0日累计确诊人数如下表:日期(SKIPIF1<0月)SKIPIF1<0日SKIPIF1<0日SKIPIF1<0日SKIPIF1<0日SKIPIF1<0日SKIPIF1<0日SKIPIF1<0日人数(人)SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0由上述表格得到如散点图(SKIPIF1<0月SKIPIF1<0日为封城第一天).(1)根据散点图判断SKIPIF1<0与SKIPIF1<0(SKIPIF1<0,SKIPIF1<0均为大于SKIPIF1<0的常数)哪一个适宜作为累计确诊人数SKIPIF1<0与封城后的天数SKIPIF1<0的回归方程类型(给出判断即可,不必说明理由);并根据上表中的数据求出回归方程;(2)随着更多的医护人员投入疫情的研究,SKIPIF1<0月SKIPIF1<0日武汉影像科医生提出存在大量核酸检测呈阴性(阳性则确诊),但观其SKIPIF1<0肺片具有明显病变,这一提议引起了广泛的关注,SKIPIF1<0月SKIPIF1<0日武汉疾控中心接收了SKIPIF1<0份血液样本,假设每份样本的检验结果是阳性还是阴性都是相互独立的,且每份样本是阳性样本的概率为SKIPIF1<0,核酸试剂能把阳性样本检测出阳性结果的概率是SKIPIF1<0(核酸检测存在阳性样本检测不出来的情况,但不会把阴性检测呈阳性),求这SKIPIF1<0份样本中检测呈阳性的份数的期望.参考数据:SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0其中SKIPIF1<0,SKIPIF1<0,参考公式:对于一组数据SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0,其回归直线SKIPIF1<0的斜率和截距的最小二乘估计公式分别为SKIPIF1<0,SKIPIF1<0.【答案】(1)由散点图可知选择SKIPIF1<0,由SKIPIF1<0两边同时取常用对数得SKIPIF1<0,设SKIPIF1<0,SKIPIF1<0.计算SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,把样本中心点SKIPIF1<0代入SKIPIF1<0得SKIPIF1<0.SKIPIF1<0,SKIPIF1<0关于SKIPIF1<0的回归方程为SKIPIF1<0;(2)这SKIPIF1<0份样本中检测呈阳性的份数为SKIPIF1<0,则每份检测出阳性的概率SKIPIF1<0,由题意可知SKIPIF1<0,SKIPIF1<0(人),故这SKIPIF1<0份样本中检测呈阳性份数的期望为SKIPIF1<0人.【方法技巧与总结】1.线性回归方程的求法;2.非线性回归方程要通过换元换成线性回归方程.【变式训练】1.(2022·广东深圳·一模)某人工智能公司近5年的利润情况如下表所示:第x年12345利润y/亿元23457已知变量y与x之间具有线性相关关系,设用最小二乘法建立的回归直线方程为SKIPIF1<0,则下列说法正确的是(

)A.SKIPIF1<0B.变量y与x之间的线性相关系数SKIPIF1<0C.预测该人工智能公司第6年的利润约为7.8亿元D.该人工智能公司这5年的利润的方差小于2【答案】.AC【详解】解:依题意SKIPIF1<0,SKIPIF1<0,因为回归直线方程为SKIPIF1<0必过样本中心点SKIPIF1<0,即SKIPIF1<0,解得SKIPIF1<0,故A正确;则回归直线方程为SKIPIF1<0,则SKIPIF1<0与SKIPIF1<0成正相关,即相关系数SKIPIF1<0,故B错误,当SKIPIF1<0时SKIPIF1<0,即该人工智能公司第6年的利润约为7.8亿元,故C正确,该人工智能公司这5年的利润的方差为SKIPIF1<0,故D错误;故选:AC2.(2022·广东惠州·二模)某地建立了农业科技图书馆,供农民免费借阅,收集了近5年的借阅数据如下表:年份20162017201820192020年份代码x12345年借阅量y/万册4.95.15.55.75.8根据上表,可得y关于x的线性回归方程为SKIPIF1<0,则(

)A.SKIPIF1<0B.估计近5年借阅量以0.24万册/年的速度增长C.y与x的样本相关系数SKIPIF1<0D.2021年的借阅量一定不少于6.12万册26.(2022·广东汕头·二模)如图所示,5个(x,y)数据,去掉D(3,10)后,下列说法正确的是(

)A.相关系数r变大B.残差平方和变大C.相关指数R2变小D.解释变量x与预报变量y的相关性变强【答案】AD【详解】由散点图知,去掉离群点D后,x与y的相关性变强,且为正相关,所以相关系数r的值变大,相关指数R2的值变大,残差平方和变小.故选:AD.3.(2022·广东·金山中学高三期末)2021年,我国脱贫攻坚战取得了全面胜利.为了巩固拓展脱贫攻坚成果,不断提高群众的幸福感,某县继续推进山羊养殖项目.为了建设相应的配套项目,该县主管部门对该县近年来山羊养殖业的规模进行了跟踪调查,得到了该县每年售卖山羊数量SKIPIF1<0(单位:万只)与相应年份代码SKIPIF1<0的数据如下表:年份201520162017201820192020年份代码SKIPIF1<0123456售卖山羊数量SKIPIF1<0(万只)111316152021(1)由表可知SKIPIF1<0与SKIPIF1<0有较强的线性相关关系,求SKIPIF1<0关于SKIPIF1<0的线性回归方程;(2)已知该县养殖的山羊品种只有甲、乙两种,且甲品种山羊与乙品种山羊的数量之比为SKIPIF1<0,甲品种山羊达到售卖标准后的出售价为2500元/只,乙品种山羊达到售卖标准后的出售价为2700元/只.为了解养殖山羊所需要的时间,该县主管部门随机抽取了甲品种山羊和乙品种山羊各100只进行调查,得到要达到售卖标准所需的养殖时间如下表:养殖时间(月数)6789甲品种山羊(只)20353510乙品种山羊(只)10304020以上述样本统计的养殖山羊所需时间情况估计全县养殖山羊所需时间(即以各养殖时间的频率作为各养殖时间的概率),且每月每只山羊的养殖成本为300元,结合(1)中所求回归方程,试求2022年该县养殖山羊所获利润的期望(假设山羊达到售卖标准后全部及时卖完).(利润=卖山羊的收入一山羊的养殖成本)参考公式及数据:回归直线方程为SKIPIF1<0,其中SKIPIF1<0,SKIPIF1<0.【答案】.(1)SKIPIF1<0;(2)8800万元.【详解】(1)因为SKIPIF1<0,SKIPIF1<0,所以SKIPIF1<0,可得SKIPIF1<0.所以SKIPIF1<0与SKIPIF1<0之间的线性回归方程为SKIPIF1<0.(2)由SKIPIF1<0可知,当SKIPIF1<0时,可得SKIPIF1<0,其中甲品种山羊有SKIPIF1<0万只,乙品种山羊有SKIPIF1<0万只.由频率估计概率,可得甲品种山羊达到售卖标准需要的养殖时间为6个月,7个月,8个月和9个月的概率分别为0.2,0.35,0.35和0.1,所以甲品种山羊要达到售卖标准需要养殖时间的期望为SKIPIF1<0(月).由频率估计概率,可得乙品种山羊达到售卖标准需要的养殖时间为6个月,7个月,8个月和9个月的概率分别为0.1,0.3,0.4和0.2,所以乙品种山羊要达到售卖标准需要养殖时间的期望为SKIPIF1<0(月).养殖每只甲品种山羊利润的期望为SKIPIF1<0(元),养殖每只乙品种山羊利润的期望为SKIPIF1<0(元),故2022年该县售卖的山羊所获利润的期望为SKIPIF1<0(万元).4.(2022·广东广州·一模)人们用大数据来描述和定义信息时代产生的海量数据,并利用这些数据处理事务和做出决策,某公司通过大数据收集到该公司销售的某电子产品1月至5月的销售量如下表.月份x12345销售量y(万件)4.95.86.88.310.2该公司为了预测未来几个月的销售量,建立了y关于x的回归模型:SKIPIF1<0.(1)根据所给数据与回归模型,求y关于x的回归方程(SKIPIF1<0的值精确到0.1);(2)已知该公司的月利润z(单位:万元)与x,y的关系为SKIPIF1<0,根据(1)的结果,问该公司哪一个月的月利润预报值最大?参考公式:对于一组数据SKIPIF1<0,其回归直线SKIPIF1<0的斜率和截距的最小二乘估计公式分别为SKIPIF1<0,SKIPIF1<0.【答案】.(1)SKIPIF1<0;(2)第9个月的月利润预报值最大(1)令SKIPIF1<0,则SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,所以y关于x的回归方程为SKIPIF1<0;(2)由(1)知:SKIPIF1<0,SKIPIF1<0,令SKIPIF1<0,SKIPIF1<0令SKIPIF1<0得:SKIPIF1<0,令SKIPIF1<0得:SKIPIF1<0,令SKIPIF1<0得:SKIPIF1<0,所以SKIPIF1<0在SKIPIF1<0处取得极大值,也是最大值,SKIPIF1<0所以第9个月的月利润预报值最大.5.(2022·广东肇庆·二模)下表是我国从2016年到2020年能源消费总量近似值y(单位:千万吨标准煤)的数据表格:年份20162017201820192020年份代号x12345能源消费总量近似值y(单位:千万吨标准煤)442456472488498以x为解释变量,y为预报变量,若以SKIPIF1<0为回归方程,则相关指数SKIPIF1<0,若以SKIPIF1<0为回归方程,则相关指数SKIPIF1<0.(1)判断SKIPIF1<0与SKIPIF1<0哪一个更适宜作为能源消费总量近似值y关于年份代号x的回归方程,并说明理由;(2)根据(1)的判断结果及表中数据,求出y关于年份代号x的回归方程.参考数据:SKIPIF1<0,SKIPIF1<0.参考公式:回归方程SKIPIF1<0中斜率和截距的最小二乘估计公式分别为:SKIPIF1<0,SKIPIF1<0.【答案】.(1)SKIPIF1<0更适宜作为y关于x的回归方程,答案见解析;(2)SKIPIF1<0.(1)因为SKIPIF1<0,所以SKIPIF1<0更适宜作为y关于x的回归方程.(2)SKIPIF1<0,SKIPIF1<0.SKIPIF1<0,SKIPIF1<0,所以以x为解释变量,y为预报变量的回归方程为SKIPIF1<0.6.(2022·广东潮州·二模)我国在芯片领域的短板有光刻机和光刻胶,某风险投资公司准备投资芯片领域,若投资光刻机项目,据预期,每年的收益率为30%的概率为SKIPIF1<0,收益率为SKIPIF1<0%的概率为SKIPIF1<0;若投资光刻胶项目,据预期,每年的收益率为30%的概率为0.4,收益率为SKIPIF1<0%的概率为0.1,收益率为零的概率为0.5.(1)已知投资以上两个项目,获利的期望是一样的,请你从风险角度考虑为该公司选择一个较稳妥的项目;(2)若该风险投资公司准备对以上你认为较稳妥的项目进行投资,4年累计投资数据如下表:年份x2018201920202021SKIPIF1<01234累计投资金额y(单位:亿元)2356请根据上表提供的数据,用最小二乘法求出y关于SKIPIF1<0的线性回归方程SKIPIF1<0,并预测到哪一年年末,该公司在芯片领域的投资收益预期能达到0.75亿元.附:收益=投入的资金×获利的期望;线性回归SKIPIF1<0中,SKIPIF1<0,SKIPIF1<0.【答案】.(1)该风投公司投资光刻胶项目;(2)SKIPIF1<0;2022年年末.(1)若投资光刻机项目,设收益率为SKIPIF1<0,则SKIPIF1<0的分布列为SKIPIF1<00.3SKIPIF1<0PpSKIPIF1<0所以SKIPIF1<0.若投资光刻胶项目,设收益率为SKIPIF1<0,则SKIPIF1<0的分布列为SKIPIF1<00.3SKIPIF1<00P0.40.10.5所以SKIPIF1<0.因为投资以上两个项目,获利的期望是一样的,所以SKIPIF1<0,所以SKIPIF1<0.因为SKIPIF1<0,SKIPIF1<0,所以SKIPIF1<0,SKIPIF1<0,这说明光刻机项目和光刻胶项目获利相等,但光刻胶项目更稳妥.综上所述,建议该风投公司投资光刻胶项目.(2)SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,则SKIPIF1<0,SKIPIF1<0,故线性回归方程为SKIPIF1<0.设该公司在芯片领域的投资收益为Y,则SKIPIF1<0,解得SKIPIF1<0,故在2022年年末该投资公司在芯片领域的投资收益可以超过0.75亿元.7.在疫情防控常态化的背景下,山东省政府各部门在保安全,保稳定的前提下有序恢复生产,生活和工作秩序,五一期间,文旅部门在落实防控举措的同时,推出了多款套票文旅产品,得到消费者的积极回应.下面是文旅部门在某地区推出六款不同价位的旅游套票,每款的套票价格x(单位:元)与购买人数y(单位:万人)的数据如下表:旅游类别城市展馆科技游乡村特色游齐鲁红色游登山套票游园套票观海套票套票价格x(元)394958677786购买数量y(万人)16.718.720.622.524.125.6在分析数据、描点绘图中,发现散点SKIPIF1<0集中在一条直线附近,其中SKIPIF1<0附:①可能用到的数据:SKIPIF1<0.②对于一组数据SKIPIF1<0,其回归直线SKIPIF1<0的斜率和截距的最小二乘估计值分别为SKIPIF1<0(1)根据所给数据,求y关于x的回归方程;(2)按照文旅部门的指标测定,当购买数量y与套票价格x的比在区间SKIPIF1<0上时,该套票受消费者的欢迎程度更高,可以被认定为“热门套票”,现有三位同学从以上六款旅游套票中,购买不同的三款各自旅游.记三人中购买“热门套票”的人数为X,求随机变量X的分布列和期望.【解析】(1)SKIPIF1<0散点SKIPIF1<0集中在一条直线附近,设回归直线方程为SKIPIF1<0由SKIPIF1<0,则SKIPIF1<0,SKIPIF1<0,SKIPIF1<0变量SKIPIF1<0关于SKIPIF1<0的回归方程为SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,综上,y关于x的回归方程为SKIPIF1<0;(2)由SKIPIF1<0,解得SKIPIF1<0,SKIPIF1<0,SKIPIF1<0乡村特色游,齐鲁红色游,登山套票,游园套票为“热门套票”,则三人中购买“热门套票”的人数X服从超几何分布,SKIPIF1<0的可能取值为SKIPIF1<0,SKIPIF1<0SKIPIF1<0SKIPIF1<0的分布列为:SKIPIF1<0123PSKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0.考点三:独立性检验【典例例题】例1.(2022·广东揭阳·高三期末)每年的毕业季都是高校毕业生求职和公司招聘最忙碌的时候,甲、乙两家公司今年分别提供了2个和3个不同的职位,一共收到了100份简历,具体数据如下:公司文史男文史女理工男理工女甲10102010乙1520105分析毕业生的选择意愿与性别的关联关系时,已知对应的SKIPIF1<0的观测值SKIPIF1<0;分析毕业生的选择意愿与专业关联的SKIPIF1<0的观测值SKIPIF1<0,则下列说法正确的是(

)SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0A.有SKIPIF1<0的把握认为毕业生的选择意愿与专业相关联B.毕业生在选择甲、乙公司时,选择意愿与专业的关联比与性别的关联性更大一些C.理科专业的学生更倾向于选择乙公司D.女性毕业生更倾向于选择甲公司【答案】B【详解】解:与专业关联的SKIPIF1<0的观测值SKIPIF1<0,明显大于SKIPIF1<0,明显小于SKIPIF1<0,所以有SKIPIF1<0的把握认为毕业生的选择意愿与专业相关联,所以SKIPIF1<0不正确;因为SKIPIF1<0,故SKIPIF1<0正确;根据题中的数据表列出专业与甲、乙公司的关联表可知,理科专业的学生更倾向于选择甲公司,列出性别与甲、乙公司的关联表可知,女性毕业生更倾向于选择乙公司,所以C,D均不正确.故选:B.例2.(2021·广东汕头·高三期末)某土特产超市为预估2022年元旦期间游客购买土特产的情况,对2021年元旦期间的90位游客购买情况进行统计,得到如下人数分布表:购买金额(元)[0,150)[150,300)[300,450)[450,600)[600,750)[750,900]人数101520152010(1)根据以上数据完成SKIPIF1<0列联表,并判断是否有95%的把握认为购买金额是否少于600元与性别有关.不少于600元少于600元合计男40女18合计(2)为吸引游客,该超市推出一种优惠方案:购买金额不少于600元可抽奖3次,每次中奖概率为P(每次抽奖互不影响,且P的值等于人数分布表中购买金额不少于600元的频率),中奖1次减50元,中奖2次减100元,中奖3次减150元.若游客甲计划购买800元的土特产,请列出实际付款数SKIPIF1<0(元)的分布列并求其数学期望.附:参考公式和数据:SKIPIF1<0附表:SKIPIF1<02.0722.7063.8416.6357.879SKIPIF1<00.1500.1000.0500.0100.005【答案】.(1)填表见解析;有(2)分布列见解析;期望为SKIPIF1<0(1)SKIPIF1<0列联表如下:不少于600元少于600元合计男124052女182038合计306090SKIPIF1<0SKIPIF1<0,因此有SKIPIF1<0的把握认为购买金额是否少于600元与性别有关.(2)SKIPIF1<0可能取值为650,700,750,800,且SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,所以SKIPIF1<0的分布列为SKIPIF1<0650700750800SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0.【方法技巧与总结】独立性检验独立性【变式训练】1.(2022·广东潮州·高三期末)(多选)千百年来,我国劳动人民在生产实践中根据云的形状、走向速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩销云,地上雨淋林”“日落云里走,雨在半夜后”……小明同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A的100天日落和夜晚天气,得到如下2×2列联表:夜晚天气日落云里走下雨不下雨临界值表SKIPIF1<00.100.050.0100.001出现255不出现2545SKIPIF1<02.7063.8416.63510.828并计算得到SKIPIF1<0,下列小明对地区SKIPIF1<0天气判断正确的是(

)A.夜晚下雨的概率约为SKIPIF1<0B.未出现“日落云里走”,但夜晚下雨的概率约为SKIPIF1<0C.出现“日落云里走”,有SKIPIF1<0的把握认为夜晚会下雨D.有SKIPIF1<0的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关【答案】BD【详解】由题意,把频率看作概率可得夜晚下雨的概率SKIPIF1<0,A错误;未出现“日落云里走”,但夜晚下雨的概率约为SKIPIF1<0,B正确;由SKIPIF1<0,所以可知有SKIPIF1<0的把握认为“日落云里走’是否出现”与“当晚是否下雨”有关,故D正确,C错误.故选:BD2.(2022·广东湛江·一模)某市为了研究该市空气中的PM2.5浓度和SKIPIF1<0浓度之间的关系,环境监测部门对该市空气质量进行调研,随机抽查了100天空气中的PM2.5浓度和SKIPIF1<0浓度(单位:SKIPIF1<0),得到如下所示的2×2列联表:SKIPIF1<0PM2.5SKIPIF1<0SKIPIF1<0SKIPIF1<06416SKIPIF1<01010经计算SKIPIF1<0,则可以推断出(

)附:SKIPIF1<0SKIPIF1<00.0500.0100.001SKIPIF1<03.8416.63510.828A.该市一天空气中PM2.5浓度不超过SKIPIF1<0,且SKIPIF1<0浓度不超过SKIPIF1<0的概率估计值是0.64B.若2×2列联表中的天数都扩大到原来的10倍,SKIPIF1<0的观测值不会发生变化C.有超过99%的把握认为该市一天空气中PM2.5浓度与SKIPIF1<0浓度有关D.在犯错的概率不超过1%的条件下,认为该市一天空气中PM2.5浓度与SKIPIF1<0浓度有关【答案】.ACD【详解】补充完整列联表如下:SKIPIF1<0PM2.5SKIPIF1<0SKIPIF1<0合计SKIPIF1<0641680SKIPIF1<0101020合计7426100对于A选项,该市一天中,空气中PM2.5浓度不超过SKIPIF1<0,且SKIPIF1<0浓度不超过SKIPIF1<0的概率估计值为SKIPIF1<0,故A正确;对于B选项,SKIPIF1<0,故B不正确;因为7.4844>6.635,根据临界值表可知,在犯错的概率不超过1%的条件下,即有超过99%的把握认为该市一天空气中PM2.5浓度与SKIPIF1<0浓度有关,故C,D均正确.故选:ACD.3.(2022·广东清远·高三期末)某市为积极响应上级部门的号召,通过沿街电子屏、微信公众号等各种渠道对抗疫进行了深入的宣传,帮助全体市民深入了解新型冠状病毒,增强战胜疫情的信心.为了检验大家对新型冠状病毒及防控知识的了解程度,该市推出了相关的问卷调查,随机抽取了年龄在18~99岁之间的200人进行调查,把年龄在SKIPIF1<0和SKIPIF1<0内的人分别称为“青年人”和“中老年人”.经统计,“青年人”和“中老年人”的人数之比为2∶3,其中“青年人”中有50%的人对防控的相关知识了解全面,“中老年人”中对防控的相关知识了解全面和了解不全面的人数之比是2∶1.(1)根据已知条件,完成下面的SKIPIF1<0列联表,并根据统计结果判断是否有95%的把握认为“中老年人”比“青年人”更加了解防控的相关知识.了解全面了解不全面合计青年人中老年人合计(2)用频率估计概率从该市18~99岁市民中随机抽取3位市民,记抽出的市民对防控相关知识了解全面的人数为X,求随机变量X的分布列与数学期望.附表及公式:SKIPIF1<0,其中SKIPIF1<0.SKIPIF1<00.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828【答案】.(1)表格见解析,有(2)分布列见解析,SKIPIF1<0(1)解:(1)因为“青年人”和“中老年人”的人数之比为2∶3,所以“青年人”和“中老年人”的人数分别为80和120,因为“青年人”中有50%的人对防控的相关知识了解全面,所以“青年人”中对防控的相关知识了解全面的有40人,了解不全面的有40人,因为“中老年人”中对防控的相关知识了解全面和了解不全面的人数之比是2∶1,所以“中老年人”中对防控的相关知识了解不全面的有80人,了解不全面的有40人,SKIPIF1<0列联表如下:了解全面了解不全面合计青年人404080中老年人8040120合计12080200因为SKIPIF1<0,所以有95%的把握认为“中老年人”比“青年人”更加了解防控的相关知识;(2)解:用样本估计总体可知,从该市18~99岁市民中随机抽取1人,抽到的市民对防控相关知识了解全面的概率为SKIPIF1<0,所以随机变量SKIPIF1<0,随机变量SKIPIF1<0可取SKIPIF1<0,因为SKIPIF1<0,SKIPIF1<0,所以X的分布列为X0123PSKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0.4.(2022·广东茂名·一模)为了增强学生体质,茂名某中学的体育部计划开展乒乓球比赛,为了解学生对乒乓球运动的兴趣,从该校一年级学生中随机抽取了200人进行调查,男女人数相同,其中女生对乒乓球运动有兴趣的占80%,而男生有15人表示对乒乓球运动没有兴趣.(1)完成2×2列联表,并回答能否有90%的把握认为“对乒乓球运动是否有兴趣与性别有关”?有兴趣没兴趣合计男女合计(2)为了提高同学们对比赛的参与度,比赛分两个阶段进行.第一阶段的比赛赛制采取单循环方式,每场比赛采取三局二胜制,然后由积分的多少选出进入第二阶段比赛的同学,每场积分规则如下:比赛中以SKIPIF1<0取胜的同学积3分,负的同学积0分;以SKIPIF1<0取胜的同学积2分,负的同学积1分.其中,小强同学和小明同学的比赛倍受关注,设每局小强同学取胜的概率为SKIPIF1<0,记小强同学所得积分为SKIPIF1<0,求SKIPIF1<0的分布列和期望.附表:P(K2≥k0)0.500.400.250.1500.1000.050k00.4550.7801.3232.0722.7063.841SKIPIF1<0【答案】.(1)表格见解析,没有;(2)分布列见解析,SKIPIF1<0.(1)由题意得到如下的2×2列联表,有兴趣没兴趣合计男8515100女8020100合计16535200SKIPIF1<0,由表格得到SKIPIF1<0,所以没有90%的把握认为“对乒乓球运动是否有兴趣与性别有关”.(2)由题意,知SKIPIF1<0,SKIPIF1<0;SKIPIF1<0;SKIPIF1<0;SKIPIF1<0,所以SKIPIF1<0的分布为SKIPIF1<00123SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0所以期望SKIPIF1<0.5.(2022·广东茂名·二模)某水果经营户对出售的苹果按大小和色泽两项指标进行分类,最大横切面直径不小于70毫米则大小达标,着色度不低于90%则色泽达标,大小和色泽均达标的苹果为一级果;大小和色泽有一项达标另一项不达标的苹果为二级果;两项均不达标的苹果为三级果.已知该经营户购进一批苹果,从中随机抽取100个进行检验,得到如下统计表格:直径小于70毫米直径不小于70毫米合计着色度低于90%101525着色度不低于90%156075合计2575100(1)根据以上数据,判断是否有95%的把握认为该经营户购进的这批苹果的大小达标和色泽达标有关;(2)该经营户对三个等级的苹果按照分层抽样从样本中抽取10个苹果,再从中随机抽取3个,求抽到二级果个数X的概率分布列和数学期望.附:SKIPIF1<

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论