2024年高考数学专项复习-第十三章-统计与成对数据的统计分析_第1页
2024年高考数学专项复习-第十三章-统计与成对数据的统计分析_第2页
2024年高考数学专项复习-第十三章-统计与成对数据的统计分析_第3页
2024年高考数学专项复习-第十三章-统计与成对数据的统计分析_第4页
2024年高考数学专项复习-第十三章-统计与成对数据的统计分析_第5页
已阅读5页,还剩185页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2024年高考数学专项复习第十三章统计与成对数据的统计分析01随机抽样、统计图表课标要求命题点五年考情命题分析预测1.了解简单随机抽样的含义及其解决问题的过程,掌握两种简单随机抽样方法:抽签法与随机数法.会计算样本均值和样本方差,了解样本与总体的关系.随机抽样本讲为高考的命题热点,主要考查:(1)分层随机抽样,题型以选择题和填空题为主,属于中低档题;(2)课标要求命题点五年考情命题分析预测2.了解分层随机抽样的特点和适用范围,了解分层随机抽样的必要性,掌握各层样本量比例分配的方法.掌握分层随机抽样的样本均值和样本方差.3.在简单的实际情境中,能根据实际问题的特点,设计恰当的抽样方法解决问题.统计图表统计图表的应用,着重考查频率分布表、频率分布直方图、条形图、折线图等,单独命题时以小题形式出现,与其他知识综合命题时常作续表课标要求命题点五年考情命题分析预测4.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.统计图表为问题情境出现在解答题中.

预计2024年高考命题趋势变化不大,重点在情境的创新.续表1.简单随机抽样(1)简单随机抽样分为放回简单随机抽样和不放回简单随机抽样,除非特殊说明,本章所称的简单随机抽样指不放回简单随机抽样.(2)常用方法:①________和②__________.辨析比较1.抽签法和随机数法的异同:(1)都是逐个、不放回抽样;(2)总体中个体数不多时选择抽签法,总体量较大,样本量较小时选择随机数法.2.能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.抽签法随机数法2.总体均值与样本均值名称定义总体均值(总体平均数)

名称定义样本均值(样本平均数)

(2)总体平均数是一个确定的数,样本平均数具有随机性(因为样本具有随机性);(3)一般情况下,样本量越大,估计越准确;(4)总体平均数是总体的一项重要特征.

续表3.分层随机抽样(1)定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为⑤______________,每一个子总体称为⑥____.在分层抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为⑦__________.分层随机抽样层比例分配

辨析比较简单随机抽样与分层随机抽样的辨析抽样方法共同点各自特点相互联系适用范围简单随机抽样(1)抽样过程中每个个体被抽到的机会均等;(2)都是不放回抽样.从总体中逐个抽取.分层随机抽样在各层抽样时可采用简单随机抽样.样本容量较小.总体由差异明显的几部分组成.分层随机抽样将总体分成互不交叉的层,分层进行抽取.4.统计图表(1)常见的统计图表有条形图、扇形图、折线图、频率分布表、频率分布直方图等.(2)频率分布直方图的制作步骤1.下列说法正确的是(

)A.从无限多个个体中抽取100个个体作为样本是简单随机抽样B.某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛是简单随机抽样C.从某厂生产的5

000件产品中抽取600件进行质量检验,可用抽签法D.某校有2

000名学生,其中高一年级700人,高二年级600人,高三年级700人,现从中抽取20人了解学生在校学习压力的情况,可用分层随机抽样的方法抽取D[解析]

A选项,不是简单随机抽样,因为题中被抽取的总体中的个体数是无限的,而不是有限的;B选项,不是简单随机抽样,个子最高的5名同学是确定的,不是等可能抽样;C选项是简单随机抽样,但总体中的个体数太多,不宜采用抽签法;D选项,三个年级的学生个体差异比较明显,所以适用分层随机抽样.

B

A

0.6

命题点1

随机抽样角度1

简单随机抽样

抽签法[解析]

三十个小球相当于号签,搅拌均匀后逐个不放回地抽取,这是典型的抽签法.

19

角度2

分层随机抽样

D

C

C

方法技巧(1)简单随机抽样需满足:①被抽取的样本总体的个体数有限;②逐个抽取;③等可能抽取.

命题点2

统计图表角度1

扇形图、条形图、雷达图、折线图3.(1)[2023重庆质检]某国有企业响应国家关于进一步深化改革,加强内循环的号召,不断自主创新提升产业技术水平,同时积极调整企业旗下的甲、乙、丙、丁、戊等5种系列产品的结构比例,近年来取得了显著效果.据悉该企业2021年5种系列产品年总收入是2020年的2倍,其中5种系列产品的年收入构成比例如图1,图2所示.则以下说法错误的是(

)图1图2

D

(3)[多选/2020新高考卷Ⅱ]我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图(如图).下列说法正确的是(

)CD

方法技巧统计图表的主要应用扇形图:直观描述各类数据占总数的比例.折线图:描述数据随时间的变化趋势.条形图和直方图:直观描述不同类别或分组数据的频数和频率.角度2

频率分布直方图

B

成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为(

)

日用水量频数13249265使用了节水龙头50天的日用水量频数分布表日用水量频数151310165(1)在图中作出使用了节水龙头50天的日用水量数据的频率分布直方图;[解析]

频率分布直方图如图所示.

(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)

方法技巧与频率分布直方图相关的结论(1)频率分布直方图中各小长方形的面积之和为1.

ABD

2.[命题点2角度1/2018全国卷Ⅰ]某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图:则下面结论中不正确的是(

)A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半A

3.[命题点2角度1]受益于年轻人的线上消费倾向,在线外卖行业市场规模不断快速增长,如图为2011—2021年中国在线外卖行业市场规模及年增长率统计图,则下列结论错误的是(

)

√02用样本估计总体课标要求命题点五年考情命题分析预测1.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.百分位数的估计本讲是高考的热点,主要考查百分位数,样本数据的数课标要求命题点五年考情命题分析预测2.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.样本的数字特征字特征,统计图中的数字特征,总体趋势估计等.预计2024年高考主续表课标要求命题点五年考情命题分析预测3.结合实例,能用样本估计总体的取值规律.4.结合实例,能用样本估计百分位数,理解百分位数的统计含义.总体集中趋势的估计要以生产生活实践情境为载体考查样本的数字特征及对总体的估计.总体离散程度的估计续表

常用结论1.百分位数的特点:(1)一组数据的百分位数可能是这组数据中的数,也可能不是这组数据中的数;(2)第0百分位数为这组数据中的最小的数,第100百分位数为这组数据中的最大的数;(3)一组数据的某些百分位数可能是同一个数.2.在实际应用中,除了中位数外,常用的分位数还有第25百分位数,第75百分位数.以上三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.2.平均数、中位数、众数数字特征概念特征平均数与每一个数据有关,只有一个.中位数将一组数据按从小到大的顺序排列后,处在最④______的一个数据(当数据个数是奇数时)或最中间两个数据的⑤________(当数据的个数是偶数时).中位数不受极端值的影响,仅利用了排在中间位置的数据信息.众数一组数据中出现次数⑥______的数据(即频数最大值所对应的样本数据).体现了样本数据的最大集中点,不受极端值的影响,而且不一定唯一.

中间平均数最多3.方差和标准差名称定义样本的方差和标准差

名称定义总体的方差和标准差

续表

常用结论1.平均数的性质

2.方差的性质

1.下列说法正确的是(

)A.众数可以准确地反映出总体的情况B.一组数据的平均数一定大于这组数据中的每个数C.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D.一组数据的方差越大,说明这组数据的波动越小C

D

C

AC[解析]

平均数、众数和中位数均刻画了样本数据的集中趋势,一般地,对数值型数据集中趋势的描述,可以用平均数和中位数,对分类型数据集中趋势的描述,可以用众数.方差、标准差和极差均是度量样本数据离散程度的数字特征.故选AC.

14.517

命题点1

百分位数的估计

(2)[2022烟台诊断节选]2022年2月4日至20日,第24届冬季奥林匹克运动会成功举办.这场冰雪盛会是运动健儿奋力拼搏的舞台,也是中外文明交流互鉴的舞台,折射出我国更加坚实的文化自信,诠释着新时代中国的从容姿态,传递出中华儿女与世界人民“一起向未来”的共同222.5心声.某学校统计了全校学生观看北京冬奥会开幕式和闭幕式的时长情况(单位:分),并根据样本数据绘制得到如图所示的频率分布直方图.则该样本数据的第85百分位数为______.

方法技巧

命题点2

样本的数字特征角度1

数据中的样本的数字特征

A

A.平均数为8

B.众数为7

C.极差为6

D.中位数为8BC

A.两组样本数据的样本平均数相同

B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同

D.两组样本数据的样本极差相同CD

角度2

统计图中的样本的数字特征

B

(2)[多选/2023云南模拟]某企业为了了解职工对某部门的服务情况,随机访问50名职工,根据这50名职工对该部门的评分,绘制频率分布直方图(如图所示),下列说法正确的是(

)ABD

(3)[多选/2023湖南三湘名校大联考]最近几个月,各学校均加强了疫情防控要求,学生在进校时必须走测温通道,每天早、中、晚都要进行体温检测并将结果上报给主管部门.某班级体温检测员对一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则下列结论中正确的是(

)ACD

命题点3

总体集中趋势的估计

纤维长度频数频率40.0480.08100.10100.10160.16400.40120.12(1)在图中作出样本的频率分布直方图;[解析]

样本的频率分布直方图如图所示.(2)根据(1)中作出的频率分布直方图求这一棉花样本的众数、中位数与平均数,并对这批棉花的众数、中位数和平均数进行估计.

(2)估计该地居民的月收入的中位数.

(3)假设同组中的数据用该组区间的中点值代替,估计该地居民月收入的平均数.

方法技巧频率分布直方图中的数字特征(1)众数:样本数据的频率分布直方图中,最高小长方形的底边中点的横坐标;(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等;(3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.命题点4

总体离散程度的估计角度1

方差和标准差

企业数22453147

7.[2021全国卷乙]某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5

方法技巧总体离散程度的估计(1)标准差(方差)刻画了数据的离散程度或波动幅度,标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.(2)在刻画数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.角度2

分层随机抽样的方差与标准差

(2)某校开展了为期一年的“弘扬传统文化,阅读经典名著”活动.在了解全校学生每年平均阅读了多少本文学经典名著时,甲同学抽取了一个容量为10的样本,并算得样本的平均数为5,方差为9;乙同学抽取了一个容量为8的样本,并算得样本的平均数为6,方差为16.已知甲、乙两同学抽取的样本合在一起组成一个容量为18的样本,则合在一起后的样本平均数为____,方差为_____.(精确到0.1)5.412.4

方法技巧计算分层随机抽样的方差的步骤

C

2.[命题点2角度2/2021全国卷甲]为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如图所示的频率分布直方图.根据此频率分布直方图,下面结论中不正确的是(

)C

3.[命题点2角度2/2022全国卷甲]某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如图,则(

)B

性别人数平均数方差男生5017218女生3016430

BD

03成对数据的统计分析课标要求命题点五年考情命题分析预测1.了解样本相关系数的统计含义,了解样本相关关系与标准化数据向量夹角的关系;会通过相关系数比较多组成对数据的相关性.2.了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,成对数据的相关性本讲是高考命题热点.对于回归分析,主要考查散点图,回归方程类型的识别,求相关系数和回归方程,利用回归方程进行预测等;对于独立性检验,主要考查列联表和依据小概率值的样本的相关系数课标要求命题点五年考情命题分析预测掌握一元线性回归模型参数的最小二乘估计方法;针对实际问题,会用一元线性回归模型进行预测.3.理解列联表的统计意义;了解列联表独立性检验及其应用.回归模型及其应用独立性检验进行分析,常与概率综合命题.题型以解答题为主,难度中等.预计2024年高考会以创新生产生活实践情境为载体考查回归分析和独立性检验.列联表与独立性检验续表1.变量的相关关系(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.(2)正相关和负相关:从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现①______

的趋势,我们就称这两个变量②________

;如果当一个变量的值增加时,另一个变量的相应值呈现③______的趋势,则称这两个变量④________.(3)线性相关:一般地,如果两个变量的取值呈现⑤____相关或⑥____相关,而且散点落在⑦__________附近,我们就称这两个变量线性相关.增加正相关减小负相关正负一条直线2.样本相关系数

正相关

负相关强弱3.一元线性回归模型

预测值4.列联表与独立性检验

合计合计

越大

0.10.050.010.0050.0012.7063.8416.6357.87910.828不成立不独立独立1.下列说法正确的是(

)

A

A.&1&

B.&2&

C.&3&

D.&4&

D

6810122356

C

4.[多选]下列关于成对样本数据的统计分析的判断中正确的有(

)

CD

幸福感强幸福感弱合计阅读量多1872阅读量少3678合计9060150

0.100.050.0250.0100.0050.0012.7063.8415.0246.6357.87910.828对于下面的选项,正确的为(

)

√√命题点1

成对数据的相关性

C

第一组第二组第三组第四组

√方法技巧判断两个变量相关性的3种方法画散点图若点的分布从左下角到右上角,则两个变量正相关;若点的分布从左上角到右下角,则两个变量负相关.利用样本相关系数利用线性回归方程命题点2

样本的相关系数

12345678910总和0.040.060.040.080.080.050.050.070.070.060.60.250.400.220.540.510.340.360.460.420.403.9

(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量.

(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01).

命题点3

回归模型及其应用角度1

一元线性回归模型3.[2022郑州质量检测]2016年起,某贫困地区创新开展产业扶贫,经济收入逐年增加.该地的经济收入变化及构成比例如下表所示:年份20162017201820192020123455009001

4001

7002

0002016年经济收入构成比例2020年经济收入构成比例(1)根据以上图表,试分析:与2016年相比,2020年第三产业与种植业的收入变化情况;[解析]

①与2016年相比,2020年第三产业的收入占比大幅度增加;②2016年第三产业的收入为30万元,2020年第三产业的收入为600万元,收入大幅度增加;③与2016年相比,种植业收入占比减少,但种植业收入依然保持增长.

方法技巧回归模型问题的类型及解题方法

(2)利用回归方程进行预测:直接将已知数值代入回归方程求得特定要求下的预测值.

角度2

非线性回归模型

123456611233772124

3.545.53.3417.5393.510.63239.85

方法技巧常见非线性回归方程与线性回归方程的转换方式非线性回归方程变换公式变换后的线性回归方程命题点4

列联表与独立性检验6.[2021全国卷甲改编]甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:单位:件一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?

0.0500.0100.0013.8416.63510.828

7.[2020全国卷Ⅲ改编]某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):

锻炼人次空气质量等级

1(优)216252(良)510123(轻度污染)6784(中度污染)720

空气质量等级1234概率的估计值0.430.270.210.09(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表).

空气质量好空气质量不好

0.050.010.0013.8416.63510.828

空气质量好3337空气质量不好228

方法技巧独立性检验的一般步骤

回归分析模型的构建及应用

(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值.

(2)你认为用哪个模型得到的预测值更可靠?并说明理由.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论