统计(5大易错点分析+解题模板+举一反三+易错题通关)-2025年高考高考数学易错题(新高考专用)含解析_第1页
统计(5大易错点分析+解题模板+举一反三+易错题通关)-2025年高考高考数学易错题(新高考专用)含解析_第2页
统计(5大易错点分析+解题模板+举一反三+易错题通关)-2025年高考高考数学易错题(新高考专用)含解析_第3页
统计(5大易错点分析+解题模板+举一反三+易错题通关)-2025年高考高考数学易错题(新高考专用)含解析_第4页
统计(5大易错点分析+解题模板+举一反三+易错题通关)-2025年高考高考数学易错题(新高考专用)含解析_第5页
已阅读5页,还剩168页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

【高考数学】备战2025年高考易错题(新高考专用)含解析

专题13统计

——题型一:频率分布直方图、总体取值规律三、易错点:统计用表中概念不清、识图不准致误

——题型二:频率分布直方图特征数考查易错点:统计中的数字特征的实际意义理解不清楚致误

统计€题型三:方差、标准差的求算氏易错点:运用数字特征作评价时考虑不周

——题型四:百分位数的考查又易错点:忽略百分位数两种情况的选取

一题型五:统计案例a、易错点:忽略相关性检验而出错

易错点一:统计用表中概念不清、识图不准致误(频率分布直方图、总体

取值规律)

频率分布直方图

作频率分布直方图的步骤

①求极差:极差为一组数据中最大值与最小值的塞

②决定组距与组数

将数据分组时,一般取等长组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚

地呈现出来.

③将数据分组

④列频率分布表

小组频数

各小组的频率=

样本容量

⑤画频率分布直方图

纵轴表示鬻,臂实际上就是频率分布直方图中各小长方形的高度,小长方形的面积=组距><整=频率.

组距组距组距

频率分布直方图的性质

①因为小矩形的面积=组距><警=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图

组距

就以面积的形式反映了数据落在各个小组内的频率大小.

②在频率分布直方图中,各小矩形的面积之和等于1.

;频数

=样本容量.

相应的频率

④频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,

可近似地估计总体在这一范围内的可能性.

易错提醒:频率分布条形图和频率分布直方图是两个完全不同的概念,考生应注意两者之间的区别.虽然它

们的横轴表示的内容是相同的,但是频率分布条形图的纵轴表示频率;频率分布直方图的纵轴表示频率与

组距的比值,其各小组的频率等于该小组上的矩形的面积.

三9

例:如图所示是某公司(共有员工300人)2021年员工年薪情况的频率分布直方图,由此可知,员工中年

薪在1.4万元〜1.6万元之间的共有人.

易错分析:解本题容易出现的错误是审题不细,对所给图形观察不细心,认为员工中年薪在1.4万元〜1.6万

元之间的频率为1-(0.02+0.08+0.10)x2=0.60,从而得到员工中年薪在1.4万元〜1.6万元之间的共有

300x0.60=180(人)的错误结论.

正解:由所给图形,可知员工中年薪在1.4万元〜1.6万元之间的频率为

1-(0.02+0.08+0.08+0.10+0.10)x2=0.24,所以员工中年薪在1.4万元〜1.6万元之间的共有300x0.24=72

(人).故72.

易错警示:考生误认为频率分布直方图中纵轴表示的是频率,这是错误的,而是“频率/组距",所以频率对

应的是各矩形的面积.

变式1:某大学有男生2000名.为了解该校男生的身体体重情况,随机抽查了该校100名男生的体重,并将

这100名男生的体重(单位:kg)分成以下六组:[54,58)、[58,62)、[62,66)、[66,70)、[70,74)、[74,78],

绘制成如下的频率分布直方图:

该校体重(单位:kg)在区间[70,78]上的男生大约有人

变式2:现对某类文物进行某种物性指标检测,从1000件中随机抽取了200件,测量物性指标值,得到如下

频率分布直方图,据此估计这1000件文物中物性指标值不小于95的件数为

频率

组距

0.033

0.024

0.022

oo9

oo8

OO2

O.0

6575859510511595135物性指标值

变式3:如图是根据我国部分城市某年6月份的平均气温数据得到的样本频率分布直方图,其中平均气温的

范围是[20,26],样本数据的分组为[20,21),[21,22),[22,23),[23,24),[24,25),[25,26],已

知样本中平均气温低于22℃的城市个数为11,样本中平均气温不低于25℃的城市个数是.

“频率

组距

0.26------------------------

0.22------------------------

0.18------------------------

0.12-----------————

0.10——

。〜,0力2223242526平均气麓/c

1.已知某班全体学生在某次数学考试中的成绩(单位:分)的频率分布直方图如图所示,则图中。所代表

的数值是

2.某校共有400名学生参加了趣味知识竞赛(满分:150分),且每位学生的竞赛成绩均不低于90分.将

这400名学生的竞赛成绩分组如下:[90,100),[100,110),[110,120),[120,130),[130,140),[140,150],得到的频率

分布直方图如图所示,则这400名学生中竞赛成绩不低于120分的人数为.

3.从某小学所有学生中随机抽取100名学生,将他们的身高(单位:cm)数据绘制成频率分布直方图(如

图),其中样本数据分组[100,110),[110,120),[120,130),[130,140),[140,150),则a=.

[40,40.5),[40.5,41),[41,41.5),[41.5,42],据此绘制出如图所示的频率分布直方图,则重量在[40,41)内的产品

件数为

5.某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得

到如下的患病者和未患病者该指标的频率分布直方图:

A频率

组距

£巨

4OO40

o.S,0O38

366

.034O3

O..0O34

0.0120.010------------------------------

0.0020.002弋-------------------------------11

O95100105110115120125130指标o707580859095100105指标

患病者未患病者

利用该指标制定一个检测标准,需要确定临界值C,将该指标大于C的人判定为阳性,小于或等于C的人判

定为阴性,此检测标准的漏诊率是将患病者判定为阴性的概率,记为2(c);误诊率是将未患病者判定为阳

性的概率,记为式C).假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.设函数

/(C)=P(c)+q(c),则函数/(c)在区间[95,105]取得最小值时c=.

6.某大学有男生10000名.为了解该校男生的身体体重情况,随机抽查了该校100名男生的体重,并将这

100名男生的体重(单位:kg)分成以下六组:[54,58)、[58,62)、[62,66)、[66,70)、[70,74)、[74,78],

绘制成如图所示的频率分布直方图,该校体重(单位:kg)在区间[70,78]上的男生大约有人.

1频率

0.09------

0.07------

0.04-------------k--

0.02~~I—」一-----

0.01-―—।

0^54586266707478M>(kg)

7.某中学为了解高三男生的体能情况,通过随机抽样,获得了200名男生的100米体能测试成绩(单位:

秒),将数据按照[1L5,12),[12,12.5),…,[15.5,16]分成9组,制成了如图所示的频率分布直方图.由直方

图估计本校高三男生100米体能测试成绩大于13.25秒的频率是.

一频率

组距

0.52--------------------------------

a---------------------

0.30---------------

os.-C6

SII2

CU8

O.IIU.4

16100米成绩(秒)

8.某工厂对一批产品的长度(单位:mm)进行检验,将抽查的产品所得数据分为五组,整理后得到的频

率分布直方图如图所示,若长度在20mm以下的产品有30个,则长度在区间[20,30)内的产品个数为.

频率

0.08

4

O..03

O.S02

°101520253035长度/mm

9.某中学为了解学生的数学学习情况,在全体学生中随机抽取200名,统计这200名学生某次数学考试的

成绩,将所得的数据分为7组:[30,40),[40,50),…,[80,90),[90,100],并整理得到如下频率分布直方

图,则在被抽取的学生中,该次数学考试成绩不低于80分的人数为

10.某区为了解全区12000名高二学生的体能素质情况,在全区高二学生中随机抽取了1000名学生进行体能

测试,并将这1000名的体能测试成绩整理成如下频率分布直方图.根据此频率分布直方图,这1000名学生

平均成绩的估计值为

11.将一个容量为100的样本数据,按照从小到大的顺序分为8个组,如下表:

组号12345678

频数10161815119

若第6组的频率是第3组频率的2倍,则第6组的频率是.

12.节约用水是中华民族的传统美德,某市政府希望在本市试行居民生活用水定额管理,即确定一个合理

的居民月用水量标准x(吨),用水量不超过x的部分按平价收费,超过尤的部分按议价收费.为此希望已

经学习过统计的小明,来给出建议.为了了解全市居民用水量的分布情况,小明通过随机走访,获得了100

位居民某年的月均用水量(单位:吨),将数据按照…,[4,4.5]分成9组,制成了如图所示的

频率分布直方图.若该市政府希望使85%的居民每月的用水量不超过标准x(吨),如果你是小明,你觉得x

的估计值为(精确到小数点后1位)

赎率

0.52

0.40

3544.5月均用

易错点二:统计中的数字特征的实际意义理解不清楚致误(频率分布直方

图特征数考查)

众数、中位数、平均数

①众数:一组数据中出现次数最多的数.

②中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的数(或中间两个数的平均数)叫

做这组数据的中位数.

一11、

③平均数:如果〃个数XI,X2,…,xn,那么X=±&+超+…+X“"上XX,.叫做这"个数的平均数.

nnZf

总体集中趋势的估计

①平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.

②一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;而对

分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.

频率分布直方图中平均数、中位数、众数的求法

①样本平均数:可以用每个小矩形底边中点的横坐标与小矩形面积的乘积之和近似代替.

②在频率分布直方图中,中位数左边和右边的直方图的面积应相等.

③将最高小矩形所在的区间中点作为众数的估计值.

易错提醒:利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直

方图中:

(1)最高的小长方形底边中点的横坐标即是众数;

(2)中位数左边和右边的小长方形的面积和是相等的;

(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中

点的横坐标之和.

例.某班50名学生期中考试数学成绩的频率分布直方图如图所示.根据频率分布直方图,估计该班本次测

试众数为.

变式1:为响应自己城市倡导的低碳出行,小李上班可以选择自行车,他记录了100次骑车所用时间(单位:

分钟),得到频率分布直方图,则骑车时间的众数的估计值是分钟

频率

变式2:数学兴趣小组的四名同学各自抛掷骰子5次,分别记录每次骰子出现的点数,四名同学的部分统计

结果如下:

甲同学:中位数为3,方差为2.8;乙同学:平均数为3.4,方差为1.04;

丙同学:中位数为3,众数为3;丁同学:平均数为3,中位数为2.

根据统计结果,数据中肯定没有出现点数6的是同学.

变式3:以下5个命题中真命题的序号有.

①样本数据的数字特征中,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息;

②若数据为,巧,x3,乙的标准差为S,则数据ax2+b,ax3+b,+6的标准差为aS;

③将二进制数11001000⑵转化成十进制数是200;

-3

④x是区间[0,5]内任意一个整数,则满足“无<3”的概率是

1.2022年11月卡塔尔世界杯如期举行,这是世界足球的一场盛宴.为了了解全民对足球的热爱程度,组

委会在某场比赛结束后,随机抽取了1000名观众进行对足球“喜爱度”的调查评分,将得到的分数分成6段:

[70,75),[75,80),[80,85),[85,90),[90,95),[95,100],得到如图所示的频率分布直方图.图中部分数

2.为了普及环保知识,增强环保意识,某中学随机抽取30名学生参加环保知识测试,得分(十分制)如图所

示,假设得分值的中位数为%,众数为名,平均数为1则“,丸天的大小关系是.

频数

10

10I~~r

8

6

6

4

2

Oami

5678910得分/分

3.《中国居民膳食指南(2022)》数据显示,6岁至17岁儿童青少年超重肥胖率高达19.0%.为了解某地中

学生的体重情况,某机构从该地中学生中随机抽取100名学生,测量他们的体重(单位:千克),根据测量

数据,按[40,45),[45,50),[50,55),[55,60),[60,65),[65,70]分成六组,得到的频率分布直方图如图

所示.根据调查的数据,估计该地中学生体重的中位数是.

4.为了解某校高三学生的数学成绩,随机地抽查了该校100名高三学生的期中考试数学成绩,得到频率分

布直方图如图所示.请根据以上信息,估计该校高三学生数学成绩的中位数为.(结果保留到小数点后

5.2021年某省高考体育百米测试中,成绩全部介于12秒与18秒之间,抽取其中100个样本,将测试结果

按如下方式分成六组:第一组[12,13),第二组[13,14),…,第六组[17,18],得到如下频率分布直方图.则

该100名考生的成绩的中位数(保留一位小数)是

6.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速的众数、中位数的估计值分别

为.

7.某快递驿站统计了近期每天代收快件的数量,并制成如下图所示的频率分布直方图.

则该快递驿站每天代收包裹数量的中位数为.

8.某质检部门对某新产品的质量指标随机抽取100件检测,由检测结果得到如图所示的频率分布直方图.

0.030

0.025

0.020

0.015

0.010

01()20304050质量指标

由频率分布直方图可以认为,该产品的质量指标值Z服从正态分布N仅。2),其中〃近似为样本平均数

无人近似为样本方差$2.设X表示从该种产品中随机抽取10件,其质量指标值位于(11.6,35.4)的件数,则X

的数学期望=.(精确到0.01)

注:①同一组数据用该区间的中点值作代表,计算得样本标准差s。11.9;②若Z〜nJq?),贝I]

尸(〃一b<Z<〃+cr)=0.6826,尸(〃一2cr<Z<〃+2a)=0.9544.

9.由于受到网络电商的冲击,某品牌的洗衣机在线下的销售受到影响,承受了一定的经济损失,现将A地

区200家实体店该品牌洗衣机的月经济损失统计如图所示,估算月经济损失的平均数为加,中位数为",则

m—n=

10.某大学天文台随机调查了该校100位天文爱好者的年龄,得到如下样本数据频率分布直方图,则估计

11.众数、平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.在如图的分布

形态中,"葭小。分别表示众数、平均数、中位数,则加、小。中最小值为.

12.如图为某工厂工人生产能力频率分布直方图,则估计此工厂工人生产能力的平均值为.

八频率/组距

0.048.....................

x...........................

0.020..........1—

0.008[-T——||||

万苏加加前谆R能力

易错点三:运用数字特征作评价时考虑不周(方差、标准差的求算)

方差、标准差

_11n

①假设一组数据为占,々,£,…X",则这组数据的平均数X7…2+•••+%)=»

nn,=i

2、

2.

方差为s阳-nx

7

②若假设一组数据为西,12,七,…与,它的平均数为嚏,方差为一,

则一组数据为办I+8办2+仇畛+仇…%+6,的平均数为菽+6,方差为a2s2。

③标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离

散程度越小.

易错提醒:方差(标准差)越大,说明数据的离散性越大;方差(标准差)越小,说明数据的离散性越小,数据

越集中、稳定.用样本的数字特征估计总体的数字特征时,如果抽样的方法比较合理,那么样本可以反映

总体的信息,但从样本得到的信息会有偏差,这些偏差是由样本的随机性引起的.虽然样本的数字特征并

不是总体真正的数字特征,而是总体的一个估计,但这种估计是合理的,特别是当样本容量很大时,样本

的数字特征稳定于总体的数字特征.

例、若甲、乙两台机床同时加工直径为100mm的零件,为了检验产品的质量,从产品中随机抽取6件进行

测量,测得数据如下:(单位:mm):甲:99,100,98,100,103;乙:99,100,102,99,100,100.通

过计算,请你说明哪一台机床加工的零件更符合要求.

【错解]%=把及±竺普但型=100,

6

-l(X)+102-994l(M)+HKIinn

x,=-----------------------------------------=100,

fi

因为两个机床所加工零件的平均数相等,平均数描绘了数据的平均水平,

所以两台机床加工的零件都符合要求.

【错因】平均数[对数据有“取齐”作用,它描述了一组数据的平均水平,定量地反映了数据的集中趋势,因

此平均数是与样本数据最接近、最理想的近似值,但由于样本选取的随机性,有时用平均数衡量总体的特

征会失之偏颇,因此应进一步计算方差或标准差来比较它们的波动大小.

【正解】匕="•当土丝L!0t…他±1电=ioo,

A

-W-1«)+102+99+100+KXJ,„„

无..=----------------------=100,

6

S?I=7X[(99-100)2+3x(100-100)2+(98-100)2+(103-100)2]=?,

n3

S^=7X[2X(99-100)2+3x(100-100)2+(102-100)2]=1.

si>s;,说明甲机床加工的零件波动比较大.

故乙机床加工的零件更符合要求.

变式1:泉州,作为古代海上丝绸之路的起点,具有深厚的历史文化底蕴,是全国同时拥有联合国三大类非

遗项目的唯一城市.为高效统筹整合优质文旅资源,文旅局在“五一”假期精心策划文旅活动,使得来泉旅游

人数突破了305.85万人次.某数学兴趣小组为了解来泉游客的旅游体验满意度,用问卷的方式随机调查了500

名来泉旅游的游客,被抽到的游客根据旅游体验给出满意度分值T(满分100分),该兴趣小组将收集到的

数据分成五段:[45,55),[55,65),[65,75),[75,85),[85,95],处理后绘制了如下频率分布直方图.

(1)求图中。的值并估计500名游客满意度分值7的中位数(结果用分数表示);

⑵已知7在[45,65)的平均数为57,方差为104,7在[65,95]的平均数为77,方差为564,试求被调查的500

名游客的满意度分值T的平均数及方差.

变式2:拔尖创新人才是21世纪社会经济发展的巨大动力,培养拔尖创新人才也成为世界各国教育的主要

任务.某市为了解市民对拔尖人才培养理念的关注程度,举办了“拔尖人才素养必备”知识普及竞赛,从所有

答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:

[40,50),[50,60),••.,[90,100],得到如图所示的频率分布直方图.

(1)求频率分布直方图中。的值,并估计该市这次竞赛成绩的众数;

⑵已知落在[50,60)的平均成绩56,方差s;=9,落在[70,80)的平均成绩亮=76,方差s;=5,求这两

组成绩的总平均数1和总方差52.

变式3:为了研究网民的上网习惯,某机构随机抽取了年龄在10岁到60岁的网民进行问卷调查,按年龄分

为5组,BP[10,20),[20,30),[30,40),[40,50),[50,60],并绘制出频率分布直方图,如图所示.

O102030405060年龄

(1)若按分层抽样的方法,从上述网民中抽取〃人做采访,其中年龄在[30,40)中被抽取的人数为7,求知

(2)若各区间的值以该区间的中点值作代表,求上述网民年龄的方差的估计值.

1.已知甲、乙两位同学在一次射击练习中各射靶10次,射中环数频率分布如图所示:

令蒋,,分别表示甲、乙射中环数的均值;s:分别表示甲、乙射中环数的方差,则()

A.x甲<》乙,s看〉s2B.x甲>》乙,

2.某学校组织学生参加数学测试,某班成绩的频率分布直方图如图,数据的分组依次为

[60,70),[70,80),[80,90),[90,100].若不低于80分的人数是35人,且同一组中的数据用该组区间的中点值代表,

B.成绩在[80,90)的学生人数是12

C.估计该班成绩的众数是95分

D.估计该班成绩的方差为100

3.从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得频率分布直方

图,则这500件产品质量指标值的样本方差52是(同一组中的数据用该组区间的中点值作代表).

0.035

0.030

4.在一次区域统考中,为了了解各学科的成绩情况,从所有考生成绩中随机抽出20位考生的成绩进行统

计分析,其中数学学科的频率分布直方图如图所示,据此估计,在本次考试中数学成绩的方差为.(同

5.为了解本市居民的生活成本,甲、乙、丙三名同学利用假期分别对三个社区进行了“家庭每月日常消费额”的

调查.他们将调查所得的数据分别绘制成频率分布直方图(如图所示),记甲、乙、丙所调查数据的标准差分别为

邑”2,邑,则它们的大小关系为.

A频率

USE

0.0008

0.0006

0.0004

0.0002

A

O消费额/元

6.某工厂从生产的一批产品中随机抽出一部分,对这些产品的一项质量指标进行了检测,整理检测结果得

到如下频率分布表:

[10,30)[30,50)[50,70]

质量指标分组

频率0.10.60.3

据此可估计这批产品的此项质量指标的方差为.

7.2023年10月22日,汉江生态城2023襄阳马拉松在湖北省襄阳市成功举行,志愿者的服务工作是马拉

松成功举办的重要保障,襄阳市新时代文明实践中心承办了志愿者选拔的面试工作.现随机抽取了100名

候选者的面试成绩,并分成五组:第一组[45,55),第二组[55,65),第三组[65,75),第四组[75,85),第五

组[85,95),绘制成如图所示的频率分布直方图.已知第一、二组的频率之和为0.3,第一组和第五组的频率

(1)估计这100名候选者面试成绩的平均数和第25百分位数;

(2)现从以上各组中用分层随机抽样的方法选取20人,担任本市的宣传者.

①现计划从第一组和第二组抽取的人中,再随机抽取2名作为组长.求选出的两人来自不同组的概率.

②若本市宣传者中第二组面试者的面试成绩的平均数和方差分别为62和40,第四组面试者的面试成绩的平

均数和方差分别为80和70,据此估计这次第二组和第四组面试者所有人的方差.

8.古人云“民以食为天”,某校为了了解学生食堂服务的整体情况,进一步提高食堂的服务质量,营造和谐

的就餐环境,使同学们能够获得更好的饮食服务为此做了一次全校的问卷调查,问卷所涉及的问题均量化

成对应的分数(满分100分),从所有答卷中随机抽取100份分数作为样本,将样本的分数(成绩均为不低

于40分的整数)分成六段:[40,50)[50,60)「、[90,100],得到如图所示的频数分布表.

[40,50)[50,60)[60,70)[70,80)[80,90)[90,100]

样本分数段

频数51020a2510

0.00.2

频率0.10.2b0.1

55

(1)求频数分布表中a和b的值,并求样本成绩的中位数和平均数;

(2)已知落在[50,60)的分数的平均值为56,方差是7;落在[60,70)的分数的平均值为65,方差是4,求两组

成绩的总平均数I和总方差S?.

9.某电信运营公司为响应国家5G网络建设政策,拟实行5G网络流量阶梯定价,每人月用流量中不超过

一种流量计算单位)的部分按0.8元/G3收费,超过4GB的部分按2元/GB收费,从用户群中随机调查了

10000位用户,获得了他们某月的流量使用数据,整理得到如下的频率分布直方图.已知用户月使用流量的

中位数为31.

⑴求表中的%

(2)若先为整数,依据本次调查为使85%以上用户在该月的流量价格为0.8元/G3,则左至少定为多少?

(3)为了进一步了解用户使用5G流量与年龄的相关关系,由频率分布直方图中流量在[20,30)和[30,40)两组

用户中,按人数比例分配的分层抽样方法中抽取了100名用户,已知[20,30)组用户平均年龄为30,方差为

36,流量在[30,40)组用户的平均年龄为20,方差为16,求抽取的100名用户年龄的方差.

10.为建立健全国家学生体质健康监测评价机制,激励学生积极参加身体锻炼,教育部印发《国家学生体

质健康标准》,要求各学校每学年开展覆盖本校各年级学生的《标准》测试工作.为做好全省的迎检工作,

成都市在高三年级开展了一次体质健康模拟测试,并从中随机抽取了200名学生的数据,根据他们的健康

指数绘制了如图所示的频率分布直方图.

(1)估计这200名学生健康指数的平均数亍和样本方差52(同一组数据用该组区间的中点值作代表);

(2)从健康指数在[45,55),[55,65)的两组中利用分层抽样抽出7人进行电话回访,并再随机抽出2人赠送奖品,

求从7人中抽出的2人来自不同组的概率.

11.2022年入冬以来,为进一步做好疫情防控工作,避免疫情的再度爆发,A地区规定居民出行或者出席

公共场合均需佩戴口罩,现将A地区20000个居民一周的口罩使用个数统计如下表所示,其中每周的口罩使

O24681012x/口罩使用个数

(1)求犯〃的值,根据表中数据,完善上面的频率分布直方图;(只画图,不要过程)

(2)根据频率分布直方图估计A地区居民一周口罩使用个数的75%分位数和中位数;(四舍五入,精确到0.1)

(3)根据频率分布直方图估计A地区居民一周口罩使用个数的平均数以及方差.(每组数据用每组中点值代替)

12.某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100户居民每人

的月均用水量(单位:吨).将数据按照[0。5),[0.5,1),…,[4,4.5]分成9组,制成了如下图所示的频率

分布直方图.

八频率

0.50-------

0.42

S16

1

12

1

O.n8

O.J.4

0.O

0.511.522.533.544.5月均用水量/吨

(1)求直万图中a的值;

(2)用每组区间的中点作为每组用水量的平均值,这9组居民每人的月均用水量前四组的方差都为0.3,后5

组的方差都为0.4,求这100户居民月均用水量的方差.

13.亚洲运动会简称亚运会,是亚洲规模最大的综合性运动会,由亚洲奥林匹克理事会的成员国轮流主办,

每四年举办一届.1951年第1届亚运会在印度首都新德里举行,七十多年来亚洲运动员已成为世界体坛上一

支不可忽视的力量,而中国更是世界的体育大国和亚洲的体育霸主.第19届杭州2022年亚运会将于2023年

9月23日至10月8日举办,为普及体育知识,增强群众体育锻炼意识,某地举办了亚运知识竞赛活动.活

动分为男子组和女子组进行,最终决赛男女各有40名选手参加,右图是其中男子组成绩的频率分布直方图

(成绩介于85到145之间),

(1)求图中缺失部分的直方图的高度,并估算男子组成绩排名第10的选手分数;

(2)若计划从男子组中105分以下的选手中随机抽样调查2个同学的答题状况,则抽到的选手中至少有1位

是95分以下选手的概率是多少?

(3)若女子组40位选手的平均分为117,标准差为12,试求所有选手的平均分和方差.

14.某中学组织了数学知识竞赛,从参加考试的学生中抽出40名学生,将其成绩(均为整数)分成六组

[40,50),[50,60),...,[90,1001,其部分频率分布直方图如图所示.观察图形,回答下列问题.

4不宓

(1)求成绩在[70,80)的频率,并补全这个频率分布直方图;

(2)估计这次考试成绩的众数,平均分和方差.

15.某学校为了了解高二年级学生数学运算能力,对高二年级的300名学生进行了一次测试.已知参加此次

测试的学生的分数尤,1=1,2,…,300)全部介于45分到95分之间,该校将所有分数分成5组:

(1)求加的值,并估计此次校内测试分数的平均值下;

(2)学校要求按照分数从高到低选拔前30名的学生进行培训,试估计这30名学生的最低分数;

(3)试估计这300名学生的分数占«=1,2,…,300)的方差S2,并判断此次得分为52分和94分的两名同学的成

绩是否进入到了[亍-2s,£+2s]范围内?

1n_____

(参考公式:-可一,其中工为各组频数;参考数据:V129®11.4)

nZ=1

易错点四:忽略百分位数两种情况的选取(百分位数的考查)

百分位数

①百分位数定义:一般地,一组数据的第P百分位数是这样一个值,它使得这组数据中至少有P%的数据小

于或等于这个值,且至少有(100一0)%的数据大于或等于这个值.

②常用的百分位数

1.四分位数:第25百分位数,第50百分位数,第75百分位数.

2.其它常用的百分位数:第1百分位数,第5百分位数,第95百分位数,第99百分位数.

③计算一组〃个数据的第p百分位数的一般步骤如下:

第一步:按从小到大排列原始数据;

第二步:计算,=〃X0%;

第三步:若,不是整数,而大于,的比邻整数为/,则第P百分位数为第/项数据;若,是整数,则第P百分

位数为第i项与第(i+1)项数据的平均数.

易错提醒:若,不是整数,而大于,•的比邻整数为人则第〃百分位数为第/项数据;若,是整数,则第p百

分位数为第i项与第(i+1)项数据的平均数.

三9

例.某高校承办了杭州亚运会志愿者选拔的面试工作.现随机抽取了100名候选者的面试成绩,并分成五组:

第一组[45,55),第二组[55,65),第三组[65,75),第四组[75,85),第五组[85,95],绘制成如图所示的频率

分布直方图.已知第三、四、五组的频率之和为0.7,第一组和第五组的频率相同.

(1)求。,6的值;

(2)估计这100名候选者面试成绩的第65百分位数(分位数精确到0.1);

(3)在第四,第五两组志愿者中,采用分层抽样的方法从中抽取5人,然后再从这5人中选出2人,以确定

组长人选,求选出的两人来自同一组的概率.

变式1.某市政府为了倡议市民节约用电,计划对居民生活用电费用实施阶梯式电价制度,即确定一户居民

月均用电量标准。,用电量不超过。的部分按照平价收费,超出部分按议价收费.为了确定一个合理的标

准,从某小区抽取了100户居民进行用电量调查(单位kW・h),并绘制了如图所示的频率分布直方图:

(2)求被调查用户的月用电量平均值:(同一组数据用该区间的中点值作代表)

(3)若使85%居民用户的水费支出不受影响,应确定a值为多少?

变式2.长沙市某中学近几年加大了对学生奥赛的培训,为了选择培训的对象,2023年5月该中学进行一

次数学竞赛,从参加竞赛的同学中,选取50名同学将其成绩(百分制,均为整数)分成六组:第1组[40,50),

第2组[50,60),第3组[60,70),第4组[70,80),第5组[80,90),第6组[90,100],得到频率分布直方图

(1)根据频率分布直方图,估计本次考试成绩的平均数和第71百分位数(同一组中的数据用该组区间的中点

值作代表);

(2)已知学生成绩评定等级有优秀、良好、一般三个等级,其中成绩不小于90分时为优秀等级,若从成绩在

第5组和第6组的学生中,随机抽取2人,求所抽取的2人中至少有1人成绩优秀的概率.

变式3.一个容量为20的样本,其数据按从小到大的顺序排列为:1,2,2,3,5,6,6,7,8,8,9,10,

13,13,14,15,17,17,18,18,则该组数据的第75百分位数为,第86百分位数为.

1.以下数据为某学校参加学科节数学竞赛决赛的10人的成绩:(单位:分)72,78,79,80,81,83,84,

86,88,90.这10人成绩的第。百分位数是85,则〃=()

A.65B.70C.75D.80

2.某校排球社的同学为训练动作组织了垫排球比赛,以下为根据排球社50位同学的垫球个数画的频率分布

直方图,所有同学垫球数都在5~40之间.估计垫球数的样本数据的第75百分位数是()

3.“幸福感指数”是指人们主观地评价自己目前生活状态的满意程度的指标,常用区间[0,10]内的一个数来

表示,该数越接近10表示满意程度越高.现随机抽取10位某小区居民,他们的幸福感指数分别为3,4,5,

5,6,6,7,8,9,10,则这组数据的第80百分位数是()

A.7.5B.8C.8.5D.9

4.为了进一步学习贯彻党的二十大精神,推进科普宣传教育,激发学生的学习热情,营造良好的学习氛围,

不断提高学生对科学、法律、健康等知识的了解,某学校组织全校班级开展“红色百年路•科普万里行”知识竞

赛.现抽取10个班级的平均成绩:70、71、73、76、78、78、81、85、89、90,据此估计该校各个班级平均成绩的第40

百分位数为()

A.77B.78C.76D.80

5.某地一年之内12个月的月降水量分别为:46,51,48,53,56,53,56,64,58,56,66,71,则

下列说法正确的是()

A.该地区的月降水量20%分位数为51

B.该地区的月降水量50%分位数为53

C.该地区的月降水量75%分位数为61

D.该地区的月降水量80%分位数为64

6.习近平总书记强调,要坚持健康第一的教育理念,加强学校体育工作,推动青少年文化学习和体育锻炼

协调发展.某学校对高一年级学生每周在校体育锻炼时长(单位:小时)进行了统计,得到如下频率分布表:

[2,3)艮4)[4,5)[5,6]

分组

频率0.250.300.200.25

则下列关于高一年级学生每周体育锻炼时长的说法中正确的是()

A.众数约为2.5

B.中位数约为3.83

C.平均数为3.95

D.第80百分位数约为5.2

7.某公司为了解用户对其产品的满意度,随机调查了10个用户,得到用户对产品的满意度评分如表所示,

评分用区间[0,10]内的一个数来表示,该数越接近10表示满意度越高,则下列说法正确的()

78975410947

A.这组数据的平均数为0

B.这组数据的众数为7

C.这组数据的极差为6

D.这组数据的第75百分位数为9

8.人均国内生产总值是人们了解和把握一个国家或地区的宏观经济运行状况的有效工具,即“人均GDP”,

常作为发展经济学中衡量经济发展状况的指标,是最重要的宏观经济指标之一.在国家统计局的官网上可以

查询到我国2013年至2022年人均国内生产总值(单位:元)的数据,如图所示,则()

B.2013年至2022年人均国内生产总值的极差为42201

C.这10年的人均国内生产总值的80%分位数是71828

D.这10年的人均国内生产总值的增长量最小的是2020年

9.已知互不相同的30个样本数据,若去掉其中最大和最小的数据,设剩下的28个样本数据的方差为s;,

平均数为第;去掉的两个数据的方差为名,平均数为三;原样本数据的方差为S?,平均数为"若嚏=三,则

下列说法正确的是()

A.x=xi

B.15s、14s:+s;

C.剩下28个数据的中位数大于原样本数据的中位数

D.剩下28个数据的22%分位数不等于原样本数据的22%分位数

10.8名学生参加100m跑的成绩(单位:s)分别为13.10,12.99,13.01,13.20,13.01,13.20,12.91,13.01,

则()

A.极差为0.29B.众数为13.01

C.平均数近似为13.05D.第75百分位数为13.10

11.党的二十大报告提出,要加快发展数字经济,促进数字经济与实体经济的深度融合,数字化构建社区

服务新模式成为一种时尚.某社区为优化数字化社区服务,问卷调查调研数字化社区服务的满意度,满意

度采用计分制(满分100分),统计满意度绘制成如下频率分布直方图,图中6=3*则下列结论正确的是

B.满意度计分的众数为80分

C.满意度计分的75%分位数是85分

D.满意度计分的平均分是76.5

12.某校1500名学生参加数学竞赛,随机抽取了40名学生的竞赛成绩(单位:分),成绩的频率分布直方

图如图所示,则()

A.频率分布直方图中a的值为0.005B.估计这40名学生的竞赛成绩的第60百分位数为75

C.估计这40名学生的竞赛成绩的众数为80D.估计总体中成绩落在[60,70)内的学生人数为225

13.甘肃省2017到2022年常住人口变化图如图所示:

甘肃省常住人口/万

恐吸12625.712637.262647.43

ZOJU.UU------------------------------------------------------------------------

2600.00—|—————-------------------------------------

念歌?―2501982490.022492疝

2500.00-------------------------------——........f=一

2450.00————————————

2400.00।1।।:~।;~।

2017年2018年2019年2020年2021年2022年

则()

A.甘肃省2017到2020年这4年的常住人口呈递增趋势

B.甘肃省2017到2022年这6年的常住人口的第40百分位数为2501.98万

C.甘肃省2017到2022年这6年的常住人口的极差为156.41万

D.从2017到2022年这6年中任选1年,则该年的甘肃省常住人口大于2500万的概率为§

14.下表是某公司的月固定工资统计表:

总工程工程见习技术

技术员工技术员2技术员C技术员D技术员E

师师员

固定工资(元)90007000400032002600200015001000

由该表能判断出该公司职工固定工资的75%分位数是元.

15.某城市30天的空气质量指数如下:29,26,28,29,38,29,26,26,40,31,35,44,33,28,80,

86,65,53,70,34,36,4y,31,38,63,60,56,34,74,34.则这组数据的第75百分位数为.

易错点五:忽略相关性检验而出错(统计案例)

I:变量间的相关关系

1.变量之间的相关关系

当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫相关关系.由于相关

关系的不确定性,在寻找变量之间相关关系的过程中,统计发挥着非常重要的作用.我们可以通过收集大

量的数据,在对数据进行统计分析的基础上,发现其中的规律,对它们的关系作出判断.

注意:相关关系与函数关系是不同的,相关关系是一种非确定的关系,函数关系是一种确定的关系,而且

函数关系是一种因果关系,但相关关系不一定是因果关系,也可能是伴随关系.

2.散点图

将样本中的〃个数据点(%,%)(i=1,2,…,n)描在平面直角坐标系中,所得图形叫做散点图.根据散点图中点

的分布可以直观地判断两个变量之间的关系.

(1)如果散点图中的点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为

正相关,如图(1)所示;

(2)如果散点图中的点散布在从左上角到右下角的区域内,对于两个变量的这种相关关系,我们将它称为

负相关,如图(2)所示.

Jf>

(1)(2)

3.相关系数

若相应于变量X的取值项,变量y的观测值为%则变量X与y的相关系数

£(x,-x)(yt-y)2x,.yt-nxy

iJi_=aI_必_,通常用:•来衡量x

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论