




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十番统计(三大考向)
一:考情分析
命题解读考向考查统计
1.高考对统计的考查,重点是以下考2022•新高考n卷,19(1)
频率分布直方图、频
点(1)分层随机抽样2023•新高考II卷,19(1)
数分布表
(2)统计图表2024.新高考n卷,4
(3)会用统计图表对总体进行估计,会独立性检验2022•新高考I卷,20(1)
求n个数据的第p百分位数.
(4)能用数字特征估计总体集中趋势
和总体离散程度.
(5)了解样本相关系数的统计含义.数据的数字特征2023•新高考I卷,9
(6)理解一元线性回归模型和2x2列
联表,会运用这些方法解决简单的实
际问题.
二:2024高考命题分析
2024年高考新高考I卷未考查统计相关内容,II卷中考查了频数分布表中数据的数字特征的求法。统计
的考查应关注:相关性、频率分布直方图、样本的数字特征、独立性检验、回归分析等。这些考验的是学生读
取数据、分析数据、处理数据的能力。预计2025年高考还是主要考查频率分布直方图和数据的数字特征,可
以多留意方差的计算方法!
三:试题精讲
一、单选题
】(2024新高考n卷⑷某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的
亩产量(均在[900,1200)之间,单位:kg)并部分整理下表
亩产量[900,950)[950,1000)[1000,1050)[1100,1150)[1150,1200)
频数612182410
据表中数据,结论中正确的是()
A.100块稻田亩产量的中位数小于1050kg
B.100块稻田中亩产量低于1100kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200kg至300kg之间
D.100块稻田亩产量的平均值介于900kg至1000kg之间
【答案】。
【分析】计算出前三段频数即可判断/;计算出低于1100kg的频数,再计算比例即可判断B;根据极
差计算方法即可判断C;根据平均值计算公式即可判断D.
【详解】对于A,根据频数分布表可知,6+12+18=36<50,
所以亩产量的中位数不小于1050kg,故A错误;
对于B,亩产量不低于1100kg的频数为24+10=34,
所以低于1100kg的稻田占比为叫浸,=66%,故B错误;
对于。,稻田亩产量的极差最大为1200-900=300,最小为1150-950=200,故C正确;
对于。,由频数分布表可得,亩产量在[1050,1100)的频数为100-(6+12+18+24+10)=30,
所以平均值为上x(6x925+12X975+18x1025+30x1075+24x1125+10x1175)=1067,
故。错误.
故选;C.
高考真题练
一、多选题
【题2】(2023新高考I卷-9)有一组样本数据如侬…,g,其中电是最小值,g是最大值,则()
A.62,力3,/4,力5的平均数等于力1,22,…,/6的平均数
B.劣2,力3,64,劣5的中位数等于22,…,劣6的中位数
C.力2,63,力4,力5的标准差不小于力1,力2,…,力6的标准差
D.62,如力外劣5的极差不大于61,劣2,…,劣6的极差
【答案】RD
【分析】根据题意结合平均数、中位数、标准差以及极差的概念逐项分析判断.
【详解】对于选项人设曲曲两血的平均数为m,力i,g,…,/6的平均数为n,
X+X-\~X+X+X+XQX+X+X-\-X2(g+g)—(g+g+g+/D
则?i_m=123452345
因为没有确定2(g+/6),g+g+g+弱的大小关系,所以无法判断77Z,72的大小,
例如:1,2,3,4,5,6,可得nz=n=3.5;
例如1,1,1,1,1,7,可得??2=l,n=2;
例如1,2,2,2,2,2,可得?n=2,九=耳;故A错误;
对于选项_8:不妨设214劣24力3424&力5&力6,
可知名2,伤,劣4,X5的中位数等于伤,力2,…a6的中位数均为“3;*4,故B正确;
对于选项。:因为0是最小值,&是最大值,
则22,力3,力4,65的波动性不大于如力2,…,力6的波动性,即力2,g,力4,65的标准差不大于力1,力2,…,力6的
标准差,
例如:2,4,6,8,10,12,则平均数「=今(2+4+6+8+10+12)=7,
标准差与=^[(2-7)2+(4-7)2+(6-7)2+(8-7)2+(10-7)2+(12-7)2]=卫野,
4,6,8,10,则平均数巾=十(4+6+8+10)=7,
标准差S2=^[(4-7)2+(6-7)2+(8-7)2+(10-7)2]=V5,
显然>V5,即Si>S2;故C错误;
O
对于选项。:不妨设力14力2&力3<力4&力5«力6,
则力6——/2,当且仅当X1=X2,X5=XQ时,等号成立,故。正确;
故选:BD.
二、解答题
卜23](2022新高考I卷-20)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为
良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾
病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好良好
病例组4060
对照组1090
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
n(ad—bc)2
附Y=
(a+b)(c+d)(a+c)(b+d)
P0.05
0.0100.001
(定〉国0
6.63
k3.84110.828
5
【答案】(1)答案见解析
【分析】⑴由所给数据结合公式求出K2的值,将其与临界值比较大小,由此确定是否有99%的把
握认为患该疾病群体与未患该疾病群体的卫生习惯有差异;(2)⑴根据定义结合条件概率公式即
可完成证明;(久)根据⑴结合已知数据求兄
200(40X90-60X10)2
【详解】(1)由已知K2=-_Mad”
、__50X150X100X100'
(a+b)(c+d)(a+c)(b+d)
又P(K2)6.635)=0.01,24>6.635,
所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
[题4](2022新高考n卷•19)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下
的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
【答案】⑴47.9岁;
【分析】(1)根据平均值等于各矩形的面积乘以对应区间的中点值的和即可求出;
【详解】(1)平均年龄万=(5x0.001+15X0.002+25x0.012+35x0.017+45x0.023
+55x0.020+65x0.017+75x0.006+85x0.002)xl0=47.9(岁).
【题5】(2023新高考n卷-19)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显
差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人
判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为p(c);误诊率是将未患病者判定
为阳性的概率,记为q(c).假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
⑴当漏诊率p(c)=0.5%时,求临界值c和误诊率q(c);
【答案】⑴c=97.5,q(c)=3.5%;
【分析】(1)根据题意由第一个图可先求出c,再根据第二个图求出c>97.5的矩形面积即可解出;
【详解】⑴依题可知,左边图形第一个小矩形的面积为5x0.002>0.5%,所以95<c<100,
所以(c―95)义0.002=0.5%,解得:c=97.5,
q(c)=0.01X(100-97.5)+5x0.002=0.035=3.5%.
知识点总结
一、分层随机抽样
1、分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体
中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分
层随机抽样,每一个子总体称为层.
2、分层随机抽样的平均数计算
在分层随机抽样中,以层数是2为例,如果第1层和第2层包含的个体数分别为M和N,抽取的样本量分别
为m和71,第1层和第2层的样本平均数分别为x,9,样本平均数位石,则M=历+血辛瓦]=
m-x+ny.我们可以采用样本平均数了估计总体平均数W
m+nm+n
二、样本的数字特征
1、众数、中位数、平均数
(1)众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平.
(2)中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)
叫做这组数据的中位数,中位数反应一组数据的中间水平.
(3)平均数:几个样本数据电,电,…网的平均数为了反应一组数据的平均水平,公式变形:
n
n
@=nx.
i=l
2、标准差和方差
(1)标准差:标准差是样本数据到平均数的一种平均距离,一般用s表示.假设样本数据是如陶…,为,了表
222
示这组数据的平均数,则标准差S=—X)+(X2—X)Hl-(xn—x)].
⑵方差:方差就是标准差的平方,即§2=工[(伤—访2+(g-可+…+3n-戏].显然,在刻画样本数据的分
n
散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差.
(3)数据特征
标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数据的离散程度越大;标
准差、方差越小,数据的离散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小.
三、频率分布直方图
1、频率、频数、样本容量的计算方法
①兽当x组距=频率.
组距
②》、学0=频率,普=样本容量,样本容量X频率=频数•
样本容量频率
③频率分布直方图中各个小方形的面积总和等于1.
2、频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为工,利用多左(右)侧矩形面积之和等于
0.5,即可求出x.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点
的横坐标之和,即有x=ajjpj+ajjpjH---其中立”为每个小长方形底边的中点,外为每个小长方形的面
积.
四、百分位数
1、定义
一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有
(100-p)%的数据大于或等于这个值.
2、计算一组八个数据的的第p百分位数的步骤
(1)按从小到大排列原始数据.
(2)计算i=nxp%.
(3)若i不是整数而大于i的比邻整数,,贝I第p百分位数为第/项数据;若i是整数,则第p百分位数为第i项
与第i+1项数据的平均数.
3、四分位数
我们之前学过的中位数,相当于是第50百分位数.在实际应用中,除了中位数外,常用的分位数还有第25
196
百分位数,第75百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
五、变量间的相关关系
1、变量之间的相关关系
当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫相关关系.由于相关
关系的不确定性,在寻找变量之间相关关系的过程中,统计发挥着非常重要的作用.我们可以通过收集大
量的数据,在对数据进行统计分析的基础上,发现其中的规律,对它们的关系作出判断.
注意:相关关系与函数关系是不同的,相关关系是一种非确定的关系,函数关系是一种确定的关系,而且函
数关系是一种因果关系,但相关关系不一定是因果关系,也可能是伴随关系.
2、散点图
将样本中的几个数据点(如%)(i=1,2,…,⑴描在平面直角坐标系中,所得图形叫做散点图.根据散点图中
点的分布可以直观地判断两个变量之间的关系.
⑴如果散点图中的点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正
相关,如图⑴所示;
(2)如果散点图中的点散布在从左上角到右下角的区域内,对于两个变量的这种相关关系,我们将它称为负
相关,如图(2)所示.
0*0»
(1)(2)
3、相关系数
若相应于变量力的取值色,变量g的观测值为仇(1则变量n与y的相关系数度=
__n_
Z(◎一⑸(仅一万)^Xiy-nxy
/1'=口,通常用「来衡量田与沙之间的线性关系的强弱,r的范
、优(◎-金)力(仇一方、优*-与虎-丽2
Vi=li=lV4=1V2=1
围为一1<丁&1.
⑴当r>0时,表示两个变量正相关;当r<0时,表示两个变量负相关.
(2)|r|越接近1,表示两个变量的线性相关性越强;上|越接近0,表示两个变量间几乎不存在线性相关关系.
当|『|=1时,所有数据点都在一条直线上.
⑶通常当|『|>0.75时,认为两个变量具有很强的线性相关关系.
六、线性回归
1、线性回归
线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法.
对于一组具有线性相关关系的数据(的,%),(62,纺),…,(/九,外),其回归方程。=62+(2的求法为
(现一历)(%~y)ZxiUi-n^y
a=y—bx
其中,x=—^xi9歹=一汇%,(5,y)称为样本点的中心.
2、残差分析
对于预报变量夕,通过观测得到的数据称为观测值物,通过回归方程得到的0称为预测值,观测值减去预测值
等于残差,a称为相应于点(%%)的残差,即有钗=yt—备.残差是随机误差的估计结果,通过对残差的分析
可以判断模型刻画数据的效果以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
⑴残差图
通过残差分析,残差点(物动比较均匀地落在水平的带状区域中,说明选用的模型比较合适,其中这样的带
状区域的宽度越窄,说明模型拟合精确度越高;反之,不合适.
⑵通过残差平方和Q=Z(%-。尸分析,如果残差平方和越小,则说明选用的模型的拟合效果越好;反之,
1=1
不合适.
(3)相关指数
£(纺-词2
用相关指数来刻画回归的效果,其计算公式是:笈=1-与-------.
」(筑-赤
2=1
&越接近于1,说明残差的平方和越小,也表示回归的效果越好.
七、非线性回归
解答非线性拟合问题,要先根据散点图选择合适的函数类型,设出回归方程,通过换元将陌生的非线性回归
方程化归转化为我们熟悉的线性回归方程.
求出样本数据换元后的值,然后根据线性回归方程的计算方法计算变换后的线性回归方程系数,还原后即
可求出非线性回归方程,再利用回归方程进行预报预测,注意计算要细心,避免计算错误.
1、建立非线性回归模型的基本步骤:
⑴确定研究对象,明确哪个是解释变量,哪个是预报变量;
⑵画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在非线性关系);
(3)由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用反比例函数、二次函数、
指数函数、对数函数、赛函数模型等);
(4)通过换元,将非线性回归方程模型转化为线性回归方程模型;
⑸按照公式计算线性回归方程中的参数(如最小二乘法),得到线性回归方程;
(6)消去新元,得到非线性回归方程;
(7)得出结果后分析残差图是否有异常.若存在异常,则检查数据是否有误,或模型是否合适等.
八、独立性检验
1、分类变量和列联表
(1)分类变量:
变量的不同"值''表示个体所属的不同类别,像这样的变量称为分类变量.
⑵列联表:
①定义:列出的两个分类变量的频数表称为列联表.
②2x2列联表.
一般地,假设有两个分类变量X和y,它们的取值分别为{e,g}和{依,的},其样本频数列联表(称为2X2
列联表)为
yiV2总计
X1aba+b
力2Cdc+d
n=a+b+
总计a+cb+d
c+d
从2X2列表中,依据一^与一^y的值可直观得出结论:两个变量是否有关系.
a-\-bc+a
2、等高条形图
(1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图表示列联表
数据的频率特征.
(2)观察等高条形图发现—与上y相差很大,就判断两个分类变量之间有关系.
a+bc+d
3、独立性检验
计算随机变量/=__叫ic)2__^利用必的取值推断分类变量X和y是否独立的方法称为尤
(a+0)(c+d)(a+c)(b+a)
独立性检验.
0.0.
a0.100.050.001
010005
2.3.6.7.10.
706841635879828
【统计常用结论】
均数、方差的性质:如果数据如电,……后的平均数为口方差为$2,那么
①一组新数据ii+Ag+b,...xn+b的平均数为了+b,方差是
②一组新数据...的平均数为a元,方差是a2s5
22
③一组新数据a力i+6,ax2+b,...,axn+b的平均数为a无+b,方差是as.
常见的非线性回归模型
(1)指数函数型y=cax(a>0且aWl,c>0)
两边取自然对数,Ing=In(ca"),即Iny=Inc+clna,
人|式=1收
,原方程变为y'=Inc+a/lna,然后按线性回归模型求出Ina,Inc.
V]c'=/Ooooooooo
(2)对数函数型y=b\nx+a
r
y—yOOOOOOOOOOOOOOOOOOO
,原方程变为式=+a,然后按线性回归模型求
{N'=ln/。0000000O
出b,a.
⑶赛函数型y=axn
两边取常用对数,Igg=lg(aa巧,即Igy=nlgx+Iga,
r
qi=]<yQI°OOOOOOOOO
{:,二H。。。。。。。。。。,原方程变为U'=m,'+lga,然后按线性回归模型求出门,lga.
(4)二次函数型y=bx?+a
r
ni--7/000000000000000
{二。。。。。。。。。。。,原方程变为4=五'+*然后按线性回归模型求出b,a.
⑸反比例函数型9=a+立型
X
yl=yGooooooooooooo
令N,=_1_Oooooooooooooo,原方程变为式=+a,然后按线性回归模型求出b,a.
X
名校模拟练
一、单选题
【题6】(2024・河南•三模)已知某学校高三年级甲、乙、丙三个班级人数分别为40,30,50,学校计划采用按比
例分配的分层随机抽样的方法在三个班级中评选优秀学生,已知乙班分配到的优秀学生名单为6人,则
高三年级三个班优秀学生总人数为()
A.16B.30C.24D.18
【答案】。
【分析】利用分层随机抽样及已知,求出三个班级分配到的优秀学生人数即得.
【详解】甲、乙、丙三个班级人数比为4:3:5,由分层随机抽样知,三个班级优秀学生名额分别为8,6,
10,
所以高三年级三个班优秀学生总人数为8+6+10=24人.
故选:C
【遨7】(2024•山东•二模)某校高三共有200人参加体育测试,根据规则,82分以上的考生成绩等级为A,则估
计获得A的考生人数约为()
【答案】。
【分析】首先计算出82分以上的考生的频率,即可得获得A的考生人数.
【详解】由频率分布直方图可得82分以上的考生的频率约为0.025X10X"书+0.005x10=
9(J—o(J
0.25,
所以获得A的考生人数约为200x0.25=50人,
故选:C.
【题8】(2024•浙江绍兴•三模)有一组样本数据:2,3,3,3,4,4,5,5,6,6.则关于该组数据的下列数字特征
中,数值最大的为()
A.第75百分位数B.平均数C.极差D.众数
【答案】4
【分析】分别求出该组数据的第75百分位数、平均数、极差、众数,比较大小,即可得到答案.
【详解】计算第75百分位数:i=10x0.75=7.5,则取第8位数据,
即该组数据的第75百分位数为5;
平均数为2+3+3+3+4+4+5+5+6+6=41;
极差为6—2=4;
众数为3.
综上,第75百分位数最大.
故选:A.
【题9】(2024•山西•三模)某次趣味运动会,设置了教师足球射门比赛:教师射门,学生守门.已知参与射门比
赛的教师有60名,进球数的平均值和方差分别是3和13,其中男教师进球数的平均值和方差分别是4和
8,女教师进球数的平均值为2,则女教师进球数的方差为()
A.15B.16C.17D.18
【答案】B
【分析】设参加射门比赛的男教师人数为上根据总体的平均数求出R,设女教师进球数的方差为s2,
根据方差公式计算可得.
【详解】设参加射门比赛的男教师人数为k,则全部参赛教师进球数的平均数或十(62;乃义2=3,
60
解得k=30,即参赛的男女教师各有30人,
设女教师进球数的方差为s2,
依题意可得13=|^-X[8+(4—3力+察x0+(2—3月,解得s2=16.
bl)o(J
故选:B
(2024•四川凉山,三模)样本数据g,A,的平均数。=4,方差s?=1,则样本数据2g+1,2x2+
1,…,24+1的平均数,方差分别为()
A.9,4B.9,2C.4,1D.2,1
【答案】4
【分析】由平均值、方差的性质求新数据的平均数和方差.
【详解】由x=4,得样本数据2xi+1,2X2+1,…,2xn+1的平均数为2Z+l=2x4+l=9,
由s,=1,得样本数据221+1,212+1,…,2xn+1的方差为4s,=4.
故选:A
(2024•四川成都・三模)“数九”从每年“冬至”当天开始计算,每九天为一个单位,冬至后的第81天,
“数九”结束,天气就变得温暖起来.如图,以温江国家基准气候站为代表记录了2023—2024年从“一
九”到“九九”成都市的“平均气温”和“多年平均气温”(单位:。°C),下列说法正确的是()
数九寒天气温对比
-1平均气温=]多年平均气温单位:℃
106智
9.69.596
一九二九三九四九五九六九七九八九九九
A.“四九”以后成都市“平均气温”一直上升
B.“四九”成都市“平均气温”较“多年平均气温”低0.1”。℃
C.“一九”到“五九”成都市“平均气温”的方差小于“多年平均气温”的方差
D.“一九”到“九九”成都市“平均气温”的极差小于“多年平均气温”的极差
【答案】。
【分析】由图表数据分析可判断A,B;由方差的意义可判断C;由极差的计算公式分析D
【详解】对于4“八九”、“九九”的平均气温比“七九”的“平均气温”低,故A错误;
对于8,“四九”成都市“平均气温”较“多年平均气温”高o.rc",故口错误;
对于C,由图表,“平均气温”的波动比“多年平均气温”的波动大,
贝『'一九”到“五九”成都市“平均气温”的方差大于“多年平均气温”的方差,故C错误;
对于“一九”到“九九”成都市“平均气温”的极差为:10.6-5.4=5.2,
“多年平均气温”的极差为10.7—5.3=5.4,
贝「'一九”到“九九”成都市“平均气温”的极差小于“多年平均气温”的极差,故。正确.
故选:D
(2024・陕西・三模)2024年1月九省联考的数学试卷出现新结构,其中多选题计分标准如下:①本题共
3小题,每小题6分,满分18分;②每道小题的四个选项中有两个或三个正确选项,全部选对得6分,有选
错的得0分;③部分选对得部分分(若某小题正确选项为两个,漏选一个正确选项得3分;若某小题正确
选项为三个,漏选一个正确选项得4分,漏选两个正确选项得2分).已知在某次新结构数学试题的考试
中,小明同学三个多选题中第一小题确定得满分,第二小题随机地选了两个选项,第三小题随机地选了
一个选项,则小明同学多选题所有可能总得分(相同总分只记录一次)的中位数为()
A.9B.10C.11D.12
【答案】。
【分析】先对各题得分情况分别进行统计,再对总得分情况分析排序,根据中位数规定即可求得.
【详解】由题意得小明同学第一题得6分:
第二题选了2个选项,可能得分情况有3种,分别是得。分、4分和6分;
第三题选了1个选项,可能得分情况有3种,分别是得0分、2分和3分;
由于相同总分只记录一次,因此小明的总得分情况有:
6分、8分、9分、10分、12分、13分、14分、15分共8种情况,所以中位数为10^12=11.
故选:C.
(2024•浙江•三模)在对某校高三学生体质健康状况某个项目的调查中,采用样本量比例分配的分层
随机抽样,如果不知道样本数据,只知道抽取了男生80人,女生120人,其方差分别为15,10,由此估计
样本的方差不可能为()
A.11B.13C.15D.17
【答案
【分析】根据题意,设男生体质健康状况的平均数为济女生的平均数为歹,总体的平均数为而,方差
为52,结合方差的公式,分析选项,即可求解.
【详解】设男生体质健康状况的平均数为万,女生的平均数为。总体的平均数为面,方差为s2,
-80-120-23-
则切=布西'+布防"=+耳"
一=石口5+(历一句]+尼[10+(上研]
=年[15+蓑(石一则+五1。+&(元一团[=12+段(历一方>12,
结合选项,可得A项不符合.
故选:4
[题14](2024♦安徽安庆・三模)已知一组数据力1,磔…,6加的平均数为石,另一组数据%,生,…,外的平均数为
y[x^y).若数据如力2,…,%m,yi,y2,…■的平均数为z=ax-\-(1—其中]VQVI,则馆,打的大小
关系为()
A.m〈nB.m>nC.m=nD.馆,九的大小关系不确定
【答案】B
【分析】根据平均数的定义表示元,歹,凡结合已知列等式,作差比较即可.
【详解】由题意可知©+x2-\---}rxm=mx,Ji+g2H---卜现=丽,
xx+x2~\---\~xm+yi+y2~\---\~yn—(m+n)z,^mx+ny—(m+n)z,
z=ax+(1—Q)歹,所以mx+ny=(m+n)z—(m+n)\_ax+(1—a)y],
所以m,=(m+ri)a,n=(7n+72)(l—a),两式相减得7n—?r=(m+n)(2a—1)>0,
所以m>n.
故选
【题15】(2024♦陕西榆林•三模)在一次数学模考中,从甲、乙两个班各自抽出10个人的成绩,甲班的十个人成
绩分别为力1、力2、…、力io,乙班的十个人成绩分别为yi,y2,…,yio・假设这两组数据中位数相同、方差也相
同,则把这20个数据合并后()
A.中位数一定不变,方差可能变大B.中位数可能改变,方差可能变大
C.中位数一定不变,方差可能变小D.中位数可能改变,方差可能变小
【答案】%
【分析】不妨设/14力24N10,加〈改4U10,表达出两组数据的中位数,根据中位数相同得到
力5<仍4%&力6或仍《254力6&%,则合并后的数据中位数是或者竺;”,中位数不变,再
设第一组数据的方差为$2,平均数为心第二组数据的方差为$2,平均数为歹,根据公式得到合并后平
均数为0,方差为s',S,2=S2+—(X—(Z))2+—(7/—0)2>s)得到结论.
【详解】不妨设61412&…&力10,%&沙2&…4%0,
则的、电、…、的。的中位数为气9,%、纺、…神的中位数为"选,
因为3;&=一夏,所以跟WgW%Wg或y5Wx5Wt6W为,
则合并后的数据中位数是苦曳或者竺兽,所以中位数不变.
设第一组数据的方差为52,平均数为%,第二组数据的方差为52,平均数为歹,
合并后总数为20,平均数为在方差为s,2,
s"=而%{1M+d)2]+1。0+(歹一切2]}
=y[s2+(x—<5)2]+1=+(歹-初2]=,2+-i-(x-—)2+一胡>«2.
如果均值相同则方差不变,如果均值不同则方差变大.
故选:A.
二、多选题
(2024•全国•三模)在某次数学测试中,甲、乙两个班的成绩情况如下表:
班级人数平均分方差
甲45881
乙45902
记这两个班的数学成绩的总平均分为现总方差为$2,则()
A.x—88B.x—89C.s?=8.6D.s?=2.5
【答案】BD
【分析】代入公式计算即可.
【详解】依题意得x=45X8,45X9°=89,s2=-^-x([1+(88-89)2])+票x([2+(90-89)2])
yuyuyu
=2.5.
故选:BD.
(2024•广东广州•三模)在某次学科期末检测后,从全部考生中选取100名考生的成绩(百分制,均为
整数)分成[50,60),[60,70),[70,80),[80,90),[90,100)五组后,得到如下图的频率分布直方图,则
A.图中a的值为0.005B.低于70分的考生人数约为40人
C.考生成绩的平均分约为73分D.估计考生成绩第80百分位数为83分
【答案】AC
04
【分析】利用频率分布直方图逐项求解
【详解】对于4由(2a+0.02+0.03+0.04)X10=1,解得a=0.005,故,对;
对于8,低于70分的考生人数约为(0.005+0.04)x10x100=45,故B错;
对于。,考生成绩的平均分约为
005x10x55+0.04x10x65+0.03x10x75+0.02x10x85+0.005x10x95=73,故。对;
对于D,成绩落在[50,80)内频率为(0.005+0.04+0.03)X10=0.75,
落在[50,90)内频率为(0.005+0.04+0.03+0.02)x10=0.95,
故考生成绩第80百分位数落在[80,90),设为m,
由0.75+(馆一80)x0Q2=0.8,解得巾=82.5,
故考生成绩第80百分位数为82.5分,故。错误;
故选:AC
U79](2024•河北・三模)根据中国报告大厅对2023年3月~10月全国太阳能发电量进行监测统计,太阳能
发电量(单位:亿千瓦时)月度数据统计如下表:
月份3456
发电量/亿千瓦242.9230.8240.5259.3
时4793
月份78910
发电量/亿千瓦246.0
258.9269.19244.31
时6
关于2023年3月~10月全国太阳能发电量,下列四种说法正确的是()
A.中位数是259.115B.极差是38.32
C.第85百分位数是259.33D.第25百分位数是240.59
【答案】BC
【分析】根据题意,由中位数,极差,百分位数的定义,代入计算,逐一判断,即可得到结果.
【详解】I争数据从小到大用卜序可得230.87,240.59,242.94,244.31,246.06,258.9,259.33,269.19,共8个
数据,
所以中位数是244.311246.06=245.185,故4错误;
极差是269.19-230.87=38.32,故B正确;
因为8X0.85=6.8,所以第85百分位数是第7个数,即259.33,故C正确;
因为8X0.25=2,所以第25百分位数是240.5”242.94=241765,故D错误;
故选:
(2024•广东汕头•三模)下图是样本甲与样本乙的频率分布直方图,下列说法判断正确的是()
A.样本乙的极差一定大于样本甲的极差B.样本乙的众数一定大于样本甲的众数
C.样本乙的方差一定小于样本甲的方差D.样本甲的中位数一定小于样本乙的中位数
【答案】BCD
【分析】根据数据分布的最小值和最大值判断A;根据众数、方差、中位数的概念,并结合图象判断
BCD.
【详解】对于A,甲的数据介于[1.5,7.5]之间,极差小于或等于6;乙的数据分布于[2.5,8.5],极差小
于或等于6;从而甲和乙的极差可能相等,A错误;
对于根据频率分布直方图可知,甲的众数介于[2.5,5.5)之间,乙的众数介于(5.5,6.5],乙的众数
大于甲的众数正确;
对于。,甲的数据比较分散,乙的数据比较集中,因此乙的方差小于甲的方差,。正确;
对于。,甲的各组频率依次为:0.15,0.20,0.20,0.20,0.15,0.10,其中位数位于[3.5,4⑸之间,
乙的各组频率依次为:0.05,0.10,0.15,0.35,0.20,0.15,其中位数位于[5.5,6.5)之间,
所以甲的中位数小于乙的中位数,。正确.
故选:BCD
(2024•黑龙江•三模)在某市初三年级举行的一次体育考试中(满分100分),所有考生成绩均在[50,
100]内,按照[50,60),[60,70),[70,80),[80,90),[90,100]分成五组,甲、乙两班考生的成绩占比如图所
示,则下列说法错误的是()
[50,60)[60,70)[70,80)[80,90)[90,100]
—甲班成绩占比----乙班成绩占比
A.成绩在[70,80)的考生中,甲班人数多于乙班人数
B.甲班成绩在[80,90)内人数最多
C.乙班成绩在[70,80)内人数最多
D.甲班成绩的极差比乙班成绩的极差小
【答案】ACD
【分析】根据折线统计图逐个分析判断即可.
【详解】对于A,由图知,每一组中的成绩占比都是以各自班级的总人数为基数的,
所以每一组中的甲班、乙班人数不能从所占的百分比来判断,敌人错误;
对于由图可知甲班成绩主要集中在[80,90),乙班成绩主要集中在[60,70),8正确,。错误;
对于。,由图可知甲班成绩的极差和乙班成绩的极差的大小无法确定,故。错误.
故选:ACD
三、解答题
(2024•青海海南・二模)某青少年跳水队共有100人,在强化训练前、后,教练组对他们进行了成绩测
试,分别得到如图1所示的强化训练前的频率分布直方图,如图2所示的强化训练后的频率分布直方图.
⑴根据表中数据,估计强化训练后的平均成绩(同一组中的数据用该组区间的中点值作代表).
⑵我们规定得分80分以上(含80分)的为“优秀”,低于80分的为“非优秀”.
将上面的表格补充完整,并回答能否有99.5%的把握认为跳水运动员是否优秀与强化训练有关.
附:眩—(a+b)(c+d)(a+c)(b+d)'"一Q+6+C+”
P0.00
0.050.0100.001
初5
6.637.87
k03.84110.828
59
【答案】(1)81.4
(2)表格见解析,有.
【分析】(1)根据频率分布直方图的数据,结合平均数公式,即可求解;
⑵根据题中数据完善列寐表,计算卡方,并与临界值对比分析即可求解.
【详解】(1)强化训练后的平均成绩约为55x0.04+65X0.16+75x0.2+85x0.32+95x0.28=
81.4
⑵根据图1可知,强化训练前的优秀人数为100x0.21+100x0.19=40,
此时非优秀人数为100—40=60,
根据图2可知,强化训练后的优秀人数为100x0.32+100x0.28=60,
此时非优秀人数为100-60=40,补充完整的表格为
优秀人数非优秀人数合计
强化训练前4060
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 租赁设备租赁合同电子化管理应用考核试卷
- 架构原则管理办法
- 建筑实验管理办法
- 救护师资管理办法
- 报纸版面管理办法
- 开封户籍管理办法
- 政府非税管理办法
- 开封客运管理办法
- 建设考核管理办法
- 束管监测管理办法
- 《秦皇岛市城市区公共租赁住房申请条件》(秦政办字【2020】6号)
- GB/T 21099.5-2024企业系统中的设备和集成过程控制用功能块(FB)和电子设备描述语言(EDDL)第5部分:EDDL内置库
- 洗碗机消毒性能技术要求和试验方法
- UL2251标准中文版-2017电动汽车的插头插座和耦合器UL中文版标准
- 电气火灾应急处置
- 前列腺增生小讲课护理病历临床病案
- 人教版七年级上册英语全册教案教学设计及教学反思
- 2025届高考语文复习:二元思辨类作文写作指导+课件
- 水泵房设备保养及维护实施方案
- 剧场使用协议
- 园林绿化工(技师)技能鉴定理论考试题库(含答案)
评论
0/150
提交评论