




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
专题10统计
考情概览
命题解读考向考查统计
1.高考对统计的考查,重点是以下考点2022•新高考n卷,19(1)
(1)分层随机抽样频率分布直方图、频数分布表2023•新高考H卷,19(1)
(2)统计图表2024•新高考n卷,4
(3)会用统计图表对总体进行估计,独立性检验2022•新高考I4,20(1)
会求n个数据的第p百分位数.
(4)能用数字特征估计总体集中趋势
和总体离散程度.
(5)了解样本相关系数的统计含义.数据的数字特征2023•新高考I卷,9
(6)理解一元线性回归模型和2x2列
联表,会运用这些方法解决简单的实际
问题.
2024年真题研析
命题分析
2024年高考新高考I卷未考查统计相关内容,II卷中考查了频数分布表中数据的数字特征的求法。统
计的考查应关注:相关性、频率分布直方图、样本的数字特征、独立性检验、回归分析等。这些考验的是
学生读取数据、分析数据、处理数据的能力。预计2025年高考还是主要考查频率分布直方图和数据的数字
特征,可以多留意方差的计算方法!
试题精讲
一、单选题
1.(2024新高考II卷4)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的
亩产量(均在[900,1200)之间,单位:kg)并部分整理下表
亩产量[900,950)[950,1000)[1000,1050)[1100,1150)[1150,1200)
频数612182410
据表中数据,结论中正确的是()
A.100块稻田亩产量的中位数小于1050kg
B.100块稻田中亩产量低于1100kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200kg至300kg之间
D.100块稻田亩产量的平均值介于900kg至1000kg之间
【答案】C
【分析】计算出前三段频数即可判断A;计算出低于1100kg的频数,再计算比例即可判断B;根据极差计
算方法即可判断C;根据平均值计算公式即可判断D.
【详解】对于A,根据频数分布表可知,6+12+18=36<50,
所以亩产量的中位数不小于1050kg,故A错误;
对于B,亩产量不低于1100kg的频数为24+10=34,
所以低于1100kg的稻田占比为愣卢=66%,故B错误;
对于C,稻田亩产量的极差最大为1200-900=300,最小为1150-950=200,故C正确;
对于D,由频数分布表可得,亩产量在口050,1100)的频数为100-(6+12+18+24+10)=30,
所以平均值为+x(6x925+12x975+18xl025+30><1075+24xll25+10xll75)=1067,故D错误.
故选;C.
近年真题精选
一、多选题
1.(2023新高考I卷-9)有一组样本数据占,々,…,天,其中为是最小值,%是最大值,贝1J()
A.%,工3,匕,工5的平均数等于无1,马,…%的平均数
B.无的中位数等于尤1,%,…,工6的中位数
C.%,X3,尤4,工5的标准差不小于占,了2,,、工6的标准差
D.%,%,尤4,%的极差不大于占,尤2,…,彳6的极差
【答案】BD
【分析】根据题意结合平均数、中位数、标准差以及极差的概念逐项分析判断.
【详解】对于选项A:设%,后,%,%的平均数为加,占…的平均数为W,
贝再+X2+%+X4+无5+*6X2+*3+*4+尤52(占+4)〜(彳5+*2+*3+”4)
"—64-12
因为没有确定2(%+%),三+/+&+%的大小关系,所以无法判断犯〃的大小,
例如:1,2,3,4,5,6,可得〃7=九=3.5;
例如1,1,1,1,1,7,可得加=1,〃=2;
例如L2,2,2,2,2,可得机=2,"=丫;故A错误;
6
对于选项B:不妨设王<x2<x3<x4<x5<x6,
可知吃,当,匕,%的中位数等于西,孙…,%的中位数均为玉产,故B正确;
对于选项C:因为看是最小值,犬6是最大值,
则x2,x3,x4,x5的波动性不大于%,马,…%的波动性,即X2,X3,X4,三的标准差不大于网,9,…,%的标准差,
例如:2,4,6,8,10,12,贝II平均数“=:(2+4+6+8+10+12)=7,
标准差S[=^1[(2-7)2+(4-7)2+(6-7)2+(8-7)2+(10-7)2+(12-7)2]=,
4,6,8,10,贝!|平均数m=;(4+6+8+10)=7,
2222
标准差52=J^-[(4-7)+(6-7)+(8-7)+(10-7)]=下,
显然叵>^,即邑>修;故C错误;
3
对于选项D:不妨设国Wx2Vx3V尤44三V%,
则%-尤12尤5-马,当且仅当外=尤2,尤5=%时,等号成立,故D正确;
故选:BD.
二、解答题
1.(2022新高考I卷20)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分
为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患
该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好良好
病例组4060
对照组1090
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
n(ad-bcf
附K?=
(a+Z?)(c+d)(a+c)[b+d)
P&Nk)0.0500.0100.001
k3.8416.63510.828
【答案】(1)答案见解析
【分析】⑴由所给数据结合公式求出K?的值,将其与临界值比较大小,由此确定是否有99%的把握认为
患该疾病群体与未患该疾病群体的卫生习惯有差异;(2)(i)根据定义结合条件概率公式即可完成证明;(ii)
根据(i)结合已知数据求R.
n(ad-be)”200(40x90-60xlQ)2
【详解】(1)由已知K?=
(a+b)(c+d)(a+c)(b+d)50x150x100x100,
又尸(K?26.635)=0.01,24>6,635,
所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
2.(2022新高考II卷J9)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如
下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
【答案】(1)47.9岁;
【分析】(1)根据平均值等于各矩形的面积乘以对应区间的中点值的和即可求出;
【详解】(1)平均年龄元=(5x0.001+15x0.002+25x0.012+35x0.017+45x0.023
+55x0.020+65x0.017+75x0.006+85x0.002)x10=47.9(岁).
3.(2023新高考H卷•19)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显
差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
赖率,组距留率,级距
C—0
^8
M6
4
O.
0.010
利用该指标制定一个检测标准,需要确定临界值C,将该指标大于C的人判定为阳性,小于或等于C的人判
定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为P(c);误诊率是将未患病者判定为阳
性的概率,记为4(。).假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
⑴当漏诊率p(c)=0.5%时,求临界值c和误诊率q(c);
【答案】⑴c=97.5,#)=3.5%;
【分析】(1)根据题意由第一个图可先求出%再根据第二个图求出c297.5的矩形面积即可解出;
【详解】(1)依题可知,左边图形第一个小矩形的面积为5x0.002>0.5%,所以95<。<100,
所以(c-95)x0.002=0.5%,解得:c=97.5,
q(c)=0.01x(100-97.5)+5x0.002=0.035=3.5%.
必备知识速记
一、分层随机抽样
1、分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总
体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为
分层随机抽样,每一个子总体称为层.
2、分层随机抽样的平均数计算
在分层随机抽样中,以层数是2为例,如果第1层和第2层包含的个体数分别为M和N,抽取的样本量分
别为加和〃,第1层和第2层的样本平均数分别为1样本平均数位石,则
—TV/"—TV—m_AT—____
①=------%+-------y=-----%+-----y.我们可以采用样本平均数3估计总体平均数W
M+NM+Nm+nm+n
二、样本的数字特征
1、众数、中位数、平均数
(1)众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平.
(2)中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均
数)叫做这组数据的中位数,中位数反应一组数据的中间水平.
(3)平均数:n个样本数据为乐…,%的平均数为I=吞*[…+I,反应一组数据的平均水平,公式变
n
形:Z%=nx.
1=1
2、标准差和方差
(1)标准差:标准差是样本数据到平均数的一种平均距离,一般用s表示.假设样本数据是%,马,…,二,x
表示这组数据的平均数,则标准差s=p[(X]-x)2+(x,-尤)?+…+(x“-x)2].
Vn
(2)方差:方差就是标准差的平方,即S2=匕(再一易2+(马-■2+3+(%-5).显然,在刻画样本数据
n
的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差.
(3)数据特征
标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数据的离散程度越大;
标准差、方差越小,数据的离散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小.
三、频率分布直方图
1,频率、频数、样本容量的计算方法
喘频后率x组距=频率.
②样频端数攀量=频率,窗频数策=样本容量,样本容量X频率=频数.
③频率分布直方图中各个小方形的面积总和等于1.
2、频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为x,利用x左(右)侧矩形面积之和等
于0.5,即可求出x.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中
点的横坐标之和,即有嚏=占口+%口++xnPn,其中尤“为每个小长方形底边的中点,p“为每个小长方形
的面积.
四、百分位数
1、定义
一组数据的第。百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少
有(100-/9)%的数据大于或等于这个值.
2、计算一组〃个数据的的第0百分位数的步骤
(1)按从小到大排列原始数据.
(2)计算i=p%.
(3)若i不是整数而大于i的比邻整数j,则第2百分位数为第,项数据;若i是整数,则第。百分位数为
第i项与第i+1项数据的平均数.
3、四分位数
我们之前学过的中位数,相当于是第50百分位数.在实际应用中,除了中位数外,常用的分位数还有第25
百分位数,第75百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
五、变量间的相关关系
1、变量之间的相关关系
当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫相关关系.由于相关
关系的不确定性,在寻找变量之间相关关系的过程中,统计发挥着非常重要的作用.我们可以通过收集大
量的数据,在对数据进行统计分析的基础上,发现其中的规律,对它们的关系作出判断.
注意:相关关系与函数关系是不同的,相关关系是一种非确定的关系,函数关系是一种确定的关系,而且
函数关系是一种因果关系,但相关关系不一定是因果关系,也可能是伴随关系.
2、散点图
将样本中的n个数据点(%,%)(力=1,2,…/)描在平面直角坐标系中,所得图形叫做散点图.根据散点图中点
的分布可以直观地判断两个变量之间的关系.
(1)如果散点图中的点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为
正相关,如图(1)所示;
(2)如果散点图中的点散布在从左上角到右下角的区域内,对于两个变量的这种相关关系,我们将它称为
负相关,如图(2)所示.
(1)(2)
3、相关系数
若相应于变量X的取值%,变量y的观测值为则变量X与y的相关系数
_n__/__
x)(y-y)Z'M一"盯
r="----=,,二,通常用r来衡量尤与y之间的线性关系的强弱,r
_I
|n_n_|n9n2
但(%-x)2f(y-y)2住x\-nx但yt-ny
yt=i«=iVi=\Vi=i
的范围为一1</<1・
(1)当r>0时,表示两个变量正相关;当r<0时,表示两个变量负相关.
(2)w越接近1,表示两个变量的线性相关性越强;H越接近o,表示两个变量间几乎不存在线性相关关
系.当|r|=l时,所有数据点都在一条直线上.
(3)通常当讨>0.75时,认为两个变量具有很强的线性相关关系.
六、线性回归
1、线性回归
线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法.
对于一组具有线性相关关系的数据(尤1,力),(X2,>2),(X,”如),其回归方程y=6无的求法
为
〃__M__
£(七一x)(y-y)^x^-nxy
b3--------------=-----------
^x^-nx'
i=li=l
a=y-bx
其中,x=~y\xi,y=—£%,(x,y)称为样本点的中心.
n,=in;=1
2、残差分析
对于预报变量y,通过观测得到的数据称为观测值,,通过回归方程得到的y称为预测值,观测值减去预
测值等于残差,自称为相应于点(%,y)的残差,即有&-=%-少.残差是随机误差的估计结果,通过对残差
的分析可以判断模型刻画数据的效果以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
(1)残差图
通过残差分析,残差点(如自)比较均匀地落在水平的带状区域中,说明选用的模型比较合适,其中这样的带
状区域的宽度越窄,说明模型拟合精确度越高;反之,不合适.
(2)通过残差平方和。=分析,如果残差平方和越小,则说明选用的模型的拟合效果越好;反
i=l
之,不合适.
(3)相关指数
£(y,-犷
用相关指数来刻画回归的效果,其计算公式是:R2=T----.
f(一)2
1=1
心越接近于1,说明残差的平方和越小,也表示回归的效果越好.
七、非线性回归
解答非线性拟合问题,要先根据散点图选择合适的函数类型,设出回归方程,通过换元将陌生的非线性回
归方程化归转化为我们熟悉的线性回归方程.
求出样本数据换元后的值,然后根据线性回归方程的计算方法计算变换后的线性回归方程系数,还原后即
可求出非线性回归方程,再利用回归方程进行预报预测,注意计算要细心,避免计算错误.
1、建立非线性回归模型的基本步骤:
(1)确定研究对象,明确哪个是解释变量,哪个是预报变量;
(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在非线性关系);
(3)由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用反比例函数、二次函
数、指数函数、对数函数、幕函数模型等);
(4)通过换元,将非线性回归方程模型转化为线性回归方程模型;
(5)按照公式计算线性回归方程中的参数(如最小二乘法),得到线性回归方程;
(6)消去新元,得到非线性回归方程;
(7)得出结果后分析残差图是否有异常.若存在异常,则检查数据是否有误,或模型是否合适等.
八、独立性检验
1、分类变量和列联表
(1)分类变量:
变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
(2)列联表:
①定义:列出的两个分类变量的频数表称为列联表.
②2x2列联表.
一般地,假设有两个分类变量X和匕它们的取值分别为{玉,%}和{%,%},其样本频数列联表(称为
2x2列联表)为
%总计
aba+b
Cdc+d
总计a+cb+dn=a+b+c+d
从2x2列表中,依据,—与上的值可直观得出结论:两个变量是否有关系.
a+bc+d
2、等高条形图
(1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图表示列联
表数据的频率特征.
(2)观察等高条形图发现,与相差很大,就判断两个分类变量之间有关系.
a+bc+d
3、独立性检验
计算随机变量/=----------------------利用/的取值推断分类变量x和y是否独立的方法称为z2独
(Q+b)(c+d){a+c)(b+d)
立性检验.
a0.100.050.0100.0050.001
Xa2.7063.8416.6357.87910.828
【统计常用结论】
均数、方差的性质:如果数据%,马,……,当的平均数为捻,方差为『,那么
X
①一组新数据须+。,%2+4..n+人的平均数为%+人,方差是d.
②一组新数据叼,3,...,OXn的平均数为〃X,方差是
③一组新数据叫+b,ax2+b,..,axn+Z?的平均数为+b,方差是"一.
常见的非线性回归模型
(1)指数函数型y=(Q>0且awl,c>0)
两边取自然对数,lny=ln3)即Iny=lnc+xlna,
令原方程变为V=lnc+£lna,然后按线性回归模型求出Ina,Inc.
[x=x
(2)对数函数型y=/?lnx+a
令厂二:,原方程变为y'—,然后按线性回归模型求出b,a.
[x=lnx
(3)幕函数型y=ax"
n
两边取常用对数,lgy=lg(ax),BP1gy=nigx+Igaf
令0,=:gy,原方程变为y'=Mx'+lga,然后按线性回归模型求出",Iga.
[X=Igx
(4)二次函数型y=6/+°
令R,原方程变为y'=6x'+0,然后按线性回归模型求出b,«.
[x=x
h
(5)反比例函数型y=a+±型
x
■y=y
令,1,原方程变为y=Zzx'+a,然后按线性回归模型求出b,a.
x=—
、X
名校模拟探源
一、单选题
1.(2024•河南・三模)已知某学校高三年级甲、乙、丙三个班级人数分别为40,30,50,学校计划采用按
比例分配的分层随机抽样的方法在三个班级中评选优秀学生,已知乙班分配到的优秀学生名单为6人,则
高三年级三个班优秀学生总人数为()
A.16B.30C.24D.18
【答案】C
【分析】利用分层随机抽样及已知,求出三个班级分配到的优秀学生人数即得.
【详解】甲、乙、丙三个班级人数比为4:3:5,由分层随机抽样知,三个班级优秀学生名额分别为8,6,
10,
所以高三年级三个班优秀学生总人数为8+6+10=24人.
故选:C
2.(2024•山东•二模)某校高三共有200人参加体育测试,根据规则,82分以上的考生成绩等级为A,则
估计获得A的考生人数约为()
T频率/组距
0.030-------------1—1
0.025-----------------------
0.015------1-I—
0.010—1—
0.005---------------------------1
----V-I――I_►
°405060708090100分数
A.100B.75C.50D.25
【答案】C
【分析】首先计算出82分以上的考生的频率,即可得获得A的考生人数.
QA_QO
【详解】由频率分布直方图可得82分以上的考生的频率约为0.025><10乂弁令+0.005*10=0.25,
所以获得A的考生人数约为200x0.25=50人,
故选:C.
3.(2024・浙江绍兴.三模)有一组样本数据:2,3,3,3,4,4,5,5,6,6.则关于该组数据的下列数
字特征中,数值最大的为()
A.第75百分位数B.平均数C.极差D.众数
【答案】A
【分析】分别求出该组数据的第75百分位数、平均数、极差、众数,比较大小,即可得到答案.
【详解】计算第75百分位数:,=10*0.75=7.5,则取第8位数据,
即该组数据的第75百分位数为5;
平均数为2+3+3+3+4+4+S+5+6+6=4
极差为6-2=4;
众数为3.
综上,第75百分位数最大.
故选:A.
4.(2024.山西.三模)某次趣味运动会,设置了教师足球射门比赛:教师射门,学生守门.已知参与射门比赛
的教师有60名,进球数的平均值和方差分别是3和13,其中男教师进球数的平均值和方差分别是4和8,
女教师进球数的平均值为2,则女教师进球数的方差为()
A.15B.16C.17D.18
【答案】B
【分析】设参加射门比赛的男教师人数为上,根据总体的平均数求出左,设女教师进球数的方差为52,根
据方差公式计算可得.
【详解】设参加射门比赛的男教师人数为上,则全部参赛教师进球数的平均数二+(6。-*2=3,
60
解得左=30,即参赛的男女教师各有30人,
设女教师进球数的方差为S2,
依题意可得13dx[8+(4-3)2]+善卜+(2—3)[,解得$2=16.
故选:B
5.(2024・四川凉山•三模)样本数据内,尤2,,毛的平均数元=4,方差$2=1,则样本数据2占+1,2X2+1,L,
2%+1的平均数,方差分别为()
A.9,4B.9,2C.4,1D.2,1
【答案】A
【分析】由平均值、方差的性质求新数据的平均数和方差.
【详解】由元=4,得样本数据2为+1,22尤+1,L,2%+1的平均数为戒+1=2*4+1=9,
由S2=1,得样本数据2占+1,2%+1,L,2%+1的方差为4s2=4
故选:A
6.(2024.四川成都.三模)“数九”从每年“冬至”当天开始计算,每九天为一个单位,冬至后的第81天,“数
九”结束,天气就变得温暖起来.如图,以温江国家基准气候站为代表记录了2023—2024年从“一九”
到“九九”成都市的“平均气温”和“多年平均气温”(单位:C),下列说法正确的是()
数九寒天气温对比
■■平均气温=1多年平均气温单位:℃
一九二九三九四九五九六九七九八九九九
A.“四九”以后成都市“平均气温”一直上升
B.“四九”成都市“平均气温”较“多年平均气温”低0.1"C
C.“一九”到“五九”成都市“平均气温”的方差小于“多年平均气温”的方差
D.“一九”到“九九”成都市“平均气温”的极差小于“多年平均气温”的极差
【答案】D
【分析】由图表数据分析可判断A,B;由方差的意义可判断C;由极差的计算公式分析D.
【详解】对于A,“八九”、“九九”的平均气温比“七九”的“平均气温”低,故A错误;
对于B,“四九”成都市“平均气温”较“多年平均气温”高故B错误;
对于C,由图表,“平均气温”的波动比“多年平均气温”的波动大,
则“一九”到“五九”成都市“平均气温”的方差大于“多年平均气温”的方差,故C错误;
对于D,“一九”到“九九”成都市“平均气温”的极差为:10.6-5.4=5.2,
“多年平均气温”的极差为10.7-5.3=5.4,
贝!1“一九”到“九九”成都市“平均气温”的极差小于“多年平均气温”的极差,故D正确.
故选:D.
7.(2024・陕西・三模)2024年1月九省联考的数学试卷出现新结构,其中多选题计分标准如下:①本题共
3小题,每小题6分,满分18分;②每道小题的四个选项中有两个或三个正确选项,全部选对得6分,有
选错的得。分;③部分选对得部分分(若某小题正确选项为两个,漏选一个正确选项得3分;若某小题正
确选项为三个,漏选一个正确选项得4分,漏选两个正确选项得2分).已知在某次新结构数学试题的考
试中,小明同学三个多选题中第一小题确定得满分,第二小题随机地选了两个选项,第三小题随机地选了
一个选项,则小明同学多选题所有可能总得分(相同总分只记录一次)的中位数为()
A.9B.10C.11D.12
【答案】C
【分析】先对各题得分情况分别进行统计,再对总得分情况分析排序,根据中位数规定即可求得.
【详解】由题意得小明同学第一题得6分:
第二题选了2个选项,可能得分情况有3种,分别是得0分、4分和6分;
第三题选了1个选项,可能得分情况有3种,分别是得0分、2分和3分;
由于相同总分只记录一次,因此小明的总得分情况有:
6分、8分、9分、10分、12分、13分、14分、15分共8种情况,所以中位数为弓-:口.
故选:C.
8.(2024•浙江・三模)在对某校高三学生体质健康状况某个项目的调查中,采用样本量比例分配的分层随
机抽样,如果不知道样本数据,只知道抽取了男生80人,女生120人,其方差分别为15,10,由此估计样
本的方差不可熊为()
A.11B.13C.15D.17
【答案】A
【分析】根据题意,设男生体质健康状况的平均数为"女生的平均数为7,总体的平均数为高,方差为d,
结合方差的公式,分析选项,即可求解.
【详解】设男生体质健康状况的平均数为"女生的平均数为亍,总体的平均数为京,方差为S2,
80120—2—3—
则w=-----------XH-------------工二兀十二)7,
80+12080+120
80120
s1[15+(x—iv)2]+[10+(y-w)2]
80+12080+120
2g__34——A_-
=-[15+--(x-y)2]+-[10+--(X-^)2]=12+—(X-)7)2>12,
结合选项,可得A项不符合.
故选:A.
9.(2024・安徽安庆・三模)已知一组数据占出2,,/的平均数为1,另一组数据,笫的平均数为
了伍彳了).若数据X],%,,xm,yt,y2,,笫的平均数为2=位+(1—,其中g<a<l,则以〃的大小关系
为()
A.m<nB.m>nC.m=nD.%,〃的大小关系不确定
【答案】B
【分析】根据平均数的定义表示结合已知列等式,作差比较即可.
【详解】由题意可知芯+々+L+4=w彳,+y2+L+yn=ny,
xx+x2++%机+%+%++%=(机+几)三,于是欣+砂=(根+〃)区,
又彳=友+(1-〃万,所以西+方=(m+〃”=(帆+〃)[就+(1-4)7],
所以a=("?+〃)a,"=(m+”)(1-a),两式相减得=
所以机>w.
故选:B
10.(2024・陕西榆林•三模)在一次数学模考中,从甲、乙两个班各自抽出10个人的成绩,甲班的十个人成
绩分别为占*2、、/,乙班的十个人成绩分别为%%,,%).假设这两组数据中位数相同、方差也相同,则把
这20个数据合并后()
A.中位数一定不变,方差可能变大
B.中位数可能改变,方差可能变大
C.中位数一定不变,方差可能变小
D.中位数可能改变,方差可能变小
【答案】A
【分析】不妨设玉4%V2V〈X。,表达出两组数据的中位数,根据中位数相同得到
三4为<为</或%则合并后的数据中位数是上爱或者^中位数不变,再设第一
组数据的方差为平均数为元,第二组数据的方差为d,平均数为歹,根据公式得到合并后平均数为了,
方差为s'2,s/2=?+1(x-®)2+|(y-®)2>52,得到结论.
【详解】不妨设为《马<4,%,
则玉、々、…、%的中位数为区产,力为、加的中位数为甘1,
因为豆产=%;%,所以当<%vy6V%或为vx5V尤6v乂,
则合并后的数据中位数是石产或者为产,所以中位数不变.
设第一组数据的方差为S?,平均数为无,第二组数据的方差为S2,平均数为少,
合并后总数为20,平均数为了,方差为s'2,
s'2=^1^{iop+(x-«)2]+iop+(y-«)2]}
=1p+(x-«)2]+|[52+(y-«)2]=52+1(x-®)2+|(y-®)2>52.
如果均值相同则方差不变,如果均值不同则方差变大.
故选:A.
二、多选题
11.(2024.全国•三模)在某次数学测试中,甲、乙两个班的成绩情况如下表:
班级人数平均分方差
甲45881
乙45902
记这两个班的数学成绩的总平均分为总总方差为则()
A.x=88B.嚏=89C.s1=8.6D.6=2.5
【答案】BD
【分析】代入公式计算即可.
【详解】依题意得4=g*88艰5x90=gg,2=|jx([1+(88-89)2])+|jx([2+(90-89)2])=2.5.
5
故选:BD.
12.(2024・广东广州•三模)在某次学科期末检测后,从全部考生中选取100名考生的成绩(百分制,均为
整数)分成[50,60),[60,70),[70,80),[80,90),[90,100)五组后,得到如下图的频率分布直方图,则()
,频率/组距
0.04------------
0.03------------------
0.02-----------------------
a-------------------------1
————1——>
o5060708090100成绩(分)
A.图中。的值为0.005B.低于70分的考生人数约为40人
C.考生成绩的平均分约为73分D.估计考生成绩第80百分位数为83分
【答案】AC
【分析】利用频率分布直方图逐项求解
【详解】对于A,由(勿+0.02+0.03+0.04)+10=+解得。=0.005,故A对;
对于B,低于70分的考生人数约为(0.005+0.04)x10x100=45,故B错;
对于C,考生成绩的平均分约为
0.005x10x55+0.04x10x65+0.03x10x75+0.02x10x85+0.005x10x95=73,故C对;
对于D,成绩落在[50,80)内频率为(0.005+0.04+0.03)x10=0.75,
落在[50,90)内频率为(0.005+0.04+0.03+0.02)x10=0.95,
故考生成绩第80百分位数落在[80,90),设为m,
由0.75+(“1—80)x0.02=0.8,解得m-82.5,
故考生成绩第80百分位数为82.5分,故D错误;
故选:AC
13.(2024.河北•三模)根据中国报告大厅对2023年3月~10月全国太阳能发电量进行监测统计,太阳能发
电量(单位:亿千瓦时)月度数据统计如下表:
月份3456
发电量/亿千瓦时242.94230.87240.59259.33
月份78910
发电量/亿千瓦时258.9269.19246.06244.31
关于2023年3月~10月全国太阳能发电量,下列四种说法正确的是()
A.中位数是259.115B.极差是38.32
C.第85百分位数是259.33D.第25百分位数是240.59
【答案】BC
【分析】根据题意,由中位数,极差,百分位数的定义,代入计算,逐一判断,即可得到结果.
【详解】将数据从小至U大排序可得230.87,240.59,242.94,244.31,246.06,258.9,259.33,269.19,共8个数据,
所以中位数是-------------=245.185,故A错误;
极差是269.19-230.87=38.32,故B正确;
因为8x0.85=6.8,所以第85百分位数是第7个数,即259.33,故C正确;
因为8x0.25=2,所以第25百分位数是包240丁59+丝242丝94=241.765,故D错误;
故选:BC
14.(2024・广东汕头•三模)下图是样本甲与样本乙的频率分布直方图,下列说法判断正确的是()
A.样本乙的极差一定大于样本甲的极差
B.样本乙的众数一定大于样本甲的众数
C.样本乙的方差一定小于样本甲的方差
D.样本甲的中位数一定小于样本乙的中位数
【答案】BCD
【分析】根据数据分布的最小值和最大值判断A;根据众数、方差、中位数的概念,并结合图象判断BCD.
【详解】对于A,甲的数据介于[1.5,7.5]之间,极差小于或等于6;乙的数据分布于[2.5,8.5],极差小于或等
于6;从而甲和乙的极差可能相等,A错误;
对于B,根据频率分布直方图可知,甲的众数介于[2.5,5.5)之间,乙的众数介于(5.5,6.5],乙的众数大于甲的
众数,B正确;
对于C,甲的数据比较分散,乙的数据比较集中,因此乙的方差小于甲的方差,C正确;
对于D,甲的各组频率依次为:0.15,0.20,0.20,0.20,0.15,0.10,其中位数位于[3.5,4.5)之间,
乙的各组频率依次为:0.05,0.10,0.15,0.35,0.20,0.15,其中位数位于[5.5,6.5)之间,
所以甲的中位数小于乙的中位数,D正确.
故选:BCD
15.(2024.黑龙江•三模)在某市初三年级举行的一次体育考试中(满分100分),所有考生成绩均在[50,100]
内,按照[50,60),[60,70),[70,80),[80,90),[90,100]分成五组,甲、乙两班考生的成绩占比如图所示,则
下列说法错误的是()
60.00%--------------------------------------------------
50.00%------------------------------r-----------------
40.00%-----------------、、、、---------
30.00%--------/---------/V--------\----------
20.00%——/-------/-------V--------
10.00%—//-----------\——
0.00%-------------------------------------——
[50,60)[60,70)[70,80)[80,90)[90,100]
—甲班成绩占比乙班成绩占比
A,成绩在[70,80)的考生中,甲班人数多于乙班人数
B.甲班成绩在[80,90)内人数最多
C.乙班成绩在[70,80)内人数最多
D.甲班成绩的极差比乙班成绩的极差小
【答案】ACD
【分析】根据折线统计图逐个分析判断即可.
【详解】对于A,由图知,每一组中的成绩占比都是以各自班级的总人数为基数的,
所以每一组中的甲班、乙班人数不能从所占的百分比来判断,故A错误;
对于BC,由图可知甲班成绩主要集中在[80,90),乙班成绩主要集中在[60,70),B正确,C错误;
对于D,由图可知甲班成绩的极差和乙班成绩的极差的大小无法确定,故D错误.
故选:ACD
三、解答题
16.(2024•青海海南•二模)某青少年跳水队共有100人,在强化训练前、后,教练组对他们进行了成绩测
试,分别得到如图1所示的强化训练前的频率分布直方图,如图2所示的强化训练后的频率分布直方图.
频率频率
组距组巨
。o32
O28
2
1
0
2
2
O
.O
S
1
9
6
O1
.O
.........r—
0.006
1-
4—
0.00
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 年度活动策划提升品牌影响力计划
- 传媒探索社团传媒行业实习计划
- 班级慈善义卖活动的策划计划
- 二年级下册数学教案-5.6算得对吗-北师大版
- 信息技术在仓库管理中的应用计划
- 学校开放日活动实施方案计划
- 幼儿园小班家长会内容安排计划
- 装修公司6S管理品管圈
- 如何制定适应市场变化的工作计划
- 第六单元路程、时间、速度(教案)四年级上册数学青岛版
- DB43T 2428-2022 水利工程管理与保护范围划定技术规范
- SB/T 11016-2013足部保健按摩服务规范
- GB/T 4062-2013三氧化二锑
- 神经系统的结构与神经调节的基本方式 【知识精讲+高效备课】 高考生物一轮复习 (新教材)
- GB/T 15328-2019普通V带疲劳试验方法无扭矩法
- 人生路遥名著导读读书分享PPT模板
- 马克思主义基本原理(完整版)
- 涉密人员脱密期管理制度
- 《GNSS原理及应用》课件
- 企业风险管理-战略与绩效整合(中文版)
- 三阶段DEA模型理论与操作步骤详解
评论
0/150
提交评论