2025年高考数学一轮复习讲义:用样本估计总体(解析版)_第1页
2025年高考数学一轮复习讲义:用样本估计总体(解析版)_第2页
2025年高考数学一轮复习讲义:用样本估计总体(解析版)_第3页
2025年高考数学一轮复习讲义:用样本估计总体(解析版)_第4页
2025年高考数学一轮复习讲义:用样本估计总体(解析版)_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题56用样本估计总体(新高考专用)

目录

【知识梳理】................................................................2

【真题自测】................................................................3

【考点突破】................................................................8

【考点1】百分位数的估计....................................................8

【考点2】总体集中趋势的估计................................................12

【考点3]总体离散程度的估计................................................17

【分层检测】...............................................................21

【基础篇】.................................................................21

【能力篇】.................................................................30

考试要求:

1.会用统计图表对总体进行估计,会求〃个数据的第p百分位数.

2.会用数字特征估计总体集中趋势和总体离散程度.

・知识梳理

L总体百分位数的估计

(1)第P百分位数的定义

一般地,一组数据的第2百分位数是这样一个值,它使得这组数据中至少有睡的数据小于或

等于这个值,且至少有(100—p)%的数据大于或等于这个值.

(2)计算一组n个数据的第p百分位数的步骤

第1步,按从小到大排列原始数据.

第2步,计算,=.Xp%.

第3步,若,不是整数,而大于,的比邻整数为/,则第p百分位数为第2项数据;若,・是整数,

则第p百分位数为第i项与第(计1)项数据的平均数.

2.样本的数字特征

(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.

(2)中位数:把〃个数据按大小顺序排列,处于最空间位置的一个数据(或最中间两个数据的平

均数)叫做这组数据的中位数.

⑶平均数:把'…+劭称为0,。2,…,诙这〃个数的平均数.

(4)标准差与方差:设一组数据XI,X2,X3,…,X”的平均数为"则这组数据的标准差和方差

分别是s=

[%(XI—X)2+(X2—X)2H------H(X"一关)2],

1一一-

2-2

s=~[(X1-x)2+(X2-x)2H----1-(xnX)].

|常用结论

1.频率分布直方图与众数、中位数、平均数的关系

⑴最高的小长方形底边中点的横坐标即是众数.

(2)中位数左边和右边的小长方形的面积和是相等的.

⑶平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小

长方形底边中点的横坐标之和.

2.平均数、方差的公式推广

(1)若数据xi,xi,…,我的平均数为x,那么"ixi+a,mx2-\-a,mx3~\-a,…,如:的平均数

2

是mx-\-a.

(2)若数据%1,X2,,,,,小的方差为心,那么

①数据%I+Q,xi+a,…,而+。的方差也为V;

②数据0X1,aX2,…,〃元〃的方差为。2s2.

「,真题自测

一、单选题

1.(2024•全国•高考真题)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的

亩产量(单位:kg)并整理如下表

亩产量[900,950)[950,1000)[1000,1050)[1050,1100)[1100,1150)[1150,1200)

频数61218302410

根据表中数据,下列结论中正确的是()

A.100块稻田亩产量的中位数小于1050kg

B.100块稻田中亩产量低于1100kg的稻田所占比例超过80%

C.100块稻田亩产量的极差介于200kg至300kg之间

D.100块稻田亩产量的平均值介于900kg至1000kg之间

2.(2022.全国•高考真题)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽

取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和

讲座后问卷答题的正确率如下图:

100%

95%....................................................................■0

90%-------♦-------------------------------------------米----------------------

树85%

每80%*讲座前

田75%-----------------------------------------------------------------------------------*-----------------------------------------------------•讲座后

70%..............................*'

65%------*....................

60%t-.............*..........................................................

0--------------1-------------1-------------1-------------1-------------1-------------1-------------1-------------1-------------1-------------1—

U12345678910

居民编号

则()

A.讲座前问卷答题的正确率的中位数小于70%

3

B.讲座后问卷答题的正确率的平均数大于85%

C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差

D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差

二、多选题

3.(2023•全国•高考真题)有一组样本数据玉,程…,%,其中七是最小值,%是最大值,贝U()

A.々,七,4内的平均数等于和尤2,1*6的平均数

B.尤2,尤3,*4,尤5的中位数等于尤1,尤2「“,%的中位数

C.%2,%3,为4,%的标准差不小于为,工2,”,,工6的标准差

D.%,无3,尤4,尤5的极差不大于石,无2,…,毛的极差

三、解答题

4.(2024・上海•高考真题)水果分为一级果和二级果,共136箱,其中一级果102箱,二级果34箱.

(1)随机挑选两箱水果,求恰好一级果和二级果各一箱的概率;

(2)进行分层抽样,共抽8箱水果,求一级果和二级果各几箱;

(3)抽取若干箱水果,其中一级果共120个,单果质量平均数为303.45克,方差为603.46;二级果48个,单

果质量平均数为240.41克,方差为648.21;求168个水果的方差和平均数,并预估果园中单果的质量.

5.(2022•全国•高考真题)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下

(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);

(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;

(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%.从该

地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率.(以样本数据中患者的年龄位

于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).

参考答案:

4

题号123

答案CBBD

1.c

【分析】计算出前三段频数即可判断A;计算出低于1100kg的频数,再计算比例即可判断B;根据极差计

算方法即可判断C;根据平均值计算公式即可判断D.

【详解】对于A,根据频数分布表可知,6+12+18=36<50,

所以亩产量的中位数不小于1050kg,故A错误;

对于B,亩产量不低于1100kg的频数为24+10=34,

所以低于1100kg的稻田占比为“10/0上-34=66%,故B错误;

对于C,稻田亩产量的极差最大为1200-900=300,最小为1150—950=200,故C正确;

对于D,由频数分布表可得,平均值为

^x(6x925+12x975+18xl025+30xl075+24xll25+10xll75)=1067,故D错误.

故选;C.

2.B

【分析】由图表信息,结合中位数、平均数、标准差、极差的概念,逐项判断即可得解.

【详解】讲座前中位数为70%;75%>70%,所以人错;

讲座后问卷答题的正确率只有一个是80%,4个85%,剩下全部大于等于90%,所以讲座后问卷答题的正确率

的平均数大于85%,所以B对;

讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所

以C错;

讲座后问卷答题的正确率的极差为100%-80%=20%,

讲座前问卷答题的正确率的极差为95%-60%=35%>20%,所以D错.

故选:B.

3.BD

【分析】根据题意结合平均数、中位数、标准差以及极差的概念逐项分析判断.

【详解】对于选项A:设9,%,4%的平均数为机,占,々,…,%的平均数为力,

IJll]n-m—无1+—+」+*4+工5+*6_%+,+*4+工5_2(一+4)-(++々+++%)

“64-12

因为没有确定2(%+%),毛+W+毛+%的大小关系,所以无法判断相,”的大小,

5

例如:1,2,3,4,5,6,可得加=〃=3.5;

例如1,1,1,1,1,7,可得加=1,〃=2;

例如1,2,2,2,2,2,可得〃2=2,"=二;故A错误;

6

对于选项B:不妨设占《马W%《匕

可知无2,鼻,看,毛的中位数等于占,z,…的中位数均为°,故B正确;

对于选项C:因为A是最小值,尤6是最大值,

则马,无3,尤4,无5的波动性不大于外,马,…,升的波动性,即X2,X3,%4,X5的标准差不大于玉,马,…的标准差,

例如:2,4,6,8,10,12,则平均数“=:(2+4+6+8+10+12)=7,

标准差心=J1[(2-7)2+(4-7)2+(6-7)2+(8-7)2+(10-7)2+(12-7)2]=,

4,6,8,10,则平均数%=;(4+6+8+10)=7,

标准差$2=£[(4-7)气(6一7了+(8一7『+(10一7月=有,

显然叵>&,即。>$2;故C错误;

3

对于选项D:不妨设玉<x2<x3<x4<x5<x6,

则%-xg%—%,当且仅当占=%,%=%时,等号成立,故D正确;

故选:BD.

(2)一级果抽取6箱,二级果抽取2箱

(3)方差1427.27克2,平均数285.44克,预估平均质量为287.69克

【分析】(1)利用组合知识和超几何分布求概率公式求出答案;

(2)利用分层抽样的定义进行求解;

(3)根据公式计算出总体样本平均质量和方差,并预估平均质量.

【详解】(1)设A事件为恰好选到一级果和二级果各一箱,

样本空间的样本点的个数〃=C*=若史=9180,

A事件的样本点的公式机=。〃。1=3468,

所以尸(A)='346817

n9180-45

6

(2)因为一级果箱数:二级果箱数=102:34=3:1,

31

所以8箱水果中有一级果抽取8乂不二二6箱,二级果抽取8x丁=2箱;

3+13+1

(3)设一级果平均质量为"方差为S〉二级果质量为亍,方差为对,

总体样本平均质量为白方差为S2,

因为T=303.45,了=240.41,S;=603.46,区=648.21,

12048

所以2=—=—X303.45+------X240.41=285.44克,

120+48120+48

22

S=x[603.46+(303.45-285.44)。+x[648.21+(240.41-285.44),=1427.27克.

预估平均质量为鳖工+盘•产287.69克.

13613o

5.(1)47.9岁;

⑵0.89;

(3)0.0014.

【分析】(1)根据平均值等于各矩形的面积乘以对应区间的中点值的和即可求出;

(2)设A={一人患这种疾病的年龄在区间[20,70)},根据对立事件的概率公式尸(A)=1-P(N)即可解出;

(3)根据条件概率公式即可求出.

【详解】(1)平均年龄元=(5x0.001+15x0.002+25x0.012+35x0.017+45x0.023

+55x0.020+65x0.017+75x0.006+85x0.002)x10=47.9(岁).

(2)设A={一人患这种疾病的年龄在区间[20,70)},所以

P(A)=1-P(A)=1-(0.001+0.002+0.006+0.002)x10=1-0.11=0.89.

(3)设8="任选一人年龄位于区间[40,50户,C="从该地区中任选一人患这种疾病”,

则由已知得:

P(B)=16%=0.16,P(C)=0.1%=0.001,P(B\C)=0.023x10=0.23,

则由条件概率公式可得

从该地区中任选一人,若此人的年龄位于区间[40,50),此人患这种疾病的概率为

P(BC)P(C)P(2|C_。。。1义。23

P(C\B)==0.0014375»0.0014.

P(B)P(B)-—0J6

考点突破

【考点1]百分位数的估计

7

一、单选题

1.(2025•黑龙江大庆•一模)法国当地时间2024年7月26日晚,第三十三届夏季奥林匹克运动会在巴黎举

行开幕式."奥林匹克之父”顾拜旦曾经说过,奥运会最重要的不是胜利,而是参与;对人生而言,重要的不

是凯旋,而是拼搏.为弘扬奥运精神,某学校组织高一年级学生进行奥运专题的答题活动.为了调查男生和女

生对奥运会的关注程度,在高一年级随机抽取10名男生和10名女生的竞赛成绩(满分100分),按从低到

高的顺序排列,得到下表中的样本数据:

男生82858687889090929496

女生82848587878788889092

则下列说法错误的是()

A.男生样本数据的25%分位数是86

B.男生样本数据的中位数小于男生样本数据的众数

C.女生样本数据中去掉一个最高分和一个最低分后所得数据的平均数不变

D.女生样本数据中去掉一个最高分和一个最低分后所得数据的方差不变

2.(2024•河南郑州•模拟预测)已知某学校参加学科节数学竞赛决赛的8人的成绩(单位:分)为:72,78,

80,81,83,86,88,90,则这组数据的第75百分位数是()

A.86B.87C.88D.90

二、多选题

3.(2023•江苏连云港•模拟预测)某学校共有2000名男生,为了解这部分学生的身体发育情况,学校抽查

了100名男生体重情况.根据所得数据绘制样本的频率分布直方图如图所示,则()

A.样本的众数为67.5B.样本的80%分位数为72.5

C.样本的平均值为66D.该校男生中体重低于60依的学生大约为150人

4.(2024•广东佛山•模拟预测)某企业是一所大学的社会实践基地,实践结束后学校对学生进行考核评分,

其得分的频率分布直方图如图所示,该学校规定,把成绩位于后25%的学生划定为不及格,把成绩位于前

25%的学生划定为优秀,则下列结论正确的是()

8

A.本次测试及格分数线的估计值为60分B.本次测试优秀分数线的估计值为75分

C.本次测试分数中位数的估计值为70分D.本次测试分数的平均数小于中位数

三、填空题

5.(2024•上海•模拟预测)某同学高三以来成绩依次为"0,93,92,93,88,86,则这组数据的第40百分

位数为.

6.(2024•云南曲靖•二模)抽样统计得到某班8名女生的身高分别为160,155,157,155.5,154,158,155,162,则

这8名女生身高的第75百分位数是.

参考答案:

题号1234

答案DBABCD

1.D

【分析】根据百分位数、中位数、众数、平均数、方差的定义一一判断即可.

【详解】对于A:10x25%=2.5,所以男生样本数据的25%分位数是86,故A正确;

对于B:男生样本数据的中位数为咬尸=89,男生样本数据的众数为90,故B正确;

2

对于C:女生样本数据的平均数为《(82+84+85+87x3+88x2+90+92)=87,

女生样本数据中去掉一个最高分和一个最低分后所得数据的平均数为1(84+85+87x3+88x2+90)=87,故

O

C正确;

对于D:女生样本数据中去掉一个最高分和一个最低分后所得数据的平均数不变,

但是极差变小,所以方差变小,故D错误.

故选:D

2.B

【分析】根据样本数据百分位数的定义求解即可.

【详解】将数据从小到大排序得72,78,80,81,83,86,88,90,

因为8x75%=6,

所以第75百分位数是^^=87.

故选:B.

9

3.AB

【分析】由频率分布直方图的众数、百分位数、平均数以及频数的计算公式对选项一一判断即可得出答案.

【详解】对于A:样本的众数为67.5,故A正确;

对于B:设样本的80%分位数为。,

因为0.03x5+0.05x5+0.06x5=0.7<0.8,

贝iJ0.03x5+0.05x5+0.06x5+(a-70)x0.04=0.8,解得:a=12.5,故B正确;

对于C:设样本的平均值为元,

则元=(57.5x0.03+62.5x0.05+67.5x0.06+72.5x0.04+77.5x0.02)x5=66.75,故C不正确;

对于D:该校男生中低于60仅的学生所占的频率为:0.03x5=0.15,

该校男生中低于60像的学生大约为0.15x2000=300人,故D不正确.

故选:AB.

4.CD

【分析】根据百分位数的定义可判断AB,根据中位数的定义可判断C,根据频率分布直方图左拖尾可判断

D.

【详解】A.由频率分布直方图可知,分数小于60分的概率为1-(0.2+0.3+0.2)=0.3,分数小于50分的概率

为1-(0.1+0.2+0.3+0.2)=0.2,

所以分数的25%分位数在区间[50,60)内,故A错误;

B.由频率分布直方图可知,分数大于80分的概率为0.2,分数大于70分的概率为0.5,

所以优秀分数线的估计值在区间[70,80)内,设其为机,

则(80-m)x0.03+0.2=0.25,

解得"个78.3,故B错误;

C.因为分数大于70分的概率为0.5,所以本次测试分数中位数的估计值为70分,故C正确;

D.因为频率分布直方图左拖尾,所以平均数小于中位数,故D正确.

故选:CD.

5.92

【分析】将数据从小到大排列,根据百分数的定义进行求解.

【详解】将数据从小到大排列,86,88,92,93,93,110,

6x40%=2.4,故从小到大,选择第3个数作为这组数据的第40百分位数,即92.

故答案为:92

6.159

10

【分析】利用百分位数的估计公式计算可得.

【详解】将数据由小到大排列为:154,155,155,155.5,157,158,160,162,

由8x75%=6,得第75百分位数是158丁60=159.

2

故答案为:159

反思提升:

计算一组数据的第p百分位数的步骤

三按从小到大排列原始数据]

计算口兀xp%]

若,不是整数,而大于泊勺比邻

r整数为7,则第p百分位数为第

-----------------------------

若,•是整数,则第P百分位数为第

i项与第(i+D项数据的平均数

【考点2]总体集中趋势的估计

一、单选题

1.(2024•广东惠州•模拟预测)为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知

识测试,得分如图所示,假设得分值的中位数为“,众数为6,平均值为J则()

频数

一一

010

8-

66

4

存3---3-2r

2E什-2"

L!仃

-n-A

O3456789O分

A.c<b<aB.b<c<a

C.a<b<cD.b<a<c

2.(2024•四川绵阳•模拟预测)某教育机构为调查中小学生每日完成作业的时间,收集了某位学生100天每

天完成作业的时间,并绘制了如图所示的频率分布直方图(每个区间均为左闭右开),根据此直方图得出了

下列结论,其中正确的是()

A.估计该学生每日完成作业的时间在2小时至2.5小时的有50天

11

B.估计该学生每日完成作业时间超过3小时的概率为0.3

C.估计该学生每日完成作业时间的中位数为2.625小时

D.估计该学生每日完成作业时间的众数为2.3小时

二、多选题

3.(2025・广东•一模)现有十个点的坐标为(加0),(程。),、国,0),它们分别与(%,10),(网」。),…,(%,1。)

关于点(3,5)对称.已知玉,9,•,税的平均数为。,中位数为b,方差为c,极差为d,贝|为%,,,为)这组

数满足()

A.平均数为6-aB.中位数为6-b

C.方差为cD.极差为d

4.(23-24高一下•全国•期末)如图所示,下列频率分布直方图显示了三种不同的分布形态.图(1)形成对称

形态,图(2)形成"右拖尾"形态,图(3)形成"左拖尾"形态,根据所给图作出以下判断,正确的是()

A.图(1)的平均数=中位数=众数

B.图(2)的平均数(众数(中位数

C.图(2)的众数〈中位数(平均数

D.图(3)的平均数〈中位数〈众数

三、填空题

5.(2022•北京,模拟预测)某班在一次考试后分析学生在语文、数学、英语三个学科的表现,绘制了各科年级

排名的散点图(如下图所示).

语文和英语年级排名散点图语文和数学年级排名散点图

300300

250250

r0oZ20o

趴5o15o

1

10O0O

51)5()

°0°0

5010015020025030035050100150200250300350

语文排名语文排名

关于该班级学生这三个学科本次考试的情况,给出下列四个结论:

12

①三科中,数学年级排名的平均数及方差均最小;

②语文、数学、英语年级排名均在150名以外的学生为1人;

③本次考试该班语文第一名、数学第一名、英语第一名可能为三名不同的同学;

④从该班学生中随机抽取1人,若其语文排名大于200,则其英语和数学排名均在150以内的概率为;.

其中所有正确结论的序号是.

6.(2014高三•全国•专题练习)为了解本书居民的生活成本,甲、乙、丙三名同学利用假期分别对三个社区

进行了“家庭每月日常消费额”的调查.他们将调查所得的数据分别绘制成频率分布直方图(如图所示),记甲、

乙、丙所调查数据的标准差分别为玛,$2,S3,则它们的大小关系为.(用连接)

参考答案:

题号1234

答案DCABCDACD

1.D

【分析】根据题意求中位数、众数和平均数,对比即可得结果.

【详解】30个数中第15个数是5,第16个数是6,所以中位数。=个=5.5,

由题意可知:众数6=5,

十士3x2+4x3+5x10+6x6+7x3+8x2+9x2+10x2179

平均值°=----------------------------------------------=——.

3030

所以

故选:D.

2.C

【分析】利用频率分别直方图、频数、频率、中位数、众数直接求解.

13

【详解】对于A,该学生每日完成作业的时间在2小时至2.5小时的天数为:0.5x0.5x100=25天,故A错误;

对于B,估计该学生每日完成作业时间超过3小时的概率为(0.3+0.2+0.1+0.1)x0.5=0.35,故B错误;

对于C,[1,2.5)的频率为(0.1+0.3+0.5)x0.5=0.45,[1,3)的频率为0.45+0.4x0.5=0.65,

则该学生每日完成作业时间的中位数为2.5+0R5-=0?4x50.5=2.625,故C正确;

0.2

对于D,估计该学生每日完成作业时间的众数为老2+三25二2.25,故D错误;

故选:C

3.ABCD

【分析】根据对称知识可得y=6-结合平均数、中位数、方差、极差的性质,即可判断

出答案.

【详解】由于(和0),伍,0),、(%,0),它们分别与(加10),(%,1。),-、(卅,1。)关于点(3,5)对称,

则有七+X=6(ieZ,lV,V10),即有y;=6-x,.(zeZ,l</<10).

则由平均数的性质可得%,%,-,%这组数的平均数为6-a,

结合中位数性质可知中位数为6-b,结合方差性质可得方差为c,极差非负,所以极差为d.

故选:ABCD

4.ACD

【详解】根据平均数,中位数,众数的概念结合图形分析判断.

【分析】图(1)的分布直方图是对称的,所以平均数=中位数=众数,故A正确;

图(2)众数最小,右拖尾平均数大于中位数,故B错误,C正确;

图(3)左拖尾众数最大,平均数小于中位数,故D正确.

故选:ACD.

5.①②④

【分析】依据平均数和方差的定义判断①;求得语文、数学、英语年级排名均在150名以外的学生人数判

断②;求得语文第一名、数学第一名、英语第一名的同学判断③;求得从该班学生中随机抽取1人,若其

语文排名大于200,则其英语和数学排名均在150以内的概率判断④.

【详解】①:三科中,数学对应的点比英语对应的点到横轴的距离近且较为密集,

数学对应的点到横轴的距离比语文对应的点到纵轴距离近且较为密集,

所以数学年级排名的平均数及方差均最小.判断正确;

②:语文、数学、英语年级排名均在150名以外的学生为1人.判断正确;

14

③:本次考试该班语文第一名、数学第一名、英语第一名为同一名同学.判断错误;

(4):由图表可知语文排名大于200的有3位同学,

语文排名大于200且英语和数学排名均在150以内的同学仅有1位同学.

故从该班学生中随机抽取1人,若其语文排名大于200,

则其英语和数学排名均在150以内的概率为g.判断正确.

故答案为①②④

6.s2<s3<Sj

【分析】根据平均数公式及方差公式分别计算S;、s;、S;,即可判断;

【详解】由图甲:平均值为

,=500(1250X0.0006+1750x0.0004+2250x0.0002+2750x0.0002+3250x0.0006)=2200,

s:=(1250-2200)2x0.3+(l750-2200)2x0.2+(2250-2200)2x0.1

+(2750-2200)2x0.1+(3250-2200)2x0.3

=672500,

元=1250x0.1+1750x0.2+2250x0.4+2750x0.2+3250x0.1=2250,

s;=(1250一2250)2x0.1+(1750-2250)2x0.2+(2250-2250)2x0.4

+(2750-2250)2x0.2+(3250-2250)2x0.1

=300000,

=1250x0.2+1750x0.2+2250x0.3+2750x0.2+3250x0.1=2150,

s;=(1250-2150)2x0.2+(1750-2150)2x0.2+(2250-2150)2x0.3

+(2750-2150)2x0.2+(3250-2150)2x0.1

=390000,

则标准差e<鸟<8,

故答案为:$2<$3<邑.

反思提升:

⑴众数、中位数、平均数的应用要点

中位数、众数分别反映了一组数据的“中等水平”“多数水平”,平均数反映了数据的平均水

平,我们需根据实际需要选择使用.

(2)频率分布直方图的数字特征

15

①众数:众数一般用频率分布表中频率最高的一组的组中值来表示,即在样本数据的频率分布

直方图中,最高小长方形的底边中点的横坐标;

②中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等;

③平均数:平均数在频率分布表中等于组中值与对应频率之积的和.

【考点3]总体离散程度的估计

一、单选题

1.(2024•黑龙江哈尔滨♦模拟预测)已知有4个数据的平均值为5,方差为4,现加入数据6和10,则这6

个数据的新方差为()

713

A.-B.—C.6D.10

33

2.(2024•陕西西安•模拟预测)已知一组样本数据项,马,…,毛的方差为10,且无|+玛=%+.%,则样本数据

再-1,尤2+1,%3-1,尤4+1,毛的方差为()

A.9.2B.10.8C.9.75D.10.25

二、多选题

3.(2024•山东泰安•模拟预测)下列结论正确的是()

A.回归直线£=%+4至少经过其样本数据(%,%),(9,%),•,(%,%)中的一个点

B.已知命题P:Vx,ye(0,l),x+y<2,则命题P的否定为Hx,ye(0,1),x+y>2

C.若X为取有限个值的离散型随机变量,则[E(x)『.(x2)

D.若一组样本数据4、3、L、X"的平均数为10,另一组样本数据2再+4、2七+4、L、2x,+4的

方差为8,则两组样本数据合并为一组样本数据后的平均数和方差分别为17和54

4.(2024・福建福州•模拟预测)下列说法中,正确的是()

A.数据40,27,32,30,38,54,31,50的第50百分位数为32

B.已知随机变量J服从正态分布尸3<4)=0.84;则P(2<J<4)=0.34

C.己知两个变量具有线性相关关系,其回归直线方程为&+若5=2,元=1,歹=3,则4=1

D.若样本数据币%,…,税的方差为2,则数据2网-1,29-1,…,2/-1的方差为4

三、填空题

5.(2023•吉林•一模)吉林市一中学有男生900人,女生600人.在“书香校园”活动中,为了解全校学生的

读书时间,按性别比例分层随机抽样的方法抽取100名学生,其中男生、女生每天读书时间的平均值分别

为60分钟和80分钟,方差分别为10和15.结合上述数据估计该校学生每天读书时间的平均值为分

钟,方差为.

6.(2022・北京•模拟预测)某班在一次考试后分析学生在语文、数学、英语三个学科的表现,绘制了各科年级

16

排名的散点图(如下图所示).

语文和英语年级排名散点图语文和数学年级排名散点图

300300

250250

r0oN2

i造00

15o价

10O

5()5()

°0°0

5010015020025030035050100150200250300350

语文排名语文排名

关于该班级学生这三个学科本次考试的情况,给出下列四个结论:

①三科中,数学年级排名的平均数及方差均最小;

②语文、数学、英语年级排名均在150名以外的学生为1人;

③本次考试该班语文第一名、数学第一名、英语第一名可能为三名不同的同学;

④从该班学生中随机抽取1人,若其语文排名大于200,则其英语和数学排名均在150以内的概率为;.

其中所有正确结论的序号是.

参考答案:

题号1234

答案CBBDBC

1.C

【分析】设原来的4个数依次为a,b,c,d,再利用平均数和方差的计算公式结合整体法即可.

【详解】设原来的4个数依次为a,b,c,d,

.原来4个数据的平均值为5,方差为4,.•.4+8+c+d=20,

1[(o-5)2+0-5)2+(c-5)2+(^-5)2]=4,

(a-5)2+(6-5)2+(c-5>+(d-5)2=16,

+c~+d~-10(a+b+c+d)+100=16,

:.a2+b2+c2+d2=16+10x20-100=116,

现加入数据6和10,则这6个数据的平均数为

一(。+Z?+c+d+6+10)=6,

6

则这6个数据的方差为::[5-6y+S-6)2+(c-胡+(d-6)2+(6-6)2+(10-6)2]

17

=:“+/+02+屋一i2m+b+c+d)+4x36+16]

=:(116-12x20+4x36+16)=6.

故选:C.

2.B

【分析】根据条件中的方差和为+%=%+%,代入新数据的方差公式,即可求解.

15

【详解】设样本数据占,3,.,%的平均数为元,贝《2(无,一叶=1°,

3i=l

且样本数据占-1,9+1,x3-l,x4+1,x5的平均数也为X,

故选:B

3.BD

【分析】对于选项A,回归直线一定过样本中心点,回归直线可能不过任何一个点;对于选项B,全称量词

命题的否定的方法是改量词,否结论;对于选项C,由。(*)=E侬2)-倒乂)]230即可判断正误;对于选

项D,计算出g>,、的值,再利用平均数和方差公式可求得合并后的新数据的平均数和方差.

1=11=1

【详解】对于选项A,回归直线亍=淡+&一定经过样本中心点(只可,但不一定经过其样本数据

(占,%),(尤2,%”(尤“,%)中的点,故A错误;

对于选项B,命题P的否定为"改,ye(O,l),无+yN2”,故B正确;

对于选项C,X为取有限个值的离散型随机变量,D(X)=E(X2)-[E(X)]2>0,则囱X)『〈E(X2),故C

错误;

对于选项D,由题意可知,数据七、%、L、%的平均数为10,则工£>,=10,则g>,=10w,

〃i=li=l

所以,数据2为+4、2%+4、L、2xn+4,

平均数为,£(2%+4)=2£/+4=2x10+4=24,£(2%+4)=24/7,

〃i=\〃i=li=l

方差为,寸(2尤,+4)-(2元+4)]2=-^(x,.-10)2-400,

ni=l〃z=l〃z=l

Ann

即方差为一»;-400=8,所以£x;=102n.

Hi=lz=l

将两组数据合并后,新数据4、X?、L、无“、2%+4、2%+4、L、2X.+4,

18

平均数为--£>+£(2%+4)=;(10〃+24")=17,

2〃|_i=ii=\J2YI

irn0n"|]fnn)

方差为丁2(x,T7)+£(2七+4-17)9=卜£片一86》;+458〃,

ZHL1=1i=l」,八i=li=lJ

即方差为:(5xl02w-860a+458〃)=54.故D正确.

故选:BD.

4.BC

【分析】根据第50百分位数为中位数判断A,根据正态分布的性质判断B,根据回归直线方程的性质判断C,

根据方差的性质判断D.

【详解】对数据排列:27,30,31,32,38,40,50,54,因为第50百分位数为中位数,所以50百分位数为35,故

A错误;

因为随机变量J服从正态分布N(202),P(J<4)=0.84,所以尸(短4)=0.16,所以尸(”0)=0.16,所以

P(0<J<4)=0.68,所以P(2<J<4)=0.34,故B正确;

因为g=2,于=1,7=3,则a=》一叙=3-2=1,故C正确;

因为样本数据玉,々,…凸。的方差为2,所以数据2x1T2%-1,…,2占。-1的方差为2?x2=8,故D错误.

故选:BC.

5.68108

【分析】利用分层抽样的平均值与方差公式计算即可.

【详解】由题意可知男生女生抽取比例分别为:其二|,恐0r|,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论