版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第九章统计与成对数据的统计分析第2讲用样本估计总体
课标要求命题点五年考情命题分析预测1.能用样本估计总体的
集中趋势参数(平均数、
中位数、众数),理解集
中趋势参数的统计含义.百分位数
的估计本讲是高考命题的热
点,主要考查百分位
数,样本数据的数字特
征,课标要求命题点五年考情命题分析预测2.能用样本估计总体的
离散程度参数(标准差、
方差、极差),理解离散
程度参数的统计含义.样本的数
字特征2023新高考卷ⅠT9;2022全国
卷乙T19;2022全国卷甲T2;
2021新高考卷ⅠT9;2021新高
考卷ⅡT9;2021全国卷甲T2;
2021全国卷乙T17;2020全国
卷ⅢT3;2019全国卷ⅡT5;
2019全国卷ⅡT13;2019全国
ⅢT17统计图中的数
字特征,总体
趋势估计等.课标要求命题点五年考情命题分析预测3.能用样本估
计总体的取值
规律.4.能用样本估
计百分位数,
理解百分位数
的统计含义.总体数字特征的
估计2023全国卷乙T17;2022新高考
卷ⅡT19;2022全国卷乙T19;
2021全国卷乙T17;2020全国卷
ⅡT18;2020全国卷ⅢT18;2019
全国卷ⅡT19;2019全国卷ⅢT17预计2025年高
考主要以生产
生活实践情境
为载体考查样
本的数字特征
及对总体的估
计.分层随机抽样的
均值与方差
学生用书P2121.百分位数(1)定义:一般地,一组数据的第
p
百分位数是这样一个值,它使得这组数据中至少
有①
的数据小于或等于这个值,且至少有②
的数据大于或
等于这个值.(2)四分位数:第25百分位数、中位数(第50百分位数)、第75百分位数把一组由
小到大排列后的数据分成四等份,这三个分位数统称为四分位数.其中第25百
分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位
数或上四分位数等.p
%
(100-
p
)%
2.平均数、中位数、众数数字特
征概念特征平均数与每一个样本数据有关,样本中任何
一个数据的改变都会引起平均数的改
变,对样本中的极端值更加敏感.
数字特
征概念特征中位数将一组数据按从小到大或从大到小的顺序
排列后,处在最④
的一个数据(当
数据个数是奇数时)或最中间两个数据的
⑤
(当数据的个数是偶数时).只利用了样本数据中间位置
的一个或两个值,有的样本
数据的改变不一定引起中位
数的改变.众数一组数据中出现次数⑥
的数据(即
频数最大值所对应的样本数据).体现了样本数据的最大集中
点,对极端值不敏感,一组
数据可能有n个众数,也可
能没有众数.中间
平均数
最多
3.方差和标准差名称定义样本的方
差和标准
差
名称定义总体的方
差和标准
差
4.分层随机抽样的样本均值与方差
常用结论1.平均数的性质
2.方差的性质若给定一组数据
x
1,
x
2,…,
xn
,其方差为
s
2,则
ax
1,
ax
2,…,
axn
的方差为
a
2
s
2,
ax
1+
b
,
ax
2+
b
,…,
axn
+
b
的方差为
a
2
s
2.特别地,当
a
=1时,有
x
1+
b
,
x
2+
b
,…,
xn
+
b
的方差为
s
2,这说明将一组数
据中的每一个数据都加上一个相同的常数,方差是不变的,即数据经过平移后方差
不变.
1.下列说法正确的是(
D
)A.对一组数据来说,平均数和中位数总是非常接近B.一组数据的第p百分位数唯一C.方差与标准差具有相同的单位D.如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变[解析]
平均数指的是这组数据的平均水平,中位数指的是这组数据的中间水平,
它们之间没有必然联系,故A错误;一组数据的第
p
百分位数可以不唯一,故B错
误;方差是标准差的平方,故它们的单位不一样,故C错误.D123452.[全国卷Ⅲ]设一组样本数据
x
1,
x
2,…,
xn
的方差为0.01,则数据10
x
1,10
x2,…,10
xn
的方差为(
C
)A.0.01B.0.1C.1D.10[解析]因为数据
axi
+
b
(
i
=1,2,…,
n
)的方差是数据
xi
(
i
=1,2,…,
n
)的方
差的
a
2倍,所以所求数据的方差为102×0.01=1.C123453.[多选/2021新高考卷Ⅱ]下列统计量中可用于度量样本
x
1,
x
2,…,
xn
离散程度的
有(
AC
)A.x1,x2,…,xn的标准差B.x1,x2,…,xn的中位数C.x1,x2,…,xn的极差D.x1,x2,…,xn的平均数[解析]平均数、众数和中位数均刻画了样本数据的集中趋势,一般地,对数值型
数据集中趋势的描述,可以用平均数和中位数,对分类型数据集中趋势的描述,可
以用众数.方差、标准差和极差均是度量样本数据离散程度的数字特征.故选AC.AC123454.[江苏高考]已知一组数据6,7,8,8,9,10,则该组数据的方差是
.
123455.[2023湖南省六校联考]数据:1,2,2,3,4,5,6,6,7,8,其中位数为
m
,
第60百分位数为
a
,则
m
+
a
=
.
10
12345
学生用书P213命题点1
百分位数的估计例1(1)一个容量为20的样本,其数据按从小到大的顺序排列为:1,2,2,3,5,
6,6,7,8,8,9,10,13,13,14,15,17,17,18,18.则该组数据的第75百分
位数为
,第86百分位数为
.
14.5
17
例1训练1例2例3训练2例4例5训练3例6训练4(2)[2023重庆二调]如图是根据某班学生在一次体能素质测试中的成绩画出的频率分
布直方图,则由直方图得到的80%分位数为
.
解得
x
=78.5.78.5
例1训练1例2例3训练2例4例5训练3例6训练4方法技巧1.计算一组
n
个数据的第
p
百分位数的步骤(1)按从小到大排列原始数据;(2)计算
i
=
n
×
p
%;(3)若
i
不是整数,而大于
i
的比
邻整数为
j
,则第
p
百分位数为第
j
项数据;若
i
是整数,则第
p
百分位数为第
i
项与
第(
i
+1)项数据的平均数.2.频率分布直方图中第
p
百分位数的求解步骤(1)确定第
p
百分位数所在的区间[
a
,
b
);
例1训练1例2例3训练2例4例5训练3例6训练4训练1(1)已知100个数据的第75百分位数是9.3,则下列说法正确的是(
C
)A.这100个数据中一定有75个数小于或等于9.3B.把这100个数据从小到大排列后,9.3是第75个数据C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数[解析]因为100×75%=75,为整数,所以第75个数据和第76个数据的平均数为第
75百分位数,是9.3,则C正确,其他选项均不正确,故选C.C例1训练1例2例3训练2例4例5训练3例6训练4(2)[2023河北名校联考]为科普航天知识,某校组织学生参与航天知识竞答活动,某
班8位同学成绩如下:7,6,8,9,8,7,10,
m
.若去掉
m
,该组数据的第25百分
位数保持不变,则整数
m
(1≤
m
≤10)的值可以是
.(写出一个满
足条件的
m
的值即可)[解析]原数据去掉
m
后,剩余数据从小到大依次为6,7,7,8,8,9,10,因为
7×0.25=1.75,所以这7个数的第25百分位数为7,所以数据7,6,8,9,8,7,
10,
m
的第25百分位数为7,又8×0.25=2,所以7为这8个数据从小到大排序后的第
2个数与第3个数的平均数,所以
m
(1≤
m
≤10)的值可以是7或8或9或10.7(8,9,10也可)
例1训练1例2例3训练2例4例5训练3例6训练4
A例1训练1例2例3训练2例4例5训练3例6训练4
例1训练1例2例3训练2例4例5训练3例6训练4(2)[多选/2023新高考卷Ⅰ]有一组样本数据
x
1,
x
2,…,
x
6,其中
x
1是最小值,
x
6是
最大值,则(
BD
)A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差BD例1训练1例2例3训练2例4例5训练3例6训练4
例1训练1例2例3训练2例4例5训练3例6训练4角度2
统计图中的数字特征例3[多选/2023重庆市三检]某学校共有2000名男生,为了了解这部分学生的身体发
育情况,学校抽查了100名男生的体重情况.根据所得数据绘制样本的频率分布直方
图如图所示,则下列结论正确的是(
ABD
)ABDC.样本的平均值为66D.该校男生体重超过70kg的学生大约为600人例1训练1例2例3训练2例4例5训练3例6训练4
例1训练1例2例3训练2例4例5训练3例6训练4方法技巧频率分布直方图中的数字特征(1)众数:在频率分布直方图中,一般用最高小长方形的底边中点的横坐标近似
代替;(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等;(3)平均数:平均数在频率分布直方图中近似等于各组区间的中点值与对应频率之积
的和.例1训练1例2例3训练2例4例5训练3例6训练4训练2(1)[2022全国卷甲]某社区通过公益讲座以普及社区居民的垃圾分类知识.为了
解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分
类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如图,则(
B
)BA.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差例1训练1例2例3训练2例4例5训练3例6训练4
例1训练1例2例3训练2例4例5训练3例6训练4(2)[多选/2021新高考卷Ⅰ]有一组样本数据
x
1,
x
2,…,
xn
,由这组数据得到新样本
数据
y
1,
y
2,…,
yn
,其中
yi
=
xi
+
c
(
i
=1,2,…,
n
),
c
为非零常数,则
(
CD
)A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同
CD例1训练1例2例3训练2例4例5训练3例6训练4命题点3
总体数字特征的估计角度1
总体集中趋势的估计例4统计局就某地居民的月收入(单位:元)情况调查了10000人,并根据所得数据画
出了样本频率分布直方图(如图),每个分组包括左端点,不包括右端点,如第一组
表示月收入在[2500,3000)内.例1训练1例2例3训练2例4例5训练3例6训练4(1)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10000人
中用分层随机抽样的方法抽出100人进行下一步分析,则月收入在[4000,4500)内
的应抽取多少人?
例1训练1例2例3训练2例4例5训练3例6训练4
(3)样本平均数为(2750×0.0002+3250×0.0004+3750×0.0005+4250×0.0005+4750×0.0003+5250×0.0001)×500=3900,因此估计该地居民月收入的平均数为3900元.(3)假设同组中的数据用该组区间的中点值代替,估计该地居民月收入的平均数.(2)估计该地居民的月收入的中位数.例1训练1例2例3训练2例4例5训练3例6训练4方法技巧平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组
数据的集中趋势.一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势
的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等
级等)集中趋势的描述,可以用众数.例1训练1例2例3训练2例4例5训练3例6训练4角度2
总体离散程度的估计例5[2023全国卷乙]某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效
应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地
选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸
缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为
xi
,
yi
(
i
=1,
2,…,10),试验结果如下:试验序号i12345678910伸缩率xi545533551522575544541568596548伸缩率yi536527543530560533522550576536例1训练1例2例3训练2例4例5训练3例6训练4
[解析]
(1)由题意,求出
zi
的值如表所示,试验序号i12345678910zi968-8151119182012
例1训练1例2例3训练2例4例5训练3例6训练4
例1训练1例2例3训练2例4例5训练3例6训练4方法技巧总体离散程度的估计标准差(方差)刻画了数据的离散程度或波动幅度,标准差(方差)越大,数据的离散程
度越大,越不稳定;标准差(方差)越小,数据的离散程度越小,越稳定.例1训练1例2例3训练2例4例5训练3例6训练4训练3[全国卷Ⅱ]某行业主管部门为了解本行业中小企业的生产情况,随机调查
了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率
y
的
频数分布表.y的分组[-0.20,0)[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数22453147例1训练1例2例3训练2例4例5训练3例6训练4(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企
业比例;
例1训练1例2例3训练2例4例5训练3例6训练4
例1训练1例2例3训练2例4例5训练3例6训练4命题点4
分层随机抽样的均值与方差例6某校开展了为期一年的“弘扬传统文化,阅读经典名著”活动.在了解全校学生
每年平均阅读了多少本文学经典名著时,甲同学抽取了一个容量为10的样本,并算
得样本的平均数为5,方差为9;乙同学抽取了一个容量为8的样本,并算得样本的
平均数为6,方差为16.已知甲、乙两同学抽取的样本合在一起组成一个容量为18的
样本,则合在一起后的样本平均数为
,方差为
.(精确到0.1)5.4
12.4
例1训练1例2例3训练2例4例5训练3例6训练4
例1训练1例2例3训练2例4例5训练3例6训练4
例1训练1例2例3训练2例4例5训练3例6训练4训练4[2023安徽省示范高中联考]为了调查公司员工的健康状况,某公司男、女员工
比例是2∶3,用分层随机抽样的方法抽取样本,统计样本数据如下:男员工的平均
体重为70kg,标准差为5kg;女员工的平均体重为50kg,标准差为6kg.则由此估
计该公司员工的平均体重是
kg,方差是
kg2.
58
127.6
例1训练1例2例3训练2例4例5训练3例6训练4
A.50B.60C.70D.80
C12345
A.平均数不变B.众数不变C.极差变小D.第20百分位数变大BD
123453.[命题点2,4/2023潍坊市高三统考]若一组样本数据
x
1,
x
2,…,
xn
的平均数为
10,另一组样本数据2
x
1+4,2
x
2+4,…,2
xn
+4的方差为8,则两组样本数据合
并为一组样本数据后的平均数和方差分别为(
A
)A.17,54B.17,48C.15,54D.15,48A12345
123454.[命题点3/2021全国卷乙]某厂研制了一种生产高精产品的设备,为检验新设备生产
产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各
件产品该项指标数据如下:旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5
12345
12345
123455.[命题点4/2023广州市调研]为调查某地区中学生每天的睡眠时间,采用样本量比例
分配的分层随机抽样,现抽取初中生800人,其每天睡眠时间均值为9小时,方差为
1,抽取高中生1200人,其每天睡眠时间均值为8小时,方差为0.5,则估计该地区
中学生每天睡眠时间的方差为(
B
)A.0.96B.0.94C.0.79D.0.75B12345
12345
学生用书·作业帮P3751234567891011121314151.[2024福州市一检]某市抽查一周空气质量指数变化情况,得到一组数据:80,
76,73,82,86,75,81.以下关于这组数据判断正确的有(
C
)A.极差为11B.中位数为82C.平均数为79D.方差为124C[解析]对A,B,将这组数据按从小到大的顺序排列为73,75,76,80,
81,82,86,则这组数据的极差为86-73=13,这组数据的中位数为80,A错
误,B错误;对C,(80+76+73+82+86+75+81)÷7=79,C正确;对D,
[(80-79)2+(76-79)2+(73-79)2+(82-79)2+(86-79)2+(75-79)2+(81-
79)2]÷7≈17.7,D错误.故选C.1234567891011121314152.[2024湖北部分学校联考]为了弘扬体育精神,某学校组织秋季运动会,在一项比
赛中,学生甲进行了8组投篮,得分分别为10,8,
a
,8,7,9,6,8,如果学生甲
的平均得分为8分,那么这组数据的第75百分位数为(
C
)A.8B.9C.8.5D.9.5C
1234567891011121314153.[全国卷Ⅱ]演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩
时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分
与9个原始评分相比,不变的数字特征是(
A
)A.中位数B.平均数C.方差D.极差[解析]记9个原始评分分别为
a
,
b
,
c
,
d
,
e
,
f
,
g
,
h
,
i
(按从小到大的顺序
排列),易知
e
为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位
数,故选A.A1234567891011121314154.[2024河南名校联考]在某次考试中,某班学生的最高分为100分,最低分为50分,
且最高分只有1个,现将全班每个学生的分数按照
yi
=
axi
+
b
(
a
>0)进行调整,其
中
xi
是第
i
个学生的原始分数,
yi
是第
i
个学生调整后的分数,若调整后,全班的最
高分为100分,最低分为60分,则(
B
)A.调整后分数的平均数和原始分数的平均数相同B.调整后分数的中位数高于原始分数的中位数C.调整后分数的标准差和原始分数的标准差相同D.调整后分数的众数个数多于原始分数的众数个数B123456789101112131415[解析]对于A,B:根据题意知100=100
a
+
b
,60=50
a
+
b
,所以
a
=0.8,
b
=
20,于是
yi
=0.8
xi
+20,则
yi
-
xi
=0.8
xi
+20-
xi
=20-0.2
xi
=0.2(100-
xi
)≥0,
即除了最高分外,调整后的分数都高于原始分数,因此调整后分数的平均数、中位
数分别高于原始分数的平均数、中位数,A错误,B正确.对于C:根据
yi
=0.8
xi
+20,可得调整后分数的标准差等于原始分数的标准差的0.8
倍,显然调整后分数的标准差变小了,故C错误.对于D:如果原始分数相同,则调整后的分数也相同,故调整后分数的众数个数和
原始分数的众数个数相同,故D错误.1234567891011121314155.[多选/2024云南昆明模拟]甲、乙两个旅游景区某月初连续7天的日均气温(单位:
℃)数据如图所示(气温均取整数),则关于这7天的日均气温,下列判断正确的是
(
ABC
)A.甲旅游景区日均气温的平均数与乙旅游景区日均气温的平均数
相等B.甲旅游景区日均气温的中位数与乙旅游景区日均气温的中位数
相等C.甲旅游景区的日均气温波动比乙旅游景区的日均气温波动大D.乙旅游景区日均气温的极差为1℃ABC123456789101112131415
1234567891011121314156.[多选/2023合肥市二检]如图是某汽车公司100家销售商2022年新能源汽车销售量
(单位:辆)的频率分布直方图,则(
ACD
)A.a的值为0.004B.估计这100家销售商新能源汽车销售量的平均数为135C.估计这100家销售商新能源汽车销售量的80%分位数为212.5D.若按分层随机抽样原则从这100家销售商中抽取20家,则从销售量在[200,300]内
的销售商中抽取5家ACD123456789101112131415[解析]对于A,由频率分布直方图可得,50×0.002+50×0.003+50
a
+50×0.006
+50
a
+50×0.001=1,得
a
=0.004,故A正确;对于B,(25×0.002+75×0.003+
125×0.004+175×0.006+225×0.004+275×0.001)×50=150,故B错误;对于C,
设80%分位数为
x
,易得
x
∈[200,250),则50×0.002+50×0.003+50×0.004+
50×0.006+(
x
-200)×0.004=0.8,解得
x
=212.5,故C正确;对于D,销售量在
[200,300]内的频率为50×0.004+50×0.001=0.25,20×0.25=5,所以从销售量在
[200,300]内的销售商中抽取5家,故D正确.故选ACD.123456789101112131415
A.从高一学生中抽取了40人B.抽取的高二学生每天的总读书时间是1860小时C.被抽取的学生每天的读书时间的平均数为3小时D.估计该校全体学生每天的读书时间的方差为s2=1.966ACD123456789101112131415
1234567891011121314158.[2024新疆喀什模拟]样本中共有五个个体,其值分别为
a
,0,1,2,3,若该样
本的平均值为1,则样本方差为
.
2
1234567891011121314159.[2024陕西商洛联考]某品牌汽车2019—2022年这四年的销量逐年增长,2019年销
量为5万辆,2022年销量为22万辆,且这四年销量的中位数与平均数相等,则这四
年的总销量为
万辆.
54
123456789101112131415
123456789101112131415
12345678910111213141511.[2023广西联考]某新能源汽车制造公司,为鼓励消费者购买其生产的新能源汽
车,约定从2023年1月开始,凡购买一辆该品牌汽车,在行驶三年后,公司将给予
适当金额的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 固体饮料行业的市场渠道合作成功案例考核试卷
- 2024-2030年中国景观设计行业发展趋势及投资模式分析报告
- 2024-2030年中国文具行业发展趋势及竞争力策略分析报告
- 2024-2030年中国拟薄水铝石行业发展规模及投资可行性分析报告
- 2024-2030年中国户外广告行业前景预测及发展创新模式分析报告
- 2024至2030年皮带轮型板模具项目投资价值分析报告
- 2024-2030年中国建筑安装行业竞争格局及投资经营模式分析报告版
- 2024至2030年中国开花铆钉数据监测研究报告
- 2024-2030年中国市政工程行业发展形势投资规划分析报告版
- 2024至2030年中国巡检器数据监测研究报告
- 设备签收单模版
- 2023中国建筑行业装配式建筑发展研究报告
- 建设工程监理费计算器(免费)
- 预防校园欺凌、预防校园性侵告家长书
- 软件系统项目监理报告
- 建筑工程施工检测试验计划
- 社会学概论课件十四讲社会问题
- 2023年多媒体应用设计师真题题库总结
- 测电阻的多种方法(修改)
- 基坑边坡支护安全技术交底
- 国开电大《农村社会学》形成考核1答案
评论
0/150
提交评论