版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
5.用样本估计总体
r学习目标11.正确理解样本数据标准差的意义和作用,学会计算数据的标准差2能根据实
际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并
做出合理的解释3会用样本的基本数字特征估计总体的基本数字特征.
知识梳理梳理教材夯实基石出
------------------------------------------------------N---------------
知识点一
在分层抽样时,如果总体分为攵层,而且第,层抽取的样本量为均,第,层的样本均值为;J,
样本方差为寸,…,匕记〃=%j,所有数据的样本均值和方差分别为x(可口),
尸j=i
s2=^[njSj+nj(xj-x)2].
j=l
知识点二用样本的数字特征来估计总体的数字特征
众数众数是最高长方形的中点所对应的数据
(1)在频率分布直方图中,中位数左边和右边的直方图面积相簧,由此可以估计
中位数中位数的值,但是有偏差;
(2)表示样本数据所占频率的等分线
(1)平均数等于每个小矩形的面枳乘以小矩形底边中点的横坐标之和;
平均数
(2)平均数是频率分布直方图的重心,是频率分布直方图的平衡点
一般来说,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可.
知识点三用样本的分布估计总体的分布
同数字特征的估计一样,分布的估计一般也有误差.如果总体在每一个分组的频率记为兀I,
兀2,…,兀",样本在每一组对应的频率记为Pl,02,…,Pn>一般来说,:Z(叫一。》2=。(兀1
LI
-pi)2+(©—p2)2+…+(兀“一p,,)2]不等于零.同样,大数定律可以保证,当样本的容量越来越
大时,上式很小的可能性将越来越大.
■思考辨析判断正误
1.样本的平均数描述了样本数据的平均水平.(V)
2.方差越大、数据越集中在平均数左右.(X)
3.中位数是样本数据中最中间位置的数据.(X)
4.用样本估计出的总体中位数一定是样本数据中的某个数.(X)
题型探究探究重点提升素养
------------------------
一、分层随机抽样的均值与方差的计算
例1(多选)某分层随机抽样中,有关数据如下:
样本量平均数方差
第1层4542
第2层3581
第3层1063
则下列叙述正确的是(结果保留两位小数)()
A.第1,2层所有数据的均值为
B.第1,2层所有数据的方差为
C.第1,2,3层所有数据的均值约为
D.第1,2,3层所有数据的方差约为
答案AD
解析第1,2层所有数据的均值为:x12=石能X4+石林X8=,A正确;第1,2层所有
4535
数据的方差为留=方标X[2+(4—月+行能X[l+(8—%=,B不正确;第1,2,3层所有
数据的均值为M=^X4+||x8+版乂6心,C不正确;第123层所有数据的方差约为S2=
款[2+(4-)2]+1|X[l+(8-)2]+|§X[3+(6-)2,D正确.
反思感悟运用公式求分层随机抽样的均值与方差时要注意
(1)清楚公式中各个符号的含义,避免代入数据混乱.
(2)运算要格外仔细,并按要求保留有效小数.
跟踪训练1某培训机构在假期招收了A,B两个数学补习班,A班10人,B班30人,经过
一周的补习后进行了一次测试,在该测试中,A班的平均成绩为130分,方差为115,8班的
平均成绩为110分,方差为215.求在这次测试中全体学生的平均成绩和方差.
解依题意x人=130,次=115,
xB=110,51=215,
'X=10+30XI30+10+30X110=115,
.••全体学生的平均分为115分.
全体学生成绩的方差为
10__30——
2
S2=10+3()"'+(x4一x)4+]o+30阂+(xB—x)]
=10+30。15+225)+]0+30(215+25)
=85+180=265.
二、用样本的数字特征估计总体的数字特征
例2甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图所示:
⑴填写下表;
平均数方差中位数命中9环及以上
甲71
乙3
(2)请从四个不同的角度对这次测试进行分析:
①从平均数和方差结合分析偏离程度;
②从平均数和中位数结合分析谁的成绩好些;
③从平均数和命中9环及以上的次数相结合看谁的成绩好些;
④从折线图上两人射击命中环数及走势分析谁更有潜力.
一1
解(1)乙的射靶环数依次为2,4,6,8,7,7,8,9,9,10,所以x乙=元(2+4+6+8+7+7+8+9+9
7+8
+10)=7;乙的射靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是一1一=;甲的射
靶环数从小到大排列为5,6,6,777,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示:
平均数方差中位数命中9环及以上
甲771
乙73
(2)①甲、乙的平均数相同,均为7,但s爷说明甲偏离平均数的程度小,而乙偏离平均
数的程度大.
②甲、乙的平均水平相同,而乙的中位数比甲大,说明乙射靶成绩比甲好.
③甲、乙的平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的射靶
成绩比甲好.
④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在
提升,更有潜力.
反思感悟在日常生活中,当面对一组数据时,相比每一个观测值,有时我们更关心的是能
反映这组数据特征的一些值,例如上述数据,我们可以从平均数、中位数、百分位数、众数、
极差、方差、标准差等角度进行比较.
跟踪训练2为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换,已知某校
使用的100支日光灯在必须换掉前的使用天数如下表:
181〜211〜241〜271〜301〜331-361〜
天数151—180
210240270300330360390
日光灯数1111820251672
(1)试估计这种日光灯的平均使用寿命;
(2)若定期更换,可选择多长时间统一更换合适?
解(1)各组的平均值分别为由此可估计这种日光灯的平均使用寿命为X1%+X11%
+X18%+X20%+X25%+X16%+X7%+X2%=(天).
(2)52=-^J[1X(-)2+11X(-)2+18X(-)2+20X(-)2+25X(-)2+16X(-)2+7X(-)2+
2X(-)2]=2,故标准差g46(天).
由上可知这种日光灯的平均使用寿命为天,标准差约为46天,故可在222天到314天内统一
更换较合适.
三、频率分布直方图与数字特征的综合应用
例3已知一组数据:
125121123125127129125128130129
126124125127126122124125126128
(1)填写下面的频率分布表;
分组个数累计频数频率
[,)
[,)
[,)
[,)
[,]
合计
(2)作出频率分布直方图;
(3)以这组数据为样本估计总体的众数、中位数和平均数.
解⑴
分组个数累计频数频率
[,)r2
[,)i;3
[,)正下8
[,)正4
[,]3
合计201
⑵
(3)在[,)中的数据最多,取这个区间的中点值作为众数的近似值,得众数为1255设中位数为
X,则+(x—)X=,解得x=125.75.使用“组中值”求平均数:^=X+X+X+X+X=
125.8.
所以可估计总体的众数为,中位数为,平均数为125.8.
(学生留)反思感悟利用频率分布直方图求数字特征
⑴众数是最高的矩形的底边的中点;
⑵中位数左右两侧直方图的面积相等;
(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.
跟踪训练3某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘
制成如图所示的频率分布直方图.求:
(1)高一参赛学生的成绩的众数、中位数;
(2)高一参赛学生的平均成绩.
解(1)由题图可知众数为65,
又因为第一个小矩形的面积为,
所以设中位数为60+x,则+xX=,得x=5,
所以中位数为60+5=65.
(2)依题意,平均成绩为55X+65X+75X+85X4-95X=67,
所以高一参赛学生的平均成绩约为67.
随堂演练基础巩固学以致用
1.为评估一种农作物的种植效果,选了〃块地作试验田.这〃块地的亩产量(单位:kg)分别
为乃,X2,…,为,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()
A.X|,X2,…,X”的平均数
B.Xi,X2,•••,X"的标准差
C.Xl,X2,••,X"的最大值
D.Xl,X2,•••,X”的中位数
答案B
解析因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,
应该用样本数据的极差、方差或标准差.故选B.
2.如图,样本A和8分别取自两个不同的总体,它们的样本平均数分别为xA和XB,样本
标准差分别为SA和SB,则()
A.X6XB,SA>SBB.XX8,SA>SB
C.XA>XB,SA<SBD.XA<xB,SA<SB
答案B
解析由题图知,A组数据分布在[,10]内,8组数据分布在[10,15]内,显然XA<XB.
又由图形可知,B组数据的分布比A组的均匀,变化幅度不大,故8组数据比较稳定,方差
较小,从而标准差较小,所以SA>SB.
3.某台机床加工的1000只产品中次品数的频率分布如下表:
次品数01234
频率
则次品数的众数、平均数依次为()
A.0,B.0,1C.4,1D.,2
答案A
解析数据为出现的频率为p:(i=l,2,…,ri),则xi,X2,-,%,的平均数为XIPI+XM+…
+x,p”.因此次品数的平均数为OX+1X+2X+3X+4X=1.1.由频率知,次品数的众数为0.
4.样本容量为9的四组数据,它们的平均数都是5,它们的柱形统计图如图所示,则标准差
最大的一组是()
5数据
第一组
0.31
0.|LEE
()34567数据58数据
第四组
A.第一组B.第二组
C.第三组D.第四组
答案D
解析方法一第一组中,样本数据都为5,数据没有波动幅度,标准差为0;
第二组中,样本数据为4,4,4,555,6,6,6,标准差为半;
第三组中,样本数据为334,4,5,6,6,7,7,标准差为芈;
第四组中,样本数据为2,22,2,5,8,8,8,8,标准差为2y.
故标准差最大的一组是第四组.
方法二从四个柱形图可看出第一组数据没有波动性,第二、三组数据的波动性都比较小,
而第四组数据的波动性相对较大,利用标准差的意义可以直观得到答案.
5.甲、乙两位同学某学科的连续五次考试成绩用茎叶图表示如图所示,则平均分数较高的是
,成绩较为稳定的是.
899
答案甲甲
一—11
解析x甲=70,xi=68.5i=gX(22+l2+l2+22)=2,X(52+12+12+32)=7.2.
-课堂小结------------------------------------------------------------------------
1.知识清单:
(1)样本的数字特征.
(2)用样本的数字特征估计总体的数字特征.
(3)用样本的分布估计总体的分布.
2.方法归纳:数据处理.
3.常见误区:样本的数字特征只能估计总体的特征,不能替代总体.
课时对点练注重双基强化落实
-----------------------\-------
g基础巩固
1.在用样本频率分布估计总体分布的过程中,下列说法中正确的是()
A.样本容量一定时总体容量越大,估计越精确
B.总体容量与估计的精确度无关
C.总体容量一定时样本容量越大,估计越精确
D.总体容量一定时样本容量越小,估计越精确
答案C
解析当样本容量越大时,估计总体越精确.
2.为了解我国13岁男孩的平均身高,从北方抽取了300个男孩,平均身高为m;从南方抽
取了200个男孩,平均身高为m.由此可估计我国13岁男孩的平均身高为()
A.mB.mC.mD.m
答案B
解析从北方抽取了300个男孩,平均身高为m,从南方抽取了200个男孩,平均身高为m,
则这500个13岁男孩的平均身高是汽go=(m),据此可估计我国13岁男孩的平均身
高为m,故选B.
3.(多选)甲、乙两名同学六次数学测验成绩(百分制)如图所示,下面说法正确的是()
9
628
620878
0926
A.甲同学成绩的中位数大于乙同学成绩的中位数
B.甲同学的平均分比乙同学高
C.甲同学的平均分比乙同学低
D.甲同学成绩的方差小于乙同学成绩的方差
答案CD
一1
解析甲的中位数为81,乙的中位数为,故A错误;甲的平均分x=/76+72+80+82+
一1
86+90)=81,乙的平均分x'=5(69+78+87+88+92+96)=85,故B错误,C正确;甲
的极差为18,乙的极差为27,且甲的成绩比较均衡,故甲的成绩的方差小于乙成绩的方差.故
选CD.
4.甲、乙两人在-一次射击比赛中各射靶5次,两人成绩的柱形统计图如图所示,则()
345678910环数078910,环数
甲乙
A.甲的成绩的平均数小于乙的成绩的平均数
B.甲的成绩的中位数等于乙的成绩的中位数
C.甲的成绩的方差小于乙的成绩的方差
D.甲的成绩的极差小于乙的成绩的极差
答案C
解析由柱形统计图知:
甲射靶5次的成绩分别为4,5,6,7,8;
乙射靶5次的成绩分别为5,5,5,6,9,
4+5+6+7+8—5+5+5+6+9
所以x甲==6;x=6.
所以x甲=x"故A不正确.
甲的成绩的中位数为6,乙的成绩的中位数为5,故B不正确.
jl=|[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=|xi0=2,
11I?
si=g[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2J=5X12=亍
I?
因为2<5,所以播<s2,故C正确.
甲的成绩的极差为8—4=4,乙的成绩的极差为9—5=4,故D不正确.故选C.
5.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十
分制)的统计图如图所示,假设得分分值的中位数为“,众数为,及,平均数为三,则()
[频数
i()—
8----
™T-
2寸
-・riU2T2rr2r
n3-45678910得分/分
A.nte=nto=xB.〃k=x
C.me<tno<xD.mo<me<x
答案D
解析由柱形统计图可知,30名学生的得分依次为2个3分,3个4分,10个5分,6个6
分,3个7分,2个8分,2个9分,2个10分.中位数为第15,16个数(分别为5,6)的平均数,
即恤=,5出现次数最多,故mo=5.
—2X3+3X4+10X5+6X6+3X7+2X8+2X9+2X10
x=30
比5.97.
于是得m<><tne<x.
6.在某市2019年“创建文明城市”知识竞赛中,考评组从所有2000份试卷中抽取200份
试卷进行分析,其分数的频率分布直方图如图所示,则本次竞赛分数在区间[60,70)上的人数
大约有.
答案800
解析根据频率分布直方图,分数在区间[60,70)上的频率为X10=,...可估计分数在区间
[60,70)上的人数为2000X=800.
7.为了鉴定某种节能灯泡的质量,对其中100只节能灯泡的使用寿命进行测量,结果如下表:
(单位:小时)
寿命450550600650700
只数2010301525
则这些节能灯泡使用寿命的平均数是
答案
解析这些节能灯泡使用寿命的平均数是
450X20+550X10+600X30+650X15+700X25
100
=597.5.
8.某校从参加高一年级期中考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分
成六段[40,50),[50,60),…,[90,100]后得到如图所示的部分频率分布直方图.在统计方法中,
同一组数据常用该组区间的中点值作为代表,观察图形的信息,据此估计本次考试数学成绩
的平均分为.
答案71
解析在频率分布直方图中,所有小长方形的面积和为1,
设[70,80)的小长方形面积为x,则(+X2++)X10+x=l,
解得x=,即该组■频率为,所以本次考试的平均分为45X+55X+65X+75X+85X+95X
=71.
9.甲、乙两台机床在相同的技术条件下,同时生产一种零件,现在从甲、乙生产的零件中分
别抽取4()件、60件,甲的平均尺寸为10,方差为20,乙的平均尺寸为12,方差为40.那么
全部100件产品的平均尺寸和方差分别是多少?
解甲机床生产的零件的平均尺寸、方差分别为
x甲=10,5%=20,
乙机床生产的零件的平均尺寸、方差分别为
x乙=12,51=40,
所以100件产品的平均尺寸
—4°X甲+6°xZ,400+720
*=-40+60--100-'
所以100件产品的方差
.1,,40X60,1,
-X[40s3+60s?.X(10—12)2]=诉X[(40X20+60X40)+24X4]=32.96.
4U十OU4U十OU1UU
10.某网站从春节期间参与收发网络红包的手机用户中随机抽取2000名进行调查,将受访用
户按年龄分成5组:]0,20),[20,30),…,[50,60],并整理得到如图所示的频率分布直方图.
⑴求a的值;
(2)从春节期间参与收发网络红包的手机用户中随机抽取一人,估计其年龄低于40岁的频率;
(3)估计春节期间参与收发网络红包的手机用户的平均年龄.
解(1)根据频率分布直方图可知10X(a++++)=1,解得a=0.035.
(2)根据题意,得样本中年龄低于40岁的频率为10X(++)=,
所以从春节期间参与收发网络红包的手机用户中随机抽取一人,估计其年龄低于40岁的频率
为0.75.
(3)根据题意,得春节期间参与收发网络红包的手机用户的平均年龄约为15X+25X+35X+
45X+55X=(岁).
g综合运用
11.从某项综合能力测试中抽取100人的成绩,统计如下表,则这100人的成绩的标准差为
()
分数54321
人数2010303010
AS-C.3D.§
答案B
〒心山,5X20+4X10+3X30+2X30+1X10
解析平均数为---------------示K---------------=3.
1Q
故$-2=而X[20X(5-3)2+10X(4-3)2+30X(3-3)2+30X(2—3)2+10X(l—3)2]=5.
故s<=噜
12.为了了解某校学生的视力情况,随机抽查了该校的100名学生,得到如图所示的频率分
布直方图.由于不慎将部分数据丢失,但知道前4组的频数和为40,后6组的频数和为87.
设最大频率为a,视力在到之间的学生人数为仇则。,。的值分别为()
频率「
组距一]
04.34.44.5464.74.84.95.05.15.2视力
A.,B.,96
C.27,D.27,96
答案B
解析由频率分布直方图知组距为,由前4组的频数和为40,后6组的频数和为87,知第4
组的频数为40+87—100=27,即视力在到之间的频数最大,为27,故最大频率“=0.27.视
力在到之间的频率为1——=,故视力在到之间的学生人数〃=X100=96.
13.某高校有甲、乙两个数学建模兴趣班.其中甲班有40人,乙班有50人.现分析两个班
的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则该校数学建模
兴趣班的平均成绩是分.
答案85
解析由题意得,该校数学建模兴趣班的平均成绩是4°义9°卜5。义81=85(分).
14.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得
到频率分布直方图如图,则
[频率
组距
0.040---------------1--------1
0.0叫
0.03(“
0.025..............J——------------
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论