版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二节统计图表、用样本估计总体第十一章统计与成对数据的分析成套的课件成套的教案成套的试题成套的微专题尽在高中数学同步资源大全QQ群552511468也可联系微信fjshuxue加入百度网盘群4000G一线老师必备资料一键转存自动更新永不过期课件使用说明01本课件使Office2016制作,请使用相应软件打开并使用使用软件02本课件理科公式均采用微软公式制作,如果您是Office2007或WPS
2021年4月份以前的版本,会出现包含公式及数字无法编辑的情况,请您升级软件享受更优质体验
软件版本03本课件文本框内容可编辑,单击文本框即可进行修改和编辑便捷操作04由于WPS软件原因,少量电脑可能存在理科公式无动画的问题,请您安装Office
2016或以上版本即可解决该问题软件更新[学习要求]
1.会列频率分布表、画频率分布直方图、频率分布折线
图,体会它们各自的特点.
2.会计算数据标准差.
3.能根据实际问题的
需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、
标准差),并作出合理的解释.
4.会用样本的频率分布估计总体分布,
会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率
分布和数字特征的随机性.
5.会用随机抽样的基本方法和样本估计总体
的思想,解决一些简单的实际问题;能通过对数据的分析为合理的决策
提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异.必备知识自主梳理内容索引关键能力重点探究课时作业巩固提升必备知识自主梳理
[知识梳理]知识点一
频率分布直方图
作频率分布直方图的步骤(1)求极差(即一组数据中
与
的差);(2)决定
与
;(3)将数据
;(4)列
;(5)画
.最大值最小值组距组数分组频率分布表频率分布直方图知识点二
样本的数字特征1.众数、中位数、平均数、百分位数(1)众数:一组数据中重复出现次数
的数.(2)中位数:把一组数据按
的顺序排列,处在
位置
的一个数据(或两个数据的平均数).
(4)百分位数:一般地,一组数据的第
p
百分位数是这样一个值,它使这
组数据中至少有
的数据小于或等于这个值,且至少有
的数据大于或等于这个值.最多从小到大中间
p
%
(100-
p
)%
2.四分位数第25百分位数,第50百分位数(中位数),第75百分位数,这三个分位数
把一组由小到大排列后的数据分成四等份,因此称为四分位数,其中第
25百分位数也称第一四分位数或下四分位数,第75百分位数也称第三四
分位数或上四分位数.
4.总体平均数、样本平均数、方差
[小题诊断]1.若数据
x
1,
x
2,···,
x
9的方差为2,则数据2
x
1,2
x
2,···,2
x
9的方
差为(
D
)A.2B.4C.6D.8根据方差的性质可知,数据
x
1,
x
2,···,
x
9的方差
s
2=2,那么数据2
x
1,2
x
2,···,2
x
9的方差为22
s
2=8.D2.某射击运动员7次的训练成绩分别为86,88,90,89,88,87,85,
则这7次成绩的第80百分位数(
B
)A.88.5B.89C.91D.89.57次的训练成绩从小到大排列为85,86,87,88,88,89,90,7×80%=5.6,所以第80百分位数为从小到大排列的数据中的第6个数
据,即89.B3.一组数据的平均数是28,方差是4,若将这组数据的每一个数据都加
上20,得到一组新数据,则所得新数据的平均数是
,方差
是
.48
4
设该组数据为
x
1,
x
2,···,
xn
,
4.某校体育节10名旗手的身高(单位:cm)分别为175,178,176,180,
179,175,176,179,180,179,则中位数为
.把10名旗手的身高从小到大排列为175,175,176,176,178,179,
179,179,180,180,
178.5
关键能力重点探究
考点一
频率分布直方图
随着新课程改革和高考综合改革的实施,高中教学以发展学生学科核心素养为导向,学习评价更关注学科核心素养的形成和发展.为此,某市于2022年举行第一届高中数学学科素养竞赛,竞赛结束后,为了评估该市高中学生的数学学科素养,从所有参赛学生中随机抽取1000名学生的成绩(单位:分)作为样本进行估计,将抽取的成绩整理后分成五组,依次记为[50,60),[60,70),[70,80),[80,90),[90,100],并绘制成如图所示的频率分布直方图.例1(1)请补全频率分布直方图,并估计这1000名学生成绩的平均数(同一组
数据用该组区间的中点值作代表);[解]
(1)成绩在[60,70)的频率为1-(0.30+0.15+0.10+0.05)=0.40,
补全的频率分布直方图如图.
(2)该市决定对本次竞赛成绩排在前180名的学生给予表彰,授予“数学学科素养优秀标兵”称号,一名学生本次竞赛成绩为79分,请你判断该学生能否被授予“数学学科素养优秀标兵”称号.
方法总结2.频率分布直方图与众数、中位数与平均数的关系(1)最高的小长方形底边中点的横坐标即是众数的估计值;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个
小长方形的面积乘小长方形底边中点的横坐标之和.方法总结跟踪训练1.(2024·深圳模拟)某市卫健委为了解社区服务志愿者的服务时长(单
位:小时),对参加过社区服务的志愿者随机抽样调查,将样本中个体
的服务时长进行整理,得到如图所示的频率分布直方图.据此估计,7.2
万名参加过社区服务的志愿者中服务时长超过32小时的约有(
A
)A.3.3万人B.3.4万人C.3.8万人D.3.9万人A依题意样本中服务时长超过32小时的个体频率为1-4×(0.005+0.04+
0.09)=0.46.由样本估计总体,可得总体中服务时长超过32小时的个体数
为7.2×0.46=3.312≈3.3(万人).考点二
总体百分位数的估计◉角度(一)
离散型抽查30袋洗衣粉,测量它们的净重如下(单位:g)例2482
485
485
508
508
509
497
497
498499
500
485
486
488
490
501
502
505490
491
492
493
495
495
495
496
500506
508
509估计第25,75百分位数分别是
,
.490
502
482
485
485
485
486
488
490
490
491
492
493
495
495
495
496
497
497
498
499
500
500
501
502
505
506
508
508
508
509
509由25%×30=7.5,75%×30=22.5,可知样本数据的第25,75百分位数分别为第8,23项数据,所以估计30
袋洗衣粉第25,75百分位数分别为490,502.把30个数据从小到大排列为方法总结◉角度(二)
连续型
为了解学生在课外读物方面的支出情况,抽取了100个同学进行调查,结果显示这些同学的支出都在[10,50](单位:元),其中支出在[30,50](单位:元)的同学有67人,其频率分布直方图如图所示,估计学生课外读物支出的样本数据的第65百分位数.例3[解]
由频率分布直方图可得支出在[40,50]的频率为1-(0.01+0.023+
0.037)×10=0.3,
频率分布直方图中的百分位数,根据频率计算.方法总结跟踪训练2.(2024·江苏南通模拟)“双减”政策实施后,学生的课外阅读增多.某
班50名学生到图书馆借书数量统计如下:借书数量(单位:本)5678910频数(单位:人)58131194则这50名学生的借书数量的第75百分位数是(
C
)CA.8B.8.5C.9D.10由50×75%=37.5,故第75百分位数在借书数量从小到大排序后的第38
人,又5+8+13+11=37<38<5+8+13+11+9=46,故第75百分位
数是9.
(1)根据频率分布直方图估计分数的样本数据的第70百分位数;
(2)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男
女生人数相等.试估计总体中女生的人数.
考点三
样本的数字特征
(2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:例4旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5
利用样本的数字特征解决优化决策问题
平均数反映了数据取值的平均水平;标准差、方差描述了一组数
据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,
越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.方法总结跟踪训练4.(多选)(2021·新高考Ⅰ卷)有一组样本数据
x
1,
x
2,···,
xn
,由这组数据
得到新样本数据
y
1,
y
2,···,
yn
,其中
yi
=
xi
+
c
(
i
=1,2,···,
n
),
c
为非零常数,则(
CD
)A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同CD
B项,因为
yi
=
xi
+
c
(
i
=1,2,···,
n
),所以
y
1,
y
2,···,
yn
的中位
数是
x
1,
x
2,···,
xn
的中位数加
c
,所以B选项错误.
所以两组数据的方差相同,从而这两组数据的标准差相同,所以C选项
正确.D项,设
x
1<
x
2<···<
xn
,则第一组数据的极差为
xn
-
x
1,设
y
1<
y
2<···<
yn
,则第二组数据的极差为
yn
-
y
1=(
xn
+
c
)-(
x
1+
c
)
=
xn
-
x
1,所以这两组数据的极差相同,所以D选项正确.◉角度(一)
扇形图教材延展其他常见统计图表
(多选)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼状图:例1则下面结论中正确的是(
BCD
)BCDA.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一
半设新农村建设前经济收入为
a
,则新农村建设后种植收入37%×2
a
=0.74
a
,新农村建设前种植收入为60%×
a
=0.6
a
<0.74
a
,种植收入增加,A错误;其他收入建设后为5%×2
a
=0.1
a
,建设前为4%×
a
=0.04
a
,增加了一倍以上,B正确;养殖收入建设前为0.3
a
,建设后为0.3×2
a
=0.6
a
,养殖收入增加了一
倍,C正确;新农村建设后,养殖收入与第三产业收入的总和占总收入的比例为30%
+28%=58%>0.5,超过经济收入的一半,D正确.通过扇形统计图可以很清楚地表示出各部分数量同总数之间的关
系,明确各部分数量占总数的比例.方法总结◉角度(二)
折线图
(多选)机器人是一种能够半自主或全自主工作的智能机器,它具有感知、决策、执行等基本特征,可以辅助甚至替代人类完成危险、繁重、复杂的工作,提高工作效率与质量,服务人类生活,扩大或延伸人的活动及能力范围.为了研究A,B两专卖店的机器人销售状况,统计了2023年2月至7月A,B两店每月的营业额(单位:万元),得到如图的折线图,则下列说法正确的是(
ABD
)例
2A.根据A店的营业额折线图可知,该店营业额的平均值在[34,35]内B.根据B店的营业额折线图可知,其营业额总体呈上升趋势C.根据A,B两店营业额的折线图,可得A店的营业额极差比B店大D.根据A,B两店营业额的折线图,可得B店7月份的营业额比A店多答案:ABD
折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因
此非常适用于显示在相等时间间隔下数据的趋势.方法总结◉角度(三)
条形图
(多选)某调查机构对某地快递行业从业者进行调查统计,得
到快递行业从业人员年龄分布饼状图(图1)、“90后”从事快递行业岗位
分布条形图(图2),则下列结论中正确的是(
ABC
)例3A.快递行业从业人员中,“90后”占一半以上B.快递行业从业人员中,从事技术岗位的“90后”的人数超过总人数的
20%C.快递行业从业人员中,从事运营岗位的“90后”的人数比“80前”的
多D.快递行业从业人员中,从事技术岗位的“90后”的人数比“80后”的
多答案:ABC由题图可知,快递行业从业人员中,“90后”占总人数的56%,超
过一半,A正确;快递行业从业人员中,从事技术岗位的“90后”
的人数占总人数的百分比为56%×39.6%=22.176%,超过20%,
所以快递行业从业人员中,从事技术岗位的“90”后的人数超过总
人数的20%,B正确;快递行业从业人员中,从事运营岗位的“90后”的人数占总人数的百分比为56%×17%=9.52%,超过“80前”的人数占总人数的百分比,C正确;快递行业从业人员中,从事技术岗位的“90后”的人数占总人数的百分比为22.176%,小于“80后”的人数占总人数的百分比,但“80后”从事技术岗位的人数占“80后”人数的比未知,D不一定正确.
条形图中注意条形图的“高度”代表的意义是占“百分比”还是
具体量.方法总结跟踪训练1.已知某市某居民小区户主人数和户主对户型结构的满意率分别如图1
和图2所示,为了解该小区户主对户型结构的满意程度,用分层随机抽
样的方法抽取30%的户主进行调查,则样本量和抽取的户主对四居室满
意的人数分别为(
A
)A.240,18B.200,20C.240,20D.200,18A样本量
n
=(250+150+400)×30%=240,抽取的户主对四居室满意的
人数为150×30%×40%=18.2.某网站为了了解某“跑团”每月跑步的平均里程,收集并整理了2023
年1月至2023年11月期间该“跑团”每月跑步的平均里程(单位:公里)的
数据,绘制了下面的折线图.根据折线图,下列结论正确的是(
D
)A.月跑步平均里程的中位数为6月份对应的里程数B.月跑步平均里程逐月增加C.月跑步平均里程高峰期大致在8,9月份D.1月至5月的月跑步平均里程相对于6月至11月波动性更小,变化比较平稳D由折线图可知月跑步平均里程比6月份高的只有9,10,11,共3个月,
比6月份低的有1,2,3,4,5,7,8,共7个月,故6月份对应里程数不
是中位数,因此A不正确;月跑步平均里程在1月到2月,6月到7月,7月到8月,10月到11月都是减
少的,故不是逐月增加,因此B不正确;月跑步平均里程高峰期大致在9,10,11三个月,8月份是相对较低的,
因此C不正确;从折线图来看,1月至5月的跑步平均里程相对于6月至11月,波动性更
小,变化比较平稳,因此D正确.3.(2024·四川成都模拟)如图是某超市一年中各月份的收入与支出(单
位:万元)情况的条形统计图.已知利润为收入与支出的差,即利润=收
入-支出.则下列说法正确的是(
D
)A.利润最高的月份是2月份,且2月份的利润为40万元B.利润最低的月份是5月份,且5月份的利润为10万元C.收入最少的月份的利润也最少D.收入最少的月份的支出也最少D在A中,利润最高的月份是3月份和10月份,且2月份的利润为40-30=
10万元,故A错误;在B中,利润最低的月份是8月份,且8月份的利润
为5万元,故B错误;在C中,收入最少的月份是5月份,但5月份的支出
也最少,故5月份的利润不是最少,故C错误,D正确.课时作业巩固提升
[A组
基础保分练]1.10名工人某天生产同一种零件,生产的件数分别是15,17,14,10,
15,19,17,16,14,12,那么数据的第80百分位数是(
D
)A.14B.15C.16D.17将10名工人某天生产同一种零件个数从小到大排列为10,12,14,14,
15,15,16,17,17,19.因为80%×10=8,所以样本数据的第80百分
位数为第8项和第9项数据的平均数,即17.D12345678910111213141516172.某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数
据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分
的人数是15,则该班的学生人数是(
B
)A.45B.50C.55D.60由频率分布直方图知,低于60分的频率为(0.010+0.005)×20=0.3,
B1234567891011121314151617
A12345678910111213141516174.已知一组数据按从小到大排列为0,4,5,
x
,8,10,12,15,且这
组数据的中位数是7,则下列选项中错误的是(
D
)A.
x
=6B.该数据的平均数为7.5C.该数据的第25百分位数是4.5D.该数据的第25百分位数是6D1234567891011121314151617
因为该组数据有8个数,所以8×25%=2,
12345678910111213141516175.“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意
程度的指标,常用区间[0,10]内的一个数来表示,该数越接近10表示满
意度越高.现随机抽取10位某市居民进行街头调查,得到他们的幸福感
指数为3,4,5,5,6,7,7,8,9,10,则这组数据的第80百分位数
是(
C
)A.7.5B.8C.8.5D.9数据3,4,5,5,6,7,7,8,9,10,共10个,且10×80%=8,所以
第80百分位数是8.5.C12345678910111213141516176.某校进行了一次创新作文大赛,共有100名同学参赛,经过评判,这
100名参赛者的得分都在[40,90]之间,其得分的频率分布直方图如图,
则下列结论错误的是(
D
)A.得分在[40,60)之间的共有40人B.从这100名参赛者中随机选取1人,其得分在[60,80)的概率为0.5C.估计得分的众数为55D.这100名参赛者得分的中位数为65D1234567891011121314151617
12345678910111213141516177.(多选)某高中为了解学生课外知识的积累情况,随机抽取200名同学参
加课外知识测试,测试共5道题,每答对一题得20分,答错得0分.已知
每名同学至少能答对2道题,得分不少于60分记为及格,不少于80分记
为优秀,测试成绩百分比分布图如图所示,则下列说法错误的是
(
ABD
)ABDA.该次课外知识测试及格率为90%B.该次课外知识测试得满分的同学有30名C.该次测试成绩的中位数大于测试成绩的平均数D.若该校共有3000名学生,则课外知识测试成绩能得
优秀的同学大约有1440名1234567891011121314151617由图知,及格率为1-8%=92%,故A错误;该测试得满分的同学百分
比为1-8%-32%-48%=12%,即样本中有12%×200=24(名)同学得
满分,但总体学生数未知,故B错误;由图知,中位数为80分,平均数
为40×8%+60×32%+80×48%+100×12%=72.8(分),故C正确;由
题意,3000名学生成绩能得优秀的同学大约有3000×(48%+12%)=1800(名),故D错误.12345678910111213141516178.(多选)某学校为了调查学生在一周生活方面的支出情况,抽出了一个
样本量为
n
的样本,其频率分布直方图如图所示,其中支出在[50,60)
元的学生有60人,则下列说法正确的是(
BC
)A.样本中支出在[50,60)元的频率为0.03B.样本中支出不少于40元的人数为132C.
n
的值为200D.若该校有2000名学生,则一定有600人的支出在[50,60)元BC1234567891011121314151617在A中,样本中支出在[50,60)元的频率为1-(0.010+0.024+
0.036)×10=0.3,故A错误;
1234567891011121314151617在B中,样本中支出不少于40元的人数为200×(0.030+0.036)×10=
132,故B正确;在D中,若该校有2000名学生,则可能有600人的支出在[50,60)元,故
D错误.12345678910111213141516179.小玲家的鱼塘里养了2500条鲢鱼,按经验,鲢鱼的成活率约为80%.
现准备打捞出售,为了估计鱼塘中鲢鱼的总质量,从鱼塘中捕捞了3次
进行统计,得到的数据如下表:鱼的条数平均每条鱼的质量/kg第一次捕捞201.6第二次捕捞102.2第三次捕捞101.8那么,鱼塘中鲢鱼的总质量约是
kg.
3600
123456789101112131415161710.(2024·江苏镇江模拟)数据:1,2,2,3,4,5,6,6,7,8,其中
位数为
m
,第60百分位数为
a
,则
m
+
a
=
.
10
123456789101112131415161711.在一个容量为5的样本中,数据均为整数,已测出其平均数为10,但
墨水污损了两个数据,其中一个数据的十位数字1未被污损,即9,10,
11,1■,■,那么这组数据的方差
s
2可能的最大值是
.
32.8
123456789101112131415161712.现有某地一年四个季度的GDP(亿元),第一季度GDP为232(亿元),
第四季度GDP为241(亿元),四个季度的GDP逐季度增长,且中位数与平
均数相同,则该地一年的GDP为
.设第二季度GDP为
x
亿元,第三季度GDP为
y
亿元,则232<
x
<
y
<241,∵中位数与平均数相同,
∴
x
+
y
=473,∴该地一年的GDP为232+
x
+
y
+241=946(亿元).946(亿元)
1234567891011121314151617[B组
能力提升练]13.(多选)某公司为了解用户对其产品的满意度,从甲、乙两地区分别随
机调查了100个用户,根据用户对产品的满意度评分,分别得到甲地区
和乙地区用户满意度评分的频率分布直方图,如图所示.若甲地区和乙
地区用户满意度评分的中位数分别为
m
1,
m
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论