版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二节用样本估计总体【课程标准】1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.2.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.3.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.4.结合实例,能用样本估计总体的取值规律.5.结合实例,能用样本估计百分位数,理解百分位数的统计含义.【考情分析】考点考法:高考命题常以频率分布直方图为载体,考查用样本数据估计总体数字特征;数据的众数、中位数、平均数、方差、百分位数是高考热点,常以选择题或解答题的形式出现.核心素养:数学抽象、数学运算、数据分析【必备知识·逐点夯实】【知识梳理·归纳】1.总体取值规律的估计(1)常见的统计图表有条形图、扇形图、折线图、频率分布直方图等.(2)作频率分布直方图的步骤①求极差;②决定组距与组数;③将数据分组;④列频率分布表;⑤画频率分布直方图.2.第p百分位数一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100p)%的数据大于或等于这个值.【微点拨】第25百分位数,第50百分位数,第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数.3.总体集中趋势的估计(1)平均数、中位数和众数的应用数值型数据(如用水量、身高、收入、产量等)集中趋势多用平均数、中位数描述;分类型数据(如校服规格、性别、产品质量等级等)集中趋势多用众数描述.(2)平均数、中位数、众数的求法数字特征样本数据频率分布直方图众数出现次数最多的数据取最高的小长方形底边中点的横坐标中位数将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)划分频率分布直方图为左右两个面积相等的分界线与x轴交点的横坐标平均数样本数据的算术平均数每个小矩形的面积乘以小矩形底边中点的横坐标之和4.总体离散程度的估计(1)方差、标准差的定义:假设一组数据为x1,x2,…,xn,其平均数为x,则方差:s2=或;标准差:s=s2.(2)总体(样本)方差①一般式:如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为Y,则总体方差S2=.②加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=.【基础小题·自测】类型辨析改编易错题号12,341.(多维辨析)(多选题)下列结论正确的为 ()A.对一组数据来说,平均数和中位数总是非常接近B.方差与标准差具有相同的单位C.如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变D.在频率分布直方图中,最高的小矩形底边中点的横坐标是众数【解析】选CD.因为一组数据如果出现极端值,其平均数与中位数不会接近,例如:1000,0,0,0,0,所以选项A错误;因为标准差是方差的算术平方根,其单位不一样,所以选项B错误;因为一组数中每个数减去同一个非零常数,则这组数的平均数改变,每个数与平均数的差值不变,所以方差不变,所以选项C正确;因为在频率分布直方图中,最高的小矩形底边中点的横坐标为众数,所以选项D正确.2.(必修第二册P215练习T2)若数据x1,x2,…,x9的方差为2,则数据2x1,2x2,…,2x9的方差为 ()A.2 B.4 C.6 D.8【解析】选D.根据方差的性质可知,数据x1,x2,…,x9的方差s2=2,那么数据2x1,2x2,…,2x9的方差为22s2=8.3.(必修第二册P203例2)某射击运动员7次的训练成绩分别为86,88,90,89,88,87,85,则这7次成绩的第80百分位数为 ()A.88.5 B.89 C.91 D.89.5【解析】选B.7次的训练成绩从小到大排列为85,86,87,88,88,89,90,7×80%=5.6,所以第80百分位数为从小到大排列的数据中的第6个数据,即89.4.(统计图识别错误)某中学初中部共有120名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为__________.
【解析】因为初中部女教师占70%,高中部女教师占40%,所以该校女教师的人数为120×0.7+150×0.4=84+60=144.答案:144【核心考点·分类突破】考点一统计图表的识别[例1](多选题)新式茶饮是指以上等茶叶通过萃取浓缩液,再根据消费者偏好,添加牛奶、坚果、柠檬等小料调制而成的饮料.如图为我国2022年消费者购买新式茶饮的频次扇形图及月均消费新式茶饮金额的条形图.根据所给统计图,下列结论中正确的是 ()A.每周都消费新式茶饮的消费者占比不到90%B.每天都消费新式茶饮的消费者占比超过20%C.月均消费新式茶饮50~200元的消费者占比超过50%D.月均消费新式茶饮超过100元的消费者占比超过60%【解析】选BC.每周都消费新式茶饮的消费者占比19.1%>90%,A错误;每天都消费新式茶饮的消费者占比5.4%+16.4%>20%,B正确;月均消费新式茶饮50~200元的消费者占比30.5%+25.6%>50%,C正确;月均消费新式茶饮超过100元的消费者占比114.5%30.5%<60%,D错误.【解题技法】统计图表的主要应用(1)扇形图:直观描述各类数据占总数的比例;(2)折线图:描述数据随时间的变化趋势;(3)条形图和直方图:直观描述不同类别或分组数据的频数和频率.【对点训练】1.已知某地区中小学生的人数比例和近视情况分别如图甲和图乙所示,为了了解该地区中小学生的近视形成原因,用比例分配的分层随机抽样的方法随机抽取1%的学生进行调查,其中被抽取的小学生有80人,则样本量和该地区的高中生近视人数分别为 ()A.200,25 B.200,2500C.8000,25 D.8000,2500【解析】选B.由扇形分布图并结合比例分配的分层随机抽样知识易知样本量为8040%=200,则样本中高中生的人数为200×25%=50,易知该地区高中生人数为5000,结合近视率条形图得该地区高中生近视的人数为5000×50%=2500.2.走路是“最简单、最优良的锻炼方式”,它不仅可以帮助减肥,还可以增强心肺功能、血管弹性、肌肉力量等.如图为甲、乙两名同学在同一星期内日步数的折线统计图,则下列结论中不正确的是 ()A.这一星期内甲的日步数的中位数为11600B.这一星期内甲的日步数的均值大于乙C.这一星期内甲的日步数的方差大于乙D.这一星期内乙的日步数的30%分位数是7030【解析】选D.对于A,这一星期内甲的日步数从小到大为2435,7965,9500,11600,12700,16000,16800,所以中位数为11600,选项A正确;对于B,计算甲的平均数为x甲=1716800)=11000,乙的平均数为x乙=17×(14200+12300+7030+12970+5340+11600+10060)=10500,所以甲的日步数的均值大于乙,选项B对于C,甲有极端值,对方差的影响大,所以甲的日步数的方差大于乙,选项C正确;对于D,因为7×30%=2.1,所以乙的日步数的30%分位数是从小到大的第3个数,为10060,选项D错误.【加练备选】(2023·丽水模拟)某校高一年级1000名学生的血型统计情况如图所示.某课外兴趣小组为了研究血型与饮食之间的关系,决定采用比例分配的分层随机抽样的方法从中抽取一个容量为100的样本,则从高一年级A型血的学生中应抽取的人数是 ()A.11 B.22 C.110 D.220【解析】选B.由题图中数据可知高一年级A型血的学生人数占高一年级学生总人数的22%,所以抽取一个容量为100的样本,从A型血的学生中应抽取的人数是100×22%=22.考点二离散型数据的数字特征[例2](多选题)为宣传杭州亚运精神,红星实验学校组织了甲、乙两个社团,利用一周的时间对外进行宣传,将每天宣传的次数绘制成如图所示的频数分布折线图,则 ()A.甲社团宣传次数的众数小于乙社团宣传次数的众数B.甲社团宣传次数的极差大于乙社团宣传次数的极差C.甲社团宣传次数的平均数大于乙社团宣传次数的平均数D.甲社团宣传次数的方差大于乙社团宣传次数的方差【解析】选ABD.观察甲、乙社团每天宣传次数的频数分布折线图,甲社团宣传次数的众数、乙社团宣传次数的众数分别为2,3,A正确;甲社团宣传次数的极差、乙社团宣传次数的极差分别为3,2,B正确;甲社团宣传次数的平均数x1=2+2+3+2+5+4+37=3,乙社团宣传次数的平均数x2=2+2+3+4+3+3+4甲社团宣传次数的方差s12=17×[3×(23)2+2×(33)2+(53)2+(43)2乙社团宣传次数的方差s22=17×[2×(23)2+3×(33)2+2×(43)2]=4【解题技法】样本数字特征的求法(1)众数是样本数据中出现次数最多的数据.(2)将样本数据按大小顺序排列,处在最中间位置的一个数据(或最中间两个数据的均值)即为中位数.(3)平均数是样本数据的算术平均数.(4)极差是样本数据中最大值与最小值的差.【对点训练】1.从某中学抽取10名同学,他们的数学成绩如下:82,85,88,90,92,92,92,96,96,98(单位:分),则这10名同学数学成绩的众数、第25百分位数分别为()A.92,85 B.92,88 C.95,88 D.96,85【解析】选B.数据92出现了3次,出现的次数最多,所以众数是92;这组数据已经按照由小到大的顺序排列,10×25%=2.5,取第三个数,所以第25百分位数是88.2.(多选题)(2023·哈尔滨模拟)下面是某城市某日在不同观测点对细颗粒物(PM2.5)的观测值:396275268225168166176173188168141157若在此组数据中增加一个比现有的最大值大25的数据,下列数字特征发生改变的是 ()A.极差 B.中位数 C.众数 D.平均数【解析】选ABD.根据题意,若在此组数据中增加一个比现有的最大值大25的数据,即最大值变为396+25=421,极差为最大值与最小值的差,发生改变;加入数据前,中位数为12×(173+176)=174.5,加入数据后,中位数为176,发生改变众数为数据中出现次数最多的数,不会改变;若加入数据前,平均数为x,加入数据后,平均数为12x+42113>x【加练备选】某中学高一年级8名学生某次考试的数学成绩(满分150分)分别为85,90,93,99,101,103,116,130,则这8名学生数学成绩的第75百分位数为 ()A.102 B.103 C.109.5 D.116【解析】选C.这组数据已经按照由小到大的顺序排列,8×75%=6,则这8名学生数学成绩的第75百分位数为第6个数与第7个数的平均数,即为103+1162=109.5考点三频率分布直方图的数字特征[例3](多选题)在某次单元测试中,4000名考生的考试成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中正确的有 ()A.成绩在[70,80)分的考生人数最多B.考生考试成绩的第80百分位数为83.3C.考生考试成绩的平均分约为70.5分D.考生考试成绩的中位数为75分【解析】选ABC.根据题图得,成绩出现在[70,80)的频率最大,故A正确;考生考试成绩的第80百分位数为80+0.050.15×10≈83.根据频率分布直方图估计考试的平均分为45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5,故C正确;0.1+0.15+0.2=0.45<0.5,0.1+0.15+0.2+0.3=0.75>0.5,所以考生考试成绩的中位数为70+0.5-0.450【解题技法】频率分布直方图中的数字特征(1)众数:最高矩形的底边中点的横坐标.(2)中位数:中位数左边和右边的矩形的面积和应该相等.(3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.(4)第p百分位数:①确定第p百分位数所在的区间[a,b],②确定小于a和小于b的数据所占的百分比fa%,fb%,则第p百分位数为a+p%-fa%f【对点训练】治理沙漠化离不开优质的树苗,现从苗圃中随机地抽测了200株树苗的高度(单位:cm),得到如图所示的频率分布直方图.(1)求直方图中a的值及众数、中位数;(2)若树苗高度在185cm及以上是可以移栽的合格树苗.从样本中用比例分配的分层随机抽样方法抽取20株树苗作进一步研究,不合格树苗、合格树苗分别应抽取多少株?【解析】(1)因为(0.0015+0.0110+0.0225+0.0300+a+0.0080+0.0020)×10=1,所以a=0.0250,众数为185+1952=190,设中位数为x,因为(0.0015+0.0110+0.0.35<0.5,(0.0015+0.0110+0.0225+0.0300)×10=0.65>0.5,则185<x<195,0.35+0.0300×(x185)=0.5,所以x=190.故a=0.0250,众数为190,中位数为190.(2)由题意可知,合格树苗所占频率为(0.0300+0.0250+0.0080+0.0020)×10=0.65,不合格树苗所占频率为10.65=0.35,所以不合格树苗抽取20×0.35=7(株),合格树苗抽取20×0.65=13(株),故不合格树苗、合格树苗应分别抽取7株和13株.【加练备选】某校为了解学生学习的效果,进行了一次摸底考试,从中选取60名学生的成绩,分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组后,得到不完整的频率分布直方图如图所示,观察图形,回答下列问题:(1)求分数在区间[70,80)内的频率,并补全这个频率分布直方图;(2)根据评奖规则,排名在前10%的学生可以获奖,请你估计获奖的学生至少需要多少分.【解析】(1)设分数在[70,80)内的频率为x,根据频率分布直方图,可得(0.01+0.015+0.02+0.025+0.005)×10+x=1,解得x=0.25,所以分数在[70,80)内的频率为0.25,补全这个频率分布直方图,如图所示.(2)因为分数在区间[80,90)内的频率为0.25,在区间[90,100]内的频率为0.05,而0.05<10%<0.25+0.05,所以设排名前10%的分界点为90a,则0.025a+0.005×10=10%,解得a=2,所以排名前10%的分界点为88分,即获奖的学生至少需要88分.考点四总体离散趋势的估计[例4](2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如表:旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x和y,样本方差分别记为s12和(1)求x,y,s12,(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果yx≥2s12+s22【解析】(1)由题表中的数据可得,x=110×(9.8+10.3+10.0+10.2+9.9+9.8+10.0+10.1+10.2+9.7)=10.y=110×(10.1+10.4+10.1+10.0+10.1+10.3+10.6+10.5+10.4+10.5)=10.s12=110×[(9.710.0)2+2×(9.810.0)2+(9.910.0)2+2×(10.010.0)2+(10.110.2×(10.210.0)2+(10.310.0)2]=0.036,s22=110×[(10.010.3)2+3×(10.110.3)2+(10.310.3)2+2×(10.410.3)2+2×(10.510+(10.610.3)2]=0.04.(2)由(1)中数据得yx=0.3,2s12+显然yx>2s12+【解题技法】计算方差、标准差的步骤(1)求出样本数据的平均数x;(2)计算每个样本数据与样本平均数的差xix(i=1,2,…,n),并求对应的平方值;(3)求出上述n个平方值的平均数,即为样本方差;求出上述n个平方值平均数的算术平方根,即为样本标准差.【对点训练】1.(2023·成都模拟)一次数学考试后,某班级平均分为110分,方差为s12.现发现有两名同学的成绩计算有误,甲同学成绩被误判为113分,实际得分为118分;乙同学成绩误判为120分,实际得分为115分.更正后重新计算,得到方差为s22,则s12A.s12=s22 B.s12>s22【解析】选B.设班级人数为n,因为113+120=118+115,所以更正前后平均分不变,且(113110)2+(120110)2>(118110)2+
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 1.四冲程内燃机-机械原理课程设计任务及说明
- 劳动之于生活模板
- 《斗拱介绍婴幼儿版》课件
- 《走进心理健康教育》课件
- 《湖南省课程》课件
- 社区2019年初工作计划
- 合肥市庭院施工方案
- 县教育局201年政务公开工作计划
- 二年级上期语文教学工作计划范本
- 年度营业员工作计划模板
- YY/T 0251-1997微量青霉素试验方法
- YC/T 559-2018烟草特征性成分生物碱的测定气相色谱-质谱联用法和气相色谱-串联质谱法
- 齐鲁工业大学信息管理学成考复习资料
- 公务员面试-自我认知与职位匹配课件
- 中频电治疗仪操作培训课件
- 三度房室传导阻滞护理查房课件
- 讲课比赛精品PPT-全概率公式贝叶斯公式-概率论与数理统计
- 药理学39人工合成抗菌药课件
- 2021-2022学年北京市海淀区八年级(上)期末数学试卷及答案解析
- ping程序的设计及实现报告
- 2022版义务教育数学课程标准解读课件PPT模板
评论
0/150
提交评论