高中数学《高中全程学习方略》2025版必修第二册第九章 9.2 9.2.3 总体集中趋势的估计含答案_第1页
高中数学《高中全程学习方略》2025版必修第二册第九章 9.2 9.2.3 总体集中趋势的估计含答案_第2页
高中数学《高中全程学习方略》2025版必修第二册第九章 9.2 9.2.3 总体集中趋势的估计含答案_第3页
高中数学《高中全程学习方略》2025版必修第二册第九章 9.2 9.2.3 总体集中趋势的估计含答案_第4页
高中数学《高中全程学习方略》2025版必修第二册第九章 9.2 9.2.3 总体集中趋势的估计含答案_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高中数学《高中全程学习方略》2025版必修第二册第九章9.29.2.3总体集中趋势的估计含答案9.2.3总体集中趋势的估计【学习目标】1.会求样本数据的众数、中位数、平均数.2.理解用样本的数字特征、频率分布直方图估计总体的集中趋势.【素养达成】数据分析数据分析、数学运算一、众数、中位数、平均数的定义1.众数:一组数据中出现次数最多的数.2.中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的数(或中间两个数的平均数)叫做这组数据的中位数.3.平均数:如果有n个数x1,x2,…,xn,那么x=1n(x1+x2+…+xn)叫做这n个数的平均数【版本交融】(人BP66尝试与发现)中位数是否能比较全面地体现数据的分布特点?如果不能,有什么补救的办法?提示:当数据个数较多时中位数是不足以体现数据的分布特征,此时可以借助多个百分位数了解数据的分布特征.【教材挖掘】(P205)中位数一定是样本数据中的一个数吗?提示:不一定.一组数据按大小顺序排列后,如果有奇数个数据,处于中间位置的数是中位数;如果有偶数个数据,则中间两个数据的平均数是中位数.【教材深化】众数、中位数和平均数的比较名称优点缺点平均数与中位数相比,平均数反映出样本数据中更多的信息,对样本中的极端值更加敏感任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大中位数不受少数几个极端数据(即排序靠前或靠后的数据)的影响对极端值不敏感众数体现了样本数据的最大集中点众数只能传递数据中的信息的很少一部分,对极端值不敏感二、众数、平均数、中位数与频率分布直方图的关系1.平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.2.中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.3.众数:众数是最高小矩形底边的中点所对应的数据.【思考】频率分布直方图中计算出的众数、中位数、平均数是精确值吗?提示:不是.三、总体集中趋势的估计1.平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.2.单峰频率分布直方图的平均数与中位数形状关系对称平均数与中位数差不多右边“拖尾”平均数大于中位数左边“拖尾”平均数小于中位数平均数总是在“长尾巴”那边3.对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.【明辨是非】(正确的打“√”,错误的打“×”)(1)平均数与每一个数据都有关,受极端值的影响.(√)提示:根据平均数的计算公式可知正确.(2)若直方图单峰且形状对称,则平均数与中位数基本一致.(√)提示:根据直方图的对称性可知,平均数与中位数可能一致.(3)一组数据的众数只有一个.(×)提示:一组数据的众数可能有一个,也可能有多个,中位数只有一个.类型一根据样本数据求众数、中位数、平均数(数学运算)【典例1】(1)(2024·洛阳高一检测)一组数据a,5,6,7,7,8,11,12的平均数为8,则这组数据的中位数为()A.6.5 B.7 C.7.5 D.8【解析】选C.由题意得a+5+6+7+7+8+11+128=8,解得a=8.将题中数据按从小到大的顺序排列为5,6,7,7,8,8,11,12,则中位数为7+82=7(2)(2024·淄博高一检测)已知一组数据为5,2,x,5,8,9,且5<x<8.若该组数据的众数是中位数的56,则该组数据的平均数为(A.6 B.6.5 C.7 D.7.5【解析】选A.因为5<x<8,所以这组数据按从小到大的顺序排列为2,5,5,x,8,9,则该组数据的众数是5.又该组数据的众数是中位数的56,所以中位数是6,即5+x2=6,解得x=7,则该组数据的平均数为【备选例题】1.(多选)PM2.5是衡量空气质量的重要指标.如图是某地9月1日到10日的PM2.5日均值(单位:μg/m3)的折线图,则下列说法正确的是()A.这10天中PM2.5日均值的众数为33B.这10天中PM2.5日均值的中位数是32C.这10天中PM2.5日均值的中位数大于平均数D.这10天中PM2.5日均值前4天的平均数大于后4天的平均数【解析】选AB.由题中折线图得,这10天中PM2.5日均值的众数为33,中位数为31+332=32,平均数为110×(36+26+17+23+33+128+42+31+30+33)=39.9,中位数小于平均数,故A,B正确,C错误;前4天的平均数为36+26+17+234=25.5,后4天的平均数为2.(多选)小华所在的年级一班共有50名学生,一次体检测量了全班学生的身高,由此求得该班学生的平均身高是1.65米,而小华的身高是1.66米,则下列说法正确的是()A.1.65米是该班学生身高的平均水平B.班上比小华高的学生人数不会超过25C.这组身高数据的中位数不一定是1.65米D.这组身高数据的众数不一定是1.65米【解析】选ACD.由平均数所反映的意义知A选项正确;由中位数与平均数的关系确定C选项正确;由众数与平均数的关系确定D选项正确;由于平均数受一组数据中的极端值的影响,故B选项错误.【总结升华】平均数、众数、中位数的计算方法(1)平均数一般是根据公式来计算的;(2)计算中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据相关数据的总个数是奇数还是偶数而定;(3)众数是看出现次数最多的数.类型二用频率分布表或直方图求数字特征(数学运算)【典例2】(1)从某企业生产的某种产品中随机抽取10件,测量这些产品的一项质量指标,数据如下:质量指标分组[10,30)[30,50)[50,70)频率0.10.60.3则可估计这批产品的质量指标的众数、中位数分别为()A.60,1303 B.C.40,1303 D.【解析】选C.根据题中数据可知,频率最大对应的分组为[30,50),所以众数约为40.设中位数为x,可知x在[30,50)内,则0.1+x-3050-30×0.6=0.5,解得x(2)(多选)(2024·南通高一检测)《教育部办公厅关于进一步加强中小学生体质健康管理工作的通知》中指出:“各地要加强对学生体质健康重要性的宣传,中小学校要通过体育与健康课程、大课间、课外体育锻炼、体育竞赛、班团队活动、家校协同等多种形式加强教育引导.”某学校共有2000名男生,为了了解这部分学生的身体发育情况,学校抽查了100名男生的体重情况.根据所得数据绘制的频率分布直方图如图所示,则下列结论正确的是()A.估计这100名男生体重的众数为67.5B.估计这100名男生体重的80%分位数为72.5C.估计这100名男生体重的平均数为66D.该校男生中体重低于60kg的学生大约有300人【解析】选ABD.由频率分布直方图可得,估计这100名男生体重的众数为65+702=67.5,A正确由于(0.03+0.05+0.06)×5=0.7<0.8,0.7+0.04×5=0.9>0.8,故80%分位数在[70,75)内,设为x,则0.7+(x-70)×0.04=0.8,解得x=72.5,B正确.估计这100名男生体重的平均数为(57.5×0.03+62.5×0.05+67.5×0.06+72.5×0.04+77.5×0.02)×5=66.75,C错误.该校男生中体重低于60kg的学生大约有2000×0.03×5=300人,D正确.【总结升华】利用频率分布直方图求数字特征的方法(1)众数即为出现次数最多的数,所以它的频率最大,在最高的小矩形中.中位数即为从小到大中间的数(或中间两数的平均数).平均数约为每个小矩形底边中点的横坐标与小矩形面积的乘积之和.(2)用频率分布直方图求得的众数、中位数不一定是样本中的具体数.类型三总体集中趋势的估计(数据分析)【典例3】(教材P206例5改编)据了解,某公司的33名职工月工资(单位:元)如下:职务董事长副董事长董事总经理经理管理员职员人数11215320工资110001000090008000650055004000(1)求该公司职工月工资的平均数、中位数、众数;(2)假设副董事长的工资从10000元提升到20000元,董事长的工资从11000元提升到30000元,那么新的平均数、中位数、众数又是多少?(精确到1元)(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法.【解析】(1)平均数是x=4000+133×(7000+6000+5000×2+4000+2500×5+1500×3+0×20)≈4000+1333=5333(元)中位数是4000元,众数是4000元.(2)新的平均数是x'=4000+133×(26000+16000+5000×2+4000+2500×5+1500×3+0×20)≈4000+2212=6212(元),中位数是4000元,众数是4000元(3)在这个问题中,中位数和众数均能反映该公司员工的工资水平,因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.【总结升华】众数、中位数、平均数的意义(1)样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算、不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.(2)当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大时,可用中位数描述其集中趋势.【即学即练】某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄(单位:岁)如下:甲群13,13,14,15,15,15,15,16,17,17;乙群54,3,4,4,5,5,6,6,6,57.(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?【解析】(1)甲群市民年龄的平均数为13+13+14+15+15+15+15+16+17+1710中位数为15岁,众数为15岁,平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.(2)乙群市民年龄的平均数为54+3+4+4+5+5+6+6+6+5710中位数为5.5岁,众数为6岁.由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.【补偿训练】学校随机调查了部分学生一周平均每天的睡眠时间,统计结果如图,则在这组数据中,这些被调查学生睡眠时间的众数和中位数分别是()A.8,9 B.8,8.5C.16,8.5 D.16,14【解析】选A.众数是一组数据中出现次数最多的数,在这一组数据中8出现的次数最多,故众数是8;而将这组数据按从小到大的顺序排列后,处于中间位置的数是第20,21个数,故这组数据的中位数是9+92=99.2.4总体离散程度的估计【学习目标】1.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差).2.理解离散程度参数的统计含义.【素养达成】数学抽象、数学运算数据分析一、总体离散程度的估计1.方差:给定一组数据x1,x2,…,xn,用x表示这组数据的平均数,则s2=1n∑i=1n(xi-x)2=1n[(x1-x)2+(x2-x)2+…+(xn-x)22.标准差:方差的算术平方根,即1n∑3.总体方差、总体标准差如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为Y,则总体方差为S2=1N∑i=1N(Yi-Y)2如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频率为fi(i=1,2,…,k),则总体方差为S2=1N∑i=1【版本交融】(湘教P243)方差越大表示什么含义?提示:方差刻画的是总体中个体的稳定或波动的程度,方差越大,说明波动越大.【教材挖掘】(P212)数据x1,x2,…,xn的平均数是x,方差为s2,数据x1,x2,…,xn,x的方差为s12,那么s2与提示:因为数据x1,x2,…,xn,x比数据x1,x2,…,xn更加相对集中,所以方差变小了,即s12<s二、分层随机抽样的方差假设第一层有m个数,分别为x1,x2,…,xm,平均数为x,方差为s2;第二层有n个数,分别为y1,y2,…,yn,平均数为y,方差为t2,则x=1m∑i=1mxi,s2=1m∑i=1m(xi-x)2,y=1n∑i=1n若记样本平均数值为a,样本方差为b2,则可以算出a=1m+n(∑i=1mxi+∑i=1nyi)=mx+nym+n,b2=m[s2【教材深化】1.方差的简化计算公式:s2=1n[(x12+x22+…+xn2)-nx2]或写成s2=1n(x2.平均数、方差公式的推广(1)若数据x1,x2,…,xn的平均数为x,那么mx1+a,mx2+a,…,mxn+a的平均数是mx+a.(2)若数据x1,x2,…,xn的方差为s2,那么①数据x1+a,x2+a,…,xn+a的方差也是s2;②数据ax1,ax2,…,axn的方差是a2s2.【明辨是非】(正确的打“√”,错误的打“×”)(1)标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散.(×)提示:标准差越大,表明各个样本数据在样本平均数周围越分散;标准差越小,表明各个样本数据在样本平均数周围越集中.(2)在两组数据中,平均值较大的一组方差较大.(×)提示:方差是描述数据围绕平均数波动的大小的量,与两组数据平均数的大小无关.(3)若样本数据的标准差为0,则数据没有离散性.(√)提示:若样本数据的标准差为0,则样本各数据相等,说明没有离散性.类型一方差、标准差(数学运算)【典例1】(1)(2024·榆林高一检测)已知一组数据6,6,8,8,10,10,则该组数据的方差是()A.43 B.2 C.83 D【解析】选C.该组数据的平均数为16所以该组数据的方差是16[2×(6-8)2+2×(8-8)2+2×(10-8)2]=8(2)甲、乙两机床同时加工直径为100mm的零件,为检验质量,从中各抽取6件测量,数据为甲:9910098100100103乙:9910010299100100①分别计算两组数据的平均数及方差;②根据计算结果判断哪台机床加工零件的质量更稳定.【解析】①x甲=16×(99+100+98+100+100+103)=100,x乙=s甲2=16×[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2s乙2=16×[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)②两台机床所加工零件的直径的平均数相同,又因为s甲2>s【总结升华】1.计算方差、标准差的步骤(1)计算样本的平均数x;(2)计算每个样本数据与样本平均数的差xi-x(i=1,2,…,n);(3)计算(xi-x)2(i=1,2,…,n);(4)计算(xi-x)2(i=1,2,…,n)这n个数据的平均数,即为样本方差s2;(5)计算方差的算术平方根,即为样本的标准差s.2.在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度.在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,离散程度越小,数据越集中,越稳定.【即学即练】1.(2024·宁波高一期中)甲乙丙丁四位同学各掷5次骰子并记录点数,方差最大的是()甲:45455乙:42343丙:23234丁:61261A.甲 B.乙 C.丙 D.丁【解析】选D.由题知x甲=235,所以s甲2=154-2352+5-2352+4-2352+5-2352+5-2352=625,x乙=165,所以s乙2=154-1652+2-1652+(3-165)2+4-1652+3-165x丙=145,所以s丙2=152-1452+3-1452+(2-145)2+3-1452+4-145x丁=165,所以s丁2=156-1652+1-1652+(2-165)2+6-1652+1-165所以方差最大的是丁.2.对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:甲273830373531乙332938342836(1)分别求出甲、乙两名自行车赛手最大速度的平均数和方差;(2)比较两个人的成绩,你认为选谁参加比赛比较合适.【解析】(1)x甲=16x乙=16s甲2=16×[(27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2s乙2=16×[(33-33)2+(29-33)2+(38-33)2+(34-33)2+(28-33)2+(36-33)2(2)由(1)知甲和乙的平均数相等,因为s甲2>所以乙更稳定,选乙参加比赛比较合适.类型二方差、标准差统计图的综合应用(数学运算)【典例2】对甲厂、乙厂、丙厂所生产的袋装食品各抽检了20袋,称得质量如条形图所示.s1,s2,s3分别表示甲厂、乙厂、丙厂这次抽检质量的标准差,则有()A.s2>s1>s3 B.s1>s3>s2C.s3>s1>s2 D.s3>s2>s1【解析】选C.根据题意,甲厂的平均数x1=120×(5×7+5×8+5×9+5×10)=8.5,方差s12=120×[5×(7-8.5)2+5×(8-8.5)2+5×(9-8.5)2+5×(10-8.5)2]=1.25,标准差乙厂的平均数x2=120×(4×7+6×8+6×9+4×10)=8.5,方差s22=120×[4×(7-8.5)2+6×(8-8.5)2+6×(9-8.5)2+4×(10-8.5)2]=1.05,标准差丙厂的平均数x3=120×(6×7+4×8+4×9+6×10)=8方差s32=120×[6×(7-8.5)2+4×(8-8.5)2+4×(9-8.5)2+6×(10-8.5)2]=1.45,标准差s3=1.45.所以s3>s【总结升华】根据统计图表确定方差(标准差)的大小关系有两种方法:(1)根据统计图表中所提供的数据与方差(标准差)的计算公式求出其数值,然后比较大小;(2)若统计图表中没有反映出具体的数据或计算较为烦琐,可根据统计图表所反映的数据的波动性大小来比较大小.【即学即练】如图所示是小王与小张二人参加某射击比赛的预赛的五次测试成绩的折线图,设小王与小张成绩的样本平均数分别为xA和xB,方差分别为sA2和A.xA<xB,sA2>sB2 B.xC.xA>xB,sA2>sB2 D.x【解析】选C.由题图可知,实线中的数据都大于或等于虚线中的数据,所以小王成绩的平均数大于小张成绩的平均数,xA>x显然实线中的数据波动较大

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论