2025版高考数学一轮复习第九章算法初步统计统计案例第三讲用样本估计总体学案含解析新人教版_第1页
2025版高考数学一轮复习第九章算法初步统计统计案例第三讲用样本估计总体学案含解析新人教版_第2页
2025版高考数学一轮复习第九章算法初步统计统计案例第三讲用样本估计总体学案含解析新人教版_第3页
2025版高考数学一轮复习第九章算法初步统计统计案例第三讲用样本估计总体学案含解析新人教版_第4页
2025版高考数学一轮复习第九章算法初步统计统计案例第三讲用样本估计总体学案含解析新人教版_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGE第三讲用样本估计总体学问梳理·双基自测eq\x(知)eq\x(识)eq\x(梳)eq\x(理)学问点一用样本的频率分布估计总体分布(1)频率分布表与频率分布直方图频率分布表和频率分布直方图,是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布规律,从中可以看到整个样本数据的频率分布状况.绘制频率分布直方图的步骤为:①__求极差__;②__确定组距与组数__;③__将数据分组__;④__列频率分布表__;⑤__画频率分布直方图__.(2)频率分布折线图顺次连接频率分布直方图中__各小长方形上端的中点__,就得到频率分布折线图.(3)总体密度曲线总体密度曲线反映了总体在各个范围内取值的百分比,它能供应更加精细的信息.学问点二茎叶图(1)茎叶图中茎是指__中间__的一列数,叶是从茎的__旁边__生长出来的数.(2)茎叶图的优点是可以__保留__原始数据,而且可以__随时__记录,这对数据的记录和表示都能带来便利.学问点三样本的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:eq\x\to(x)=__eq\f(x1+x2+…+xn,n)__,反映了一组数据的平均水平.(4)标准差:s=__eq\r(\f(1,n)[x1-\x\to(x)2+x2-\x\to(x)2+…+xn-\x\to(x)2])__,反映了样本数据的离散程度.(5)方差:s2=__eq\f(1,n)[(x1-eq\x\to(x))2+(x2-eq\x\to(x))2+…+(xn-eq\x\to(x))2]__,反映了样本数据的离散程度.eq\x(归)eq\x(纳)eq\x(拓)eq\x(展)(1)若一组数据xi(i=1,2,…,n)的平均数为eq\o(x,\s\up6(-)),方差为s2,则数据组axi+b(i=1,2,…,n,a,b为常数)的平均数为aeq\o(x,\s\up6(-))+b,方差为a2·s2.(2)频率分布直方图与众数、中位数与平均数的关系①最高的小长方形底边中点的横坐标即是众数.②中位数左边和右边的小长方形的面积和是相等的,均为eq\f(1,2).③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.eq\x(双)eq\x(基)eq\x(自)eq\x(测)题组一走出误区1.推断下列结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.(√)(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.(×)(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的详细数据信息就被抹掉了.(√)(4)茎叶图一般左侧的叶按从大到小的依次写,右侧的叶按从小到大的依次写,相同的数据可以只记一次.(×)(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.(√)(6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.(×)题组二走进教材2.(P81A组T1改编)A.95,94 B.92,86C.99,86 D.95,91[解析]由茎叶图可知,此组数据由小到大排列依次76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86,故选B.3.(P7T1)如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有__25__人.[解析]100×(0.5×0.5)=25(人).题组三走向高考4.(2024·新课标Ⅲ)设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为(C)A.0.01 B.0.1C.1 D.10[解析]∵样本数据x1,x2,…,xn的方差为0.01,∴依据任何一组数据同时扩大几倍方差将变为平方倍增长,∴数据10x1,10x2,…,10xn的方差为:100×0.01=1,故选C.5.(2024·天津)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为(B)A.10 B.18C.20 D.36[解析]直径落在区间[5.43,5.47)的频率为(6.25+5)×0.02=0.225,则被抽取的零件中,直径落在区间[5.43,5.47)内的个数为0.225×80=18个,故选B.考点突破·互动探究考点一频率分布直方图——自主练透例1(1)(2024·江西赣州十四县联考)中心电视台播出《中国诗词大会》火遍全国,下面是组委会在选拔赛时随机抽取的100名选手的成果,按成果分组,得到的频率分布表如下所示:组号分组频数频率第1组[160,165)0.100笫2组[165,170)①第3组[170,175)20②第4组[175,180)200.200第5组[180,185)100.100合计1001.00(ⅰ)请先求出频率分布表中①、②位置的相应数据,再完成频率分布直方图(用阴影表示).(ⅱ)为了能选拔出最优秀的选手,组委会确定在笔试成果高的第3,4,5组中用分层抽样抽取5名选手进入其次轮面试,则第3,4,5组每组各抽取多少名选手进入其次轮面试?(ⅲ)在(ⅱ)的前提下,组委会确定在5名选手中随机抽取2名选手接受考官A面试,求第4组至少有一名选手被考官A面试的概率.(2)(2024·湖北恩施州质检)为了解人们对环保学问的认知状况,某调查机构对A地区随机选取n个居民进行了环保学问问卷调查(满分为100分),并依据问卷成果(不低于60分记为及格)绘制成如图所示的频率分布直方图(分为[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组),若问卷成果最终三组频数之和为360,则下列结论正确的是__②③④__.①n=480②问卷成果在[70,80)内的频率为0.3③a=0.030④以样本估计总体,若对A地区5000人进行问卷调查,则约有1250人不及格[解析](1)(ⅰ)第1组的频数为100×0.100=10,所以①处应填的数为100-(10+20+20+10)=40,从而第2组的频率为eq\f(40,100)=0.400.②处应填的数为1-(0.1+0.4+0.2+0.1)=0.200.频率分布直方图如图所示.(ⅱ)因为第3,4,5组共有50名选手,所以利用分层抽样在50名选手中抽取5名选手进入其次轮面试时,每组抽取的人数分别为:第3组:eq\f(20,50)×5=2,第4组:eq\f(20,50)×5=2,第5组:eq\f(10,50)×5=1,所以第3,4,5组分别抽取2人,2人,1人进入其次轮面试.(ⅲ)(理)记“第4组至少有一名选手被考官A面试”为事务A,则P(A)=eq\f(C\o\al(1,2)C\o\al(1,3)+C\o\al(2,2),C\o\al(2,5))=eq\f(7,10).eq\b\lc\(\rc\)(\a\vs4\al\co1(或PA=1-P\o(A,\s\up6(-))=1-\f(C\o\al(2,3),C\o\al(2,5))=\f(7,10)))(文)设第3组的2位选手为A1,A2,第4组的2位选手为B1,B2,第5组的1位选手为C1,则从这五位选手中抽取两位选手有(A1,A2),(A1,B1),(A1,B2),(A1,C1),(A2,B1),(A2,B2),(A2,C1),(B1,B2),(B1,C1),(B2,C1),共10种状况.其中第4组的2位选手B1,B2,中至少有一位入选的有(A1,B1),(A1,B2),(A2,B1),(A2,B2),(B1,B2),(B1,C1),(B2,C1),共有7种状况,所以第4组至少有一名选手被考官A面试的概率为eq\f(7,10).(2)由(0.010+0.015+0.015+a+0.025+0.005)×10=1,得a=0.030,n=eq\f(360,10a+0.025+0.005)=600.故①不正确,③正确;成果在[70,80)内的频率为10a=0.3,故②正确;若对A地区5000人进行问卷调查,则约有5000×(0.1+0.15)=1250人不及格,故④正确.名师点拨应用频率分布直方图时的留意事项用频率分布直方图解决相关问题时,应正确理解图表中各个量的意义,识图驾驭信息是解决该类问题的关键.频率分布直方图有以下几个要点:(1)纵轴表示频率/组距;(2)频率分布直方图中各长方形高的比也就是其频率之比;(3)频率分布直方图中每一个矩形的面积是样本数据落在这个区间上的频率,全部的小矩形的面积之和等于1,即频率之和为1.〔变式训练1〕(1)(2024·安徽“皖南八校”摸底)某校高三年级有400名学生,在一次数学测试中,成果都在[80,130](单位:分)内,其频率分布直方图如图,则这次测试数学成果不低于100分的人数为__220__.(2)(2024·山西适应性考试)某病毒引起的肺炎的潜藏期平均为7天左右,短的约2~3天,长的约10~14天,甚至有20余天.某医疗机构对400名确诊患者的潜藏期进行统计,整理得到以下频率分布直方图.依据该直方图估计:要使90%的患者显现出明显病状,需隔离视察的天数至少是(C)A.12 B.13C.14 D.15[解析](1)依据频率分布直方图知:(2a+0.04+0.03+0.02)×10=1⇒a计算出数学成果不低于100分的频率为:(0.03+0.02+0.005)×10=0.55;所以这次测试数学成果不低于100分的人数为0.55×400=220人.(2)由题可知,第一,二,三,四,五组的频率分别为0.16,0.4,0.32,0.08,0.04.因为前三组的频率和为0.88,故要使90%的患者显现出明显病状,则需隔离视察的天数至少是:13+eq\f(0.9-0.88,0.02)=14,故选C.考点二茎叶图——师生共研例2(2024·四川省乐山市调研)胡萝卜中含有大量的β-胡萝卜素,摄入人体消化器官后,可以转化为维生素A,现从a,b两个品种的胡萝卜所含的β-胡萝卜素(单位mg)得到茎叶图如图所示,则下列说法不正确的是(C)ab64423864143.13.23.33.42371111257A.eq\x\to(x)a<eq\x\to(x)bB.a的方差大于b的方差C.b品种的众数为3.31D.a品种的中位数为3.27[解析]由茎叶图得:b品种所含β-胡萝卜素普遍高于a品种,∴eq\x\to(x)a<eq\x\to(x)b,故A正确;a品种的数据波动比b品种的数据波动大,∴a的方差大于b的方差,故B正确;b品种的众数为3.31与3.41,故C错误;a品种的数据的中位数为:eq\f(3.23+3.31,2)=3.27,故D正确.名师点拨茎叶图的绘制及应用(1)茎叶图的绘制需留意:①“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不须要统一;②重复出现的数据要重复记录,不能遗漏,特殊是“叶”的位置上的数据.(2)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否匀称等.〔变式训练2〕(2024·山东)如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x与y的值分别为(A)甲组乙组625x4567917y8A.3,5 B.5,5C.3,7 D.5,7[解析]甲组数据的中位数为65,由甲、乙两组数据的中位数相等,得y=5.又甲、乙两组数据的平均值相等,∴eq\f(1,5)×(56+65+62+74+70+x)=eq\f(1,5)×(59+61+67+65+78),∴x=3.故选A.考点三,样本数字特征——多维探究角度1样本数字特征与频率分布直方图例3(1)如图所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数分别是(B)A.12.5,12.5 B.12.5,13C.13,12.5 D.13,13[解析]由频率分布直方图可知,众数为eq\f(10+15,2)=12.5,因为0.04×5=0.2,0.1×5=0.5,在频率分布直方图中,中位数左边和右边的面积相等,所以中位数在区间[10,15)内.设中位数为x,则(x-10)×0.1=0.5-0.2,解得x=13.角度2样本数字特征与茎叶图(2)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法分辨,在图中以x表示:eq\b\lc\\rc\|(\a\vs4\al\co1(8,9))eq\b\lc\\rc\(\a\vs4\al\co1(77,4010x91))则7个剩余分数的方差为__eq\f(36,7)__.[解析]由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x=91×7,解得x=4,∴s2=eq\f(1,7)[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=eq\f(36,7).角度3样本数字特征的计算(3)(2024·湖北武汉、襄阳、荆门、宜昌四地六校考试联盟联考)已知某7个数据的平均数为5,方差为4,现又加入一个新数据5,此时这8个数的方差s2为(C)A.eq\f(5,2) B.3C.eq\f(7,2) D.4[解析]设某7个数据分别为a1,a2,…,a7,则由题意得a1+a2+…+a7=5×7=35,(a1-5)2+(a2-5)2+…+(a7-5)2=4×7=28,加入新数据5后的平均数eq\o(x,\s\up6(-))=eq\f(35+5,8)=5,方差s2=eq\f(a1-52+a2-52+…+a7-52+5-52,8)=eq\f(28,8)=eq\f(7,2).故选C.名师点拨平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的状况有着重要的实际意义,平均数,中位数,众数描述其集中趋势,方差和标准差描述其波动大小.〔变式训练3〕(1)(角度1)某小区共有1000户居民,现对他们的用电状况进行调查,得到频率分布直方图如图所示,则该小区居民用电量的中位数为__155__,平均数为__156.8__.(2)(角度2)(2024·陕西西安八校联考)在一次技能竞赛中,共有12人参与,他们的得分(百分制)茎叶图如图,则他们得分的中位数和方差分别为(B)789846779148899A.8954.5 B.8953.5C.8753.5 D.8954(3)高铁、扫码支付、共享单车、网购并称中国“新四大独创”,近日对全国100个城市的共享单车和扫码支付的运用人数进行大数据分析,其中共享单车运用的人数分别为x1,x2,x3,…,x100,它们的平均数为eq\o(x,\s\up6(-)),方差为s2:其中扫码支付运用的人数分别为3x1+2,3x2+2,3x3+2,…,3x100+2,它们的平均数为eq\o(x,\s\up6(-))′,方差为s′2,则eq\o(x,\s\up6(-))′,s′2分别为(C)A.3eq\o(x,\s\up6(-))+2,3s2+2 B.3eq\o(x,\s\up6(-)),3s2C.3eq\o(x,\s\up6(-))+2,9s2 D.3eq\o(x,\s\up6(-))+2,9s2+2[解析](1)中位数为:150+(170-150)×eq\f(0.1,0.02×20)=155.该组数据的平均数为eq\x\to(x)=0.005×20×120+0.015×20×140+0.020×20×160+0.005×20×180+0.003×20×200+0.002×20×220=156.8.(2)由题可知,中位数为:eq\f(87+91,2)=89,先求平均数:eq\o(x,\s\up6(-))=eq\f(78+79+84+86+87+87+91+94+98+98+99+99,12)=90,S2=eq\f(1,12)[(-12)2+(-11)2+(-6)2+(-4)2+(-3)2+(-3)2+12+42+82+82+92+92]=53.5,故中位数为:89,方差为53.5,故选:B.(3)明显eq\o(x,\s\up6(-))′=3eq\o(x,\s\up6(-))+2,而每个数据上都加上或减去相同数不影响方差,但每个数据都乘以a,则方差变为原方差的a2倍,故选C.考点四,折线图——师生共研例4(2024·河南顶级名校模拟改编)如图是某地某月1日至15日的日平均温度改变的折线图,依据该折线图,下列结论正确的是(A)A.连续三天日平均温度的方差最大的是7日,8日,9日三天B.这15天日平均温度的极差为15C.由折线图能预料16日温度要低于19D.由折线图能预料本月温度小于25℃的天数少于温度大于25[解析]A选项,日平均温度的方差的大小取决于日平均温度的波动的大小,7,8,9三日的日平均温度的波动最大,故日平均温度的方差最大,正确;B选项,这15天日平均温度的极差为18℃,B错;C选项,由折线图无法预料16日温度是否低于19℃,故C错误;D选项,由折线图无法预料本月温度小于25℃名师点拨折线图可以显示随时间(依据常用比例放置)而改变的连续数据,因此特别适用于显示在相等时间间隔下数据的趋势.〔变式训练4〕甲乙两名同学在本学期的六次考试成果统计如图,甲乙两组数据的平均值分别为eq\o(x,\s\up6(-))甲、eq\o(x,\s\up6(-))乙,则下列结论正确的个数为(B)①每次考试甲的成果都比乙的成果高②甲的成果比乙稳定③eq\o(x,\s\up6(-))甲肯定大于eq\o(x,\s\up6(-))乙④甲的成果的极差大于乙的成果的极差A.1 B.2C.3 D.4[解析]其次次考试甲的成果比乙低,①错;由图可知甲的成果比乙的成果波动小,②正确,④错;甲的平均成果明显比乙的平均成果高,③正确;故选B.名师讲坛·素养提升高考与频率分布直方图例5(理)(2024·安徽省池州市期末)高三年级某班50名学生期中考试数学成果的频率分布直方图如图所示,成果分组区间为:[80,90),[90,100),[100,110),[110,120),[120,130),[130,140),[140,150].其中a,b,c成等差数列且c=2a,物理成果统计如表.(说明:数学满分150分,物理满分100分)分组[50,60)[60,70)[70,80)[80,90)[90,100]频数6920105(1)依据频率分布直方图,请估计数学成果的平均分;(2)依据物理成果统计表,请估计物理成果的中位数;(3)若数学成果不低于140分的为“优”,物理成果不低于90分的为“优”,已知本班中至少有一个“优”同学总数为6人,从今6人中随机抽取3人.记X为抽到两个“优”的学生人数,求X的分布列和期望值.(文)(2024·河南新乡模拟)甲、乙两人想参与某项竞赛,依据以往20次的测试,将样本数据分成[50,60),[60,70),[70,80),[80,90),[90,100]五组,并整理得到如下频率分布直方图:已知甲测试成果的中位数是75.(1)求x,y的值,并分别求出甲、乙两人测试成果的平均数(假设同一组中的每个数据可用该组区间中点值代替);(2)从甲、乙两人测试成果不足60分的试卷中随机抽取3份,求恰有2份来自乙的概率.[解析](理)(1)依据频率分布直方图得,(a+b+2c+0.024+0.020+0.004)×又因a+c=2b,c=2a解得a=0.008,b=0.012,c=0.016,故数学成果的平均分eq\o(x,\s\up6(-))=85×0.04+95×0.12+105×0.16+115×0.2+125×0.24+135×0.16+145×0.08=117.8(分),(2)总人数50分,由物理成果统计表知,中位数在成果区间[70,80),所以物理成果的中位数为75分.(3)数学成果为“优”的同学有4人,物理成果为“优”有5人,因为至少有一个“优”的同学总数为6名同学,故两科均为“优”的人数为3人,故X的取值为0、1、2、3.P(X=0)=eq\f(C\o\al(3,3),C\o\al(3,6))=eq\f(1,20),P(X=1)=eq\f(C\o\al(1,3)C\o\al(2,3),C\o\al(3,6))=eq\f(9,20),P(X=2)=eq\f(C\o\al(2,3)C\o\al(1,3),C\o\al(3,6))=eq\f(9,20),P(X=3)=eq\f(C\o\al(3,3),C\o\al(3,6))=eq\f(1,20),所以分布列为:X0123Peq\f(1,20)eq\f(9,20)eq\f(9,20)eq\f(1,20)∴期望值为E(X)=0×eq\f(1,20)+1×eq\f(9,20)+2×eq\f(9,20)+3×eq\f(1,20)=eq\f(3,2).(文)(1)∵甲测试成果的中位数为75

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论