




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGEPAGE1第三节用样本估计总体2024考纲考题考情1.用样本的频率分布估计总体分布(1)作频率分布直方图的步骤。①求极差(即一组数据中最大值与最小值的差)。②确定组距与组数。③将数据分组。④列频率分布表。⑤画频率分布直方图。(2)频率分布折线图和总体密度曲线。①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图。②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,即总体密度曲线。(3)茎叶图。茎是指中间的一列数,叶是从茎的旁边生长出来的数。2.用样本的数字特征估计总体的数字特征(1)众数:一组数据中出现次数最多的数。(2)中位数:将数据按大小依次排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数。(3)平均数:eq\o(x,\s\up10(-))=eq\f(x1+x2+…+xn,n),反映了一组数据的平均水平。(4)标准差:是样本数据到平均数的一种平均距离,s=eq\r(\f(1,n)[x1-\o(x,\s\up10(-))2+x2-\o(x,\s\up10(-))2+…+xn-\o(x,\s\up10(-))2])。(5)方差:s2=eq\f(1,n)[(x1-eq\o(x,\s\up10(-)))2+(x2-eq\o(x,\s\up10(-)))2+…+(xn-eq\o(x,\s\up10(-)))2](xn是样本数据,n是样本容量,eq\o(x,\s\up10(-))是样本平均数)。1.频率分布直方图中各小矩形的面积之和为1。2.频率分布直方图与众数、中位数与平均数的关系(1)最高的小长方形底边中点的横坐标即是众数。(2)中位数左边和右边的小长方形的面积和是相等的。(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和。3.平均数、方差的公式推广(1)若数据x1,x2,…,xn的平均数为eq\o(x,\s\up10(-)),那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是meq\o(x,\s\up10(-))+a。(2)数据x1,x2,…,xn的方差为s2。①数据x1+a,x2+a,…,xn+a的方差也为s2;②数据ax1,ax2,…,axn的方差为a2s2。一、走进教材1.(必修3P65例题改编)如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民数有________人。解析由频率分布直方图可知,月均用水量为[2,2.5)范围内的居民所占频率为0.5×0.5=0.25,所以月均用水量为[2,2.5)范围内的居民数为100×0.25=25。答案252.(必修3P82A组T6改编)甲、乙两台机床同时生产一种零件,10天中,两台机床每天出的次品数分别是:甲0102203124乙2311021101则机床性能较好的为________。解析因为eq\x\to(x)甲=1.5,eq\x\to(x)乙=1.2,seq\o\al(2,甲)=1.65,seq\o\al(2,乙)=0.76,所以seq\o\al(2,乙)<seq\o\al(2,甲),所以乙机床性能较好。答案乙二、走近高考3.(2024·江苏高考)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________。解析由茎叶图可得分数的平均数为eq\f(89+89+90+91+91,5)=90。答案904.(2024·山东高考)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件)。若这两组数据的中位数相等,且平均值也相等,则x与y的值分别为()A.3,5 B.5,5C.3,7 D.5,7解析由两组数据的中位数相等可得65=60+y,解得y=5,又它们的平均值相等,所以eq\f(1,5)×[56+62+65+74+(70+x)]=eq\f(1,5)×(59+61+67+65+78),解得x=3。答案A三、走出误区微提示:①平均数与方差的性质理解出错;②中位数、众数、平均数的求法不清导致出错。5.若数据x1,x2,x3,…,xn的平均数eq\o(x,\s\up10(-))=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数和方差分别为()A.5,2 B.16,2C.16,18 D.16,9解析因为x1,x2,x3,…,xn的平均数为5,所以eq\f(x1+x2+x3+…+xn,n)=5,所以eq\f(3x1+3x2+3x3+…+3xn,n)+1=3×5+1=16,因为x1,x2,x3,…,xn的方差为2,所以3x1+1,3x2+1,3x3+1,…,3xn+1的方差是32×2=18。故选C。答案C6.为了普及环保学问,增加环保意识,某高校随机抽取30名学生参与环保学问测试,得分(非常制)如图所示,假设得分的中位数为m,众数为n,平均数为eq\o(x,\s\up10(-)),则m,n,eq\o(x,\s\up10(-))的大小关系为________。(用“<”连接)解析由图可知,30名学生得分的中位数为第15个数和第16个数(分别为5,6)的平均数,即m=5.5;又5出现次数最多,故n=5;eq\o(x,\s\up10(-))=eq\f(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10,30)≈5.97。故n<m<eq\o(x,\s\up10(-))。答案n<m<eq\o(x,\s\up10(-))考点一频率分布直方图【例1】某高校艺术专业400名学生参与某次测评,依据男女学生人数比例,运用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90]。并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等。试估计总体中男生和女生人数的比例。解(1)依据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4。所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计值为0.4。(2)依据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,故样本中分数小于50的频率为0.1,故分数在区间[40,50)内的人数为100×0.1-5=5。所以总体中分数在区间[40,50)内的人数估计为400×eq\f(5,100)=20。(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60。所以样本中分数不小于70的男生人数为60×eq\f(1,2)=30。所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2。所以依据分层抽样原理,总体中男生和女生人数的比例估计为3∶2。1.绘制频率分布直方图时需留意的两点(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确;(2)频率分布直方图的纵坐标是eq\f(频率,组距),而不是频率。2.与频率分布直方图计算有关的两个关系式(1)eq\f(频率,组距)×组距=频率;(2)eq\f(频数,样本容量)=频率,此关系式的变形为eq\f(频数,频率)=样本容量,样本容量×频率=频数。【变式训练】(2024·贵阳监测考试)在某中学实行的环保学问竞赛中,将三个年级参赛学生的成果进行整理后分为5组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、其次、第三、第四、第五小组,已知其次小组的频数是40,则成果在80~100分的学生人数是()A.15 B.18C.20 D.25解析依据频率分布直方图,得其次小组的频率是0.04×10=0.4,因为频数是40,所以样本容量是eq\f(40,0.4)=100,又成果在80~100分的频率是(0.010+0.005)×10=0.15,所以成果在80~100分的学生人数是100×0.15=15。故选A。答案A考点二茎叶图【例2】(2024·郑州质量预料)我市某中学从高三年级甲、乙两个班中各选出7名学生参与2024年全国中学数学联赛(河南初赛),他们取得的成果(满分140分)的茎叶图如图所示,其中甲班学生成果的中位数是81,乙班学生成果的平均数是86,若正实数a,b满足a,G,b成等差数列且x,G,y成等比数列,则eq\f(1,a)+eq\f(4,b)的最小值为()A.eq\f(4,9) B.2C.eq\f(9,4) D.9解析由甲班学生成果的中位数是81,可知81为甲班7名学生的成果按从小到大的依次排列的第4个数,故x=1。由乙班学生成果的平均数为86,可得(-10)+(-6)+(-4)+(y-6)+5+7+10=0,解得y=4。由x,G,y成等比数列,可得G2=xy=4,由正实数a,b满足a,G,b成等差数列,可得G=2,a+b=2G=4,所以eq\f(1,a)+eq\f(4,b)=eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(1,a)+\f(4,b)))×eq\b\lc\(\rc\)(\a\vs4\al\co1(\f(a,4)+\f(b,4)))=eq\f(1,4)eq\b\lc\(\rc\)(\a\vs4\al\co1(1+\f(b,a)+\f(4a,b)+4))≥eq\f(1,4)×(5+4)=eq\f(9,4)(当且仅当b=2a时取等号)。故eq\f(1,a)+eq\f(4,b)的最小值为eq\f(9,4)。故选C。答案C1.由于茎叶图完全反映了全部的原始数据,解决由茎叶图给出的统计图表问题时,要充分对这个图表供应的样本数据进行相关的计算或者是对某些问题作出推断。2.茎叶图不能干脆反映总体的分布状况,这就须要通过茎叶图中的数据求出样本数据的数字特征,进一步估计总体状况。【变式训练】(1)已知某班级部分同学一次测验的成果统计如图,则其中位数和众数分别为()A.95,94 B.92,86C.99,86 D.95,91(2)在一次马拉松竞赛中,35名运动员的成果(单位:分钟)的茎叶图如图所示。若将运动员按成果由好到差编为1~35号,再用系统抽样方法从中抽取7人,假设抽到的第一个数据是133,则这7人的平均成果为________。解析(1)由茎叶图可知,此组数据由小到大排列依次为76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86。故选B。(2)依题意,应将35名运动员的成果由好到差排序后分为7组,每组5人。抽到的7人的编号为3,8,13,18,23,28,33,成果为133,138,141,143,145,148,153,平均成果是eq\f(1,7)×(133+138+141+143+145+148+153)=143。答案(1)B(2)143考点三样本的数字特征微点小专题方向1:样本方差的计算【例3】(1)(2024·武汉调研)某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个得分的平均数为91,如图,该选手的7个得分的茎叶图有一个数据模糊,无法分辨,在图中用x表示,则剩余5个得分的方差为()A.eq\f(116,9) B.eq\f(36,7)C.6 D.30(2)已知一组数据x1,x2,x3,x4,x5的方差是2,则数据2x1,2x2,2x3,2x4,2x5的标准差为________。解析(1)由茎叶图知,最低分为87分,最高分为99分。依题意得,eq\f(1,5)×(87+93+90+90+x+91)=91,解得x=4。则剩余5个得分的方差s2=eq\f(1,5)×[(87-91)2+(93-91)2+(90-91)2+(94-91)2+(91-91)2]=eq\f(1,5)×(16+4+1+9)=6。故选C。(2)由s2=eq\f(1,n)eq\i\su(i=1,n,)(xi-eq\o(x,\s\up10(-)))2=2,则数据2x1,2x2,2x3,2x4,2x5的方差是8,标准差为2eq\r(2)。答案(1)C(2)2eq\r(2)1.平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的状况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小。2.方差的简化计算公式:s2=eq\f(1,n)[(xeq\o\al(2,1)+xeq\o\al(2,2)+…+xeq\o\al(2,n))-neq\o(x,\s\up10(-))2],或写成s2=eq\f(1,n)(xeq\o\al(2,1)+xeq\o\al(2,2)+…+xeq\o\al(2,n))-eq\o(x,\s\up10(-))2,即方差等于原数据平方的平均数减去平均数的平方。方向2:用样本数字特征估计总体【例4】(2024·福州高三期末)随着“互联网+交通”模式的迅猛发展,“共享自行车”在许多城市相继出现。某“共享自行车”运营公司为了了解某地区用户对该公司所供应的服务的满足度,随机调查了40名用户,得到用户的满足度评分如下:用系统抽样法从40名用户中抽取容量为10的样本,且在第一分段里随机抽到的评分数据为92。(1)请你列出抽到的10个样本的评分数据;(2)计算所抽到的10个样本的均值eq\o(x,\s\up10(-))和方差s2;(3)在(2)的条件下,若用户的满足度评分在(eq\o(x,\s\up10(-))-s,eq\o(x,\s\up10(-))+s)之间,则满足度等级为“A级”。试应用样本估计总体的思想,估计该地区满足度等级为“A级”的用户所占的百分比是多少?(精确到0.1%)参考数据:eq\r(30)≈5.48,eq\r(33)≈5.74,eq\r(35)≈5.92。解(1)由题意得,通过系统抽样分别抽取编号为4,8,12,16,20,24,28,32,36,40的评分数据为样本,则样本的评分数据分别为92,84,86,78,89,74,83,78,77,89。(2)由(1)中样本的评分数据可得eq\o(x,\s\up10(-))=eq\f(1,10)×(92+84+86+78+89+74+83+78+77+89)=83,则有s2=eq\f(1,10)×[(92-83)2+(84-83)2+(86-83)2+(78-83)2+(89-83)2+(74-83)2+(83-83)2+(78-83)2+(77-83)2+(89-83)2]=33。(3)由题意知用户的满足度评分在(83-eq\r(33),83+eq\r(33)),即(77.26,88.74)之间,满足度等级为“A级”,由(1)中容量为10的样本评分在(77.26,88.74)之间的有5人,则该地区满足度等级为“A级”的用户所占的百分比约为eq\f(5,10)×100%=50.0%。解:由题意知用户的满足度评分在(83-eq\r(33),83+eq\r(33)),即(77.26,88.74)之间,满足度等级为“A级”,调查的40名用户的评分数据在(77.26,88.74)之间的共有21人,则该地区满足度等级为“A级”的用户所占的百分比约为eq\f(21,40)×100%=52.5%。若给出图表,一方面可以由图表得到相应的样本数据,再计算平均数、方差(标准差);另一方面,可以从图表直观分析样本数据的分布状况,大致推断平均数的范围,并利用数据的波动性大小比较方差(标准差)的大小。【题点对应练】1.(方向1)一组数据1,10,5,2,x,2,且2<x<5,若该数据的众数是中位数的eq\f(2,3)倍,则该数据的方差为________。解析依据题意知,该组数据的众数是2,则中位数是2÷eq\f(2,3)=3,把这组数据从小到大排列为1,2,2,x,5,10,则eq\f(2+x,2)=3,解得x=4,所以这组数据的平均数为eq\o(x,\s\up10(-))=eq\f(1,6)×(1+2+2+4+5+10)=4,方差为s2=eq\f(1,6)×[(1-4)2+(2-4)2×2+(4-4)2+(5-4)2+(10-4)2]=9。答案92.(方向1)若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为________。解析依题意,x1,x2,x3,…,x10的方差s2=64。则数据2x1-1,2x2-1,…,2x10-1的方差为22s2=22×64,所以其标准差为eq\r(22×64)=2×8=16。答案163.(方向2)某商家为了解“双十一”这一天网购者在其网店一次性购物的状况,从这一天交易胜利的全部订单中随机抽取了100份,按购物金额(单位:元)进行统计,得到的频率分布直方图如图所示。(1)该商家确定对这100份订单中购物金额不低于1000元的订单按区间[1000,1200),[1200,1400]采纳分层抽样的方法抽取6份,对买家进行售后回访,再从这6位买家中随机抽取2位赠送小礼品。求获赠小礼品的2位买家中,至少有1位买家的购物金额位于区间[1200,1400]内的概率。(2)若该商家制订了两种不同的促销方案:方案一:全场商品打八折;方案二:全场商品实惠如下表。购物金额[200,400)[400,600)[600,800)[800,1000)[1000,1200)[1200,1400]实惠金额/元3050140160280320利用直方图的数据,计算说明哪种方案的实惠力度更大(同一组中的数据用该组区间中点值表示)。解(1)在这100份订单中,购物金额位于区间[1000,1200)内的有100×0.00050×200=10(份),位于区间[1200,1400]内的有100×0.00025×200=5(份),则购物金额位于区间[1000,1400]内的订单共有15份。利用分层抽样抽取6份,则位于区间[1000,1200)内的有4份,记为X1,X2,X3,X4,位于区间[1200,1400]内的有2份,记为Y1,Y2。从X1,X2,X3,X4,Y1,Y2中抽取2份,全部可能的结果有X1X2,X1X3,X1X4,X2X3,X2X4,X3X4,X1Y1,X1Y2,X2Y1,X2Y2,X3Y1,X3Y2,X4Y1,X4Y2,Y1Y2,共15种。设事务A表示“获赠小礼品的2位买家中,至少有1位买家的购物金额位于区间[1200,1400]内”,其所含基本领件有X1Y1,X1Y2,X2Y1,X2Y2,X3Y1,X3Y2,X4Y1,X4Y2,Y1Y2,共9个,则P(A)=eq\f(9,15)=eq\f(3,5)。(2)由直方图知,各组的频率依次为0.1,0.2,0.25,0.3,0.1,0.05,方案一:商家实惠金额的平均值为(300×0.1+500×0.2+700×0.25+900×0.3+1100×0.1+1300×0.05)×0.2=150(元)。方案二:商家实惠金额的平均值为30×0.1+50×0.2+140×0.25+160×0.3+280×0.1+320×0.05=140(元)。由于150>140,所以方案一的实惠力度更大。eq\b\
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 学生社会责任感培养的教育心理学方法
- 教育行业的技术变革与培训实践指南
- 技术的力量智能教室在教育领域的贡献
- 未来学校的教育技术探索与实践
- 教育技术推动教师教学方法的改进研究
- 智慧教育中师生心理交互策略研究
- 数据时代的教育行业隐私保护趋势分析
- 新加坡品牌推广活动方案
- 酒精所致精神和行为障碍的护理
- 2022年AI-智慧社区大数据平台整体解决方案
- 阀门维修与更换操作规范考核试卷
- 防洪防汛施工现场应急预案(16篇)
- 《地方铁路运输企业安全生产标准化建设规范》
- 截瘫患者的并发症及护理
- 肝切除合并糖尿病
- 《大模型原理与技术》全套教学课件
- 《出口退税培训》课件
- 高考补习班招生策划书策划方案
- 康明斯产品合格证
- 矿山废水处理行业调研及投资前景分析报告
- 【五升六暑期阅读】专题10.环境描写及其作用-2024年五升六暑期阅读专项提升(统编版)5
评论
0/150
提交评论