高考数学二轮专题复习与策略 第1部分 专题3 概率与统计 突破点7 用样本估计总体教师用书 理-人教版高三数学试题_第1页
高考数学二轮专题复习与策略 第1部分 专题3 概率与统计 突破点7 用样本估计总体教师用书 理-人教版高三数学试题_第2页
高考数学二轮专题复习与策略 第1部分 专题3 概率与统计 突破点7 用样本估计总体教师用书 理-人教版高三数学试题_第3页
高考数学二轮专题复习与策略 第1部分 专题3 概率与统计 突破点7 用样本估计总体教师用书 理-人教版高三数学试题_第4页
高考数学二轮专题复习与策略 第1部分 专题3 概率与统计 突破点7 用样本估计总体教师用书 理-人教版高三数学试题_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

突破点7用样本估计总体(对应学生用书第167页)提炼1频率分布直方图(1)频率分布直方图中横坐标表示组距,纵坐标表示eq\f(频率,组距),频率=组距×eq\f(频率,组距).(2)频率分布直方图中各小长方形的面积之和为1.(3)利用频率分布直方图求众数、中位数与平均数,在频率分布直方图中:①最高的小长方形底边中点的横坐标即是众数;②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.提炼2茎叶图的优点(1)所有的信息都可以从茎叶图中得到.(2)可以帮助分析样本数据的大致频率分布情况.提炼3样本的数字特征(1)众数、中位数.(2)样本平均数eq\x\to(x)=eq\f(1,n)(x1+x2+…+xn).(3)样本方差s2=eq\f(1,n)[(x1-eq\x\to(x))2+(x2-eq\x\to(x))2+…+(xn-eq\x\to(x))2].(4)样本标准差s=eq\r(\f(1,n)[x1-\x\to(x)2+x2-\x\to(x)2+…+xn-\x\to(x)2]).回访1频率分布表或频率分布直方图1.(2016·山东高考)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图7­1所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()图7­1A.56 B.60C.120 D.140D[由直方图可知每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,则每周自习时间不少于22.5小时的人数为0.7×200=140.故选D.]2.某雷达测速区规定:凡车速大于或等于70km/h的汽车视为“超速”,并将受到处罚,如图7­2是某路段的一个检测点对200辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可以看出被处罚的汽车大约有()图7­2A.30辆 B.40辆C.60辆 D.80辆B[由题图可知,车速大于或等于70km/h的汽车的频率为0.02×10=0.2,则将被处罚的汽车大约有200×0.2=40(辆).]回访2茎叶图3.(2015·山东高考)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图7­3所示的茎叶图.考虑以下结论:图7­3①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为()A.①③ B.①④C.②③ D.②④B[甲地该月14时的气温数据分布在26和31之间,且数据波动较大,而乙地该月14时的气温数据分布在28和32之间,且数据波动较小,可以判断结论①④正确,故选B.]4.(2015·湖南高考)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图7­4所示.图7­4若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是()A.3 B.4C.5 D.6B[35÷7=5,因此可将编号为1~35的35个数据分成7组,每组有5个数据,在区间[139,151]上共有20个数据,分在4个小组中,每组取1人,共取4人.](对应学生用书第167页)热点题型1频率分布直方图题型分析:频率分布直方图多以生活中的实际问题为背景,考查学生运用已知数据分析问题的能力,难度中等.(2016·潍坊模拟)某高中为了解全校学生每周参与体育运动的情况,随机从全校学生中抽取100名学生,统计他们每周参与体育运动的时间如下:每周参与运动的时间(单位:小时)[0,4)[4,8)[8,12)[12,16)[16,20]频数24402862(1)作出样本的频率分布直方图;(2)①估计该校学生每周参与体育运动的时间的中位数及平均数;②若该校有学生3000人,根据以上抽样调查数据,估计该校学生每周参与体育运动的时间不低于8小时的人数.[解](1)频率分布直方图如图所示:(2)①由数据估计中位数为4+eq\f(26,40)×4=6.6,8分估计平均数为2×0.24+6×0.4+10×0.28+14×0.06+18×0.02=6.88.10分②将频率看作概率知P(t≥8)=0.36,∴3000×0.36=1080.12分解决该类问题的关键是正确理解已知数据的含义.掌握图表中各个量的意义,通过图表对已知数据进行分析.提醒:(1)小长方形的面积表示频率,其纵轴是eq\f(频率,组距),而不是频率.(2)各组数据频率之比等于对应小长方形的高度之比.[变式训练1]某电子商务公司随机抽取1000名网络购物者进行调查.这1000名购物者2015年网上购物金额(单位:万元)均在区间[0.3,0.9]内,样本分组为:[0.3,0.4),[0.4,0.5),[0.5,0.6),[0.6,0.7),[0.7,0.8),[0.8,0.9],购物金额的频率分布直方图如下:图7­5电子商务公司决定给购物者发放优惠券,其金额(单位:元)与购物金额关系如下:购物金额分组[0.3,0.5)[0.5,0.6)[0.6,0.8)[0.8,0.9]发放金额50100150200(1)求这1000名购物者获得优惠券金额的平均数;(2)以这1000名购物者购物金额落在相应区间的频率作为概率,求一个购物者获得优惠券金额不少于150元的概率.[解](1)购物者的购物金额x与获得优惠券金额y的频率分布如下表:x0.3≤x<0.50.5≤x<0.60.6≤x<0.80.8≤x≤0.9y50100150200频率0.40.30.280.02这1000名购物者获得优惠券金额的平均数为:eq\f(50×400+100×300+150×280+200×20,1000)=96.4分(2)由获得优惠券金额y与购物金额x的对应关系,有P(y=150)=P(0.6≤x<0.8)=(2+0.8)×0.1=0.28,P(y=200)=P(0.8≤x≤0.9)=0.2×0.1=0.02,10分从而,获得优惠券不少于150元的概率为P(y≥150)=P(y=150)+P(y=200)=0.28+0.02=0.3.12分热点题型2茎叶图题型分析:结合样本数据和茎叶图对总体作出估计是高考命题的热点,应引起足够的重视,难度中等.(2016·福州模拟)长时间用手机上网严重影响着学生的身体健康,某校为了解A,B两班学生手机上网的时长,分别从这两个班中随机抽取5名同学进行调查,将他们平均每周手机上网的时长作为样本,绘制成茎叶图如图7­6所示(图中的茎表示十位数字,叶表示个位数字).图7­6(1)分别求出图中所给两组样本数据的平均值,并据此估计哪个班的学生平均上网时间较长;(2)从A班的样本数据中随机抽取一个不超过19的数据记为a,从B班的样本数据中随机提取一个不超过21的数据记为b,求a>b的概率.[解](1)A班样本数据的平均值为eq\f(1,5)(9+11+14+20+31)=17.3分由此估计A班学生每周平均上网时间17小时;B班样本数据的平均值为eq\f(1,5)(11+12+21+25+26)=19,由此估计B班学生每周平均上网时间较长.6分(2)A班的样本数据中不超过19的数据a有3个,分别为9,11,14,B班的样本数据中不超过21的数据b也有3个,分别为11,12,21,从A班和B班的样本数据中各随机抽取一个共有:9种不同情况,分别为(9,11),(9,12),(9,21),(11,11),(11,21),(11,21),(14,11),(14,12),(14,21),其中a>b的情况有(14,11),(14,12)两种,故a>b的概率P=eq\f(2,9).12分作茎叶图时先要弄清“茎”和“叶”分别代表什么,根据茎叶图,可以得到数据的众数、中位数,也可从图中直接估计出两组数据的平均数大小与稳定性.[变式训练2](名师押题)某车间20名工人年龄数据如下表:(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.[解](1)由题表中的数据易知,这20名工人年龄的众数是30,极差为40-19=21.2分(2)这20名工人年龄的茎叶图如下:6分(3)这20名工人年龄的平均数eq\x\to(x)=eq\f(1,20)(19×1+28×3+29×3+30×5+31×4+32×3+40×1)=30,8分故方差s2=eq\f(1,20)[1×(19-30)2+3×(28-30)2+3×(29-30)2+5×(30-30)2+4×(31-30)2+3×(32-30)2+1×(40-30)2]=eq\f(1,20)×(121+12+3+0+4+12+100)=12.6.12分专题限时集训(七)用样本估计总体[建议A、B组各用时:45分钟][A组高考达标]一、选择题1.(2016·山西考前模拟)某同学将全班某次数学考试成绩整理成频率分布直方图后,并将每个小矩形上方线段的中点连接起来得到频率分布折线图(如图7­7所示),据此估计此次考试成绩的众数是()图7­7A.100 B.110C.115 D.120C[分析频率分布折线图可知众数为115,故选C.]2.(2016·济南模拟)某校高一、高二、高三年级学生人数分别是400,320,280.采用分层抽样的方法抽取50人,参加学校举行的社会主义核心价值观知识竞赛,则样本中高三年级的人数是()A.20 B.16C.15 D.14D[样本中高三年级的人数为eq\f(280,400+320+280)×50=14.]3.(2016·青岛模拟)已知数据x1,x2,x3,…,x50,500(单位:kg),其中x1,x2,x3,…,x50是某班50个学生的体重,设这50个学生体重的平均数为x,中位数为y,则x1,x2,x3,…,x50,500这51个数据的平均数、中位数分别与x,y比较,下列说法正确的是()【导学号:67722030】A.平均数一定变大,中位数一定变大B.平均数一定变大,中位数可能不变C.平均数可能不变,中位数可能不变D.平均数可能不变,中位数可能变小B[显然500大于这50个学生的平均体重,则这51个数据的平均数一定增大,中位数可能增大也可能不变,故选B.]4.(2016·沈阳模拟)从某小学随机抽取100名同学,现已将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图7­8).若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为()图7­8A.2 B.3C.4 D.5B[依题意可得10×(0.005+0.010+0.020+a+0.035)=1,解得a=0.030,故身高在[120,130),[130,140),[140,150]三组内的学生比例为3∶2∶1,所以从身高在[140,150]内的学生中选取的人数应为3.]5.(2016·郑州模拟)某车间共有6名工人,他们某日加工零件个数的茎叶图如图7­9所示,其中茎为十位数,叶为个位数,日加工零件个数大于样本均值的工人为优秀工人.从该车间6名工人中,任取2人,则至少有1名优秀工人的概率为()图7­9A.eq\f(8,15) B.eq\f(4,9)C.eq\f(3,5) D.eq\f(1,9)C[依题意,平均数eq\x\to(x)=eq\f(20+60+30+7+9+1+5,6)=22,故优秀工人只有2人,从中任取2人共有Ceq\o\al(2,6)=15种情况,其中至少有1名优秀工人的情况有Ceq\o\al(2,6)-Ceq\o\al(2,4)=9种,故至少有1名优秀工人的概率P=eq\f(9,15)=eq\f(3,5),故选C.]二、填空题6.某中学共有女生2000人,为了了解学生体质健康状况,随机抽取100名女生进行体质监测,将她们的体重(单位:kg)数据加以统计,得到如图7­10所示的频率分布直方图,则直方图中x的值为________;试估计该校体重在[55,70)的女生有________人.图7­100.0241000[由5×(0.06+0.05+0.04+x+0.016+0.01)=1,得x=0.024.在样本中,体重在[55,70)的女生的频率为5×(0.01+0.04+0.05)=0.5,所以该校体重在[55,70)的女生估计有2000×0.5=1000人.]7.某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图7­11所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应该是________.图7­111[当x≥4时,eq\f(89+89+92+93+92+91+94,7)=eq\f(640,7)≠91,∴x<4,∴eq\f(89+89+92+93+92+91+x+90,7)=91,∴x=1.]8.(2016·淄博模拟)从甲、乙两种树苗中各抽测了10株树苗的高度,其茎叶图如图7­12.根据茎叶图,树苗的平均高度较高的是__________种树苗,树苗长得整齐的是__________种树苗.【导学号:67722031】图7­12乙甲[根据茎叶图可知,甲种树苗中的高度比较集中,则甲种树苗比乙种树苗长得整齐;而通过计算可得,eq\x\to(x)甲=27,eq\x\to(x)乙=30,即乙种树苗的平均高度大于甲种树苗的平均高度.]三、解答题9.(2016·泰安二模)某校从高一年级学生中随机抽取40名学生,将他们的期中考试数学成绩(满分100分,成绩均为不低于40分的整数)分成如下六段:[40,50),[50,60),…,[90,100],得到如图7­13所示的频率分布直方图.图7­13(1)若该校高一年级共有学生640名,试估计该校高一年级期中考试数学成绩不低于60分的人数;(2)在抽取的40名学生中,若从数学成绩在[40,50)与[90,100]两个分数段内随机选取2名学生,求这2名学生的数学成绩之差的绝对值不大于10的概率.[解](1)由10×(0.005+0.01+0.02+a+0.025+0.01)=1,得a=0.03.2分根据频率分布直方图,成绩不低于60分的频率为1-10×(0.005+0.01)=0.85.4分估计期中考试数学成绩不低于60分的人数约为640×0.85=544(人).6分(2)成绩在[40,50)分数段内的人数为40×0.05=2,成绩在[90,100]分数段内的人数为40×0.1=4,则记在[40,50)分数段的两名同学为A1,A2,在[90,100]分数段内的同学为B1,B2,B3,B4.若从这6名学生中随机抽取2人,则总的取法共有15种.8分如果2名学生的数学成绩都在[40,50)分数段内或都在[90,100]分数段内,那么这2名学生的数学成绩之差的绝对值不大于10,则所取2名学生的数学成绩之差的绝对值不大于10的取法有(A1,A2),(B1,B2),(B1,B3),(B1,B4),(B2,B3),(B2,B4),(B3,B4),共7种取法,所以所求概率为P=eq\f(7,15).12分10.(2016·郑州一模)为了整顿道路交通秩序,某地考虑将对行人闯红灯进行处罚.为了更好地了解市民的态度,在普通行人中随机选取了200人进行调查,当不处罚时,有80人会闯红灯,处罚时,得到如下数据:处罚金额x(单位:元)5101520会闯红灯的人数y50402010若用表中数据所得频率代替概率.(1)当罚金定为10元时,行人闯红灯的概率会比不进行处罚降低多少?(2)将先取的200人中会闯红灯的市民分为两类:A类市民在罚金不超过10元时就会改正行为;B类是其他市民.现对A类与B类市民按分层抽样的方法抽取4人依次进行深度问卷,则前两位均为B类市民的概率是多少.[解](1)设“当罚金定为10元时,闯红灯的市民改正行为”为事件A,2分则P(A)=eq\f(40,200)=eq\f(1,5).4分所以当罚金定为10元时,比不制定处罚,行人闯红灯的概率会降低eq\f(1,5).6分(2)由题可知A类市民和B类市民各有40人,故分别从A类市民和B类市民中各抽出2人,设从A类市民中抽出的2人分别为A1,A2,从B类市民中抽出的2人分别为B1,B2.设“A类与B类市民按分层抽样的方法抽取4人依次进行深度问卷”为事件M,8分则事件M中首先抽出A1的事件有:(A1,A2,B1,B2),(A1,A2,B2,B1),(A1,B1,A2,B2),(A1,B1,B2,A2),(A1,B2,A2,B1),(A1,B2,B1,A2),共6种.同理首先抽出A2,B1,B2的事件也各有6种.故事件M共有24种.10分设“抽取4人中前两位均为B类市民”为事件N,则事件N有(B1,B2,A1,A2),(B1,B2,A2,A1),(B2,B1,A1,A2),(B2,B1,A2,A1).∴P(N)=eq\f(4,24)=eq\f(1,6).12分[B组名校冲刺]一、选择题1.已知甲、乙两组数据的茎叶图如图7­14所示,若它们的中位数相同,平均数也相同,则图中的m,n的比值eq\f(m,n)=()图7­14A.1 B.eq\f(1,3)C.eq\f(3,8) D.eq\f(2,9)C[由茎叶图可知乙的中位数是eq\f(32+34,2)=33,根据甲、乙两组数据的中位数相同,可得m=3,所以甲的平均数为eq\f(27+33+39,3)=33,又由甲、乙两组数据的平均数相同,可得eq\f(20+n+32+34+38,4)=33,解得n=8,所以eq\f(m,n)=eq\f(3,8),故选C.]2.(2016·烟台模拟)如图7­15茎叶图记录了甲、乙两位射箭运动员的5次比赛成绩(单位:环),若两位运动员平均成绩相同,则成绩较为稳定(方差较小)的那位运动员成绩的方差为()图7­15A.4 B.3C.2 D.1C[根据茎叶图中的数据,得:甲、乙二人的平均成绩相同,即eq\f(1,5)×(87+89+90+91+93)=eq\f(1,5)(88+89+90+91+90+x),解得x=2,所以平均数为eq\x\to(x)=90.根据茎叶图中的数据知乙的成绩波动性小,较为稳定(方差较小),且乙成绩的方差为s2=eq\f(1,5)[(88-90)2+(89-90)2+(90-90)2+(91-90)2+(92-90)2]=2.]3.为了了解某城市今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图7­16),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为120,则抽取的学生人数是()图7­16A.240 B.280C.320 D.480D[由频率分布直方图知:学生的体重在65~75kg的频率为(0.0125+0.0375)×5=0.25,则学生的体重在50~65kg的频率为1-0.25=0.75.从左到右第2个小组的频率为0.75×eq\f(2,6)=0.25.所以抽取的学生人数是120÷0.25=480,故选D.]4.3个老师对某学校高三三个班级各85人的数学成绩进行分析,已知甲班平均分为116.3分,乙班平均分为114.8分,丙班平均分为115.5分,成绩分布直方图如图7­17,据此推断高考中考生发挥差异较小的班级是()图7­17A.甲 B.乙C.丙 D.无法判断C[由于平均分相差不大,由直方图知丙班中,学生成绩主要集中在110~120区间上且平均分较高,其次是乙,分数相对甲来说比较集中,相对丙而言相对分散.数据最分散的是甲班,虽然平均分较高,但学生两极分化,彼此差距较大,根据标准差的计算公式和性质知甲的方差大于乙的方差大于丙的方差,所以丙班的学生发挥差异较小.故选C.]二、填空题5.已知某单位有40名职工,现要从中抽取5名职工,将全体职工随机按1~40编号,并按编号顺序平均分成5组.按系统抽样方法在各组内抽取一个号码.(1)若第1组抽出的号码为2,则所有被抽出职工的号码为________;(2)分别统计这5名职工的体重(单位:kg),获得体重数据的茎叶图如图7­18所示,则该样本的方差为________.图7­18(1)2,10,18,26,34(2)62[(1)分段间隔为eq\f(40,5)=8,则所有被抽出职工的号码为2,10,18,26,34.(2)eq\x\to(x)=eq\f(1,5)(59+62+70+73+81)=69.s2=eq\f(1,5)[(59-69)2+(62-69)2+(70-69)2+(73-69)2+(81-69)2]=62.]6.如图7­19是某个样本的频率分布直方图,分组为[100,110),[110,120),[120,130),[130,140),[140,150),已知a,b,c成等差数列,且区间[130,140)与[140,150)上的数据个数相差10,则区间[110,120)上的数据个数为__________.图7­1920[由频率分布直方图得[130,140)上的频率为0.025×10=0.25,[140,150)上的频率为0.015×10=0.15.设样本容量为x,则由题意知0.25x-0.15x=0.1x=10,解得x=100.因为a

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论