版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三节用样本估计总体总体分布的估计(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.知识点一频率分布直方图1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.易误提醒(1)易把直方图与条形图混淆:两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,连续随机变量在某一点上是没有频率的.(2)易忽视频率分布直方图中纵轴表示的应为eq\f(频率,组距).必记结论由频率分布直方图进行相关计算时,需掌握下列关系式:(1)eq\f(频率,组距)×组距=频率.(2)eq\f(频数,样本容量)=频率,此关系式的变形为eq\f(频数,频率)=样本容量,样本容量×频率=频数.[自测练习]1.某校100名学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则图中a的值为()A.0.006 B.0.005C.0.0045 D.0.0025解析:由题意知,a=eq\f(1-0.02+0.03+0.04×10,2×10)=0.005.答案:B2.在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积的和的eq\f(1,4),且样本容量为80,则中间一组的频数为()A.0.25 B.0.5C.20 D.16解析:设中间一组的频数为x,依题意有eq\f(x,80)=eq\f(1,4)eq\b\lc\(\rc\)(\a\vs4\al\co1(1-\f(x,80))),解得x=16,应选D.答案:D知识点二茎叶图茎叶图的优点茎叶图的优点是可以保留原始数据,而且可以随时记录,这对数据的记录和表示都能带来方便.易误提醒在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义.[自测练习]3.(惠州模拟)某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员的中位数分别为()A.19、13 B.13、19C.20、18 D.18、20解析:由茎叶图可知,甲的中位数为19,乙的中位数为13.故选A.答案:A知识点三样本的数字特征1.众数、中位数、平均数数字特征定义与求法优点与缺点众数一组数据中重复出现次数最多的数众数通常用于描述变量的值出现次数最多的数.但显然它对其他数据信息的忽视使得无法客观地反映总体特征中位数把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数)中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数如果有n个数据x1,x2,…,xn,那么这n个数的平均数eq\x\to(x)=eq\f(x1+x2+…+xn,n)平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低2.标准差、方差(1)标准差:样本数据到平均数的一种平均距离,一般用s表示,s=eq\r(\f(1,n)[x1-\x\to(x)2+x2-\x\to(x)2+…+xn-\x\to(x)2]).(2)方差:标准差的平方s2s2=eq\f(1,n)[(x1-eq\x\to(x))2+(x2-eq\x\to(x))2+…+(xn-eq\x\to(x))2],其中xi(i=1,2,3,…,n)是样本数据,n是样本容量,eq\x\to(x)是样本平均数.易误提醒(1)众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.(2)平均数反映的是样本个体的平均水平,众数和中位数则反映样本中个体的“重心”.(3)实际问题中求得的平均数、众数和中位数应带上单位.必备方法利用频率分布直方图求众数、中位数与平均数时易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标是众数.(2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.[自测练习]4.对于一组数据xi(i=1,2,3,…,n),如果将它们改变为xi+C(i=1,2,3,…,n),其中C≠0,则下列结论正确的是()A.平均数与方差均不变B.平均数变,方差保持不变C.平均数不变,方差变D.平均数与方差均发生变化解析:依题意,记原数据的平均数为eq\x\to(x),方差为s2,则新数据的平均数为eq\f(x1+C+x2+C+…+xn+C,n)=eq\x\to(x)+C,即新数据的平均数改变;新数据的方差为eq\f(1,n){[(x1+C)-(eq\x\to(x)+C)]2+[(x2+C)-(eq\x\to(x)+C)]2+…+[(xn+C)-(eq\x\to(x)+C)]2}=s2,即新数据的方差不变,故选B.答案:B5.(高考陕西卷)中位数为1010的一组数构成等差数列,其末项为2015,则该数列的首项为________.解析:设等差数列的首项为a1,根据等差数列的性质可得,a1+2015=2×1010,解得a1=5.答案:5考点一频率分布直方图及应用|1.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x的值等于()A.0.12 B.0.012C.0.18 D.0.018解析:依题意,0.054×10+10x+0.01×10+0.006×10×3=1,解得x=0.018,故选D.答案:D2.某市为了节约能源,拟出台“阶梯电价”制度,即制订住户月用电量的临界值a.若某住户某月用电量不超过a度,则按平价计费;若某月用电量超过a度,则超出部分按议价计费,未超出部分按平价计费.为确定a的值,随机调查了该市100户的月用电量,工作人员已将90户的月用电量填在了下面的频率分布表中,最后10户的月用电量(单位:度)为:18,63,43,119,65,77,29,97,52,100.组别月用电量频数统计频数频率①[0,20)②[20,40)正正③[40,60)正正正正④[60,80)正正正正正⑤[80,100)正正正正⑥[100,120](1)完成频率分布表并绘制频率分布直方图;(2)根据已有信息,试估计全市住户的平均月用电量(同一组数据用该区间的中点值作代表);(3)若该市计划让全市75%的住户在“阶梯电价”出台前后缴纳的电费不变,试求临界值a.解:(1)组别月用电量频数统计频数频率①[0,20)40.04②[20,40)正正120.12③[40,60)正正正正240.24④[60,80)正正正正正正300.30⑤[80,100)正正正正正250.25⑥[100,120]正50.05(2)由题意,用每小组的中点值代表该小组的平均月用电量,则100户住户组成的样本的平均月用电量为10×0.04+30×0.12+50×0.24+70×0.30+90×0.25+110×0.05=65(度).用样本估计总体,可知全市居民的平均月用电量约为65度.(3)计算累计频率,可得下表:分组[0,20)[20,40)[40,60)[60,80)[80,100)[100,120]频率0.040.120.240.300.250.05累计频率0.040.160.400.700.951.00由此可知临界值a应在区间[80,100)内,且频率分布直方图中,在临界值a左侧小矩形的总面积(频率)为0.75,故有0.7+(a-80)×0.0125=0.75,解得a=84,由样本估计总体,可得临界值a为84.绘制频率分布直方图时需注意(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确;(2)频率分布直方图的纵坐标是eq\f(频率,组距),而不是频率.考点二茎叶图|1.如图所示的茎叶图是甲、乙两位同学在期末考试中的六科成绩,已知甲同学的平均成绩为85,乙同学的六科成绩的众数为84,则x,y的值分别为()A.2,4B.4,4C.5,6D.6,4解析:eq\x\to(x)甲=eq\f(75+82+84+80+x+90+93,6)=85,解得x=6,由图可知y=4,故选D.答案:D2.(长沙一模)右面的茎叶图是某班学生在一次数学测验时的成绩:根据茎叶图,得出该班男、女生数学成绩的四个统计结论,其中错误的一项是()A.15名女生成绩的平均分为78B.17名男生成绩的平均分为77C.女生成绩和男生成绩的中位数分别为82,80D.男生中的高分段和低分段均比女生多,相比较男生两极分化比较严重解析:对于A,15名女生成绩的平均分为eq\f(1,15)×(90+93+80+80+82+82+83+83+85+70+71+73+75+66+57)=78,A正确;对于B,17名男生成绩的平均分为eq\f(1,17)×(93+93+96+80+82+83+86+86+88+71+74+75+62+62+68+53+57)=77,故B正确;对于D,观察茎叶图,对男生、女生成绩进行比较,可知男生两极分化比较严重,D正确;对于C,根据女生和男生成绩数据分析可得,两组数据的中位数均为80,C错误,故选C.答案:C使用茎叶图时,需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.考点三样本的数字特征|(高考广东卷)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?[解](1)依题意,20×(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)=1,解得x=0.0075.∴直方图中x的值为0.0075.(2)由图可知,最高矩形的数据组为[220,240),∴众数为eq\f(220+240,2)=230.∵[160,220)的频率之和为(0.002+0.0095+0.011)×20=0.45,∴依题意,设中位数为y,∴0.45+(y-220)×0.0125=0.5.解得y=224,∴中位数为224.(3)月平均用电量在[220,240)的用户在四组用户中所占比例为eq\f(0.0125,0.0125+0.0075+0.005+0.0025)=eq\f(5,11),∴月平均用电量在[220,240)的用户中应抽取11×eq\f(5,11)=5(户).(1)平均数与方差都是重要的数字特征,是对总体的一种简明地描述,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)利用方差优化比较时方差越小,效果越好.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲108999乙1010799如果甲、乙两人中只有1人入选,则入选的最佳人选应是________.解析:eq\x\to(x)甲=eq\x\to(x)乙=9,seq\o\al(2,甲)=eq\f(1,5)×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=eq\f(2,5),seq\o\al(2,乙)=eq\f(1,5)×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=eq\f(6,5)>seq\o\al(2,甲),故甲更稳定.答案:甲11.概率与统计的综合问题的答题模板【典例】(12分)(高考全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图B地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100]频数2814106(1)作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图(2)根据用户满意度评分,将用户的满意度分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大?说明理由.[思路点拨](1)因为在频率分布直方图上,纵坐标表示的是频率与组距的比值,根据频数求出频率,进而求出频率与组距的比值,根据频率分布直方图可看出满意度评分的平均值的大小和分散程度,中间的矩形面积越高越集中,越不分散;(2)B地区可直接借助低于70分的频数10求出不满意的概率,A地区利用频率分布直方图中小矩形的面积即为频率,可求出不满意的概率,进而比较大小.[规范解答](1)如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(6分)(2)A地区用户的满意度等级为不满意的概率大.(7分)记CA表示事件:“A地区用户的满意度等级为不满意”;CB表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(CA)的估计值为(0.01+0.02+0.03)×10=0.6,(8分)P(CB)的估计值为(0.005+0.02)×10=0.25.(10分)所以A地区用户的满意度等级为不满意的概率大.(12分)[模板形成]eq\x(分析图表、审核数据)↓eq\x(作出频率分布直方图)↓eq\x(由直方图数据分析相应问题)↓eq\x(利用直方图求概率,作出判断)↓eq\x(反思解题过程注意规范化)A组考点能力演练1.(邢台摸底)样本中共有五个个体,其值分别为0,1,2,3,m.若该样本的平均值为1,则其样本方差为()A.eq\f(\r(10),5) B.eq\f(\r(30),5)C.eq\r(2) D.2解析:依题意得m=5×1-(0+1+2+3)=-1,样本方差s2=eq\f(1,5)(12+02+12+22+22)=2,即所求的样本方差为2,选D.答案:D2.10名工人某天生产同一零件,生产的零件数分别是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有()A.a>b>c B.b>c>aC.c>a>b D.c>b>a解析:依题意,这些数据由小到大依次是10,12,14,14,15,15,16,17,17,17,因此a<15,b=15,c=17,c>b>a,选D.答案:D3.(高考全国卷Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关解析:根据柱形图易得选项A,B,C正确,2006年以来我国二氧化硫年排放量与年份负相关,选项D错误.故选D.答案:D4.(高考山东卷)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为()A.①③ B.①④C.②③ D.②④解析:由题中茎叶图,知eq\x\to(x)甲=eq\f(26+28+29+31+31,5)=29,s甲=eq\r(\f(1,5)[26-292+28-292+29-292+31-292+31-292])=eq\f(3\r(10),5);eq\x\to(x)乙=eq\f(28+29+30+31+32,5)=30,s乙=eq\r(\f(1,5)[28-302+29-302+30-302+31-302+32-302])=eq\r(2).所以eq\x\to(x)甲<eq\x\to(x)乙,s甲>s乙,故选B.答案:B5.(内江模拟)某公司10个销售店某月销售某产品数量(单位:台)的茎叶图如下:分组成[11,20),[20,30),[30,40]时,所作的频率分布直方图是()解析:本题考查统计.利用排除法求解.由直方图的纵坐标是频率/组距,排除C和D;又第一组的频率是0.2,直方图中第一组的纵坐标是0.02,排除A,故选B.答案:B6.(郑州二检)已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中的m、n的比值eq\f(m,n)=________.解析:由茎叶图可知甲的数据为27、30+m、39,乙的数据为20+n、32、34、38.由此可知乙的中位数是33,所以甲的中位数也是33,所以m=3.由此可以得出甲的平均数为33,所以乙的平均数也为33,所以有eq\f(20+n+32+34+38,4)=33,所以n=8,所以eq\f(m,n)=eq\f(3,8).答案:eq\f(3,8)7.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:学生1号2号3号4号5号甲班67787乙班67679则以上两组数据的方差中较小的一个为s2,则s2=________.解析:由数据表可得出乙班的数据波动性较大,则其方差较大,甲班的数据波动性较小,其方差较小,其平均值为7,方差s2=eq\f(1,5)(1+0+0+1+0)=eq\f(2,5).答案:eq\f(2,5)8.(高考湖北卷)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.解析:(1)0.1×1.5+0.1×2.5+0.1×a+0.1×2+0.1×0.8+0.1×0.2=1,解得a=3;(2)区间[0.5,0.9]内的频率为1-0.1×1.5-0.1×2.5=0.6,则该区间内购物者的人数为10000×0.6=6000.答案:(1)3(2)60009.甲、乙两人参加数学竞赛培训.现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,画出茎叶图如图.(1)指出学生乙成绩的中位数;(2)现要从中选派一人参加数学竞赛,你认为应该派哪位学生参加?解:(1)依题意知,学生乙成绩的中位数为eq\f(83+85,2)=84.(2)派甲参加比较合适,理由如下:eq\x\to(x)甲=eq\f(1,8)(70×2+80×4+90×2+9+8+8+4+2+1+5+3)=85,eq\x\to(x)乙=eq\f(1,8)(70×1+80×4+90×3+5+3+5+2+5)=85,seq\o\al(2,甲)=35.5,seq\o\al(2,乙)=41,∵eq\x\to(x)甲=eq\x\to(x)乙,且seq\o\al(2,甲)<seq\o\al(2,乙),∴甲的成绩比较稳定.10.(唐山统考)为了调查某校学生体质健康达标情况,现采用随机抽样的方法从该校抽取了m名学生进行体育测试.根据体育测试得到了这m名学生的各项平均成绩(满足100分),按照以下区间分为七组:[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],并得到频率分布直方图(如图).已知测试平均成绩在区间[30,60)内有20人.(1)求m的值及中位数n;(2)若该校学生测试平均成绩小于n,则学校应适当增加体育活动时间.根据以上抽样调查数据,该校是否需要增加体育活动时间?解:(1)由频率分布直方图知第1组,第2组和第3组的频率分别是0.02,0.02和0.06,则m×(0.02+0.02+0.06)=20,解得m=200.由直方图可知,中位数n位于[70,80)内,则0.02+0.02+0.06+0.22+0.04(n-70)=0.5,解得n=74.5.(2)设第i(i=1,2,3,4,5,6,7)组的频率和频数分别为pi和xi,由图知,p1=0.02,p2=0.02,p3=0.06,p4=0.22,p5=0.40,p6=0.18,p7=0.10,则由xi=200×pi,可得x1=4,x2=4,x3=12,x4=44,x5=80,x6=36,x7=20,故该校学生测试平均成绩是eq\x\to(x)=eq\f(35x1+45x2+55x3+65x4+75x5+85x6+95x7,200)=74<74.5,所以学校应该适当增加体育活动时间.B组高考题型专练1.(高考陕西卷)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93 B.123C.137 D.167解析:由扇形统计图可得,该校女教师人数为110×70%+150×(1-60%)=137.故选C.答案:C2.(高考湖南卷)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.解析:由题意可知,这35名运动员的分组情况为,第一组(130,130,133,134,135),第二组(136,136,138,138,138),第三组(139,141,141,141,142),第四组(142,142,143,143,144),第五组(144,145,145,145,146),第六组(146,147,148
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 重要物资采购合同
- 江西省万载县高中生物 专题2 细胞工程 2.2.2 动物细胞融合与单克隆抗体(练习课)教案 新人教版选修3
- 2024年三年级品社下册《浓浓乡土情》教案 山东版
- 高考化学 专题二 第8讲 有机物的结构、性质和应用教案(含解析)
- 2024秋九年级历史上册 第七单元 工业革命和工人运动的兴起 第20课 第一次工业革命教案 新人教版
- 2023一年级数学上册 二 比一比第1课时 比长短 比高矮教案 苏教版
- 2024年春九年级化学下册 第12单元 化学与生活 课题2 化学元素与人体健康教案 (新版)新人教版
- 文书模板-委托研发合同补充协议
- 年度部门评分表
- 混凝土浇筑课件
- GA 1808-2022军工单位反恐怖防范要求
- 网易公司战略分析报告书
- 2023年中国通用技术(集团)控股有限责任公司招聘笔试题库及答案解析
- GB/T 7409.1-2008同步电机励磁系统定义
- GB/T 34279-2017笼式足球场围网设施安全通用要求
- 四川省工伤保险待遇申请表
- 《火力发电工程建设预算编制与计算标准》使用指南
- 2023年注册物业管理师考试真题
- 运用PDCA提高患者身份识别正确率课件
- 生而为赢-新东方英语背诵美文30篇
- 居住外地离退休人员联系服务工作制度(试行)
评论
0/150
提交评论