2016年高中数学-第二章-统计-2.2.1用样本的频率分布估计总体分布学案-新人教A版必修3_第1页
2016年高中数学-第二章-统计-2.2.1用样本的频率分布估计总体分布学案-新人教A版必修3_第2页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2. 2 用样本估计总体2. 2.1 用样本的频率分布估计总体分布1 .问题导航(1) 画频率分布直方图有哪些步骤?频率分布直方图的特征是什么?(2) 什么是频率分布折线图?(3) 什么是总体密度曲线?(4) 画茎叶图的步骤有哪些?茎叶图有什么特征?2例题导读对“ P68探究”内容的导读:同样一组数据,如果组距不同,横轴、纵轴的单位不同,得 到的图的形状也会不同不同的形状给人以不同的印象,这种印象有时会影响我们对总体的 判断.对“ P68思考”内容的导读:由于约有 88%勺居民月均用水量都在 3 吨以下,因此,只要将 月用水量标准制定为 3 吨时,就可以满足 85%A 上的居民每月的用水量不超

2、过标准.对“ P69思考”内容的导读:不同的样本得到的频率分布折线图不同;即使对于同一样本, 不同的分组情况得到的频率分布折线图也不同,因此不能由样本的频率分布折线图得到准确 的总体密度曲线.1 .频率分布表与频率分布直方图(1) 频数与频率将一批数据按要求分成若干个组,数据分布在各个小组的个数,叫做该组的频数,每 _ 频数除以全体数据总数的商,叫做该组的频率,率反映数据在每组中所占比例的大小.(2) 样本的频率分布与频率分布表1相关概念根据随机所抽样本的大小,分别计算数据分布在各个小组的频率,这些频率的分布规律 (取值情况),就叫做样本的频率分布为了能直观地显示样本的频率分布情况,通常我们会

3、 将样本的分组情况、数据分布在各个小组的频数以及计算所得的相应频率列在一张表中,叫 做样本频率分布表.2求一组数据的频率分布表的步骤:a .求极差.b .决定组距与组数.c .将数据分组.d .列频率分布表.(3) 用样本的频率分布估计总体的分布从一个总体得到一个包含大量数据的样本时,很难从一个个的数字中直接看出样本所包 含的信息.如果把这些数据形成频率分布表或频率分布直方图,就可以比较清楚地看出样本 数据的特征,从而估计总体的分布情况.(4) 频率分布直方图1在频率分布直方图中,纵轴表示频率/组距,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积的总和等于1.2频率分布直方图的

4、绘制方法与步骤:a .先制作频率分布表,然后作直角坐标系,横轴表示总体,纵轴表示b .把横轴分成若干段,每一段对应一个组.以每个组距为底,以各频率除以组距的商为 高,分别画成矩形这样得到的直方图就是频率分布直方图.2 频率分布折线图与总体密度曲线(1) 频率分布折线图频率组距 -连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2) 总体密度曲线一般地,当总体中的个体数较多时,抽样时样本容量就不能太小可以想象,随着样本 容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图会越来越接近于一 条光滑曲线,统计中称这条光滑曲线为总体密度曲线,如图所示.3 .茎叶图茎叶图也

5、是用来表示数据的一种图,其画法如下:(1) 将一个或两个样本的数据分为“茎” _ (高位)和“叶(低位)两部分.(2) 将最小茎和最大茎之间的数按大小、次序排成一列.(3) 将各个数据的“叶”按大小次序写在其茎一侧或两侧.1.判断下列各题.(对的打“/,错的打“x”)(1) 频率分布折线图与总体密度曲线无关;()(2) 频率分布折线图就是总体密度曲线;()(3) 样本容量很大的频率分布折线图就是总体密度曲线;()(4) 如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于总体密度曲线;()(5) 频率分布直方图不能保留原始数据,而茎叶图可以保留原始数据,而且可以随时记 录

6、.()解析:总体密度曲线通常都是用样本频率分布估计出来的.如果样本容量无限增大,分 组的组距无限减小,那么频率分布折线图就会无限接近于一条光滑曲线,这条光滑曲线就是 总体密度曲线.答案:(1)X(2)X(3)x(4)V(5)V2 .一个容量为 32 的样本,分成 5 组,已知第三组的频率为0.375,则另外四组的频数之和为_ .解析:由题意,得第三组的频数为32X0.375 = 12.另外四组的频数之和为32 - 12= 20.答案:203 .在频率分布直方图中,各小长方形的面积表示什么?它们的总和是多少?解:各小长方形的面积表示样本中落在该组内的数据的频率;总和等于1.1.茎叶图的优缺点优点

7、:用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有 数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录 与表示.缺点:茎叶图在样本数据较多时,显得不太方便,而且茎叶图只方便记录两组的数据, 两组以上的数据虽然能够记录,但是没有表示两组记录那么直观、清晰.2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录(这对于教练员发现运动员现场状态特别有用);而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.3.频率分布表和频率分布直

8、方图之间的密切关系是显然的,它们只不过是相同的数据 的两种不同的表达方式,茎叶图和频率分布表极为类似,事实上,茎相当于频率分布表中的分组;茎上叶的数目相当于频率分布表中指定区间组的频数.作频率分布表、绘制频率分布直方图学生用书P37丁:营调查某校高三年级男生的身高, 随机抽取 40 名高三男生,实测身高数据(单位:cm)如下:171163163166166168168160168165171169167169151168170168160174165168174159167156157164169180176157162161158164163163167161(1) 作出频率分布表;(2)

9、画出频率分布直方图.解最低身高 151 cm,最高身高 180 cm,它们的差是 180- 151 = 29,即极差为 29; 确定组距为 4,组数为 8,列表如下:分组频数频率149.5 , 153.5)10.025153.5 , 157.5)30.075157.5 , 161.5)60.15161.5 , 165.5)90.225165.5 , 169.5)140.35169.5 , 173.5)30.075173.5 , 177.5)30.075177.5 , 181.510.025合计401(2)频率分布直方图如图所示.互动探究本例中,画出相应的频率分布折线图.解:连接频率分布直方图中

10、各小长方形上端的中点,就得到频率分布折线图如下: 方法归纳(1)在列频率分布表时,极差、组距、组数有如下关系: 极差极差1若极距为整数,则组晅=组数;极差极差2若组距不为整数,则 组距的整数部分+ 1=组数.(2)组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,使数据的分布规 律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量 不超过 100,按照数据的多少常分为512 组,一般样本容量越大,所分组数越多.1美国历届总统中,就任时年纪最小的是罗斯福,他于1901 年就任,当时年仅 42 岁;就任时年纪最大的是里根,他于 1981 年就任,当时 69 岁

11、.下面按时间顺序(从 1789 年的华 盛顿到 2009年的奥巴马,共 44 任)给出了历届美国总统就任时的年龄:57, 61, 57, 57, 58, 57, 61,54,68, 51, 49, 64, 50,48, 65, 52, 56, 46, 54,49, 51, 47, 55, 55, 54, 42, 51,56,55, 51, 54, 51, 60,62, 43, 55, 56, 61, 52,69, 64, 46, 54, 48(1) 将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图;(2) 用自己的语言描述一下历届美国总统就任时年龄的分布情况.解:(1)以 4

12、为组距,列表如下:分组频数累计频数频率41.5 , 45.5)20.045 545.5 , 49.5)正 T70.159 149.5 , 53.5)正卞正正正亠80.181 853.5 , 57.5)160.363 657.5 , 61.5)正50.113 661.5 , 65.5)40.090 965.5 , 69.520.045 5合计441.00画频率分布直方图及频率分布折线图如下:从频率分布表中可以看出,将近60%勺美国总统就任时的年龄在5 0 岁 至 6 0 岁 之 间 ,45 岁以下以及 65 岁以上就任的总统所占的比例相对较小.茎叶图及其应用丁砂 某化肥厂甲、乙两个车间包装肥料,

13、在自动包装传送带上每隔30 分钟抽取一包产品,称其质量,分别记下抽查记录如下(单位:千克):甲:5251 4948534849乙:6065 4035256560画出茎叶图,并说明哪个车间的产品质量比较稳定.解茎叶图如图所示(茎为十位上的数字):由图可以看出甲车间的产品质量较集中,而乙车间的产品质量较分散,所以甲车间的产 品质量比较稳定.方法归纳画茎叶图时,用中间的数表示数据的十位和百位数,两边的数分别表示两组数据的个位 数要先确定中间的数取数据的哪几位,填写数据时边读边填比较数据时从数据分布的对 称性、中位数、稳定性等几方面来比较.绘制茎叶图的关键是分清茎和叶, 一般地说数据是两位数时, 十位

14、数字为“茎”, 个位 数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”,解题时 要根据数据的特点合理选择茎和叶.2 从两个班中各随机抽取10 名学生,他们的数学成绩如下:甲班:76, 74, 82, 96, 66, 76, 78, 72, 52, 68乙班:86,84, 62, 76, 78, 92, 82, 74, 88, 85画出茎叶图并分析两个班学生的数学学习情况.解:茎叶图如下:由茎叶图可知,乙班的数学成绩较好,而且较稳定.频率分布直方图的综合应用巧:紗为了检测某种产品的质量,抽取了一个容量为100 的样本,数据的分组情况与频数如下:10.75 , 10.85)

15、 , 3; 10.85 , 10.95) , 9; 10.95 , 11.05) , 13; 11.05 , 11.15) , 16; 11.15 ,11.25) , 26; 11.25 , 11.35) , 20; 11.35 , 11.45) , 7; 11.45 , 11.55) , 4; 11.55 , 11.65 , 2(1) 列出频率分布表;(2) 画出频率分布直方图以及频率分布折线图;(3) 据上述图表,估计数据落在 10.95 , 11.35)范围内的可能性是百分之几;(4) 数据小于 11.20 的可能性是百分之几.解(1)频率分布表如下:分组频数频率10.75 , 10.8

16、5)30.0310.85 , 10.95)90.0910.95 , 11.05)130.1311.05 , 11.15)160.1611.15 , 11.25)260.2611.25 , 11.35)200.2011.35 , 11.45)70.0711.45 , 11.55)40.0411.55 , 11.6520.02合计1001.00(2)频率分布直方图及频率分布折线图,如图(3) 由上述图表可知数据落在10.95 , 11.35)范围内的频率为1 - (0.03 + 0.09) - (0.07+ 0.04 + 0.02) = 0.75 = 75% 即数据落在10.95 , 11.35)

17、范围内的可能性是75%.(4) 数据小于 11.20 的可能性即数据小于11.20 的频率,设为x,则(X 0.41) - (11.2011.15) = (0.67 0.41) - (11.25 11.15),所以X 0.41 = 0.13,即x= 0.54 ,从而估计数据小于11.20 的可能性是 54%.方法归纳(1) 用样本的频率分布估计总体的分布,是列频率分布表和画频率分布直方图的主要目 的,频率分布表比较准确地反映样本的频率分布,而频率分布直方图则能直观地反映样本的 频率分布.(2) 频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在 某一范围内的频率,可近似

18、地估计总体在这一范围内的可能性.3. (1)随机抽取 100 名学生, 测得他们的身高(单位: cm), 按照区间160 , 165) , 165 , 170) , 170 ,175) , 175 , 180) , 180 , 185分组,得到样本身高的频率分布直方图如图.1求频率分布直方图中x的值及身高在 170 cm 以上的学生人数;2将身高在170 , 175) , 175 , 180) , 180 , 185区间内的学生依次记为A,B,C三个组,用分层抽样的方法从三个组中抽取6 人,求从这三个组分别抽取的学生人数.解:由频率分布直方图可知5x= 1 5X(0.07 + 0.04 + 0

19、.02 + 0.01),1所以x=X(1 5X0.14) = 0.06.5即身高在 170 cm 以上的学生人数为 100X(0.06X5+ 0.04X5 + 0.02X5) = 60 人. A, B,C三组的人数分别为 30 人,20 人,10 人.6 630X60= 3 人,20X60= 2 人,(2)从高一学生中抽取50 名参加调研考试,成绩的分组及各组的频数如下(单位:分):40 , 50) , 2; 50 , 60) , 3; 60 , 70) , 10; 70 , 80), 15; 80 , 90) , 12; 90 , 100 , 8.1列出样本的频率分布表;2画出频率分布直方图

20、;3估计成绩在70 , 80)分的学生所占总体的百分比;4估计成绩在70 , 100分的学生所占总体的百分比.因此应该从A,B, C三组中每组各抽取610X60=1人.解:频率分布表如下:成绩分组频数频率40 , 50)20.0450 , 60)30.0660 , 70)100.270 , 80)150.380 , 90)120.2490 , 10080.16合计501.00由题意知组距为 10,取小矩形的高为 组距,计算得到如下的数据表:成绩分组频率小矩形高40 , 50)0.040.00450 , 60)0.060.00660 , 70)0.20.0270 , 80)0.30.0380 ,

21、 90)0.240.02490 , 1000.160.016合计1.00根据表格画出频率分布直方图如图:3由频率分布表可知成绩在 70, 80)分的学生所占总体的百分比约是0.3 = 30%.4估计成绩在70 , 100分的学生所占总体的百分比是0.3 + 0.24 + 0.16 = 0.7 = 70%.刑:匚:某良种品种B进行对照试验两种小麦各种植了25 亩,所得亩产数据(单位:千克)如下:品种 A: 357, 359, 367, 368, 375, 388, 392, 399, 400, 405, 412, 414, 415, 421, 423, 423,427, 430, 430, 43

22、4, 443, 445, 445, 451, 454品种 B: 363 , 371 , 374 , 383 , 385 , 386 , 391 , 392 , 394 , 394 , 395 , 397 , 397 , 400 ,401, 401, 403, 406, 407, 410, 412, 415, 416, 422 , 430(1) 完成数据的茎叶图;(2) 用茎叶图处理现有的数据,有什么优点?(3) 通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.解(1)(2) 由于每个品种的数据都只有25 个,样本不大,画茎叶图很方便;此时茎叶图不仅清晰明了地展示了数据的分

23、布情况,便于比较,没有任何信息损失,而且还可以随时记录新的 数据.(3) 通过观察茎叶图可以看出:品种A的亩产量比品种B高;品种A的亩产量比较分散,故品种A的亩产稳定性较差.感悟提高数形结合思想是中学数学很重要的方法之一,是高考的重要内容之一,是根据数的结构 特征,构造出与之相应的几何图形,并利用图形的特性和规律,解决数的问题.1 没有信息的损失,所有的原始数据都可以从图中得到的统计图是()A.总体密度曲线 B.茎叶图数学思想统计问题中的数形结合思想C.频率分布折线图D.频率分布直方图解析:选 B.所有的统计图中,仅有茎叶统计图完好无损地保存着所有的数据信息.2. (2015 湖南师大附中月考

24、)某厂对一批元件的长度(单位:mm 进行抽样检测,得到如图所示的频率分布直方图若长度在区间90, 96)内的元件为合格品,则估计这批元件中合格产品所占的百分比是()A. 70%B. 75%C. 80%D. 85%解析:选 C.易知在区间90 , 96)内的直方图的面积S= 1 (0.027 5 + 0.027 5 + 0.0450)X2= 0.8,故合格品所占的百分比是80%.3.(2014 高考江苏卷)为了了解一片经济林的生长情况,随机抽测了其中60 株树木的底部周长(单位:cm),所得数据均在区间80,130上,其频率分布直方图如图所示,则在抽 测的 60株树木中,有 _ 株树木的底部周长

25、小于100 cm.解析:底部周长在80, 90)的频率为 0.015X10= 0.15,底部周长在90 , 100)的频率为 0.025X10= 0.25,样本容量为 60,所以树木的底部周长小于100 cm 的株数为(0.15 +0.25 )X60=24.答案:24活学巧练跟踪验证A.基础达标1在抽查某产品尺寸的过程中,将其尺寸分成若干组,a,b)是其中一组,抽查出的个体数在该组内的频率为m该组直方图的高为h,则|ab|的值等于()A.hmmB.hhC.-D.与m h无关m解析:选B.小长方形的高=频率组距,|ab|频率m小长方形的高-h.2. 某雷达测速区规定:凡车速大于或等于70 km/

26、h 的汽车视为“超速”,并将受到处罚,如图是某路段的一个检测点对300 辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可得出将被处罚的汽车数为()A. 30 辆B. 40 辆C. 60 辆D. 80 辆解析:选 C.车速大于或等于 70 km/h 的汽车数为 0.02X10X300= 60(辆).故选 C.3. 某超市连锁店统计了城市甲、乙的各16 台自动售货机在 12: 00 至 13: 00 间的销售金额,并用茎叶图表示如图则可估计有()A. 甲城市销售额多,乙城市销售额不够稳定B. 甲城市销售额多,乙城市销售额稳定C. 乙城市销售额多,甲城市销售额稳定D. 乙城市销售额多,甲城市

27、销售额不够稳定解析:选 D.十位数字是 3、4、5 时乙城市的销售额明显多于甲,估计乙城市销售额多, 甲的数字过于分散,不够稳定.故选D.4. (2013 高考辽宁卷)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:20 , 40) , 40 , 60) , 60 , 80) , 80 , 100.若低于 60 分的人数是 15, 则该班的学生人数是()900A. 45B. 50C. 55D. 60解析:选 B.根据频率分布直方图的特点可知,低于5. (2015 宿迁质检)某校 100 名学生的数学测试成绩频率分布直方图如图所示,分数不 低于a即为优秀,如果优秀的人数为

28、20,则a的估计值是()A. 130B. 140C. 133D. 137解析:选 C.由已知可以判断a (130, 140),所以(140 a)X0.015 + 0.01X10X100=20.解得a 133.6.(2015 辽宁名校联考)为了解一片经济林的生长情况,随机测量了其中100 株树木的底部周长(单位:cm),根据所得数据画出样本的频率分布直方图(如图),那么这 100 株树木中,底部周长小于 110 cm 的树有_ 株.解析:(0.01X10+ 0.02X10+ 0.04X10)X100=70.答案:707. (2015 丹东质检)茎叶图表示的是甲、乙两人在 5 次综合测甲乙评中的成

29、绩,其中一个数字被污损,若乙的总成绩是445,则污损rrvTTT的数字是-.2 10 9*9解析:设污损的叶对应的成绩是X,由茎叶图可得 445= 83 +83 + 87+x+ 99,解得x= 93,故污损的数字是 3.答案:38.(2015 江西宜春质检)为了帮助班上的两名贫困生解决经济困难,班上的20 名同学捐出了自己的零花钱,他们的捐款数(单位:元)如下:19, 20, 25, 30, 24, 23, 25, 29,27, 27, 28, 28, 26, 27, 21, 30, 20, 19, 22, 20.班主任老师准备将这组数据制成频率分 布直方图,以表彰他们的爱心.制图时先计算最大

30、值与最小值的差是 _ .若取组距为 2,则应分成 _ 组;若第一组的起点定为18.5,则在26.5 , 28.5)内的频数为 _ .11解析:由题意知,极差为 30 19= 11;由于组距为 2,则2= 5.5 不是整数,所以取 6 组; 捐款数落在26.5 , 28.5)内的有 27, 27, 28, 28, 27 共 5 个,因此频数为 5.答案:11659. 某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下:甲:95, 81, 75, 91, 86, 89, 71, 65, 76, 88, 94, 110, 107;乙:83, 86, 93, 99, 88, 10

31、3, 98, 114, 98, 79, 78, 106, 101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.解:甲、乙两人数学成绩的茎叶图如图所示.60 分的频率是(0.005 + 0.01)X20=0.3,所以该班的学生人数是1503=50.900所以参加考试0.05 =18 000.从这个茎叶图上可以看出,乙同学的得分情况是大致对称的;甲同学的得分情况也大致 对称,相对乙来说有些分散.乙同学的成绩比较稳定,总体情况比甲同学好.10.某市高三数学抽测考试中,对90 分以上(含 90 分)的成绩进行统计,其频率分布直 方图如图所示,若130 , 140)分数段的人数为 900

32、,求90 , 100)分数段的人数.解:由频率分布直方图可得 130 , 140)分数段的人数所占的百分比为0.005X10= 0.05 ,因此90 , 100)分数段的人数为18 000 X (0.045 X 10) = 8 100.B.能力提升1.(2013 高考四川卷)某学校随机抽取 20 个班,调查各班中,有网上购物经历的人数,所得数据的茎叶图如图所示以组距为I5 将数据分组成0 , 5) , 5 , 10),30 , 35) , 35 , 40时,、所作的频率分布直方图是()解析:选 A.法一:由题意知样本容量为20,组距为 5.列表如下:分组频数频率0 , 5)10.015 , 1

33、0)10.0110 , 15)40.0415 , 20)20.0220 , 25)40.0425 , 30)30.0330 , 35)30.0335 , 4020.02合计201观察各选择项的频率分布直方图知选A.法二:由茎叶图知落在区间0 , 5)与5 , 10)上的频数相等,故频率、频距也分别相等.比较四个选项知 A 正确,故选 A.2 某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单元:克)数据绘制的频率分布直方图,其中产品净重的范围是96 , 106,样本数据分组为96 , 98) ,98 , 100) ,100 , 102) , 102 , 104) , 104 ,

34、 106,已知样本中产品净重小于 100 克的个数是 36, 则样本中净重大于或等于 98 克并且小于 104 克的产品的个数是()A. 90B. 75C. 60D. 45解析:选 A.产品净重小于 100 克的频率为(0.050 + 0.100)X2= 0.300 ,已知样本中产品36净重小于 100 克的个数是 36,设样本容量为n,则=0.300,所以n= 120,净重大于或等于98 克并且小于 104 克的产品的频率为(0.100 + 0.150 + 0.125)X2= 0.75,所以样本中净重大 于或等于98 克并且小于 104 克的产品的个数是120X0.75 = 90.故选 A.3. 有一个容量为 200 的样本,其频率分布直方图如图所示,根据样本的频率分布直方图估计,样本数据落在区间10 , 12内的频数为 _.解析:设样本

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论