用样本估计总体58_第1页
用样本估计总体58_第2页
用样本估计总体58_第3页
用样本估计总体58_第4页
用样本估计总体58_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、东北师大附中2011-2012学年高三数学(理)第一轮复习导学案058用样本估计总体 编写教师:杨艳昌 审稿教师:刘彦永一、知识梳理 (一)用样本的频率分布估计总体分布1频率分布、频率分布表、频率分布直方图:频率分布表和频率分布直方图是从各个小组数据在样本容量中所占比例的大小的角度来表示数据分布的规律它可以使我们看到整个样本数据的频率分布情况2. 画频率分布直方图的步骤:(1) 求极差(即一组数据中最大值与最小值的差);(2) 决定组距与组数;(3) 将数据分组;(4) 列频率分布表;(5) 画频率分布直方图3. 频率分布折线图和总体密度曲线:(1) 频率分布折线图:连接频率分布直方图中各小长

2、方形上端的中点,就得到频率分布折线图;(2) 总体密度曲线:随着样本容量的增加,作图时所分的组数增加, 组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,即为总体密度曲线4. 茎叶图:茎是指中间的一列数,叶是从茎的旁边生长出来的数(二)用样本的数字特征估计总体的数字特征5平均数:对于一组数据,平均数 6. 众数:一组数据中出现次数最多的数7. 中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数8标准差:对于一组数据,标准差,标准差是样本数据到平均数的一种平均距离9方差:对于一组数据,方差10利用频率分布直方图估计众数、中位数、平均数

3、:在频率分布直方图中,众数是其最高矩形底边中点的横坐标;中位数左边和右边的直方图的面积相等;平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和二、题型探究探究一:如何求频率分布的有关数据;画频率分布直方图;用样本频率分布估计总体分布分组频数频率145.5149.510.02149.5153.540.08153.5157.5200.40157.5161.5150.30161.5165.580.16165.5169.5mn合计MN例1 某市2011年4月1日 4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物): 61,76,70,56,81,91,92

4、,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45() 完成频率分布表;()作出频率分布直方图;()根据国家标准,污染指数在0 50之间时,空气质量为优;在51 100之间时,为良;在101 150之间时,为轻微污染;在151 200之间时,为轻度污染请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.解:()首先根据题目中的数据完成频率分布表: ()作出频率分布直方图:分组频数频率21461052-411511611711911811101111空气污染指数() 答对下述两条中的一条即可:根

5、据污染指数,确定空气质量为优、良、轻微污染、轻度污染的天数: 该市一个月中空气污染指数有2天处于优的水平,占当月天数的,有26天处于良的水平,占当月天数的,处于优或良的天数共有28天,占当月天数的. 说明该市空气质量基本良好. 轻微污染有2天,占当月天数的. 污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的,超过50%.说明该市空气质量有待进一步改善.例2 为了了解高三年级学生中女生的身高(单位:)情况,某中学对高三年级女生身高进行了一次测量,所得数据整理后,列出了频率分布表(如下表):() 求出表中所表示的数分别是多少?() 画出频率分布直方图

6、,并利用它估计全体高三年级女生身高的众数、中位数和平均数; () 试问:全体女生中身高在哪组范围内的人数最多?并估计高三年级学生中女生的身高在161.5cm以上的概率分组频数频率145.5149.510.02149.5153.540.08153.5157.5200.40157.5161.5150.30161.5165.580.16165.5169.5mn合计MN分组频数频率145.5149.510.02149.5153.540.08153.5157.5200.40157.5161.5150.30161.5165.580.16165.5169.5mn合计MN分组频数频率145.5149.510.

7、02149.5153.540.08153.5157.5200.40157.5161.5150.30161.5165.580.16165.5169.5合计解: (),;, 145.5149.5153.5157.5161.5165.5169.50.0100.1000.0200.0750.0400.005身高 ()频率分布直方图如图,众数是其最高矩形底边中点的横坐标,即; 中位数左边和右边的直方图的面积相等,而,频率分布直方图左边第一个小矩形的面积为0.02,第二个小矩形的面积为0.08,第三个小矩形的面积为0.40,这三个小矩形面积的和恰好等于0.5, 中位数为157.5;平均数的估计值等于频率分

8、布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和()在153.5157.5cm的范围最多,估计在161.5cm以上的概率为0.160.040.2探究二:茎叶图的绘制与运用例3 随机抽取某中学甲乙两班各10名同学,测量他们的身高(单位:),获得身高数据的茎叶图(如图)() 根据茎叶图判断哪个班的平均身高较高;() 计算甲班的样本方差;() 现从乙班这10名同学中随机抽取两名身高不低于173的同学, 求身高为176的同学被抽中的概率.解:()乙班平均身高高于甲班;() 甲班的样本的平均数为 甲班的样本方差为 ()设身高为176的同学被抽中的事件为A; 从乙班10名同学中抽中两名身高不低于1

9、73的同学有:(181,173)、(181,176)、 (181,178)、(181,179)、(179,173)、(179,176)、(179,178)、(178,173)、(178, 176) 、(176,173)共10个基本事件,而事件A含有4个基本事件; 例4 某良种培育基地正在培育一种小麦新品种A,将其与原有的一个优良品种B进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下: 品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,443,445,

10、451,454.品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430.()绘制茎叶图;()用茎叶图处理现有的数据,有什么优点? ()通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.A B9 7 358 7 36 3 5 37 1 4 8 38 3 5 69 2 39 1 2 4 4 5 7 75 0 40 0 1 1 3 6 7 5 4 2 41 0 2 5 6 7 3 3 1 42 2 4 0 0 43 0 5 3 3

11、 44 4 1 45 解:()茎叶图如图所示()用茎叶图处理现有的数据不仅可以看出数据的分布状况,而且可以看出每组中的具体数据.()通过观察茎叶图,可以计算出品种A的平均每亩产量为411.1千克,品种B的平均亩产量为397.8千克,由此可知,品种A的平均亩产量比品种B的平均亩产量高,但品种A的亩产量不够稳定,而品种B的亩产量比较集中在平均产量附近.三、方法提升(1)用频率分布直方图解决相关问题时,应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键. 频率分布直方图有以下几个要点: 纵轴表示频率/组距; 频率分布直方图中各长方形高的比也就是其频率之比; 直方图中每一个矩形的面积是样本

12、数据落在这个区间上的频率,所有的小矩形的面积之和等于1,即频率之和为1. (在绘制小矩形时,宽窄要一致)(2)标准差、方差描述了一组数据围绕平均数波动的大小. 标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小. 因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.(3)几种表示频率分布的方法的优点与不足: 频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便; 频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到

13、在分布表中看不清楚的数据,但从直方图本身得不出原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了; 频率分布折线图的优点是它反映了数据的变化趋势,如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线; 用茎叶图优点是原有信息不会抹掉,能够展示数据的分布情况,但当样本数据较多或数据位数较多时,茎叶图显得不太方便了.五、课时作业一、选择题(1)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是 A8 9 7 9 3 1 6 4 0 2(A)91.5和91.5 (B)91.5和92 (C )91和91.5 (D)9

14、2和92(2)将参加夏令营的600名学生编号为:001,002,600,采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003这600名学生分住在三个营区,从001到300在第营区,从301到495住在第营区,从496到600在第营区,三个营区被抽中的人数依次为 B(A)26, 16, 8, (B)25,17,8 (C)25,16,9 (D)24,17,9(3)样本中共有五个个体,其值分别为,若该样本的平均值为1,则样本方差为 D(A) (B) (C) (D) 2(4)在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其它10个小长方形的面积和的,且样本容量

15、为160,则中间一组的频数为 A(A)32 (B)0.2(C)40 (D)0.25 010515246010515246(5)如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为和,样本标准差分别为和,则 B(A) (B) (C) (D) (6)根据中华人民共和国道路交通安全法规定:车辆驾驶员血液酒精浓度在2080 mg/100ml(不含80)之间,属于酒后驾车,处暂扣一个月以上三个月以下驾驶证,并处200元以上500元以下罚款;血液酒精浓度在80mg/100ml(含80)以上时,属醉酒驾车,处十五日以下拘留和暂扣三个月以上六个月以下驾驶证,并处500元以上2000元以下罚款据法制晚

16、报报道,2010年8月15日至8 月28日,全国查处酒后驾车和醉酒驾车共28800人,如图是对这28800人酒后驾车血液中酒精含量进行检测所得结果的频率分布直方图,则属于醉酒驾车的人数约为 C (A)2160 (B)2880(C)4320 (D)8640(7)统计某校1000名学生的数学水平测试成绩,得到样本频率分布直方图(如图所示),若满分为100分,规定不低于60分为及格,则及格率是 D(A)20% (B)25%(C)6% (D)80%(8)有一个容量为66的样本,数据的分组及各组的频数如下:115,155) 2 155,195) 4 195,235) 9 235,275) 18 275,

17、315) 1l 315,355) 12 355395) 7 395,435) 3 根据样本的频率分布估计,数据落在315,435)的概率约是( ) A B C D二、填空题100110120130140150身高0.0050.0100.0200.035(9)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知;若要从身高在,三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在内的学生中选取的人数应为_. 0.030; 3 (10)将容量为的样本中的数据分成6组,绘制频率分步直方图,若第一组至第六组数据的频率之比为,且前三组数据的

18、频数之和等于27,则等于_. 60(11)一个总体共有100个个体,随机编号0,1,2,99,依从小到大的编号顺序平均分成10个小组,组号依次为1,2,3,10,现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为,那么在第组中抽取的号码个位数字与的个位数字相同,若,则在第8组中抽取的号码是_76(12)下图甲是某市有关部门根据对当地干部的月收入情况调查后画出的样本频率分布直方图,已知图甲中从左向右第一组的频数为4000在样本中记月收入在,的人数依次为图乙是统计图甲中月工资收入在一定范围内的人数的算法流程图,则样本的容量 ;图乙输出的 10000, 60001000150

19、02000250030003500月收入(元)0.00010.00030.00040.00084000图甲开始输入否输出结束图乙是三、解答题(13)从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:甲品种:271273280285285 287292294295301303303307 308310314319323325325 328331334337352乙品种:284292295304306307312313315315316318318 320322322324327329331333336337343356由以上数据设计了如下茎叶图,3 1 277 5 5

20、0 28 45 4 2 29 2 58 7 3 3 1 30 4 6 79 4 0 31 2 3 5 5 6 8 88 5 5 3 32 0 2 2 4 7 97 4 1 33 1 3 6 734 32 35 6甲乙根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论:;解: 1乙品种棉花的纤维平均长度大于甲品种棉花的纤维平均长度(或:乙品种棉花的纤维长度普遍大于甲品种棉花的纤维长度)2甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散(或:乙品种棉花的纤维长度较甲品种棉花的纤维长度更集中(稳定)甲品种棉花的纤维长度的分散程度比乙品种棉花的纤维长度的分散程度更大)分组频率3甲品种棉花的纤维长度的中位数为307mm,乙品种棉花的纤维长度的中位数为318mm4乙品种棉花的纤维长度基本上是对称的,而且大多集中在中间(均值附近)甲品种棉花的纤维长度除一个特殊值(352)外,也大致对称,其分布较均匀(14)为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的重量(单位:千克),并

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论