




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三节用样本估计总体1. 了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶 图,理解它们各自的特点.2 理解样本数据标准差的意义和作用,会计算数据标准差.3 能从样本数据中提取基本的数字特征(平均数、标准差),并给出合理解释.4 会用样本的频率分布估计总体的分布,会用样本的基本数字特征估计总体的基本数字 特征,理解用样本估计总体的思想.5 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.主干知汉整合07_课前拍才槌固棍基知识点一用样本的频率分布估计总体分布i通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率 分布,另一种是用样
2、本的数字特征估计总体的数字特征.2._ 在频率分布直方图中,纵轴表示,数据落在各小组内的频率用_表示,各小长方形的面积总和等于 _ .3 .连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.随着样本容量的增加,作图时所分的 _增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为 _ ,它能够更加精细的反映出总体在各个范围内取值的百分比.4 当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且 可以随时记录,给数据的记录和表示都带来方便.答案频率2.组距各小长方形的面积13 .组数总体密度曲线-2 -对点快练1.判断正误(1)在频率
3、分布直方图中,小矩形的高表示频率.()-3 -(2)频率分布直方图中各个长方形的面积之和为1.()答案:XV2 . (2016 山东卷)某高校调查了 200 名学生每周的自习时间(单位:小时),制成了如图 所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20),20,22.5) , 22.5,25) , 25,27.5) , 27.5,30.根据直方图,这 200 名学生中每周的自习时间不少于 22.5 小时的人数是()C. 120D. 140解析:由频率分布直方图可知,这200 名学生每周的自习时间不少于22.5 小时的频率为(0.16 + 0.08 + 0
4、.04)X2.5 = 0.7,故这 200 名学生中每周的自习时间不少于22.5 小时的人数为 200X0.7 = 140.故选 D.答案:D3甲、乙两个班各随机选出15 名同学进行测验,所得成绩的茎叶图如图从图中看_班的平均成绩较高.A. 5694 187 6 42 174 46乙45762 5972 578 981 447 992-4 -解析:结合茎叶图中成绩的情况可知,乙班平均成绩较高.答案:乙知识点二用样本的数字特征估计总体的数字特征1 众数、中位数、平均数(1) 众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.(2) 中位数:将一组数据按大小依次排列,把处在最中间位置的一个
5、数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3) 平均数:样本数据的算术平均数,即 7 =_ .在频率分布直方图中,中位数左边和右边的直方图的面积 _2 .样本方差、标准差标准差 s =_ .其中 xn是样本数据的第 n 项,n 是样本容量, 匚是平均数标准差是反映总体波动大小的特征数,样本方差是标准差的平方通常用样本方差估计总体方差,当样本容量接近总体 容量时,样本方差很接近总体方差.答案1左1 (3)n(X1+X2+ +Xn)相等/1 -2 - 2 - 22.-X1X+X2X+XnX.n-对点快练4 .某厂 10 名工人在一个小时内生产零件的个数分别是15,17,14,10,1
6、5,17,17,16,14,12设该组数据的平均数为a,中位数为 b,众数为 c,则有()A. abcB.bcaC. cab解析:把该组数据按从小到大的顺序排列为10,12,14,14,15,15,16,17,17,17,其平均数115+ 15a= 10X(10 + 12+ 14+ 14+ 15+ 15+ 16+ 17 + 17+ 17) = 14.7,中位数 b= = 15,众数 c=17,则 abba-5 -(2)命中环数的标准差为_.解析:(1) x =7 + 8+ 7 + 9+ 5 + 4+ 9+ 10+ 7 + 410212 2 2 2 2 2 2(2)s =而(7 7) + (8
7、7) + (7 7) + (9 7) + (5 7) + (4 7) + (9 7) + (10 7)2 2+ (7 7) + (4 7) = 4,二 s= 2.答案:(1)7(2 )202热点一频率分布直方图及应用考向 1 求频率与概率【例 1】某电子商务公司对 10 000 名网络购物者 2014 年度的消费情况进行统计,发现消费金额(单位:万元)都在区间0.3,0.9内,其频率分布直方图如图所示.(1) 直方图中的 a=_.(2) 在这些购物者中,消费金额在区间0.5,0.9内的购物者的人数为 _ .【解析】 由频率分布直方图及频率和等于1 可得 0.2X0.1 + 0.8X0.1 +
8、1.5X0.1 +2X0.1 + 2.5X0.1 + ax0.1 = 1,解得 a= 3,消费金额在区间0.5,0.9 内的频率为 0.2X0.1 + 0.8X0.1 +2X0.1 + 3X0.1 =0.6,所以消费金额在区间0.5,0.9内的购物者的人数为0.6X10 000=6 000.【答案】 (1)3(2)6 000考向 2 求样本的数字特征-6 -频率0.035缈0.030 0.025 0.020 0.015 0.010 0.005o 405060708090100分数【例 2】某校从参加高一年级期中考试的学生中随机抽出60 名学生,将其物理成绩(均为整数)分成六段40,50) ,
9、50,60),90,100后得到如图所示的频率分布直方图,观察 图形的信息,回答下列问题:(1)求分数在70,80)内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平 均分.【解】(1)设分数在70,80)内的频率为X,根据频率分布直方图,有(0.010 + 0.015X2+ 0.025+ 0.005)X10+x= 1,可得x= 0.3,所以频率分布直方图如图所示.频率(2)平均分:45X0.1 + 55X0.15 + 65X0.15 + 75X0.3 + 85X0.25 + 95X0.05 =【总结反思】频率分布直方图直观形象
10、地表示了样本的频率分布,从这个直方图上可以求出样本数据在各个组的频率分布根据频率分布直方图估计样本(或者总体)的平均值时,一般是采取每组中值乘以各组的频率的方法.71(分).-7 -(2016 四川卷)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100 位居民每人的月均用水量(单位:吨),将数据按照0,0.5), 0.5,1),4,4.5分成 9 组,制成了如图所示的频率分布直方图.频率组距0.50.0,42.(I)求直方图中a的值;(n)设该市有 30 万居民,估计全市居民中月均用水量不低于3 吨的人数,说明理由;(川)估计居民月均用
11、水量的中位数.解:(I)由频率分布直方图,可知:月均用水量在 0,0.5)的频率为 0.08X0.5 = 0.04.同理,在0.5,1), 1.5,2) , 2,2.5) , 3,3.5) , 3.5,4) , 4,4.5)组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由 1 (0.04 + 0.08 + 0.21 + 0.25 + 0.06 + 0.04 + 0.02) = 0.5Xa+ 0.5Xa,解得 a= 0.30.(n)由(I) , 100 位居民月均用水量不低于 3 吨的频率为 0.06 + 0.04 + 0.02 = 0.12.由以上样本的频率分布,可
12、以估计30 万居民中月均用水量不低于3 吨的人数为 300000X0.12=36 000.(川)设中位数为 x 吨.因为前 5 组的频率之和为 0.04 + 0.08 + 0.15 + 0.21 + 0.25 = 0.730.5 ,而前 4 组的频率之和为 0.04 + 0.08 + 0.15 + 0.21 = 0.480.5 ,所以 2 x2.5.由 0.50X(x 2) = 0.5 0.48,解得 x = 2.04.故可估计居民月均用水量的中位数为2.04 吨.热点二茎叶图及应用【例 3】(2017 福州模拟)某大学为调查来自南方和北方的大学生的身高差异, 从 2013 级的年龄在 181
13、9 岁之间的大学生中随机抽取了来自南方和北方的大学生各10 名,测量得O.AAO.620045二O.1_-1 1-522.5 3 3.54 4.5月均用水量(吨)-8 -他们的身高(单位:cm)如下:南方:158,170,166,169,180,175,171,176,162,163.北方:183,173,169,163,179,171,157,175,178,166.画出题中两组数据的茎叶图,并根据茎叶图对来自南方和北方的大学生的身高进行比较, 写出两个统计结论.【解】 题中两组数据的茎叶图如图所示:南方北方0183651017135 8996321636 98157统计结论:北方大学生的平
14、均身高大于南方大学生的平均身高;南方大学生的身高比北方大学生的身高更整齐;南方大学生的身高的中位数是169.5 ,北方大学生的身高的中位数是 172 :南方大学生的身高基本上是对称的,而且大多数集中在均值附近,北方大学生的身高分布较分散【总结反思】(1)茎叶图保留了全部的样本数据;(2)从茎叶图上可以发现样本数据的分散与集中程度,从而对样本数据的平均值和方差作出定性判断(1)某中学从甲、乙两个艺术班中各选出 7 名学生参加市级才艺比赛, 他们取得的成绩(满 分100 分)的茎叶图如图所示,其中甲班学生成绩的众数是85,乙班学生成绩的中位数是 83,则x+y的值为()A.6B. 8C. 9D.
15、11甲乙甲乙86979 8 2 7 85 x0811 y6 5 8 6 8 86291 1 629131 题图2 题图(2)为了从甲、乙两人中选一人参加数学竞赛,老师将二人最近6 次数学测试的分数进行-9 -统计,甲、乙两人的平均成绩分别是7甲、7乙,则下列说法正确的是()A.7甲X乙,乙比甲成绩稳定,应选乙参加比赛-10 -B. x甲x乙,甲比乙成绩稳定,应选甲参加比赛C. 7甲X乙,甲比乙成绩稳定,应选甲参加比赛D. 7甲X乙,乙比甲成绩稳定,应选乙参加比赛解析:(1)由茎叶图可知,茎为 8 时,甲班学生成绩对应数据只能是80,80 +x,85,因为甲班学生成绩众数是 85,所以 85 出
16、现的次数最多,可知x= 5.由茎叶图可知,乙班学生成绩为 76,81,81,80 + y,91,91,96 ,由乙班学生成绩的中位数是83,可知 y= 3.所以x+y= 8.故选 B.-87.33.所以x甲x乙,又由乙的茎集中在8,而甲较分散,即乙比甲成绩稳定故选D.答案:B(2)D热点三样本的数字特征甲乙6 4 2 2 58 6 3 33 2 3 49 7 3414 51 51 3【例 4】(必修P79 练习第 3 题改编)将甲、乙两个篮球队 10 场比赛的得分数据整理 成如图所示的茎叶图,由图可知()A.甲、乙两队得分的中位数相等B.甲、乙两队得分的平均数相等C.甲、乙两队得分的极差相等D
17、.甲、乙两队得分的方差相等1故选项A错误;由平均数定义得x甲=后(24 + 26 + 33 + 33 + 36 + 38 + 43 + 47 + 49 + 51) = 38, 1x乙=10(22 + 25+ 32 + 33 + 34 + 41 + 44 + 45 + 51 + 53) = 38,故选项B正确;由极差定义得,甲的极差为 51 -24= 27,乙的极差为 53 22= 31,故选项C错误;由方差定义知,s*=彳 0(24由茎叶图知x甲72+ 78+ 79+ 85+ 86+ 926=82.78+ 86+ 88 + 88 + 91 + 936【解由中位数定义知,甲的中位数为36+ 38
18、2=37,乙的中位数为34+412=37.5-11 -2 2 2 212 2 238) + (26 38) + (51 38) = 79, s乙=亦(22 38) + (25 38) + (53 38)=-12 -99,故选项D错误故选 B.【答案】B【总结反思】平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小对于一组数据x(i = 1,2,3,n),如果将它们改变为x +C(i= 1,2,3,n),其中CM0,则下列结论正确的是()0 x91则 7 个剩余分数的方差为(36B-7A.平
19、均数与方差均不变B.平均数变,方差保持不变C.平均数不变,方差变D.平均数与方差均发生变化(2)将某选手的 9 个得分去掉1 个最高分,去掉 1 个最低分,7 个剩余分数的平均分为91,现场作的 9 个分数的茎叶图后来有1 个数据模糊,无法辨认,在图中以x 表示:解析:(1)依题意,记原数据的平均数为x,方差为 s2,则新数据的平均数为X1+C+X2+C+ +Xn+Cx+C即新数据的平均数改变;新数据的方差1161 用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计 算时一定要准确,在绘制小
20、矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对 总体作出估计.2 .茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图 由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直 方图则损失了样本的一些信息,必须在完成抽样后才能制作.3 .若取值X1,X2,,Xn的频率分别为pi,P2,,pn,则其平均值为Xipi+X2P2+ +Xnpn;若Xi,X2,Xn的平均数为x,方差为 s,贝Uaxi+b, ax2+b,,axn+b的平均数 为 aX+b,方差为a2s2.彈尝 6频率分布直方图易误点梳理利用频率分布直方图估计总体的基本数字特征,简
21、单地说,就是能“制图”,会“用图”,而我们在应用中产生的错误也主要发生在这两个过程中.错误一、制图一一分组不对,频数统计错误【例 u某校在开学之初,以班级为单位,对学生自行购买保险的情况进行了抽样统计,得到了如下 20 个班级购买保险人数情况:i2,9,5,ii,i0,22,28,6,30,i4,i5,i2,i6,26,i8,27,22,i4,i2,5试作出该样本的一个频率分布直方图.【错解】 这组数据的极差为 30- 5 = 25,将组距定为 5,组数定为 5,则可将 20 个数据分为5,i0, i0,i5, i5,20, 20,25, 25,30这 5 组,得到 每组的 频数分别 为-io
22、 -5,8,3,2,4.( 剩余解答略)-14 -【正解】 在上述解答中,各小组频数之和为22,大于样本容量,显然是错误的原因是分组区间全是双闭区间,则数据“ 10”在第一组和第二组均被计入频数,数据“15”也是如此.在分组时,应将 20 个数据分为5,10) , 10,15) , 15,20) , 20,25) , 25,30这 5 组, 得到每组的频数分别为4,7,3,2,4.(剩余解答略)【易错总结】分组时,每组所在区间一般是选择“左闭右开”,而不是“双闭”或“双开”,防止某些数据漏选或被多次计入不同小组,从而导致频数统计失误规避这种失误, 可以检查各组频数之和是否等于样本容量.频率错误
23、二、用图一一将频率分布直方图的纵坐标“频距”误认为是“频率”【例 2】某校高一年级有 400 名学生,将他们的期中考试数学成绩(满分 100 分,成绩均为不低于 40 分的整数)分成六段:40,50) , 50,60),90,100后得到如图的频率分 布直方图求该校高一年级期中考试数学成绩不低于80 分的人数.频率【错解】 根据频率分布直方图知,成绩不低于80 分的频率为 0.025 + 0.01 = 0.035. /该校高一年级期中考试数学成绩不低于80 分的人数为 400X0.035 = 14.【正解】 根据频率分布直方图知,成绩不低于80 分的频率为(0.025 + 0.01)X10=0.35. 该校高一年级期中考试数学成绩不低于80 分的人数为 400X0.35 = 140
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度网络信息安全工程师雇佣劳务合同协议
- 二零二五年度全国旅游合同集合:旅游企业信用体系建设合作协议
- 2025年度高端企业人才招聘与培训人力资源合作协议
- 二零二五年度特色餐饮店厨师团队协作合同
- 二零二五年度民宿租赁合同(含民宿特色旅游线路)
- 二零二五年度离婚后抚养权交接协议范本
- 二零二五年度住宅小区铝合金门窗批量定制安装合同
- 第二章运输需求分析与预测(06)课件
- 2025届高三化学二轮《多视角分析工艺流程试题》
- 《物流系统分析》课件 项目七任务二 认识物流系统仿真
- DeepSeek的应用与部署
- 图解自然资源部《自然资源领域数据安全管理办法》
- 混凝土面板堆石坝接缝止水
- 人教版三年级数学下册各单元教材分析(全册共九个单元)
- 公司驾驶员承诺书
- 中国石油电子招标投标交易平台投标保证金操作指南V1.0
- 城市雕塑工程工程量清单计价定额
- 家具销售合同,家居订购订货协议A4标准版(精编版)
- 假如你爱我的正谱
- 边防检查站港口码头智能监控系统建设技术方案
- 神奇的数字治病法
评论
0/150
提交评论