版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
问题提出1.随机抽样有哪几种基本的抽样方法?2.随机抽样是收集数据的方法,如何通过样本数据所包含的信息,估计总体的基本特征,即用样本估计总体,是我们需要进一步学习的内容.简单随机抽样、系统抽样、分层抽样.2023/1/171.2.2.1用样本的频率分布估计总体分布2023/1/172.频数:在总体(或样本)中,某个个体出现的次数叫做这个个体的频数。频率:某个个体的频数与总体(或样本)中所含个体的数量的比叫做这个个体的频率。性质:在总体(或样本)中,各个个体的频率之和等于1。2023/1/173.【问题】
我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.通过抽样调查,获得100位居民2007年的月均用水量如下表(单位:t):2023/1/174.3.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2通过抽样我们得到了100户居民的某年的月平均用水量2023/1/175.为了确定一个比较合理的标准a,必须先了解全市居民的日常用水量的分布情况。通过抽样调查了解居民的用水情况。课本66页表2-12023/1/176.思考1:上述100个数据中的最大值和最小值分别是什么?由此说明样本数据的变化范围是什么?思考2:样本数据中的最大值和最小值的差称为极差.如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少组?0.2~4.3(4.3-0.2)÷0.5=8.22023/1/177.思考3:以组距为0.5进行分组,上述100个数据共分为9组,各组数据的取值范围可以如何设定?思考4:如何统计上述100个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?[0,0.5),[0.5,1),[1,1.5),…,[4,4.5].2023/1/178.分组频数累计(划记)频数[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]合计频数累计(划记)正正正正正正正正丅正正正正正正正正丅频数48152225146421004.画频数分布表2023/1/179.思考5:上表称为样本数据的频率分布表,由此可以推测该市全体居民月均用水量分布的大致情况,给市政府确定居民月用水量标准提供参考依据,这里体现了一种什么统计思想?
用样本的频率分布估计总体分布.2023/1/1710.思考6:如果市政府希望85%左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即a的取值)有何建议?88%的居民月用水量在3t以下,可建议取a=3.思考7:在实际中,取a=3t一定能保证85%以上的居民用水不超标吗?哪些环节可能会导致结论出现偏差?2023/1/1711.所得到的结论的统计意义3t这个标准一定能保证85%以上的居民用水不超标吗?不一定!原因1、样本只是总体的代表,并且具有随机性,不同的样本所得到的频率分布表和直方图是不同的。原因2、明年的用水情况与今年不可能完全一样,但应该大致一样。2023/1/1712.所得到的结论的统计意义一般的,统计得到的结果,是对于总体较为合理的估计或预测,但其误差应该控制在合理的范围之内。也正因为这样,统计结果的好坏,往往需要进一步的评价,或通过理论方法的检验,或通过实际应用的检验。2023/1/1713.思考8:对样本数据进行分组,其组数是由哪些因素确定的?
对样本数据进行分组,组距的确定没有固定的标准,组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.按统计原理,若样本的容量为n,分组数一般在(1+3.3lgn)附近选取.当样本容量不超过100时,按照数据的多少,常分成5~12组.2023/1/1714.思考9:一般地,列出一组样本数据的频率分布表可以分哪几个步骤进行?第一步,求极差.(极差=样本数据中最大值与最小值的差)第二步,决定组距与组数.(设k=极差÷组距,若k为整数,则组数=k,否则,组数=k+1)第三步,确定分点,将数据分组.第四步,统计频数,计算频率,制成表格.
(频数=样本数据落在各小组内的个数,频率=频数÷样本容量)2023/1/1715.月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O思考1:为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:2023/1/1716.上图称为频率分布直方图,其中横轴表示月均用水量,纵轴表示频率/组距.频率分布直方图中各小长方形的宽度和高度在数量上有何特点?宽度:组距高度:频率组距月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O2023/1/1717.思考2:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少?各小长方形的面积=频率各小长方形的面积之和=1月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O2023/1/1718.思考3:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O2023/1/1719.(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的对称性等.月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O2023/1/1720.思考5:对一组给定的样本数据,频率分布直方图的外观形状与哪些因素有关?在居民月均用水量样本中,你能以1为组距画频率分布直方图吗?与分组数(或组距)及坐标系的单位长度有关.月均用水量/t频率组距0.40.30.20.112345O2023/1/1721.
总结画频率分布直方图的操作步骤1.求极差,即数据中最大值与最小值的差2.决定组距与组数
组数=极差/组距3.将数据分组,通常对组内数值所在区间,取左闭右开区间,
最后一组取闭区间4.登记频数,计算频率和频率/组距,列出频率分布表5.画出频率分布直方图(纵轴表示频率/组距)2023/1/1722.频率分布表和频率分布直方图在带给我们许多新的信息的同时,也丢失了一些信息,如原始数据不能在分布表和直方图中很好地体现出来。频率分布直方图的优缺点是什么?2023/1/1723.全优81页限时规范训练2023/1/1724.1.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?全优39页变式训练2023/1/1725.【解析】(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:2023/1/1726.4.某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[20,40),[40,60),[60,80),[80,100).若低于60分的人数是15人,则该班的学生人数是()A.45 B.50 C.55 D.60解析:∵成绩低于60分有第一、二组数据,在频率分布直方图中,对应矩形的高分别为0.005,0.01,每组数据的组距为20,则成绩低于60分的频率P=(0.005+0.010)×20=0.3,又∵低于60分的人数是15人,全优40页基础夯实2023/1/1727.6.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示:(1)直方图中x的值为______;(2)在这些用户中,用电量落在区间[100,250)内的户数为______.解析:(1)依题意及频率分布直方图知,0.0024×50+0.0036×50+0.0060×50+x×50+0.0024×50+0.0012×50=1,解得x=0.0044.全优41页能力提升2023/1/1728.6.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示:(1)直方图中x的值为______;(2)在这些用户中,用电量落在区间[100,250)内的户数为______.解得x=0.0044.(2)样本数据落在[100,150)内的频率为0.0036×50=0.18,样本数据落在[150,200)内的频率为0.006×50=0.3.样本数据落在[200,250)内的频率为0.0044×50=0.22,故在这些用户中,用电量落在区间[100,250)内的户数为(0.18+0.30+0.22)×100=70.2023/1/1729.8.如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:(1)求:79.5-89.5这一组数据的频数、频率;(2)求:本次竞赛的及格率(60分及以上为及格)。解:(1)频率为:0.025×10=0.25,频数:60×0.25=15;(2)0.015×10+0.03×10+0.025×10+0.005×10=0.75。全优41页能力提升2023/1/1730.思考1:在城市居民月均用水量样本数据的频率分布直方图中,各组数据的平均值大致是哪些数?
月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O2023/1/1731.思考2:在频率分布直方图中,依次连接各小长方形上端的中点,就得到一条折线,这条折线称为频率分布折线图.你认为频率分布折线图能大致反映样本数据的频率分布吗?月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O2023/1/1732.思考3:当总体中的个体数很多时(如抽样调查全国城市居民月均用水量),随着样本容量的增加,作图时所分的组数增多,组距减少,你能想象出相应的频率分布折线图会发生什么变化吗?月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O2023/1/1733.频率组距产品尺寸(mm)ab
当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近一条光滑曲线——总体密度曲线.区间在总体内取值的概率总体密度曲线总体密度曲线2023/1/1734.
用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。
总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.总体密度曲线2023/1/1735.思考:对于一个总体,如果存在总体密度曲线,这条曲线是否惟一?频率分布表、频率分布直方图和折线图的主要作用是表示样本数据的分布情况,此外,我们还可以用茎叶图来表示样本数据的分布情况.由于样本是随机的,不同的样本得到的不同频率分布折线图;即使对与同一样本,不同的分组情况得到的也不同频率分布折线图。频率分布折线图是随着样本容量和分组情况变化而变化的。2023/1/1736.某赛季甲、乙两名篮球运动员每场比赛得分的原始记录为:甲运动员的得分:135123826381633142839乙运动员的得分:49241231503144361537253639我们可以画出茎叶图,也就是中间的数表示十位数,旁边的数表示两个人得分的个位数,就象一棵树的茎与叶子一样,能更直观地看出这两个人的得分情况。茎叶图2023/1/1737.甲乙0123452554161679490846368389
1(1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(2)乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39茎叶图
叶就是从茎的旁边生长出来的数,表示得分的个位数。
茎是指中间的一列数,表示得分的十位数2023/1/1738.茎叶图不仅能够保留原始数据,而且能够展示数据的分布情况。从运动员的成绩的分布来看,乙运动员的成绩更好;从叶在茎上的分布情况来看,乙运动员的得分更集中于峰值附近,说明乙运动员的发挥更稳定。在样本数据较少时,用茎叶图表示数据的效果较好。它不但可以保留所有信息,而且可以随时纪录,这对数据的纪录和表示都能带来方便。但当样本数据较多时,茎叶图就显得不太方便。因为每一个数据都要在茎叶图中占据一个空间,如果数据很多,枝叶就会很长。2023/1/1739.画茎叶图的步骤:1.将每个数据分为茎(高位)和叶(低位
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 教案用纸(正业)
- 保护环境课件下载
- 玉溪师范学院《西方哲学史》2021-2022学年第一学期期末试卷
- 玉溪师范学院《试验设计》2023-2024学年第一学期期末试卷
- 玉溪师范学院《民法学》2022-2023学年期末试卷
- 好乐迪超市作业流程教案
- 普通人18条忠告
- 2024年生化分析试剂项目成效分析报告
- 采购合同 和付款合同
- 毕业摄影合同范本
- 中图版七年级下册信息技术 4.1策划数字故事 教学设计
- 2024年全国职业院校技能大赛高职组(检验检疫技术赛项)考试题库(含答案)
- 和灯做朋友(教学设计)-2023-2024学年五年级上册综合实践活动蒙沪版
- 2024人教版新教材初中地理七年级上册内容解读课件(深度)
- 乐理知识考试题库130题(含答案)
- 人教版(2024)七年级地理上册2.2《地形图的判读》精美课件
- 2024年共青团入团积极分子团校结业考试试题库及答案
- 2024年辽宁高考历史试题(含答案和解析)
- 黄河商品交易市场介绍稿
- Unit 3 My friends Part C Story time(教学设计)-2024-2025学年人教PEP版英语四年级上册
- 2024中国海油校园招聘2024人(高频重点提升专题训练)共500题附带答案详解
评论
0/150
提交评论