版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
9.2用样本估计总体9.2.1总体取值规律的估计一个统计小故事的启示新课引入一个统计小故事的启示这位统计学家在分析问题的时候,能够做到不被表面现象所迷惑,在获取数据之后,择合适的工具对数据进行整理和直观描述,在此基础上,通过数据分析,找出数据蕴含的信息,进而得到了正确的统计分析结果。新课引入收集数据是为了寻找数据中蕴含的信息,因为实际问题中数据多而且杂乱,往往无法直接从原始数据中发现规律所以需要根据问题的背景特点,选择合适的统计图表对数据进行整理和直观描述,在此基础上,通过数据分析,找出数据中蕴含的信息,就可以用这些信息来解决实际问题了下面我们讨论对随机抽样获取的数据的处理方法.1.随机抽样有哪几种基本的抽样方法?简单随机抽样、分层抽样.温故知新
前面研究学习了两种抽样方法来收集数据,还知道了一些常见的获取数据的途径,数据收集后,必须从中寻找包含的信息,以使我们能通过样本的规律估计总体的规律,解决相应的实际问题。但由于数据多而杂,所以需要通过一定的方法去处理数据。可以通过表、图、计算方法来分析数据,进而对总体做出相应的估计。学习新知问题1我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了减少水资源的浪费,计划对居民生活用水费用实施阶梯式水价制度,即确定一户居民月均用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望确定一个比较合理的标准,以使大部分居民用户的水费支出不受影响,你认为需要做哪些工作?假设通过简单随机抽样,获得了100户居民用户的月均用水量数据(单位:1):学习新知9.013.614.95.94.07.16.45.419.42.02.28.613.85.410.24.96.814.02.010.52.15.75.116.86.011.11.311.27.74.92.310.016.712.012.47.85.213.62.422.43.67.18.825.63.218.35.12.03.012.022.210.85.52.024.39.93.65.64.47.95.124.56.47.54.720.55.515.72.65.75.56.016.02.49.53.717.03.84.12.35.37.88.14.313.36.81.37.04.91.87.128.010.213.817.910.15.54.63.221.6从这组数据你能发现什么信息呢?如果将这组数据从小到大排序,容易发现,这组数据的最小值是1.3t,最大值是28.0t,其他在1.3t至28.0t之间.学习新知
我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数.
在这个实际问题中,因为我们更关心月均用水量在不同范围内的居民用户占全市居民用户的比例,所以选择频率分布表(frequencydistributiontable)和频率分布直方图(frequencydistributionhistogram)来整理和表示数据,与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图学习新知1.求极差:
极差为一组数据中最大值与最小值的差.样本观测数据的最小值是1.3t,最大值是28.0t,极差为28.0-1.3=26.7这说明样本观测数据的变化范围是26.7t.学习新知2.决定组距与组数:合适的组距与组数对发现数据分布规律有重要意义.数太多或太少,都会影响我们了解数据的分布情况.数据分组可以是等距的,也可以是不等距的,要根据数据的特点而定。有时为了方便,往往按等距分组,或者除了第一和最后的两段,其余各段按等距分组组距与与组数的确定没有固定的标准.数据分组的组数与数据的个数有关,一般数据的个数越多,所分组数也越多,当样本容量不超过100时,常分成5~12组.为方便起见,一般取等长组距,并且组距应力求“取整”分组时可以先确定组距,也可以先确定组数,如果我们取所有组距为3,则学习新知学习新知3.将数据分组:由于组距为3,9个组距的长度超过极差,我们可以使第一组的左端点略小于数据中的最小值,最后一组的右端点略大于数据中的最大值,例如,可以取区间为[1.2,28.2],按如下方式把样本观测数据以组距3分为9组:[1.2,4.2),[4.2,7.2),...,[25.2,28.2].4.列频率分布表计算各小组的频率,例如第一小组的频率作出频率分布表学习新知月均用水量/t0.020.040.060.080.101.24.27.210.213.216.219.222.225.228.200.12频率/组距学习新知5.画频率分布直方图根据频率分布表画出如图所示的频率分布直方图频率分布直方图中各小长方形的高度,它反映了各组样本观测数据的疏密程度样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频率分布直方图的作图步骤如何?
第一步,画平面直角坐标系.第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度.第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形.学习新知学习新知频率分布直方图与频数分布直方图有什么区别?通过调查或实验收集到的数据一般数量较大且无序,为了得到有用的信息,就需要对数据进行分类(组)整理,利用统计表(或图)表示数据的特征.数据是对客观现象计量的结果,按照计量的精确程度可以大致分为两类.第一类,只能对事物的属性进行分类.例如,性别分男、女,商品分不同品牌,等级成绩分为优、良、及格和不及格,民意调查中对某观点的态度分为同意、中立、不同意,视力情况分为正常、轻度近视、中度近视、重度近视等.各类别可以用字母表示或数字表示,对此类数据的整理就是列频数分布表,记录各类别出现的频数,计算百分比.用条形图直观表示各类数据的频数,用扇形图表示各类数据所占的百分比大小.第二类,计量结果表现为数值,例如,考试成绩,中学生的身高或体重,居民家庭的收入,居民家庭月用电量等.对这类连续数据的整理需要按数据个数的多少,进行适当的分组(不重不漏),统计各组的频数,计算百分比,用直方图表示数据的分布状况.学习新知
观察频率分布表和频率分布直方图,你觉得这组数据中蕴含了哪些有用的信息?你能从图表中发现居民用户月均用水量的哪些分布规律?(1)从频率分布表中可以清楚地看出,样本观测数据落在各个小组的比例大小,例如,月均用水量在区间[4.2,7.2)内的居民用户最多,在区间[1.2,4.2)内的次之,而月均用水量超过16.2的各区间内数据所占比例较小,等等.学习新知
观察频率分布表和频率分布直方图,你觉得这组数据中蕴含了哪些有用的信息?你能从图表中发现居民用户月均用水量的哪些分布规律?(2)从频率分布直方图能直观的表明数据分布的形状和总体趋势.从上图容易看出,居民用户月均用水量的样本观测数据的分布是不对称的,图形的左边高、右边低,右边有一个较长的“尾巴”,这表明大部分居民用户的月均用水量集中在一个较低值区域,尤其在区间[1.2,7.2)最为集中,少数居民用户的月均用水量偏多,而且随着月均用水量的增加,居民用户数呈现降低趋势.有了样本观测数据的频率分布,我们可以用它估计总体的取值规律学习新知
根据100户居民用户的月均用水量的频率分布,可以推测该市全体居民用户月均用水量也会有类似的分布,即大部分居民用户月均用水量集中在较低值区域.这使我们确定用水量标准时,可以定一个合适的值,以达到既不影响大多数居民用户的水费支出,又能节水的目的.
需要注意的是,由于样本的随机性,这种估计可能会存在一定误差,但这一误差一般不会影响我们对总体分布情况的大致了解.分别以3和27为组数,对数据进行等距分组,画出100户居民用户月均用水量的频率分市直方图.观察图形,你发现不同的组数对于直方图呈现数据分市规律有什么影响?学习新知分别以3和27为组数,对数据进行等距分组,画出100户居民用户月均用水量的频率分市直方图.观察图形,你发现不同的组数对于直方图呈现数据分市规律有什么影响?从图中可以看出,同一组数据,组数不同,得到的直方图形状也不尽相同,会给人以不同的频率分布印象有时会影响人们对总体的判断当频率分布直方图的组数少、组距大时,容易从中看出数据整体的分布特点,但由于无法看出每组内的数据分布情况,损失了较多的原始数据信息当频率分布直方图的组数多、组距小时,保留了较多的原始数据信息,会依赖样本数据,稳定性差,由于小长方形较多,有时图形会变得非常不规则,不容易从中看出总体数据的分布特点.学习新知
例某地区为了了解知识分子的年龄结构,随机抽样50名,其年龄分别如下:
42,38,29,36,41,43,54,43,34,44,
40,59,39,42,44,50,37,44,45,29,
48,45,53,48,37,28,46,50,37,44,
42,39,51,52,62,47,59,46,45,67,
53,49,65,47,54,63,57,43,46,58.(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计年龄在32~52岁的知识分子所占的比例约是多少.典型例题(1)极差为67-28=39,取组距为5,分为8组.
分组频数频率
[27,32)30.06[32,37)30.06[37,42)90.18[42,47)160.32[47,52)70.14[52,57)50.10[57,62)40.08[62,67)30.06
合计501.00样本频率分布表:(2)样本频率分布直方图:年龄0.060.050.040.030.020.01273237424752576267频率组距O(3)因为0.06+0.18+0.32+0.14=0.7,故年龄在32~52岁的知识分子约占70%.巩固练习巩固练习0.030.050.07体重(kg)频率/组距54.558.562.566.570.574.5巩固练习巩固练习巩固练习巩固练习7.为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛.为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表和频率分布直方图,解答下列问题:分组频数频率[50.5,60.5)40.08[60.5,70.5)0.16[70.5,80.5)10[80.5,90.5)160.32[90.5,100.5]合计50(1)填充频率分布表的空格(将答案直接填在表格内);(2)补全频率分布直方图.分组频数频率[50.5,60.5)40.08[60.5,70.5)80.16[70.5,80.5)100.20[80.5,90.5)160.32[90.5,100.5]120.24合计501.00频率分布直方图频率分布表8.对“小康县”的经济评价标准如下:①年人均收入不小于7000元;②年人均食品支出不大于收入的35%.某县有40万人,调查数据如下:巩固练习年人均收入/元)02000400060008000100001200016000人数/万人63556753则该县(
)A.是小康县B.达到标准①,未达到标准②,不是小康县C.达到标准②,未达到标准①,不是小康县D.两个标准都未达到,不是小康县B其他的统计图:扇形图条形图折线图例1:已知某市2015年全年空气质量等级如下表:频数频率8322.8%12133.2%6818.6%4913.4%308.2%143.8%合计365100%2016年5月和6月的空气质量指数如下:5月2408056539212645875660191625558565389901251241038189443453798162116886月63921101221021168116315876331026553385552769912712080108333573829014695请选择合适的统计图描述数据,并回答下列问题:(1)分析该市2016年6月的空气质量情况.(2)比较该市2016年5月和6月的空气质量,哪个月的空气质量较好?(3)比较该市2016年6月与该市2015年全年的空气质量,2016年6月
的空气质量是否好于去年?(4)要想对比该市2016年全年与2015年全年的空气质量情况,需要
收集哪些数据?请选择合适的统计图描述数据,并回答下列问题:(1)分析该市2016年6月的空气质量情况.2016年6月63921101221021168116315876331026553385552769912712080108333573829014695
频数频率8322.8%12133.2%6818.6%4913.4%308.2%143.8%合计365100%2015年请选择合适的统计图描述数据,并回答下列问题:(1)分析该市2016年6月的空气质量情况.空气质量等级合计优良轻度污染中度污染重度污染严重污染天数415920030比例13.33%50%30%6.67%00100%
频率分布表:条形图:优良天数
20151050轻度污染中度污染重度污染严重污染空气质量等级扇形图:2016/5/302016/6/42016/6/92016/6/142016/6/192016/6/242016/6/29日期折线图:请选择合适的统计图描述数据,并回答下列问题:(2)比较该市2016年5月和6月的空气质量,哪个月的空气质量较好?5
月空气质量等级合计优良轻度
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度豪华轿车指标租赁及售后服务合同4篇
- 2025年度跨境电商代理服务合同范本(正本版)8篇
- 二零二五版楼盘销售代理合同大曰金地产健康住宅销售代理协议4篇
- 2025年度房地产开发项目房屋租赁协议延期及预售合同4篇
- 基于5G技术的2025年度通信设备购销合同2篇
- 二零二五年度海洋工程一致行动人合作协议4篇
- 苏教版四年级数学下册第三单元第二课时《常见的数量关系》课件
- 2025年度大学科研经费使用与监督合同模板4篇
- 2025年度智慧城市个人技术入股合作协议4篇
- 2025年度电子商务平台运营管理contract合同4篇
- 劳动合同续签意见单
- 大学生国家安全教育意义
- 2024年保育员(初级)培训计划和教学大纲-(目录版)
- 河北省石家庄市2023-2024学年高二上学期期末考试 语文 Word版含答案
- 企业正确认识和运用矩阵式管理
- 分布式光伏高处作业专项施工方案
- 陈阅增普通生物学全部课件
- 检验科主任就职演讲稿范文
- 人防工程主体监理质量评估报告
- 20225GRedCap通信技术白皮书
- 燃气有限公司客户服务规范制度
评论
0/150
提交评论