版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 第二章第二章 统计统计2.2.1 2.2.1 用样本的频率分布估计用样本的频率分布估计 总体分布总体分布 我国是世界上严重缺水的国家我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,本市试行居民生活用水定额管理,即确定一个居民月用水量标准即确定一个居民月用水量标准a a,用,用水量不超过水量不超过a a的部分按平价收费,超的部分按平价收费,超出出a a的部分按议价收费。如果希望大的部分按议价收费。如果希望大部分居民的日常生活不受影响,那部分居民的日常生活不受影响,那么
2、标准么标准a a定为多少比较合理呢定为多少比较合理呢 ?探究探究:你认为,为了较为合理你认为,为了较为合理地确定出这个标准,需地确定出这个标准,需要做哪些工作?要做哪些工作? 复习引入: (1)(1)统计的核心问题统计的核心问题: : 如何根据样本的情况对总体的情况作出推断如何根据样本的情况对总体的情况作出推断 简单随机抽样简单随机抽样 系统抽样系统抽样 分层抽样分层抽样(3 3)通过抽样方法收集数据的目的是什么?)通过抽样方法收集数据的目的是什么?从中寻找所包含的信息,用样本去估计总体从中寻找所包含的信息,用样本去估计总体(2)(2)随机抽样的几种常用方法随机抽样的几种常用方法 : : 我国
3、是世界上严重缺水我国是世界上严重缺水的国家之一,城市缺水的国家之一,城市缺水问题较为突出,某市政问题较为突出,某市政府为了节约生活用水,府为了节约生活用水,计划在本市试行居民生计划在本市试行居民生活用水定额管理,即确活用水定额管理,即确定一个居民月用水量标定一个居民月用水量标准准a a,用水量不超过,用水量不超过a a的的部分按平价收费,超出部分按平价收费,超出a a的部分按议价收费。的部分按议价收费。如果希望大部分居民的如果希望大部分居民的日常生活不受影响,那日常生活不受影响,那么标准么标准a a定为多少比较定为多少比较合理呢合理呢 ?探究探究:采用抽样调查的方采用抽样调查的方式获得样本数据
4、式获得样本数据分析样本数据来估分析样本数据来估计全市居民用水量的计全市居民用水量的分布情况分布情况下表给出下表给出100100位居民的月均用水量表位居民的月均用水量表 分析数据的一种基本方法是用图将它们画出来,或者分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提信息。表格则是通过改变数据的构成形式,为我们提供解释数据的新方式供解释数据的新方式讨论:如何分讨论:如何分析数
5、据?析数据?根据这些数据根据这些数据你能得出用水你能得出用水量其他信息吗量其他信息吗? ?为此我们要对这些数据进行整理与分析为此我们要对这些数据进行整理与分析一频率分布的概念:一频率分布的概念:频率分布频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布方图反映样本的频率分布 二画二画频率分布直方图频率分布直方图其其一般步骤一般步骤为:为:(1 1)计算一组数据中最大值与最小值的差,即求极差()计算一组数据中最大值与最小值的差,即求极差(2 2)决定组距与组数()决定组距与组数(3 3)将数据
6、分组将数据分组(4(4)列频率分布表()列频率分布表(5 5)画频率分布直方图)画频率分布直方图第一步第一步: : 求极差求极差: ( (数据组中最大值与最小值的差距数据组中最大值与最小值的差距) ) 最大值最大值= 4.3 = 4.3 最小值最小值= 0.2 = 0.2 所以极差所以极差= 4.3-0.2 = 4.1= 4.3-0.2 = 4.1第二步第二步: : 决定组距与组数决定组距与组数: : (强调取整)(强调取整) 当样本容量不超过当样本容量不超过100100时时, , 按照数据的多少按照数据的多少, , 常分成常分成512512组组. .为方便组距的选择应力求为方便组距的选择应力
7、求“取整取整”. . 本题如果组距为本题如果组距为0.5(t). 0.5(t). 则则 第三步第三步: : 将数据分组:将数据分组:( ( 给出组的界限给出组的界限) ) 所以将数据分成所以将数据分成9 9组较合适组较合适. . 0, 0.5), 0.5, 1), 1, 1.5),4, 4.5) 共共9组组. 4.18.20.5极差组数=组距第四步第四步: : 列频率分布表列频率分布表. . 分组分组频数频数频率频率频率频率/组距组距0-0.5)40.5-1)8 1-1.5)15 1.5-2)22 2-2.5)25 2.5-3)15 3-3.5)5 3.5-4)4 4-4.5)2合计合计100
8、组距组距=0.5=0.5 0.040.080.080.160.30.150.440.220.250.512.000.020.040.040.080.10.30.150.0500.10.20.30.40.50.6 0.5 1 1.5 2 2.5 3 3.5 4 4.5第第五五步步: : 画画出出频频率率分分布布直直方方图图. 频率频率/ /组距组距 月均用水量月均用水量/t/t ( (组距组距=0.5)=0.5) 0.080.160.30.440.50.30.10.080.04小长方形的面小长方形的面积积=?=?小长方形的面小长方形的面积总和积总和=?=?月均用水量最月均用水量最多的在哪个区多的
9、在哪个区间间? ?请大家阅读第请大家阅读第6868页页, ,直方图有直方图有哪些优点和缺哪些优点和缺点点? ?频率分布直方图的特征:频率分布直方图的特征: 从频率分布直方图可以清楚的看出数据分布的总体趋势。从频率分布直方图可以清楚的看出数据分布的总体趋势。 从频率分布直方图得不出原始的数据内容,把数据表示成直方从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。图后,原有的具体数据信息就被抹掉了。思考思考:1.频率分布表与频率分布直方图的区别?频率分布表与频率分布直方图的区别?频率分布表频率分布表列出的是在各个不同区间内取值的频率。列出的是在各个不同区间内
10、取值的频率。频率分布直方图频率分布直方图是用小长方形面积的大小来表示在各个区间内取值的频率是用小长方形面积的大小来表示在各个区间内取值的频率。2.2.如果当地政府希望使如果当地政府希望使85%85%以上的居民每月的用水量不超出标准,根据频率分布表以上的居民每月的用水量不超出标准,根据频率分布表2-22-2和频率分布直方图和频率分布直方图2.2-12.2-1,你能对制定月用水量标准提出建议吗,你能对制定月用水量标准提出建议吗 ?3.将组距确定为将组距确定为1 1,作出教材,作出教材P66P66页页 居民月均用水量的频率分布直方图居民月均用水量的频率分布直方图 4.谈谈两种组距下,你对图的印象?同
11、一个样本数据,绘制出来的分布图是唯谈谈两种组距下,你对图的印象?同一个样本数据,绘制出来的分布图是唯一的吗?一的吗? (同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到(同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断有时会影响我们对总体的判断 ) 00.10.20.30.40.50.6 0.5 1 1.5 2 2.5 3 3.5 4 4.5画出频率分布折线图画出频率分布折线图. . 频率频率/组距组距 月均用水量月均用水量/t (取组距中点取组
12、距中点, 并连线并连线 ) 0.080.160.30.440.50.30.10.080.04频率分布折线图:频率分布折线图: 画好频率分布图后,我们把频率分布直方图中各小长方形上端连接起来,画好频率分布图后,我们把频率分布直方图中各小长方形上端连接起来,得到的图形得到的图形. .在样本频率分布直方图中,当样本容量增加,作图时在样本频率分布直方图中,当样本容量增加,作图时所分的组数增加,组距减少,相应的频率折线图会越所分的组数增加,组距减少,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线总体密度曲线. . 它能够精确地
13、反映了总体在各个范围它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息内取值的百分比,它能给我们提供更加精细的信息. 总体密度曲线总体密度曲线:月均用水量月均用水量/t/t频率频率组距组距0ab1.1.对于任何一个总体,它的密度曲线是不对于任何一个总体,它的密度曲线是不是一定存在?它的密度曲线是否可以被非是一定存在?它的密度曲线是否可以被非常准确地画出来?常准确地画出来?思考 实际上,尽管有些总体密度曲线是客观存实际上,尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样准确地画出在的,但一般很难像函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,
14、来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确。一般来说,样本容量越大,这种估计就越精确。2.2.图中阴影部分的面积表示什么?图中阴影部分的面积表示什么?月均用水量月均用水量/t/t频率频率组距组距0ab2.2.总体在范围(总体在范围(a a, ,b b)内取值的百分比)内取值的百分比 月均用水量月均用水量/t/t频率频率组距组距0ab例例: : 甲乙两人比赛得分记录如下:甲乙两人比赛得分记录如下:甲:甲:13, 51, 23, 8, 26, 38, 16, 33, 14, 28, 3913, 51, 23, 8, 26, 38, 16, 33, 14, 2
15、8, 39乙:乙:49, 24, 12, 31, 50, 31, 44, 36, 15, 37, 25, 36, 3949, 24, 12, 31, 50, 31, 44, 36, 15, 37, 25, 36, 39用茎叶图表示两人成绩,说明哪一个成绩好用茎叶图表示两人成绩,说明哪一个成绩好甲甲乙乙0 12345 2, 55, 41, 6, 1, 6, 7, 9 4, 90 8 4, 6, 3 3, 6, 8 3, 8, 9 1 叶叶 茎茎 叶叶茎叶图茎叶图 ( (一种被用来表示数据的图一种被用来表示数据的图) ) 茎叶图茎叶图 当数据是两位有效数字时,用中间的数字表示当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图因此通常把这样的图叫做茎叶图 小结:小结: 1.不易知一个总体的分布情况时,往往从总体中不易知一个总体的分布情况时,往往从总体中抽取一个样本,用样本的频率分布去估计总体的抽取一个样本,用样本的频率分布去估计总体的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 护理记录与交接管理制度
- 《散步》知识讲义
- 人教版可能性课件
- 2024年浙江客运从业资格证下载什么软件练题
- 算法设计与分析 课件 5.8-动态规划应用-编辑距离问题
- 2024年山西客运资格证应用能力试题答案解析
- 2024年承德考客运从业资格证考试题目
- 2024年鞍山客运资格证题库及答案
- 2024年长沙客运证考试
- 2024年乌鲁木齐客运资格专业能力考试试题
- 如何搞定你的客户-
- 八年级物理上册说课稿:第二章2.1物质的三态 温度的测量
- 湖北省鄂东南省级示范高中教育教学改革联盟2023-2024学年高一上学期期中联考政治试题
- 全护筒跟进旋挖施工方案
- 海水淡化处理方案
- 福建省厦门市翔安区2023-2024学年九年级上学期期中英语试题
- 学生对学校满意度评价表
- 化工项目国民经济分析 化工项目技术经济
- 计算与人工智能概论智慧树知到课后章节答案2023年下湖南大学
- 小学一年级下册数学期末考试质量分析及试卷分析
- 原材料情况说明范本
评论
0/150
提交评论