




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、会计学1 用样本估计总体一改用样本估计总体一改 分层抽样 系统抽样 随机数法 抓阄抽签 简单随机抽样 抽样方法 )( 复习回顾复习回顾 1.抽样方法有哪些? 第1页/共85页 类别类别共同点共同点各自特点各自特点相互联系相互联系适用范围适用范围 简单随机简单随机 抽样抽样 系统系统 抽样抽样 分层抽样分层抽样 2.三三种抽样方式比较种抽样方式比较 1.不放不放 回抽样回抽样 2.抽样抽样 过程中过程中, 每个个每个个 体被抽体被抽 取的机取的机 会均等会均等 从总体中从总体中 逐个抽取逐个抽取 将总体均分为将总体均分为 几部分几部分,按简单按简单 随机抽样抽取随机抽样抽取 第一个样本,第一个样
2、本, 然后按相同的然后按相同的 间隔抽取其他间隔抽取其他 样本样本 将总体分将总体分 成几层,成几层, 分层进行分层进行 抽取抽取 抽取第一抽取第一 个样本时个样本时 采用简单采用简单 随机抽样随机抽样 各层抽样时各层抽样时 ,采用简单,采用简单 随机抽样或随机抽样或 系统抽样系统抽样 总体中的总体中的 个体数较个体数较 少少 总体中的个总体中的个 体数较多体数较多 (间隔相同的间隔相同的 时间或距离时间或距离) 总体由差总体由差 异明显的异明显的 几部分组几部分组 成成 第2页/共85页 练习:在练习:在下列问题中,各采用什么抽样下列问题中,各采用什么抽样 方法抽取样本较合适?方法抽取样本较
3、合适? 1、从、从20台电脑中抽取台电脑中抽取4台进行质量检测;台进行质量检测; 2、从、从2004名同学中,抽取一个容量为名同学中,抽取一个容量为20的样本的样本 3、某中学有、某中学有180名教工,其中业务人员名教工,其中业务人员136名,管理人员名,管理人员20名,后勤人员名,后勤人员24名,从中抽取一个容量为名,从中抽取一个容量为15的样本。的样本。 简单随机抽样简单随机抽样 系统抽样系统抽样 分层抽样分层抽样 第3页/共85页 如何从样本数据中提取基本如何从样本数据中提取基本 信息来估计总体的情况呢?信息来估计总体的情况呢? 抽样是统计的第一步,抽样是统计的第一步, 接下来就要对样本
4、进行分析。接下来就要对样本进行分析。 第4页/共85页 2.2 2.2 用样本估计总体用样本估计总体 一、用样本的频率分布估计总体的分布一、用样本的频率分布估计总体的分布 二、用样本的数字特征估计总体的特二、用样本的数字特征估计总体的特 征征 平均数、中位数、众数、平均数、中位数、众数、 极差、方差、标准差极差、方差、标准差 频率分布表、频率分布直方图、频率分布表、频率分布直方图、 频率折线图、茎叶图频率折线图、茎叶图 第5页/共85页 采用抽样调查的方采用抽样调查的方 式获得样本数据式获得样本数据 分析样本数据来估分析样本数据来估 计全市居民用水量的计全市居民用水量的 分布情况分布情况 我国
5、是世界上严重缺水我国是世界上严重缺水 的国家之一,城市缺水的国家之一,城市缺水 问题较为突出,某市政问题较为突出,某市政 府为了节约生活用水,府为了节约生活用水, 计划在本市试行居民生计划在本市试行居民生 活用水定额管理,即确活用水定额管理,即确 定一个居民月用水量标定一个居民月用水量标 准准a a,用水量不超过,用水量不超过a a的的 部分按平价收费,超出部分按平价收费,超出 a a的部分按议价收费。的部分按议价收费。 如果希望大部分居民的如果希望大部分居民的 日常生活不受影响,那日常生活不受影响,那 么标准么标准a a定为多少比较定为多少比较 合理呢合理呢 ? 探究探究: 你认为,为了较你
6、认为,为了较 为合理地确定出为合理地确定出 这个标准,需要这个标准,需要 做哪些工作?做哪些工作? 第6页/共85页 下表给出下表给出100100位居民的月均用水量表位居民的月均用水量表 分析数据的一种分析数据的一种基本方法基本方法是用图将它们画出来,或是用图将它们画出来,或 者用紧凑的表格改变数据的排列方式,作图可以达者用紧凑的表格改变数据的排列方式,作图可以达 到两个目的,一是从数据中提取信息,二是利用图到两个目的,一是从数据中提取信息,二是利用图 形传递信息。表格则是通过改变数据的构成形式,形传递信息。表格则是通过改变数据的构成形式, 为我们提供解释数据的新方式为我们提供解释数据的新方式
7、 讨论:如何分讨论:如何分 析数据?析数据? 根据这些数根据这些数 据你能得出据你能得出 用水量其他用水量其他 信息吗信息吗? ? 为此我们要对这些数据进行整理与分析为此我们要对这些数据进行整理与分析 第7页/共85页 初中我们曾经学过频数分布图和频数分布表,这使我们能够清楚地知道数据分布在各个小组的个数。下面将要学习的频率分布图和频率分布表,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律。它可以使我们看到整个样本数据的频率分布情况。初中我们曾经学过频数分布图和频数分布表,这使我们能够清楚地知道数据分布在各个小组的个数。下面将要学习的频率分布图和频率分布表,则是从各个小
8、组数据在样本容量中所占比例大小的角度,来表示数据分布的规律。它可以使我们看到整个样本数据的频率分布情况。 第8页/共85页 一一频率分布的概念:频率分布的概念: 频率分布频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布 一、频率分布直方图一、频率分布直方图 第9页/共85页 第一步第一步: : 求极差求极差: ( (数据组中最大值与最小值的差距数据组中最大值与最小值的差距) ) 最大值最大值= 4.3 = 4.3 最小值最小值= 0.2 = 0.2 所以极差所以极差=
9、 4.3-0.2 = 4.1= 4.3-0.2 = 4.1 第二步第二步: : 决定组距与组数决定组距与组数: : (注意取整)(注意取整) 当样本容量不超过当样本容量不超过100100时时, , 按照数据的多少按照数据的多少, , 常分成常分成512512组组. . 为方便组距的选择应力求为方便组距的选择应力求“取整取整”. . 本题如果组距为本题如果组距为0.5(t). 0.5(t). 则则 4.1 8.2 0.5 极差 组数= 组距 第三步第三步: : 将数据分组:将数据分组:( ( 给出组的界限给出组的界限) ) 所以将数据分成所以将数据分成9 9组较合适组较合适. . 0, 0.5)
10、, 0.5, 1), 1, 1.5),4, 4.5) 共共9组组. 第10页/共85页 第四步第四步: : 列频率分布表列频率分布表. . 分组分组频数频数频率频率频率频率/组距组距 0-0.5)4 0.5-1)8 1-1.5)15 1.5-2)22 2-2.5)25 2.5-3)15 3-3.5)5 3.5-4)4 4-4.5)2 合计合计100 组距组距=0.5=0.5 0.04 0.08 0.08 0.16 0.3 0.15 0.440.22 0.250.5 12.00 0.020.04 0.04 0.08 0.1 0.30.15 0.05 第11页/共85页 为了直观反映样本数据在各组
11、中的为了直观反映样本数据在各组中的 分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有 关信息用下面的图形表示:关信息用下面的图形表示: 月均用水量月均用水量/t 频率频率 组距组距 0.5 0.4 0.3 0.2 0.1 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O 第12页/共85页 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的 分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有 关信息用下面的图形表示:关信息用下面的图形表示: 月均用水量月均用水量/t 频率频率 组距组距 0.5 0.4 0.3 0.2 0.1 0
12、.5 1 1.5 2 2.5 3 3.5 4 4.5 O 第13页/共85页 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的 分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有 关信息用下面的图形表示:关信息用下面的图形表示: 月均用水量月均用水量/t 频率频率 组距组距 0.5 0.4 0.3 0.2 0.1 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O 第14页/共85页 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的 分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有 关信息用下面的图形表示:关信息用下
13、面的图形表示: 月均用水量月均用水量/t 频率频率 组距组距 0.5 0.4 0.3 0.2 0.1 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O 第15页/共85页 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的 分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有 关信息用下面的图形表示:关信息用下面的图形表示: 月均用水量月均用水量/t 频率频率 组距组距 0.5 0.4 0.3 0.2 0.1 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O 第16页/共85页 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的 分布
14、情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有 关信息用下面的图形表示:关信息用下面的图形表示: 月均用水量月均用水量/t 频率频率 组距组距 0.5 0.4 0.3 0.2 0.1 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O 第17页/共85页 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的 分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有 关信息用下面的图形表示:关信息用下面的图形表示: 月均用水量月均用水量/t 频率频率 组距组距 0.5 0.4 0.3 0.2 0.1 0.5 1 1.5 2 2.5 3 3.5
15、 4 4.5 O 第18页/共85页 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的 分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有 关信息用下面的图形表示:关信息用下面的图形表示: 月均用水量月均用水量/t 频率频率 组距组距 0.5 0.4 0.3 0.2 0.1 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O 第19页/共85页 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的 分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有 关信息用下面的图形表示:关信息用下面的图形表示: 月均用水量月均用水量/t
16、 频率频率 组距组距 0.5 0.4 0.3 0.2 0.1 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O 第20页/共85页 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的 分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有 关信息用下面的图形表示:关信息用下面的图形表示: 月均用水量月均用水量/t 频率频率 组距组距 0.5 0.4 0.3 0.2 0.1 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O 第21页/共85页 0 0.1 0.2 0.3 0.4 0.5 0.6 0.5 1 1.5 2 2.5 3 3.5 4 4.5
17、 频率频率/ /组距组距 月均用水量月均用水量/t/t ( (组距组距=0.5)=0.5) 0.08 0.16 0.3 0.44 0.5 0.3 0.1 0.08 0.04 小长方形的面小长方形的面 积积=?=? 小长方形的面小长方形的面 积总和积总和=?=? 月均用水月均用水量居量居 民人数最民人数最多的多的 在哪个区间在哪个区间? ? 请大家阅读第请大家阅读第 6868页页, ,直方图有直方图有 哪些优点和缺哪些优点和缺 点点? ? 第五步第五步: : 画出频率分布直方图画出频率分布直方图 . 第22页/共85页 同样一组数据同样一组数据, ,如果组距不同如果组距不同, ,横轴、纵轴的单位
18、横轴、纵轴的单位 不同不同, ,得到的图的形状也会不同得到的图的形状也会不同. .不同的形状给人以不不同的形状给人以不 同的印象同的印象, ,这种印象有时会影响我们对总体的判断这种印象有时会影响我们对总体的判断. .分分 别以别以1 1和和0.10.1为组距重新作图为组距重新作图, ,然后谈谈你对图的印象然后谈谈你对图的印象. . 第23页/共85页 频率分布直方图的特征:频率分布直方图的特征: 1.频频率分布直率分布直方图频率分布表更直方图频率分布表更直 观地观地反映了样本的分布规律反映了样本的分布规律. 2.从从频率分布直方图得不出原始的频率分布直方图得不出原始的 数据内容,把数据表示成直
19、方图后数据内容,把数据表示成直方图后 ,原有的具体数据信息就被抹掉了,原有的具体数据信息就被抹掉了 。 第24页/共85页 如如果当地政府希望使果当地政府希望使85%85%以上的居民每月的用水量不超出标准,根据频率分布表以上的居民每月的用水量不超出标准,根据频率分布表2-22-2和频率分布直方图和频率分布直方图2.2-12.2-1, 你能对制定月用水量标准提出建议吗你能对制定月用水量标准提出建议吗 ? 88%88%的居民月用水量在的居民月用水量在3t 3t以下,以下, 可建议取可建议取a=3.a=3. 第25页/共85页 小结小结: : 画频率分布直方图的步骤画频率分布直方图的步骤: : 第一
20、步第一步: 求极差求极差: (数据组中最大值与最小值的差距数据组中最大值与最小值的差距) 第二步第二步: 决定组距与组数决定组距与组数: (强调取整)(强调取整) 第三步第三步: 将数据分组将数据分组 ( 给出组的界限给出组的界限) 第四步第四步: 列频率分布表列频率分布表. (包括分组、频数、频率(包括分组、频数、频率、 频率频率/组距组距) 第五步第五步: 画频率分布直方图画频率分布直方图(在频率分布表的基础上(在频率分布表的基础上 绘制,横坐标为样本数据尺寸,纵坐标为频率绘制,横坐标为样本数据尺寸,纵坐标为频率/组距组距.) 组距组距:指每个小组的两个端点的距离指每个小组的两个端点的距离
21、 组数组数:将数据分组,当数据在将数据分组,当数据在100个以内时,个以内时, 按数据多少常分按数据多少常分5-12组。组。 第26页/共85页 注意注意 第几组频数 (1)第几组频率 样本容量 (2)纵坐标为纵坐标为: 频率 组距 第27页/共85页 练习:练习: 例例 某地区为了了解知识分子的年龄结构,某地区为了了解知识分子的年龄结构, 随机抽样随机抽样5050名,其年龄分别如下:名,其年龄分别如下: 4242,3838,2929,3636,4141,4343,5454,4343,3434,4444, 4040,5959,3939,4242,4444,5050,3737,4444,4545
22、,2929, 4848,4545,5353,4848,3737,2828,4646,5050,3737,4444, 4242,3939,5151,5252,6262,4747,5959,4646,4545,6767, 5353,4949,6565,4747,5454,6363,5757,4343,4646,58.58. (1)(1)列出样本频率分布表;列出样本频率分布表; (2)(2)画出频率分布直方图;画出频率分布直方图; (3)(3)估计年龄在估计年龄在32325252岁的知识分子所占的比例约是多少岁的知识分子所占的比例约是多少. . 第28页/共85页 (1)(1)极差为极差为67-28
23、=3967-28=39,取组距为,取组距为5 5,分为,分为8 8组组 . . 分分 组组 频数频数 频率频率 2727,3232) 3 0.063 0.06 32 32,3737) 3 0.063 0.06 37 37,4242) 9 0.189 0.18 42 42,4747) 16 0.3216 0.32 47 47,5252) 7 0.147 0.14 52 52,5757) 5 0.105 0.10 57 57,6262) 4 0.084 0.08 62 62,6767) 3 0.063 0.06 合合 计计 50 1.0050 1.00 样本频率分布表:样本频率分布表: 第29页/
24、共85页 (2 2)样本频率分布直方图:)样本频率分布直方图: 年龄年龄 0.060.06 0.050.05 0.040.04 0.030.03 0.020.02 0.010.01 27 32 37 42 47 52 57 62 6727 32 37 42 47 52 57 62 67 频率频率 组距组距 O (3 3)因为)因为0.06+0.18+0.32+0.14=0.70.06+0.18+0.32+0.14=0.7, 故年龄在故年龄在32325252岁的知识分子约占岁的知识分子约占70%.70%. 第30页/共85页 课堂练习课堂练习 2(2006年全国卷年全国卷II)一个社会调查机构就
25、某地居民一个社会调查机构就某地居民 的月收入调查了的月收入调查了10 000人,并根据所得数据画了样人,并根据所得数据画了样 本的频率分布直方图本的频率分布直方图(如下图如下图).为了分析居民的收入为了分析居民的收入 与年龄、学历、职业等方面的关系,要从这与年龄、学历、职业等方面的关系,要从这10 000 人中再用分层抽样方法抽出人中再用分层抽样方法抽出100人作进一步调查,人作进一步调查, 则在则在2500,3000(元元)月收入段应抽出月收入段应抽出_人人. 0.0001 0.0002 0.0003 0.0004 0.0005 月收入月收入(元元) 频率频率/组距组距 25 1000 15
26、00 2000 2500 3000 3500 4000 第31页/共85页 频率 组距 课堂练习课堂练习 0.3 0.1 4.34.54.74.95.1 视力视力 频率频率/组距组距 A. 0.27,78 B. 0.27,83 C. 2.7,78 D. 2.7,83 A 第32页/共85页 第33页/共85页 频率分布直方图如下频率分布直方图如下: 月均用水量月均用水量 /t 频率频率 组距组距 0.1 0 0.2 0 0.3 0 0.4 0 0.5 0 0.51 1.5 2 2.533.544.5 连接频率分布直方图连接频率分布直方图 中各小长方形上端的中各小长方形上端的 中点中点,得到得到
27、频率分布折频率分布折 线图线图 第34页/共85页 频率分布折线图频率分布折线图 由于样本是随机的,不同的样本的得到的频率分布折线图不同,即使对于同一样本,不同的分组情况得到的频率分布折线图也不同,频率分布折线图是随着由于样本是随机的,不同的样本的得到的频率分布折线图不同,即使对于同一样本,不同的分组情况得到的频率分布折线图也不同,频率分布折线图是随着样本的容量样本的容量和和分组情况分组情况的变化而变化的。的变化而变化的。 第35页/共85页 利用样本频分布对总体分布进行相应估计利用样本频分布对总体分布进行相应估计 (3)当样本容量无限增大,组距无限缩小,)当样本容量无限增大,组距无限缩小,
28、那么频率折线图就会无限接近于一条光滑曲线那么频率折线图就会无限接近于一条光滑曲线 总体密度曲线总体密度曲线。 (2)样本容量越大,这种估计越精确。)样本容量越大,这种估计越精确。 (1)上例的样本容量为)上例的样本容量为100,如果增至,如果增至1000 ,其频率分布直方图的情况会有什么变化?假,其频率分布直方图的情况会有什么变化?假 如增至如增至10000呢?呢? 第36页/共85页 总体密度曲线总体密度曲线 频率频率 组距组距 月均用月均用 水量水量/t ab (图中阴影部分的面积,表示总体在(图中阴影部分的面积,表示总体在 某个区间某个区间 (a, b) 内取值的百分比)。内取值的百分比
29、)。 第37页/共85页 用样本分布直方图去估计相应的总体分布时用样本分布直方图去估计相应的总体分布时 ,一般样本容量越大,一般样本容量越大,频率分布直方图频率分布直方图就会无限就会无限 接近接近总体密度曲线总体密度曲线,就越精确地反映了总体的分,就越精确地反映了总体的分 布规律,即越精确地反映了总体在各个范围内取布规律,即越精确地反映了总体在各个范围内取 值百分比。值百分比。 总体密度曲线反映了总体在各个范围内取值总体密度曲线反映了总体在各个范围内取值 的百分比的百分比,精确地反映了总体的分布规律。是研究精确地反映了总体的分布规律。是研究 总体分布的工具总体分布的工具. 总体密度曲线总体密度
30、曲线 并非所有的总体都存在密度曲线,如一些离散型总体并非所有的总体都存在密度曲线,如一些离散型总体 不能由样本折线图得到准确的总体密度曲线不能由样本折线图得到准确的总体密度曲线 第38页/共85页 随堂训练随堂训练 第39页/共85页 第40页/共85页 第41页/共85页 第42页/共85页 第43页/共85页 6.6.如图是总体密度曲线,下列说法正确的是如图是总体密度曲线,下列说法正确的是( )( ) (A A)组距越大,频率分布折线图越接近于它)组距越大,频率分布折线图越接近于它 (B B)样本容量越小,频率分布折线图越接近于它)样本容量越小,频率分布折线图越接近于它 (C C)阴影部分
31、的面积代表总体在)阴影部分的面积代表总体在(a,b)(a,b)内取值的百分比内取值的百分比 (D D)阴影部分的平均高度代表总体在()阴影部分的平均高度代表总体在(a,b)a,b)内取值的百分内取值的百分 比比 c 第44页/共85页 茎叶图茎叶图 某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下: 甲运动员得分:甲运动员得分: 13, 51, 23, 8, 26, 38, 16, 33, 14, 28, 39 乙运动员得分:乙运动员得分: 49, 24, 12, 31, 50, 31, 44, 36, 15, 37, 25,36, 3
32、9 第45页/共85页 甲甲乙乙 0 1 2 3 4 5 2 5 5 4 1 6 1 6 7 9 4 9 0 8 4 6 3 3 6 8 3 8 9 1 叶叶 茎茎 叶叶 当数据是两位有效数字时,用中间的数字表示十位数,即当数据是两位有效数字时,用中间的数字表示十位数,即 第一个有效数字,两边的数字表示个位数,即第二个有效数第一个有效数字,两边的数字表示个位数,即第二个有效数 字,它的中间部分像植物的茎,两边部分像植物茎上长出来字,它的中间部分像植物的茎,两边部分像植物茎上长出来 的叶子,因此通常把这样的图叫做茎叶图。的叶子,因此通常把这样的图叫做茎叶图。 1.茎叶图茎叶图: 第46页/共85
33、页 2.画茎叶图的步骤画茎叶图的步骤: 1.将每个数据分为茎将每个数据分为茎(高位高位)和叶和叶(低位低位)两部分两部分,在此例中在此例中,茎为十茎为十 位上的数字位上的数字,叶为个位上的数字叶为个位上的数字; 2.将最小茎和最大茎之间的数按大小次序排成一列将最小茎和最大茎之间的数按大小次序排成一列,写在左写在左(右右) 侧侧; 3.将各个数据的叶按大小次序将各个数据的叶按大小次序 写在其茎右写在其茎右(左左)侧侧. 茎叶 08 13 4 5 23 6 8 33 8 9 4 51 第47页/共85页 3.茎茎叶叶图优缺点图优缺点 : 从统计图上没有原始数据信息的损失,所有从统计图上没有原始数据
34、信息的损失,所有 数据信息都可以从茎叶图中得到;茎叶图中的数数据信息都可以从茎叶图中得到;茎叶图中的数 据可以随时记录,随时添加据可以随时记录,随时添加 ,方便记录方便记录与表示与表示 茎叶图只便于表示两位或一位有效数字的数据,茎叶图只便于表示两位或一位有效数字的数据, 对位数多的数据不太容易操作;茎叶图只便于记录两对位数多的数据不太容易操作;茎叶图只便于记录两 组数据,两组以上的数据虽然能够记录但是没有表示组数据,两组以上的数据虽然能够记录但是没有表示 两组记录那么直观、清晰两组记录那么直观、清晰 茎叶图对重复出现的数据要重复记录,不能遗漏 优点:优点: 缺点:缺点: 第48页/共85页 甲
35、、乙两个小组各甲、乙两个小组各10名学生的英语口语测试成绩名学生的英语口语测试成绩 如下:如下: 甲组甲组 76 90 84 86 81 87 86 82 85 83 乙组乙组 82 84 85 89 79 80 91 89 79 74 用茎叶图表示两小组的成绩,并判断哪个小组用茎叶图表示两小组的成绩,并判断哪个小组 的成绩更整齐一些的成绩更整齐一些 甲甲乙乙 7 8 9 4 9 9 0 2 4 5 9 9 1 6 7 6 6 5 4 3 2 1 0 甲组成绩较集中甲组成绩较集中 ,所以甲组成绩,所以甲组成绩 更稳定一些更稳定一些 第49页/共85页 小小 结结 图形图形 优点优点 缺点缺点
36、频率分布频率分布 1)易表示)易表示大量数据大量数据 丢失一些丢失一些 直方图直方图 2)直观直观地表明分布地地表明分布地 情况情况 信息信息 1)无信息损失无信息损失 只能处理样本只能处理样本 茎叶图茎叶图 2)随时记录方便记录和表示)随时记录方便记录和表示 容量较小数据容量较小数据 第50页/共85页 几种表示频率分布的方法的优点与不足几种表示频率分布的方法的优点与不足 1.频率分布表频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便。在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便。 2.频率分布直方图频率分布直方图能够很容易地表示大量
37、数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式。但是从直方图本身得不出原始的数据内容。能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式。但是从直方图本身得不出原始的数据内容。 3.频率分布折线图频率分布折线图的优点是它反映了数据的变化的优点是它反映了数据的变化 趋势。如果样本容量不断增大,分组的组距不断趋势。如果样本容量不断增大,分组的组距不断 缩小,那么折线图就趋向于总体分布的密度曲线。缩小,那么折线图就趋向于总体分布的密度曲线。 4.用用茎叶图茎叶图刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶
38、图便于记录和表示,能够展示数据的分布情况。但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了。刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况。但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了。 第51页/共85页 4.4.(20102010龙岩高一检测)如图是某赛季甲、乙两名篮球运龙岩高一检测)如图是某赛季甲、乙两名篮球运 动员参加的每场比赛得分的茎叶图,则甲、乙两人这几场比动员参加的每场比赛得分的茎叶图,则甲、乙两人这几场比 赛得分的中位数之和是赛得分的中位数之和是( )( ) (A A)65 65 (B B)64
39、64 (C C)63 63 (D D)6262 第52页/共85页 二、用样本的数字特征二、用样本的数字特征 估计总体的数字特征估计总体的数字特征 第53页/共85页 中位数中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数. 众数众数:在一组数据中,出现次数最多的数据叫做这组数据的众数:在一组数据中,出现次数最多的数据叫做这组数据的众数 平均数平均数: 一组数据的算术平均数一组数据的算术平均数,即即 )( 1 21n xxx n X
40、三三 众数、中位数、平均数的概念众数、中位数、平均数的概念 第54页/共85页 问题问题1:众数、中位数、平均数这三个数众数、中位数、平均数这三个数 一般都会来自于同一个总体或样本,它们一般都会来自于同一个总体或样本,它们 能表明总体或样本的什么性质?能表明总体或样本的什么性质? 平均数平均数:反映所有数据的平均水平反映所有数据的平均水平 众数众数:反映的往往是局部较集中的数据信息反映的往往是局部较集中的数据信息 中位数中位数:是位置型数,反映处于中间部位的是位置型数,反映处于中间部位的 数据信息数据信息 第55页/共85页 三种数字特征的优缺点三种数字特征的优缺点 特征数特征数优优 点点缺缺
41、 点点 众数众数体现了样本数据的最大体现了样本数据的最大 集中点集中点 无法客观反映总体无法客观反映总体 特征特征 中位数中位数 不受少数极端值的影响不受少数极端值的影响 不受少数极端值的不受少数极端值的 影响有时也是缺点影响有时也是缺点 平均数平均数 与每一个数据有关,更与每一个数据有关,更 能反映全体的信息能反映全体的信息. 受少数极端值的影受少数极端值的影 响较大,使其在估响较大,使其在估 计总体时的可靠性计总体时的可靠性 降低降低. 第56页/共85页 月均用水量月均用水量/t 频率频率/组距组距 o 4.543.532.521.510.5 0.50 0.40 0.30 0.20 0.
42、10 思考思考1:如何从频率分布直方图中估计:如何从频率分布直方图中估计众数众数? 2.2 5 众数在样本数据的频率分布直方图中众数在样本数据的频率分布直方图中 ,就是最高矩形的中点的横坐标。,就是最高矩形的中点的横坐标。 第57页/共85页 0.02 0.04 0.06 0.14 0.25 0.22 0.15 0.08 0.04 月均用水量月均用水量/t 频率频率/组距组距 o 4.543.532.521.510.5 0.50 0.40 0.30 0.20 0.10 前四个小矩形的面前四个小矩形的面 积和积和=0.49 2.0 2 后四个小矩形的后四个小矩形的 面积和面积和=0.26 分析:
43、分析:在样本数据中,有在样本数据中,有50%50%的个体小于或等于中位数,也有的个体小于或等于中位数,也有50%50%的个体大的个体大 于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图 的面积应该相等。的面积应该相等。 总结:总结:在频率分布直方图中,把频率分布直方图划分左右两在频率分布直方图中,把频率分布直方图划分左右两 个面积相等的分界线与个面积相等的分界线与x轴交点的横坐标称为中位数。轴交点的横坐标称为中位数。 注注:图中的数据是小矩形的面积即频率图中的数据是小矩形的面积即频率 上图中,设中位数为上图中,
44、设中位数为x,则,则 02. 2 5 . 05 . 0) 2(22. 015. 008. 004. 0 x x 第58页/共85页 注注:图中的数据是小矩形的面积即频率图中的数据是小矩形的面积即频率 0.02 0.04 0.06 0.14 0.25 0.22 0.15 0.08 0.04 月均用水量月均用水量/t 频率频率/组距组距 o 4.543.532.521.510.5 0.50 0.40 0.30 0.20 0.10 . 0.250.7 5 1.2 5 1.752.25 . 2.753.253.754.25 平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。平均
45、数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。 2.0 2 第59页/共85页 在频率分布直方图中如何估计在频率分布直方图中如何估计众数众数? 月均用水量月均用水量 /t 频率频率 组距组距 0.1 0 0.2 0 0.3 0 0.4 0 0.5 0 0.51 1.5 2 2.533.544.5 众数:频率分布直方图中众数:频率分布直方图中最高最高小长方形底边中点的小长方形底边中点的横坐标横坐标. 左图中,众数为左图中,众数为_. 2.25 第60页/共85页 在频率分布直方图中如何估计在频率分布直方图中如何估计中位数中位数? 月均用水量月均用水量 /t 频率频率 组距
46、组距 0.1 0 0.2 0 0.3 0 0.4 0 0.5 0 0.51 1.5 2 2.533.544.5 中位数中位数:在频率分布直方图中:在频率分布直方图中 ,把频率分布直方图划分左右,把频率分布直方图划分左右 两个面积相等的分界线与两个面积相等的分界线与x轴交轴交 点的横坐标点的横坐标 。 左图中左图中,中位数为,中位数为_. 2.02 第61页/共85页 在频率分布直方图中如何估计在频率分布直方图中如何估计平均数平均数? 月均用水量月均用水量 /t 频率频率 组距组距 0.1 0 0.2 0 0.3 0 0.4 0 0.5 0 0.51 1.5 2 2.533.544.5 平均数是
47、频率分布直方图的平均数是频率分布直方图的“ 重心重心”,等于频率分布直方图中每,等于频率分布直方图中每 个小矩形的面积乘以小矩形底边中个小矩形的面积乘以小矩形底边中 点的横坐标之和点的横坐标之和. 左图中左图中,平均数为,平均数为_. 2.02 第62页/共85页 方差与标准差方差与标准差 第63页/共85页 引言引言: 样本的众数、中位数和平均数常用来表示样本数据的样本的众数、中位数和平均数常用来表示样本数据的“中心值中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息
48、. 平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度. 第64页/共85页 情景一情景一:在一次射击选拔赛中,甲、乙两名运动在
49、一次射击选拔赛中,甲、乙两名运动 员各射击员各射击1010次,每次命中的环数如下:次,每次命中的环数如下: 甲:甲:7 8 7 9 5 4 9 10 7 47 8 7 9 5 4 9 10 7 4 乙:乙:9 5 7 8 7 6 8 6 7 79 5 7 8 7 6 8 6 7 7 甲、乙两人本次射击的平均成绩分甲、乙两人本次射击的平均成绩分 别为多少环?别为多少环? 第65页/共85页 思考:思考:甲、乙两人射击的平均成绩相等,观甲、乙两人射击的平均成绩相等,观 察两人成绩的频率分布条形图,你能说明其察两人成绩的频率分布条形图,你能说明其 水平差异在那里吗?水平差异在那里吗? 环数环数 甲的
50、成绩比较分散,极差较大,乙甲的成绩比较分散,极差较大,乙 的成绩相对集中,比较稳定的成绩相对集中,比较稳定. . 第66页/共85页 极差极差 : 一组数据的最大值与最小值的差一组数据的最大值与最小值的差 极差越大,数据越分散,越不稳极差越大,数据越分散,越不稳 定定 极差越小,数据越集中,越稳定极差越小,数据越集中,越稳定 极差体现了数据的离散极差体现了数据的离散程度程度. 第67页/共85页 为了对玉米生长的高度差异以及两为了对玉米生长的高度差异以及两 人射击水平的稳定程度等做个合理的人射击水平的稳定程度等做个合理的 评价评价, 我们用一个新的概念来研究,我们用一个新的概念来研究, 方差和
51、标准差方差和标准差. 有没有一种可能两组数据极差相同但是稳定性差别很大呢?有没有一种可能两组数据极差相同但是稳定性差别很大呢? 第68页/共85页 甲的环数极差甲的环数极差=10- 4=6 乙的环数极差乙的环数极差=9-5=4. 它们在一定程度上表明了样本数据的分散程度它们在一定程度上表明了样本数据的分散程度,与平均数一与平均数一 起起,可以给我们许多关于样本数据的信息可以给我们许多关于样本数据的信息.显然显然,极差对极端值非极差对极端值非 常敏感常敏感,注意到这一点注意到这一点,我们可以得到一种我们可以得到一种“去掉一个最高分去掉一个最高分,去去 掉一个最低分掉一个最低分”的统计策略的统计策
52、略. 考察样本数据的考察样本数据的分散程度分散程度的大小,最常用的统计量是的大小,最常用的统计量是标准差标准差 标准差是样本数据到平均数的一种标准差是样本数据到平均数的一种平均距离平均距离,一般用,一般用s表示表示 所谓所谓“平均距离平均距离”,其含义可作如下理解:,其含义可作如下理解: :x。xxxxx in 的距离是到表示这组数据的平均数假设样本数据是 ,., 21 ).,2,1(nixx i 第69页/共85页 :xxxx, n 是平均距离的到样本数据于是”“, 21 . 21 n xxxxxx n 由于上式含有绝对值,运算不太方便,因此,通常改用由于上式含有绝对值,运算不太方便,因此,
53、通常改用 如下公式来计算如下公式来计算标准差标准差 .)()()( 1 22 2 2 1 xxxxxx n s n 22 2 2 1 2 )()()( 1 xxxxxx n s n 方差方差: 第70页/共85页 对于样本数据对于样本数据x x1 1,x x2 2,x xn n,设想通,设想通 过各数据到其平均数的平均距离来反映过各数据到其平均数的平均距离来反映 样本数据的分散程度,那么这个平均距样本数据的分散程度,那么这个平均距 离如何计算?离如何计算? 标准差的概念:标准差的概念: 第71页/共85页 计算标准差的公式:计算标准差的公式: 222 12 1 ()()() n sxxxxxx
54、 n 设一组样本数据设一组样本数据 x1,x2,xn ,其平均数为,其平均数为 ,则,则 标准差是样本数据到平均数的一种标准差是样本数据到平均数的一种平平 均距离均距离,一般用,一般用s表示。表示。 第72页/共85页 标准差的平方标准差的平方s2方差方差 2222 12 1 ()()() n sxxxxxx n 在刻画样本数据分散程度上,方差在刻画样本数据分散程度上,方差s2与与 标准差标准差s是一样的。但是在解决实际问是一样的。但是在解决实际问 题时,一般多采用标准差题时,一般多采用标准差s 。 第73页/共85页 对标准差的理解对标准差的理解 (1)标准差是用来描述样本数据的离散程)标准
55、差是用来描述样本数据的离散程 度的,它反映了各个样本数据聚集于样本平度的,它反映了各个样本数据聚集于样本平 均数周围的程度。标准差越小,表明各个样均数周围的程度。标准差越小,表明各个样 本数据在样本平均数的周围越集中;反之,本数据在样本平均数的周围越集中;反之, 标准差越大,表明各个样本数据在样本平均标准差越大,表明各个样本数据在样本平均 数的两边越分散。数的两边越分散。 (2)在实际应用中,标准差常被理解为)在实际应用中,标准差常被理解为 稳定性。稳定性。 第74页/共85页 标标准差的取值范围是什么?标准差为准差的取值范围是什么?标准差为 0的样本数据有什么特点?的样本数据有什么特点? 标标准差是非负的。标准差为准差是非负的。标准差为0意味着所意味着所 有的样本数据都相等的特性,且与样本平均有的样本数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 出借咨询服务协议
- 联合研究开发协议
- 办公项目总结与未来展望报告
- 地坪浇筑劳务分包合同
- 独院买卖合同协议书
- 砖砌体工程施工合同协议书
- 高效办公流程优化解决方案
- 媒体资源共享合作框架协议
- 制作细胞的结构模型(第1课时)教学设计-2024-2025学年苏科版生物七年级上册
- 写字楼照明设计施工方案
- 路基换填级配碎石施工方案
- EIM Book 1 Unit 7 Learning languages单元检测试题
- 四川省政府采购评审专家考试题库
- GB/T 34875-2017离心泵和转子泵用轴封系统
- GB/T 25085.3-2020道路车辆汽车电缆第3部分:交流30 V或直流60 V单芯铜导体电缆的尺寸和要求
- GA/T 1081-2020安全防范系统维护保养规范
- 2023一年级下册语文教学工作计划(2篇)
- 2022年云上贵州大数据(集团)有限公司招聘笔试试题及答案解析
- (虎符铜砭刮痧)基本理论及临床应用课件
- 文件袋、档案袋密封条模板
- 依图科技业务概述
评论
0/150
提交评论