第2章数据分布特征的描述(2)_第1页
第2章数据分布特征的描述(2)_第2页
第2章数据分布特征的描述(2)_第3页
第2章数据分布特征的描述(2)_第4页
第2章数据分布特征的描述(2)_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第第2 2章章 数据分布特征的描述数据分布特征的描述(2) 数据的分布特征主要体现在两个方面:数据的分布特征主要体现在两个方面: 1、数据分布的集中趋势数据分布的集中趋势 2、数据分布的离中趋势(离散程度)数据分布的离中趋势(离散程度)第一节第一节 数据分布集中趋势的测度数据分布集中趋势的测度 所谓集中趋势是指一组数据向某一中心值靠所谓集中趋势是指一组数据向某一中心值靠拢的倾向,测度数据的集中趋势也就是寻找数据一拢的倾向,测度数据的集中趋势也就是寻找数据一般水平的代表值或中心值(即般水平的代表值或中心值(即平均数平均数)。)。一、众数(一、众数(Mo) (一)概念(一)概念 众数是一组数中出

2、现次数最多的众数是一组数中出现次数最多的变量值变量值。 注意:注意:如果一组数中有多个变量值出现的次数同样最多时,如果一组数中有多个变量值出现的次数同样最多时,则有多个众数;一组数可能只有一个众数;如果各变量值出则有多个众数;一组数可能只有一个众数;如果各变量值出现次数一样多或差不多时,则没有众数。所以,只有变量值现次数一样多或差不多时,则没有众数。所以,只有变量值个数多且分布集中时,才有众数。个数多且分布集中时,才有众数。(二)众数的确定(二)众数的确定1、根据未分组或单项式变量数列计算众数根据未分组或单项式变量数列计算众数 出现次数最多的变量值就是众数。出现次数最多的变量值就是众数。注意:

3、注意:也可以从次数分布曲线的高低来判断。也可以从次数分布曲线的高低来判断。2、根据组距式变量数列确定众数根据组距式变量数列确定众数 标志值标志值 x 次数次数 f x1x2 x2x3 x3x4 x4x5 . . . . xn-1xn f1 f2 :众数所在组前一组(众数所在组前一组( f-1) f3 :众数所在组众数所在组( f) f4 :众数所在组后一组(众数所在组后一组( f+1) . . . . fn-1 合合 计计 f 步骤:步骤: 第一,确定众数所在的组第一,确定众数所在的组(次数最多的组)(次数最多的组); 第二,运用公式计算:第二,运用公式计算:iffffffLoM)1()1(1

4、见第见第24页的例题页的例题二、中位数二、中位数(Me)(一)概念(一)概念 中位数是一组数据中位数是一组数据排序排序后,处于后,处于中间位置中间位置上的变上的变量值。量值。 如一组数:如一组数:x1、x2、x3、xn (二)中位数的确定(二)中位数的确定 (1 1)对于未分组数据)对于未分组数据 步骤:步骤: 第一,对数据排序。第一,对数据排序。 第二,找出中位数所在的位置,该位置上的变量值就是中位第二,找出中位数所在的位置,该位置上的变量值就是中位数。数。 当当n为奇数时,中位数就是第为奇数时,中位数就是第(n+1)/2位置上的变量值;当位置上的变量值;当n为偶数时,中位数就是为偶数时,中

5、位数就是 中间位置上两个变量值相中间位置上两个变量值相加除以加除以2。122nn和第第见第见第25页的例题页的例题(2 2)对于单项式变量数列)对于单项式变量数列 标志值标志值 x 次数次数 f 向下累计次数向下累计次数Z x1 x2 x3 x4 . . . . xn f1 f2 f3 f4 . . . . fn Z1 Z2 Z3:中位数所在组中位数所在组 Z4 . . . . Zn 合合 计计 f 注意:注意:这里的累计次数表示的是一个范围。这里的累计次数表示的是一个范围。步骤:步骤:第一,计算出向下累计次数。第一,计算出向下累计次数。第二,在累计次数中沿着累计的方向找出包括第二,在累计次数

6、中沿着累计的方向找出包括 的第一个组,该组即为中位数所在的组。的第一个组,该组即为中位数所在的组。第三,与该组相对应的变量值即为中位数。第三,与该组相对应的变量值即为中位数。2 f(3 3)对于组距式变量数列)对于组距式变量数列 分分 组组 次数次数 f 向下累计向下累计 x1x2 x2x3 x3x4 x4x5 . . . . xn-1xn f1 f2 f3 (fm) f4 . . . . fn Z1 Z2 (Sm-1) Z3 Z4 . . . . Zn 合合 计计 f 注意:注意:这里的累计次数表示的是一个范围。这里的累计次数表示的是一个范围。步骤:步骤:第一,计算出向下累计次数。第一,计算

7、出向下累计次数。第二,在累计次数中沿着累计的方向找出包括第二,在累计次数中沿着累计的方向找出包括 的的 第一个组,该组即为中位数所在的组。第一个组,该组即为中位数所在的组。 第三,采用公式进行计算。第三,采用公式进行计算。2 f 2 1ifSfLMmme见第见第25页的例题页的例题三、分位数(以四分位数为例)三、分位数(以四分位数为例) 先将全部数据按从小到大的顺序排列后,再将其先将全部数据按从小到大的顺序排列后,再将其划分为数据个数相等的四部分,每部分的数据个数各划分为数据个数相等的四部分,每部分的数据个数各占占25%,其端点分别为,其端点分别为Q Q0、Q Q1、Q Q2、Q Q3、Q Q

8、4 。Q Q0 0Q Q1 1Q Q2 2Q Q3 3Q Q4 4Q1称为下四分位数、称为下四分位数、 Q2为中位数、为中位数、 Q3称为上四分位数称为上四分位数其中:其中: Q Q0 是最小值是最小值;Q Q1是第是第 位置上的数值位置上的数值; Q Q2是第是第 位置上的数值位置上的数值(即中位数)即中位数); Q Q3是第是第 位置上的数值;位置上的数值; Q Q4是最大值是最大值。 413n41n21412nn 注意:注意: 1、如果数据个数不能被如果数据个数不能被4除尽时,还是按这个规则来确定分位除尽时,还是按这个规则来确定分位数的位置;数的位置;2、有时可能出现分位数在两个数之间的

9、情况,这时有时可能出现分位数在两个数之间的情况,这时如果分位数刚好在这两个数的正中间时,分位数就是这两个数相如果分位数刚好在这两个数的正中间时,分位数就是这两个数相加除以加除以2。但有时不是刚好在这两个数的正中间时,要用其中比较但有时不是刚好在这两个数的正中间时,要用其中比较小的数加上按比例分摊的这两个数之间的距离。小的数加上按比例分摊的这两个数之间的距离。【例】:【例】:9个家庭的人均月收入数据个家庭的人均月收入数据 原始数据原始数据: 1500 750 780 1080 850 960 2000 1250 1630 排排 序序: 750 780 850 960 1080 1250 1500

10、 1630 2000 位位 置置: 1 2 3 4 5 6 7 8 95 . 74) 19( 35 . 241931位置位置QQ1565216301500815285078031QQ见第见第26页的例题。页的例题。 注:该例是根据组距式变量数列来求分位数,注:该例是根据组距式变量数列来求分位数,计算方法与组距式变量数列求中位数的方法相同。计算方法与组距式变量数列求中位数的方法相同。 注意:注意:众数、中位数和分位数是根据变量值在一组数中的众数、中位数和分位数是根据变量值在一组数中的位置来确定的,而不是根据各变量值大小来确定的,故称它们位置来确定的,而不是根据各变量值大小来确定的,故称它们为位置

11、平均数,它们不受极端值的影响。为位置平均数,它们不受极端值的影响。四、均值(算术平均数,四、均值(算术平均数, ) (一)简单算术平均数(一)简单算术平均数 当掌握的资料是当掌握的资料是未分组资料未分组资料时,就计算时,就计算简单算术平均简单算术平均数数。如一组数:。如一组数:x1、x2、x3、xn 。则其算术平均数为;。则其算术平均数为;nxnxxxxn21x 注意:注意:算术平均数的分母等于分子中相加数据的个数,即算术平均数的分母等于分子中相加数据的个数,即分子与分母属于同一总体。分子与分母属于同一总体。(二)加权算术平均数(二)加权算术平均数 当掌握的资料是当掌握的资料是分组资料分组资料

12、时,就计算时,就计算加权算术平均数加权算术平均数。 1、单项式变量数列单项式变量数列 标志值标志值 x 次数次数 f 标志总量标志总量 xf 比重比重 f/ f x1 x2 x3 . . . . xn f1 f2 f3 . . . . fn x1f1 x2f2 x3f3 . . . . xn fn f1/ f f2/ f f3/ f . . . . fn/ f 合合 计计 f xf 1ffxfxfx见第见第27页的例题页的例题分析:分析: f与与 之间的关系。之间的关系。f越大,越大, 越靠近该组的变量越靠近该组的变量值,值,f越小,越小, 越远离该组的变量值,越远离该组的变量值, 说明说明f

13、对对 起一个起一个权衡轻重的作用,故权衡轻重的作用,故f叫权数。因为叫权数。因为 ,所以就,所以就权数的实质而言,权数的实质而言,f是通过其相对数形式是通过其相对数形式 来起作用来起作用的,所以,的,所以, 叫权重系数。叫权重系数。xxxffffxffxfxfx 根据根据 ,加权算术平均数有两种,加权算术平均数有两种算法。算法。ffxfxfx2、组距式变量数列组距式变量数列 当组距式变量数列求算术平均数时,先要求出各组的组中值当组距式变量数列求算术平均数时,先要求出各组的组中值来作为各组的变量值来作为各组的变量值(x),其余步骤与单项式变量数列相同。,其余步骤与单项式变量数列相同。 分分 组组

14、 次数次数 f 组中值组中值 x标志总量标志总量 xf a1b1 a2b2 a3b3 . . . . anbn f1 f2 f3 . . . . fn x1 x2 x3 . . . . xn x1f1 x2f2 x3f3 . . . . xn fn 合合 计计 f _ xf 见第见第27页的例题页的例题注意:注意:1、利用组中值来代表各组的一般水平时,是假定各组、利用组中值来代表各组的一般水平时,是假定各组 中各标志值在该组内是均匀分布的,故根据组中值中各标志值在该组内是均匀分布的,故根据组中值 计算的平均数是一个近似值。计算的平均数是一个近似值。 2、算术平均数易受到极端值(极大值和极小值统

15、称极、算术平均数易受到极端值(极大值和极小值统称极 端值)的影响,故在统计实务中,往往将极端值剔端值)的影响,故在统计实务中,往往将极端值剔 除掉再计算平均数。除掉再计算平均数。五五 几何平均数(几何平均数(G) 1、概念、概念 n个变量值个变量值 (一般是比率值一般是比率值) 连乘积的连乘积的n次方根。次方根。 几何平均数的适用条件:几何平均数的适用条件:当各变量值的总量等于各变量值当各变量值的总量等于各变量值的乘积,而不是各变量值相加时,对这些变量值求平均数,就的乘积,而不是各变量值相加时,对这些变量值求平均数,就应采用几何平均法,如求平均发展速度、平均合格率等。应采用几何平均法,如求平均

16、发展速度、平均合格率等。2、几何平均数的计算、几何平均数的计算(1 1)简单几何平均数(未分组的资料)简单几何平均数(未分组的资料) 如一组数:如一组数:x1、x2、x3、xn 。nnxxxG 21见第见第29页的例题页的例题 在求几何平均数之前要判断是否满足求几何平均数的适用条在求几何平均数之前要判断是否满足求几何平均数的适用条件。件。 标志值标志值 x 次数次数 f x1 x2 x3 . . . . xn f1 f2 f3 . . . . fn 合合 计计 f (2 2)加权几何平均数(分组资料)加权几何平均数(分组资料)fxxxGnfnff 2211(1)(2)()2nnn nxxxxn

17、n 式中:式中:分子分子x的值是对的值是对原始数据排序原始数据排序以后的值;以后的值;n 表示数据表示数据的个数;的个数; 表示切尾系数表示切尾系数 ,它等于两端它等于两端各各切除的数据个数与数切除的数据个数与数据总个数之比。据总个数之比。六、切尾均值六、切尾均值【例】【例】某次比赛共有某次比赛共有1111名评委,对某位歌手的给分分别是:名评委,对某位歌手的给分分别是: 经整理得到顺序统计量值为经整理得到顺序统计量值为123456, , , , , ,9.22,9.25,9.20,9.30,9.65,9.30,xxxxxx7891011, , , , 9.27,9.20,9.28,9.25,9

18、.24xxxxx(1)(2)(3)(4)(5)(6), , , , , ,9.20, 9.20, 9.22, 9.24, 9.25, 9.25,xxxxxx(7)(8)(9)(10)(11), , , , 9.27, 9.28, 9.30, 9.30, 9.65xxxxx去掉一个最高分和一个最低分,取去掉一个最高分和一个最低分,取 =1/11 26.993 .922.92 .921111111211)10()3()2(1111111211111111111111xxxxxxx 对称分布:对称分布: 左偏分布:左偏分布: 右偏分布:右偏分布:oeMMxxeMoMxeMoM左偏分布左偏分布xeMo

19、M右偏分布右偏分布oMeMx对称分布对称分布xoMeM=七、几种平均数的关系七、几种平均数的关系总结:总结: 1、中位数在一般情况下,始终居于算术平均数和众数中位数在一般情况下,始终居于算术平均数和众数之间,算术平均数和众数分布在中位数两侧,众数以曲线之间,算术平均数和众数分布在中位数两侧,众数以曲线最高点来定,算术平均数的位置根据极端值的种类来定。最高点来定,算术平均数的位置根据极端值的种类来定。 2、可以根据一组数的这三个平均数之间的大小关系来可以根据一组数的这三个平均数之间的大小关系来判断该组数呈何种分布。判断该组数呈何种分布。第二节第二节 数据分布离散程度的测度数据分布离散程度的测度

20、数据分布的离散程度是数据分布的另一个特征,它所反映数据分布的离散程度是数据分布的另一个特征,它所反映的是各变量值远离其中心值的程度,也称为离中趋势。的是各变量值远离其中心值的程度,也称为离中趋势。 平均数只反映了一组数中各数据的共性,掩盖了数据之间平均数只反映了一组数中各数据的共性,掩盖了数据之间的差异性。数据分布的离散程度就是用来反映数据之间的差异的差异性。数据分布的离散程度就是用来反映数据之间的差异性的。性的。 数据分布离散程度的测度就是找出能对该组数据进行分散数据分布离散程度的测度就是找出能对该组数据进行分散程度描述的测度值,程度描述的测度值,这些测度值常见的有:极差(全距)、方这些测度

21、值常见的有:极差(全距)、方差、标准差、离散系数等差、标准差、离散系数等。一、极差(全距,一、极差(全距,R) 全距是一组数中最大的数值与最小的数值之差。全距是一组数中最大的数值与最小的数值之差。 全距的优点是计算简单,意思明确。不足之处是它只反全距的优点是计算简单,意思明确。不足之处是它只反映了一组数中最大值与最小值之间的差异程度,对于中间其映了一组数中最大值与最小值之间的差异程度,对于中间其他数据之间的差异程度却没有反映出来。他数据之间的差异程度却没有反映出来。二、内距(四分位差二、内距(四分位差Q) 先将全部标志值按从小到大的顺序排列后,再将先将全部标志值按从小到大的顺序排列后,再将其划

22、分为总体单位数相等的四部分,每部分的总体单其划分为总体单位数相等的四部分,每部分的总体单位数各占位数各占25%,其端点分别为,其端点分别为Q Q0、Q Q1、Q Q2、Q Q3、Q Q4 。Q Q0 0Q Q1 1Q Q2 2Q Q3 3Q Q4 4Q1称为下四分位数、称为下四分位数、 Q2为中位数、为中位数、 Q3称为上四分位数称为上四分位数其中:其中: Q Q0 是第一个数,即最小值是第一个数,即最小值;Q Q1是第是第 位置上的位置上的数值数值; Q Q2是第是第 位置上的数值位置上的数值(即中位数)即中位数); Q Q3是第是第 位置上的数值;位置上的数值; Q Q4是最后一个数,即是

23、最后一个数,即最大值最大值。 则四分位差为:则四分位差为:13QQQ413n41n21412nn见第见第33页的例题页的例题三、方差和标准差三、方差和标准差(一)概念(一)概念 各变量值与其算术平均数各变量值与其算术平均数离差离差平方平方的的算术平均数算术平均数叫方差;叫方差;方差的方根就是标准差。方差的方根就是标准差。 注意:注意:由于标准差与变量值的单位相同,其实际意义要比方由于标准差与变量值的单位相同,其实际意义要比方差清楚,因此在对社会经济现象进行分析时,更多使用标准差。差清楚,因此在对社会经济现象进行分析时,更多使用标准差。 (1 1)总体方差()总体方差(2) 对于未分组资料对于未

24、分组资料 对于分组数据对于分组数据(组距式变量数列要先计算出各组组中组距式变量数列要先计算出各组组中值来作为各组的变量值值来作为各组的变量值 X ) ) NXX22FFXX22(二)计算(二)计算 1、总体方差(总体方差(2)和总体标准差()和总体标准差() (2 2)总体标准差()总体标准差() 对于未分组资料:对于未分组资料: 对于分组数据:对于分组数据:NXX2FFXX22、样本方差(样本方差( )和样本标准差()和样本标准差( ) (1)样本方差样本方差 对于未分组资料:对于未分组资料: 对于分组数据对于分组数据(组距式变量数列要先计算出各组组中值组距式变量数列要先计算出各组组中值来作

25、为各组的变量值来作为各组的变量值 X ) ) 2SS1s22nxx1s22ffxx * * 样本的方差和标准差为什么要除以样本次数减样本的方差和标准差为什么要除以样本次数减1,见教,见教材的解释。材的解释。(2)样本标准差样本标准差 对于未分组资料:对于未分组资料: 对于分组数据:对于分组数据:1s2nxx1s2ffxx见第见第35页的例题页的例题 根据分组资料计算标准差的步骤:根据分组资料计算标准差的步骤: 第一、若是组距式变量数列,应先计算出各组组中值;第一、若是组距式变量数列,应先计算出各组组中值; 第二、计算算术平均数;第二、计算算术平均数; 第三、计算各组标志值与其算术平均数的离差;

26、第三、计算各组标志值与其算术平均数的离差; 第四、取离差的平方;第四、取离差的平方; 第五、对离差的平方求算术平均数。第五、对离差的平方求算术平均数。注意:注意: 1、当样本的次数当样本的次数n很大(一般是大于等于很大(一般是大于等于30时),样本方差与总体方时),样本方差与总体方差的计算结果相差很小,这时样本方差也可以用总体方差来计算。差的计算结果相差很小,这时样本方差也可以用总体方差来计算。 2、标准差(方差)是通过各变量值到其算术平均数的标准差(方差)是通过各变量值到其算术平均数的平均距离平均距离来反来反映该组中各数据之间的差异程度的。标准差(方差)值越大,表示各变映该组中各数据之间的差

27、异程度的。标准差(方差)值越大,表示各变量值到他们的算术平均数的平均距离越远,数据越分散;标准差(方差)量值到他们的算术平均数的平均距离越远,数据越分散;标准差(方差)值越小,表示各变量值到他们的算术平均数的平均距离越短,数据越集值越小,表示各变量值到他们的算术平均数的平均距离越短,数据越集中。中。四、四、 离散系数离散系数 全距和标准差的共同特点:全距和标准差的共同特点: 1、它们都是有单位的数,其单位与变量值的单位相同。、它们都是有单位的数,其单位与变量值的单位相同。 2、它们都能较好地反映、它们都能较好地反映一组一组数的离散程度,但要比较数的离散程度,但要比较多组多组数数 的离散程度时,

28、如果通过计算以上各指标来比较,则要求的离散程度时,如果通过计算以上各指标来比较,则要求 这几组数的这几组数的计量单位计量单位和和平均数平均数都必须相等。都必须相等。 要比较几组要比较几组平均水平平均水平或或计量单位计量单位不同的数据的离散程度时,不同的数据的离散程度时,不能通过计算以上各指标来比较,而应该计算各组的离散系数来不能通过计算以上各指标来比较,而应该计算各组的离散系数来比较。比较。 离散系数:离散系数:某组数的标准差除以该组数的算术某组数的标准差除以该组数的算术平均数。平均数。 计算出各组离散系数后,离散系数大的组差异程度大;计算出各组离散系数后,离散系数大的组差异程度大;离散系数小

29、的组差异程度小。离散系数小的组差异程度小。样本总体 %100 %100 xssVXV见第见第36页的例题页的例题第三节第三节 数据分布偏态与峰度的测定数据分布偏态与峰度的测定一、偏态及其测定一、偏态及其测定 1 1、概念、概念 偏态是对数据分布偏斜方向及程度的测定。偏态是对数据分布偏斜方向及程度的测定。 2、偏态系数的计算公式、偏态系数的计算公式 偏斜程度:偏斜程度:SK 越大,偏斜程度越大;越大,偏斜程度越大; SK 越小,偏斜程度越小。越小,偏斜程度越小。 偏斜方向:偏斜方向: SK大于零,右偏分布;大于零,右偏分布; SK等于零,对称分布;等于零,对称分布; SK小于零,左偏分布。小于零

30、,左偏分布。)( 33fnnsfxx SK见第见第37-38页例页例2.3二、峰度二、峰度(一)概念(一)概念 峰度是指次数分布曲线尖峭的程度。它是与标准正态分布曲峰度是指次数分布曲线尖峭的程度。它是与标准正态分布曲线相对而言的,标准正态分布曲线的峰顶,叫正态峰;比标准线相对而言的,标准正态分布曲线的峰顶,叫正态峰;比标准正态分布曲线峰顶高的为尖顶峰;比标准正态分布曲线峰顶扁正态分布曲线峰顶高的为尖顶峰;比标准正态分布曲线峰顶扁平的为平顶峰。平的为平顶峰。尖顶峰尖顶峰与标准正态与标准正态分布比较!分布比较!(二)峰度的测定(二)峰度的测定 峰度是通过峰度系数来测定的。峰度是通过峰度系数来测定的

31、。)( 3- 44fnnsfxxK 峰顶类型:峰顶类型: 当当 K 大于大于0,尖顶峰;,尖顶峰; 当当 K等于等于0,正态峰;,正态峰; 当当 K小于小于0,平顶峰。,平顶峰。 尖峭程度:尖峭程度: K 越大,尖峭程度越大;越大,尖峭程度越大; K 越小,尖峭程度越小。越小,尖峭程度越小。 见第见第39页例页例2.4第四节第四节 统计资料的显示统计资料的显示一、统计表一、统计表(一)概念(一)概念 统计表是集中而有序地显示统计资料的表格,它是表现统计表是集中而有序地显示统计资料的表格,它是表现统计资料和积累统计资料的基本手段。统计资料和积累统计资料的基本手段。(二)统计表的结构(二)统计表的

32、结构 由由表头、行标题、列标题、数字资料表头、行标题、列标题、数字资料和和附加附加五部分组五部分组成。成。 见第见第40页表页表2.16(三)编制统计表时应注意的问题(三)编制统计表时应注意的问题 总体上看:总体上看:科学、实用、简练、美观科学、实用、简练、美观 具体来说具体来说: 1 文字要简练,应使统计表的横竖长度比例适当文字要简练,应使统计表的横竖长度比例适当(10:7)。)。 2 如果全表只有一个单位,就写在表的右上方。若各指如果全表只有一个单位,就写在表的右上方。若各指 标的计量单位不同,则应放在每个指标后(列标题标的计量单位不同,则应放在每个指标后(列标题 的单位)或单独列出一列(

33、行标题的单位)标明。的单位)或单独列出一列(行标题的单位)标明。3 表的上下线要用粗线或双线画出,中间用细线。左右两表的上下线要用粗线或双线画出,中间用细线。左右两 端不能画纵线封口。列与列之间要用竖线画出,行与行端不能画纵线封口。列与列之间要用竖线画出,行与行 之间尽可能不用横线。之间尽可能不用横线。4 表中数据一般右对齐,有小数点的以小数点对齐,小数表中数据一般右对齐,有小数点的以小数点对齐,小数 的位数应统一。对于没有数据的用的位数应统一。对于没有数据的用“”表示,对于数字表示,对于数字 太小,可以忽略不计或数据不详时用太小,可以忽略不计或数据不详时用“”表示。表示。5 在统计表的下方注

34、明资料的来源、指标的注释和必要的在统计表的下方注明资料的来源、指标的注释和必要的 说明等内容。说明等内容。二、统计图二、统计图(一)线图(一)线图 线图是在平面坐标上用折线表现事物的数量随时间变化线图是在平面坐标上用折线表现事物的数量随时间变化的统计图。的统计图。 统计图多种多样,前面讲过的直方图、折线图等也是统统计图多种多样,前面讲过的直方图、折线图等也是统计图。在计图。在Excel中有各种统计图。中有各种统计图。020004000600019911992199319941995199619971998城镇居民农村居民收收入入 (元)(元) 图图3-14 3-14 城乡居民家庭人均收入城乡居

35、民家庭人均收入(二)条形图(二)条形图 条形图是用宽度相同的条形的高度或长短来表示数据变条形图是用宽度相同的条形的高度或长短来表示数据变动的图形。可以横置,也可纵置。纵置时也称为柱形图;可动的图形。可以横置,也可纵置。纵置时也称为柱形图;可以是立体的,也可以是平面的。以是立体的,也可以是平面的。 注意:注意:条形图与直方图的区别:条形图与直方图的区别:1、条形图宽度相同,而条形图宽度相同,而直方图宽度不一定相同(如异距数列);直方图宽度不一定相同(如异距数列);2、条形图之间是条形图之间是间隔的,而直方图之间是靠拢的。间隔的,而直方图之间是靠拢的。人数(人)人数(人)5191610211204

36、080120 商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告广广告告类类型型 图图3-1 3-1 某城市居民关注不同类型广告的人数分布某城市居民关注不同类型广告的人数分布0200400600800100012001400产 量 103t1989199019951998199920002001年 份大黄鱼小黄鱼带鱼鱼(三)圆形图(饼图)和环形图(三)圆形图(饼图)和环形图 1、圆形图(饼图):圆形图(饼图):它是用圆形及圆内扇形面积来表示数它是用圆形及圆内扇形面积来表示数值大小的图形。值大小的图形。 2、环形图:环形图:环形图中间有一个环形图中间有一个“空洞空洞”,总体中的每一

37、部,总体中的每一部分数据用环中的一段表示。分数据用环中的一段表示。 区别:区别:圆形图只能显示一个总体各部分所占的比例,而环圆形图只能显示一个总体各部分所占的比例,而环形图可显示多个总体各部分所占的相应比例。形图可显示多个总体各部分所占的相应比例。 其他广告1.0% 房地产广告8.0% 商品广告56.0% 金融广告4.5% 服务广告25.5% 招生招聘广告5.8%某城市居民关注不同类型广告的人数构成某城市居民关注不同类型广告的人数构成8%36%31%15%7%33%26%21%13%10% 非常不满意 不满意 一般 满意 非常满意 甲乙两城市家庭对住房状况的评价甲乙两城市家庭对住房状况的评价(

38、四)茎叶图(四)茎叶图1、用于显示未分组的原始数据的分布;用于显示未分组的原始数据的分布;2、由由“茎茎”和和“叶叶”两部分构成,其图形是由数字组成的;两部分构成,其图形是由数字组成的;3、以该组数据的高位数值作树茎,低位数字作树叶;以该组数据的高位数值作树茎,低位数字作树叶;4、树叶上只保留一位数字;树叶上只保留一位数字;5、茎叶图类似于横置的直方图,但又有区别:直方图可观察茎叶图类似于横置的直方图,但又有区别:直方图可观察一组数据的分布状况,但没有给出具体的数值;茎叶图既一组数据的分布状况,但没有给出具体的数值;茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留能给出数据的分布状况

39、,又能给出每一个原始数值,保留了原始数据的信息。了原始数据的信息。数据见第数据见第17页表页表2.6。分析结果见第。分析结果见第41页表页表2.17茎叶图的扩展茎叶图的扩展(五)箱线图(五)箱线图(box plot)1.用于显示未分组的原始数据的分布。用于显示未分组的原始数据的分布。2.箱线图由一组数据的箱线图由一组数据的5个特征值(个特征值(最大值、最小值、中位数最大值、最小值、中位数Me、下四分位数下四分位数QL和上四分位数和上四分位数QU)绘制而成,它由一个箱子和)绘制而成,它由一个箱子和两条线段组成。两条线段组成。3.箱线图的绘制方法:箱线图的绘制方法:u排序排序u找出该组数据的找出该

40、组数据的5个特征值个特征值u连接两个四分(位)数画出箱子,再将两个极值点与箱子连接两个四分(位)数画出箱子,再将两个极值点与箱子相连接相连接 箱线图的构成:箱线图的构成:中位数中位数QULX最大值最大值X最小值最小值n以线段、箱体的长短来表示数据的分散程度,因为每一段中数以线段、箱体的长短来表示数据的分散程度,因为每一段中数据的个数相等,所以线段、箱体越长就表示数据越分散;以中据的个数相等,所以线段、箱体越长就表示数据越分散;以中位数的高低来表示平均数的大小;以中位数在箱体的位置来表位数的高低来表示平均数的大小;以中位数在箱体的位置来表示分布。示分布。分布的形状与箱线图分布的形状与箱线图对称分

41、布对称分布QL中位数中位数左偏分布左偏分布QL中位数中位数Q右偏分布右偏分布Q中位数中位数例例1 ( (见表见表2.6的数据的数据) )最小值最小值84最大值最大值128中位数中位数105下四分位数下四分位数96上四分位数上四分位数1098085 90 95 100 105 110 150 120 125 130周加工零件数的箱线图周加工零件数的箱线图【例【例2】 从某从某大学经济管理大学经济管理专业二年级学专业二年级学生中随机抽取生中随机抽取11人,对人,对8门门主要课程的考主要课程的考试成绩进行调试成绩进行调查,所得结果查,所得结果如表。试绘制如表。试绘制各科考试成绩各科考试成绩的批比较箱线的批比较箱线图,并分析各图,并分析各科考试成绩的科考试成绩的分布特征分布特征11名学生各科的考试成绩数据名学生各科的考试成绩数据课程名称课程名称学生编号学生编号1234567891011英语英语经济数学经济数学西方经济学西方经济学市场营销学市场营销学财务管理财务管理基础会计学基础会计学统计学统计学计算机应用基础计算机应用基础766593746870558590958187757391789751768570926881717488698465739570786690737884

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论