第五章分布的数值特征_第1页
第五章分布的数值特征_第2页
第五章分布的数值特征_第3页
第五章分布的数值特征_第4页
第五章分布的数值特征_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章第五章 分布的数值特征分布的数值特征 教教 学学 目目 的的 了解数据的集中趋势、离散趋势、偏了解数据的集中趋势、离散趋势、偏 度与峰度等分布特征的描述和测度度与峰度等分布特征的描述和测度 掌握各种数据分布特征的计算方法掌握各种数据分布特征的计算方法 本本 章章 重重 点点 算术平均数的计算算术平均数的计算 调和平均数的计算调和平均数的计算 标准差和标准差系数的应用标准差和标准差系数的应用 1 1 数据分布集中趋势的测定数据分布集中趋势的测定 平平 均均 指指 标标 一、平均指标的概念、特点、种类一、平均指标的概念、特点、种类 平均指标又称平均数,它是将一个平均指标又称平均数,它是将一个

2、 同质总体同质总体各单位之间量的各单位之间量的差异抽象化差异抽象化, 用用一个指标一个指标来代表总体各单位的来代表总体各单位的一般水一般水 平平,是对总体分布,是对总体分布集中趋势或中心位置集中趋势或中心位置 的度量。的度量。 特点特点 - - 数量抽象性数量抽象性 - - 集中趋势代表性集中趋势代表性 种类种类: : 数值平均数数值平均数 位置平均数位置平均数 算术平均数算术平均数 调和平均数调和平均数 几何平均数几何平均数 众数众数 中位数中位数 X h X G X o M e M 二、算术平均数二、算术平均数 (一)基本公式(一)基本公式 总体单位总量 总体标志总量 算术平均数 x 例例

3、: :平均工资平均工资= =工资总额工资总额/ /职工人数职工人数 平均成本平均成本= =总成本总成本/ /产量产量 算术平均数与强度相对数的区别算术平均数与强度相对数的区别 平均数平均数 (1 1)平均数是在同质总体内进行计算的。)平均数是在同质总体内进行计算的。 (2 2)平均数的分子与分母是一一对应关系,分)平均数的分子与分母是一一对应关系,分 母是分子(标志值)的承担者。母是分子(标志值)的承担者。 (3 3)平均数是反映一般水平或集中趋势的。)平均数是反映一般水平或集中趋势的。 强度相对数:强度相对数: (1 1)强度相对数是由两个不同质但有联系的总)强度相对数是由两个不同质但有联系

4、的总 体的指标数值对比求得。体的指标数值对比求得。 (2 2)强度相对数的分子与分母不存在一一对应)强度相对数的分子与分母不存在一一对应 关系。关系。 (3 3)强度相对数是反映两个有联系的总体之间)强度相对数是反映两个有联系的总体之间 的数量联系。的数量联系。 1 1、简单算术平均数:、简单算术平均数: 适合于未分组资料适合于未分组资料 6 6名学生的考试成绩分别为(分):名学生的考试成绩分别为(分):7979、 8282、8787、6060、9595、9191,他们的平均成绩,他们的平均成绩 是多少?是多少? n x n xxx x n 21 2 2、加权算术平均数:、加权算术平均数:适合

5、分组资料适合分组资料 工人日产量工人日产量 (件)(件) 工人人数工人人数 (人)(人) 工人人数比重工人人数比重 (%) 10 11 12 13 14 70 150 380 150 100 8.75 12.50 47.50 18725 12.50 合合 计计800100.00 10 11 12 13 1460 12 55 工人平均量(件) 10015038010070 141414131313121212111111101010 错误算法!错误算法!不符合基本公式,不是不符合基本公式,不是5 5个个 工人,而是工人,而是800800个工人;工人总产量不个工人;工人总产量不 是是6060件,而

6、是件,而是97109710件。件。 正确的算法:正确的算法: 1122 12 9710 12.1375 800 nn n x fx fx fxf x ffff (件) 例:某企业工人日产量分组资料如下:试计例:某企业工人日产量分组资料如下:试计 算平均日产量算平均日产量 日产量(件)工人人数(人)日产量(件)工人人数(人) (x x) (f f) 15 1015 10 16 2016 20 17 30 17 30 18 50 18 50 19 40 19 40 f xf x 解解: : 150 40195018301720161015 件176.17 150 2640 例:某企业职工按工资分组

7、资料如下:例:某企业职工按工资分组资料如下: 工工 资资 (元)(元) 职工人数(人)职工人数(人) x fx f 400 400 500 50500 50 500 500 600 70600 70 600 600 700 120700 120 700 700 800 60 800 60 要求:根据资料计算全部职工的平均工资。要求:根据资料计算全部职工的平均工资。 解:计算过程如下:解:计算过程如下: 工工 资资 (元)(元) 组中值组中值 x 职工人数职工人数 f 400500 500600 600700 700800 450 550 650 750 50 70 120 60 合合 计计 3

8、00 )(33.613 300 184000 元 f xf x 平均工资:平均工资: x f 22500 38500 78000 45000 184000 (二)影响加权算术平均数的因素(二)影响加权算术平均数的因素 1 1、看以下三例、看以下三例 例例1 1 性别性别成绩(分)成绩(分)X X人数人数f f (人)(人) 甲班甲班乙班乙班 男男808075753030 女女858580802020 x甲 =82=82分分 x乙 =77=77分分 结果:结果:f f相同,相同,x x不同,则平均不同,则平均 数不同数不同 相同)(比重 f f 例例2 2 x甲=1.375 =1.375元元/

9、/斤斤 x乙=1.325 =1.325元元/ /斤斤 结果:结果:f f不同,不同,x x相同,则平均相同,则平均 数不同数不同 不同)(比重 f f 产品产品价格价格X X (元(元/ /斤)斤) 成交量成交量( (万斤万斤)f)f 甲市场甲市场乙市场乙市场 A A1.21.21 12 2 B B1.41.42 21 1 C C1.51.51 11 1 例例3 3 x甲 =23=23岁岁 x乙=23 =23岁岁 结果:结果:f f不同,不同,x x相同,则平均相同,则平均 数相同数相同 相同)(但比重 f f 性别性别年龄年龄X X (岁)(岁) 人数人数( (人人)f)f 甲组甲组乙组乙组

10、 男男30306 61515 女女202014143535 2 2、从以上三例可得结论,影响加权算、从以上三例可得结论,影响加权算 术平均数的因素有二:术平均数的因素有二: 各组变量值(各组变量值(X X) 各组权数所占比重各组权数所占比重 )( f f 3 3、通过公式变形也可得到上述结论:、通过公式变形也可得到上述结论: f xf x f f x 1 1 f f x 2 2 f f x n n f f x 1 1 f f x 2 2 f f x n n )( f f x 4 4、前面例子也可求解为:、前面例子也可求解为: )(176 .17 %2719%3318%2017%1316%715

11、 件 )( f f xx (三)权数的选择(三)权数的选择 对绝对数求平均数时,频数一般都是权数。对绝对数求平均数时,频数一般都是权数。 但但对相对数求平均数时,频数不一定是权数对相对数求平均数时,频数不一定是权数。 例:某企业例:某企业2525个班组按工人劳动生产率分组资料个班组按工人劳动生产率分组资料 如下:如下: 求:这求:这2525个班组的平均劳动生产率个班组的平均劳动生产率 劳动生产率(件劳动生产率(件/ /人)人)生产班组数生产班组数工人数工人数 50-6050-601010150150 60-7060-707 7100100 70-8070-805 57070 80-9080-9

12、02 23030 9090以上以上1 11616 解:平均劳动生产率解:平均劳动生产率 = = f xf 总人数 总产量 366 1695308570751006515055 = 65.77(= 65.77(件件/ /人人) ) (四)算术平均数的数学性质(四)算术平均数的数学性质 1 1、各变量值与其均值的离差之和等于零,、各变量值与其均值的离差之和等于零, 即即 =0=0 2 2、各变量值与其均值的离差平方和最小,、各变量值与其均值的离差平方和最小, 即即 =min =min n i i x x 1 2 )( n i i x x 1 )( 3 3、如果变量、如果变量X X与变量与变量Y Y

13、之间的关系是之间的关系是Y Yi i=a=a+ +bXbXi i, , 其中其中a a、b b为常数,为常数, 则则 =a=a+ +b b Y X 优点:容易理解,便于计算优点:容易理解,便于计算 灵敏度高灵敏度高 稳定性好稳定性好 和和 缺点:易受极值影响缺点:易受极值影响 在偏斜分布和在偏斜分布和U U形分布中,不具形分布中,不具 有代表性有代表性 min )( 1 2 n i i x x 0)( 1 n i i x x 例:某售货小组有例:某售货小组有5 5名营业员,名营业员,1010月月6 6日一天的日一天的 销售额分别为销售额分别为520520元,元,600600元,元,480480

14、元,元,750750元元 和和500500元,求该日平均销售额。元,求该日平均销售额。 元元)(570 5 500750480600520 5 1 5 1 i i XX 其中一位销售员其中一位销售员1010月月7 7号销售号销售50005000元,其他元,其他 人销售额不变,人销售额不变,1010月月7 7号平均销售额是多少?号平均销售额是多少? 这个数据代表性如何?这个数据代表性如何? 元元)(1466 5 5007504806005000 X 二、调和平均数二、调和平均数 (一)基本公式(一)基本公式 1 1、例:张三在甲、乙、丙三处各买了、例:张三在甲、乙、丙三处各买了1 1元的小白元的

15、小白 菜,价格分别为菜,价格分别为1 1、1.11.1、1.21.2(元(元/ /斤)。求张斤)。求张 三购买小白菜的平均价格。三购买小白菜的平均价格。 解:平均价格解:平均价格= = 购买量 购买额= = 2 . 1 1 1 . 1 1 1 1 3 = = 742. 2 3 =1.094=1.094元元/ /斤斤 得,简单调和平均数得,简单调和平均数 x n x 1 2 2、例:张三在甲、乙、丙三处各买了、例:张三在甲、乙、丙三处各买了1 1、2 2、3 3 元的小白菜,价格分别为元的小白菜,价格分别为1 1、1.11.1、1.21.2(元(元/ / 斤)。求张三购买小白菜的平均价格。斤)。

16、求张三购买小白菜的平均价格。 解:平均价格解:平均价格= = 购买量 购买额 = = 2 . 1 3 1 . 1 2 1 1 321 = = 318. 5 6 =1.128=1.128元元/ /斤斤 得,加权调和平均数得,加权调和平均数 x m m x (二)调和平均数和算术平均数的判断(二)调和平均数和算术平均数的判断 1 1、例:某校大二年级、例:某校大二年级1010个班的英语四级过级个班的英语四级过级 情况如下:情况如下: 过级率 (%) 班数 (个) 40以下2 40-602 60-805 80-1001 总过关 人数 21 30 140 36 要求:要求: 舍弃总过关人数资料,求平均

17、过级率;舍弃总过关人数资料,求平均过级率; 舍弃总人数资料,求平均过级率。舍弃总人数资料,求平均过级率。 总人数 70 60 200 40 解:平均过级率解:平均过级率 = = 总人数 总过关人数 x 402006070 409 . 02007 . 0605 . 0703 . 0 370 227 = 61.35%= 61.35% x 9 . 0 36 7 . 0 140 5 . 0 30 3 . 0 21 361403021 370 227 = 61.35%= 61.35% 某公司下属某公司下属1818个企业,计划完成相对数如下:个企业,计划完成相对数如下: 产 值 计 划产 值 计 划 完

18、成 程 度完 成 程 度 (% %) 组中值组中值 ()() 企业数企业数 (个)(个) 实际实际 产值产值 计划计划 80-90 80-90 85 85 2 2 680 680 800 800 90-100 90-100 95 95 3 3 2375 2375 2500 2500 100-110 100-110 105 105 10 10 18060 18060 17200 17200 110-120 110-120 115 115 3 3 5060 5060 4400 4400 合计合计 18 18 26175 26175 24900 24900 产值产值 产值计划产值计划 完成程度完成程

19、度 (% %) 组中值组中值 (% %)x x 企业数企业数 (个)(个) 计 划 产计 划 产 值值 ( ( 万万 元)元)f f 80809090 85 85 2 2 800 800 9090100100 95 95 3 3 2500 2500 100100110110 105 105 10 10 17200 17200 110110120120 115 115 3 3 4400 4400 合合 计计 18 18 24900 24900 实际产值实际产值 (万元)(万元) xfxf 680 680 2375 2375 18060 18060 5060 5060 26175 26175 计划

20、产值 实际完成产值 x 0.85 8000.95 2500 1.05 17200 1.15 4400 8002500 172004400 xf f 26175 105.12% 24900 某公司下属某公司下属1818个企业,计划完成相对数如下:个企业,计划完成相对数如下: 产 值 计 划产 值 计 划 完 成 程 度完 成 程 度 (% %) 组中值组中值 (% %) 企业数企业数 (个)(个) 实际实际 产值产值 计划计划 产值产值 = = / 80-90 80-90 85 85 2 2 680 680 800 800 90-100 90-100 95 95 3 3 2375 2375 25

21、002500 100-110 100-110 105 105 10 10 18060 18060 1720017200 110-120 110-120 115 115 3 3 5060 5060 4400 4400 合计合计 18 18 26175 26175 2490024900 计划产值 实际完成产值 x xf x xf 1 %12.105 24900 26175 平均计划完成为平均计划完成为105.12%105.12% 2 2、结论:、结论: 已知已知x x的文字公式中的母项(的文字公式中的母项(f f)资料时,)资料时, 用加权算术平均数用加权算术平均数 已知已知x x的文字公式中的子

22、项(的文字公式中的子项(m m)资料时,)资料时, 用加权调和平均数用加权调和平均数 当当m=xfm=xf时时, ,调和平均数是算术平均数的变调和平均数是算术平均数的变 形形 例:例:1010家企业的销售利润率分组资料如下:家企业的销售利润率分组资料如下: 销售利润率销售利润率 (% %) 企业数企业数 (个)(个) 总销售利润总销售利润 (万元)(万元) 12 12以下以下2 2500500 12-1612-164 415001500 16-2016-203 3800800 20 20以上以上1 1100100 试求这试求这1010家企业的平均销售利润率家企业的平均销售利润率 (14.07%

23、14.07%) 优点:灵敏度高优点:灵敏度高 有有“0 0”值时不能计算值时不能计算 易受极值影响易受极值影响 缺点:不易理解缺点:不易理解 在某种不能计算的条件下,可以代替算在某种不能计算的条件下,可以代替算 术平均数进行计算术平均数进行计算 三、几何平均数三、几何平均数 (一)概念(一)概念 它是它是N N个单位的变量值的连乘积的个单位的变量值的连乘积的N N次次 方根。凡是方根。凡是变量值的连乘积等于总比率或变量值的连乘积等于总比率或 总速度总速度时,都可使用几何平均数。时,都可使用几何平均数。 (二)计算公式(二)计算公式 1 1、资料未分组时,用简单几何平均数、资料未分组时,用简单几

24、何平均数 : n x XG 例:某厂生产某种零件经过四个车间,例:某厂生产某种零件经过四个车间, 各车间合格率依次为各车间合格率依次为95%95%、92%92%、90%90%、 94%94%。求平均合格率。求平均合格率。 平均合格率平均合格率= = 4 %94%90%92%95 = 92.73%= 92.73% 2 2、资料分组时,用加权几何平均数、资料分组时,用加权几何平均数 : XG f f x 某金融机构以复利方式计息。近某金融机构以复利方式计息。近1212 年来的年利率有年来的年利率有4 4年为年为3%3%、2 2年为年为5%5%、2 2年年 为为8%8%、3 3年为年为10%10%、

25、1 1年为年为15%15%。则。则1212年的年的 平均年利率?平均年利率? %82.106 15. 110. 108. 105. 103. 1 13224 3224 x 平均年利率平均年利率=106.82%-1=6.82=106.82%-1=6.82 几何平均数的特点:几何平均数的特点: 1 1、如数列中有标志值为、如数列中有标志值为0 0或负值,则或负值,则 无法计算无法计算 3 3、几何平均数主要应用于计算比率或、几何平均数主要应用于计算比率或 速度的平均(变量值的连乘积等于总比速度的平均(变量值的连乘积等于总比 率或总速度。)率或总速度。) 2 2、受极值的影响、受极值的影响 常用的数

26、值平均数的一般数量关系:常用的数值平均数的一般数量关系: H G AH G A (调和平均数)(几何平均数)(算术平均数)(调和平均数)(几何平均数)(算术平均数) 由于三种平均数之间存在着上述不由于三种平均数之间存在着上述不 等式关系,因而在计算平均数时应根据等式关系,因而在计算平均数时应根据 社会经济现象的性质和统计研究的目的社会经济现象的性质和统计研究的目的 选择适当的计算方法。选择适当的计算方法。 四、众数(四、众数(MoMo) 1 1、众数是一组数据中出现次数最多的、众数是一组数据中出现次数最多的 变量值。它是一个位置代表值,不受极变量值。它是一个位置代表值,不受极 端值(极大值、极

27、小值)的影响。求众端值(极大值、极小值)的影响。求众 数不需要对数据进行排序。数不需要对数据进行排序。 把例一中把例一中4545换成换成500500,众数是否改变?,众数是否改变? 例一:例一:3131,3232,3131,2828,2929,3131,4545,4040, 4242,3131,2828 众数众数3131 例二:例二:8 8,9 9,6 6,7 7,8 8,5 5,9 9,8 8,9 9 众数众数8 8,9 9 例三:例三:8 8,6 6,5 5,7 7,9 9,1010,4 4,1212 众数众数不存在不存在 M0 M0M0 M0M0 若有两个次数相等的众数,则称复众数。若有

28、两个次数相等的众数,则称复众数。 只只有总体单位数比较多,而且又有有总体单位数比较多,而且又有 明显的集中趋势时才存在众数。明显的集中趋势时才存在众数。 下三图无众数:下三图无众数: 在单位数很少,或单位数虽多但无明在单位数很少,或单位数虽多但无明 显集中趋势时计算众数是没有意义的。显集中趋势时计算众数是没有意义的。 由单项式数列确定众数:只需找出出现次由单项式数列确定众数:只需找出出现次 数最多的标志值。如:数最多的标志值。如: 每日平均砌砖墙量(每日平均砌砖墙量(M M3 3)工人人数(人)工人人数(人) x xf f 0.80.82020 0.90.93030 ( (Mo) Mo) 1.

29、01.08080 1.11.11515 1.21.25 5 合计合计 150 150 2 2、对未分组资料和单项式数列,直接找、对未分组资料和单项式数列,直接找 出即可。出即可。 3 3、对组距式数列,先找出众数组,再按、对组距式数列,先找出众数组,再按 公式计算:公式计算: M M0 0=X=XL L+ + d 21 1 其中,其中, X XL L表众数组的下限、表众数组的下限、d d 表众数组的表众数组的 组距组距 1 1表众数组与其前一组的次数之差表众数组与其前一组的次数之差 2 2 表众数组与其后一组的次数之差。表众数组与其后一组的次数之差。 例:例: 某市某年职工家庭收支的抽样资料如

30、下,某市某年职工家庭收支的抽样资料如下, 求家庭月收入的众数。求家庭月收入的众数。 某市职工家庭抽样调查收入表某市职工家庭抽样调查收入表 月收入(元)月收入(元)户数户数 1000-20001000-20005050 2000-30002000-3000250250 3000-40003000-4000320320 4000-50004000-5000950950 5000-60005000-6000200200 60006000以上以上180180 解:解: 众数组为第四组众数组为第四组 M M0 0 = X = XL L+ + d 21 1 = 4000 + = 4000 + 1000 )

31、200950()320950( 320950 = 4456 = 4456 元元 4 4、利用以上公式计算众数时,假定数、利用以上公式计算众数时,假定数 据分布具有明显的集中趋势据分布具有明显的集中趋势 同时假定众数组的频数在该组内是同时假定众数组的频数在该组内是 均匀分布的。均匀分布的。 5 5、众数的特点:是一种位置平均数;、众数的特点:是一种位置平均数; 无明显集中趋势时,计算众数没有无明显集中趋势时,计算众数没有 意义。意义。 五、中位数(五、中位数(M Me e) 把最大值把最大值1010换成换成100100,中位数是多少?,中位数是多少? (不受极值影响)(不受极值影响) 中位数中位

32、数 7 7 先排序:先排序:4 4,5 5,6 6,7 7,7 7,8 8,8 8,9 9,1010 例一:例一:8 8,6 6,5 5,7 7,9 9,7 7,8 8,4 4,1010求求 中位数中位数 1 1、中位数是指一组数据按大小排列后,、中位数是指一组数据按大小排列后, 处于处于正中间位置正中间位置上的变量值。中位数也不上的变量值。中位数也不 受极值的影响。受极值的影响。 例如:人口的年龄分布往往近似倒例如:人口的年龄分布往往近似倒J J 型:婴儿数最多,随着年龄的增大,人数型:婴儿数最多,随着年龄的增大,人数 逐渐下降,到了百岁左右,所剩的人数就逐渐下降,到了百岁左右,所剩的人数就

33、 很少了。如果计算年龄的算术平均数,老很少了。如果计算年龄的算术平均数,老 年人口数虽然较少,但其年龄数值很高,年人口数虽然较少,但其年龄数值很高, 这样一来,计算的平均年龄就会偏向老年这样一来,计算的平均年龄就会偏向老年 一方。因此,各国的人口统计资料中,平一方。因此,各国的人口统计资料中,平 均年龄的计算一般采用中位数。均年龄的计算一般采用中位数。 中国几次人口普查年龄结构的变化(单位中国几次人口普查年龄结构的变化(单位: %: %) 普查年份普查年份0-140-1415-6015-60 6565岁及以岁及以 上上 老少比老少比 1964196440.7040.7055.7055.703.

34、603.608.88.8 1982198233.4533.4561.6661.664.894.8914.614.6 1990199027.6127.6166.8966.895.505.5019.919.9 2000200022.8922.8970.1570.156.966.9630.430.4 1982年年 1990年年 2000年年 年龄中位数年龄中位数 22.9 25.3 30.8 按照国际上划分人口类型的标准,按照国际上划分人口类型的标准,O-14O-14 岁少年儿童比重在岁少年儿童比重在3030以下、以下、6565岁以上老年人岁以上老年人 口比重在口比重在7 7以上、年龄中位数超过以上

35、、年龄中位数超过3030岁、老岁、老 少比在少比在3030以上时,为老年型结构。按此标准以上时,为老年型结构。按此标准 ,可以看出,可以看出, 19641964年我国人口类型属典型的年我国人口类型属典型的 年轻型。经过近年轻型。经过近2020年时间,到年时间,到19821982年,人口类年,人口类 型已经从年轻型步入了成年型。第五次人口普型已经从年轻型步入了成年型。第五次人口普 查,中国的人口年龄结构已进入老年型社会。查,中国的人口年龄结构已进入老年型社会。 而且从年轻型到老年型的转变仅用了而且从年轻型到老年型的转变仅用了3030年的时年的时 间,而西方发达国家完成这一转变大约用了间,而西方发

36、达国家完成这一转变大约用了 50-10050-100年的时间。年的时间。 例二:例二:1111,8 8,6 6,5 5,7 7,9 9,7 7,8 8,4 4,1010 求中位数求中位数 2 2、中位数的确定:、中位数的确定: 资料未分组时,直接找出即可。资料未分组时,直接找出即可。 N N为奇数时为奇数时 N N为偶数时为偶数时 中位数是中位数是 ? 先排序:先排序:4 4,5 5,6 6,7 7,7 7,8 8,8 8,9 9,1010, 1111 资料分组时资料分组时, ,先确定先确定中位数所在的组中位数所在的组 (第(第 个值所在的组),再通过以下个值所在的组),再通过以下 公式计算中

37、位数的近似值。公式计算中位数的近似值。 2 f M Me e = = d f s f X m m L 1 2 该式为下限公式,适宜向上累计。式中,该式为下限公式,适宜向上累计。式中, X XL L为中位数所在组的下限,为中位数所在组的下限,f fm m为中位数所为中位数所 在组的频数,在组的频数,d d为中位数所在组的组距,为中位数所在组的组距, S Sm-1 m-1为中位数所在组以前各组的累计频数。 为中位数所在组以前各组的累计频数。 例例 :某乡:某乡30003000户家庭的月收入如下,试求户家庭的月收入如下,试求 月收入的中位数。月收入的中位数。 月收入(元)月收入(元)户数户数 400

38、400以下以下300300 400-500400-500510510 500-600500-60010201020 600-700600-700480480 700-800700-800450450 800800以上以上240240 向上累计次数向上累计次数 300300 810810 18301830 23102310 27602760 30003000 解:解: 2 f = 1500= 1500,第三组为中位数组,第三组为中位数组 X XL L=500=500,S Sm-1 m-1=810 =810,f fm m=1020=1020,d=100 d=100 M Me e = = d f s

39、 f X m m L 1 2 100 1020 8101500 500 =567.65 =567.65 元元 3 3、利用以上公式时,需假定中位数所在、利用以上公式时,需假定中位数所在 组的频数在该组内是均匀分布的。组的频数在该组内是均匀分布的。 中位数的特征:中位数的特征: 2 2、各变量值与中位数的离差绝对值之、各变量值与中位数的离差绝对值之 和最小。和最小。 1 1、是一种位置平均数,不受极端值的、是一种位置平均数,不受极端值的 影响,具有稳健性。影响,具有稳健性。 六、六、 、M M0 0、M Me e的关系的关系 X 1 1、求出以下、求出以下3 3例年龄的算术平均数、例年龄的算术平

40、均数、 众数、中位数众数、中位数 年龄 (岁) 人数 10-2010 20-3020 30-4010 例例1 1 例例3 3 年龄年龄 (岁)(岁) 人数人数 10-2010-206 6 20-3020-301010 30-4030-402020 40-5040-504 4 年龄年龄 (岁)(岁) 人数人数 10-2010-206 6 20-3020-302020 30-4030-401010 40-5040-504 4 例例2 2 解:据公式,得以上三例的答案分别为:解:据公式,得以上三例的答案分别为: 例例1 1: 25 Oe MMX 例例2 2: =30.5 =30.5 X M M0 0

41、=33.85 M=33.85 Me e=32 =32 MMe e MMMe eMM0 0 2 2、上述结果用图示如下:、上述结果用图示如下: X =M=M0 0=M=Me e (对称)(对称) XMMe e MMMe eMM0 0 (右偏或正偏)(右偏或正偏) (一)(一) 众数、中位数和均值的关系众数、中位数和均值的关系 1 1、判别总体分布特征。、判别总体分布特征。 在完全对称的正态分布中,在完全对称的正态分布中, = Me = Mo= Me = Mo 次数分布为右偏态时,次数分布为右偏态时, Me MoMe Mo 次数分布为左偏态时,次数分布为左偏态时, Me MoMe Mo 2 2、利

42、用位置平均数与算术平均数的关系进行推、利用位置平均数与算术平均数的关系进行推 算。算。3 3( MeMe)= =( MoMo) Mo = 3Me Mo = 3Me 2 2 X X X XX X (二)众数、中位数及均值的特点和应用场合。(二)众数、中位数及均值的特点和应用场合。 例:例:已知某地职工年消费支出的算术平已知某地职工年消费支出的算术平 均数为均数为20002000元,中位数为元,中位数为19001900元。元。 则众数应为:则众数应为: (判断为正偏分布) )()()( (元) 200019001700 1700 40005700 2000219003 23 XMeMo xmm e

43、o 七、正确应用平均指标的原则七、正确应用平均指标的原则 (三)用分配数列补充说明平均数。(三)用分配数列补充说明平均数。 (二)用组平均数补充说明总平均数。(二)用组平均数补充说明总平均数。 (一)平均指标只能应用于同质总体(一)平均指标只能应用于同质总体 某生产小组基期有工人某生产小组基期有工人1515人,报告期人数人,报告期人数 增加到增加到3030人,两时期各技术等级的工人数和人,两时期各技术等级的工人数和 工资总额如下:工资总额如下: 级别级别基基 期期报报 告告 期期 工人工人 数数 ( (人人) ) 比重比重 (%)(%) 工资工资 总额总额 ( (元元) ) 平均平均 工资工资

44、 ( (元元) ) 工人工人 数数 ( (人人) ) 比重比重 (%)(%) 工资工资 总额总额 ( (元元) ) 平均工平均工 资资 ( (元元) ) 二级工二级工 2 213.313.3 1000 1000 500 500161653.353.3 9600 9600 600 600 四级工四级工 8 853.353.3 7200 7200 900 900101033.333.3100001000010001000 七级工七级工 5 533.433.4 7500 750015001500 4 413.413.4 6800 680017001700 合计合计1515 100.0100.0 15

45、70015700104710473030 100.0100.0 2640026400 880 880 某工业部门某工业部门100100个企业年度利润计划完成程个企业年度利润计划完成程 度资料如下:度资料如下: 按计划完成程度分组按计划完成程度分组(%)(%)企业数企业数 85-89.9 85-89.9 2 2 90-94.9 90-94.9 8 8 95-99.9 95-99.9 10 10 100-104.9100-104.9 40 40 105-109.9105-109.9 30 30 110-114.9110-114.9 10 10 合合 计计100100 经计算,经计算,100100个

46、企业年度平均利润计划完成个企业年度平均利润计划完成 程度为程度为103.35103.35,观察次数分布情况。,观察次数分布情况。 2 2 数据分布离散程度的测定数据分布离散程度的测定 标志变异指标标志变异指标 一、标志变异指标的意义和作用一、标志变异指标的意义和作用 (一)概念:反映同质总体各单位标志值(一)概念:反映同质总体各单位标志值 的差异程度,即数列的离散趋势。的差异程度,即数列的离散趋势。 (二)作用:(二)作用: 1 1、衡量平均指标的代表性;、衡量平均指标的代表性; 2 2、反映社会经济活动的均衡程度;、反映社会经济活动的均衡程度; 3 3、是统计分析的一个基本指标。、是统计分析

47、的一个基本指标。 二、全距二、全距( (极差)极差)R R 全距全距= =最大值最大值最小值最小值 全距的意义明确,计算简单。但它全距的意义明确,计算简单。但它 只考虑极值的大小,而不考虑其他变量只考虑极值的大小,而不考虑其他变量 值的分布情况,因而,用全距来测定数值的分布情况,因而,用全距来测定数 列的离散程度就不全面。列的离散程度就不全面。 例例4-4-1 : : 有甲、乙两组数据,有甲、乙两组数据, 试比较哪组均值平均数的代表性大试比较哪组均值平均数的代表性大 甲:甲:40 60 80 84 40 60 80 84 乙:乙:63 65 66 7063 65 66 70 解:由解:由 x

48、x= = xx n n ,有,有 =66 =66 x甲x乙 =66 =66 R R甲 甲=84-40=44 =84-40=44 R R乙 乙=70-63=7 =70-63=7 744 744 所以,乙组平均数的代表性大所以,乙组平均数的代表性大 三、平均差(三、平均差(A.DA.D) 1 1、简单平均差、简单平均差 A.D= A.D= n xx 如例如例4-4-14-4-1中中 A.DA.D甲 甲= = 4 6684668066606640 =16 =16 A.DA.D乙 乙= = 4 6670666666656663 =2 =2 因为因为 216 216 , 所以,乙组平均数的代表性大所以,

49、乙组平均数的代表性大 2 2、加权平均差、加权平均差 A.D= A.D= f fxx 四、四分位差(四、四分位差(Q.DQ.D) 1 1、它指第三个四分位数与第一个四分位数之差。、它指第三个四分位数与第一个四分位数之差。 2 2、第三个四分位数是处于中位数和最大值中间、第三个四分位数是处于中位数和最大值中间 的数;的数; 第二个四分位数是中位数;第二个四分位数是中位数; 第一个四分位数是处于中位数和最小值中间第一个四分位数是处于中位数和最小值中间 的数。的数。 3 3、如、如 1 1、2 2、2 2、3 3、3 3、3 3、5 5、6 6、6 6数列中数列中 第三个四分位数为第三个四分位数为5

50、 5,第二个四分位数为,第二个四分位数为3 3, 第一个四分位数为第一个四分位数为2 2。则四分位差等于。则四分位差等于3 3。 五、方差和标准差五、方差和标准差 方差是各变量值与其均值方差是各变量值与其均值离差平方离差平方的的平均平均 数数。方差的平方根叫标准差,也叫均方差。方差的平方根叫标准差,也叫均方差。 (一)计算公式(一)计算公式 1 1、资料未分组时,用简单标准差或方差、资料未分组时,用简单标准差或方差 (方方差差) 标标准准差差) n xx n xx 2 2 2 ( 用例用例4-4-14-4-1中的数据,得中的数据,得 = = 甲 4 1814626 2222 =17.55 =1

51、7.55 乙= = 4 4013 2222 =2.55 =2.55 即,仍然是乙组的均值的代表性强即,仍然是乙组的均值的代表性强 2 2、资料分组时,用加权标准差、资料分组时,用加权标准差 = = f fxx 2 例例4-4-2 4-4-2 : 已知某厂已知某厂200200个工人按日产量分组个工人按日产量分组 如下:试求其标准差。如下:试求其标准差。 日产量(件)日产量(件)工人数(人)工人数(人) 20-3020-301010 30-4030-407070 40-5040-509090 50-6050-603030 解:解: X f xf =42(件)(件)= = = f fxx 2 309

52、07010 30907010 133717 2222 = = = = 200 12200 =7.81(=7.81(件件) ) (二)标准差的数学性质(二)标准差的数学性质 2 1 1、 xx 2 2 证明:证明: 2 n xx 2 n xxx x 2 2 2 n nxxx x 2 2 2 xxx 22 2 2 xx 2 2 2 2、如、如y= ay= a+ +bxbx, 则则 = b = b y x 证明:证明: y= ay= a+ +bxbx 则则 =a=a+ +b b yx 所以,所以, y n xbabxa 2 n b xx 2 b x 六、离散系数六、离散系数 一群牛的平均体重是一群牛

53、的平均体重是180180公斤,标公斤,标 准差是准差是1818公斤;一群羊的平均体重是公斤;一群羊的平均体重是 1515公斤,标准差是公斤,标准差是3 3公斤,请问羊的平公斤,请问羊的平 均体重的代表性是否更高?为什么?均体重的代表性是否更高?为什么? 两组数据:两组数据: 第一组:第一组:5 5,1010,2020,2525,3030 第二组:第二组:100000100000,100005100005,9999599995, 100020100020,100040100040 第一组数据极差第一组数据极差2525 第二组数据极差第二组数据极差4545 第一组数据平均差第一组数据平均差8.48.4 第二组数据平均差第二组数据平均差14.414.4 第一组数据方差第一组数据方差107.5107.5标准差标准差10.3682210.36822 第二组数据方差第二组数据方差332.5332.5标准差标准差18.2345818.23458 对一组人测量体重,得数据如下(公斤):对一组人测量体重,得数据如下(公斤): 极差极差0.017 0.017 平均差平均差0.0048 0.0048 方差方差0.000045 0.000045 标准差标准差0.0066710.006671 6565,7575,6060,6262,5858

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论