数据分布特征的测度课件_第1页
数据分布特征的测度课件_第2页
数据分布特征的测度课件_第3页
数据分布特征的测度课件_第4页
数据分布特征的测度课件_第5页
已阅读5页,还剩144页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、4-1 第四章 总体特征的测度与描述4-2基本内容1、总体总量的测度2、总体数量对比关系的测度3、总体平均水平的测度4、总体变异程度的测度5、总体分布的偏态与峰度6、统计图与统计表4-3学习目标 1.掌握总体各种特征值的计算方法及应用2.掌握总体分布偏态与峰态的测度方法3.用统计图表描述总体的特征4.用Excel计算总体特征值并进行分析4-4第一节总体总量的测度 总量指标4-5 1、总量指标是用绝对数形式表现的反映现象在一定时间、地点条件下的总规模或总水平的统计指标。 2、总量指标是对统计调查阶段搜集的原始资料,进行分组和汇总所得到的总计数据。 3、总量指标的数值大小与总体范围大小有关,总体范

2、围越大,其总量指标数值就越大。 4、总量指标是认识事物的起点,是计算其它统计指标的基础。一、总量指标概述4-6二、总量指标的分类4-7 总量指标是具有一定经济内容的量,其计量单位都为“有名数”。 总量指标的计量单位具体有:实物单位、价值单位和劳动量单位。 实物单位又可分为自然计量单位、度量衡计量单位和标准实物计量单位。三、总量指标的计量单位4-8 总量指标的计算方法主要有直接计算法、推算法和专家估算法。1直接计量法就是通过统计数据整理,对所有调查单位进行点数、计数或测量等,然后汇总得到总量指标。有限总体总量可通过直接计量法取得。2推算法是在总量指标不能直接计算或不必直接计算的条件下,根据总量指

3、标与其它指标之间的数量关系或有关资料进行的推算。无限总体总量需通过推算法取得。3专家估算法是对一些在数量上要求不太精确的现象,根据专家或有实践经验的人通过估算得出总量。四、总量指标的计算方法4-9第二节总体数量对比关系 的测度相对指标4-10一、相对指标概述 1、相对指标是性质相同或相互有关的指标数值通过对比求得的商数或比例,用于反映现象总体内部的结构、比例、发展状况和彼此之间的对比关系。 2、常用的相对指标有:结构相对数、比例相对数、比较相对数、强度相对数、计划完成程度相对数和动态相对数。 3、除强度相对指标的计量单位为复名数外,其余相对指标的计量单位都为“无名数”,主要有:倍数或系数、成数

4、、百分数(%)、千分数()。 4、计算相对指标可以加深对事物的认识,同时也便于事物之间的比较分析。4-11二、结构相对指标(一)概念与特点1、结构相对指标在分组的基础上,将部分与全部相比,以反映总体内部构成所计算的比重指标。2、计算公式:3、特点:(1)任何一个结构相对数都小于1(100%)(2)同一总体按某一变量分组所计算的结构相对数之和等于1(100%)4-12(二)、结构相对数的作用1、用于反映事物的本质和特征;2、用于反映事物由量变到质变的过程;3、用于检查工作质量和产品质量;4、用于反映人、财、物的利用程度。4-13三、强度相对数(一)概念与特点1、强度相度指标是两个性质不同但有一定

5、联系的总量指标相互对比的结果,用于反映现象的强度、密度和普遍程度。2、计算公式:3、特点(1)有正逆指标之分;(2)由平均的含义(3)反映的是一种依附性的比例关系;(4)计量单位为复名数。4-14(二)强度相对指标的作用 1、用于说明社会经济现象的强弱程度。在反映一个国家的经济实力时被广泛采用。人均国民收入、人均国民生产总值、人均钢产量等。 2、可用来反映现象的密度和普遍程度;如、人口密度、铁路或公路网的密度、电话普及率。 3、用于反映生活、生产的条件或效果。如每职工拥有的固定资产额、每万元产值的利润、每百人拥有电视、洗衣机、电冰箱台数等。4-15四、计划完成程度相对数(一)概念要点 1、计划

6、完成程度相对数是用来检查和监督计划执行情况的相对指标。通常以百分数表示,又称计划完成百分比。 2、基本公式: 3、计划任务根据时间长短有三种:长期计划(五年以上)、中期计划(15年)、短期计划(一年以内)。4-16(二)短期计划的检查 1、计划执行进度检查。其目的是为了保证计划与时间同步进行。其公式为:2、计划执行结果检查。对计划执行结果检查,根据下达计划指标的形式不同,可分为三种情况,所以相应的计划检查方法也有三种。4-17(1)计划任务数为绝对数(2)计划任务数为增长率(3)计划任务数为平均数4-18(三)长期计划的检查 由于经济现象本身的特点不同,因而长期计划制定的办法也不同。对于具有持

7、续升(降)变动趋势的经济现象,在制定长期计划任务时,通常只规定计划期内最后一年应达到的水平;而对于发展过程中有增降起伏的经济现象,制定长期计划时,通常规定计划期内各年累计应达到的水平。制定计划的方法不同,相应的计划检查方法也不同,检察长期计划的方法有:水平法和累计法两种。4-191、水平法适用条件:计划任务以“水平法”的形式下达,即只规定计划期内最后一年应达到的水平。 提前完成任务的时间:按水平法检查计划完成情况时,如果在计划期内有连续12个月(一年),达到计划规定的任务数,则后面所余的时间为提前完成计划的时间。计算公式:4-202、累计法适用条件:计划任务以“累计法”的形式下达,即规定计划期

8、内各年累计应达到的水平。计算公式:提前完成任务的时间 =计划期的全部时间完成计划任务所需的时间 4-21(四)应用计划完成程度相对数应注意的问题 1、注意分子与分母的可比性; 2、分子与分母的资料不可互换; 3、考察计划任务完成的好坏,需要把计划完成程度的计算结果与具体问题的性质特点结合起来。如产量、产值、利润、收入等越大越好的指标,计划完成程度大于等于100%为完成或超额完成任务;而成本、原材料消耗等越小越好的指标,计划完成程度小于等于100%为完成或超额完成任务。4-22 例如某厂2004年计划劳动生产率比去年提高10%,而实际劳动生产率提高了16%,同时,计划规定单位产品成本比上年降低4

9、%,实际成本降低了7%,则: 计算结果表明,该企业劳动生产率计划完成程度为105.5%,超额5.5%。成本计划完成了96.9%,超计划完成3.1%。例题分析4-23第三节 总体平均水平的测度 平均指标4-24一、平均指标概述 1、平均指标是同质总体内部各单位某一特征值的一般水平,具有抽象性和代表性; 2、用于反映数据分布的集中趋势 3、具体形式有:众数、中位数与分位数、均值 4、作用:(1)可以作为评判事物的标准或依据;(2)用于不同地区或单位之间发展水平的比较;(3)利用平均指标可以进行数量上的推算。4-25关于集中趋势(central tendency) 一组数据向其中心值靠拢的倾向和程度

10、测度集中趋势就是寻找数据水平的代表值或中心值不同类型的数据用不同的指标测定其集中趋势低层次数据的测度指标适用于高层次的测量数据,但高层次数据的测度指标并不适用于低层次的测量数据4-26二、众数(mode) (一)概念要点一组数据中出现次数最多的变量值适合于数据量较多时使用不受极端值的影响一组数据可能没有众数或有几个众数主要用于反映定类数据的集中趋势或一般水平,也可用于定序数据和数值型数据4-27众数的特性 无众数 原始数据: 10 5 9 12 6 8 一个众数 原始数据: 6 5 9 8 5 5多于一个众数 原始数据: 25 28 28 36 42 424-28(二)众数的确定(品质数据众数

11、的确定) 1.对数据作分类整理;2.根据频数分布确定众数所在的组(频数最多的组即为中位数所在组);3.众数所在组的变量值即为众数。4-29定类数据众数的确定(例题分析) 不同品牌饮料的频数分布 饮料品牌频数比例百分比(%) 可口可乐 旭日升冰茶 百事可乐 汇源果汁 露露1511 9 6 90.300.220.180.120.183022181218合计501100解:这里的变量为“饮料品牌”,这是个定类变量,不同类型的饮料就是变量值 所调查的50人中,购买可口可乐的人数最多为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即 Mo可口可乐4-30定序数据众数的确定 (例题分析)

12、 一解:这里的数据为定序数据。变量为“回答类别” 甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即 Mo不满意甲城市家庭对住房状况评价的频数分布回答类别甲城市户数 (户)百分比 (%) 非常不满意 不满意 一般 满意 非常满意 24108 93 45 30 836311510合计300100.04-31数值型数据众数的确定(单变量值分组) 单变量值(单项式)分组众数的确定方法和步骤与品质数据众数的确定方法相同。家庭人口数(人)家庭数(户)频率(%)1185002902500318050004722000合 计36010000众数4-32数值型数据众数的确定(组距

13、式分组) 1. 众数的值与相邻两组频数的分布有关4. 该公式假定众数组的频数在众数组内均匀分布2. 相邻两组的频数相等时,众数组的组中值即为众数3. 相邻两组的频数不相等时,众数采用下列近似公式计算MoMoMo4-33数值型分组数据的众数(例题分析) 表3-5 某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105110110115115120120125125130130135135140358141064381630404650合计50【例】根据第三章表3-5中的数据,计算50名工人日加工零件数的众数.4-34 三、中位数和分位数4-35中位数(median)(一)概念要点

14、 一组数据排序后处于中间位置上的值Me50%50%不受极端值的影响主要用于反映定序数据的一般水平或集中趋势,也可用数值型数据,但不能用于定类数据各变量值与中位数的离差绝对值之和最小,即4-36(二)中位数的确定(定序数据) 1.对数据作分类整理;2.计算累计频数;3.根据 确定中位数所在的组;4.中位数所在组的变量值即为中位数4-37定序数据的中位数 (例题分析) 解:中位数的位置为 300/2150 从累计频数看,中位数在“一般”这一组别中 中位数为 Me=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数 (户)累计频数 非常不满意 不满意 一般 满意 非常满意 24108 93 4

15、5 30 24132225270300合计3004-38数值型数据的中位数 计算公式(未分组数据) 4-39数值型数据的中位数 (9个数据的算例) 【例】 9个家庭的人均月收入数据原始数据: 1500 750 780 1080 850 960 2000 1250 1630排 序: 750 780 850 960 1080 1250 1500 1630 2000位 置: 1 2 3 4 5 6 7 8 9中位数 10804-40数值型数据的中位数 (10个数据的算例) 【例】:10个家庭的人均月收入数据排 序: 660 750 780 850 960 1080 1250 1500 1630 20

16、00位 置: 1 2 3 4 5 6 7 8 9 10 4-41数值型分组数据的中位数(要点及计算公式) 根据位置公式确定中位数所在的组采用下列近似公式计算: 3. 该公式假定中位数组的频数在该组内均匀分布4-42 数值型分组数据的中位数(例题分析)表3-5 某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105110110115115120120125125130130135135140358141064381630404650合计50【例】根据第三章表3-5中的数据,计算50 名工人日加工零件数的中位数4-43四分位数(概念要点) 1.集中趋势的测度值之一2.排序后处于25

17、%和75%位置上的值3. 不受极端值的影响4. 主要用于定序数据,也可用于数值型数据,但不能用于定类数据QLQMQU25%25%25%25%4-44四分位数(位置的确定) 未分组数据:组距分组数据:下四分位数(QL)位置 =N+14上四分位数(QU)位置 =3(N+1)4下四分位数(QL)位置 =N4上四分位数(QL)位置 =3N44-45定序数据的四分位数(算例) 一.【例】根据第三章表3-2中的数据,计算甲城市家庭对住房满意状况评价的四分位数解:下四分位数(QL)的位置为: QL位置(300)/475 上四分位数(QL)的位置为: QU位置(3300)/4225从累计频数看, QL在“不满

18、意”这一组别中; QU在“一般”这一组别中。因此 QL 不满意 QU 一般表3-2 甲城市家庭对住房状况评价的频数分布回答类别甲城市户数 (户)累计频数 非常不满意 不满意 一般 满意 非常满意2410893453024132225270300合计3004-46数值型未分组数据的四分位数(7个数据的算例) 原始数据: 23 21 30 32 28 25 26 排 序: 21 23 25 26 28 30 32 位 置: 1 2 3 4 5 6 7 7+1QL位置 =4=4= 2QU位置 =3(N+1)43(7+1)4 = 6N+14-47数值型数据的四分位数 (9个数据的算例) 【例】:9个家

19、庭的人均月收入数据 原始数据: 1500 750 780 1080 850 960 2000 1250 1630 排 序: 750 780 850 960 1080 1250 1500 1630 2000 位 置: 1 2 3 4 5 6 7 8 94-48数值型数据的四分位数 (10个数据的算例) 【例】:10个家庭的人均月收入数据排序: 660 750 780 850 960 1080 1250 1500 1630 2000位置: 1 2 3 4 5 6 7 8 9 10 4-49数值型分组数据的四分位数(计算公式)上四分位数: 下四分位数: 4-50 数值型分组数据的四分位数 (计算示例

20、)QL位置50/4=12.5QU位置350/437.5表3-5 某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105110110115115120120125125130130135135140358141064381630404650合计50【例】根据第三章表3-5中的数据,计算50 名工人日加工零件数的四分位数四、均值4-521、均值(算术平均数)average(mean value)概念要点:集中趋势的最常用测度值一组数据的均衡点所在易受极端值的影响用于数值型数据,不能用于定类数据和定序数据4-53计算公式加权式:称为简单均值,适用于未分组数据 简单式:称为加权均值,适

21、用于分组数据4-54简单平均数(simple mean )(算例)原始数据:105913684-55加权平均数(weighted mean) (例题分析单项式分组)日产零件数(X)工人数(f)各组工人比重 816209243010324011810合 计80100某厂工人按日产量分组表某电脑公司销售量数据分组表按销售量分组(台)组中值(Mi)频数(fi)Mi fi 140150150160160170170180180190190200200210210220220230230240145155165175185195205215225235 4 91627201710 8 4 5 58013

22、95264047253700331520501720 9001175合计12022200加权平均数 (例题分析组距式分组)4-57加权平均数(权数对均值的影响) 甲乙两组各有10名学生,他们的考试成绩及其分布数据如下: 甲组: 考试成绩(x ): 0 20 100 人数分布(f ):1 1 8 乙组: 考试成绩(x): 0 20 100 人数分布(f ):8 1 14-58均值的数学性质1.各变量值与均值的离差之和等于零 2. 各变量值与均值的离差平方和最小4-592、调和平均数(harmonic mean)概念要点:也称为倒数平均数易受极端值的影响用于定比数据,不能用于定类数据和定序数据其加

23、权式与算术平均加权式有变形关系可用于计算逆指标的平均原来只是计算时使用了不同的数据!4-60计算公式简单式:加权式:称为简单调和平均数,适合于未分组数据称为加权调和平均数,适合于分组数据4-61假设有5个工人,他们的劳动生产率水平如下: 工人劳动生产率水平正指标(件/小时)逆指标(分/件)甲乙丙丁戌101215203065432计算逆指标的平均数(例题分析)4-62调和平均数 (例题分析)日产零件数(X)各组日总产量(M)各组工人数 (件)(件)(人)812816921624103203211888合计75280 某厂工人按日产量分组表4-633、几何平均数(geometric mean)1.

24、n 个变量值乘积的 n 次方根2.适用于对比率数据求平均3.主要用于计算平均速度4.计算公式为:5. 可看作是均值的一种变形4-64几何平均数 (例题分析) 【例】某水泥生产企业1999年的水泥产量为100万吨,2000年与1999年相比增长率为9%,2001年与2000年相比增长率为16%,2002年与2001年相比增长率为20%。求各年的年平均增长率。年平均增长率114.91%-1=14.91%4-65几何平均数 (例题分析) 【例】一位投资者购持有一种股票,在2000、2001、2002和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率

25、算术平均: 几何平均:4-664、由相对数或平均数计算平均数设有:则:4-67由平均数计算平均数(例题分析) 某企业从不同地区购进三批价格不同的相同材料,资料要求计算该单位购进该种材料的平均价格。各地区名称价格(元/件)X购进额(千元)M甲地区8160乙地区10250丙地区12360合 计770某企业从不同地区购进某种材料的资料4-68由相对数计算平均数(例题分析) 某工业公司所属12个企业,总产值计划完成情况如下表所示。求该工业公司12个企业的平均计划完成程度。某工业公司总产值计划完成程度分组表按计划完成程度分组(%)组中值(%)企业数(个)计划产值(万元)f9010095312001001

26、1010551280011012011542000合 计1216000平均计划完成程度(四)众数、中位数和平均数的比较4-70众数、中位数和平均数的关系左偏分布均值 中位数 众数对称分布 均值= 中位数= 众数右偏分布众数 中位数均值 位置关系:结论:中位数总是处于中间,众数和均值的位置则随频数分布的分布不同而变化。数值关系:4-71数据类型与集中趋势测度值数据类型和所适用的集中趋势测度值数据类型定类数据 定序数据定距数据定比数据适用的测度值众数中位数均值均值四分位数众数调和平均数众数中位数几何平均数四分位数 中位数四分位数众数4-72众数、中位数、平均数的特点和应用众数不受极端值影响具有不惟

27、一性数据分布偏斜程度较大时应用中位数不受极端值影响数据分布偏斜程度较大时应用平均数易受极端值影响数学性质优良数据对称分布或接近对称分布时应用第四节 总体变异程度的测度 -变异指标4-74一、概念要点1、能够反映总体各单位某一变量值(一组数据)的离中趋势或离散程度2、变异指标的具体形式有:异众比率、四分为差、全距、平均差、标准差或方差、变异系数。3、作用(1)用于反映数据的差异程度;(2)用于衡量平均数的代表性大小;(3)用于反映经济活动过程的节奏性关于离中趋势数据分布的另一个重要特征反映各变量值远离其中心值的程度(离散程度)从另一个侧面说明了集中趋势测度值的代表程度不同类型的数据有不同的离散程

28、度测度值二、定类数据离散程度的测度:异众比率4-77异众比率(variation ratio)概念要点1.非众数组的频数占总频数的比率2.计算公式为: 4. 用于衡量众数的代表性4-78异众比率 (例题分析)解: 在所调查的50人当中,购买其他品牌饮料的人数占70%,异众比率比较大。因此,用“可口可乐”代表消费者购买饮料品牌的状况,其代表性不是很好不同品牌饮料的频数分布 饮料品牌频数比例百分比(%) 可口可乐 旭日升冰茶 百事可乐 汇源果汁 露露1511 9 6 90.300.220.180.120.183022181218合计501100三、定序数据离散程度的测度四分位差4-80四分位差(q

29、uartile deviation)概念要点1.上四分位数与下四分位数之差 Qd = Qu QL2.反映了中间50%数据的离散程度3.不受极端值的影响4.用于衡量中位数的代表性4-81四分位差 (例题分析)解:设非常不满意为1,不满意为2, 一般为3, 满意为 4, 非常满意为5 。 已知 QL = 不满意 = 2 QU = 一般 = 3四分位差: Qd = QU = QL = 3 2 = 1甲城市家庭对住房状况评价的频数分布回答类别甲城市户数 (户)累计频数 非常不满意 不满意 一般 满意 非常满意 24108 93 45 30 24132225270300合计300四、数值型数据离散程度的

30、测度、方差和标准差4-831、极差(range)(1)一组数据的最大值与最小值之差(2)数值型数据离散程度的最简单测度值(3)存在极端数值时,不能准确反映全部数据的离散程度 未分组数据 R = max(Xi) - min(Xi).=组距分组数据 R 最高组上限 - 最低组下限(4) 计算公式为4-842、平均差(mean deviation)(1)各变量值与其均值离差绝对值的平均数(2)能全面反映一组数据的离散程度(3)数学性质较差,实际中应用较少(4)计算公式为:未分组数据:组距分组数据:4-85平均差 (例题分析)某电脑公司销售量数据平均差计算表 按销售量分组组中值(xi)频数(fi)14

31、0150150 160160 170170 180180 190190 200200 210210 220220 230230 240145155165175185195205215225235 4 91627201710 8 4 540302010 01020304050160270320270 0170200240160250合计12020404-86平均差 (例题分析) 含义:每一天的销售量与平均数相比, 平均相差17台4-873、方差和标准差(variance and standard deviation) 数值型数据离散程度的最常用测度值 反映了各变量值与其均值的平均差异 根据总体数

32、据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差4 6 8 10 12x = 8.34-88(1)总体方差和标准差未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式4-89总体标准差(例题分析)表4-6 某车间50名工人日加工零件标准差计算表按零件数分组组中值(Xi)频数(Fi)(Xi- X )2(Xi- X )2Fi105110110115115120120125125130130135135140107.5112.5117.5122.5127.5132.5137.5358141064246.49114.4932.490.4918.49

33、86.49204.49739.47572.45259.926.86184.90518.94817.96合计503100.5【例】根据第三章表3-5中的数据,计算工人日加工零件数的标准差4-90(2)样本方差和标准差 (simple variance and standard deviation)未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式注意:样本方差用自由度n-1去除!4-91样本方差自由度(degree of freedom)1.一组数据中可以自由取值的数据的个数2.当样本数据的个数为 n 时,若样本均值x 确定后,只有n-1个数据可以自由取值,其中必

34、有一个数据则不能自由取值 例如,样本有3个数值,即x1=2,x2=4,x3=9,则 x = 5。当 = 5 确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值3.样本方差用自由度去除,其原因可从多方面解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差2时,它是2的无偏估计量4-92样本方差(算例)原始数据: 10 5 9 13 6 84-93样本标准差(算例)样本标准差原始数据: 10 5 9 13 6 84-94样本标准差 (例题分析)某电脑公司销售量数据平均差计算表 按销售量分组组中值(xi)频数(

35、fi)140150150 160160 170170 180180 190190 200200 210210 220220 230230 240145155165175185195205215225235 4 91627201710 8 4 540302010 01020304050160270320270 0170200240160250合计120554004-95样本标准差 (例题分析) 含义:每一天的销售量与平均数相比, 平均相差21.58台4-96(3)方差的数学性质各变量值对均值的方差小于对任意值的方差设X0为不等于X 的任意数,D2为对X0的方差,则五、标准化值(standard

36、score)4-981、概念要点(1) 也称标准分数( 2)用于对变量的标准化处理(3)给出某一个值在一组数据中的相对位置(4)可用于判断一组数据是否有离群点(5) 计算公式为:4-99标准化值(性质)1.均值等于0方差等于14-100标准化值(性质) z分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数分布的形状,而只是将该组数据变为均值为0,标准差为1。 4-101标准化值 (例题分析)9个家庭人均月收入标准化值计算表 家庭编号人均月收入(元) 标准化值 z 1234567891500 750 7801080 850 960200012501630

37、0.695-1.042-0.973-0.278-0.811-0.556 1.853 0.116 0.9964-102经验法则经验法则表明:当一组数据对称分布时约有68%的数据在平均数加减1个标准差的范围之内约有95%的数据在平均数加减2个标准差的范围之内约有99%的数据在平均数加减3个标准差的范围之内 六、相对离散程度:离散系数 (coefficient of variation)4-104离散系数(概念要点)(1)标准差与其相应的均值之比(2)对数据相对离散程度的测度(3)消除了数据水平高低和计量单位的影响(4)用于对不同组别数据离散程度的比较(5) 计算公式为:4-105离散系数 (例题分

38、析)某管理局所属8家企业的产品销售数据企业编号产品销售额(万元)x1销售利润(万元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【 例 】某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度4-106离散系数 (例题分析)结论: 计算结果表明,v1 0为右偏分布(也称为正偏)偏态系数 0为左偏分布(也称为负偏)4-112(二)偏态系数 (skewness coefficient)1、根据原始数据计算:2、根据分组数据计算:4-113偏态系数 (例题分析) 某电脑公司销售量偏

39、态及峰度计算表 按销售量份组(台) 组中值(xi)频数 fi140 150150 160160 170170 180180 190190 200200 210210 220220 230230 240145155165175185195205215225235 4 91627201710 8 4 5-256000-243000-128000 -27000 0 17000 80000 216000 256000 62500010240000 7290000 2560000 270000 0 170000 1600000 64800001024000031250000合计120540000 701

40、00000 4-114偏态系数 (例题分析)结论:偏态系数为正值,但与0的差异不大,说明电脑销售量为轻微右偏分布,即销售量较少的天数占据多数,而销售量较多的天数则占少数二、峰 度(kurtosis)4-116(一)峰度(概念要点)1、统计学家Pearson于1905年首次提出2、用于测度一组数据分布相对于标准正态分布的扁平程度3、测度值为峰态系数 峰态系数=0为标准正态分布 峰态系数0为尖峰分布4-117(二)峰度系数 (kurtosis coefficient)1、根据原始数据计算:2、根据分组数据计算:4-118峰态系数 (例题分析)结论:峰态系数为负值,但与0的差异不大,说明电脑销售量为

41、轻微扁平分布4-119240220230偏态与峰态(从直方图上观察)按销售量分组(台)结论:1. 为右偏分布 2. 峰态适中140150210某电脑公司销售量分布的直方图190200180160170频数(天)25201510530正态分布曲线4-120第六节 统计表与统计图4-121一、统计表4-122(一)统计表的结构与内容表-X 19992000年城镇居民家庭抽样调查资料项目单位1999年 2000年 调查户数 平均每户家庭人口 平均每户就业人口 平均每户就业面 平均一名就业者负担人数 平均每人全部年收入 可支配收入 平均每人消费性支出户人人%元元元元 400443.141.7756.4

42、31.775888.775854.024615.91 4222.0 3.13 1.68 53.67 1.86 6316.81 6279.98 4998.00资料来源:中国统计年鉴2001,中国统计出版社,2001,第305页。注:本表为城市和县城的城镇居民家庭抽样调查材料。 行标题列标题数字资料表头附加4-1231、合理安排统计表的结构,长宽比例要适当;2、总标题内容应满足3W 要求;3、数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明;4、表中的上下两条横线一般用粗线,其他线用细线;5、通常情况下,统计表的左右两边不封口,列之间可以用竖线分开,行之间通常不必用

43、横线隔开;6、表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一7、对于没有数字的表格单元,一般用“”表示 8、必要时可在表的下方加上注释(二)统计表的设计要求(基本原则:科学、实用、简练、美观)4-124统计表的设计(比较与选用)4-125统计表的设计(比较与选用)4-126统计表的设计(比较与选用)4-127二、统计图4-128(一)箱线图(box plot)用于显示未分组的原始数据的分布箱线图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成其绘制方法是:首先找出一组数据的5个特征值,即最大值、最小值、中位数Me 和两个四分位数(下四分位数QL和上四分位数Q

44、U)连接两个四分(位)数画出箱子,再将两个极值点与箱子相连接 4-129未分组数据单批数据箱线图(箱线图的构成)中位数4681012QUQLX最大值X最小值简单箱线图4-130未分组数据单批数据箱线图(例题分析)最小值141最大值237中位数182下四分位数170.25上四分位数197140 150 160 170 180 190 200 210 220 230 240某电脑公司销售量数据的箱线图4-131分布的形状与箱线图 对称分布QL中位数 QU左偏分布QL中位数 QU右偏分布QL 中位数 QU不同分布的箱线图4-132未分组数据多批数据箱线图 (例题分析)【例】 从某大学经济管理专业二年

45、级学生中随机抽取11人,对8门主要课程的考试成绩进行调查,所得结果如表。试绘制各科考试成绩的批比较箱线图,并分析各科考试成绩的分布特征11名学生各科的考试成绩数据课程名称学生编号1234567891011英语经济数学西方经济学市场营销学财务管理基础会计学统计学计算机应用基础7665937468705585909581877573917897517685709268817174886984657395707866907378847093637980608781678691837776907082838292848170697278757891886694808571867468796281815

46、57870756871774-133未分组数据多批数据箱线图(例题分析)8门课程考试成绩的箱线图4-13411名学生8门课程考试成绩的箱线图min-max25%-75%median value455565758595105学生1学生2学生3学生4学生5学生6学生7学生8学生9学生10学生11未分组数据多批数据箱线图 (例题分析)4-135(二)时间序列数据线图(line plot) 绘制线图时应注意以下几点时间一般绘在横轴,指标数据绘在纵轴图形的长宽比例要适当,其长宽比例大 致为10 : 7一般情况下,纵轴数据下端应从“0”开始,以便于比较。数据与“0”之间的间距过大 时,可以采取折断的符号将纵轴折断4-136时间序列数据线图 (例题分析)【例】已知19912000年我国城乡居民家庭的人均收入数据如表。试绘制线图¥ 19912000年城乡居民家庭人均收入年份城镇居民农村居民1991199219931994199519961997199

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论