数据特征的描述(2011.9).ppt_第1页
数据特征的描述(2011.9).ppt_第2页
数据特征的描述(2011.9).ppt_第3页
数据特征的描述(2011.9).ppt_第4页
数据特征的描述(2011.9).ppt_第5页
已阅读5页,还剩119页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第 4 章 综合指标分析,指标和指标体系,统计指标,统计指标是综合反映统计总体数量特征的概念和数值。,指标名称,指标数值,反映总体某一方面的质的规定性,是对总体本质特征的一种概括。,是总体量的规定性在一定时间、地点、条件下的具体表现。,统计指标,重要特点:具体性; 综合性,描述指标 评价指标 监测指标,分类,数量指标 质量指标,绝对数指标 相对数指标 平均数指标,统计数据分布的特征,也可以从以下三个方面进行描述: 一.绝对数与相对数,反映现象总体的广度及发展变化的趋势; 二.集中趋势,反映各数据向其中心值靠拢或聚集的程度,用平均指标或者平均数表示; 三.离散程度,反映各数据远离其中心值的趋势。 其中绝对数、相对数和平均数三种指标统称为综合指标。,指标体系,具有内在联系的一系列指标所构成的整体,即称为指标体系。,分类,社会指标体系 经济指标体系 科技指标体系,基本统计指标体系,是针对某项社会经济问题而制定的专项指标体系,如工业经济效益指标体系、价格指标体系等。,专题统计指标体系,一、总量指标(绝对数) (一)绝对数的概念 1.绝对数就是总量指标的表现形式。 2.总量指标指反映经济现象总体规模或水平的统计指标。 3.总量指标的数值随着研究范围的大小而增加或减少。,总量指标与相对指标,总量指标,按其反映的内容不同,总体单位总量指标,总体标志总量指标,按其反映的时间状况的不同,时期指标,时点指标,按采用的计量单 位不同,实物量指标,价值量指标,(二)总量指标的分类,劳动量指标,(二)总量指标的分类 总体单位总量指标:用来反映总体中单位数的总和的指标,也就是总体单位数之和。 总体标志总量指标:用来反映总体中各单位标志值总和的总量指标,也就是总体各单位某一数量标志的各标志值之和。 一个总量指标究竟属于总体单位总量还是总体标志总量,并不是固定不变的,它随着研究目的的不同和研究对象的变化而定。,时期指标反映社会经济现象总体在一段时期内发 展过程的总量。 时点指标表明社会经济现象总体在某一时点的总量。 时期指标和时点指标各有不同特点:,时期指标的特点 1.不同的时期指标数值具有可加性; 2.时期指标数值大小与时期长短有直接关系; 3.时期指标数值是连续登记、累计的结果。 时点指标的特点 1.不同时点的指标数值不具有可加性。 2.时点指标的数值的大小与其时间间隔长短无关。 3.时点指标的数值是间断计数的。,实物量指标是指采用实物单位计量的总量指标。实物单位有: 1.自然计量单位; 2.度量衡计量单位; 3.标准实物计量单位。 价值量指标是指采用货币单位计量的总量指标。 劳动量指标是以劳动时间为单位计量的产品产量或完成的工作量,通常用于工业企业内部核算。,二、相对指标(相对数) (一)相对数概述 1.相对数的概念: 将两个有联系的指标数值对比形成的一种比率,用来反映现象之间的数量对比关系和联系程度。 2.相对数的数值表现形式: 无名数:是一种抽象化的数值,大多以系数、倍数、成数、百分数或千分数表示。 有名数:主要用来表现强度相对指标的数值。它同时使用分子和分母指标数值的计量单位,以表明事物的密度、强度和普遍程度。,3.相对数的作用 (1)能综合表明有关现象之间数量联系的程度、 强度、速度、比例关系、总体结构,弥补总量指标的不足。 (2)为原来不能直接对比的总量指标提供共同的比较基础。,(二)相对指标的种类及计算 1计划完成相对数 计划完成相对数也称计划完成百分比,它是将某一时期的实际完成数与同期计划数进行对比,一般用百分数表示。基本计算公式为: 计划完成相对数(实际完成数同期计划数)100,(1)计划数为绝对数 计划完成相对数(实际完成数同期计划数)100 适用于研究分析社会经济现象的规模或水平的计划完成程度。 (2)计划数为平均数 计划完成相对数(实际平均水平计划平均水平)100 适用于计划任务用平均数来表示的情形,例如:劳动生产力、单位产品成本、单位产品原材料消耗量等。,(3)计划数为相对数 计划完成相对数实际完成数()计划完成数()100 适用于当计划任务是用计划提高的百分数或计划降低的百分数规定的时候。如劳动生产率计划提高百分数、产品的成本降低率、流通费用降低率。,例1 某公司2000年计划销售某种产品30万件,实际销售32万件,则该公司2000年销售计划完成1067,超额67完成计划。,例2某企业某种产品的产值计划要求增长10, 该种产品的单位成本计划要求下降5,而实际产 值增长了15,实际单位成本下降了3,则计划完成程度指标为: 产值计划完成相对数115110104.55 单位成本计划完成相对数(1003)(1005)102.11,分析: 1.产值计划完成程度若大于100,说明超额完 成计划;若小于100,说明没有完成计划,为正指标。 2.单位成本计划完成程度若大于100,说明成本比计划高,没有完成计划;若小于100,说明成本比计划降低,超额完成计划,为逆指标。 3.计划完成相对数的分子分母不能互换,且要求在指标含义、计算范围、核算方法等方面要一致。,例3某企业要求劳动生产率达到5000元人,某 种产品的计划单位成本为100元,该企业实际的劳动 生产率达到6000元人,某种产品的实际单位成本为 80元,它们的计划完成程度指标如下: 劳动生产率计划完成相对数60005000120 (正指标) 单位成本计划完成相对数8010080 (逆指标),小结:如果计划规定的任务是提高率,结果要等于或大于100才算超额完成任务;如果计划规定的任务是降低率,结果等于或小于100才算超额完成任务。,检查长期(通常是五年)计划完成情况 (1)水平法:若计划指标是按整个计划期的末年应 达到的水平来规定的,用水平法。公式为: 计划完成相对数(计划期末年实际达到的水平计划中规定的末年水平)100 (2)累计法:若计划指标是按整个计划期内累计完成量来规定的,宜用累计法计算。公式为: 计划完成相对数(计划期间累计完成数计划中规定的累计数)100,例4某种产品按五年计划规定,最后一年产量应 达450万吨,计划执行情况如下:,要求:1.计算该产品五年计划完成程度 2.计算提前完成五年计划的时间 解: 1.五年计划完成程度(120+120+130+130)450111.11 2.因为从第四年的第二季度起至第五年的第一季度止累计产量已达450万吨(100+110+120+120450),所以提前三个季度完成五年计划。,分析:该题是考核五年计划的完成情况,由于五年 计划指标是按整个计划的末年应达到的水平规定的,所以要用水平法 。按水平法考核五年计划完成程度,只要在连续一年内(不论是否在同一个日历年度内)实际完成数 达到了计划规定的末年水平就算完成计划,往后所余的时间就是提前完成计划的时间。,2.结构相对数 是总体内某一部分数值与总体全部数值对比的 结果,反映总体内部的构成和类型特征,亦称比重 指标。其公式为: 结构相对数(总体中某一部分数值总体全部数值)100,2.结构相对数 例5某企业有职工1000人,其中男职工700人,女职工300人。结构相对数如下: 男职工占全部职工的比重() 700100070 女职工占全体职工的比重() 300100030,结构相对指标有如下特点: 1必须与统计分组相结合。 2分子的数值是分母数值的一部分。 3.总体中各部分比重之和等于100。,结构相对指标有如下作用: 1.可以说明在一定的时间、地点和条件下总体结构的特征。 2. 不同时期的结构相对数的变化,可以反映实物性质的发展趋势,分析经济结构的演变规律。 3. 根据个构成部分所占比重的大小以及是否合理,可以反映所研究现象总体的质量以及人、财、物的利用情况。 4.利用结构相对数,有助于分清主次,确定工作重点。,例6 1996年我国工业总产值构成,3.比例相对数 比例相对数是将总体内某一部分与另一部分数 值对比所得到的相对数。其公式为: 比例相对数总体中某一部分数值总体中另一部分数值 例7我国第四次人口普查结果表明,1990年7月1日零时,我国男性人数为584949922人,女性人数为548732579人,则男性对女性的比例是106.6。,比例相对数的特点: 1.对比的分子分母属于同一总体(与结构相对数 一致)。 2.分子分母可以互换。 3.比例相对数的数值,一般用百分数或几比几 的形式表示。,4.比较相对数 将不同地区、单位或企业之间的同类指标值作静态对比而得出的综合指标,表明同类事物在不同空间条件下的差异程度或相对状态。 其公式为: 比较相对数某一条件下某一指标数值另一条件下同类指标数值,例8两个类型相同的工业企业,甲企业全员劳动生产率为18542元人.年,乙企业全员劳动生产率为 21560元人.年,则两个企业全员劳动生产率的比较 相对数为: 185422156086 比较相对数的特点: 1.分子分母的数值分别属于不同的总体。 2.分子分母是同类指标。 3.分子分母可以互换。,5.动态相对数 动态相对数是将总体不同时期的同一类指标对 比而计算出的数值,用于表明现象在时间上发展变动的程度。 其公式为: 动态相对数(某一现象报告期数值同一现象基期数值)100,例91996年我国国民生产总值为67559.7亿元,1995年为57494.9亿元,如果选1995年作基期,则1996年的国民生产总值与1995年对比,得出动态相对数为117.5,说明在1995年的基础上1996年国民生产总值的发展速度。,动态相对数的特点: 1.分子分母的数值是同类但不同时期的。 2.报告期是指计算的那一期,基期可以是报告期的前一期、历史上最好的时期或某一特定时期。,6.强度相对数 强度相对数是两个性质不同而有联系的总量指 标对比的结果。能够反映现象的强度、密度和普遍程度。 其公式为: 强度相对数某一总量指标数值另一性质不同而有联系的总量指标数值,例10我国土地面积为960万平方公里,1996年底人口总数为122389万人,则 我国1996年末人口密度122389960127(人平方公里),强度相对数的特点 1.强度相对数一般采用有名数的计量单位,即由分 子分母原有的计量单位构成。如“公斤人”、“人平方公里”等。 2.有的强度相对数有正、逆指标,正指标的比值的大小与其反映的强度、密度和普遍程度成正比,而逆指标正好相反。,3.有少数反映社会服务行业的负担情况或保证程度的强度相对指标,其分子分母可以互换,即采用正算法计算正指标,采用倒算法计算逆指标。如:,商业网密度(逆指标),商业网密度(正指标),例11某市人口数为158000人,有零售商店790个,则该市零售商业网点密度是: 正指标(零售商业网点数人口数) 7901585(个千人) 逆指标 (人口数零售商业网点数) 158000790200人个,三.正确运用相对指标的原则 (一)可比性原则,正确选择对比的基数; (二)定性分析与数量分析相结合的原则; (三)相对指标和总量指标结合运用的原则; (四)各种相对指标综合运用的原则。,相对指标小结,概念,相对指标是两个有联系的指标对比的比值,反映事物的数量特征和数量关系。,(1)反映总体内在的结构特征,(3)反映事物发展变化的过程和趋势。,(2)用于不同对象的比较评价;,作用,种类,计划完成相对数,结构相对数,比例相对数,比较相对数,强度相对数,动态相对数,六种相对数指标的比较,不同时期 比 较,动 态 相对数,强 度 相对数,不同现象 比较,不同总体 比较,比 较 相对数,同一总体中,部分与部分 比 较,部分与总体 比 较,实际与计划 比 较,比 例 相对数,结 构 相对数,计划完成 相对数,同一时期比较,同类现象比较,数据类型,品质数据,数值数据,分类数据(定类数据),顺序数据(定序数据),间隔数据(定距数据),比率数据(定比数据),数据分布的特征,数据分布特征的测度,平均指标集中趋势的测度,一. 分类数据:众数 二. 顺序数据:中位数和分位数 三. 数值型数据:均值 四. 众数、中位数和均值的比较,数据分布特征的和测度 (本节位置),集中趋势 (Central tendency),一组数据向其中心值靠拢的倾向和程度 测度集中趋势就是寻找数据水平的代表值或中心值 不同类型的数据用不同的集中趋势测度值 低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据,分类数据:众数,众数 (mode),出现次数最多的变量值 不受极端值的影响 一组数据可能没有众数或有几个众数 主要用于分类数据,也可用于顺序数据和数值型数据,品质数据、未分组数值型数据的众数,(一)概念:众数是一组出现次数最多的变量值,一般用M0来表示。 (二)确定方法:根据掌握资料的不同,众数的确定方法两种: 方法一:根据品质数据(分类数据、顺序数据)、未分组数值型数据(或单项变量数列)计算众数,只需找出出现次数最多的变量值即为众数。,众数 (不唯一性),无众数 原始数据: 10 5 9 12 6 8,一个众数 原始数据: 6 5 9 8 5 5,多于一个众数 原始数据: 25 28 28 36 42 42,分类数据的众数 (例题分析),解:这里的变量为“饮料品牌”,这是个分类变量,不同类型的饮料就是变量值 在所调查的50人中,购买可口可乐的人数最多,为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即 Mo可口可乐,顺序数据的众数 (例题分析),解:这里的数据为顺序数据。变量为“回答类别” 甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即 Mo不满意,方法二:分组数值型数据的众数,1、众数的值与相邻两组频数的分布有关,4、该公式假定众数组的频数在众数组内均匀分布,2、相邻两组的频数相等时,众数组的组中值即为众数,3、相邻两组的频数不相等时,众数采用下列近似公式计算,分组数值型数据的众数,等价公式: 两公式中,L和U分别表示众数组的下限值和上限值;f、f-1、f+1分别表示众数组频数、其前面相邻组频数、其后面相邻组频数;d表示众数组组距。,分组数值型数据众数举例,【例题】根据表中的数据,计算50名工人日加工零件数的众数,顺序数据:中位数和分位数,中位数 (median),排序后处于中间位置上的值,不受极端值的影响 主要用于顺序数据,也可用数值型数据,但不能用于分类数据 各变量值与中位数的离差绝对值之和最小,即,中位数 (位置的确定),2、未分组数值型数据(原始数据):,1、顺序数据、分组数值型数据:,顺序数据的中位数 (例题分析),解:中位数的位置为 300/2150 从累计频数看,中位数在“一般”这一组别中。因此 Me=一般,未分组数据的中位数 (计算公式),未分组数值型数据的中位数 (9个数据的算例),【例】:9个家庭的人均月收入数据 原始数据: 1500 750 780 1080 850 960 2000 1250 1630 排 序: 750 780 850 960 1080 1250 1500 1630 2000 位 置: 1 2 3 4 5 6 7 8 9,中位数 1080,未分组数值型数据的中位数 (10个数据的算例),【例】:10个家庭的人均月收入数据 排 序: 660 750 780 850 960 1080 1250 1500 1630 2000 位 置: 1 2 3 4 5 6 7 8 9 10,(1)根据位置公式确定中位数所在的组 (2)采用下列近似公式计算:,分组数值型数据中位数,Sm-1和Sm+1分别表示数据从小到大排列后中位数组前面各组的累积频数和后面各组的累积频数;fm和d分别为中位数组频数及组距。,分组数值型数据中位数举例,【例题】根据表中的数据,计算50 名工人日加工零件数的中位数,四分位数 (quartile),排序后处于25%和75%位置上的值,不受极端值的影响 主要用于顺序数据,也可用于数值型数据,但不能用于分类数据,四分位数 (位置的确定),2、未分组数值型数据:,1、顺序数据、分组数值型数据:,顺序数据的四分位数 (例题分析),解:QL位置= (300)/4 =75 QU位置 =(3300)/4 =225 从累计频数看, QL在“不满意”这一组别中; QU在“一般”这一组别中。因此 QL = 不满意 QU = 一般,数值型数据的四分位数 (9个数据的算例),【例】:9个家庭的人均月收入数据 原始数据: 1500 750 780 1080 850 960 2000 1250 1630 排 序: 750 780 850 960 1080 1250 1500 1630 2000 位 置: 1 2 3 4 5 6 7 8 9,数值型数据的四分位数 (10个数据的算例),【例】:10个家庭的人均月收入数据 排 序: 660 750 780 850 960 1080 1250 1500 1630 2000 位 置: 1 2 3 4 5 6 7 8 9 10,数值型数据:均值,均值 (mean),集中趋势的最常用测度值 一组数据的均衡点所在 体现了数据的必然性特征 易受极端值的影响 用于数值型数据,不能用于分类数据和顺序数据,简单均值与加权均值 (simple mean / weighted mean),设一组数据为: x1 ,x2 , ,xn 各组的组中值为:M1 ,M2 , ,Mk 相应的频数为: f1 , f2 , ,fk,简单均值,加权均值,加权均值 (例题分析),加权均值 (权数对均值的影响),甲乙两组各有10名学生,他们的考试成绩及其分布数据如下 甲组: 考试成绩(x ): 0 20 100 人数分布(f ):1 1 8 乙组: 考试成绩(x): 0 20 100 人数分布(f ):8 1 1,均值 (数学性质),1. 各变量值与均值的离差之和等于零,2. 各变量值与均值的离差平方和最小,调和平均数 (harmonic mean),均值的另一种表现形式 易受极端值的影响 计算公式为,原来只是计算时使用了不同的数据!,调和平均数 (例题分析),【例】某蔬菜批发市场三种蔬菜的日成交数据如表,计算三种蔬菜该日的平均批发价格,几何平均数 (geometric mean),n 个变量值乘积的 n 次方根 适用于对比率数据的平均 主要用于计算平均增长率 计算公式为,5. 可看作是均值的一种变形,几何平均数 (例题分析),【例】某水泥生产企业1999年的水泥产量为100万吨,2000年与1999年相比增长率为9%,2001年与2000年相比增长率为16%,2002年与2001年相比增长率为20%。求各年的年平均增长率。,年平均增长率114.91%-1=14.91%,几何平均数 (例题分析),【例】一位投资者购持有一种股票,在2000、2001、2002和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率,算术平均:,几何平均:,众数、中位数和均值的比较,众数、中位数和均值的关系,众数、中位数和均值的特点和应用,众数 不受极端值影响 具有不唯一性 数据分布偏斜程度较大时应用 中位数 不受极端值影响 数据分布偏斜程度较大时应用 均值 易受极端值影响 数学性质优良 数据对称分布或接近对称分布时应用,数据类型与集中趋势测度值,概 念 计算 公 式 特 点,1. 众数 (Mo),分配数列中出现次数最多的标志值位置平均数,上限公式:,下限公式:,优点:容易理解, 不受极值影响 缺点:灵敏度和计算功能差 稳定性差 具有不唯一性,平均指标小结,概 念 计算 公 式 特 点,1. 中位数 (Me),标志值由小到大顺序排列中居中间位置的标志值位置平均数,上限公式:,下限公式:,优点:容易理解 不受极值影响 适宜于开口组资料和些不能用数字测定的事物 缺点:灵敏度和计算功能差 间断数Me,平均指标小结,平均指标小结,概 念 计算 公 式 特 点,优点:容易理解, 便于计算 灵敏度高 稳定性好 和 缺点:易受极值影响 在偏斜分布和U形分布中, 不具有代表性,3. 算术平均数 ( ),标志总量与总体单位总数的比值,简单:,加权:,概 念 计算 公 式 特 点,优点:灵敏度高 在某种不能计算的条件下,可以代替 缺点:不易理解 易受极值影响 有“ 0”值时不能计算,4. 调和平均数 ( ),标志值倒数平均数的倒数,简单:,加权:,平均指标小结,概 念 计算 公 式 特 点,优点: 灵敏度高 受极值影响小于算术平均数 适宜于各比率之积为总比率的变量求平均 缺点:有“ 0”或负值时不能计算 偶数项数列只能用正根,5. 几何平均数 ( ),几个变量值连乘积的几次根,简单:,加权:,平均指标小结,变异指标离散程度的测度,分类数据:异众比率 顺序数据:四分位差 数值型数据:方差及标准差 相对位置的测量:标准分数 相对离散程度:离散系数,数据的特征和测度 (本节位置),离中趋势,数据分布的另一个重要特征 反映各变量值远离其中心值的程度(离散程度) 从另一个侧面说明了集中趋势测度值的代表程度 不同类型的数据有不同的离散程度测度值,分类数据:异众比率,异众比率 (variation ratio),1. 对分类数据离散程度的测度 2. 非众数组的频数占总频数的比率 3. 计算公式为,4. 用于衡量众数的代表性,异众比率 (例题分析),解: 在所调查的50人当中,购买其他品牌饮料的人数占70%,异众比率比较大。因此,用“可口可乐”代表消费者购买饮料品牌的状况,其代表性不是很好,顺序数据:四分位差,四分位差 (quartile deviation),对顺序数据离散程度的测度 也称为内距或四分间距 上四分位数与下四分位数之差 QD = QU QL 反映了中间50%数据的离散程度 不受极端值的影响 用于衡量中位数的代表性,四分位差 (例题分析),解:设非常不满意为1,不满意为2, 一般为3, 满意为 4, 非常满意为5 已知 QL = 不满意 = 2 QU = 一般 = 3 四分位差: QD = QU - QL = 3 2 = 1,数值型数据:方差和标准差,极差 (range),一组数据的最大值与最小值之差 离散程度的最简单测度值 易受极端值影响 未考虑数据的分布,R = max(xi) - min(xi),计算公式为,平均差 (mean deviation),各变量值与其均值离差绝对值的平均数 能全面反映一组数据的离散程度 数学性质较差,实际中应用较少,计算公式为,未分组数据,组距分组数据,平均差 (例题分析),平均差 (例题分析),含义:每一天的销售量平均数相比, 平均相差17台,方差和标准差 (variance and standard deviation),数据离散程度的最常用测度值 反映了各变量值与均值的平均差异 根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差,总体方差和标准差 (population variance and standard deviation),未分组数据:,组距分组数据:,未分组数据:,组距分组数据:,方差的计算公式,标准差的计算公式,样本方差和标准差 (simple variance and standard deviation),未分组数据:,组距分组数据:,未分组数据:,组距分组数据:,方差的计算公式,标准差的计算公式,样本方差 自由度(degree of freedom),一组数据中可以自由取值的数据的个数 当样本数据的个数为 n 时,若样本均值x 确定后,只有n-1个数据可以自由取值,其中必有一个数据则

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论