数据特征的描述与分析.ppt_第1页
数据特征的描述与分析.ppt_第2页
数据特征的描述与分析.ppt_第3页
数据特征的描述与分析.ppt_第4页
数据特征的描述与分析.ppt_第5页
已阅读5页,还剩108页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3章综合指标 第3章综合指标 3 1总量指标3 2相对指标概述3 3集中趋势的测度3 4离散程度的测度3 5偏态与峰度的测度 学习目标 1 了解总量指标与相对指标的概念和分类2 集中趋势各测度值的计算方法3 集中趋势各测度值的特点及应用场合4 离散程度各测度值的计算方法离散程度各测度值的特点及应用场合偏态与峰态的测度方法用Excel计算描述统计量并进行分析 总量指标 总量指标是反映一定时间 地点和条件下某种现象总体规模或水平的统计指标总量指标的种类按其说明总体内容不同 分为总体单位总量和总体标志总量按其反映的时间状况不同 分为时期指标和时点指标按其采用的计量单位不同 分为实物指标 价值指标和劳动指标 时期指标与时点指标 时期指标反映现象在一段时期内发展过程的总数量 如产品产量 商品销售额 国内生产总值等 时点指标表示现象在某一时刻上的状态 如人口数 商品库存额 固定资产原值等 相对指标的概念和表现形式 相对指标是说明现象之间数量对比关系的指标 用两个或两个以上有联系的指标数值对比来求得 其结果表现为相对数 故也将相对指标称为相对数 相对指标有无名数和有名数两种表现形式 相对指标的作用 利用相对指标 可以较清楚地反映现象内部结构和现象之间的数量联系程度 对现象进行更深入地分析和说明 利用相对指标可以使某些不能直接对比分析的统计指标 取得可以比较的基础 相对指标的种类 结构相对指标比例相对指标比较相对指标动态相对指标强度相对指标计划完成情况相对指标 结构相对指标 比例相对指标 比例相对指标是反映总体内部各个组成部分之间的数量对比关系的相对指标 计算公式为 比较相对指标 动态相对指标 动态相对指标是表明某类现象在不同时间上的指标数值对比关系的相对指标 用以说明现象发展变化的方向和程度 计算公式为 强度相对指标 强度相对指标是两个性质不同 但有一定联系的总量指标数值之比 如人口密度 人均粮食产量 医生密度等 有正逆指标之分 计算公式为 计划完成程度相对指标 计划完成程度相对指标例题 例1 某企业计划规定2004年的劳动生产率要比2000年提高4 实际执行结果是提高5 求计划完成情况相对指标 解 该企业劳动生产率计划完成情况为 计划完成情况相对指标 100 5 100 4 100 105 104 100 100 96 计划完成程度相对指标例题 例2 某企业计划规定2004年的可比产品成本比2000年降低5 实际执行结果是可比产品成本降低了6 求计划完成情况相对指标 该企业可比产品成本计划完成情况为 计划完成情况相对指标 100 6 100 5 100 94 95 100 98 95 指标有正负之分 并非低于100 一定是未完成计划 计划执行进度指标 长期计划的检查和监督 计划完成情况的检查 可分为长期计划检查和短期计划检查两种 依计划任务数的规定不同 检查长期计划的完成情况又有水平法和累计法两种方法 水平法关心现象期末的水平 而累计法关心的现象在整个计划期内累计完成情况 水平法 累计法 水平法和累计法例题 例 某企业五年计划规定累计完成产品产量1200万吨 其中最后一年产量达到300万吨 实际完成情况如下表 求计划完成程度及提前时间 计算和运用总量和相对指标的原则 在计算实物指标时 应注意现象的同类性指标要有明确的统计含义和合理的统计方法统一计量单位计算和运用相对指标时要注意可比性相对指标和总量指标结合运用的原则 数据分布的特征 数据分布特征的测度 集中趋势的测度 一 分类数据 众数二 顺序数据 中位数和分位数三 数值型数据 均值四 众数 中位数和均值的比较 数据分布特征的和测度 本节位置 集中趋势 Centraltendency 一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据水平的代表值或中心值不同类型的数据用不同的集中趋势测度值低层次数据的测度值适用于高层次的测量数据 但高层次数据的测度值并不适用于低层次的测量数据 分类数据 众数 众数 mode 出现次数最多的变量值不受极端值的影响一组数据可能没有众数或有几个众数主要用于分类数据 也可用于顺序数据和数值型数据 众数 不唯一性 无众数原始数据 10591268 一个众数原始数据 659855 多于一个众数原始数据 252828364242 分类数据的众数 例题分析 解 这里的变量为 饮料品牌 这是个分类变量 不同类型的饮料就是变量值在所调查的50人中 购买可口可乐的人数最多 为15人 占总被调查人数的30 因此众数为 可口可乐 这一品牌 即Mo 可口可乐 顺序数据的众数 例题分析 解 这里的数据为顺序数据 变量为 回答类别 甲城市中对住房表示不满意的户数最多 为108户 因此众数为 不满意 这一类别 即Mo 不满意 顺序数据 中位数和分位数 中位数 median 排序后处于中间位置上的值 不受极端值的影响主要用于顺序数据 也可用数值型数据 但不能用于分类数据各变量值与中位数的离差绝对值之和最小 即 中位数 位置的确定 原始数据 顺序数据 顺序数据的中位数 例题分析 解 中位数的位置为300 2 150从累计频数看 中位数在 一般 这一组别中 因此Me 一般 数值型数据的中位数 9个数据的算例 例 9个家庭的人均月收入数据原始数据 15007507801080850960200012501630排序 75078085096010801250150016302000位置 123456789 中位数 1080 数值型数据的中位数 10个数据的算例 例 10个家庭的人均月收入数据排序 66075078085096010801250150016302000位置 12345678910 四分位数 quartile 排序后处于25 和75 位置上的值 不受极端值的影响主要用于顺序数据 也可用于数值型数据 但不能用于分类数据 四分位数 位置的确定 原始数据 顺序数据 顺序数据的四分位数 例题分析 解 QL位置 300 4 75QU位置 3 300 4 225从累计频数看 QL在 不满意 这一组别中 QU在 一般 这一组别中 因此QL 不满意QU 一般 数值型数据的四分位数 9个数据的算例 例 9个家庭的人均月收入数据原始数据 15007507801080850960200012501630排序 75078085096010801250150016302000位置 123456789 数值型数据的四分位数 10个数据的算例 例 10个家庭的人均月收入数据排序 66075078085096010801250150016302000位置 12345678910 数值型数据 众数 中位数 均值 众数的含义 众数是指总体中最常见的标志值 即 在分配数列中重复出现次数最多的标志值 因而 它具有一定的代表性 可以近似地表明现象的一般水平 未分组数据或单项式数列的众数可由定义直接计算 组距式数列的计算见下页 组距式数列众数计算公式 众数的近似值常由下限公式或上限公式来确定 1下限公式 Mo L d 1 2 2上限公式 Mo U d 1 2 中位数的含义 将总体单位的某一数量标志的各个数值按大小顺序排列 居于中间位置的那个标志值就是中位数 未分组数据或单项式数列的中位数计算同顺序型数据 组距式数列的计算见下页 组距式数列的中位数计算公式 f 2 Sm 1下限公式为 Me L dfm f 2 Sm 1上限公式为 Me U dfm分组数据计算实例 均值 mean 集中趋势的最常用测度值一组数据的均衡点所在体现了数据的必然性特征易受极端值的影响用于数值型数据 不能用于分类数据和顺序数据 简单均值与加权均值 simplemean weightedmean 设一组数据为x1 x2 xn 简单均值 简单均值与加权均值 simplemean weightedmean 设各组组中值为x1 x2 xk相应的频数为 f1 f2 fk 加权均值 已改至此 加权均值 例题分析 加权均值 权数对均值的影响 甲乙两组各有10名学生 他们的考试成绩及其分布数据如下甲组 考试成绩 x 020100人数分布 f 118乙组 考试成绩 x 020100人数分布 f 811 均值 数学性质 1 各变量值与均值的离差之和等于零 2 各变量值与均值的离差平方和最小 调和平均数 harmonicmean 均值的另一种表现形式易受极端值的影响计算公式为 原来只是计算时使用了不同的数据 调和平均数 例题分析 例 某蔬菜批发市场三种蔬菜的日成交数据如表 计算三种蔬菜该日的平均批发价格 几何平均数 geometricmean n个变量值乘积的n次方根适用于对比率数据的平均主要用于计算平均增长率计算公式为 5 可看作是均值的一种变形 几何平均数 例题分析 例 某水泥生产企业1999年的水泥产量为100万吨 2000年与1999年相比增长率为9 2001年与2000年相比增长率为16 2002年与2001年相比增长率为20 求各年的年平均增长率 年平均增长率 114 91 1 14 91 几何平均数 例题分析 例 一位投资者购持有一种股票 在2000 2001 2002和2003年收益率分别为4 5 2 1 25 5 1 9 计算该投资者在这四年内的平均收益率 算术平均 几何平均 众数 中位数和均值的比较 众数 中位数和均值的关系 众数 中位数和均值的特点和应用 众数不受极端值影响具有不唯一性数据分布偏斜程度较大时应用中位数不受极端值影响数据分布偏斜程度较大时应用平均数易受极端值影响数学性质优良数据对称分布或接近对称分布时应用 数据类型与集中趋势测度值 离散程度的测度 分类数据 异众比率顺序数据 四分位差数值型数据 方差及标准差相对位置的测量 标准分数相对离散程度 离散系数 数据的特征和测度 本节位置 离中趋势 数据分布的另一个重要特征反映各变量值远离其中心值的程度 离散程度 从另一个侧面说明了集中趋势测度值的代表程度不同类型的数据有不同的离散程度测度值 分类数据 异众比率 异众比率 variationratio 1 对分类数据离散程度的测度2 非众数组的频数占总频数的比率3 计算公式为 4 用于衡量众数的代表性 异众比率 例题分析 解 在所调查的50人当中 购买其他品牌饮料的人数占70 异众比率比较大 因此 用 可口可乐 代表消费者购买饮料品牌的状况 其代表性不是很好 顺序数据 四分位差 四分位差 quartiledeviation 对顺序数据离散程度的测度也称为内距或四分间距上四分位数与下四分位数之差QD QU QL反映了中间50 数据的离散程度不受极端值的影响用于衡量中位数的代表性 四分位差 例题分析 解 设非常不满意为1 不满意为2 一般为3 满意为4 非常满意为5已知QL 不满意 2QU 一般 3四分位差 QD QU QL 3 2 1 数值型数据 方差和标准差 极差 range 一组数据的最大值与最小值之差离散程度的最简单测度值易受极端值影响未考虑数据的分布 R max xi min xi 计算公式为 平均差 meandeviation 各变量值与其均值离差绝对值的平均数能全面反映一组数据的离散程度数学性质较差 实际中应用较少 计算公式为 未分组数据 组距分组数据 平均差 例题分析 平均差 例题分析 含义 每一天的销售量与平均数相比 平均相差17台 方差和标准差 varianceandstandarddeviation 数据离散程度的最常用测度值反映了各变量值与均值的平均差异根据总体数据计算的 称为总体方差或标准差 根据样本数据计算的 称为样本方差或标准差 总体方差和标准差 varianceandstandarddeviation 未分组数据 组距分组数据 未分组数据 组距分组数据 方差的计算公式 标准差的计算公式 样本方差和标准差 samplevarianceandstandarddeviation 未分组数据 组距分组数据 未分组数据 组距分组数据 方差的计算公式 标准差的计算公式 样本方差自由度 degreeoffreedom 一组数据中可以自由取值的数据的个数当样本数据的个数为n时 若样本均值 x确定后 只有n 1个数据可以自由取值 其中必有一个数据则不能自由取值例如 样本有3个数值 即x1 2 x2 4 x3 9 则 x 5 当 x 5确定后 x1 x2和x3有两个数据可以自由取值 另一个则不能自由取值 比如x1 6 x2 7 那么x3则必然取2 而不能取其他值样本方差用自由度去除 其原因可从多方面来解释 从实际应用角度看 在抽样估计中 当用样本方差去估计总体方差 2时 它是 2的无偏估计量 样本标准差 例题分析 样本标准差 例题分析 含义 每一天的销售量与平均数相比 平均相差21 58台 相对位置的测量 标准分数 标准分数 standardscore 1 也称标准化值2 对某一个值在一组数据中相对位置的度量3 可用于判断一组数据是否有离群点4 用于对变量的标准化处理5 计算公式为 标准分数 性质 均值等于02 方差等于1 标准分数 性质 z分数只是将原始数据进行了线性变换 它并没有改变一个数据在改组数据中的位置 也没有改变该组数分布的形状 而只是将该组数据变为均值为0 标准差为1 标准化值 例题分析 经验法则 经验法则表明 当一组数据对称正态分布时约有68 的数据在平均数加减1个标准差的范围之内约有95 的数据在平均数加减2个标准差的范围之内约有99 的数据在平均数加减3个标准差的范围之内 相对离散程度 离散系数 离散系数 coefficientofvariation 1 变异指标与其相应的均值之比对数据相对离散程度的测度消除了数据水平高低和计量单位的影响4 用于对不同组别数据离散程度的比较5 常用的计算公式为 离散系数 例题分析 例 某管理局抽查了所属的8家企业 其产品销售数据如表 试比较产品销售额与销售利润的离散程度 离散系数 例题分析 结论 计算结果表明 v1 v2 说明产品销售额的离散程度小于销售利润的离散程度 数据类型与离散程度测度值 4 3偏态与峰态的测度 一 偏态及其测度二 峰态及其测度 数据的特征和测度 本节位置 偏态与峰态分布的形状 偏态 峰态 偏态 偏态 skewness 统计学家Pearson于1895年首次提出数据分布偏斜程度的测度2 偏态系数 0为对称分布3 偏态系数 0为右偏分布4 偏态系数 0为左偏分布 偏态系数 skewnesscoefficient 根据总体

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论