《统计数据描述》PPT课件.ppt_第1页
《统计数据描述》PPT课件.ppt_第2页
《统计数据描述》PPT课件.ppt_第3页
《统计数据描述》PPT课件.ppt_第4页
《统计数据描述》PPT课件.ppt_第5页
已阅读5页,还剩130页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 通过本章的学习 要求掌握总量指标的概念和种类 分清时期指标和时点指标 理解相对指标的概念 掌握几种常用的相对指标的计算和应用 掌握集中趋势和离中趋势的含义及测定方法 掌握各种指标的特点及计算方法 学习目标 2 3 3 1总量指标与相对指标 3 1 1总量指标的概念和种类 1 总量指标 AggregateIndicators 的概念总量指标是反映社会经济现象在一定时间 地点条件下所达到的总规模 总水平或工作总量的综合指标 也称为绝对数指标或绝对数 其表现形式是绝对数 5 2 总量指标的种类 1 按说明总体内容 总体单位总量 单位总量 总体标志总量 标志总量 总体单位总量是一个总体内总体单位数之和 反映总体本身规模大小 总体标志总量是总体各单位某一数量标志的各标志值之和 说明总体特征的总数量 一个总量指标究竟属于总体单位总量还是总体标志总量 并不是固定不变的 随着研究目的的不同和研究对象的变化而定 6 2 按其反映的时间状况 时期指标 时点指标 时点指标表明社会经济现象总体在某一时点的总量 时期指标反映社会经济现象总体在一段时期内发展过程的总量 7 时期指标的数值是连续计数的 表现的是现象在一段时间内发生的总量 时点指标的数值是间断计数的 表现的是现象在一定时点上所处的发展水平时期指标数值具有可加性 时点指标不具有可加性时期指标数值大小与时期长短有直接关系 时点指标的数值的大小与其时间间隔长短无关 时期指标和时点指标的特点 8 3 按采用的计量单位 实物指标 价值指标 劳动量指标 自然单位 度量衡单位 双重或多重单位 复合单位 9 3 1 2相对指标的概念及其计算方法 1 相对指标的概念相对指标是将两个有联系的指标数值对比形成的一种比率 用来反映现象之间的数量对比关系和联系程度 又称相对数 10 将分子和分母计量单位结合使用 表明事物的密度 普遍程度等 如人口密度用人 平方公里 一种抽象化的数值 有系数 倍数 成数 百分数 千分数等 11 2 相对数的种类和计算方法 结构相对数 比例相对数 强度相对数 计划完成相对数 动态相对数 相对数的种类 比较相对数 12 1 结构相对数结构相对指标是用分组法将总体区分为不同性质的各部分来反映总体内部组成情况的综合指标 一般用百分数表示 各组比重的百分数总和等于100 或1 亦称比重指标 13 计算公式 结构相对指标的分子和分母可以同是总体单位数 也可以同是总体的标志数值 14 作用 反映对资源的利用程度及生产经营效果 反映事物的变化过程及发展趋势 反映总体内部结构的特征 15 2 比例相对数概念比例相对数是将总体内某一部分与另一部分数值对比所得到的相对数 16 计算公式分子分母属于同一总体分子分母可以互换可以用百分数表示 也可以用一比几或几比几的形式表示 17 3 比较相对数概念比较相对数是将不同地区 单位或企业之间的同类指标值作静态对比而得出的综合指标 表明同类事物在不同空间条件下的差异程度或相对状态 18 计算公式比较相对数的分子分母是同类指标 但数值分别属于不同的总体所属统计指标的涵义 口径 计算方法和计量单位必须一致可以用百分数 系数或倍数表示 分子分母可以互换 19 例 甲 乙两个同类企业工人劳动生产率分别为18000元和24000元 则 20 4 强度相对数概念强度相对数是两种性质不同而有联系的 属于不同总体的总量指标之间的对比 以说明现象的强度 密度和普遍程度的综合指标 21 计算公式两个有联系的不同的总量指标的对比分子分母大多可以互换有正指标和逆指标两种 人口出生率 死亡率等分子分母不能互换 正指标和逆指标分别从两个不同的方面说明现象的密度 正指标数值越大越好 逆指标数值越小越好 22 例 某地区人口总量为500万人 医疗机构600家 则 23 5 动态相对数概念动态相对数是由同一总体的同类指标在不同时间上的数值对比而确定的相对数 表明某一现象在不同时间上的发展不平衡程度 24 计算公式分子分母的数值是同类但不同时期的 作为对比标准的时期是基期 同基期比较的时期是报告期计算结果一般用百分数 系数或倍数表示 25 6 计划完成相对数概念计划完成相对数是用现象在某一段时间内的实际完成数与计划任务数相比表明计划完成程度的综合指标 又称计划完成百分比 通常以百分数表示 26 计算公式 27 计算问题 在计划完成相对数的计算上 由于计划指标既有可能是总量指标也可能是相对指标 所以在计算时 根据不同的情况要采取不同的方法 28 根据总量指标计算计划完成相对数例 某企业某年计划总产值为300万元 实际完成330万元 则 产值计划完成相对数 330 300 110 超额的绝对值 330 300 30 万元 计算结果表明该企业超额完成10 的任务 超产30万元 29 根据相对指标计算计划完成相对数例 某企业要求劳动生产率达到5000元 人 某种产品的计划单位成本为100元 该企业实际的劳动生产率达到6000元 人 某种产品的实际单位成本为80元 则 劳动生产率计划完成相对数 6000 5000 120 单位成本计划完成相对数 80 100 80 对于正指标 如产值 产量 利润额 劳动生产率等 其计划完成程度若大于100 说明超额完成计划 若小于100 说明没有完成计划 对于逆指标 如单位成本等 其计划完成程度若小于100 说明超额完成计划 若大于100 说明没有完成计划 30 计划完成相对数的作用 考核计划执行的进度 31 全公司的计划执行情况达到了75 但乙企业离进度要求还有差距 乙企业完成进度计划是完成全年计划的关键 32 长期计划的检查 累计法 水平法 计划指标按整个计划期内累计完成量来规定应该达到的水平 在计划期内只规定最后一期应达到的水平 33 例 某五年计划的基本建设投资额为5000亿元 5年内实际累计完成5150亿元 则 34 例 某产品计划规定第五年产量56万件 第五年实际产量为63万件 则 计划提前完成 提前多久 35 从第4年9月到第5年8月 产量合计为57万件 累计到第5年7月的产量合计数为51万件 因此8月份只需完成5万件就可以达到计划规定的56万件 而8月的实际产量是6万件 所以提前完成任务的天数可以根据生产进度推知 即 1 5 6 30 5天 即提前4个月又5天完成计划 36 3 1 3应用相对指标的原则 可比性原则 相对指标和总量指标结合应用的原则 各种相对指标结合应用的原则 37 38 3 2 1集中趋势的涵义 集中趋势 Centraltendency 是指一组数据向某一中心值靠拢的倾向 测度集中趋势也就是寻找数据一般水平的代表值或中心值 39 位置平均数 数值平均数 根据总体中处于特殊位置的个别或部分单位的标志值来确定的代表值 众数 中位数 根据所有变量值计算的 算术平均数 调和平均数 几何平均数 40 3 2 2算术平均数 ArithmeticMean 集中趋势的最主要度量值基本公式 41 算术平均数的分子和分母是同一总体的标志总量和单位总量 而强度相对指标对比的分子分母是两个不同总体现象总量算术平均数分子中的每一个标志量都是由分母中的每一个单位来承担 分子的标志值个数和分母的单位数存在着对应关系 而强度相对指标对比的分子分母在数量上没有对应关系 42 强度相对指标一般由对比双方原有的计量单位构成 平均数计量单位则与标志值指标计量单位相同有的强度相对指标的分子分母可互换 平均数则不可 43 算术平均数的计算方法简单算术平均数 SimpleArithmeticMean 44 例3 1 某产品某种型号的价格有5种 分别为 100元 105元 110元 120元和125元 计算平均价格 解 根据公式 5种价格用简单算术平均数计算平均价格如下 45 加权算术平均数 WeightedArithmeticMean 表现 次数 频率 各组次数完全相同 此时不再对x大小产生影响 实际上简单算术平均数是加权算术平均数的特例 46 根据单项数列计算加权算术平均数根据单项数列计算加权算术平均数 直接利用各组总体单位数 次数 对各组变量值进行加权 47 例3 2 某车间100名工人生产的零件产量如下所示 根据所给资料 计算工人的平均产量 200 440 360 130 xf 1130 xp 2 4 4 3 6 1 3 11 3 48 两种计算方法结果相等 平均每个工人一天生产11 3个零件 49 由组距数列计算加权算术平均数理论上讲 由组距数列计算加权算术平均数 应先计算各组的平均数 再以各组的平均数乘以相应的权数 并计算加权算术平均数 但在实际工作中 很少计算组平均数 而是用各组的组中值代替各组平均数 50 例3 3 某市旅游协会根据100个会员的样本 整理出一年的营业额分布资料如下 计算年均营业额 x 125 175 225 275 325 375 51 计算结果表明 100个旅游企业年平均销售额为240万元 52 算术平均数的数学性质 53 54 3 2 3调和平均数 harmonicmean 调和平均数是被研究对象中各单位标志值倒数的算术平均数的倒数 因而也称为倒数平均数 调和平均数也分为简单调和平均数和加权调和平均数 55 m xf时 加权调和平均数实际上是加权算术平均数的变形 当各组标志总量相等时 加权调和平均数可化简成为简单调和平均数形式 56 例3 4 某饭店分一部 二部 三部 2010年实际收入分别为306万元 278 2万元 261 6万元 计划完成相对数分别为102 107 109 求平均计划完成程度 57 解 以实际收入为权数的加权调和平均数公式计算 58 59 例3 5 某饭店分一部 二部 三部 2000年计划收人分别为300万元 260万元 240万元 计划完成程度分别为102 107 109 求平均计划完成程度 60 解 根据掌握的资料 平均计划完成程度应采用以计划收入为权数的加权算术平均法来计算 61 3 2 4几何平均数 geometricmean 几何平均数是把各个标志值连乘 然后开次方根所得的平均水平 几何平均数是适应于特殊数据的一种平均数 在实际生活中通常用来计算平均比率和平均速度 当所掌握的变量值本身是比率的形式 而且各比率的乘积等于总的比率时 就应采用几何平均法计算平均比率 62 简单几何平均数 加权几何平均数 63 例3 6 某投资者持有一种股票 2007 2008 2009 2010收益率分别为5 6 5 5 5 4 计算该投资者在这四年内的平均收益率 平均收益率为5 47 64 例3 7 投资银行某笔投资是的年利率是按复利计算的 利率分配时有一年是3 有4年为4 有8年为8 有10年为10 有2年为15 求平均年利率 即平均年利率为8 6 65 几何平均数的特点相对于算术平均数而言 几何平均数应用范围较窄如果变量值等于零或者负值 无法计算几何平均数相对于算术平均数和调和平均数几何平均数受极端值影响较小几何平均数的对数是各变量值对数的算术平均数 66 3 2 5众数 Mode 含义变量数列中出现次数最多或频率最大的标志表现为众数 用M0表示 从变量分布的角度看 众数是具有明显集中趋势点的数值 一组数据分布的最高峰点所对应的数值即为众数 67 只有集中趋势明显时 才能用众数作为总体的代表值 如果数据的分布没有明显的集中趋势 众数可以不存在 称为无众数 如果有多个高峰点 可以有多个众数 称为复众数 68 根据单项数列确定众数在单项数列中 一般用直接观察法确定众数 在分配数列中出现次数最多 频率最大 的标志值就是众数 69 例3 8 面对房租上涨 2010年12月中国青年报社会调查中心对全国31个省 区 市 共计4060名租房者进行的调查结果如下表所示 判断房租上涨对受访者生活的影响程度的众数 70 解 本题中标志表现为严重影响 一般 比较小和非常小 可以看到 80 6 的受访者表示房租上涨给生活带来的严重影响 所以M0 严重影响 71 组距数列确定众数 下限公式 上限公式 式中 L为众数所在组组距的下限 U为众数所在组组距的上限 1 fm fm 1 其中 fm为众数组次数 fm 1众数组前一组次数 2 fm fm 1 其中 fm为众数组次数 fm 1众数组后一组次数d为众数所在组的组距 72 例3 9 利用下表资料确定某地区农民收入的众数 fm fm 1 fm 1 73 解 从表中的数据可以看出 出现次数最多的频数是1050 即众数组为1400 1600这一组 根据公式得 下限公式 或者上限公式 74 3 2 6中位数 Median 概念中位数是将总体单位的某一数量标志的各个数值按照大小顺序排列 居于中间位置的标志值就是中位数 用Me表示 中位数将总体分为两个相等的部分 一半单位的标志值小于中位数 一半单位的标志值大于中位数 用me表示 75 计算由未分组资料确定中位数 n为奇数时 中间位置对应的标志值为所求的中位数 n为偶数时 处于中间位置的两个标志值的简单算术平均数为所求的中位数 76 例3 10 某班7名同学的身高分别为1 70m 1 80m 1 85m 1 60m 1 65m 1 75m和1 72m 试求其中位数 解 先将学生身高按大小顺序排列为 1 60m 1 65m 1 70m 1 72m 1 75m 1 80m 185m 然后求中位数的位置即 中位数的位置则位于第四位的标志值就是中位数 即Me 1 72m 77 例3 11 某班6名学生统计学考试成绩 单位 分 分别为80 90 60 50 65和75 试求其中位数 解 先将学生考试成绩按大小顺序排列为 50 60 65 75 80 90 然后求中位数的位置 即中位数位于第3个和第4个学生成绩之间 也就是65和75的算术平均数 即Me 70 分 78 组距数列确定中位数 下限公式 上限公式 L为中位数所在组下限 U为中位数所在组下限 Sm 1为小于中位数组下限的观察值的累积频数 Sm 1为大于中位数组上限的观察值的累积频数 d为中位数所在组组距 79 例3 12 利用下表的资料确定某地区农民收入的中位数 fm Sm 1 Sm 1 80 解 由表中的次数合计可知 中位数位于的位置 应当位于第三组 根据下限公式 或者根据上限公式 81 3 2 7分位数 四分位数 Quartile 十分位数 Decile 和百分位数 Percentile 分别是用3个点 9个点和99个点将数据4等分 10等分和100等分各分位点的值 下面以四分位数为例介绍计算方法 82 四分位数是通过3个点将全部数据等分为4部分 通常所说的四分位数是指一组数据排序后处于25 和75 位置上的值 分别称为下四分位数和上四分位数 83 设下分位数为QL 上四位数为QU 根据四分位数的定义 84 例3 13 在某城市随机抽取8个家庭 调查得到每个家庭的人均月收入为1500元 750元 780元 850元 960元 1250元 1080元和1630元 计算人均月收入的四分位数 解 先对数据进行排序 结果如下 7507808509601080125015001630 根据公式得 即QL在第二个数值 780 和第三个数值 850 之间0 25的位置上 QL 780 850 780 0 25 797 5 元 即QU在第六个数值 1250 和第七个数值 1500 之间0 75的位置上 QU 1250 1500 1250 0 75 1437 5 元 85 3 2 8算术平均数 中位数 众数的特点和关系 含义和特点不同算术平均数是应用最广泛的平均指标 全面反映了整个总体的次数分布 当总体中出现极大值或极小值时 算术平均数受极端值的影响 中位数和众数都属于位置平均数 不受极端值的影响 86 对称的 钟 型分布 右偏分布时 左偏分布时 受非对称分布的影响程度不同 87 皮尔生经验法则 分布在轻微偏斜的情况下 众数 中位数和算术平均数数量关系的经验公式为 88 例3 15 某外贸企业月收入众数为2800元 算术平均数为3100元 推测总体分布特征 所以为右偏分布 解 根据公式 3 25 月收入中位数近似值为 89 3 3离中趋势的测定 离中趋势的涵义离中趋势反映各变量值远离其中心值的程度 因此也称为离中趋势 从另一个侧面说明了集中趋势测度值的代表程度 90 离中趋势的作用评价平均指标代表性大小的依据反映社会生产和其他社会经济活动的均衡性或协调性进行质量和风险控制 标志变动度越大 则平均数的代表性就差 标志变动度越小 平均数代表性越强 标志变动度越小 质量越好 风险越小 标志变动度越大 质量越差 风险越大 91 3 3 2离中趋势的测定方法 全距 range 全距又称极差 是一组数据的最大值与最小值之差 用R表示公式 R max xi min xi R 最高组上限值 最低组下限值 开口组 92 R越大 表明数值变动的范围越大 即数列中各变量值差异大 反之 R越小 表明数值变动的范围越小 即数列中各变量值差异小 93 四分位差 quartiledeviation 四分位差是下四分位数和上四分位数之差 也成内距 常用Qd表示公式 Qd QU QL 四分位差反映了中间50 的数据的离散程度 不受极端值的影响 一定程度上克服了用全距描述离散程度的不足 中位数经常和四分位差可以结合使用 94 平均差 AverageDeviation 平均差 即平均绝对偏差 是各变量值与其算术平均数离差绝对值的平均数 用A D 表示 根据掌握资料的不同 平均差有以下两种计算方法 95 简单平均差对于未分组资料 采用简单平均法 公式 96 例3 17 某车间5名工人日生产零件数分别为50件 60件 70件 80件和90件 求平均差 解 根据公式计算平均数根据公式计算平均差 97 加权平均差在资料分组的情况下 应采用加权平均式 98 例3 18 某企业100名工人的月工资统计资料如下表所示 计算平均差 组中值x 1300 1500 1700 1900 xf 26000 45000 59500 28500 159000 5800 2700 3850 4650 17000 99 月工资 元 工人数 人 解 根据公式 100 101 标准差和方差标准差是总体中各单位变量值与其算术平均数离差平方的平均数的平方根 通常用表示 标准差的意义与平均差基本相同 也是各项离差的平均数 但在数学处理上 标准差是采用平方的方法来避免正负离差相互抵消的 标准差的平方称为方差 通常用表示 102 根据所掌握的资料不同 标准差和方差的计算公式也有简单式和加权式两种形式 用未分组资料计算如果所掌握的资料未经过分组 需要采用简单平均公式计算标准差和方差 103 用分组资料计算 104 方差及标准差的计算过程 105 例3 19 用例3 2中100个工人生产的元件数量计算方差和标准差 106 解 或者 107 108 可包括总体单位数的68 27 可包括总体单位数的95 45 可包括总体单位数的99 73 社会经济统计是研究大量社会经济现象的数量特征 大多数现象总体内的次数呈正态分布 即以平均数为中心 中间大 两头小的分布特征 在正态分布情况下 109 是非标志的均值及标准差是非标志是指只具有两种表现的品质标志 在社会经济统计中有时把某种社会经济现象的全部总体单位 分为具有某一标志的单位和不具有某一标志的单位两组 其值仅表现为具有某种特征或不具有某种特征两种情况 110 在计算平均数时首先需要将是非标志的文字表现进行数量化处理 用 1 表示具有某种表现 用 0 表示不具有某种表现 然后以 1 和 0 作为变量值 计算是非标志的平均数和标准差 111 是非标志总体的算数平均数 即是非标志总体的算数平均数是总体中标志值为1的单位的成数 112 113 例3 20 某机械厂铸造车间生产6000吨铸件 合格品5400吨 不合格品600吨 铸件合格率为90 其合格品成数数和标准差各为多少 解 平均数合格品的成数 即 标准差为 114 离散系数 coefficientofvariation 离散系数是反映一组数据相对差异程度的指标 是各变异指标与其算术平均数的比值 又称变异系数 离散系数通常用V表示 分别是全距 平均差 标准差除以算术平均数所得到的相对水平 即全距系数 平均差系数和标准差系数 其中最常用的是标准差系数 115 在平均数不为零的条件下 离散系数越大 数据的离散程度越大 而所对应的集中趋势统计量的代表性就越小 反之 则数据的离散程度越小 集中趋势统计量的代表性就越大 116 例3 21 甲乙两组工人的平均工资分别为1938 14元 2276元 标准差分别为元305 73 329 27元 判断哪一组的平均工资代表性更好 解 根据公式 甲组相对的变异程度大于乙组 因而乙组平均工资的代表性要大 117 异众比率 variationratio 异众比率是一组数据的非众数与全个数的比率 用Vr表示 异众比率常常和众数结合起来使用 公式 异众比率越大 众数的代表性越差 异众比率越小 众数的代表性越好 118 例3 22 一家市场调查公司为研究不同品牌饮料的市场占有率 对随机抽取的一家超市进行了调查 调查员在某天对50名顾客购买饮料的品牌整理得到不同品牌饮料的频数分布资料要求根据资料计算异众比率 119 解 很明显 M0 可口可乐 fm 15根据公式可得 120 标准化数值 Z Score 标准化数值是数据在数据集中相对位置的测度 计算一组数据中各个数值的标准化数值以测度每个数据在该组数据中的相对位置 并可以用它来

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论