第4章综合指标_第1页
第4章综合指标_第2页
第4章综合指标_第3页
第4章综合指标_第4页
第4章综合指标_第5页
已阅读5页,还剩174页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章

综合指标本章重点与难点1、总量指标的概念与分类;

2、相对指标的概念、分类及计算方法;

3、平均指标的概念与作用;加权算术平均数、加权调和平均数与加权几何平均数的计算;

4、中位数、众数的概念及其计算;5、标志变异指标的概念、作用及其应用;标准差及标准差系数的概念与计算方法。

要特别注意加权算术平均数、加权调和平均数、标准差及标准差系数的计算与应用,这是本章的难点。统计分析指标从它的作用和方法特点的角度可概括为:

总量指标相对指标平均指标标志变异指标偏度与峰度概念:

(一)总量指标的概念总量指标是反映社会经济现象一定时间、地点、条件下的总规模、总水平的统计指标。总量指标表现形式是绝对数,所以又叫绝对差数指标。一、总量指标(绝对指标)例如:2005年我国财政收入30510亿元,财政支出33510亿元,财政赤字3000亿元。总量指标的作用(1)总量指标是认识社会经济现象的起点能反映一个国家的基本国情和国力,反映某部门、单位等人、财、物的基本数据。(2)总量指标是实行社会经济管理的依据之一。制定政策、编制计划、实施管理的基本依据之一;

(3)总量指标是计算相对指标和平均指标以及各种分析指标的基础。1、按其反映的内容不同可分为:

总体单位总量——

说明总体的单位数数量。

总体标志总量——

说明总体中某个标志值的总量。(二)总量指标的种类

2、按其反映的时间状况不同可分为:时期指标——

反映现象在某一时期发展过程的总数量。(可连续计数,与时间长短有关,是累计结果)时点指标——

反映现象在某一时刻的状况。(间断计数,与时间间隔无关,不能累计)

时期指标时点指标(1)指标数值靠连指标数值靠

续计量汇总取得间隔盘点取得(2)指标数值具不具有累加性

有累加性

点(3)指标数值的大与时期长短小受时期长短制约无关劳动指标—用于企业内部计量工业产品的数量,它是用生工业品所必需的劳动时间来计量。价值指标—也是货币单位指标,它是以货币价值来计量。实物指标—根据事物的外部特征或物理属性所采用的单位。3、按总量计量单位的不同,可分为:实物指标、价值指标和劳动指标注意问题—明确每项指标的含义;掌握指标的口径范围;注意指标的可比性和计量单位;方法:间接法和直接计算法

(三)总量指标的核算方法与运用核算原则3.

一致性—要注意计算口径、计算方法和计量单位的一致性。2.

可比性—总体范围、指标内容等的可比;

1.

科学性—科学界定总量指标的含义、范围和计算方法;二、相对指标

1.概念:是由两个有联系的指标数值对比的结果。

用来对比的两个数,既可以是绝对数,也可以是平均数或相对数。对比的结果,用以反映现象的计划完成程度、发展速度、结构、比例、强度和普遍程度等。(二)相对数指标的概念与作用

相对指标有两种表现形式:有名数和无名数,其中多为无名数,只有少数指标用有名数表示。2.相对指标的作用(1)通过数量对比,表明事物相关程度及发展程度,用来描述现象的相对水平和普度程度。可以揭示社会经济现象的各种比例关系,深化对事物的认识。(2)把现象的绝对差异抽象化,使无法对比的指标具有可比性,反映现象之间的相互联系程度,说明总体现象的质量、经济效益和经济实力情况。可以使原本不便于直接对比的事物具有比较的基础。(3)说明总体内在结构特征,为深入分析事物的性质提供依据。相对指标是进行经济管理和绩效评价的重要指标。企业8月份劳动生产率(万元)7月份劳动生产率(万元)8月比7月发展速度%)甲21.94103.09+600元乙0.560.52107.69+400元

从上表中看来,好象甲厂比乙厂劳动生产率高(∵600>400);而将其换算成相对指标,实际发展速度是乙厂大于甲厂。由此可看出相对指标可以弥补总量指标的不足。例

二、相对数指标的种类及其计算

(1)计划完成度相对指标

(1)计划完成程度相对数

1.基本计算公式根据统计局数据可知,2012年中国全国公共财政预算收入为113600亿元,财政决算收入为117253.52亿元;全国财政预算支出为124300亿元,财政决算支出为125952.97亿元;2013年全国GDP预期增长率为7.5%,实际增长率为7.7%。分别求财政收入、财政支出与GDP增长率的计划完成相对数。解:根据计划完成相对数的定义及公式,可计算:(1)根据绝对数来计算计划完成相对数

计算结果表明该厂超额10%完成总产值计划。

设某工厂某年计划工业总产值为200万元,实际完成220万元,则:

(2)根据平均数来计算计划完成相对数

某化肥厂某年每吨化肥计划成本为200元,实际成本为180元,则:

实际单位成本-计划单位成本=180-200=-20(元)计算结果表明该厂化肥单位成本实际比计划降低了10%,平均每吨化肥节约生产费用20元。例(3)根据相对数来计算计划完成相对数

某企业生产某产品,上年度实际成本为420元/吨,本年度计划单位成本降低6%,实际降低7.6%,则:

1-7.6%

计划完成程度==98.29%1-6%∴

比计划多完成1-98.29%=1.71%;例1

某企业计划规定劳动生产率比上年提高10%,实际比上年提高15%,则:

∴劳动生产率超额4.5%完成计划任务。

例2(2)结构相对数1、公式:

结构相对数=

结构相对数(又称比重)一般用百分数表示,各组比重总和等于100%或1。其分子和分母可以同是总体单位数,也可以同是总体的标志数值,但分子的数值必须是分母数值的一部分。例表2011年金砖五国与收入不同程度国家的产业结构

第一产业比重第二产业比重第三产业比重世界2.826.370.9高收入国家1.324.474.3中等收入国家9.734.755.6中低收入国家1034.455.5低收入国家24.725.350最不发达地区22.728.348.9中国1046.643.3印度17.226.456.4南非2.430.667巴西5.527.567俄罗斯联帮436.759.3

2、结构相对数的作用(1)可以反映总体内部结构的特征;(2)通过不同时期结构相对数的变动分析,可以看出事物的变化过程及其发展趋势;(3)能反映经济现象对人、财、物的利用程度及生产经营效果的好坏;(3)比例相对数指标

1、计算公式为:

比例相对数一般用百分数表示,也有直接用比例表示。

常用的比例形式有两种:

1.将作为比较基础的数值抽象化为1、10、100或1000,看被比较的数值是多少。

我国2000年第五次人口普查结果,男女性别比例为106.74:100,这说明以女性为100,男性人口是女性人口数的1.0674倍。简称性比例106.74。目前已上升到116.86:100。例2.先将总体全部数值抽象化为100,求得各部分数值在总体中所占百分数,然后将各部分的百分数连比得比例相对数。

2005年上海GDP抽象化为100,第一产业、第二产业、第三产业的比例为:

0.87︰48.95︰50.18。

例表2012年世界相关国家(地区)的男女性别比国别性别比国别性别比国别性别比卡塔尔31.81澳大利亚100.54波兰107.41阿联酋44.28南非101.74澳门108.12巴林59.98智利102.29哈萨克斯坦108.15科威特67.78西班牙102.32百慕大110.15阿曼69.23美国102.43匈牙利110.55沙特阿拉伯81.48英国102.87中国香港111.26中国92.6泰国103.59美属维尔京群岛111.45阿富汗93.32法国105.37格鲁吉亚112.4印度93.75日本105.41俄罗斯联邦116.24约旦94.51罗马尼亚106.24爱少尼亚116.76菲律宾99.46葡萄牙106.32拉脱维亚117.18瑞典100.54保加利亚107.11乌克兰117.45(三)比较相对数指标(类比相对指标)

计算比较相对数时,作为比较基数的分母可取不同的对象,一般有两种情况:1.比较标准是一般对象,如:

式中:分子与分母现象所属统计指标的涵义、口径、计算方法和计量单位必须一致。比较相对数一般用百分数或倍数表示。

分子、分母可以互换。发达国家与发展中国家在以源利用效率方面存在较大的差异,此时可以用比较相对数分析不同国家之间的差异。以火电为例,中国火电厂供电煤耗为每千瓦时404标准煤,国际先进水平为317克标准煤,而我国为世界先时的1.274倍(404/317)对于GDP的能源,中国单位能源每千克油当量的使用所产生的国内生产总值仅为0.7美元,而美国为3.4美元,德国为7美元,日本为10.5美元。则中国为美国的0.2(0.7/3.4);中国为德国的0.1(0.7/7);中国为日本的0.067(0.7/10.5)2.比较标准(基数)典型化,如:

把企业的各项技术经济指标都和国家规定的质量水平比较,和同类企业的先进水平比较,和国外先进水平比较等,这时,分子与分母的位置不能互换。

某年有甲、乙两企业同时生产一种性能相同的产品,甲企业工人劳动生产率为19,307元,乙企业为27,994元。说明甲企业劳动生产率比乙企业低31%。例(5)强度相对数指标

1、计算公式

强度相对数主要用来表明现象的强度、密度和普遍程度。①一般用复名数表示;

②也有少数用百分数或千分数表示。

1.强度相对数的数值表示有两种方法:表2011年度世界经济实力前十位国家的单位GDP能耗测算表GDP排名国家GDP总量(亿美元)一次能源消费总量(百万吨煤当量)单位GDP能耗(吨标准煤/万美元)1美国150940.32269.31.5032中国72981.472613.23.5813日本58694.71477.60.8144德国35770.31306.40.8575法国27763.24242.90.8756巴西24929.08266.91.0717英国24175.7198.20.828意大利21987.3168.50.7669俄罗斯18504.01685.63.70510加拿大17368.69330.31.902某城市人口100万人,有零售商业机构5000个,则:例2.有些强度相对数有正、逆两种计算方法:表2012年中国各省市自治区人口密度指标地区人口(万人)面积(万平方公里)人口密度(人/平方公里)地区人口(万人)面积(万平方公里)人口密度(人/平方公里)全国135404313.42432.02河南940616.80559.88北京20691.681231.55湖北577918.60310.70天津14131.191187.39湖南663921.20313.16河北728819.00383.58广东1059417.80595.17山西361115.70230.00广西468223.50199.23内蒙古2490118.0021.10海南8873.50253.43辽宁438914.60300.62重庆29458.20359.15吉林275018.00152.78四川807648.50166.52黑龙江383445.5084.26贵州348417.60197.95上海23800.643718.75云南465938.40121.33江苏792010.30768.93西藏308122.002.52浙江547710.20536.96陕西375320.56182.54安徽598813.97428.63甘肃257845.5056.66福建374812.14308.73青海57372.007.96江西450416.70269.70宁夏6476.6497.44山东968515.80612.97新疆2233166.0013.45

必须注意,虽然强度相对数也有“平均”的涵义,但是,它与平均数指标的区别在于:它不是同质总体的标志总量与总体单位数之比,所以,它不是平均数。(6)动态相对数指标

计算公式为:

基期

——作为对比标准的时间报告期——

同基期比较的时期,也称计算期

表2006-2012年国内和产总值和各产业的动态相对数年份GDP第一产业第二产业第三产业2006112.7105113.4114.12007114.2103.7115.11162008109.6105.4109.9110.42009109.2104.2109.9109.62010110.4104.3112.3109.82011109.3104.3110.3109.42012107.7104.5107.9108.12.相对数指标要和总量指标结合起来运用;定性与定量分析相结合1.注意二个对比指标的可比性;(可比性原则)(三)正确运用相对指标的原则3.多种相对数指标结合运用;相对指标和总量指标结合运用的原则三、平均指标

2.特点:

(1)同质性——只能就同类现象计算;

(2)抽象性

——将现象的数量差异抽象化;

(3)代表性——能反映总体变量值的一般水平。1.概念:

平均数指标是指在同质总体内将各单位某一数量标志的差异抽象化,用以反映总体在具体条件下的一般水平。

一、平均数指标的概念与作用

(1)

比较作用

a.同类现象在不同空间的对比;

b.同一总体在不同时间上的比较。

(2)利用平均指标可以分析现象之间的依存关系

(3)利用平均指标可以进行数量上的推算,还可以作为论断事物的一种数量标准或参数3.平均数指标的作用

4.平均数的种类

算术平均数

数值平均数 调和平均数几何平均数 众数

位置平均数

中位数算术平均数的基本公式1、算术平均数

式中:——

算术平均数

X——

各单位的标志值

n——

总体单位数

——

总和符号2.简单算术平均数设一组数据为:X1,X2,…,XN简单均值的计算公式为设分组后的数据为:X1,X2,…,XK

相应的频数为:F1,F2,…,FK加权均值的计算公式为原始数据: 0 2 3 5 10 34164表20个锻炼者每月跑步长度组组中值(Xi)频数(Fi)XiFi5.5~10.510.5~15.515.5~20.520.5~25.525.5~30.530.5~35.535.5~40.581318232833381235432226541151129976合计—20490【例】根据表中的数据,计算20个锻炼者每月跑步长度

甲乙两组各有10名学生,他们的考试成绩及其分布数据如下甲组:考试成绩(X): 020100

人数分布(F):118乙组:考试成绩(X): 020100

人数分布(F):811X甲0×1+20×1+100×8n10i=1Xi82(分)X乙0×8+20×1+100×1n10i=1Xi12(分)算术平均数具有如下特征:1)算术平均数是一系列数据的平衡点2)算术平均数的大小受两外委会因素的影响,一是变量值的大小,二是权数或权重。3)算术平均数易受离群观测值的影响优点:①容易理,便于计算②灵敏度高③稳定性好④和缺点:①易受极值影响②在偏斜分布和U形分布中,不具有代表性①各个变量值与算术平均数离差之和等于零算术平均数的数学性质简单平均数:加权平均数:②各个变量值与算术平均数离差平方之和

为最小值△算术平均数的特点算术平均数适合用代数方法运算,因此运用比较广泛;易受极端变量值的影响,使的代表性变小;受极大值的影响大于受极小值的影响;当组距数列为开口组时,由于组中值不易确定,使的代表性也不很可靠。

调和平均数是各个变量值倒数的算术平均数的倒数。2、调和平均数(又称“倒数平均数”)

1. 集中趋势的测度值之一2. 均值的另一种表现形式3. 易受极端值的影响4. 用于定比数据5.不能用于定类数据和定序数据表某基金市场的两只股票的具体表现股票股本(亿)每股股价(元)每股收益(元)总股价(元)市盈率(%)股票A1000100.51000020股票B0.11000.011010000求市盈率表

某日三种蔬菜的批发成交数据蔬菜名称批发价格(元)

Xi成交额(元)XiFi成交量(公斤)Fi甲乙丙1.200.500.801800012500640015000250008000合计—3690048000【例】某蔬菜批发市场三种蔬菜的日成交数据如表,计算三种蔬菜该日的平均批发价格其计算方法如下:在加权的情况下:=在社会经济统计学中经常用到的仅是一种特定权数的加权调和平均数。即有以下数学关系式成立:m是一种特定权数,它不是各组变量值出现的次数,而是各组标志值总量。某公司有四个工厂,已知其计划完成程度(%)及实际产值资料如下:工厂计划完成程度(%)X实际产值(万元)m=Xf实际产值÷计划完成程度(%)(即计划产值)(万元)

甲9090100乙100200200丙110330300丁120480400合计-1,1001,0001.由相对数计算平均数时调和平均数法的应用:例已知某商品在三个集市贸易市场上的平均价格及销售额资料如下:市场平均价格(元)X销售额(元)m=Xf销售额(元)÷平均价格(元)(即销售量)

甲1.003000030000乙1.503000020000丙1.403500025000合计-95000750002.由平均数计算平均数时调和平均数法的应用:例△调和平均数的特点如果数列中有一标志值等于零,则无法计算;较之算术平均数,受极端值的影响要小。式中:——

算术平均数

X——

各组数值

f——

各组数值出现的次数(即权数)3.加权算术平均数设某厂职工按日产量分组后所得组距数列如下,据此求平均日产量。按日产量分组(千克)组中值X(千克)工人数f(人)Xf60以下551055060–706519123570–807550375080–908536306090–10095272565100–110105141470110以上1158920合计-16413550例在掌握比重权数的情况下,可以直接利用权数系数来求加权算术平均数,其公式为:按日产量分组(千克)组中值X(千克)工人数f(人)ff/∑f

60以下55100.063.360–7065190.127.870–8075500.3022.580–9085360.2218.790–10095270.1615.2100–110105140.099.45110以上11580.055.75合计-1641.0082.7加权算术平均数受两因素的影响:

变量值大小的影响。次数多少的影响。

而简单算术平均数只反映变量值大小这一因素的影响。加权算术平均数与简单算术平均数不同在于:1.简单几何平均数4、几何平均数(又称“对数平均数”)例

某机械厂有铸造车间、机加工车间、装配车间三个连续流水作业车间。本月份这三个车间产品合格率分别为95%、92%、90%,求平均车间产品合格率。解:这说明该厂车间产品平均合格率为92.31%2.加权几何平均数

投资银行某笔投资的年利率是按复利计算的,25年的年利率分配是:有1年为3%,有4年为5%,有8年为8%,有10年为10%,有2年为15%,求平均年利率。例首先,将年利率换算成年本利率计算平均年本利率

然后,再将平均年本利率换算成平均年利率

G-1=108.6%-1=8.6%解某矿泉水的流水生产线前后衔接共五道工序,其中某天各工序产品的合格率分别为90%、92%、98%、85%及90%,计算产品的平均合格率。△几何平均数的特点如果数列中有一个标志值等于零或负值,就无法计算;受极端值的影响较和小;它适用于反映特定现象的平均水平,即现象的总标志值是各单位标志值的连乘积。4、广义均值是一组n个正数的幂函数,也称为幂均值其中为广义均值,m为待取值;为对应的各标志值;n为标志值的个数,当m取不同的值时分别代表二次均值,算术平均值及几何平均值。M值广义均值m→∞最大m→-∞最小m=2均方根m=1算术平均数m=-1调和平均数m→0几何平均数由定义可看出众数存在的条件:1.概念:众数是在总体中出现次数最多的那个标志值。

1、众数M0(三)位置平均数

M0M0M0M0M0若有两个次数相等的众数,则称复众数。①只有总体单位数比较多,而且又有明显的集中趋势时才存在众数。下三图无众数:②在单位数很少,或单位数虽多但无明显集中趋势时,计算众数是没有意义的。众数特征:1)从数从位置的角度反映总体平均水平,一般用于名义数据和顺序数据痪料集中趋势的说明。2)一组数据中的众数可能有多个,也可能不存在3)众数不受个别数据的影响,常在数据缺陷较大或大致估计的情况中。①根据单项数列确定众数;众数M0=192.众数的计算方法例表某高校统计学专业年龄分布年龄频数向上累计频数向下累计频数1733861858831960687820128018215856221861合计86

②根据组距数列确定众数(ⅱ)利用比例插值法推算众数的近似值。(ⅰ)

由最多次数来确定众数所在组;表20个锻炼者每月跑步长度组组中值(Xi)频数(Fi)XiFi5.5~10.510.5~15.515.5~20.520.5~25.525.5~30.530.5~35.535.5~40.581318232833381235432226541151129976合计—20490按日产量分组(千克)工人人数(人)60以下1060-701970-805080-903690-10027100-11014110以上8表中70-80,即众数所在组。例计算众数的近似值:下限公式:上限公式:由下限公式,日产量众数由上限公式,日产量众数△众数的特点

众数是一个位置平均数,它只考虑总体分布中最频繁出现的变量值,而不受各单位标志值的影响,从而增强了对变量数列一般水平的代表性。不受极端值和开口组数列的影响。

众数是一个不容易确定的平均指标,当分布数列没有明显的集中趋势而趋均匀分布时,则无众数可言;当变量数列是不等距分组时,众数的位置也不好确定。①由未分组资料确定中位数2)中位数的计算方法1)概念:将总体中各单位标志值按大小顺序排列,居于中间位置的那个标志值就是中位数。2、中位数Me⑴n为奇数时,则居于中间位置的那个标志值

就是中位数。例⑵n为偶数时,则中间位置的两个标志值的算术

平均数为中位数。②由单项数列确定中位数某企业按日产零件分组如下:按日产零件分组(件)工人数(人)较小制累计较大制累计26338031101377321427673427545336187226418808合计80--例③由组距数列确定中位数

按日产量分组(千克)工人数(人)较小制累计较大制累计50–60101016460–70192915470–80507913580–90361158590–1002714249100-1101415622110以上81648合计164--下限公式(较小制累计时用):上限公式(较大制累计时用):①中位数不受极端值及开口组的影响,具有稳健性。②各单位标志值与中位数离差的绝对值之和是个最小值。③对某些不具有数学特点或不能用数字测定的现象,可用中位数求其一般水平。3.中位数的特点(1)三者的关系表示为:(四)相关统计指标比较例(2)算术平均数与强度相对数比较1、指标含义不同,强度相对数说明的是某一现象发展的强度、密度或普遍程度有正指标和逆指标之分;而平均指标说明的是现象发展的一般水平2、计算方法不同。强度相对数分子分母的联系,只表现为一种经济关系,且分子分母可以互换,而平均指标是在一个同质的总体内标志总量单位和单位总量的比例关系,分子是分母的一部分,且不能互换3、计量单位的不同,强度相对指标一般由对比双方原有的计量单位构成;平均数计量单位则与标志值指标计量单位相同f如图:3三者的关系1.当总体分布呈对称状态时,三者合而为一,如图:fX2.

当总体分布呈非对称状态时如图:fX所以如果,则说明分布右偏(或上偏)如果,则说明分布左偏(或下偏)如果,则说明分布对称一组工人的月收入众数为700元,月收入的算术平均数为1000元,则月收入的中位数近似值是:例根据卡尔·皮尔逊经验公式,还可以推算出:1.平均指标只能适用于同质总体。2.用组平均数补充说明总平均数。平均指标的运用原则

某生产小组基期有工人15人,报告期人数增加到30人,两时期各技术等级的工人数和工资总额如下:级别基期报告期工人数(人)比重(%)工资总额(元)平均工资(元)工人数(人)比重(%)工资总额(元)平均工资(元)二级工213.310005001653.39600600四级工853.372009001033.3100001000七级工533.475001500413.468001700合计15100.015700104730100.026400880例某工业部门100个企业年度利润计划完成程度资料如下:按计划完成程度分组(%)企业数85-89.9290-94.9895-99.910100-104.940105-109.930110-114.910合计100经计算,100个企业年度平均利润计划完成程度为103.35%。3.用分配数列补充说明平均数例①标志变异指标是评价平均数代表性的依据。四标志变异指标2.作用:1.概念:标志变异指标是反映总体各单位标志值差程度的指标,又称离散度指标。一、标志变异指标的意义、作用和种类

甲、乙两班学生统计学考试成绩列表例成绩分组

甲班乙班10——200020——301030——402040——501150——602260——705970——8081580——90211590——10053合计4545分析:甲、乙两班学生的平均成绩均为76分,集中趋势一样,但是他们各班成绩偏离平均数的程度却不一样。甲班学生成绩较分散,离散程度大,平均成绩的代表性差;乙班学生成绩数据分布较集中,离散程度小,平均成绩的代表性就大。②标志变异指标可用来反映社会生产和其他社会经济活动过程的均衡性或协调性,以及产品质量的稳定程度。

供货计划完成百分比(%)季度总供货计划执行结果一月二月三月钢厂甲100323434乙100203050例3.种类即测定标志变异指标的方法,主要有:全距、平均差、标准差、离散系数等。

极差 R平均差 A.D.标准差 S.D.(σ)变异系数 Vσ四分位差Q①优点:计算方便,易于理解。②缺点:全距只考虑数列两端数值差异,它是测定标志变动度的一种粗略方法,不能全面反映总体各单位标志的变异程度。1.全距是总体各单位标志值最大值和最小值之差,2.全距的特点(一)极差R

平均差是数列中各单位标志值与平均数之间绝对离差的平均数。1.概念和计算:三、平均差A.D.以某车间100个工人按日产量编成变量数列的资料:工人按日产量分组(千克)工人数(人)f组中值XXf20-30525125-178530-4035351225-724540-5045452025313550-60155582513195合计100-4200-660例①平均差是根据全部标志值与平均数离差而计算出的变异指标,能全面反映标志值的差异程度;②平均差计算有绝对值符号,不适合代数方法的演算使其应用受到限制。2.平均差的特点1.离散程度的测度值之一2.各变量值与其均值离差绝对值的平均数3.能全面反映一组数据的离散程度4.数学性质较差,实际中应用较少

标准差是离差平方平均数的平方根,故又称“均方差”。其意义与平均差基本相同。1.概念与计算公式:四、标准差S.D.(σ)1. 离散程度的测度值之一2. 最常用的测度值3. 反映了数据的分布反映了各变量值与均值的平均差异根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差4681012X=8.3工人按日产量分组(千克)工人数(人)f组中值X50-601055-27.627628.64460-701965-17.625898.823670-805075-7.622903.918480-9036852.38203.918490-100279512.384138.1388100-1101410522.387012.1016110以上811532.388387.7152合计164--36172.5616例未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式总体方差和标准差

(计算公式)表

某车间50名工人日加工零件标准差计算表按零件数分组组中值(Xi)频数(Fi)(Xi-X)2(Xi-X)2Fi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064246.49114.4932.490.4918.4986.49204.49739.47572.45259.926.86184.90518.94817.96合计—50—3100.5【例】根据表中的数据,计算工人日加工零件数的标准差未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式注意:样本方差用自由度n-1去除!样本方差和标准差

(计算公式)一组数据中可以自由取值的数据的个数当样本数据的个数为n

时,若样本均值x确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值例如,样本有3个数值,即x1=2,x2=4,x3=9,则x=5。当x

=5

确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值样本方差用自由度去除,其原因可从多方面来解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差σ2时,它是σ2的无偏估计量

自由度(degreeoffreedom)样本方差总体方差方差

(简化计算公式)方差

(数学性质)各变量值对均值的方差小于对任意值的方差设X0为不等于X的任意数,D2为对X0的方差,则标准化值

(概念要点和计算公式)1.也称标准分数2. 给出某一个值在一组数据中的相对位置3. 可用于判断一组数据是否有离群点4. 用于对变量的标准化处理5.计算公式为2.交替标志的标准差

在社会经济统计中,有时把社会经济现象的总体单位,分为具有某种标志的单位和不具有这种标志的单位两组。统计中,用“是”、“否”或“有”、“无”来表示的标志,称为交替标志,也称是非标志。N:N1,N2N1是具有某种标志的单位数N1=PN2是不具有这种标志的单位数N2=1-P具有某种标志——变量为1不具有这种标志——变量为0XfXf1N1(P)P1-p(1-P)2P(1-P)20N2(1-p)0-pP2(1-P)P2合计1P--P(1-P)2+P2(1-P)①σ与R的关系②σ与A.D.的关系

经验表明,当分布数列接近于正态分布时,R和σ之间存在以下经验公式:R为4至6个σ:当标志值项数较少时,R≈4σ

当标志值项数较多时,R≈6σ

对同一资料,所求的平均差一般比标准差要小,即A.D.≤σ3.标准差与全距、平均差的关系

变异系数,是各种变异指标与平均数的比率。反映总体各单位标志值的相对离散程度,最常用的是标准差系数。(四)变异系数Vσ1. 标准差与其相应的均值之比2. 消除了数据水平高低和计量单位的影响3. 测度了数据的相对离散程度4. 用于对不同组别数据离散程度的比较5.计算公式为表

某管理局所属8家企业的产品销售数据企业编号产品销售额(万元)X1销售利润(万元)X21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度X1=536.25(万元)S1=309.19(万元)V1=536.25309.19=0.577S2=23.09(万元)V2=32.521523.09=0.710X2=32.5215(万元)结论:计算结果表明,V1<V2,说明产品销售额的离散程度小于销售利润的离散程度例(五)四分位差1. 离散程度的测度值之一2.也称为内距或四分间距3.上四分位数与下四分位数之差

QD=QU-QL4.反映了中间50%数据的离散程度不受极端值的影响,用于衡量中位数的代表性【例】根据表中的数据,计算甲城市家庭对住房满意状况评价的四分位差解:设非常不满意为1,不满意为2,一般为3,满意为4,非常满意为5已知QL=不满意=2,

QU=

一般=

3四分位差:

QD=QU=

QL

=3–2

=1表

甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数

非常不满意

不满意

一般

满意

非常满意2410893453024132225270300合计300—五、偏度与峰度1. 数据分布偏斜程度的测度2. 偏态系数=0为对称分布3. 偏态系数>0为右偏分布4. 偏态系数<0为左偏分布5.计算公式为偏度,数据分布偏斜方向和程度的度量,是非对称程度的数字特征。计算方法:1、算术平均数与众数比较法偏度为负意味着在概率密度函数左侧的尾部比右侧的长,绝大多数的值位于平均值的右侧;偏度为正就意味着在概率密度函数右侧的尾部比左侧的长,绝大多数的值位于平均值的左侧;偏度为零,表示数值相对均匀地分布在平均值的两侧,但不一定是对称分布。矩方法矩:表示数列中各变量值xi对特定值(c)的k(k=1,2,3,4……)次方的算术平均数,称为变量x关于特定值c的k阶矩。偏态左偏分布右偏分布【例】已知1997年我国农村居民家庭按纯收入分组的有关数据如表4.9。试计算偏态系数表1997年农村居民家庭纯收入数据按纯收入分组(元)户数比重(%)500以下500~10001000~15001500~20002000~25002500~30003000~35003500~40004000~45004500~50005000以上2.2812.4520.3519.5214.9310.356.564.132.681.814.94户数比重(%)252015105农村居民家庭村收入数据的直方图偏态

(从直方图上观察)按纯收入分组(元)1000500←15002000250030003500400045005000→结论:1.为右偏分布

2.峰度适中偏态系数

(计算过程)表

农村居民家庭纯收入数据偏态及峰度计算表按纯收入分组(百元)组中值Xi户数比重(%)Fi(Xi-X)Fi3(Xi-X)Fi45以下5—1010—1515—2020—2525—3030—3535—4040—4545—5050以上2.57.512.517.522.527.532.537.542.547.552.52.2812.4520.3519.5214.9310.356.564.132.681.814.94-154.64-336.46-144.87-11.840.1823.1689.02171.43250.72320.741481.812927.154686.511293.5346.520.20140.60985.492755.005282.948361.9846041.33合计—1001689.2572521.25偏态系数根据上表数据计算得将计算结果代入公式得结论:偏态系数为正值,而且数值较大,说明农村居民家庭纯收入的分布为右偏分布,即收入较少的家庭占据多数,而收入较高的家庭则占少数,而且偏斜的程度较大

峰度:是指次数分布曲线顶峰的尖平程度,是次数分布的又一重要特征。峰度测定,一般是采用统矩的方法,即以四阶中心矩M4为测定依据,将除以其标准差的四次方,以消除单位量纲的影响,便于不同次数分布曲线的峰度比较,从而得到以无名数表示的相对数,即为峰度的测定值。峰度1. 数据分布扁平程度的测度2. 峰度系数=3扁平程度适中3. 偏态系数<3为扁平分布4. 偏态系数>3为尖峰分布5、偏态系数=1.8时,分布曲线呈水平矩形分布,偏态系数<1.8为次数分布曲线趋向“U”形分布6.计算公式为扁平分布尖峰分布与标准正态分布比较!代入公式得

【例】根据上表中的计算结果,计算农村居民家庭纯收入分布的峰度系数

结论:由于=3.4>3,说明我国农村居民家庭纯收入的分布为尖峰分布,说明低收入家庭占有较大的比重

峰度系数本章小结1、统计指标可分为三大类:总量指标;相对指标;平均指标;变异指标2、总量指标:是反映现象在一定时间、地点、条件下的总体规模或水平的一类指标,它以绝对数的形式出现,是计算相对指标和平均指标的基础。按其反映的内容可分为:总体单位总量和总体标志总量;按其反映的时间分为:时期指标和时点指标;按其采用的计量单位不同分为:实物指标、价值指标和劳动量指标3、相对指标:是由两个有联系的指标对比而成的,它能揭示总体内部的结构、比例、比重等数量关系,确定相关事物之间的数量联系程度。表现形式有两种:有名数和无名数;常用的相对指标有:结构相对指标;比例相对指标;比较相对指标;强度相对指标、计划完成相对指标和动相对指标;4、平均指标:说明同质总体内某一数量标志在具体时间、地点、条件下达到的一般水平的综合指标;常用的有数值平均数和位置平均数,数值平均数有算术平均数;调和平均数;几何平均数;位位置平均数有中位数和众数5、变异指标:反映数据分布的离散趋势,是与平均指标相匹配的重要的特征指标指标有:全距、平均差、标准差和离散系数。课堂练习一、判断题部分1.同一个总体,时期指标值的大小与时期长短成正比,时点指标值的大小与时点间隔成反比。(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论