第四章 数据分布特征的描述_第1页
第四章 数据分布特征的描述_第2页
第四章 数据分布特征的描述_第3页
第四章 数据分布特征的描述_第4页
第四章 数据分布特征的描述_第5页
已阅读5页,还剩151页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章数据分布特征的描述通过本章学习,掌握各种指标的分类及计算,特别是平均指标与变异度指标的计算,能运用所学的计算方法分析具体问题。

教学目的与要求:2005年全国1%人口抽样调查主要数据公报

2005年11月1日零时,全国31个省、自治区、直辖市和现役军人的总人口为130628万人,与2000年11月1日零时第五次全国人口普查的总人口126583万人相比,增加了4045万人,增长3.2%;年平均增加809万人,年平均增长0.63%。根据调查数据推算,2005年年末总人口为130756万人。全国人口中,男性为67309万人,占总人口的51.53%;女性为63319万人,占总人口的48.47%。性别比(以女性为100,男性对女性的比例)为106.30,与第五次全国人口普查相比下降0.44。全国人口中,0-14岁的人口为26478万人,占总人口的20.27%;15-59岁的人口为89742万人,占总人口的68.70%;60岁及以上的人口为14408万人,占总人口的11.03%(其中,65岁及以上的人口为10045万人,占总人口的7.69%)。与第五次全国人口普查相比,0-14岁人口的比重下降了2.62个百分点,60岁及以上人口的比重上升了0.76个百分点(其中,65岁及以上人口比重上升了0.73个百分点)。

讨论:以上诸多指标中,哪些是总量指标?哪些是相对指标?指出他们分别属于什么相对指标。并对这些指标进行初步的分析。

1、人口继续保持低速增长,年平均增长0.63%。。2、男女性别比例失调的状况得到了有效遏制,并进一步趋向合理。农村的“养儿防老,重男轻女”的传统生育观念尚未得到根本的转变。3、老龄化社会特征明显

——按照国际通行定义,60岁及以上人口超过10%或65岁及以上人口超过7%的国家或地区,被称为老龄化社会的国家或地区。进入老龄化社会,反映了我国经济社会的进步,医疗卫生条件的改善,出生率和死亡率的下降,平均预期寿命的提高……但与此同时,老龄化社会也会给我国经济社会带来一些重大影响。我国应大力发展社会经济,建立健全和完善社会保障体系、养老保障体系,积极应对日益突出的老龄化问题。对这些指标的初步分析:第一节总量指标一、总量指标的概念与作用

1、概念:指反映社会经济现象在一定的时间、地点条件下达到的的总规模或工作总量的综合指标。2、作用:它是对社会经济现象认识的起点。是编制计划、实行经营管理的重要依据。是计算相对指标和平均指标的基础。计量单位自然单位:头、辆、人

复合单位:台/千瓦、千瓦小时人/平方公里标准实物单位:实物单位货币单位劳动量单位度量衡单位:米、公斤、吨二、总量指标的计量单位三、总量指标的种类(一)按其所反映的内容不同分1、总体总量:反映总体中单位数多少。如:一个企业的职工人数,一个地区的企业个数2、标志总量:反映总体各单位某一数量标志值总和。如:企业全部职工的工资总额,一个地区的工业总产值(二)按其所反映的时间状况不同分1、时期指标:反映现象在某一段时期内的总量。2、时点指标:反映现象在某一时刻上的总量。

▲两者区别:①时期指标可累计,具有可加性,时点指标是间断的,只能间断计数;②时期指标的大小与时期长短有关,时点指标与时点间隔长短无直接关系;③时期指标需连续登记取得,时点指标只能在某一时刻取得。单位名称企业数(个)职工人数(人)固定资产增加额(万元)工业增加值(万元)纺织局化工局机械局300250450

800050007000

100020002000

200500300合计

100020000

5000

1000通过下表:1、区分总体单位总量与总体标志总量;

2、区分时期指标与时点指标。总体标志总量时点指标时期指标总体单位总量(三)按所采用计量单位的不同

1、实物指标:以实物单位计量的总量指标

2、价值指标:以货币单位计量的总量指标

3、劳动量指标:以劳动单位计量的总量指标如:工日、工时等劳动时间1、计算总量指标必须对指标的含义、范围做严格的确定。2、计算实物总量指标时,要注意现象的同类性。3、计算总量指标要有统一的计量单位。四、计算和应用总量指标的原则选择题:1、下列统计指标属于时期指标的是()。

A、工业总产值B、粮食产量C、电脑销售量D、企业职工人数E、旅游入境人数2、下列指标属于时点指标的有()。A、某地区企业个数B、某地区人口死亡数C、某城市在校学生数D、居民银行存款余额E、某农场每年拖拉机台数

3、“商品库存额”属于()。A、总量指标B、时期指标C、时点指标D、相对指标E、数量指标

第二节相对指标一、相对指标的概念1、概念:两个有联系的指标进行对比的比值。2、作用:(1)具体说明现象之间的数量关系;(2)使不能直接对比的绝对数变成可对比。

二、相对指标的表现形式(一)有名数:有具体计量单位的数值。(二)无名数:抽象化的数值。

1、系数和倍数:基数化为1

(当分子、分母相差不大时常用系数表示,当分子比分母数值大1倍以上时常用倍数表示)

2、成数:对比的基数化为103、百分数:基数化为1004、千分数:基数化为1000

三、相对指标的种类及计算

(一)计划完成相对指标1、基本公式

2、短期计划的检查(1)计划任务数为绝对数

例:某企业计划规定本年度销售收入达到1000万元,实际为950万元,计划完成相对指标为:

(2)计划任务数为平均数

例:某企业计划某种产品单位成本为50元,实际为

45元,计划完成相对指标为:注意:在分析计划完成情况时,要注意计划任务数的性质差异。若计划数是以下限规定的(越大越好的指标),如产值、利润等,其计划完成相对数大于100%为超额完成计划;若计划数是以上限规定的(越小越好的指标),如产品成本、原材料消耗量等,其计划完成相对数小于100%为超额完成计划。(3)计划数为相对数

某企业计划劳动生产率今年比去年提高10%,实际提高了15%。计划完成相对指标为:某企业计划某种产品成本今年比去年降低5%,实际降低了6%。计划完成相对指标为:计划执行进度的计算公式:

某公司2002年计划实现工业增加值160万元,第一、第二季度分别实现工业增加值42万元和44万元。则计划执行进度=(42+44)÷160×100%=53.75%例:某企业生产某种产品产量计划完成情况如下:单位(吨)2、检查累计至二月份的产量计划完成情况。月份计划产量实际产量

一二三180018001800122517202665合计

540056101、计算各月和一季度产量计划完成相对指标。计划完成程度(%)

68.0695.56148.06

103.89(计算结果见上表)

中长期计划的检查累计法水平法五年计划规定全期任务规定期末任务3、中长期计划完成相对数

——当计划任务是以计划期期末(最后一年)应达到的水平下达的,检查计划执行情况用水平法。

确定提前完成计划的时间:

——如果计划期内有连续一年的实际数,达到计划规定最后一年应达到的水平,后面所余的时间就是提前完成计划的时间。公式:P51(1)水平法:例:甲企业某五年计划规定,A产品产量在计划期最后一年应达到200万吨,实际执行结果如下:万吨试计算该企业产量计划完成相对数和提前完成计划时间。时间第1年第2年第3年第4年第5年上半年下半年一季二季三季四季一季二季三季四季产量11012266743738424953586572

提前完成计划的时间

(2)累计法

——当计划任务是以计划期全期累计应达到的水平下达的,检查计划执行情况用累计法。

确定提前完成计划的时间:

——从计划期开始至某一时间所累计完成的实际数达到了计划规定的累计数,以后的时间就是提前完成计划的时间。公式:P52

恩格尔系数食物支出总额消费支出总额(二)结构相对指标注意:组或各部分占总体的比重之和,必须为1或100%国内生产总值构成与从业人员构成(国内生产总值=100)

年份国内生产总值(亿元)国内生产总值构成(%)年底从业人员(万人)从业人员构成(%)第一产业第二产业第三产业第一产业第二产业第三产业199626651.921.843.934.36555458.821.719.8199734560.519.947.432.76637356.422.421.2199846670.020.247.931.96719954.322.723.0199957494.920.548.830.76794752.223.024.8200066850.520.449.530.16885050.523.526.0200173142.719.150.030.96960049.923.726.4200276967.118.649.332.16995749.823.526.7200380729.817.348.732.97058650.123.026.9我国男女(0至4岁)性比例120.72:100

我国男女(5至9岁)性比例123.05:100

我国男女性比例106.74:100

例如:某年北京市工业总产值为708.97亿元,上海市工业总产值为1515.35亿元,则上海市工业总产值为北京的2.14倍(即1515.35÷708.97)。

★比例相对指标和比较相对指标的区别是:⑴子项与母项的内容不同----比例相对指标是同一总体内,不同组成部分的指标数值的对比;比较相对指标是同一时间同类指标在空间上的对比。⑵说明问题不同----比例相对指标说明总体内部的比例关系;比较相对指标说明现象发展的不均衡程度。比较相对指标是不同单位的同类指标对比而确定的相对数,用以说明同类现象在同一时期内各单位发展的不平衡程度。例如:某企业2005年上半年实现利润1200万元,2006

年上半年实现利润1360万元,则动态相对数=1360/1200×100%=113.33%(六)强度相对指标

1、基本公式强度相对指标如:人口出生率人口密度

12.9‰肇庆是2005年末:247人/平方公里全国2006年:136人/平方公里计量单位有两种表示形式:(1)复名数:如“人/平方公里,元/人”等例:某地区2003年末土地面积为36万平方公里,年末人口数为1158万人,则人口密度约为

1158/36=32人/平方公里(2)无名数:一般用千分数、百分数表示,如人口出生率、流通费用率等

2、指标形式——有些强度相对指标分子、分母可以互换位置(1)正指标:指标数值的大小与现象的强度、密度和普遍程度成正方向。例:某地区2004年末人口数为100万人,年末拥有商业网点1200个,则商业网点密度=1200/1000000=12个/万人(2)逆指标:指标数值的大小与现象的强度、密度和普遍程度成反方向。商业网点密度=1000000/1200=833人/个练习:想一想可以计算哪几种相对指标?根据第五次人口普查调整数

1990年

2000年人口总数其中:男女

1133685849554873

1265836535561228单位:万人又知我国国土面积为960万平方公里。结构相对指标比例相对指标比较相对指标强度相对指标动态相对指标√√√√×计划完成相对数×六种相对数指标的比较不同时期比较动态相对数强度相对数不同现象比较不同总体比较比较相对数同一总体中部分与部分比较部分与总体比较实际与计划比较比例相对数结构相对数计划完成相对数同一时期比较同类现象比较课堂练习判断题:1、同一个总体,时期指标值的大小与时期长短成正比,时点指标值的大小与时点间隔成反比。()2、全国粮食总产量与全国人口对比计算的人均粮食产量是平均指标。()

3、同一总体的一部分数值与另一部分数值对比得到的相对指标是比较相对指标。()4、某企业生产某种产品的单位成本,计划在上年的基础上降低2%,实际降低了3%,则该企业差一个百分点没有完成计划任务。()5、甲企业工人劳动生产率是乙企业的一倍,这是比较相对指标。()

选择题:1、下列统计指标属于总量指标的是()。

A、工资总额B、商业网点密度C、商品库存量D、人均国民生产总值E、进出口总额2、某厂2006年完成产值2000万元,2007年计划增长10%,实际完成2310万元,超额完成计划( )。

A、5.5% B、5% C、115.5%D、15.5%3、下列指标中的结构相对指标是()。

A、国有制企业职工占总数的比重

B、某工业产品产量比上年增长的百分比C、大学生占全部学生的比重

D、中间投入占总产出的比重E、某年人均消费额4、下列指标属于相对指标的是()。

A、某地区平均每人生活费245元

B、某地区人口出生率14.3%

C、某地区粮食总产量4000万吨

D、某产品产量计划完成程度为113%E、某地区人口自然增长率11.5‰

5、下列指标中强度相对指标是()。

A、人口密度

B、平均每人占有粮食产量

C、人口自然增长率

D、人均每国内生产总值

E、生产工人劳动生产率练习:1.某企业2007年某种产品单位成本为800元,2008年计划规定比2007年下降8%,实际下降6%。企业2008年产品销售量计划为上年的108%,2007~2008年动态相对指标为114%,试确定:⑴该种产品2008年单位成本计划数与实际数。⑵2008年单位产品成本计划完成程度。⑶2008年单位产品成本实际比计划多或少降低的百分点。⑷2008年产品销售计划完成程度。解:以2007年的产品单位成本为基数,根据2008年的计划百分比和实际完成百分比可以计算出:⑴2008年计划单位产品成本800×(100%-8%)=736(元)实际单位产品成本800×(100%-6%)=752(元)⑵单位产品成本计划完成程度相对数或⑶2008年实际比计划少降低6%-8%=-2%即2个百分点

⑷2008年产品销售计划完成程度设2007年销售量为a,依题意则2008年的计划销售量为a×108%,

2008年的实际销售量为a×114%,所以2008年产品销售计划完成程度=(a×114%)÷(a×108%)=114%÷108%=105.56%

2.假定某产品按五年计划规定,最末一年产量应达到50万吨,实际产量如下表,检查长期计划完成情况及提前完成的时间。单位:万吨13.5+12.5+12.5+13=51.5(万吨)从第四年的第二季度起到第五年的一季度止,实际产量已达到计划规定的50万吨,即12+12.5+13+13.5=51(万吨),所以提前完成任务的天数为(20-17)×90+1/(13.5-11)/90=270+36=306(天)

51.5×100%=103%50时间第一年第二年第三年第四年第五年上下一二三四一二三四产量44452224111212.51313.512.512.513提前完成任务的时间:长期计划完成程度=解:计划末期实际产量=3.某企业三个车间生产同种产品,2002年上半年有关生产资料如下:要求:(1)计算该企业产品计划完成百分比;

(2)计算该企业产品的实际优质品率。车间实际产量(台)完成计划(%)实际优质品率(%)甲乙丙15001800220012010080939596案例引入

在正常的市场经济环境下,投资的高收益总是伴随着高风险。所以,投资理财专家总是在提醒人们:不仅要看到收益率的高低,还要注意到风险的大小。某投资者为了比较不同类型投资基金的收益率水平,收集了30只投资基金某年的收益率数据如下:30只投资基金某年的收益率表

偏债券型(%)中间型(%)偏股票型(%)6.36.05.28.17.53.94.85.910.86.99.87.211.52.34.18.77.47.38.113.918.75.1-1.89.68.47.612.010.514.311.4思考与讨论1、如何比较三种类型投资基金的收益率高低?试计算出有关指标的数值。2、各种类型投资基金的风险大小如何度量?3、哪类投资基金收益率的波动较大?试计算出有关指标的数值来具体说明,并可得出什么结论?4、对于一个稳健型的投资者,你会建议他购买哪种类型的投资基金,为什么?

第三节平均指标一、平均指标的概念、特点和作用

1、概念:各总体单位某一标志值在一定时间、地点、条件下所达到的一般水平。(平均指标反映同类现象的一般水平,是总体内各单位参差不齐的标志值的代表值,也是对变量分布集中趋势的测定。)数据集中区变量x2、平均指标的特点

(1)同质性(2)代表性(3)抽象性

3、平均数的作用

(1)可以比较不同空间同一事物一般水平的差异

——消除了总体数量差异使其具有可比性(2)反映总体不同时期的发展变化规律(3)分析研究现象之间的依存关系(4)可以推算和预测

时间状况---静态平均数和动态平均数计算方法---数值平均数和位置平均数数值平均数算术平均数调和平均数几何平均数众数中位数二、平均指标的种类三、算术平均数(一)算术平均数的基本计算公式例如,

注意:强度相对指标与平均指标的区别(1)指标的含义不同。强度相对指标说明的是某一现象在另一现象中发展的强度、密度或普遍程度;而平均指标说明的是现象发展的一般水平。(2)计算方法不同。两者虽然都是两个有联系的总量指标之比,但是,强度相对指标分子与分母的联系,只表现为一种经济关系,它的分子、分母可以互换。而平均指标是在一个同质总体内标志总量和单位总量的比例关系,分子与分母的联系是一种内在的联系,即分子是分母(总体单位)所具有的标志,有一一对应的关系,对比结果是对总体各单位某一标志值的平均。

(二)简单算术平均数举例:5名学生的学习成绩分别为:75、91、64、

53、82,则平均成绩为:

计算公式:应用条件:资料未分组,各组出现的次数都是1。

——资料已经分组

1、根据单项数列计算应用条件:单项式分组,各组次数不同。(三)加权算术平均数计算公式:标志值权数举例:某车间20名工人加工某种零件资料:

平均日产量

按日产量分组(件)x工人数(人)f日产总量

xf14151617182485128601288518

合计

203192、根据组距数列计算应用条件:组距式分组,各组次数不同。用各组的组中值代替各组平均数。注意:计算出来的加权算术平均数是一个近似值。举例:某车间200名工人日产量资料:按日产量分组(公斤)工人数

f组中值

x日产总量xf20—3030—4040—5050—601070903025354555250245041501650合计

200

—84003、由比重权数计算应用条件:已知的是比重权数(次数是比重)公式:按日产量分组(公斤)人数比重(%)组中值x20—3030—4040—5050—60

535451525354555例:两个班组工人生产资料如下:根据资料分别计算两个班组工人的平均日产量。

一班二班日产量工人数比重日产量工人数比重(件)(人)(%)(件)(人)(%)

202102015211521152215752215231523152415241680

合计20100合计20100一班工人平均日产量

二班工人平均日产量

计算得到:=21.9(件)=23.5(件)注意:权数在平均数形成中起的作用权数的选择:

当分组的标志为相对数或平均数时,经常会遇到选择哪一个条件为权数的问题。如下例:计划完成程度企业数计划产值

(%)(个)(万元)

80—9055090—1001080100—110120200110—1203070合计165400某工业局下属各企业按产值计划完成程度分组资料如下,根据资料计算该工业局产值平均计划完成程度。选择权数的原则:1、变量与权数的乘积必须有实际经济意义。2、依据相对数或平均数本身的计算方法来选择权数。根据原则本题应选计划完成产值为权数平均计划完成程度:

简单算数平均数与加权算数平均数的关系

当四、调和平均数(H)

例如:某人买蔬菜,早上是每斤1元,中午是每斤0.8元,傍晚是每斤0.5元,现在他早、午、晚各买1元,问平均每斤的价格?分析:平均价格=总金额÷总重量,现在一共花了3元钱,买到蔬菜的数量分别为:

1/1.00,1/0.8,1/0.5,一共为4.25斤,

于是,平均价格=总金额÷总重量=3/4.25=0.71(元/斤)(一)简单调和平均数——资料未分组,各个变量值次数都是1。计算公式:调和平均数:各单位标志值倒数的算术平均数的

倒数。举例:一个人步行两里,走第一里时速度为每小时

10里,走第二里时为每小时20里,则平均速度为:举例:上列若不是各买1元,而是早上买了5元,中午买了4元,傍晚买了2元,则平均价格的计算为:分析:总共花了5+4+2=11元,买回的蔬菜重量为5/1+4/0.8+2/0.5=14(斤)∴平均价格=11/14=0.79(元/斤)(二)加权调和平均数

——资料经过分组,各组次数不同。计算公式:

权数

例1:按速度分

x行走里程m所需时间201510123

合计6求平均速度。

按月工资分组x工资总额m100020003000500040000030000合计435000

例2工人数m/x520010215求平均工资。例3:某工业局下属各企业按产值计划完成程度分组资料如下,根据资料计算该工业局产值平均计划完成程度:计划完成程度企业数实际产值

(%)(个)(万元)80—9055090—1001080100—110120200110—1203070

合计165400平均计划完成程度=400394=101.52%组中值

(%)x8559958410519011561—394m说明:该工业局实际比计划多完成6万元,超额1.52%

完成产值计划任务。计划产值m价格(元)3.32.52.0合计销售量(斤)34512加权算术平均法求某种商品三种零售价格的平均价格加权调和平均法价格(元)3.32.52.0合计销售额(元)10101030加权算术平均数求某种商品三种零售价格的平均价格加权调和平均数★结论:

在统计实务中,调和平均数常常作为算术平均数的变形来使用,它虽然与算术平均数计算方法不同,但其实质是一样的(即)。凡是掌握被平均指标的分母资料时,用加权算术平均法计算平均数。凡是掌握被平均指标的分子资料时,用加权调和平均法计算平均数。

班组平均劳动生产率x产品产量(件)m一二三四五

101215203010002400450060006000合计

—19900练习:某车间各班组工人劳动生产率资料如下表,计算该车间平均劳动生产率。实际工时1002003003002001100

五、几何平均数(G)

车间投入量产出量合格率%x一

二三

1000800720800720504809070例:某企业生产某种产品需经过三个连续作业车间才能完成。

几何平均数:n个变量值连乘积的n次方根。

(适用于对速度、比率等现象计算平均数。)

(一)简单几何平均数计算公式:应用条件:资料未分组(各变量值次数都是1)。

例:某投资者持有的一种股票,2005—2008年的收益率分别为4.5%,2.1%,25.5%,1.9%。计算该投资者四年的平均收益率。平均收益率=108.08%-1=8.08%(二)加权几何平均数计算公式:应用条件:资料经过分组,各组次数不同。举例1:某地区近20年来的经济发展速度如下,计算20年中经济平均发展速度。发展速度(%)x年次f10210510711015104合计20计算过程:举例2:

某人将一笔钱存入银行,存期10年,以复利计息,10年的利率分配是第1年至第2年为5%、第3年至5年为8%、第6年至第8年为10%、第9

年至第10年12%,计算平均年利率。本利率x年数f105%108%110%112%2332合计10平均年利率=108.77%-1=8.77%几何平均数的适用范围:

——当变量值是比率,而且变量值之间存在连乘关系,这时反映现象的一般水平要用几何平均数。六、中位数()

——把总体各单位标志值按大小顺序排列起来,居于中间位置的那个数就是中位数。(一)由未分组资料确定中位数方法:①把资料按大小顺序排列②求中间项次

Om=③确定中位数:

n为奇数时,第Om项对应的标志值

n为偶数时,第Om项两边标志值的平均数1、标志值的个数是奇数例:7名工人生产某种产品,日产量(件)分别为4、6、6、8、9、12、14。中间位置为(7+1)/2=4即位于第四名工人的日产量8件为中位数。2、标志值的个数是偶数上例增加为8名工人,日产量为4、6、6、8、9、12、13、14。由于(8+1)/2=4.5,即中间位置在第四和第五名中间,中位数为(8+9)/2=8.5(二)由分组资料确定中位数

②确定中位数所在组

——按累计次数的方向找出第一个能够容纳的累计次数所对应的组;

方法:①确定中间位置Om=

③确定中位数若为单项式数列,中位数组所对应的标志值;若为组距式数列,用公式计算。

1、由单项数列确定中位数

例:中间位置为80/2=40,中位数组为第三组,则中位数为24。

按日产量分组(件)x工人数(人)f累计次数以下累计以上累计20222426101530251025558080705525合计80——2、由组距数列确定中位数

(1)计算公式某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—(2)【例题】根据表中的数据,计算50名工人日加工零件数的中位数举例年人均纯收入(千元)农户数(户)以下累计次数5以下5—66—77—88—99以上24048011007003201602407201820252028403000合计3000—(1)确定中间位次(2)确定中位数组为

6—7(3)确定中位数七、众数()

——总体中出现次数最多的标志值是众数。1、由未分组资料确定众数例:7名工人日产量(件)为4、5、6、6、6、7、

8。则众数是6。

无众数

原始数据:10591268一个众数

原始数据:6598

55多于一个众数

原始数据:25

2828

36

4242

——次数最多的组对应的变量值例:

按日产量分组(件)工人数(人)20212223153020102、由单项数列确定众数:3、由组距数列确定众数(1)计算公式:某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—(2)【例题】根据表中的数据,计算50名工人日加工零件数的众数课堂练习

1、根据分组资料计算算术平均数,当各组单位数出现的次数均相等时,按加权算数平均数计算的结果与按简单算数平均数计算的结果相同。()

2、权数对算数平均数的影响作用只表现为各组出现次数的多少,与各组次数占总次数的比重无关。()

3、各个变量值与其平均数离差的平方之和等于0。()

4、一组数据中可能存在多个众数。()一、判断题1.计算平均指标最常用的方法和最基本的形式是()。

A.中位数B.众数

C.算术平均数

D.调和平均数2.算术平均数的基本形式是()。

A.同一总体不同部分对比

B.总体的部分数值与总体数值对比

C.总体单位数量标志值之和与总体单位总数对比

D.不同总体两个有联系的指标数值对比3.在加权算术平均数公式中,若各个变量值都扩大3倍,而频数都减少为原来的1/3,则平均数()。

A.不变B.减少了

C.扩大3倍D.不能确定二、选择题

4.影响加权算术平均数的因素有()。A.各组频率或频数B.各组标志值的大小C.各组组距的大小D.各组组数的多少E.各组组限的大小

5.在下列条件下,加权算术平均数等于简单算术平均数()。

A.各组次数相等

B.各组变量值不等

C.变量数列为组距数列

D.各组次数都为1E.各组次数占总次数的比重相等三、计算题

1、某集团公司公司工资资料如下:求公司职工平均工资。月平均工资(元)企业个数(个)职工人数(人)1000元以下1000--14001400--18001800以上31052150020001200800合计205500计算如下:月平均工资(元)组中值(X)职工人数(人)X*f1000元以下1000--14001400--18001800以上8001200160020001500200012008001200000240000019200001600000合计——55007120000

(元)

解释:由于职工平均工资=职工工资总额÷职工人数故应选职工人数作为权数。

某自行车公司下属20个企业,1999年甲种车的单位成本分组资料如下:

试计算该公司1999年甲种自行车的平均单位成本。

单位成本(元/辆)企业数(个)各组产量占总产量的比重(%)200-220220-240240-26051234045152、平均单位成本为:

第四节

变异度指标(一)变异度指标的概念和作用——反映总体各标志值间差异程度的综合指标作用:1、衡量平均数代表性——变异度指标值越大,平均数的代表性越小。2、用来研究现象的稳定性和均衡性3、是统计分析的一个基本指标数据的分散程度是数据分布的另一个重要特征,它所反映的是各变量值远离中心值的程度,因此称为离散趋势。二、变异度指标的计算(一)全距(R)公式:R=最大值—最小值优点:计算简便缺点:易受极端值的影响举例:5名学生的成绩为50、69、76、88、97

则R=97-50=47组距数列的全距R=最高组的上限-最低组的下限全距反映总体标志值的变动范围,其数值越大,平均数代表性越小。(二)四分位差1、定义:四分位数中间两个分位数之差,一般以Q表示。四分位数:将所有总体单位的标志值从小到大顺序排列后分为四个相等部分,处于这四个相等部分分割点位置上的所对应的标志值。通常用Q1,Q2,Q3表示,Q2即为中位数。其中:Q1的位置=(n+1)/4Q2的位置=2(n+1)/4Q3的位置=3(n+1)/42、计算方法:公式:Q=Q3-Q1

例:某车间有12名工人,其日产量按大小顺序依次排列如下:10,20,22,24,25,26,27,28,30,32,34,35,求其四分位差。解:Q1的位置=(n+1)/4=3.25

则Q1=(22+24)÷2=23Q3的位置=3(n+1)/4=9.75

则Q3=(30+32)÷2=31所以,Q=Q3-Q1

=31-23=8(件)3、特点:

——四分位差反映的只是数列中段占总体50%的单位的差异程度,故比全距要小得多。但它不是根据全部标志值计算的,存在与全距类似的缺点。(三)平均差(A.D)应用条件:资料未分组,各变量值出现的次数为1。——总体各单位标志值对其算术平均数的离差绝对值的算术平均数。1、简单平均差公式:计算步骤:(1)计算算术平均数(2)计算离差的绝对值(3)根据公式计算平均差例:甲乙两个班组工人日产量资料如下:

甲班组(件):2528303542

乙班组(件):1824323848要求:计算平均差,比较两个班组工人平均日产量的代表性。结论:平均差越大,其平均数代表性越小。

解:计算平均日产量甲组:x=

n

∑x=

5

160=乙组:x=

n

∑x=

5

160=

32(件)32(件)甲班组:=26÷5=5.2(件)乙班组:=44÷5=8.8(件)

甲班组工人日产量的平均差小于乙班组的∴甲班组工人平均日产量的代表性大于乙班组计算平均差

2、加权平均差应用条件:资料经过分组,各组次数不同。计算公式:计算步骤:(1)计算算术平均数(2)计算离差的绝对值(3)计算绝对值乘以次数(4)根据公式计算平均差按日产量分组(公斤)工人数

f20—3030—4040—5050—6010709030合计

200举例:某车间200名工人日产量资料如下,计算其平均差。

按日产量分组(公斤)工人数f组中值x日产总量xf20—3030—4040—5050—601070903025354555

250245041501650170490270390合计200—84001320平均日产量:计算过程:平均差:3、平均差的优缺点优点:平均差是根据全部数值计算的,受极端值影响较全距小。缺点:由于采取绝对值的方法消除离差的正负号,应用较少。

(四)标准差()和方差标准差:总体各单位标志值与其算术平均数的离差平方的算术平均数的平方根。方差:标准差的平方,用表示。注:方差(σ2)和标准差(σ)是应用最广的变异度指标结论:标准差越大,其平均数代表性越小。应用条件:资料未分组,各组次数都是1。1、简单标准差公式:简单方差计算步骤:①求算术平均数②求离差③求离差平方④求离差平方总和⑤求方差⑥求标准差举例:五名工人的日产量分别是:日产量(件)202223242691019合计202、加权标准差

应用条件:资料经过分组,各组次数不同。举例:前例,日产量(公斤)工人数(f)20—3030—4040—5050—6010709030合计200公式:加权方差

解:已知日产量(公斤)工人数f组中值x20—3030—4040—5050—601070903025354555288034308105070合计200—12190标准差的简捷计算:

——标准差等于各标志值平方的算术平均数减各标志值算术平均数的平方之差的平方根。计算公式:

证明:

日产量(公斤)工人数f组中值x20—3030—4040—5050—60107090302535455562508575018225090750合计200—365000前例,已知计算:(1)已知方差为25,各标志值的平方的平均数为250,求平均数。(2)已知总体标志值的平均数为13,各标志值的平方的平均数为174,求标准差。绝对数形式变异指标的适用条件

——当两个或多个数列的平均水平相等时,衡量平均水平的代表性,用绝对数形式的变异指标。变异度指标值越大,说明变异程度越大,平均水平的代表性越低;反之亦然。思考:一群牛的平均体重是180公斤,标准差是10公斤;一群羊的平均体重是15公斤,标准差是3公斤,能不能说羊的平均体重的代表性高些?为什么?(五)变异度系数——用相对数形式反映各个变量值与其平均数的离差程度,其数值表现为系数或百分数。变异度系数包括:全距系数、平均差系数、标准差系数,使用最多的是标准差系数。其公式为:

例1:甲组日产量(件)为:6065707580

乙组日产量(台)为:257912

甲组标准差:乙组标准差:=7.07=3.41

即:甲组的平均日产量的代表性高于乙组的。组别平均数标准差标准差系数%甲70(件)7.07(件)10.1乙7(台)3.41(台)48.7例题2:已知甲、乙两个班组工人日产资料如下:

甲班乙班日产量工人数日产量工人数(件)(人)(件)(人)

568117101214912147108156134162

合计40合计40要求:比较一下哪个班组工人的平均日产量的代表性高?解题过程如下:

甲班

乙班日产量

工人数

日产量工人数56

8

11

7

101214

9

1214710815

613416

2合计40

合计

40307010880523408816898903247615049097280067630887042016137213505125954甲班:=8.5(件)乙班:=11.9(件)甲班:σ=2.22(件)乙班:σ=2.69(件)1、计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论