统计指标描述与分析课件_第1页
统计指标描述与分析课件_第2页
统计指标描述与分析课件_第3页
统计指标描述与分析课件_第4页
统计指标描述与分析课件_第5页
已阅读5页,还剩249页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章统计指标描述与分析-课件1第四章统计指标描述与分析-课件2第四章统计指标描述与分析-课件3学习内容及要求

理解变量分布三大特征及平均指标、离散指标的意义;熟练掌握各种平均指标的计算方法及其相互之间的关系;熟练掌握各种离散指标的计算方法;掌握偏度和峰度系数的计算方法。学习内容及要求理解变量分布三大特征及4第一节总量指标重点:时期指标与时点指标在含义和计算上的区别带着问题学:1、总量指标有哪些种类?

2、时期指标与时点指标在含义和计算上的区别?一、总量指标的概念及作用

总量指标(绝对数)——反映社会经济现象总体在一定时间、地点条件下的总规模、或绝对水平的指标.是认识社会经济现象的起点;是实现宏观经济调控和企业经营管理基本指标;是计算相对指标、平均指标及统计分析的基础用绝对数形式表示(必须带计量单位)。

第一节总量指标重点:时期指标与时点指标在含义和计算上的区别5二、总量指标的种类

(一)按反映总体的内容(标志)分为:总体总量——即总体单位总量。常用N、f表示

(如:总人数,产品数,企业数)标志总量——即总体各单位标志值总和。常用X

、Xf表示。

(如:工资总额、总成本、利润总额)

(分组或不分组,其符号和算法不同.该组指标在计算平均数时要用。如:劳动生产率、单位产品成本等。)二、总量指标的种类(一)按反映总体的内容(标志)分为:6(2)按反映的时间状况分为:(难点)

时期指标——反映某社会经济现象在一段时期

发展变化的总量。①指标数值可以相加汇总

②数值大小与计算期时间的长短有直接关系,

③指标数值是通过连续登记取得的.

(如:工业总产值、产品总成本、播种面积)时点指标——反映某社会经济现象在某一时刻(瞬间)的状态总量

①指标数值不能直接相加,

②数值大小与时间间隔的长短没有直接关系,

③指标数值是通过定期的一次性登记取得的.

(如:期末商品库存量、在校生人数、土地面积)(该组指标在计算平均发展水平时要用。因为时期、时点指标计算平均发展水平的方法和公式不同,所以,要严格区分和正确判断。如:年均销售额、甲产品库存量占比重、月平均劳动生产率)(2)按反映的时间状况分为:(难点)7时期、

时点指标的区别

(图示)

富乐公司一季度甲商品销售量统计图

吨3002001000

123月一个月(1月份)销售量

二个月(1_2月份)销售量

三个月(1_3月份

)销售量

富乐公司一季度甲商品库存量统计图

吨300200100

0123

一月末(31/1这天)库存量

二月末

(28/2这天)库存量三月末(31/3这天)库存量

。。。。。。时间越短(长),销售量越小(大).

可见,时期指标数值大小与时期的长短密切相关(正相关关系).

1月末是100吨,3月末还是100吨;若3月份将库存全部提完,则3月末的库存量为0.

时间向后推移,库存量并没有随之一定增大.这说明,指标数值大小与间隔时间长短无直接关系.时期、时点指标的区别(图示)富乐公司一季度甲商品销8

(三)按计量单位分为:

1、实物单位(实物量指标)自然单位:如:

人、只、台、件…。用于离散型变量。

度量衡单位:如:

kg、cm、m³…。用于连续型变量。双重(复合)单位:如:

吨公里、千瓦/小时、…标准实物单位:同类产品,因为品种、规格、能力、或化学成分不同,所以按某一标准(含量、规格等)折算后的实物单位。

如:

能源(标煤);粮食(标准吨);电机(马力);化肥(含氮量);

皮革(面积/张)等。(三)按计量单位分为:9②价值量指标(货币单位)用货币为价值尺度来衡量社会财富和劳动成果。(具有最广泛的综合性能和概括能力。)(如:GDP、销售额、工资额等)③劳动量指标(劳动单位)用劳动时间单位来计量。(如:工时、工日、人年等。)可作为确定劳动定额、评价劳动时间利用程度、计算劳动生产率的依据。(机械加工工业企业常用)②价值量指标(货币单位)10第二节相对指标(重点节)重点:各种相对指标的计算方法、联系与区别带着问题学:

1、计划指标是绝对数或相对数时,其计算方法及区别是什么?2、比较相对数与动态相对数的计算方法及区别是什么?

3、强度相对数与算术平均数的区别是什么?第二节相对指标(重点节)11一、相对指数的概念和作用

概念:相对指标(相对数)——两个有联系的统计数据对比的比率,用以表明各种经济现象间的发展程度、结构、强度、比例关系。二、相对指标计量形式(两种):无名数——百分比、千分比、倍数、系数、成数等。

(如:计划完成程度、合格率)有名数——强度相对数是复名数。

(如:人口密度——

人/平方公里)作用:反映现象间的联系及各种数量对比关系;可为某些不能直接对比的数量找到对比基础。

(例:当两规模大小不同的企业的总产值对比时,由于基数不同,不能直接比较,可以用相对指标——产值计划完成程度作比较。)返回一、相对指数的概念和作用返回12▲相对指标的种类和计算原则

(一)计划完成程度相对指标

因为计划完成数有绝对数(平均数);相对数两种形式,

所以,计算方法也分两大类.

a.

计划完成数以绝对数(或平均数)的形式出现,

可直接用基本公式计算计划完成相对指标.

例如:某厂本月销售额计划完成100万元,实际完成120万元,则

~=120/100=120%(注意:计划是….万元,

是绝对数额.)计划完成程度相对指标

=实际完成数计划完成数▲相对指标的种类和计算原则

△(一)计划完成程度相对指标13*b.计划完成数以相对数形式出现

设定上期的实际数为基数1(或100%),本期的计划数或实际数都是与这个(同一)基础进行比较的.

二月份实际增加3%

二月份计划增加2%

一月份实际数1

二月份计划减少2%

二月份实际减少3%

计划完成程度相对指标(注意:计划增减….%,

是相对比率.)*b.计划完成数以相对数形式出现设定上期14

例如:

四川省旅游业2009年计划主营业务收入

收入比上年增加3%,实际增加2%.计划完成程度指标=1+2%1+3%=99.03%

这里的1,就是上年实际完成了的主营业务收入,2019年就是在这个基础上制定计划的.若写成

*也可以表示为2%-3%=-1%2%3%就错了!!

(注意:计划

增加….%,

是相对程度.)例如:

四川省旅游业20015例如:

倘若四川省旅游业2009年计划主营

业务收入比上年减少3%,实际仅减少2%.

即比计划少降了1.03%*也可以表示为:2%-3%=-1%(注意:计划

减少….%,

也是相对程度.)例如:

倘若四川省旅游业2009年计划主营

16补充:计划执行进度检查

例:销售额计划全年4000万元,每季度完成1000万元.

万元

实际1季度完成1050万元,(累计1050)40002季度完成950万元,(累计2000)30003季度完成1080万元,(累计3080)20004季度完成1100万元.(累计4180)100001234季度(计划执行进度如左图)

利用这个公式,可以检查合同的执行情况:

合同完成程度=实际完成合同数/合同数

。。。。。计划完成程度=

累计至本期止实际完成数全期计划数补充:计划执行进度检查例:销售额计划全年4000万元17

※补充:中长期计划完成情况检查累计法——凡计划指标是按计划期内各年的总和,或是按计划全期(如5年)提出累计完成工作量时,则用此法计算。(如:基建投资额、新增生产能力、造林面积等指标的计划完成情况检查。)计算时,只要各年的累计和达到规定数就算完成任务了。

比如,某市“十一五期”基建投资额计划70亿元,第五年第一季度(累计)已达到了70亿元,提前三个季度完成任务。

1234570※补充:中长期计划完成情况检查累计法——凡计划指标是按计划18水平法——计划指标是以计划期末应达到的水平下达的,检查计划完成

情况时,需用此法计算。

以固定的时距(连续12个月或4个季度),逐项(月、季)移动,

其所在时段上的数值和达到了计划规定的水平,则为完成计划任务。

比如,某市“十一五”期粮食产量计划达到70万吨,结果,在第四年第二季度至第五年第一季度这一时段(连续4个季度)的产量已达70

万吨,提前3个季度完成计划。

1234570∑x<70∑x<70∑x<70∑x<70∑x<70∑x<70∑x≥70水平法——计划指标是以计划期末应达到的水平下达的,检查计划完19(二)结构相对指标

——反映总体内部组成及内部结构的综合指标。结构相对指标=总体中各组(或部分)总量总体总量

这里的“总体总量”可以是总体单位总量,也可以是标志总量。如:产品合格率、某种商品销售收入占总销售收入的比重。(二)结构相对指标~——反映总体内部组成及内部结202009年中国男(女)性人口占总人口的比重性别人数(亿人)比重(%)男7.18851.53女合计6.16813.96548.47100.0051.53%+48.47%2009年中国男(女)性人口占总人口的比重性别人数(亿人)比21某市国内生产总值构成及从业人员构成

(国内生产总值、从业人员总数=100%)

年份国内生产总值(万元)国内生产总值构成(%)年底从业人员(万人)从业人员构成(%)第一产业第二产业第三产业第一产业第二产业第三产业2019118328229.243.627.2294.168.314.816.92019157525229.842.327.9302.069.616.114.32019200025827.642.030.3306.769.816.014.22019238482026.642.530.9306.069.615.914.52019275150124.844.231.0307.863.518.717.82019308662622.645.631.8304.156.219.224.62019310522322.642.834.6310.553.919.426.72009317884922.441.336.3304.854.719.725.6某市国内生产总值构成及从业人员构成

(国内生产总值、从业人员22国民经济结构统计

国民经济结构是指一国国民经济中各个领域、各个部门、各个地区和各种经济成份之间的对比关系和结合状况。它包括部门结构、产业结构、地区结构和所有制结构等。国民经济结构统计23(三)比例相对指标比例相对指标=

总体中某一总体中另一部分数值部分数值

反映总体内部的比例关系,可以是多个构成部分连比。

如:2009年中国男女性别比例106.3∶100

某地区农轻重比例20:50:30

分子分母可以换位.

例:

男/女or女/男

106.3:100100:106.3:(三)比例相对指标比例相对指标=总体中某一242009年中国人口性别比例性别人数(亿人)比例(%)男7.188106.3女6.168100106.3100:2009年中国人口性别比例性别人数(亿人)比例(%)男7.125(四)比较相对指标

同类现象同时不同空间横向对比、可以用作竞赛、评比、找差距等.

可以是绝对数、相对数、平均数的对比,但计算口径方法应一致。

甲地区(单位)数值乙地区(单位)数值比较相对指标=

分子分母可以换位.例:甲厂产量/乙厂产量or乙厂产量/甲厂产量

480/380380/480(四)比较相对指标同类现象同时不同空间横向对26(五)动态相对指标(发展速度)

同类现象同空间不同时间纵向对比,可说明现象发展变化的速度,程度和趋势.动态相对指标=报告期指标数值基期指标数值基期:可以是前一期,(称为环比);

可以是最初期,(称为定基对比)。

动态相对指标可以利用总量指标或平均指标去计算.(五)动态相对指标(发展速度)同类现象同空间27基期:是前一期,(称为环比);_____绿线

是最初期,(称为定基对比)._____蓝线基期:是前一期,(称为环比);_____绿线28

(六)强度相对指标

两个性质不同但有联系的总量指标之间对比.用以反映强度,密度,普遍程度.

某种现象总量指标数值另一不同性质的相关现象总量指标数值强度相对指标=分子分母可以换位;计量单位是复名数.

如:人口密度、商业网点密度;人均GDP、人均钢产量;资金利润率;人口出生率。(六)强度相对指标29非劳非物非工非冶钢铁职工钢铁产量总人口与钢产量相比,是强度相对数;钢铁职工与钢产量相比,是算术平均数。

强度相对数与算术平均数的区别(以人均钢产量、钢铁工人劳动生产率为例)非劳非物非工非冶钢铁职工钢铁产量总人口与钢产量相比,是强度相30种类计划完成~结构~比例~比较~动态~强度~意义作用计划完成程度,进度总体内部结构比重总体内部各部分间的比例关系同类事物静态(横向)对比某种现象发展变化的水平,趋势,规律某种现象的密度,强度.普遍程度指标对比的特点同质总体同一时间实际数与计划数比同质总体内部部分与全体比同质总体内部部分与部分比同类事物同时不同空间比同一事物同空间不同时间比不同性质但相关的两个总体总量比计算公式.实际数/计划数.1±实际增减%1±计划增减%部分

全体部分/部分甲:乙:丙甲/乙或乙/甲报告期数基期数某一总体总量另一异性相关总体总量分子分母可否置换否否可可否可计量单位无名数无名数无名数无名数无名数有(复)名数举例本月服装销售量~60/50成本降低~(1-3%)/(1-2%)甲产品合格率90/100农轻重比例

38:29:33男女生比例

2/3或

3/2绵阳成都电子工业产值

60/80

80/60某公司三季度与二季度利润

180/120人口密度1000人

/KM²

或0.001KM²/

人种类计划完成~结构~比例~比较~动态~强度~意义计划完成程度31第三节集中趋势的统计描述重点:组距式数列计算平均指标的方法带着问题学:

1、单项式数列与组距式数列计算加权平均数的方法及区别是什么?

2、算术平均数与调和平均数的区别是什么?

3、位置平均数有哪两种?组距式数列计算众数和中位数的方法是什么?

4、算术平均数、众数、中位数之间的数量关系有哪几种?第三节集中趋势的统计描述32

集中趋势亦称为趋中性,是指变量分布以某一数值为中心的倾向。作为中心的数值就称为中心值,它反映变量分布中心点的位置所在。变量分布的集中趋势要用平均指标来反映。平均指标是将变量的各变量值差异抽象化、以反映变量值一般水平或平均水平的指标,也就是反映变量分布中心值或代表值的指标。平均指标的具体表现称为平均数,平均数因计算方法不同可分为数值平均数和位置平均数两类。▲第三节集中趋势的统计描述(重点节)重点:数值平均数集中趋势亦称为趋中性,是指变量分布33

是同质总体某标志值的一般水平.(与强度相对数有别___两总体,性质不同,总量比总量)反映总体各单位变量分布的集中趋势.(与变异指标有别___反映离中趋势)

(与序时平均数有别___用时间数列计算)

对某类现象作综合分析和评价时,若两者的总量差异过大,则可用平均数去对比。如:甲企业总产值(工资总额)800000元,职工1000人;乙企业总产值(工资总额)8000元,职工8人。总产值(工资总额)比较,差异太大,(800000>8000),甲>乙

但劳动生产率(平均工资)比较,反超。(800<1000).甲<乙

(新就业观:宁做鸡头,不做凤尾)返回是同质总体某标志值的一般水平.返回34作用:1、反映总体各单位变量分布的一般水平。(比如:“农民家庭收入”高低)2、比较同类现象在不同单位、地区、及总体各部分的差别。(比如:用“劳动生产率”或“亩产量”来比较评价不同工业企业或乡村的生产情况。)3、分析现象之间的相互依存关系。(比如:⑴商品销售量与商品价格之间的关系;⑵施肥量与亩产量之间的关系——找到“拐点”。)⑴⑵作用:1、反映总体各单位变量分布的一般水平。35

平均指标按其计算方法不同可分为:数值平均数和位置平均数两类。

数值平均数:算术平均数、几何平均数。

位置平均数:中位数、众数。△数值平均数(重点)

△一、

算术平均数(亦称均值)(重点掌握)算术平均数是变量的所有取值的总和除以变量个数的结果。平均指标按其计算方法不同可分为:36例:平均人数=总人数/企业数劳动生产率=产品产量/职工人数平均工资=工资总额/职工人数单位产品成本=总成本/总产量单耗=原材料消耗总量/产品产量返回例:平均人数=总人数/企业数返回37(一)简单算术平均数___标志未分组时

例:某企业5名工人的产量,计算平均产量

(一)简单算术平均数___标志未分组时例:某企业538△2、加权算术平均数__标志已分组

数量标志已分组,就形成了单项式组距式单项式变量数列(表3-1)组距式变量数列(表3-3)

各组单位数(权数)所占比重的大小,直接影响平均数的大小。将各组人数排列顺序互换,则分布频率变化,平均数也发生相应变化。年出口额(万元)业务员人数(人)比重

(%)300217.143104514.2932061021.4333010635.713405417.86350123.51合计28

100.00108642

300310320330340350出口额人数△2、加权算术平均数__标志已分组数量标志已分组39第四章统计指标描述与分析-课件40权数(次数.一般多指总体单位数)

——权衡轻重(影响平均数的大小)

权数的两种形式——绝对数(次数)常用f表示;

——相对数(比重)常用表示.

计算公式如下:

*这种写法在平均指标指数分析时有独特的意义作用。权数(次数.一般多指总体单位数)

——权衡轻重41两种算法结果相同,都是76.4分。两种算法结果相同,都是76.4分。42

△组距式分组

——各组标志是一个数值区间

表4-2某班学生“统计学原理”成绩表按年龄分组

组中值

x人数(人)

fXf

频率

60以下60__7070__8080__9090__1005565758595

210201531106501500127528542040306

2.213.030.025.55.7合计__50382010076.4

(*各组标志值X以该组的组中值为代表值)△组距式分组——各组标志是一个数值43

根据组距数列计算加权算术平均数的方法的说明假定条件:组内均匀分布或对称分布,组间分布可以不等。X—用各组的组中值(代表组平均水平)开口组的组距以邻组组距为依据,从而计算确定出本组组中值。所以,计算的结果是一个近似值。根据组距数列计算加权算术平均数的方法的说明假定条件:组内44补充:算术平均数的影响因素

算术平均数除受标志值出现次数(比重)的影响外(如前例图示),还受极端值的影响.

图示:

x

300250200150100500

12345678910f即俗话所说的“一颗老鼠屎打坏一锅汤”出现一个最大值,平均数会上移一般正常分布下的平均数出现一个最小值,平均数会下移。。补充:算术平均数的影响因素算术平均数除受标志值出45

补充:先进平均数

(计算各种定额时选用,本章作业第9题要用)

先进平均数(劳动定额)一般平均数

先进平均数(消耗定额)最大数最小数补充:先463.算术平均数的数学性质

1)各变量值与算术平均数的离差之和等于零,即:(对于简单算术平均数)

(对于加权算术平均数)

2)各变量值与算术平均数的离差平方之和为最小值,即:

只有当时,等号成立。3.算术平均数的数学性质47

4.算术平均数的优缺点

算术平均数具有以下几个优点:一是可以利用算术平均数来推算总体标志总量,因为算术平均数与变量值个数之乘积等于总体标志总量;二是由算术平均数的两个数学性质可知,算术平均数在数理上具有无偏性与有效性(方差最小性)的特点,这使得算术平均数在统计推断中得到了极为广泛的应用。三是算术平均数具有良好的代数运算功能,即分组算术平均数的算术平均数等于总体算术平均数。算术平均数也有其局限性,主要表现在以下两个方面:一是算术平均数易受特殊值(特大或特小值)的影响,当变量存在少数几个甚至一个特别大或特别小的变量值时,就会导致算术平均数迅速增大或迅速变小,从而影响对变量值一般水平的代表性;二是根据组距数列计算算术平均数时,由于组中值具有假定性而使得计算结果只是一个近似值,尤其是当组距数列存在开口组时,算术平均数的准确性会更差。4.算术平均数的优缺点48(二)调和平均数

调和平均数__标志值倒数的算术平均数的倒数。故亦称倒数平均数。

根据资料是否分组,而分为简单或加权调和平均数.加权调和平均数使用特定形式的权数(m=xf).

(二)调和平均数49

(二)调和平均数

1.简单调和平均数

当各组的标志总量相等时,所计算的调和平均数称为简单调和平均数。设总体分为k个组,每个组的标志总量都为m,则总体标志总量为km。现仍以x表示各组变量值,以H表示调和平均数,则简单调和平均数的计算公式为:(二)调和平均数50例4.17题:某农贸市场某种蔬菜早市、午市、晚市价格不同,计算该种蔬菜的平均价格。市场价格(元/千克)早市2.6午市2.2晚市2.0例4.17题:某农贸市场某种蔬菜早市、午市、晚市价格不同,计512.加权调和平均数

当各组的标志总量不相等时,所计算的调和平均数要以各组的标志总量为权数,其结果即为加权调和平均数。若以表示各组标志总量(m=xf),则加权调和平均数的计算公式为:2.加权调和平均数52价格(元)

x销售额(元)m=xf2036505800198003400合计29000P95例4.18表4-3:不知道各商品的销售量f的值,但是,可以间接求出。价格(元)销售额(元)205800合计29000P9553※补充:用相对数或平均数计算平均数

(用加权算术平均数求解)

例:某零售公司20家分店销售计划完成情况:计划完成程度(%)组中值(%)

x商店数(个)计划销售额

(万元)f实际销售额(万元)

xf

80—90

85210085.00

90—100

95310599.75100—110

1058480504.00110—120

1154260299.00120—1301253200250.00合计

——

2011451237.75※补充:用相对数或平均数计算平均数

(用加权算术平均数求解)54补充:用相对数或平均数计算平均数

(用加权调和平均数求解)

例:某零售公司20家分店销售计划完成情况:计划完成程度(%)组中值(%)

x商店数(个)计划销售额

(万元)m/x=f实际销售额(万元)

m=xf

80—90

85210085.00

90—100

95310599.75100—110

1058480504.00110—120

1154260299.00120—1301253200250.00合计

——

2011451237.75补充:用相对数或平均数计算平均数

(用加权调和平均数求解)

55第四章统计指标描述与分析-课件56

经验(关键要领):

若要求平均工资、平均单位成本、平均计划完成程度等指标时,所给资料与计算方法的关系为:

当已知权数f(分母)的直接数据资料,而无标志总量时,采用算术平均数.

(比如:已知人数,产品数,企业数、计划数)

当缺乏权数f(分母)的直接数据资料,而有标志总量时,采用调和平均数。

(比如:已知工资总额,成本总额,利润额、实际数)经验(关57算术(调和)平均数一览表是否已知总体单位(分母)的直接数据资料是否对资料(标志)分组

计算公式

书例相互关系算术平均数(已知)简单~(未分)例4.14简单~是加权~的特例,(权数均为1或相等)

加权~(已分)例4.154.16

调和平均数(未知)简单~(未分)例4.17同一事例,用加权算术平均数或加权调和平均数方法计算结果相等

加权~(已分)例4.18算术(调和)平均数一览表是否已知总体单位(分母)的直接数据资58(三)几何平均数

几何平均数通常用在总量等于各分量乘积的情形。比如,求某些平均比率,平均速度等。(三)几何平均数59例:某流水生产线前后衔接的五个车间(工序)产品的合格率分别为96%、94%、95%、95%、96%,求整个流水线生产产品平均合格率(全厂平均合格率)?五个车间(工序)的产品平均合格品率为95.2%.

思考:为什么要用几何平均数计算?例:某流水生产线前后衔接的五个车间(工序)产品的合格率分60例:

某企业10年销售收入的平均发展速度又例:某金融机够以复利方式计息。近12年来的年利率有4年为3%、2年为5%、2年为8%、3年为10%、1年为15%,则12年的平均年利率?例:某企业10年销售收入的平均发展速度又例:某金融机够以复61位置平均数

四、

中位数(Median)

~__是根据变量值的位置来确定的平均数。将变量值按大小顺序排序,处于中间位置的变量值(或数据)即中位数,用表示。由于中位数是位置代表值,所以不会受极端值的影响,具有较高的稳健性。

(下图中,斜线表示总体单位(组)的累计数;

横线表示某现象按标志值的大小排序。)50%

返回sm⊙50%⊙meme标志值累计次数位62中位数位置的确定中位数位置的确定63(1)根据未分组的原始数据确定中位数

①数据是基数项

原始数据:

3328383550

排序:

2833353850

位置: 123 45♂(1)根据未分组的原始数据确定中位数

①数据是基数64②数据是偶数项原始数据:7972668795100

排序:

6672798795100

位置: 123

456♂②数据是偶数项原始数据:79726665其中:L:为中位数组的下限;U:为中位数组的下限∑f:为总次数;Sm-1:为中位数组前一组的向上累计次数;Sm+1:为中位数组前一组的向下累计次数;fm:为中位数组的次数;i:为中位数组的组距。该公式假定中位数组的频数在该组内均匀分布。其中:该公式假定中位数组的频数在该组内均匀分布。66

⑵根据变量分布数列确定中位数

(组距数列确定中位数)

涉及“定组”和“定值”两个步骤.即首先确定出中位数的位置在哪一组;再确定(用公式计算)中位数的值具体是多少。“定组”所使用的次数是累计次数.

方法:计算向上(下)累计次数;确定中位数的位置:

总体单位数刚好包含∑f/2的所在组即是中位数组;确定中位数(用公式):累计次数

⑵根据变量分布数列确定中位数(组距数列确定中位数67①在单项式数列中确定中位数:例4.21确定中位数的位置:累计总体单位数刚好包含∑f/2的所在组(即中位数组)

30/2=15确定中位数:对应的那个(唯一的)标志值就是中位数。

me=800销售额(万元)商店数(个)累计数(个)向上向下300333050069278008172110007241315006306合计30//①在单项式数列中确定中位数:例4.21确定中位数的位68②组距式数列计算中位数例表4.6

企业数和职工人数表(累计数)按职工人数分组(人)企业数(个)累计企业数(个)向上向下0—2005050550200—400110160500400—600130290390600—800140430260800—1000905201201000—12003055030合计550//确定中位数的位置:总体单位数刚好包含∑f/2的所在组(即中位数组)

550/2=275计算中位数:中位数组对应的是一个数据区间,中位数需要通过公式计算才能确定。②组距式数列计算中位数例表4.6按职工人数企业69

中位数具有不受极端变量值的影响的特点,比算术平均数稳健。中位数具有不受极端变量值的影响的特点,703、众数(Mode)

众数是指分组后,总体中出现次数最多或频率最大的变量值(数据),用mo表示。众数也是一种位置平均数,且也不受极端值的影响。变量数列求众数,也涉及“定组”和“定值”两个步骤。单项式数列计算众数时,众数组对应的(唯一的)标志值就是众数。组距数列计算众数时,则需要通过公式才能确定。即首先确定出众数的位置在哪一组,再确定众数的值具体是多少。(用公式计算)

“定组”所使用的次数是本组次数.3、众数(Mode)众数是指分组后,71众数的特点:集中趋势的参考值之一出现次数最多(或频率最大)的变量值不受极端值的影响可能没有众数或有几个众数众数的特点:72众数(众数可能不存在或不唯一)无众数

原始数据:10591268一个众数

原始数据:6

8

1112

88多个众数

原始数据:

6

282832

46464650众数(众数可能不存在或不唯一)无众数

原始数据:1073等距数列计算众数——先确定众数所在组

众数的值与相邻两组频数的分布有关,假定众数组的次数在众数组内是均匀分布的。

相邻两组的次数相等时,众数组的组中值即为众数。相邻两组的次数不相等时,众数计算公式为:等距数列计算众数——先确定众数所在组74其中:

L:是众数所在组的下限;

∆1:是众数所在组次数与前一组的次数差;

∆2:是众数所在组后一组的次数;

i:是众数组的组距;其中:75

根据变量分布数列确定众数

(组距数列确定众数)

涉及“定组”和“定值”两个步骤.即首先确定出众数的位置在哪一组;再确定(用公式计算)众数的值具体是多少。“定组”所使用的次数是本组次数.本组次数

根据变量分布数列确定众数(组距数列确定众数)76①在单项式数列中确定众数:例表4.5确定众数组的位置:总体单位数(次数、频数)最多(即值最大)的组即为众数组。“8”所在组确定众数:对应的那个(唯一的)标志值就是众数。

m0=800销售额(万元)商店数(个)3003500680081000715006合计30①在单项式数列中确定众数:例表4.5确定众数组的位置77②组距式数列计算众数例表4.6

某企业数和职工人数表确定众数组的位置:本组总体单位数(次数、频数)最多(即值最大)的组即为众数组——“140”所在组计算众数:众数组对应的是一个数据区间,众数需要通过公式计算才能确定。按职工人数分组(人)企业数(个)0—20050200—400110400—600130600—800140800—1000901000—120030合计550②组距式数列计算众数例表4.6确定众数组的位78第四章统计指标描述与分析-课件79位置平均数概念与计算方法小结定义资料是否分组(计算条件)计算方法(两步骤)定位(组)定值中位数将标志值按序排列后,位置居中的标志值未分组对应的(唯一的)标志值。已分组单项式中位数组对应的(唯一的)标志值。组距式众数分组后,次数(频数)最多的标志值。已分组单项式本组次数最多(f数值最大)的组众数组对应的(唯一的)标志值。组距式返回位置平均数概念与计算方法小结定义资料是否计算方法(两80(三)算术平均数与中位数、众数的关系:

对称钟形分布情形下:非对称左偏分布情形下:非对称右偏分布情形下:(三)算术平均数与中位数、众数的关系:81

众数、中位数和平均数的关系图

(人像投影)

总体分布:请一名女生做正、侧位头像的投影。飘逸的长发飘向左,即为左偏态;长发飘向右,即为右偏态。平均数()形若蝴蝶结,附着于发稍。中位数始终位于中间,平均数、众数位于两端。

(数轴上的数,位置越靠右,值越大。)xxx左偏态分布右偏态分布正态分布x众数、中位数和平均数的关系图(人82第四章统计指标描述与分析-课件83

补充:分位数分位数是将变量的数值按大小顺序排列并等分为若干部分后,处于等分点位置的数值。常用的分位数有四分位数、十分位数和百分位数,他们分别是将数值序列4等分、10等分和100等分的3个点、9个点和99个点上的数值。其中四分位数第2点的数值、十分位数第5个点的数值和百分位数第50个点的数值,就是中位数。所以,中位数就是一个特殊的分位数。

以四分位数为例,设,和分别表示第一个、第二个和第三个四分位数,则他们的位置分别为:,和,根据位置即可确定各个四分位数。补充:分位数84四分位数(位置的确定)原始数据:分组数据:

。25%

。50%

。75%四分位数(位置的确定)原始数据:分组数据:。85数值型数据的四分位数

(9个数据的算例)【例】:9个家庭的人均月收入数据原始数据:

15007507801080850960200012501630排序:

75078085096010801250150016302000位置:

123456789数值型数据的四分位数

(9个数据的算例)【例】:9个家庭的86数值型数据的四分位数

(10个数据的算例)【例】:10个家庭的人均月收入数据排序:

660

75078085096010801250150016302000位置:1234

5678910

数值型数据的四分位数

(10个数据的算例)【例】:10个家87第四节离散程度的描述(重点节)重点:标准差和离散系数的计算方法与适用范围带着问题学:

1、离散程度指标的意义是什么?它与平均指标的作用有何区别?

2、当两个总体平均水平相同时,要反映其离散程度差异,应该选用什么离散指标指标进行对比?

3、当两个总体平均水平不同时,要反映其离散程度差异,应该选用什么离散指标指标进行对比?第四节离散程度的描述(重点节)88第四节离散程度的描述重点:标准差和离散系数离中趋势和离散指标

离中趋势即变量分布中各变量值背离中心值(平均数)的倾向。离散指标有:全距、平均差、标准差、离散系数等。离散指标作用:1.变异指标是衡量平均指标代表性的尺度。2.变异指标说明现象变动的均衡性、稳定性程度。

变异指标数值越大,平均数代表性越小,稳定性越差;变异指标数值越小,平均数代表性越大,稳定性越好。返回第四节离散程度的描述离中趋势即变量分布中各89离中趋势(离散程度)——离散指标离中趋势(离散程度)——离散指标90例如:某地的两个轴承厂生产直径为172毫米的轴承,各抽取5件产品检验,其结果如下:

甲:171,172,172,172,173(毫米)

……乙:220,190,170,150,130(毫米)

计算结果,两厂产品的平均数相等(172毫米),……但平均数(172)的代表性甲组比乙组好。(图示如下:)Why?Why?例如:某地的两个轴承厂生产直径为172毫米的轴承,各抽取5件91换(多)个角度观察、分析

两个轴承厂的产品平均直径一样,产品质量都符合要求,但产品直径大小的差异确存在区别,说明两者生产的稳定性差别很大。如果只从平均数观察,是不能全面反映其真实情况的。所以,通常需要将平均水平与变异程度结合起来分析。172直径差距乙厂甲厂换(多)个角度观察、分析两个轴承厂的产品平92一、极差又名全距,是指所研究数据中的最大值与最小值之差。极差表示数据的变动范围,用R表示:未分组数据:组距分布数列:一、极差又名全距,是指所研究数据中的最93

补充:平均差(AverageDeviation)

(变量值与平均数的离差绝对值的平均数)补充:平均差(AverageDeviation)94日产量(件)组中值x工人数f各组产量

xf40以下40_5050_6060以上354555651020155350900825325133717

1306010585合计___50240040380例:某企业工人日产量分组表平均差计算表日产量(件)组中值工人数各组产量40以下35103501395

二、方差(Variance)和标准差(S.D)

测度标志变异最重要,最常用的指标。标准差=方差的平方根即:变量值与平均数的离差平方平均数的平方根。▲二、方差(Variance)和标准差(S.D)96第四章统计指标描述与分析-课件97例:某企业工人日产量分组表标准差计算表日产量(件)组中值x工人数f

40以下40_5050_6060以上354555651020155-13-3717169949289169018073585合计___50——5162690例:某企业工人日产量分组表标准差计算表日产量98例:平均水平相同的两个数列对比,只需用标准差即可判断。图例(形如蓄水池)

A建筑队用人工挖土方,平均劳动生产率为20M³/人,标准差为1M³.

.

B建筑公司亦用人工挖土方,平均劳动生产率为20M³/人,标准差为2M³.

20

~~~~~~~

返回例:平均水平相同的两个数列对比,只需用标准差即可判断。99△

三、离散系数(变异系数)(重点)例:一群牛的平均体重是180公斤,标准差是6公斤;一群兔的平均体重是3公斤,标准差是0.5公斤,能不能说兔的平均体重的代表性高些(通俗地说,个头均匀些)?为什么?

△三、离散系数(变异系数)(重点)例:一群牛的平均体100不同的对比,不同的结论6>0.5;16.67%>

3.33%不同的对比,不同的结论6>0.5;101结论:

全距、平均差、方差和标准差有(相同的)计量单位,是标志变异的绝对指标。变异指标的大小不仅取决于统计数据的差异程度,还取决于这些统计数据一般水平的高低。因而,对于平均水平不同的数列,或计量单位不同的数列,都不能直接用全距、平均差、方差和标准差来比较平均数代表性的大小。只能用相对形式——离散系数进行比较。

(图示如下:)结论:102例:平均水平不同的两个数列对比,需用离散系数。图例(形如蓄水池)

甲建筑队用人工挖土方,平均劳动生产率为10M³/人,标准差为1M³.

10~~~~~~~

.

乙建筑公司用机械挖土方,平均劳动生产率为100M³/人,标准差为2M³.

100

~~~~~~~

V甲=1/10=0.1V甲>v乙

平均数代表性弱,稳定性,均衡性差V乙=2/100=0.02v乙<V甲平均数代表性强,稳定性,均衡性高返回例:平均水平不同的两个数列对比,需用离散系数。103两类不同性质的产品进行对比分析长虹公司3月份生产的彩电双马集团3月份生产的的水泥标准差4(台)标准差4(袋)

两类不同性质的产品,无直接可比性。故,需用离散系数进行对比。(消除质的差异)两类不同性质的产品进行对比分析长虹公司3月份生产的彩电104变异系数包括:变异系数包括:105

偏度的概念首先由统计学家皮尔逊(Pearson)于1895年提出,是对变量分布对称性的测度,是指变量分布偏斜的方向及其程度。

偏度的测定是通过计算偏度系数来实现的,通常用来表示。

※补充一:偏度系数

※补充一:偏度系数106总体单位分布形状示意图(偏度)总体单位分布形状示意图(偏度)107第四章统计指标描述与分析-课件108

峰度的概念首先由统计学家皮尔逊于1905年提出,是对变量分布扁平性或尖陡性的测度,通常是指钟型分布的顶峰与标准正态分布相比偏扁平或偏尖陡的程度。它通常分为三种情况:标准正态峰度、尖顶峰度和平顶峰度。如果变量分布的频数比较集中于众数附近,分布曲线比较尖陡,使分布曲线的顶部较标准正态曲线更为突起,则变量分布的峰度属于尖顶峰度;如果变量分布各组的频数比较接近,分布曲线比较扁平,使分布曲线的顶部低于标准正态曲线,则变量分布的峰度属于平顶峰度。峰度的测定是通过计算峰度系来实现的,通常用K来表示。峰度系数的计算主要采用动差法,是4阶中心动差与标准差4次方相比的结果,即:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论