第四章 数据特征测度3-平均指标_第1页
第四章 数据特征测度3-平均指标_第2页
第四章 数据特征测度3-平均指标_第3页
第四章 数据特征测度3-平均指标_第4页
第四章 数据特征测度3-平均指标_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

4.3平均指标(平均数-集中程度测度)数据集中区变量x学习目标1. 集中趋势各测度值的计算方法集中趋势各测度值的特点及应用场合

算术平均数调和平均数几何平均数中位数众数数据分布的特征集中趋势

(位置)偏态和峰态(形状)离中趋势

(分散程度)数据分布特征的测度数据特征的测度分布的形状集中趋势离散程度众数中位数均值离散系数方差和标准差峰态四分位差异众比率偏态集中趋势

(Centraltendency)一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据水平的代表值或中心值不同类型的数据用不同的集中趋势测度值低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据一、平均指标的概念和作用(一)平均指标的含义平均指标是同质总体各单位某一数量标志值在具体时间、地点、条件下达到的一般水平。平均指标具有以下特点:(1)同构型(2)抽象性(3)代表性(二)平均指标的作用

1.平均指标可以反映分配数列中各变量值分布的集中趋势2.平均指标可以反映现象总体的综合特征3.平均指标经常用来进行同类现象在不同空间、不同时间条件下的对比分析

二、平均指标的类别及计算均值(Mean)

中位数 (Median)众数 (Mode)算术平均数(Mean)调和平均数(Harmonicmean)几何平均数(Geometricmean)(一)算术平均数(Mean)1.简单算术平均数(Simplemean)简写为:简写为:分组资料时,各组变量值应用组中值M代替。2.加权算术平均数(Weightedmean)加权算术平均数

(权数对均值的影响)

甲乙两组各有10名学生,他们的考试成绩及其分布数据如下

甲组:

考试成绩(x): 020100

人数分布(f):118

乙组:考试成绩(x): 020100

人数分布(f):811已改至此!!某电脑公司销售量数据分组表按销售量分组组中值(Mi)频数(fi)Mi

fi140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084558013952640472537003315205017209001175合计—12022200加权算术平均数

(例题分析)3.算术平均数的重要数学性质(1)各变量值与算术平均数的离差总和等于0,即:未分组资料:分组资料:(2)各变量值与算术平均数的离差平方和最小。即:未分组资料:为最小。分组资料:为最小。

这两个性质是进行趋势预测、回归预测、建立数学模型的重要数学理论依据。为最小。算术平均数(均值,mean)

小结集中趋势的最常用测度值一组数据的均衡点所在(重心)体现了数据的必然性特征易受极端值的影响用于数值型数据,不能用于分类数据和顺序数据(二)调和平均数(Harmonicmean)

调和平均数是总体各单位标志值倒数的算术平均数的倒数,又称为倒数平均数记作。1.简单调和平均数

2.加权调和平均数

调和平均数

(例题分析)某日三种蔬菜的批发成交数据蔬菜名称批发价格(元)

xi成交额(元)mi=xi

fi成交量(公斤)fi甲乙丙1.200.500.801800012500640015000250008000合计—3690048000【例】某蔬菜批发市场三种蔬菜的日成交数据如表,计算三种蔬菜该日的平均批发价格算术平均数与调和平均数的关系及运用调和平均数一般作为算术平均数的变形使用,它仍然是依据算术平均数的基本公式——标志总量除以总体单位总量来计算。若已知条件为分组资料的各组变量值及各组的标志总和即时,可采用加权调和平均法计算平均指标;若已知条件为分组资料的各组变量值及各组的次数时,可直接用加权算术平均法计算平均指标。算术平均法和调和平均法在相对指标和平均指标的平均数的应用

计算相对指标和平均指标的平均数应根据被研究标志的性质即具有的权数资料用不同的方法。举例见书P73-74。

调和平均数(harmonicmean)

小结均值的另一种表现形式易受极端值的影响计算公式为原来只是计算时使用了不同的数据!(三)几何平均数(Geometricmean)几何平均数是个变量值乘积的次方根,主要用于计算比率的平均数。在实际应用中,几何平均数主要用于计算社会经济现象的发展速度、比率(如本利率)等变量的平均。1.简单几何平均数(根据未分组资料计算)

2.加权几何平均数(根据分组资料计算)

简单几何平均数

(例题分析)

【例】某水泥生产企业1999年的水泥产量为100万吨,2000年与1999年相比增长率为9%,2001年与2000年相比增长率为16%,2002年与2001年相比增长率为20%。求各年的年平均增长率。年平均增长率=114.91%-1=14.91%简单几何平均数

(例题分析)

【例】一位投资者购持有一种股票,在2000、2001、2002和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率算术平均:

几何平均:加权几何平均数

(例题分析)【例】某人有一笔款现存入银行10年,前2年的平均率为6%,第3至5年的年利率为5%,后5年的年利率为3%,如果按复利计算,这笔款项的平均年利率为多少?几何平均数(geometricmean)

小结

n个变量值乘积的

n次方根适用于对比率数据的平均主要用于计算平均增长率计算公式为5.可看作是均值的一种变形(四)众数(Mode)

众数()是指总体中出现次数最多的标志值。由于它出现的次数最多,在总体各标志值之中它的代表性较强,能够鲜明地反映数据分布的集中趋势。1.由单项式数列确定众数单项式数列确定众数,只需观察找出次数最多的标志值即可。2.由组距数列确定众数(1)确定众数所在组(2)利用公式计算众数的近似值下限公式:上限公式:式中:—为众数;—是众数组的下限;—是众数组的上限;

—为众数组的次数;—为众数组前一组的次数;

—为众数组后一组的次数;—为众数组的组距。

3.众数的特征及作用众数是一种位置平均数,不受极端值的影响。当总体单位数多且具有明显集中趋势时,计算众数既方便且意义明确。(当然,如果总体单位数少或没有明显的集中趋势,则众数就不存在。当变量数列中有两个或几个变量值的次数都比较集中时,就可能有两个或几个众数)众数也适用于定类、定序数据集中趋势的测度,尤其颇适用于定类资料集中趋势的测度。

众数

(不唯一性)无众数

原始数据:10591268一个众数

原始数据:65

9855多于一个众数

原始数据:252828

364242分类数据的众数

(例题分析)不同品牌饮料的频数分布

饮料品牌频数比例百分比(%)可口可乐旭日升冰茶百事可乐汇源果汁露露15119690.300.220.180.120.183022181218合计501100解:这里的变量为“饮料品牌”,这是个分类变量,不同类型的饮料就是变量值在所调查的50人中,购买可口可乐的人数最多,为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即

Mo=可口可乐顺序数据的众数

(例题分析)解:这里的数据为顺序数据。变量为“回答类别”甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即

Mo=不满意甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)

非常不满意

不满意

一般

满意

非常满意24108934530836311510合计300100.0众数(mode)小结出现次数最多的变量值不受极端值的影响一组数据可能没有众数或有几个众数主要用于分类数据,也可用于顺序数据和数值型数据(五)中位数(median)中位数()是将总体各单位的标志值按大小顺序排列,处于中间位置的那个标志值。1.中位数的计算:确定中点位次;找出中点位次对应的标志值(中位数)。(1)由未分组资料计算中位数先将总体各单位的标志值按大小顺序排列,再按下式确定中位数所在的位次,进而确定中位数。未分组数据的中位数

(9个数据的算例)【例】:9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排

序:7507808509601080

1250150016302000位置:123456789中位数1080未分组数据的中位数

(10个数据的算例)【例】:10个家庭的人均月收入数据排

序:

660

75078085096010801250150016302000位置:12345

678910(2)由分组资料计算中位数

在单项式分组资料下:首先计算累计次数,再按确定中位数的位次,找出中位数所在组,该组的变量值就是中位数。在组距式分组资料下:首先计算累计次数,按确定中位数所在组,再利用公式按比例求得中位数的近似值,此公式有下限公式和上限公式两种。式中:—为中位数所在组的下限;—为中位数所在组的次数;—为中位数组前一组的累计次数(累计次数按向上累计计算);—为中位数所在组的组距。—中位数所在组的上限;——中位数组前一组的累计次数(累计次数按向下累计计算)。下限公式:

上限公式:

2.中位数的特征和作用中位数是位置平均数,不受极端值的影响(当次数分布非对称,特别是资料中存在极端值时,中位数作集中趋势的测度量较准确)。中位数适用于测度数量资料集中趋势外,尤其适用于测度定序数据的集中趋势,但不适用于定类数据。顺序数据的中位数

(例题分析)解:中位数的位置为300/2=150

从累计频数看,中位数在“一般”这一组别中。因此

Me=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数

非常不满意

不满意

一般

满意

非常满意2410893453024132225270300合计300—中位数

(median)排序后处于中间位置上的值Me50%50%不受极端值的影响主要用于顺序数据,也可用数值型数据,但不能用于分类数据各变量值与中位数的离差绝对值之和最小,即三、集中趋势的其它测度量—四分位数(quartile)将资料按大小顺序排列后,分割成四等分,得到三个分割点,每个分割点上的数值就是四分位数。四分位数位置的确定:未分组资料分组资料顺序数据的四分位数

(例题分析)解:QL位置=(300)/4=75QU位置=(3×300)/4

=225

从累计频数看,QL在“不满意”这一组别中;QU在“一般”这一组别中。因此

QL

=不满意

QU

=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数

非常不满意

不满意

一般

满意

非常满意2410893453024132225270300合计300—数值型未分组数据的四分位数

(9个数据的算例)【例】:9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排

序:75078085096010801250150016302000位置:123456789数值型未分组数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论