集中趋势和离中趋势的度量_第1页
集中趋势和离中趋势的度量_第2页
集中趋势和离中趋势的度量_第3页
集中趋势和离中趋势的度量_第4页
集中趋势和离中趋势的度量_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

集中趋势和离中趋势的度量第一页,共五十三页,编辑于2023年,星期二集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势即要寻找数据一般水平的代表值或中心值。

第一节集中趋势指标概述

集中趋势指标即统计平均数,是反映若干统计数据一般水平或集中趋势的综合指标。它可能表现为总体内各单位某一数量标志的一般水平,也可能表现为总体在某一段时期内的数量一般水平。第二页,共五十三页,编辑于2023年,星期二

统计平均数的特点

统计平均数是一个代表值

统计平均数是一个抽象值

第一节集中趋势指标概述数据集中区变量x第三页,共五十三页,编辑于2023年,星期二统计平均数的作用

两个同类现象而范围不同的总体一般水平。

将同一总体、同一性质的平均数按时间先后顺序排列起来可以反映现象发展变化的过程、趋势、规律性。

和统计分组结合,揭示现象之间的依存关系。

第一节集中趋势指标概述第四页,共五十三页,编辑于2023年,星期二类型

第一节集中趋势指标概述动态平均数静态平均数统计平均数数值平均数位置平均数算术平均数调和平均数几何平均数众数分位数第五页,共五十三页,编辑于2023年,星期二一、算术平均数

基本公式

由于掌握的资料不同,在实际计算时又可以分别采用简单算术平均数和加权算术平均数的方法。第二节数值平均数第六页,共五十三页,编辑于2023年,星期二简单算术平均数

资料未分组时可以采用简单算术平均数的方法。第二节数值平均数第七页,共五十三页,编辑于2023年,星期二

∑和号第二节数值平均数算术平均数 变量值的个数

变量值第八页,共五十三页,编辑于2023年,星期二(三)加权算术平均数

当资料已经分组则采用加权算术平均数的方法

第二节数值平均数第九页,共五十三页,编辑于2023年,星期二(四)需要注意的几个问题⒈加权算术平均数不仅受各个变量值大小的影响,而且受权数大小的影响。⒉权数可以用比重形式。

第二节数值平均数第十页,共五十三页,编辑于2023年,星期二(四)需要注意的几个问题⒊简单算术平均数是加权算术平均数的特例。

第二节数值平均数第十一页,共五十三页,编辑于2023年,星期二(五)算术平均数的数学性质⒈各变量值与算术平均数的离差之和为零。这一性质说明算术平均数是一组数据的重心。

第二节数值平均数第十二页,共五十三页,编辑于2023年,星期二(五)算术平均数的数学性质

⒉各变量值与算术平均数的离差平方和为最小。

第二节数值平均数第十三页,共五十三页,编辑于2023年,星期二二、调和平均数

又叫倒数平均数,即各变量值的倒数的算术平均数的倒数。调和平均数用表示。

第二节数值平均数第十四页,共五十三页,编辑于2023年,星期二调和平均数

上述公式是加权调和平均数的公式。若各变量值的权数都相等时,加权调和平均数简化为简单调和平均数。即:

第二节数值平均数第十五页,共五十三页,编辑于2023年,星期二调和平均数公式中的权数是各组的标志总量(算术平均数的分子数据)。当已知各组的变量值和算术平均数的分子数据,而缺乏分母数据时,可以采用调和平均数的形式来计算。调和平均数

第二节数值平均数第十六页,共五十三页,编辑于2023年,星期二例:某车间各班组工人劳动生产率和实际产量资料如下:班组劳动生产率实际产量

(件工时)(件)

一101000

二122400

三154500

四206000

五306000合计—19900要求:计算五个班组工人的平均劳动生产率。xmmx1002003003002001100解:平均劳动生产率为:(总工时)第十七页,共五十三页,编辑于2023年,星期二几何平均数几何平均数是n个变量值连乘积的n次方根,适应于计算平均比率和平均速度。根据掌握的资料不同,有简单几何平均数和加权几何平均数两种。简单几何平均数适应于已知每个比率或每个速度求平均数的情况。

第二节数值平均数第十八页,共五十三页,编辑于2023年,星期二几何平均数

加权几何平均数适应于比率或速度已分组的情况。

第二节数值平均数第十九页,共五十三页,编辑于2023年,星期二1、2001年某月份甲、乙两农贸市场某农产品价格和成交量、成交额资料如下:品种价格甲市场成交额(万元)乙市场成交量(万斤)甲乙丙1.21.41.51.22.81.5211合计-5.54试问哪一个市场农产品的平均价格高?并说明原因。第二十页,共五十三页,编辑于2023年,星期二2、已知某企业有如下资料:按计划完成百分比分组(%)实际产值(万元)80——9090——100100——110110——120986105718601846计算该企业平均计划完成百分比。第二十一页,共五十三页,编辑于2023年,星期二某厂生产某种机床配件,要经过三道工序,现生产一批该产品在各道生产工序上的合格率分别为95.74%、93.48%、97.23%。根据资料计算三道生产工序的平均合格率。第二十二页,共五十三页,编辑于2023年,星期二一、众数

第三节位置平均数

众数是一组数据中出现次数最多的标志值。一、众数第二十三页,共五十三页,编辑于2023年,星期二

众数不仅适应于变量数列,也适应于品质数列。如销售量最多的服装款式或色彩,即通常所讲的“流行款式”,就属于这种意义上的众数。

第三节位置平均数第二十四页,共五十三页,编辑于2023年,星期二众数的确定⒈如果各标志值分布很均匀,无明显的变化,则数列无众数。2.如果是单项式数列或未分组的数据,出现次数最多的那一个标志值就是众数。3.由组距式数列确定众数,先根据次数的多少确定众数组,然后可按下述公式之一计算:

第三节位置平均数第二十五页,共五十三页,编辑于2023年,星期二计算公式

第三节位置平均数第二十六页,共五十三页,编辑于2023年,星期二二、中位数(Median)

第三节位置平均数中位数是指将总体各单位标志值按照大小顺序排列后,处于中间位置的那个标志值,用Me表示。第二十七页,共五十三页,编辑于2023年,星期二

第三节位置平均数

中位数将变量数列分为相等的两部分,一部分的标志值小于中位数,另一部分的标志值大于中位数。如何确定中位数?1.由未分组的数据确定中位数2.由单项数列确定中位数3.由组距数列确定中位数第二十八页,共五十三页,编辑于2023年,星期二1.由未分组的数据确定中位数

根据未分组的数据确定中位数时,首先将总体各单位的标志值资料按大小顺序排列,然后按照(n表示资料的项数)来确定中位数的位次,再根据中位数的位次找出对应的标志值即可。

第三节位置平均数第二十九页,共五十三页,编辑于2023年,星期二2.由单项数列确定中位数由单项数列确定中位数时,先向上或向下累计次数,然后按下式确定中位数的位次:根据中位数的位次,将累计次数刚好超过中位数位次组确定为中位数组,该组所对应的标志值即为中位数。

第三节位置平均数第三十页,共五十三页,编辑于2023年,星期二3.由组距数列确定中位数由组距数列确定中位数,先向上或向下累计频数,然后按确定中位数的位次,再用公式计算中位数的近似值。

方法同单项数列

第三节位置平均数第三十一页,共五十三页,编辑于2023年,星期二计算公式

第三节位置平均数第三十二页,共五十三页,编辑于2023年,星期二

一、离中趋势:含义离中趋势是指一组数据中各数据值以不同程度的距离偏离其中心(平均数)的趋势,又称标志变动度。

第四节离中趋势的度量离中趋势指标是用来综合反映数据的离中程度的一类指标。极差分位差平均差方差标准差离散系数第三十三页,共五十三页,编辑于2023年,星期二极差(Range)极差=最大变量值-最小变量值组距数列极差可近似值为:极差=最大组的上限-最小组的下限

第四节离中趋势的度量第三十四页,共五十三页,编辑于2023年,星期二优点

计算简便含义清楚

缺点没有考虑到中间变量值的变动情况,测定离中趋势时不准确。

第四节离中趋势的度量第三十五页,共五十三页,编辑于2023年,星期二分位差是从一组数据中剔除了一部分极端值之后重新计算的类似于极差的指标。常用的有四分位差、八分位差和十分位差等

四分位差是第三个四分位数减去第一个四分位数的差的一半

第四节离中趋势的度量第三十六页,共五十三页,编辑于2023年,星期二平均差

平均差(Meandeviation)是数据组中各数据值与其算术平均数离差绝对值的算术平均数,常用符号“M.D”表示。简单平均式

加权平均式由于平均差是根据数列中所有数值计算出来的,受极端值影响较小,所以对整个统计数列的离中趋势有较充分的代表性。但是在计算过程中,数学处理方法不够理想,所以,其应用受限

第四节离中趋势的度量第三十七页,共五十三页,编辑于2023年,星期二方差Variance与标准差Standarddeviation方差是数据组中各数据值与其算术平均数离差平方的算术平均数。方差的平方根就是标准差。简单平均式加权平均式标准差是应用最广泛的离中趋势指标

第四节离中趋势的度量第三十八页,共五十三页,编辑于2023年,星期二离散系数(Coefficientofvariation)上述三个指标带有计量单位,而且其离中趋势大小与变量平均水平的高低有关。要比较数据平均水平不同的两组数据的离中程度的大小,就有必要计算它们的相对离中程度指标,即离散系数。常用的离散系数指标是标准差系数。

第四节离中趋势的度量第三十九页,共五十三页,编辑于2023年,星期二标准差系数是将一组数据的标准差与其算术平均数对比的结果。标准差系数

第四节离中趋势的度量第四十页,共五十三页,编辑于2023年,星期二例已知甲乙两个水稻品种分别在五块田里试种,资料如下,试计算有关指标,比较甲乙两个水稻品种的收获率哪一个具有较强的稳定性,可以推广.

甲乙平均亩产量面积平均亩产面积

(千克/亩)(亩)(千克/亩)(亩)4592.24392.34522.14452.0440

2.04502.54531.94611.94611.84782.3

合计10.0合计11.0

第四十一页,共五十三页,编辑于2023年,星期二第四十二页,共五十三页,编辑于2023年,星期二例

甲平均亩产x面积fxf

x-x

(x-x)²

(x-x)²f

4592.2101063679.24522.1950-112.1440

204531.98600004611.8830864115.2

合计10.04530--534.5第四十三页,共五十三页,编辑于2023年,星期二乙平均亩产x面积fxf

x-x

(x-x)²

(x-x)²f

4392.31010-16256588.8445204502.51125-52562.54611.987563668.44782.31100235291216.7

合计11.05000--2136.4

第四十四页,共五十三页,编辑于2023年,星期二第四十五页,共五十三页,编辑于2023年,星期二第四十六页,共五十三页,编辑于2023年,星期二∵∴甲水稻品种的收获率具有较强的稳定性,可以推广.第四十七页,共五十三页,编辑于2023年,星期二练习题1、加权算术平均式转变为简单算术平均式的条件是各组变量值完全相等。()2、三种水果,每公斤价格分别为5元、4元和2.5元。各买2公斤和各买10元的平均价格都是每公斤4元。()3、在变量数列中,若标志值较小的组,而权数大时,计算出来的平均数()

A、接近标志值较大的一组B、接近标志值较小的一组

C、不受权数影响D、仅受标志值影响第四十八页,共五十三页,编辑于2023年,星期二4、若单项式数列的所有标志值都减少一倍,而权数都增加一倍,则其算术平均数()

A、增加一倍B、不变

C、减少一倍D、无法判断5、比较两个单位的资料,甲的标准差小于乙的标准差,则()

A、两个单位的平均数代表性相同

B、甲单位的平均数代表性大于乙单位

C、乙单位的平均数代表性大于甲单位

D、不能确定哪个单位的平均数代表性大第四十九页,共五十三页,编辑于2023年,星期二6、将未分组资料整理成组距变量数列,然后,分别按未分组资料和组距变量数列计算平均数,其结果()

A、一定相同B、不一定相同

C、往往相差很大D、无法比较7、对于同一资料,直接

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论