版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第五章 分布的数值特征一、平均指标的概念及特点(一)平均指标的概念平均指标(Mean)又称平均数,是指同类现象在一定时间、地点、条件下所达到的一般水平。它作为同类现象的一般水平,是总体内各单位参差不齐的标志值的代表值,也是对变量分布集中趋势的测度。它是将总体各单位某一标志值的个体差异抽象化,反映总体某一变量达到的平均水平的指标,如平均工资、平均年龄、平均文化水平等。在统计中,常用的平均指标有算术平均数、调和平均数、几何平均数、众数和中位数等。其中,算术平均数、调和平均数、几何平均数是根据变量数列中各单位的标志值计算得到的,所以称为数值平均数;众数和中位数是根据变量数列中某些标志值所处的位置来确
2、定的,称为位置平均数。各种平均指标的计算方法、指标含义、应用条件都不相同,现分别加以叙述。(二)平均指标的特点1.将数量差异抽象化。平均指标将各个变量间的差异抽象化,从而说明总体的一般水平。如某地区的居民平均收入指标,是将该地区居民个人之间的收入差异抽象化,用来说明该地区居民收入的一般水平。2.只能就同类现象计算。计算平均指标的各单位必须具有同类性质,这是计算平均指标的前提条件。如果将性质不同的个体混杂在一起,由此计算的平均数只会掩盖事物的本质区别,得出错误的结论。3.能反映总体变量的集中趋势,是反映总体变量分布特征的指标之一。从总体变量分布的情况看,多数标志值集中在平均数附近,所以平均指标是
3、标志值集中趋势的测度数,是反映总体变量集中倾向的代表值。二、数值平均数数值平均数(Mean)是根据数据分布的全部标志值(或变量值)来计算的平均数,也称均值,是反映数据分布集中趋势的重要指标。它包括算术平均数()、调和平均数()和几何平均数()。(一)算术平均数1. 简单算术平均数简单算术平均数(Simple Arithmetic Mean)是用一组数据中所有数据值求和再除以该组数据的个数而得到的数据平均值。它主要用于处理未分组的原始资料。计算公式为: 其中,x1,x2,.xn表示各个变量值;n表示变量个数;表示总和符号。2.加权算术平均数加权算术平均数(Weighted Arithmetic
4、Mean)又简称为加权平均数,是根据每个数据在全组中的重要程度而赋予一定权重后计算得到的算术平均数。在数据资料已分组时,计算平均数需要采用加权算术平均数的计算方法。计算公式为: 其中,x表示变量值,f表示权数,表示各组次数占总次数的比重。 当对绝对数求加权算术平均数时,次数就是权数f;当对相对数或平均数求加权算术平均数时,次数不一定是权数,此时,变量x的分母数据为权数f。(1)加权算术平均数的计算步骤:如果是单项式数列求加权算术平均数:第一步,把各组的变量值乘以相应的权数,求出各组总量(xf);第二步,把各组总量相加,求得最终的总量();第三步,把各组的权数相加,求得总权数();第四步,用最终
5、的总量除以总权数,得平均数。如果是组距式数列求加权算术平均数:第一步,确定各组组中值;第二步,用各组组中值乘以相应的权数,求出各组的总量(xf);第三步,把各组的总量相加,求得最终的总量();第四步,把各组的权数相加,求得总权数();第五步,用最终的总量除以总权数,得平均数。(2)加权算术平均数的影响因素:一是各组变量值的大小(x);二是各组权数占总权数比重的高低()。(3)权数的作用:变量值与权数相乘,被称为加权。当变量值大小与总权数一定时,权数在各组的分配比例会影响平均数的高低,即权数越大的组,该组变量值会越接近资料的平均数;权数越小的组,该组变量值会远离平均数。3.算术平均数的数学性质(
6、1)各变量值与算术平均数的离差总和等于零。(2)各变量值与算术平均数的离差平方和为最小值。(3)两个独立的同性质变量代数和的平均数等于各变量平均数的代数和。即 。(4)两个独立的同性质变量乘积的平均数等于各个变量平均数的乘积。即。(二)调和平均数调和平均数是常用的另一种平均指标。 调和平均数是各变量值倒数的算术平均数的倒数,又称倒数平均数,是算术平均数的变形计算。1.简单调和平均数简单调和平均数适用于未分组资料,其计算公式为: 式中:表示调和平均数;xi表示类似于劳动生产率的倒指标变量值;n表示变量值个数。例4.3.4:某市场的白菜价格:早市为每千克 2.5元,中市为每千克3元,晚市为每千克2
7、元,则白菜全天的平均价格为:即白菜全天的平均价格为每千克2.44元。2.加权调和平均数加权调和平均数适用于已分组资料,其计算公式为: 式中,mi为一种特殊权数,是各组总量指标,即mixifi。3.调和平均数的计算步骤:第一,计算各个变量值的倒数, 即第二,计算上述各个变量值倒数的算术平均数,即第三,计算算术平均数的倒数,得到调和平均数,即4. 加权算术平均数与加权调和平均数的关系:调和平均数可以作为算术平均数的变形,因为二者只是由于所掌握的资料不同而采用的不同计算公式:加权算术平均数一般是在已知分母情况下应用;而加权调和平均数一般是在已知分子的情况下应用。5.根据平均数和相对数计算平均数时调和
8、平均数的应用根据平均数和相对数计算平均数由两个原则:其一,不能用简单平均的方法,必须加权;其二,当所掌握的资料是构成平均数(相对数)的母项指标时,采用加权算术平均的方法(见例4.3.3),当所掌握的资料是构成平均数(相对数)的子项指标时,采用加权调和平均的方法,体现了调和平均数的应用。 (1)由平均数计算平均数时,调和平均数的应用(2)由相对数计算平均数时,调和平均数的应用 6.调和平均数的特点:如果数列中有一变量值等于零,则无法计算调和平均数;调和平均数是一种数值平均数,要受所有变量值的影响;但较之算术平均数,调和平均数受极端值的影响要小一些。5.调和平均数的特点:(1)如果数列中有一标志值
9、等于零,则无法计算;(2)它作为一种数值平均数,受所有标志值的影响,但较之算术平均数,受极端值的影响要小。(四)几何平均数1.简单几何平均数简单几何平均数被定义为n个变量值乘积的n次算术方根。计算公式为: 式中:表示几何平均数,为连乘符号。几何平均数主要用于计算平均比率或平均速度,因而常常代表比率或速度这样一类相对数。在实际应用时,可以应用对数进行计算。 2.加权几何平均数 公式(4.3.6)3.几何平均数的特点如果数列中有一个标志值等于零或负值,就无法计算几何平均数;几何平均数受极端值的影响较算术平均数和调和平均数小;几何平均数适用于反映特定现象的平均水平,即现象的总标志值是各单位标志值的连
10、乘积。4.常用数值平均数之间的数量关系算术平均数、调和平均数和几何平均数都是常用的数值平均数,三者之间一般存在下述的数量关系:()几何平均数()算术平均数()由于三种平均数之间存在这种不等式关系,所以在计算平均数时,应根据现象的性质和统计研究的目的来选择恰当的平均数。三、位置平均数位置平均数是根据其在总体中所处的位置或地位确定的。位置平均数不是根据统计总体的全部标志值或变量值计算的,而是根据其在总体中所处的位置或地位确定的,。位置平均数有两种:众数(Mo)和中位数(Me)。(一)众数众数(Mode)是总体或分布数列中出现频数最多、出现频率最高的那个标志值。1.众数存在的条件由众数的定义可看出其
11、存在的条件: (1)只有总体单位数较多,且有明显的集中趋势时才存在众数。 (2)在单位数很少,或单位数虽多但无明显集中趋势时,计算众数是没有意义的。如图1.1.3所示资料就无众数。2.众数的计算方法(1)根据单项式数列确定众数:数列中出现次数最多的那个标志值就是众数。(1) 根据单项数列确定众数:只需找出出现次数最多的标志值。 (2)根据组距数列确定众数首先,由最多次数来确定众数所在组;其次,利用比例插值法来推算众数的近似值。计算公式如下 3、众数的特点(1)众数是一个位置平均数,它只考虑总体分布中最频繁出现的变量值,而不受各单位标志值的影响,从而增强了对变量数列一般水平的代表性。不受极端值和
12、开口组数列的影响。(2)众数是一个不容易确定的平均指标,当分布数列没有明显的集中趋势而趋均匀分布时,则无众数可言;当变量数列是不等距分组时,众数的位置也不好确定。(二)中位数(Me)1、中位数的概念中位数(Median)是一个统计总体或分布数列中处于中间位置的变量值。用一个中等水平的标志值来表示分布数列的集中趋势,有非常直观的代表性意义。2、中位数的计算方法(1)未分组的原始资料:首先,将标志值按大小顺序排列。其次,确定中位数的位次。最后,确定中位数。当n为奇数时,则居于中间位置的那个标志值就是中位数。(2)由单项数列确定中位数(3) 由组距数列确定中位数 第一步,计算累计次数(向上累计或向下
13、累计) 第二步,按确定中位数所在组 第三步,采用下列公式计算众数的近似值: 3、中位数的特点:(1) 中位数也是一种位置平均数,它也不受极端值及开口组的影响,具有稳健性。(2) 各单位标志值与中位数离差绝对值之和最小。(3)对某些不具有数学特点或不能用数字测定的现象,可以用中位数求其一般水平。(三)中位数、众数与算术平均数的关系 1判别总体分布特征 (1) f (对称分布) (2) f (正偏态分布) (3) f (负偏态分布) 2互相推算(在偏斜不大时) 经变换,有:四、应用平均指标分析社会经济现象时,应注意的两个原则(一)平均指标只能应用于同质总体。平均数只能在同质总体中进行计算,才能正确
14、反映社会经济现象的一般水平。所谓同质性,是指社会经济现象的各个单位在被平均的标志上具有相同性。否则,就会混淆不同质总体的数量特征,就不能正确反映总体所具有的数量特征。(二)用组平均数补充说明总平均数。(三)根据具体条件选择平均方法;不同的平均数,其计算方法、意义和使用条件都存在较大的不同,在使用平均数时,一定要根据变量数列的性质和已知条件来确定平均数的计算方法。 (四)平均数与典型值和分配数列结合分析;第四节 数据离散程度的侧度标志变异指标一、标志变异指标的概念标志变异指标是反映同质总体各单位标志值的差异程度,即数列的离散趋势的指标。标志变异指标又称标志变动度。平均数是将总体中各单位标志值的数
15、量差异抽象化,以反映总体各单位在某一标志上的一般水平,即集中趋势。但一个变量数列除了需要反映其集中趋势的特征以外,还需反映其另一特征,即离散趋势,以说明被抽象化的总体各单位标志值的差异程度。标志变异指标主要有:全距(R)、四分位差(Q.D.)、平均差(A.D.)、标准差()。二、标志变异指标的作用(一)衡量平均指标的代表性 (二)标志变动度可用来反映社会生产和其他社会经济活动过程的均衡性或协调性,以及产品质量的稳定程度。(三)标志变异指标是统计分析的一个基本指标。 标志变异指标是统计反映数列分布特征的重要指标之一,也是计算抽样平均误差等其它统计指标的基础。三、标志变异指标的种类及计算(一) 全
16、距全距也叫级差,常用R表示,是一组资料的最大值与最小值之差。反应其最大的可能的变化范围。1、未分组资料的级差未分组资料的级差的计算公式: 全距的优点是计算方便,易于理解,可以粗略反应数据的变异情况,其数值大,表示数据的分散程度大,数据小表示数据集中。缺点是只考虑数列中极大值和极小值的差异,而忽视了其它变量值的分布情况,因而,不能全面反映总体各单位标志的变异程度。2、分组资料的级差对于分组资料其级差的计算公式为:对开口组:3、修正极差修正极差也称为四分位距,如果将总体各单位的标志值按大小顺序排列,然后将数列分为四等分,形成三个分割点(Q1、Q2、Q3),这三个分割点称为四分位数。其中第二个四分位
17、数Q2就是数列的中位数Me。 式中,分别被称为上四分位点和下四分位点。是一组资料的四分之三位次和四分之一位次上的变量值。式的意义是很明确的,即去掉整个数据的前25和后25,集中反映中间50数据离散程度的指标。四分位差的特点:(1) 四分位差不受两端各25%数值的影响,能对开口组数列的差异程度进行测定;(2) 用四分位差可以衡量中位数的代表性高低;(3) 四分位差不反映所有标志值的差异程度,它所描述的只是次数分配中间一半的离差,所以也是一个比较粗略的指标。(三)平均差1、平均差的概念:平均差是数列中各单位标志值与平均数之间绝对离差的平均数。 2、平均差的计算: 3.平均差的特点(1) 平均差是根
18、据全部标志值与平均数离差而计算出来的变异指标,能全面反映标志值的差异程度;(2) 平均差计算有绝对值符号,不适合代数方法的演算使其应用受到限制。(四)标准差1标准差的概念标准差是离均差平方平均数的算术根,故又称“均方差”。其意义与平均差基本相同。只是采用了平方的方法解决正负方向问题。其计算过程简便且数学性质也最优。是最常用,也是最重要的标志变异指标。2计算公式 3计算标准差的一般步骤:(1) 算出每个变量值对平均数的离差;(2) 将每个离差平方;(3) 计算这些平方数值的算术平均数;(4)把得到的数值开平方根,即按4.4.5式计算得到。 4.标准差与全距、平均差的关系 (1) 与R的关系:经验表明,当分布数列接近于正态分布时,R和之间存在以下经验公式:R为4至6个: 当标志值项数较少时,R4;当标志值
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版土地租赁及资源开发合同3篇
- 2025版二手豪华轿车买卖及车主尊享保养套餐合同3篇
- 山东省济宁市曲阜市2024-2025学年九年级上学期期末历史试题(含答案)
- 公共基础-试验检验师(含助理)《公共基础》模拟试卷5
- 公交车辆电动化发展趋势分析考核试卷
- 二零二五年港口拖轮服务与海运运输合同3篇
- 2025年健康养生孕前保养合同
- 2025年在线美食分享平台用户注册协议
- 2025年体育器材赠与协议
- 二零二五年肉牛养殖项目配套购牛合同3篇
- 湖北省黄石市阳新县2024-2025学年八年级上学期数学期末考试题 含答案
- 硝化棉是天然纤维素硝化棉制造行业分析报告
- 央视网2025亚冬会营销方案
- 《00541语言学概论》自考复习题库(含答案)
- 《无砟轨道施工与组织》 课件 第十讲双块式无砟轨道施工工艺
- 江苏省南京市、盐城市2023-2024学年高三上学期期末调研测试+英语+ 含答案
- 2024新版《药品管理法》培训课件
- 《阻燃材料与技术》课件 第7讲 阻燃橡胶材料
- 爆炸物运输安全保障方案
- 江苏省南京市2025届高三学业水平调研考试数学试卷(解析版)
- 2024年黑龙江省哈尔滨市中考数学试卷(附答案)
评论
0/150
提交评论