第三章数据分布特征的描述_第1页
第三章数据分布特征的描述_第2页
第三章数据分布特征的描述_第3页
第三章数据分布特征的描述_第4页
第三章数据分布特征的描述_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章统计分布的数值特征第一节分布的集中趋势和位置的度量其次节分布的离散程度统计指标的分类总量指标(确定数)—数量指标相对指标(相对数)—质量指标平均指标(平均数)—质量指标确定数。现象的规模、水平一般以确定数形式表现。相对数。相对数由两个相互联系的数值对比求得。常用的相对数包括:结构相对数、动态相对数、比较相对数、强度相对数、利用程度相对数、支配完成相对数等。平均数。平均数反映现象总体的一般水平或分布的集中趋势。总量指标概念:总量指标是反映社会经济现象在确定时间和地点条件下所达到的总规模、总水平或工作总量的统计指标,表现为确定数,又称确定指标。特点:总量指标的数值大小会随统计总体范围的大小而发生增减变动。作用:相识社会经济现象的起点;实行宏观调控和科学管理的依据;计算相对指标和平均指标的基础。相对指标概念:相对指标是指通过两个有联系的统计指标的比率,来反映现象的发展程度、内部结构、比例关系、强度或密度等。作用:为深化相识事物发展的质量与状况供应客观依据;可以使不能干脆对比的现象找到可以对比的基础,进行更为有效的分析。相对指标的种类和计算方法相对指标计算方法计划完成程度指标实际数/计划数结构相对指标总体中部分数值/全部数值比例相对指标总体中A部分数值/B部分数值比较相对指标甲地某指标数值/乙地同一指标数值动态相对指标报告期水平/基期水平强度相对指标某一指标数值/同期另一有联系的指标数值数据分布的特征集中趋势(位置)离中趋势

(分散程度)偏态和峰度(形状)第一节

分布的集中趋势和位置的度量一、统计平均数的含义及其作用二、数值平均数三、众数和中位数四、算术平均数、众数和中位数的比较一、集中趋势的指标及其作用集中趋势(Centraltendency)较大和较小的观测值出现的频率比较低,大多数观测值密集分布在中心旁边,使得全部数据呈现出向中心聚集或靠拢的态势。集中趋势一组数据向其中心值靠拢的倾向和程度测度集中趋势就是找寻数据一般水平的代表值或中心值不同类型的数据用不同的集中趋势测度值选用哪一个测度值来反映数据的集中趋势,要依据所驾驭的数据的类型来确定统计平均指标的基本分类数值平均数:以统计数列的全部各项数据来计算平均数,用以反映统计数列的全部各项数值的平均水平。这类平均数的特点是,统计数列中任何一项数据的变动,或大或小,都会在确定程度上影响到数值平均数的计算结果。常用的数值平均数有算术平均数、调和平均数和几何平均数等。位置平均数:是依据标记值的位置来确定的。常用的位置平均数有众数和中位数两种。测定集中趋势指标的作用1、反映变量分布的集中趋势和一般水平。2、可以用来比较同一现象在不同空间或不同时间的发展水平,以说明生产水平、经济效益或工作质量的差距。3、可用来分析现象之间的依存关系。4、平均指标是统计推断中的一个重要统计量。二、数值平均数(一)算术平均数(均值)一组数据的总和除以这组数据的项数所得的结果最常用的数值平均数简洁受极端值的影响有简洁算术平均数和加权算术平均数1.简洁算术平均数把每项数据干脆加总后除以它们的项数通常用于对未分组的数据计算算术平均数计算公式:分组表3-2年龄人数(人)xf2242510305501合计20表3-1男性女性2222222225252525252525252525303030305030解:接受简洁算术平均法计算,即全体队员的平均年龄为(单位:周岁):若接受简洁平均:分组数据不能简洁平均!因为各组变量值的次数不等!2.加权算术平均数设分组后各组的变量值或组中值为:

x1,x2,…,xn相应的频数为:f1,f2,…,fn正确的计算是:加权算术平均数加权算术平均数的计算公式:加权—为了体现各变量值轻重不同的影响作用,对各个变量值赐予不尽相同的权数(fi).权数(fi,也称权重)权数——指在计算总体平均数或综合水平的过程中对各个数据起着权衡轻重作用的变量。可以是确定数形式,也可以是比重形式(如频率)表示。事实上比重权数更能够干脆表明权数权衡轻重作用的实质。当权数完全相等(f1=f2=…=fn)时,加权算术平均数就成了简洁算术平均数。要点:各组变量值用组中值来代表假定条件是各组内数据呈匀整分布或对称分布计算结果是近似值表3-3节能灯泡的使用寿命的分组数据

使用寿命(小时)组中值(x)数量(f)Xf频率(f/Σf)(Xf/Σf)1000以下900218000.020181000-12001100888000.080881200-1400130016208000.1602081400-1600150035525000.3505251600-1800170023391000.2303911800-2000190012228000.1202282000以上2100484000.04084合计——1001542001.0001542解:平均运用寿命为:(1)

(2)(3)X456合计频数频率(%)10201025.050.025.040100.0X456合计频数频率(%)20402025.050.025.080100.0X456合计频数频率(%)20101050.025.025.080100.0

=5

=5

=4.75

频率分布变了,平均数也变了。因此,严格地说,权数应指频率。总体成数(总体比率)有些社会经济现象,只表现为两种性质上的差异,如产品的质量表现为合格或不合格;人口性别表现为男性和女性等,这些只表现为是或否、有或无的标记称为交替标记,也称为是非标记。总体中,具有某种表现的单位数(N1)或不具某种表现的单位数(N0)占总体全部单位数(N)的比重称为成数,用p或q表示。3.是非标记的平均数在总体中,具有某种性质的单位占总体的比率为p,不具有该种性质的单位占总体的比率为q,以1作为具有某种性质的单位的标记值,以0作为不具有该种性质的单位的标记值: p也称为总体中具有某种属性的单位成数,是非标记的平均数。4.算术平均数的主要数学性质(1)各变量值与算术平均数的离差之总和等于零。(2)各变量值与算术平均数的离差平方之总和为最小。(二)调和平均数1. 集中趋势的测度值之一2. 算术平均数的另一种表现形式3. 易受极端值的影响4.有简洁调和平均数和加权调和平均数原来只是计算时使用了不同的数据!问题提出:某种农产品在三个农贸市场的价格分别为:甲市场2元/公斤,乙市场2.5元/公斤,丙市场3元/公斤。现从以下两个方面提出平均价格问题:若分别在各市场购买了1公斤,则该农产品平均价格是多少?(2.5)若分别在各市场购买了1元,则该农产品平均价格是多少?(2.44)若分别在各市场购买了3元、5元、4元,则该农产品平均价格是多少?(2.48)调和平均数也称为倒数平均数。各变量值的倒数(1/xi)的算术平均数的倒数。其计算公式为:(三)几何平均数1.集中趋势的测度值之一2.n个变量值乘积的n次方根3.适用于特殊的数据4.主要用于计算平均发展速度5.计算公式为:三、位置平均数—众数和中位数(一)众数集中趋势的测度值之一出现次数最多的变量值不受极端值的影响可能没有众数或有几个众数既可用于数值型数据,也可用于非数值型数据众数是一组数据中出现频数最多、频率最高的变量值,常用M0表示。如表3-2中年龄的众数值MO=25。众数代表的是最常见、最普遍的状况,是对现象集中趋势的度量。可用来测度定性变量的集中趋势;销售量最大的产品颜色是“白色”,则有M0=“白色”可以度量定量变量的集中趋势。从分布曲线的角度看,众数就是变量分布曲线的最高峰所对应的变量值。xMOf(x)组距分组数据众数的确定1.众数的值与相邻两组频数的分布有关2.相邻两组的频数相等时,众数组的组中值即为众数3.该公式假定众数组的频数在众数组内匀整分布4.相邻两组的频数不相等时,众数接受下列近似公式计算:下限公式:上限公式:Mo(二)中位数1.集中趋势的测度值之一2.排序后处于中间位置上的值Me50%50%不受极端值的影响未分组数据中位数的确定依据(n+1)/2确定中间位置若数据项数是奇数,则正好位于中间的数值就是中位数;如5人收入为:1200,1450,1500,1600,2000元,则收入的中位数Me=1500若数据项数是偶数,则取居中两个数值的平均数为中位数。如6人收入为:1200,1450,1500,1600,1800,2000元,则收入的中位数Me=1550组距分组数据中位数的确定先确定中位数组,即中间位置(用Σf/2来计算)所在的组。假定中位数组内次数匀整分布(次数与变量值的区间大小成比例),近似推算中位数的值。接受下列近似公式计算:下限公式:上限公式:四、众数、中位数和算术平均数的比较1.算术平均数综合反映了全部数据的信息,众数和中位数由数据分布的特定位置所确定。2.算术平均数和中位数在任何一组数据中都存在而且具有唯一性,但计算和应用众数有两个前提条件:(1)数据项数众多;(2)数据具有明显的集中趋势。3.算术平均数只能用于定量(数值型)数据,中位数适用于定序数据和定量数据,众数适用于全部形式(类型、计量层次)的数据4.算术平均数要受数据中极端值的影响。而众数和中位数都不受极端值的影响。为了解除极端值的干扰,可计算切尾均值,即去掉数据中最大和最小的若干项数值后计算的均值。切尾均值是将均值与中位数取长补短的结果。5.算术平均数可以推算总体的有关总量指标,而中位数和众数则不宜用作此类推算。算术平均数和众数、中位数的数量关系在对称分布中,三者相等.即:均值=Me=Mo;x<Me<Mox=Me=MoMo

<

Me<x在左偏分布中,一般有:

均值<Me<Mo在右偏分布中,一般有:Mo<Me<均值。皮尔生阅历公式:在稍微偏态时,三者的近似关系:其次节分布的离散程度一、变异指标的含义及其作用二、极差(全距)三、平均差四、方差和标准差五、离散系数问题提出:

有A、B两种证券,有关预期收益率及概率资料如下:项目预期收益率(%)概率(%)A140308050–6020B1803012030–5040(1)分别计算A、B两种证券的期望收益率。(2)应选择哪种证券进行投资?为什么?EA=140×0.3+80×0.5–60×0.2=70(万元)EB=180×0.3+120×0.3–50×0.4=70(万元)可见A、B这两种证券的预期收益率是一样的。但A、B这两种证券的风险程度是有差别的。A证券的收益率波动较小,而B证券的收益率波动较大,因而B证券的风险程度较高。因此在收益相同状况下,宜选择风险程度较小的A证券进行投资。离中趋势(离散程度)数据分布的另一个重要特征离中趋势的各测度值是对数据离散程度所作的描述反映各变量值远离其中心值的程度,因此也称为离中趋势从另一个侧面说明白集中趋势测度值的代表程度不同类型的数据有不同的离散程度测度值一、变异指标的含义及其作用1.衡量平均数的代表性。离散程度越大,平均数的代表性就越小。2.反映现象变动的均衡性。数据之间差异越大,现象的稳定性或均衡性越差。3.统计推断的重要依据判别统计推断前提条件是否成立。衡量推断效果好坏的重要尺度。二、全距1.一组数据的最大值与最小值之差2.离散程度的最简洁测度值3.易受极端值影响4.不能考虑全部数据的分布5.计算简便、含义直观、简洁理解■6.计算公式为:未分组数据R=xmax-xmin组距分组数据R=Umax-Lmin四分位差1. 离散程度的测度值之一2. 上四分位数与下四分位数之差Qd=Q3

–Q1

3.反映了中间50%数据的离散程度4.避开极端数值的影响5.不能考虑全部数据的分布Q1MeQ325%25%25%25%三、平均差平均差——各个数据与其均值的离差确定值的算术平均数,反映各个数据与其均值的平均差距,通常以A.D表示。计算公式为:未分组数据:已分组数据:三、平均差1.离散程度的测度值之一2.各变量值与其均值离差确定值的平均数3.能全面反映一组数据的离散程度4.因取确定值,数学性质不志向,实际中应用较少四、方差和标准差1.离散程度的测度值之一2.最常用的测度值3.反映了各变量值与均值的平均差异4.反映了全部数据的分布5.依据总体数据计算的,称为总体方差或标准差;依据样本数据计算的,称为样本方差或标准差1.方差方差是各个数据与其均值的离差平方的算术平均数总体方差(σ2)的计算公式为:未分组数据:分组数据:样本方差(通常用S2表示)分母应为(n-1)。变量的方差等于变量平方的平均数减去变量平均数的平方。即:2.标准差-方差的算术平方根总体标准差一般用σ表示。其计算公式为:未分组数据:分组数据:标准差比方差更简洁理解。在社会经济现象的统计分析中,标准差比方差的应用更为普遍,常常被用作测度数据与均值差距的标准尺度。样本标准差(S)分母应为(n-1)。【例】计算平均差和方差、标准差使用寿命(小时)组中值(x)试验数量(只)f(x-1542)|x-1542|f(X-1542)2f1000以下9002-64212848243281000-120011008-442353615629121200-1400130016-24238729370241400-1600150035-421470617401600-180017002315836345741721800-2000190012358429615379682000以上2100455822321245456合计——100——2032467436003.是非标记的方差与标准差4.标准化值标准化值或标准得分也称为Z值。对于来自不同均值和标准差的个体的数据,往往不能干脆对比。这就须要将它们转化为同一规格、尺度的数据后再比较。标准化值事实上是将不同均值和标准差的总体都转换为均值为0、标准差为1的总体,将各个体的数据转换为它在其总体中的相对位置。举例(一):现有两个班(一班和二班)统计学成果:一班成果的均值78.53和标准差9.43,二班成果的均值70.19和标准差7.00。假定两个班水平类似,但由于两个任课老师的评分标准或试题不同,则应如何评价两个班学生的成果才比较合理?一班张三90分,二班李四82分,哪个学生成果更好?只要把各个观测值都转化成相应的标准得分,就可以进行比较了。张三的标准

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论