第三章数据分布特征描述_第1页
第三章数据分布特征描述_第2页
第三章数据分布特征描述_第3页
第三章数据分布特征描述_第4页
第三章数据分布特征描述_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章数据分布特征描述第三章数据分布特征描述PAGE1/PAGE16第三章数据分布特征描述第三章数据分布特征描述Ⅰ.学习目的通过本章的学习,1.理解统计数据分布的集中趋势和离散程度的概念;2.掌握描述统计数据分布的集中趋势和离散程度的各代表值的测定、计算与分析方法;3.能够应用各种指标分析实际问题;4.了解分布偏度与峰度的描述。Ⅱ.课程内容要点第一节统计变量集中趋势的测定一、测定集中趋势的意义统计数据的集中趋势(或中心位置)是指数据向其中心值靠拢或集中的程度。测定集中趋势是为了表示社会经济现象总体各单位某一标志在一定时间、地点条件下所达到的一般水平。测定集中趋势的作用有四:首先,反映总体各单位变量分布的集中趋势和一般水平;其次,比较同类现象在不同单位的发展水平;再次,比较同类现象在不同时期的发展变化趋势或规律;最后,分析现象之间的依存关系。二、位置代表值测定集中趋势常用的位置代表值有众数和中位数。众数是总体中最普遍出现的标志值。中位数是总体各单位按大小顺序序列化后,处在数列中点位置上那个单位的标志值。对分组或未分组的资料和组距式变量数列,众数和中位数各有不同的确定方法。三、数值平均数数值平均数就是均值,它是对总体中的所有数据计算平均值,用以反映所有数据的一般水平。1、算术平均数的基本公式是总体标志总量除以总体单位总量。其有简单式和加权式两种。加权算术平均数中权数的权衡轻重的作用体现在各标志值对平均数的影响上,权数大的标志值对平均数的影响也大,权数小的标志值对平均数的影响也小。权数必须是标志值的直接承担者,权数与标志值的乘积要具有标志总量的意义。只有当三个量之间存在着客观的数量对等关系时,各组单位数才是加权算术平均数的合适权数。当各组频数都相等时,权数不起作用。是非标志的算术平均数。算术平均数有四个数学性质。2、调和平均数是总体中各单位标志值倒数的算术平均数的倒数,又称“倒数平均数”。也有简单调和平均数和加权调和平均数两种。在统计实践中,调和平均数常常被作为算术平均数的变形来使用:当因为数据的原因不能采用算术平均数的方法计算均值时,可以考虑采用调和平均数的形式。3、几何平均数是N个变量值(比率)连乘积的N次方根,通常用于时间上有联系或有先后顺序关系的比率求平均,凡是度量值的连乘积等于总比率或总速度的现象都必须使用几何平均法计算均值。几何平均数根据所掌握数据资料不同,有简单几何平均数和加权几何平均数两种方法。4、幂平均数是标志值K次方的平均数的K次方根。5、计算和应用集中趋势测定指标应注意三个问题:(1)集中趋势的测定指标只能应用于同质总体。(2)用组平均数和分配数列补充说明总平均数。(3)集中趋势指标与离散程度指标相结合。四、集中趋势测定指标的关系1、众数、中位数和算术平均数各自的含义、计算方法不同,但三者之间存在一定的数量联系。对称分布时,三者相等;适度正偏斜时,<<;适度负偏斜时则相反。适度偏斜情形下,可采用皮尔生经验公式进行推算:。2、在相同的数据中,算术平均数、调和平均数和几何平均数在数值是的关系如下:。第二节统计变量离散程度的测定一、离散程度测定的意义在实践中,测定离散程度的主要作用在于:1、反映现象总体各单位的标志值的差异程度。2、衡量均值的代表性。3、测定现象变动的均匀性或稳定性程度。一、极差、四分位差和平均差极差又称全距,是最大和最小观测值之间的距离。2、四分位差是在数列中剔除最大和最小各四分之一的数据,是第一和第三个四分位数之间距离的二分之一。3、平均差是分配数列中各单位标志值与其算术平均数之间离差绝对值的平均数。三、方差与标准差方差是总体各单位标志值与其算术平均数离差的平方的算术平均数。标准差是方差的平方根,总方差等于组间方差和组内方差平均数之和。方差和标准差有5个数学性质。是非标志的方差即0-1分布的方差,当时,非标志的方差达到最大可能值。方差和标准差有五个数学性质。极差、分位差和标准差都是绝对量指标,它们的计量单位与标志值相同。它们的大小不仅取决于总体的变异情况,也和标志值水平的高低、计量水平的不同有关。四、离散系数与异众比率离散系数是数量数据的各离散程度指标与其算术平均数的比值。最常用的离散系数是标准差系数:。离散系数是一个无量纲的量。它适于比较不同现象或具有不同水平数据的变异程度的情况。异众比率是指非众数的次数与全部变量值总次数的比率。第三节变量分布偏度与峰度的描述一、矩矩也称为动差。它是总体中所有变量值与任意常数离差K次方的算术平均数。矩有原点矩和中心矩两种。一阶原点矩就是变量的算术平均数,二阶原点矩就是变量平方的算术平均数。一阶中心矩为0,二阶中心矩就是方差。二、偏度偏度指分布不对称的方向和程度,它可用三阶中心动差除以标准差三次方来度量。三、峰度峰度又称峭度,是指分布图形的尖峭程度或峰凸程度。峰度指标可用四阶中心动差除以标准差四次方再减去3,来度量。Ⅲ.考核知识点与考核要求(一)识记:1.算术平均数、调和平均数、几何平均数、幂平均数、众数、中位数指标的定义、特点与计算方法。2.权数的定义、形式和作用。3.极差、四分位差、方差和标准差的定义、特点与计算方法。4.变异系数尤其是标准差系数的定义、特点与计算方法。5、偏度和峰度的定义、特点与计算方法。(二)领会1.权数的意义及其选择;2.算术平均数的数学性质;3.众数、中位数和算术平均数三者之间存在的数量联系;算术平均数、调和平均数和几何平均数之间存在的数量关系。(三)应用1.对客观数据进行统计综合描述,利用集中趋势和离中趋势说明数据的特征。2.利用偏度和峰度分析数据的分布形状。Ⅳ.习题详解一、选择题1.C2.D3.B4.C5.B6.ABCDE7.ADE8.BC9.BCE10.ADE二、计算题1.解:(1)(元/斤)(2)(元/斤)2.解:(1);(2);(3);(4);(5);(6);(7)异众比率=0.65;(8),,3.解:平均商品销售价值(元/公斤)4.解:计算表如下:月工资组中值各组工人比重(%)450550650750850202530151090.0137.5195.0112.585.0合计100620.0该工业集团公司工人平均工资620元。5.解:成交额单位:万元,成交量单位:万斤。品种价格(元)甲市场乙市场成交额成交量成交量成交额甲乙丙1.21

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论