《统计数据的度量》PPT课件.ppt_第1页
《统计数据的度量》PPT课件.ppt_第2页
《统计数据的度量》PPT课件.ppt_第3页
《统计数据的度量》PPT课件.ppt_第4页
《统计数据的度量》PPT课件.ppt_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章 统计数据的测度,第一节.总量指标 概念:反映总体现象的总规模、总水平的综合指标。也称为绝对数。它是统计总体最基本的指标。,按其反映的内容不同可分为:,总体单位总量 说明总体的单位数数量。 标志总量 说明总体中某个标志值总和的量。,按其反映的时间状况不同可分为:,时期指标 反映现象在某一时期发展过程的总数量。(可连续计数,与时间长短有关,是累计结果) 时点指标 反映现象在某一时刻的状况。 (间断计数,与时间间隔无关,不能累计),第二节、相对指标,表现形式,有名数:人/每平方公里 无名数:倍数、百分数等,概念:相对指标习惯上称为相对数,它是两个相互联系的指标数值的比值,用来反映相关事物之间数量联系程度的综合指标。 作用: 利用相对指标,可以说明现象和过程的比率、构成、速度、密度、普遍程度等,以更深刻地反映现象的实质特征。,十五”时期城乡居民生活改善情况,运用相对指标应注意的问题 (一)要注意相对比的指标的可比性 1。应注意范围的可比。 2。应注意总体构成是否可比。 3。应注意计算方法、计量单位的可比 (二)应注意正确选择对比基数 (三)应注意相对指标与总量指标的结合运用 (四)应注意多种相对指标结合运用,第三节、集中趋势的测度,第三节、集中趋势的测度,算术平均数(均值) (mean) 1. 集中趋势的测度值之一 2. 最常用的测度值 3. 一组数据的均衡点所在 4. 易受极端值的影响 5. 用于数值型数据,不能用于分类数据和顺序数据,加权均值的计算公式为,F1 , F2, ,FN,相应的频数为:,X1 ,X2 , ,XN,设分组后的数据为:,简单均值的计算公式为,X1 ,X2 , ,XN,设一组数据为:,原始数据: 10 5 9 13 6 8,频数分布表的编制 (实例),117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121,【例3.3】某生产车间50名工人日加工零件数如下(单位:个)。试采用单变量值对数据进行分组。,【例】根据以上数据,计算50 名工人日加工零件数的均值,均值 (数学性质),1. 各变量值与均值的离差之和等于零,2. 各变量值与均值的离差平方和最小,调和平均数 (harmonic mean),1. 集中趋势的测度值之一 2. 均值的另一种表现形式 3. 易受极端值的影响 4. 用于定比数据 5. 不能用于定类数据和定序数据 6. 计算公式为,调和平均数 (算例),【例】某蔬菜批发市场三种蔬菜的日成交数据如表4-2,计算三种蔬菜该日的平均批发价格,几何平均数 (geometric mean),1. 集中趋势的测度值之一 2. N 个变量值乘积的 N 次方根 3. 适用于特殊的数据 4. 主要用于计算平均发展速度,6. 可看作是均值的一种变形,5. 计算公式为,几何平均数 (算例),【例】一位投资者持有一种股票,1996年、1997年、1998年和1999年收益率分别为4.5%、2.0%、3.5%、5.4%。计算该投资者在这四年内的平均收益率。,平均收益率103.6%-1=3.6%,位置平均数 众数 (mode),1.集中趋势的测度值之一 2.出现次数最多的变量值 3.不受极端值的影响 4.可能没有众数或有几个众数,分类数据的众数 (例题分析),解:这里的变量为“饮料品牌”,这是个分类变量,不同类型的饮料就是变量值 所调查的50人中,购买可口可乐的人数最多,为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即 Mo可口可乐,1.单项数列确定众数。 只需要直接判断哪一组的次数最多,该组的变量值即为众数,用Mo表示。 2.组距式分组资料计算众数 在组距式分组资料中,众数的计算就带有一定的假定性。先根据数列次数最多的组确定为众数所在组,再利用插补法求其众数近似值。形成了两个计算公式,即上限公式和下限公式:,式中:Mo表示众数 L表示众数所在组的下限 U表示众数所在组的上限 1是众数所在组的次数f2与其下限邻近组的次数f1之差 2是众数所在组的次数f2与其上限邻近组的次数f3之差 i表示众数所在组的组距,中位数 (median),1. 集中趋势的测度值之一 2. 排序后处于中间位置上的值 不受极端值的影响 主要用于顺序数据,也可用数值型数据,但不能用于分类数据 各变量值与中位数的离差绝对值之和最小,即,1.未分组资料确定中位数 在资料未分组情况下,将总体各单位的标志值按其大小顺序排列,确定标志值数列的中间位置点,即中位数位置(N+1)/2,当N为奇数时,当N为偶数时,2.单项式分配数列的中位数计算 在单项式分配数列情况下,先计算各组的累计次数,然后根据中点的位次(f/2)所在的组来确定中位数所在组,中位数所在组的标志值就是中位数。,3.组距式分组资料的中位数计算 对于组距数列资料,首先要确定中位数所在组,再利用其上限公式或下限公式计算:,式中:Me为中位数; i为中位数所在组的组距; L为中位数所在组的下限; U为中位数所在组的上限; fm为中位数所在组的次数; Sm-1为中位数组下限的邻近组及以下各组的累计次数; Sm+1为中位数组上限的邻近组及以上各组的累计次数,四分位数 (quartile),1. 集中趋势的测度值之一 2. 排序后处于25%和75%位置上的值 3. 不受极端值的影响 4. 主要用于顺序数据,也可用于数值型数据,但不能用于分类数据,四分位数位置的确定,未分组数据,组距分组数据,数值型未分组数据的四分位数 (7个数据的算例),原始数据: 23 21 30 32 28 25 26 排 序: 21 23 25 26 28 30 32 位 置: 1 2 3 4 5 6 7,QL= 23,QU = 30,数值型未分组数据的四分位数 (6个数据的算例),原始数据: 23 21 30 28 25 26 排 序: 21 23 25 26 28 30 位 置: 1 2 3 4 5 6,QL= 21+0.75(23-21) = 22. 5,QU = 28+0.25(30-28) = 28.5,数值型分组数据的四分位数 (计算示例),计算50 名工人日加工零件数的四分位数,QL位置50/412.5,QU位置350/437.5,众数、中位数和均值的关系,根据英国统计学家皮尔逊的经验,在轻微偏态情况下,算术平均数与中位数的距离约为算术平均数与众数距离的1/3,即有:,左偏分布,均值,中位数,众数,右偏分布,众数,中位数,均值,对称分布,2(Me )=MoMe,众数、中位数和均值的特点和应用,1.众数 不受极端值影响 具有不唯一性 数据分布偏斜程度较大时应用 2.中位数 不受极端值影响 数据分布偏斜程度较大时应用 3.均值 易受极端值影响 数学性质优良 数据对称分布或接近对称分布时应用,第四节 离散程度的测度,数据分布的另一个重要特征 离中趋势的各测度值是对数据离散程度所作的描述 反映各变量值远离其中心值的程度,因此也称为离中趋势 从另一个侧面说明了集中趋势测度值的代表程度 判断平均数的代表性;反映现象变动的稳定性。,极差 (range),1. 一组数据的最大值与最小值之差 2. 离散程度的最简单测度值 3. 易受极端值影响 4. 未考虑中间变动数据,5. 计算公式为,未分组数据 R = max(Xi) - min(Xi),组距分组数据 R = 最高组上限 - 最低组下限,异众比率 (variation ratio),1. 离散程度的测度值之一 2. 非众数组的频数占总频数的比率 3. 计算公式为,4. 用于衡量众数的代表性,四分位差 (quartile deviation),1. 离散程度的测度值之一 2. 也称为内距或四分间距 3. 上四分位数与下四分位数之差 QD = QU - QL 4. 反映了中间50%数据的离散程度 5.不受极端值的影响 6.用于衡量中位数的代表性,平均差 (mean deviation),1. 离散程度的测度值之一 2. 各变量值与其均值离差绝对值的平均数 3. 能全面反映一组数据的离散程度 4. 数学性质较差,实际中应用较少 5. 计算公式为 未分组数据 组距分组数据,平均差 (计算过程及结果),方差和标准差 (variance and standard deviation),1. 离散程度的测度值之一 2. 最常用的测度值 3. 标准差:各变量值与均值离差平方的平均数的平方根 4. 反映了各变量值与均值的平均差异程度 根据总体数据计算的,称为总体方差或标准差; 根据样本数据计算的,称为样本方差或标准差,总体方差和标准差 (计算公式),方差的计算公式,未分组数据:,未分组数据,组距分组数据:,组距分组数据:,标准差的计算公式,总体标准差,【例】计算工人日加工零件数的标准差,样本方差和标准差 simple variance and standard deviation,方差的计算公式 未分组数据:,组距分组数据:,标准差的计算公式,组距分组数据:,相对位置的测量:标准分数 (standard score),1. 也称标准化值 2. 给出某一个值在一组数据中的相对位置 3. 可用于判断一组数据是否有离群点 4. 用于对变量的标准化处理 5. 计算公式为,标准化值 (例题分析),标准分数 (性质),1、均值等于0 2、方差等于1,标准分数 (性质),z分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数分布的形状,而只是将该组数据变为均值为0,标准差为1。,经验法则,经验法则表明:当一组数据对称分布时 约有68%的数据在平均数加减1个标准差的范围之内 约有95%的数据在平均数加减2个标准差的范围之内 约有99%的数据在平均数加减3个标准差的范围之内,1. 标准差与其相应的均值之比 2. 消除了数据水平高低和计量单位的影响 3. 测度了数据的相对离散程度 4. 用于对不同组别数据离散程度的比较,离散系数 (coefficient of variation),5. 计算公式为,离散系数 (实例和计算过程),某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度,结论: 计算结果表明,V1V2,说明产品销售额的离散程度小于销售利润的离散程度,第五节 偏态与峰态的测度,峰态及其测度,偏态及其测度,偏态与峰度分布的形状,偏态 (skewness),1、数据分布偏斜程度的测度 2. 偏态系数=0为对称分布 3. 偏态系数 0为右偏分布 4. 偏态系数 0为左偏分布 5. 计算公式为,偏态 (实例),【例】已知2007年我国农村居民家庭按纯收入分组的有关数据。试计算偏态系数,农村居民家庭村收入数据的直方图,偏态与峰度 (从直方图上观察),按纯收入分组(元),结论:1. 为右偏分布 2. 峰度适中,偏态系数 (计算过程),偏态系数 (计算结果),将计算结果代入公式得,结论:偏态系数为正值,而且数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论