模块四-数据特征的描述2_第1页
模块四-数据特征的描述2_第2页
模块四-数据特征的描述2_第3页
模块四-数据特征的描述2_第4页
模块四-数据特征的描述2_第5页
已阅读5页,还剩93页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

模块四数据特征的描述任务1总量与相对量的测度任务2集中趋势的测度任务3离散程度的测度模块四数据特征的描述2模块四数据特征的描述2知识目标掌握总量指标的含义、种类和计量方法掌握相对指标的含义、种类和计量方法能力目标能够正确运用总量指标与相对指标对研究对象进行描述能够对常用相对指标进行计算模块四数据特征的描述2任务引入我国2016年和2017年的国内生产总值及三次产业增加值资料见表。我国2016年和2017年的GDP资料单位:万亿元模块四数据特征的描述2要求:(1)判断表中指标类型。(2)计算动态相对指标,反映2016年到2017年GDP总量及三次产业增加值的变化。(3)分别用结构相对指标和比例相对指标反映2016年和2017年我国GDP的内部结构。模块四数据特征的描述2任务分析对调查数据整理后,通过统计表或统计图的展示还不够,总体数据特征的描述还需要使用相应的综合指标来完成。这些综合指标有总量指标、相对指标和平均指标三种类型。本任务的目的是引导大家认识总量指标和相对指标,并掌握这两类指标的计算方法。模块四数据特征的描述2相关知识一、总量指标1.总量指标的含义总量指标是描述社会经济现象总规模、总水平的指标,一般以绝对数的形式存在,又叫绝对数。总量指标是认识现象数量特征的起点指标,也是计算其他形式指标的基础。模块四数据特征的描述22.总量指标的计量单位总量指标计量单位有实物单位、价值单位、劳动单位三类。实物单位反映了事物的自然属性和特征,具体的表现形式有自然单位、度量衡单位、标准实物单位、复合单位等。价值单位即货币计量单位,如元、万元、亿元等,以价值单位计算的价值量指标可以反映某一类或若干类事物价值量的总规模,如GDP总量、商品销售额、工资总额等。劳动单位一般在生产性企业使用,是制定劳动定额或统计产出的一种计量工具,如工日、工时等。模块四数据特征的描述23.总量指标的种类总量指标通常是简单加总的结果,求和符号为“∑”。总量指标的种类模块四数据特征的描述2时期总量反映现象在一定时间范围内发展变化的总规模,又称流量。时点总量反映现象在某一时点或瞬间状态上的总规模,又称存量。总体单位总量是一项调查中调查单位的总数量。总体标志总量是总体各单位某一标志的总和。模块四数据特征的描述2二、相对指标1.相对指标的含义对比分析通常有两种方法:一是差额比较法,二是相对程度比较法。相对指标是两个有相互联系的指标的对比,用以反映现象之间的对比关系,又称相对数。其计算公式为:

。模块四数据特征的描述22.相对指标的计量相对指标的计量形式有有名数和无名数两种。有名数一般表现为复名数的形式,如人/平方公里、元/人、千克/人等,表现现象的强度、密度和普遍程度等。无名数是一种抽象化的数值,如系数、倍数、成数、百分数和千分数等。模块四数据特征的描述23.相对指标的种类及计量方法(1)计划完成程度相对指标计算公式如下:相对指标的种类模块四数据特征的描述21)短期计划检查是将按月度、季度或年度统计的实际完成数与计划任务数进行对比。计划数是绝对数时,可将实际完成数与计划任务数直接对比计算计划完成程度。计划数是相对数时,需要用实际完成百分比与计划完成百分比进行对比来计算计划完成程度。计划完成程度检查的类型模块四数据特征的描述22)中、长期计划检查是对5年或5年以上计划任务的检查。中、长期计划的检查有水平法和累计法两种方法。水平法适合于只规定计划期末要达到某种水平的现象。计算公式为:累计法适合于规定计划期全期累计应达到某个规模的现象。计算公式如下:模块四数据特征的描述2(2)结构相对指标结构相对指标是总体中的一部分数值与总体全部数值对比的结果,以反映总体内部的构成情况一般用百分数表示,各部分占总体的比重之和应等于100%。计算公式如下:模块四数据特征的描述2(3)比例相对指标比例相对指标是总体中某一部分数值与另一部分数值对比的结果,反映总体中各部分数值之间的对比关系。计算公式如下:(4)比较相对指标比较相对指标是在同一时间不同空间条件下同类指标数值对比的结果。计算公式如下:模块四数据特征的描述2(5)强度相对指标强度相对指标是两个性质不同但又有密切联系的两个总量指标对比的结果,强度相对指标反映现象的强度、密度和普遍程度。计算公式如下:(6)动态相对指标动态相对指标是某一指标在不同时间上的数值对比,反映现象的动态变化。计算公式如下:模块四数据特征的描述2任务实施1.判断指标类型2.计算动态相对指标3.计算结构相对指标4.计算比例相对指标模块四数据特征的描述2知识目标了解集中趋势的含义掌握算术平均数的应用条件及计算方法掌握众数和中位数的应用条件及确定方法掌握几何平均数的应用条件及计算方法能力目标能够使用Excel中的统计函数计算算术平均数、众数、中位数、几何平均数能够根据所学知识选择合适的集中趋势代表值反应现象的一般水平模块四数据特征的描述2任务引入某学校136名学生月消费支出额的原始数据见表。要求:选择合适的方法计算136名学生月消费支出的平均水平。模块四数据特征的描述2

136名学生月消费支出额资料单位:元模块四数据特征的描述2任务分析数据整理后形成的频数分布表及统计图形只是数据描述的初步。对数据分布的特征更加准确的描述,则需要更精确的统计方法,这就是集中趋势的测度方法和离散趋势的测度方法。本任务的主要目的是引导大家学习数据集中趋势的测度方法。模块四数据特征的描述2相关知识一、集中趋势及其度量方法集中趋势是一组数据向其中心值靠拢的倾向和程度,它反映了一组数据中心点所在的位置。在选择测度数据集中趋势的方法时,一是要考虑数据的类型,二是要考虑数据的分布特征。模块四数据特征的描述2集中趋势的测度方法模块四数据特征的描述2

模块四数据特征的描述22.加权算术平均数加权算术平均数是对已分组的数据资料计算平均数的形式。计算公式如下:当权数为比重或频率形式时,计算平均数的公式为:模块四数据特征的描述2(1)由单项式数列计算加权算术平均数(2)由组距式数列计算加权算术平均数(3)加权算术平均数的权数(4)平均数的两个数学性质性质之一:各变量值与其算术平均数离差之和等于零,即

性质之二:各变量值与其算术平均数离差平方和最小,即

最小值。模块四数据特征的描述2三、众数众数是一组数据中出现频率最高的数值,用“Mo

”表示。众数示意图a)单众数b)双众数c)无众数模块四数据特征的描述2对于大部分数值型数据,将原始数据整理成组距式频数分布表后,计算众数需要使用下列公式推算:下限公式:上限公式:式中,L

是众数所在组的下限,U

是众数所在组的上限,Δ1

是众数所在组的次数与前一组次数之差,Δ2

是众数所在组的次数与后一组次数之差,i

是众数所在组的组距。模块四数据特征的描述2四、中位数中位数是一组数据按大小顺序排列后,处于中间位置上的数据,用“Me”表示。1.根据未分组的数据确定中位数首先要对数据进行排序,然后确定中位数所在位置,最后确定中位数的具体数值。中点位置是(n

为变量值的个数),该位置上的变量值就是中位数。模块四数据特征的描述2若是偶数项,数据就没有明确的居中观测值。中位数示意图a)奇数项b)偶数项模块四数据特征的描述22.根据单项式分组数列确定中位数计算步骤为:(1)计算累积频数(向上累积或向下累积)。(2)确定中位数所在组:首先包含

的累积频数所在组就是中位数所在组。(3)中位数所在组的变量值即为中位数。模块四数据特征的描述23.根据组距式分组数列计算中位数计算步骤为:(1)计算累积频数(向上累积或向下累积)。(2)确定中位数所在组:首先包含

的累积频数所在组就是中位数所在组。模块四数据特征的描述2(3)根据上限公式或下限公式推算中位数。下限公式(采用“向上累积”):上限公式(采用“向下累积”):式中,fm

是中位数所在组的次数,Sm-1

是向上累积时中位数所在组前一组的累积频数,Sm+1是向下累积时中位数所在组前一组的累积频数。模块四数据特征的描述2五、算术平均数、众数、中位数的关系算术平均数、众数、中位数是反映数据分布集中趋势的三个主要测度值。模块四数据特征的描述2六、几何平均数几何平均数是n

个变量值乘积的n

次方根,用G

表示。几何平均数是适用于特殊数据的平均数,主要用于计算平均比率和平均速度。算术平均数、众数、中位数的关系图a)对称分布b)右偏态分布c)左偏态分布模块四数据特征的描述21.简单几何平均数适用于未分组数据,其计算公式可以表示为:式中,x1

、x2、…、xn

为n

个变量值,n

个变量值的乘积x1·x2…xn

表示变量值的总量,乘积的n

次方根表示变量值的平均数,Π为连乘的符号。模块四数据特征的描述22.加权几何平均数适用于已分组数据,其计算公式可以表示为:式中

f1

、f2

、…、fn

为各组变量的频数,Π为连乘符号。3.应用几何平均数应注意两点第一,当一组数据中有一项数值为0或负数时就不能计算几何平均数。第二,当被平均的速度或比率的数值差别不大时,几何平均数与算术平均数的计算结果相差不大;当各速度或比率的数值差别较大时,两种平均数的计算结果差别明显,一般几何平均数小于算术平均数。模块四数据特征的描述2任务实施一、利用Excel中的函数对表的原始数据计算算术平均数、中位数、众数1.数据准备模块四数据特征的描述2136名学生月消费支出额资料单位:元模块四数据特征的描述21.简单几何平均数方法一:①点击函数按钮fx

,如图所示。②选择“统计”函数,再选择“AVERAGE”函数,如图所示。③鼠标移至“Number1”框,并选中存放原始数据的单元格区域,这里是“A1:H17”,这时,对话框底部就给出了计算结果,这里计算的平均数为300.6176471,如图所示。方法二:单击任一空单元格,输入“=AVERAGE(A1:H17)”,按“回车”键确认,得到结果为300.6176471。模块四数据特征的描述2点击“函数”按钮模块四数据特征的描述2选择“统计”函数和“AVERAGE”函数模块四数据特征的描述2“AVERAGE”对话框模块四数据特征的描述23.利用“MEDIAN”函数计算中位数方法一:点击函数按钮fx,选择“统计”函数,再选择“MEDIAN”

函数,鼠标移至“Number1”框,并选中存放原始数据的单元格区域,这里是“A1:H17”,这时,对话框底部就给出了计算结果,这里的中位数为305,如图所示。方法二:单击任一空单元格,输入“=MEDIAN(A1:H17)”,按“回车”键确认,得到结果305。模块四数据特征的描述2“MEDIAN”对话框模块四数据特征的描述24.利用“MODE”函数计算众数方法一:点击函数按钮fx

,选择“统计”函数,再选择“MODE”

函数,鼠标移至“Number1”框,并选中存放原始数据的单元格区域,这里是“A1:H17”,这时,对话框底部给出了计算结果,这里的众数为320,如图所示。方法二:单击任一空单元格,输入“=MODE(A1:H17)”,按“回车”键确认,得到结果320。模块四数据特征的描述2“MODE”对话框模块四数据特征的描述2二、利用Excel的单元格操作对表的分组数据计算平均数、众数、中位数136名学生月消费支出额资料单位:元模块四数据特征的描述2对于组距式变量数列,首先计算各组的组中值,再进行以下操作。1.计算算术平均数计算各组的支出总额:单击D2单元格,输入“=B2∗C2”后,按“回车”键确认,得出第一组6个人的消费支出总额;按住D2单元格的填充柄,下拖至D9单元格,得到其他组的消费支出总额,如图所示。计算总体的支出总额:单击D10单元格,点击求和符号“∑”,选中D2到D9单元格,按“回车”键确认,可计算出136人的消费开支总额,如图所示。

计算平均每人的月均支出额:单击任一单元格(放置计算结果的单元格),这里是E5单元格,输入“=D10/C10”,按“回车”键确认,得到加权算术平均数计算结果299.632,如图所示。模块四数据特征的描述2

加权算术平均数计算表模块四数据特征的描述22.计算中位数对于已分组资料计算中位数没有相应的函数,采用下限公式计算,计算方法如下:模块四数据特征的描述2单击任一单元格,这里选中D6单元格,输入“=300+((68-66)/30)∗50”,点击“确认”按钮,即可计算出中位数303.3333,如图所示。中位数计算表模块四数据特征的描述23.计算众数对于已分组资料计算中位数没有相应的函数,采用下限公式计算,计算方法如下:模块四数据特征的描述2单击任一单元格,这里是C6单元格,输入“=300+(3/(3+6))∗50”,按“回车”键确认,即可计算出众数316.6667,如图所示。众数计算表模块四数据特征的描述2三、结果说明1.根据原始数据计算的结果更准确。2.算术平均数是136名学生月消费支出的合适代表值。模块四数据特征的描述2知识目标了解离散程度的含义掌握异众比率、四分位差、极差、平均差、标准差、方差、变异系数的计算方法及其适用条件能力目标能够使用Excel中的统计函数计算离散指标能够针对一组特定数据,利用离散指标并结合集中趋势测度值解释数据的特征模块四数据特征的描述2任务引入选择相应的方法对模块二任务2中136名学生的月消费支出额计算离散指标,并对该组数据的离散程度进行描述。136名学生月消费支出额资料单位:元模块四数据特征的描述2任务分析任务2对136名学生月均消费支出额的集中趋势进行了测度,计算出了月均消费支出额的代表值,代表值将每名学生每月支出的差异给抽象掉了,然而这种差异仍然是存在的,若想了解这种差异的程度,则需要另一类指标来测度,这就是离散指标。本任务的目的是学习离散程度的测度方法。模块四数据特征的描述2相关知识一、离散程度及其测度方法数据的离散程度是一组数据各变量值远离其中心值的程度,也称离中趋势。离散程度的测度方法模块四数据特征的描述2二、常用离散指标的计算1.异众比率异众比率主要用于衡量众数对一组数据的代表程度,用非众数组的频数之和占总频数的比重表示。模块四数据特征的描述22.四分位差四分位差的意义是,约有50%的数据应落在上四分位数和下四分位数之间。四分位数及四分位差示意图模块四数据特征的描述23.极差极差是一组数据的最大值与最小值之差,又称为全距,用“R”表示。极差是离散指标中最简单的计算方法,但它只强调了两个极端的数值,而忽视了其他的观察值。模块四数据特征的描述24.平均差平均差是各变量值与其平均数离差绝对值的平均数,用“A.D”表示。(1)简单平均差简单平均差适用于未分组资料。计算公式为:(2)加权平均差加权平均差适用于已分组资料。计算公式为:模块四数据特征的描述25.方差和标准差方差是各变量值与其算术平均数离差平方的算术平均数。标准差是方差的平方根。标准差与平均差的意义基本相同,都表示各变量值与其算术平均数的平均离差程度,但在数学处理上有所不同。平均差是通过绝对值的方法消除离差的正负号,而标准差则是通过平方的方法消除离差的正负号,标准差在数学处理上比平均差更为合理。模块四数据特征的描述2(1)总体的方差和标准差根据未分组资料计算总体方差(σ2

)和标准差(σ)可以使用简单式,计算公式如下:式中,X

代表总体单位的变量值,μ

代表总体的均值,N

代表总体单位数。模块四数据特征的描述2根据已分组资料计算总体方差和标准差需要使用加权式,计算公式如下:式中,X

代表总体分组数据中各组的组中值,μ

代表总体的均值,F

代表总体分组数据中各组的频数,∑F代表各组频数之和(即分组条件下的总体单位数)。模块四数据特征的描述2

模块四数据特征的描述2

模块四数据特征的描述2(3)经验法则经验法则表明,当一组数据呈对称分布时:约有68.27%的数据在平均数加减1个标准差的范围内(μ±1σ)。约有95.45%的数据在平均数加减2个标准差的范围内(μ±2σ)。约有99.73%的数据在平均数加减3个标准差的范围内(μ±3σ)。如果有数据落在3倍的标准差范围之外,这些数据就被称为异常值或离群点。模块四数据特征的描述2(4)是非变量的标准差是非变量是指只有两种变量值表现的变量。具有某种属性的变量值用“1”表示,不具有某种属性的变量值用“0”表示。是非变量的标准差实际就是比例的标准差。模块四数据特征的描述2总体比例的标准差和方差分别是:总体比例的标准差总体比例的方差样本比例的标准差和方差分别是:样本比例的标准差样本比例的方差模块四数据特征的描述26.离散系数离散系数是绝对数形式的离散指标与算术平均数相除的结果,用比率反映一组数据离散程度的大小,一般用百分数表示,也称为变异系数。实际中,通常用标准差与算术平均数相除,这时计算的离散系数称为标准差系数,计算公式如下:模块四数据特征的描述2

模块四数据特征的描述2任务实施一、利用Excel对表的原始数据计算四分位差、极差、标准差、方差136名学生月消费支出额资料单位:元模块四数据特征的描述2136名学生月消费支出额资料单位:元模块四数据特征的描述21.数据准备2.使用Excel中“数据分析”工具的“描述统计”解读数据特征“描述统计”操作步骤模块四数据特征的描述2选择“描述统计”:①单击“工具”菜单。②单击“数据分析”选项,出现“数据分析”对话框。③在“分析工具”中选择“描述统计”,单击“确定”按钮。“描述统计”对话框设置:①在“输入区域”输入“$A$1:$A$136”或选中数据所在单元格区域“A1:A136”。②“分组方式”选择“逐列”。③在“输出区域”输入任一单元格以放置输出结果,这里输入“$C$1”或选中单元格C1。④在“汇总统计”和“平均数置信度(%)”前点击选中,如图所示。模块四数据特征的描述2“描述统计”对话框设置模块四数据特征的描述2输出描述统计量:单击“确定”按钮,显示描述统计量的计算结果,如图所示。Excel输出的描述统计结果模块四数据特征的描述2结果解释:(1)“平均”是数据的平均数(2)“标准误差”是样本平均数的抽样误差。(3)“中值”即中位数。(4)“模式”即众数。(5)“标准偏差”即样本的标准差。(6)“样本方差”就是样本标准差的平方。(7)“峰值”也称峰态系数,用来表明数据分布曲线的陡峭程度。模块四数据特征的描述2(8)“偏斜度”也称偏态系数,用来表示一组数据的非对称性程度,即向左或向右偏斜的程度。(9)“区域”即极差,是最大值与最小值之差。(10)“最小值”是全部数据中的最小者。(11)“最大值”是全部数据中的最大者。(12)“求和”是全部数据的总和。(13)“计数”是数据的个数。(14)“置信度(95.0%)”是指置信度为95%时的t

分布临界值。模块四数据特征的描述23.使用Excel中相应的函数功能计算离散指标(1)四分位差方法一:①进入“QUARTILE”对话框:“插入”→“函数”→“统计”→“QUARTILE”函数→“确定”。②“QUARTILE”

函数对话框设置:点击任一单元格准备存放四分位数,这里选中I5单元格;在“QUARTILE”对话框的“Array”

框中输入存放原始数据的单元格区域,这里是“A1:H17”(或用鼠标选中原始数据所在的单元格区域);在“Quart”框中输入“1”,对话框底部就给出了下四分位数QL

为239,如图所示。模块四数据特征的描述2下四分位数对话框模块四数据特征的描述2③执行重复操作:在“Quart”框中输入“2”,得到中位数305;在“Quart”框中输入“3”,得到上四分位数QU=367.25。④四分位差:Qd=QU-QL=367.25-239=128.25模块四数据特征的描述2方法二:①单击任一空单元格,这里选中I5单元格,输入“=QUARTILE((A1:H17),1)”,按“回车”键确认,即得到下四分位数239,结果如图所示。②重复操作,在任一单元格输入“=QUARTILE((A1:H17),2)”,按“回车”键确认,得到中位数305;输入“=QUARTILE((A1:H17),3)”,按“回车”键确认,得到上四分位数367.25。模块四数据特征的描述2下四分位数函数计算模块四数据特征的描述2(2)极差

R方法一:①进入“MAX”对话框:“插入”→“函数”→“统计”→“MAX”

函数→“确定”。②设置“MAX”

对话框:鼠标移至“Number1”框,再选中存放原始数据的单元格区域,这里是“A

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论