版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章平均指标和变异指标本章将讨论的是数据的总量和相对关系的测度,数据的集中趋势、离散趋势及其形态的测度。
总量指标和相对指标集中趋势的测定---平均指标离散趋势的测定----离散指标数据的形态测定----偏度和峰度主要内容一、总量指标(一)总量指标总量指标(亦称绝对数)是统计资料经过汇总整理后得到的反映总体规模和水平的总和指标。
(3)是计算相对指标和平均指标的基础。作用概念例如,企业的销售收入、一个地区或国家的社会总产值、国内生产总值等。
(1)反映一个国家的国情和国力,一个地区或一个企业的人力、物力、财力
(2)是进行经济核算和经济活动分析的基础
(二)总量指标的计量单位
1、实物单位自然单位度量衡单位简单单位双重单位复合单位2、货币单位3、劳动单位(工时、工日)(三)总量指标的种类按其所反映的内容不同1、总体单位总量指标:反映总体中单位数多少的。2、总体标志总量指标:是反映总体中某种数量标志值总和的。按其所反映的时间状况不同1、时期指标:反映现象在某一段时期内的总量。2、时点指标:反映现象在某一时刻上的总量。按计量单位的不同1、实物量指标2、价值量指标3、劳动量指标
相对指标是用两个有联系的指标进行对比的比值,可以反映现象的数量特征和数量关系,并可将现象的绝对差异抽象化,使原来不能直接相比的绝对数可以进行比较。
相对指标的表现形式(一)名数(二)无名数1、系数和倍数2、成数3、百分数4、千分数二、相对指标概念三、相对指标的种类及计算(结构、比例)
如:如:(一)(二)返回(五)强度相对指标1、基本公式
2、作用(1)反映现象的强弱程度
如:(2)反映现象的密度
如:
(3)反映现象的经济效益如:
返回(六)计划完成相对指标1、基本公式
2、短期计划的检查(1)计划任务数为绝对数
某企业计划规定本年度销售收入达到1000万元,实际为950万元,计划完成相对指标为
(2)计划任务数为平均数
某企业计划某种产品单位成本为50元,实际为45元,计划完成相对指标为(3)计划数为相对数
某企业计划劳动生产率今年比去年提高10%,实际提高了15%。计划完成相对指标为(正指标)某企业计划某种产品成本今年比去年降低5%,实际降低了6%。计划完成相对指标为(逆指标)五种相对数指标的比较不同时期比较动态相对数注:又称发展速度
强度相对数注:复名数有正逆指标不同现象比较不同总体比较或者同一总体的两个不同部分比较相对数同一总体中部分与总体比较实际与计划比较结构相对数计划完成相对数注:有正逆指标同一时期比较同类现象比较(1)正确选择对比的基数;(2)必须注意统计的可比性;(3)相对指标要与总量指标相结合。应用原则数据分布的特征集中趋势(位置)离中趋势
(分散程度)偏态和峰度(形状)二、分布的集中趋势主要内容定类数据:众数定序数据:中位数和分位数定距和定比数据:数值平均数众数、中位数和算术平均数的比较(一)众数
1.定义:出现次数最多的变量值。是集中趋势的测度值之一,不受极端值的影响。适用:主要用于定类数据,也可用于定序数据和数值型数据注意:有些数据可能没有众数或有几个众数众数
原始数据:10591268
原始数据:6
5
9855
原始数据:252828
364242(众数的不唯一性)无众数一个众数多于一个众数定类数据的众数
表3-1某城市居民关注广告类型的频数分布
广告类型人数(人)比例频率(%)
商品广告服务广告金融广告房地产广告招生招聘广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计2001100【例】根据表3-1中的数据,计算众数解:这里的变量为“广告类型”,这是个定类变量,不同类型的广告就是变量值。我们看到,在所调查的200人当中,关注商品广告的人数最多,为112人,占总被调查人数的56%,因此众数为“商品广告”这一类别,即Mo=商品广告定序数据的众数
【例】根据表3-2中的数据,计算众数解:这里的数据为定序数据。变量为“回答类别”。甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即
Mo=不满意表3-2甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)
非常不满意
不满意
一般
满意
非常满意24108934530836311510合计300100.0数值型分组数据的众数
1.众数的值与相邻两组频数的分布有关该公式假定众数组的频数在众数组内均匀分布2.相邻两组的频数相等时,众数组的组中值即为众数Mo3.相邻两组的频数不相等时,众数采用下列近似公式计算MoMo数值型分组数据的众数
表1某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—【例】根据表1中的数据,计算50名工人日加工零件数的众数(二)中位数
1.定义:排序后处于中间位置上的值,集中趋势的测度值之一。不受极端值的影响Me50%50%适用:主要用于定序数据,也可用数值型数据,但不能用于定类数据2.中位数计算
(位置的确定)未分组数据:组距分组数据:2∑f=中位数位置中位数位置=N+12未分组数据的中位数
(计算公式)例子见书42页数值型未分组数据的中位数
(5个数据的算例)中位数22原始数据:
2422212620排序: 2021222426位置: 123
4
5数值型未分组数据的中位数
(6个数据的算例)原始数据:105 91268排序:56891012位置: 123
4
56位置N+126+123.5中位数8+928.5根据位置公式确定中位数所在的组采用下列近似公式计算:该公式假定中位数组的频数在该组内均匀分布例子见书43页数值型分组数据的中位数
(要点及计算公式)ifS∑fLMmme´-+=-12&(三)集中趋势的测定—平均数概念表明同类现象在一定时间、地点、条件下所达到的一般水平,是总体内某个变量大小各异的观察值的代表性数值。也是对变量分布集中趋势的测定。数据集中区变量x一、算术平均数()(一)简单算术平均数(二)加权算术平均数
1、根据单项数列计算的
2、根据组距数列计算的
3、用比重权数计算的加权算术平均数
4、根据相对数(平均数)计算的加权
5、是非标志的平均数(三)的数学性质(四)的应用条件
返回(一)简单算术平均数计算公式:
应用条件:资料未分组,各组出现的次数都是1。举例:5名学生的学习成绩分别为:75、91、64、53、82。则平均成绩为:
返回
(二)加权算术平均数
1、根据单项数列计算的计算公式:应用条件:单项式分组,各组次数不同。权数解释权数(Weighted),是分布数列中的频数或频率。对求平均数具有权衡轻重的作用,是影响平均数变动的两个因素之一(另一因素是变量值)。(1)(2)(3)X456合计频数频率(%)10201025.050.025.040100.0X456合计频数频率(%)20402025.050.025.080100.0X456合计频数频率(%)20101050.025.025.080100.0=5=5=4.75频率分布变了,均值也变。因此,严格地说,权数应指频率。举例某车间20名工人加工某种零件资料:
按日产量分组(件)x工人数(人)f日产总量xf14228154601681281758518118合计20319返回2、根据组距数列计算的应用条件:组距式分组,各组次数不同。举例:某车间200名工人日产量资料:按日产量分组(公斤)工人数f组中值x日产总量xf20—30102525030—407035245040—509045415050—6030551650合计200—8400返回3、由比重权数计算的应用条件:已知的是比重权数(次数是比重)公式:举例:(仍用上例)按日产量分组(公斤)人数比重(%)组中值x20—3052530—40353540—50454550—601555返回4、根据相对数(平均数)计算的加权
(1)根据相对数计算的某局所属的三个企业的资料:
企业产值计划完成%x计划产值(万元)f实际产值(万元)xf甲95300285乙105900945丙115300345合计—15001575(2)根据平均数计算的某企业各班组工人劳动生产率资料:
班组平均劳动生产率x实际工时f产品产量(件)xf一101001000二122002400三153004500四203006000五302006000合计—110019900返回5、是非标志的平均数是非标志:如果按照某种标志把总体只能分为具有某种特征的单位和不具有该种特征的单位两部分,这个标志就是是非标志。平均数的计算:把具有某种特征的用“1”表示,不具有该种特征的用“0”表示。
是非标志x单位数f比重
1
0
合计N1返回(三)算术平均数的数学性质1、各个变量值与其平均数离差之和等于零2、各个变量值与其平均数离差平方之和为最小值性质(3、4)3、给每个变量值增加或减少一个任意数A,则算术平均数也相应增增加或减少这个任意数A。4、给每个变量值乘以或除以一个任意数A,则算术平均数也相应扩大或缩小A倍。返回(四)算术平均数的适用范围1、当变量值是绝对数时,变量值之间是和的关系,而且已知的是分母资料,在这种情况下,反映现象的平均水平用算术平均数。2、当变量值是相对数或平均数时,变量值之间既不存在和的关系,也不存在相乘的关系,而且已知的是分母资料,在这种情况下,反映现象的平均水平用算术平均数。
返回二、调和平均数(H)(一)简单调和平均数计算公式:应用条件:资料未分组,各个变量值次数都是1。举例:一个人步行两里,走第一里时速度为每小时候10里,走第二里时为每小时20里,则平均速度为:(二)加权调和平均数计算公式:应用条件:资料经过分组,各组次数不同。例1:速度x行走里程m所需时间201
152103
合计6(三)调和平均数的适用范围1、当变量值是绝对数时,变量值之间是和的关系,而且已知的是分子资料,在这种情况下,反映现象的平均水平用调和平均数。2、当变量值是相对数或平均数时,变量值之间既不存在和的关系,也不存在相乘的关系,而且已知的是分子资料,在这种情况下,反映现象的平均水平用调和平均数。三、几何平均数(G)(一)简单几何平均数计算公式:应用条件:资料未分组(各变量值次数都是1)。举例:某企业生产某种产品需经过三个连续作业车间才能完成。车间投入量产出量合格率%x一100080080二80072090三72050470(二)加权几何平均数计算公式:应用条件:资料经过分组,各组次数不同。举例:将一笔钱存入银行,存期10年,以复利计息,10年的利率分配是第1年至第2年为5%、第3年至5年为8%、第6年至第8年为10%、第9年至第10年12%,计算平均年利率设本金为年份累计存款额本利率%第1年105%第2年105%第3年108%………第10年112%本利率x年数f105%2108%3110%3112%2合计10平均年利率=8.77%(三)几何平均数的适用范围当变量值是相对数,而且变量值之间存在连乘关系,反映现象的一般水平用几何平均数。
返回常用的几种平均数概念 计算公式 特点 优点:灵敏度高②受极值影响小于和③适宜于各比率之积为总比率的变量求平均缺点:①有“0”或负值时不能计算②偶数项数列只能用正根2.几何平均数()几个变量值连乘积的n次根简单:加权:概念 计算公式 特点 3.中位数(Me)是一种位置平均数,数据按大小顺序排列,处于数据序列中间位置的数值就是中位数
上限公式:下限公式:优点:①容易理解,②不受极值影响③适宜于开口组资料和些不能用数字测定的事物缺点:①灵敏度和计算功能差②间断数Me常用的几种平均数常用的几种平均数概念 计算公式 特点 4.众数(Mo)是一种位置平均数,是一批数据中出现次数最多的那个数值.通常只用于定性数据或离散型的定量数据。 上限公式:下限公式:优点:①容易理解,②不受极值影响缺点:①灵敏度和计算功能差②稳定性差③具有不唯一性位置平均数与算术平均数的关系1.众数适用于所有的定性数据和定量数据
中位数适用于定性数据中的定序数据和定量数据
算术平均数只适用于定量数据2.定量数据:若是钟形分布,三种集中趋势指标一般都可适用。而对J形分布,反J形分布和U形分布,中位数和算术平均数没有任何意义。3.在确定集中趋势指标的过程中,算术平均数比中位数和众数使用了更多的数据信息。4.对于钟形分布且数据量很大时,三种集中趋势指标有如下三种数量关系:
XfXfXf(对称分布)正偏态分布(右)负偏态分布(左)1212※应用平均指标的原则:1.必须是同质的量方可平均;2.总平均数与组平均数结合分析;3.集中趋势与离散趋势结合分析三、离散趋势的测定概念标志变异指标是反映变量分布离散趋势、与平均指标相匹配的指标。
(1)反映变量分布的离散趋势;
(3)是对事物发展均衡性的量度。
(2)是对平均数的代表性程度的量度;作用常用的几种标志变异指标概念 计算方法 特点 是非众数组所占比重
1.异众比率
如百得便利超市公司50家门店按区域划分的众数是A区域,该组的次数是20家,所以异众比率为60%,这说明50家门店按区域划分的离散程度比较大,众数的代表性较差。
异众比率是反映定名数据离散趋势的唯一指标,这个指标越小,说明数据的离散程度越小,集中程度越大
常用的几种标志变异指标概念 计算 特点 数列中最大值与最小值之差2.极差(R)R=最大值-最小值R=最大组的上限-最小组的下限
优点:容易理解,计算方便缺点:不能反映全部数据分布状况3.四分位差
(M3-M1)/2在反映数据的离散程度方面比全距较为准确,但仍显粗略
是一批数据中的第三四分位数与第一四分位数之差的二分之一
常用的几种标志变异指标概念 计算 特点 4.平均差(AD)各标志值与均值离差绝对值的算术平均 简单:加权:优点:反映全部数据分布状况缺点:取绝对值数字上不尽合理所有观察值与平均数离差平方平均数的平方根,亦称均方差。标准差的平方即为方差。
5.方差(σ2s2)和标准差(σs) 优点:反映全部数据分布状况,数字上合理。缺点:受计量单位和平均水平影响,不便于比较简单:加权:概念计算 特点 6.标准差系数(Vσ) 标准差与均值之商,是无量纲的 两列数据的分布进行离散程度的比较,当它们的平均数不等、计量单位不同时则应消除平均数不同和计量单位不可比的影响。此时就需要用离散系数这种相对数来是测定离散趋势
方差(σ2)和标准差(σ)是应用最广的标志变异指标常用的几种标志变异指标总体方差和标准差
(计算公式)未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式样本方差和标准差
(计算公式)未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式注意:样本方差用自由度n-1去除!样本方差
自由度(degreeoffreedom)定义:一组数据中可以自由取值的数据的个数。例如,样本有3个数值,即x1=2,x2=4,x3=9,则x
=5。当x
=5
确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值。样本方差
(算例)原始数据:10 591368样本标准差样本标准差
(算例)样本标准差原始数据:
10591368方差
(简化计算公式)样本方差总体方差方差
(数学性质)各变量值对均值的方差小于对任意值的方差证明提示:设X0为不等于X的任意数,D2为对X0的方差,则:偏度与峰度分布的形状扁平分布尖峰分布偏度峰度左偏分布右偏分布与标准正态分布比较!四、数据的形态测定偏度:是测定数据分布的偏斜程度的指标.。
定义M=∑(X-A)k/n为变量X关于A的k阶矩。
当A=0,即以原点为中心,上式称为“K阶原点矩”。K=1,2,3时,有:一阶原点矩M1=∑(X-0)1/n=∑X/n二阶原点矩M2=∑(X-0)2/n=∑X2/n三阶原点矩M3=∑(X-0)3/n=∑X3/n
当A=0,即以为中心,上式称为“K阶中心矩”。K=1,2,3时,有:一阶中心矩二阶中心矩三阶中心矩
所以,m3可以测定偏度。为消除量纲,转变为系数,再除以σ3。<0负偏态=0对称分布>0正偏态峰度:是用来反映数据分布曲线顶端的尖峭或扁平程度的指标。
<3平顶曲线=3正态曲线>3尖顶曲线注:在EXCL等
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024货物道路运输合同样书范文
- 2024至2030年中国磁悬浮实验装置行业投资前景及策略咨询研究报告
- 2024至2030年中国滑动水口行业投资前景及策略咨询研究报告
- 2024至2030年中国橡木条凳数据监测研究报告
- 2024至2030年中国指南温度计数据监测研究报告
- 2024至2030年中国多工位织物印刷机数据监测研究报告
- 《100% 可再生能源供应合同》
- 福建省电力有限公司农网配电设施改造技术规范(试行)
- 浙江省杭州市2025届高三年级上学期期中教学质量检测语文试题及答案
- 广东省2025届普通高中毕业班第二次调研考试 生物试卷(含答案解析)
- (完整版)二年级乘除法竖式计算
- 60立方油罐容积细表
- -精神病医院设置基本标准
- 铝土矿采矿项目可行性研究报告写作范文
- A01083《纳税人(扣缴义务人)基础信息报告表》
- 元旦、春节前我市建筑领域农民工工资支付工作通知
- 医疗废物流失泄漏应急处理流程图
- 长方形、正方形的面积和周长复习课件
- 信号与系统(第十章Z-变换)
- 广东省高级人民法院民一庭关于建设工程施工合同纠纷案件若干问题的意见
- 家装施工组织设计方案模板
评论
0/150
提交评论