第三章-3-变异指标(统计数据的离中趋势)课件_第1页
第三章-3-变异指标(统计数据的离中趋势)课件_第2页
第三章-3-变异指标(统计数据的离中趋势)课件_第3页
第三章-3-变异指标(统计数据的离中趋势)课件_第4页
第三章-3-变异指标(统计数据的离中趋势)课件_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章—3变异指标(统计数据的离中趋势)第一节

变异指标概述第二节

全距、分位差和平均差第三节

标准差和标准差系数

【学习目标】通过本章的学习和习题演算,掌握变异指标的意义和作用;标准差和标准差系数的计算和应用。了解变异指标的分布特性;极差、平均差和四分位差的概念、计算公式和特点;分布的偏度与峰度。第四节

偏度和峰度变异指标△△变异指标引例

投资风险的评价

在金融证券领域,一项投资的的预期收益率的变化通常用该项投资的风险来衡量。预期收益率的变化越小,投资风险越低,预期收益率的变化越大,投资风险就越高。下面的两个直方图,分别反映了200种商业类股票和200种高科技类股票的收益率分布。在股票市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。变异指标02550收益率(%)频数(a)商业类股票

收益率(%)频数(b)高科技类股票

02550变异指标

(1)你认为该用什么样的统计测度值来反映投资的风险?

(2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票?

(3)如果你进行股票投资,你会选择商业类股票还是高科技类股票?讨论

一、离中趋势的涵义变异指标第一节变异指标概述

二、变异指标的作用三、变异指标的种类

一、离中趋势的涵义变异指标第一节变异指标概述指总体中各单位标志值背离分布中心的规模或程度,用标志变异指标来反映。离中趋势反映统计数据差异程度的综合指标,也称为标志变动度变异指标值越大,平均指标的代表性越小;反之,平均指标的代表性越大。

二、变异指标的作用变异指标第一节变异指标概述衡量和比较平均数代表性的大小;是进行质量控制的基础;是衡量风险程度的尺度。 例如:某车间有两个生产小组,各有7名工人,各人日产量如下:甲组:20,40,60,70,80,100,120乙组:67,68,69,70,71,72,73变异指标第一节变异指标概述变异指标第一节变异指标概述供货计划完成百分比(%)季度总供货计划执行结果1月2月3月钢厂甲厂100323434乙厂100203050【专栏3-3】

国家统计局日前发布的报告称,与2005年的工资数据相比,2006年全国城镇单位在岗职工的年平均工资增加了2596元,日平均工资增加了10.36元。(中国证券报3月26日)温家宝总理在十届全国人大五次会议记者招待会上曾说:“一个舰队决定它速度快慢的不是那个航行最快的船只,而是那个最慢的船只。”同样,决定全国城镇单位在岗职工工资整体发展速度的是广大低收入者的增长情况。别把平均指标看得过重

变异指标【专栏3-3】

目前,虽然过去15年中,中国居民工资性收入稳步增长,但收入差距的扩大,已成为工资分配中的突出问题。1月31日,国家发改委官方网站公布系列收入分配报告显示,1990~2005年,城乡居民的工资性收入在居民总收入中所占的比重从45.3%逐步提高到63.2%.但也就在这一时期,平均货币工资收入最高最低行业之比由1.76∶1扩大为4.88∶1。如果我们不注重行业间的收入差距过大问题,不采取措施弥补这种差距,而是任其扩大,一味追求平均指标的增长,那就无助于“整个社会的生活状况”的改善,因为一个舰队的速度,取决于那个最慢的船只。别把平均指标看得过重

变异指标变异指标第一节变异指标概述三、变异指标的种类以标志值之间相互比较说明变异情况

以平均数为比较标准来说明标志的变异情况

以正态分布为标准说明分配数列偏离情况的指标平均差标准差平均差系数标准差系数方差峰度偏度全距分位差变异指标还有一类,是以次数之间相互比较说明变异情况

异众比率

它是指非众数组的频数占总频数的比率,用于衡量众数的代表性。计算公式为:变异指标【例】根据下表中的数据,计算异众比率。某城市居民关注广告类型的频数分布

广告类型人数(人)频率(%)商品广告服务广告金融广告房地产广告招生招聘广告其他广告1125191610256.025.54.58.05.01.0合计200100解:

在所调查的200人当中,关注非商品广告的人数占44%,异众比率还是比较大。因此,用“商品广告”来反映城市居民对广告关注的一般趋势,其代表性不是很好。

Vr

=200-112200

=1-

112

200

=0.44=44%第二节全距、分位差和平均差

变异指标一、全距二、分位差三、平均差第二节全距、分位差和平均差

变异指标指所研究的数据中,最大值与最小值之差,又称极差。一、全距最大变量值或最高组上限或开口组假定上限最小变量值或最低组下限或开口组假定下限第二节全距、分位差和平均差

变异指标【例】某售货小组5人某天的销售额分别为440元、480元、520元、600元、750元,则一、全距第二节全距、分位差和平均差

变异指标一、全距【例】某季度某工业公司18个工业企业产值计划完成情况如下:计划完成程度(﹪)组中值(﹪)企业数(个)计划产值(万元)90以下90~100100~110110以上8595105115231038002500172004400合计—1824900第二节全距、分位差和平均差

变异指标一、全距缺点:①仅取决于两个极端值的水平,不能反映其间的变量分布情况;②受个别极端值的影响过于显著,不符合稳健性和耐抗性的要求。全距的特点优点:计算方法简单、易懂;第二节全距、分位差和平均差

变异指标二、分位差从变量数列中,剔除了一部分极端值后计算的类似于极差的指标。四分位差十六分位差十分位差八分位差三十二分位差百分位差第二节全距、分位差和平均差

变异指标四分位差【例】根据下表数据,计算甲城市家庭对住房满意状况评价的四分位差。甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数

非常不满意

不满意

一般

满意

非常满意2410893453024132225270300合计300—是上四分位数与下四分位数之差。主要用于测度定序数据的离散程度。数值型数据也可以计算四分位差,但不适合于定类数据。

第二节全距、分位差和平均差

变异指标四分位差

解:设非常不满意为1,不满意为2,一般为3,满意为4,非常满意为5已知

Q1=不满意=2,Q3=

满意=

4

四分位差:

QD=Q3-

Q1=4-

2

=2第二节全距、分位差和平均差

变异指标三、平均差⑴简单平均差——适用于未分组资料是各个数据与其算术平均数的离差绝对值的算术平均数,用表示。计算公式:总体算术平均数总体单位总数第个单位的变量值第二节全距、分位差和平均差

变异指标三、平均差【例】某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的平均差。解:即该售货小组5个人销售额的平均差为93.6元。第二节全距、分位差和平均差

变异指标三、平均差⑵加权平均差——适用于分组资料总体算术平均数第组变量值出现的次数第组的变量值或组中值第二节全距、分位差和平均差

变异指标三、平均差优点:不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;缺点:用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算。平均差的特点第三节标准差与标准差系数

变异指标一、标准差二、标准差系数三、是非标志总体的标准差第三节标准差和标准差系数变异指标⑴简单标准差——适用于未分组资料是各个数据与其算术平均数的离差平方的算术平均数的开平方根,用来表示;标准差的平方又叫作方差,用来表示。一、标准差计算公式:总体单位总数第个单位的变量值总体算术平均数第三节标准差和标准差系数变异指标【例】某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的标准差。解:第三节标准差和标准差系数变异指标一、标准差⑵加权标准差——适用于分组资料总体算术平均数第组变量值出现的次数第组的变量值或组中值第三节标准差和标准差系数变异指标标准差的特点不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统计分析运算.第三节标准差和标准差系数变异指标标准化值1.也称标准分数;2. 给出某一个值在一组数据中的相对位置;3. 可用于判断一组数据是否有离群点(异常值判断);4. 用于对变量的标准化处理;5.计算公式为(补充)第三节标准差和标准差系数变异指标【例】甲、乙两名学生六门课程高考成绩及全部考生相应的平均分和标准差如下:语文数学外语政治物理化学总分学生甲学生乙平均分标准差7090708.05751554.04540425.080858010.060723612.07062504.0380420第三节标准差和标准差系数变异指标甲、乙两名学生六门课程标准化后的分值:语文数学外语政治物理化学总分学生甲学生乙0.02.50.5-1.00.6-0.40.00.52.03.05.03.08.17.6第三节标准差和标准差系数变异指标思考题

一家公司在招收职员时,首先要通过两项能力测试。在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。一位应试者在A项测试中得了115分,在B项测试中得了425分。与平均分数相比,该位应试者哪一项测试更为理想?

第三节标准差和标准差系数变异指标二、标准差系数用来对比不同水平的同类现象,特别是不同类现象总体平均数代表性的大小——标准差系数小的总体,其平均数的代表性大;反之,亦然。应用:第三节标准差和标准差系数变异指标可比变异系数指标第三节标准差和标准差系数变异指标身高的差异水平:cm体重的差异水平:kg用变异系数可以相互比较可比第三节标准差和标准差系数变异指标【例】如果投资项目A的预期回报率(均值)为7%,标准差为5%;而投资项目B的预期回报率为12%,标准差为7%,试问哪个投资项目风险较大?解:因为投资项目A每单位回报率承受0.714单位的风险,而投资项目B每单位回报率的风险为0.583单位,因此,投资项目A的风险较大。第三节标准差和标准差系数变异指标三、是非标志总体的标准差分组单位数变量值具有某一属性不具有某一属性10合计—为研究是非标志总体的数量特征,令指总体中全部单位只具有“是”或“否”、“有”或“无”两种表现形式的标志,又叫交替标志。是非标志第三节标准差和标准差系数变异指标三、是非标志总体的标准差具有某种标志表现的单位数所占的成数不具有某种标志表现的单位数所占的成数指是非标志总体中具有某种表现或不具有某种表现的单位数占全部总体单位总数的比重。成数第三节标准差和标准差系数变异指标三、是非标志总体的标准差均值标准差第三节标准差和标准差系数变异指标三、是非标志总体的标准差【例】某厂某月份生产了400件产品,其中合格品380件,不合格品20件。求产品质量分布的集中趋势与离中趋势。解:第四节偏度与峰度

变异指标一、分布的矩二、测定分布的偏度三、测定分布的峰度偏度与峰度的形状第六章变异指标第四节偏度与峰度左偏分布右偏分布扁平分布尖峰分布与标准正态分布比较!偏度峰度变异指标一、分布的矩矩的基本形式第i个变量常数权数第六章变异指标变异指标第四节偏度与峰度原点矩中心矩未分组资料分组资料未分组资料分组资料变异指标矩法

定义M=∑(X-A)k/n为变量X关于A的k阶矩。当A=0,即以原点为中心,上式称为““K阶原点矩”。K=1,2,3时,有:一阶原点矩μ1=∑(X-0)1/n=∑X/n二阶原点矩μ2=∑(X-0)2/n=∑X2/n三阶原点矩μ3=∑(X-0)3/n=∑X3/n变异指标二、测定分布的偏度当A=,即以为中心,上式称为“K阶中心矩”。K=1,2,3时,有:一阶中心矩二阶中心矩三阶中心矩变异指标二、测定分布的偏度矩法所以,ν3可以测定偏度。为消除量纲,转变为系数,再除以σ3。<0负偏态(左偏)=0对称分布>0正偏态(右偏)<0=0>0变异指标二、测定分布的偏度矩法矩法变异指标二、测定分布的偏度【例】已知某年我国农村居民家庭按纯收入分组的有关数据如表所示。试计算偏态系数。某年农村居民家庭纯收入数据按纯收入分组(元)户数比重(%)500以下500~10001000~15001500~20002000~25002500~30003000~35003500~40004000~45004500~50005000以上2.2812.4520.3519.5214.9310.356.564.132.681.814.94变异指标从直方图上观察:户数比重(%)252015105500←10001500200025003000400035004500→5000结论:1.为右偏分布

2.峰度适中农村居民家庭村收入数据的直方图变异指标农村居民家庭纯收入数据偏态及峰度计算表按纯收入分组(百元)组中值Xi户数比重(%)Fi(Xi-X)Fi3(Xi-X

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论