版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章分布数值特征的统计描述第一节平均水平、集中趋势和位置的度量第二节分布离散程度的度量第三节分布的偏度和峰度*1第一节平均水平、集中趋势和位置的度量统计平均数的含义与作用数值平均数算术平均数、调和平均数
几何平均数、幂平均数位置平均数众数、中位数众数、中位数和算术平均数的关系2一、平均数的含义与作用含义社会经济现象总体各单位某一标志在一定时间、地点条件下所达到的一般水平。作用(1)反映总体各单位变量分布的集中趋势和一般水平。(2)常用来进行同类现象在不同空间、不同时间条件下的对比分析。(3)用于分析现象之间的依存关系34分类(1)数值平均数:以分配数列的所有各项数据来计算的平均数。特点:分配数列中任何一项数据的变动,都会在一定程度上影响到数值平均数的计算结果。包括:算术平均数、调和平均数和几何平均数。(2)位置平均数:根据数列中处于特殊位置上的个别单位或部分单位的标志值来确定的。包括:众数和中位数。二、算术平均数算术平均数的概念及与强对相对指标的区别算术平均数的计算简单算术平均数:适用于未分组的资料加权算术平均数:已编制分配数列的情况下是非标志平均数算术平均数的数学性质5(一)概念、与强对相对指标的区别
6工人劳动生产率全员劳动生产率人均粮食产量人均粮食消费量钢铁工人平均钢产量人均钢产量人均GDP人均石油消费量7平均指标还是强度相对指标?(二)算术平均数的计算简单算术平均数:适用于未分组的资料加权算术平均数:已编制分配数列的情况是非标志平均数8引例:市场上有三种苹果,甲种每斤2元,乙种每斤1.6元,丙种每斤1.2元。问:(1)三种苹果各买一斤,则平均每斤价钱是多少?(2)甲种苹果买2斤,乙种买3斤,丙种买5斤,则平均每斤价钱又是多少?1.简单算术平均数
92.加权算术平均数适用于已编制分配数列的情况,包括以下两种:单项式数列的算术平均数组距式加权算术平均数10(1)单项式数列的算术平均数例:某机械厂工人日产零件数的分配数列。求工人的平均日产量。公式:11权数加权各组标志值出现的次数在计算平均数的过程中起着权衡轻重的作用,故常将其称作“权数”。(2)组距式加权算术平均数例:某年我国80个产棉大县的分配数列如表。求平均每县产棉量。以组中值作为各组的代表值12注意:这里假定各组标志值在组内分布是均匀的。但一般来讲,分布是不均匀的,结果与简单算术平均不一样。(3)加权算术平均数的频率公式13成绩(分)人数(人)比重(%)组中值(x)60以下6125560~7012246570~8019387580~9010208590~1003695合计50100-(4)权数的作用和形式14加权算术平均数受两个因素的影响,一个是分配数列中各组的标志值xi,另一个是各组标志值出现的次数fi。各组标志值出现的次数在计算平均数的过程中起着权衡轻重的作用,故常将其称作“权数”。15
(5)正确选择权数—当从相对数或平均数求平均数时例:某管理局所属15个企业销售计划完成情况资料如右表。请计算平均计划完成程度。(注:计划完成程度=实际完成数/计划任务数)选择权数的准则:最终的平均指标的涵义要符合原来相对指标(平均指标)本身的涵义。此时选什么作为权数?163.是非标志平均数—一种特殊的平均数是非标志?17产品合格与否xf合格(是)1N1不合格(非)0N2合计—N18用上式得到的p,即是非标志的平均数。也称为总体中具有某种属性的单位成数,简称成数。一般来讲用p表示“是”所占的比重,q表示“非”所占的比重。(三)算术平均数的数学性质 性质1:算术平均数与标志值个数的乘积等于各标志值的总和简单算术平均数加权算术平均数1920性质2:各单位标志值与算术平均数的离差之和等于021性质3:各单位标志值与算术平均数的离差平方和为最小22性质4*:对被平均的变量实施某些线性变换后,新变量的算术平均数等于对原变量的算术平均数实施同样的线性变换的结果三、调和平均数(H)调和平均数的公式调和平均数的应用场合23(一)调和平均数的公式调和平均数:又称倒数平均数,是总体单位各标志值倒数的算术平均数的倒数。简单调和平均数加权调和平均数24在运用加权调和平均数时,如果各组权数相等,就可以采用简单调和平均数(二)调和平均数的应用场合调和平均数通常是加权算术平均数的变形,即当已知各组的变量值x和算术平均数的分子数据(xf)而缺乏其分母数据(f)时,加权算术平均数通常可通过变形利用以分子数据(xf)为权数的调和平均数形式来计算。25例1:求工人平均日产量某工厂工人日产零件数资料如右所示(假设只知道x和m)。求工人平均日产量。26可以看出,已知分配数列各组标志值及其标志总量时,计算平均数可用加权调和平均法,权数m为各组的标志总量。27例2:求平均利润率某公司下属三个部门销售情况,求三个部门的平均利润率28部门销售利润率(%)x利润额(万元)ABC12107120200105合计-425例3:求平均计划完成程度例:某管理局所属15个企业销售计划完成情况资料如下表:求平均计划完成程度2930例4:求平均亩产已知某地区甲、乙、丙三个乡粮食平均亩产和粮食总产量如表,求全区平均亩产。3132四、几何平均数(一)公式几何平均数是N项标志值连乘积的N次方根。1.简单几何平均数2.加权几何平均数33(二)应用在某些情况下,若总体总量是由标志值相乘得出,这时平均数就应该用几何平均数的方式来计算。34某产品经过三个流水连续作业的车间加工生产而成,本月第一车间的产品合格率为90%,第二车间的产品合格率为80%,第三车间的产品合格率为70%。则全厂的总合格率为:这样三个车间平均合格率为例1:平均合格率35例2:以复利计算利息时的平均利率假设p0为本金,r为利率,pn为n年后的本利和若以单利计算若以单利计算36可以看出,以复利计算利息时,n年后本利率的总量为n个(1+r)相乘,所以本利率的平均数用几何平均数计算。例2:以复利计算利息时的平均利率
37幂平均数38
平均数方程五、众数Mo出现次数最多的标志值。在分配曲线图上,众数就是曲线的最高峰所对应的标志值。1.未分组资料和单项式分组资料出现次数最多的变量值。2.组距分组数列先确定次数最多的众数组,然后假定众数组的标志值的分布是均匀的。最后利用公式计算众数的近似值。39例:组距式分组时众数的求法402004年某市80个中型工业企业资料如何得到众数上限或下限公式41众数组的前一组众数组的后一组众数组例:分类数据的众数42不同品牌饮料的频数分布饮料品牌频数比例百分比(%)
可口可乐旭日升冰茶百事可乐汇源果汁露露15119690.300.220.180.120.183022181218合计501100解:这里的变量为“饮料品牌”,这是个分类变量,不同类型的饮料就是变量值在所调查的50人中,购买可口可乐的人数最多,为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即
Mo=可口可乐例:顺序数据的众数43解:这里的数据为顺序数据。变量为“回答类别”甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即
Mo=不满意甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)
非常不满意不满意一般满意非常满意24108934530836311510合计300100.0众数的不唯一性无众数
原始数据:10591268一个众数
原始数据:659855多于一个众数
原始数据:25282836424244六、中位数将总体各单位按其标志值大小顺序排列,处于中点位置那个单位的标志值,即为中位数。45(一)由未分组资料确定中位数未分组资料中位数确定方法:首先将各总体单位的标志值,按照大小顺序排列,然后确定中位数的位置,处于中位数的位置的标志值就是中位数。46当n为奇数当n为偶数例:求未分组资料中位数(1)7个人的身高为:165、168、169、170、172、173、175cm,则中位数为x4=170cm(2)若8个人的身高为:165、168、169、170、172、173、175、179cm,则中位数为(x4+x5)/2=(170+172)/2,即171cm47(二)由单项式分组资料确定中位数确定方法:单项式分组已经将资料序列化,这时总体单位数n=∑f,确定确定中位数的位置要通过累计次数计算。48当∑f为奇数当∑f为偶数例:求单项式分组资料中位数某工厂工人的月工资分配数列如表。49∑f=30为偶数(三)由组距分组数列确定中位数(1)确定“中位数组”向上累计次数等于∑f/2(2)假定中位数组内分布是均匀的,近似计算出中位数来。50向上累计时向下累计时例:求组距分组数列的中位数(1)确定“中位数组”。∑f/2=40,35<40≤55,中位数组为“20-30百万元”这一组(2)假定中位数组内分布是均匀的,
计算出中位数来。5120百万元30百万元第35个第55个第40个共20个例:顺序数据的中位数定序尺度数据的中位数位置:n/252解:中位数的位置为300/2=150
从累计频数看,中位数在“一般”这一组别中。因此
Me=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数
非常不满意不满意一般满意非常满意2410893453024132225270300合计300—例:求众数、中位数下表是某银行月末活期存款余额及存款人数的资料,请计算存款余额众数和中位数。53月末存款余额(元)存款人数(人)1000以下11501000-200017902000-300023103000-400020904000-500014505000以上800合计9590众数=?中位数=?对中位数的解释和应用要谨慎54中位数可用于表示居于中间水平的数值大小。一般的解释是:中位数将全部数据一分为二,一半数据小于它而另一半数据大于它。这个结论显然只是对连续型分布曲线才成立,或在中位数数值没有重复出现的情况下才成立。55如果中位数数值出现次数大于1,则上述含义就不符合实际了。例如下表中男女队员的年龄中位数都是25岁,但不能说有一半队员的年龄小于25,另一半队员的年龄大于25。所以对中位数的上述解释和应用要谨慎。性别各个队员的年龄(周岁)男性22222525252525303050女性22222525252525303030四分位数、十分位数和百分位数其他分位数四分位数是将数据由小到大排序后,位于全部数据1/4位置上的数值。十分位数是将数据由小到大排序后,位于全部数据1/10位置上的数值。百分位数是将数据由小到大排序后,位于全部数据1/100位置上的数值。中位数也就是第二个四分位数、第五个十分位数、第五十个百分位数。分位数与其它指标结合,可以更详细地反映数据的分布特征。56七、众数、中位数和算术平均数的关系(一)各自特点的比较*1.概括能力:算术平均数综合反映了全部数据的信息,众数和中位数由数据分布的特定位置所确定。2.耐抗能力:算术平均数要受数据中极端值的影响。而众数和中位数几乎不受极端值的影响。3.适用的数据类型:算术平均数适用于定距和定比数据,中位数还适用于定序数据,众数适用于所有形式的数据。57584.算术平均数和中位数在任何一组数据中都存在而且具有惟一性,但计算和应用众数有两个前提条件:(1)数据项数众多;(2)数据具有明显的集中趋势5.算术平均数可以推算总体的有关总量指标,而中位数和众数则不宜用作此类推算。(二)数量关系59对称分布右偏(正偏)分布左偏(负偏)分布皮尔生法则在适度偏态情况下,算术平均数和众数的距离约等于算术平均数与中位数距离的三倍。即60例:皮尔生法则的应用
61第二节分布离散程度的度量变异指标的含义与作用极差*平均差*方差与标准差变异系数62为什么需要计算变异标例1:如果你一只脚放在摄氏1度的水里,另一只脚放在摄氏79度的水里,平均水温40度,你感觉舒服极了!?例2:张家有财一千万,九个邻居穷光蛋,平均起来算一算,个个都是张百万。63显然,只了解变量的集中趋势是不够的!一、变异指标的含义用来描述总体中各单位的离中趋势或离散程度的指标。注意:数据分布的另一个重要特征分布的离中趋势也可称为分布的离散程度有多种不同的指标用于测度离中趋势64变异指标的作用1.用于衡量平均指标的代表性程度。例如:假定两组学生身高资料如下:(单位:cm)
甲组:160,165,170,175,180。
乙组:168,169,170,171,172。两组平均身高均为170cm。哪组平均身高的代表性更大?乙组各标志值离散程度小,平均数170的代表性更大。65662.反映社会经济现象变动的均匀性和稳定性。在产品质量控制中常常应用这类指标。3.利用变异指标可研究总体标志值分布偏离正态的情况。4.资产风险的度量4.变异指标是统计分析的一个基本指标。可用于衡量统计推断效果。变异指标的种类(1)标志变异指标:反映总体中各变量值离散程度的指标。极差或全距、平均差方差与标准差、变异系数(2)分布变异指标:描述分布状态的指标,说明统计分布偏离正态分布的情况。偏度、峰度67二、极差R(也称全距)
68改进方法:计算四分位差Q.D=(QU-QL)/2
QU-QL称为“四分位间距”位次的确定:(n+1)/4、(n+1)/2、3(n+1)/4不受极端值的影响,但也没有充分利用数列的全部信息。不能用于定类数据。69QLQMQU25%25%25%25%三、平均差是总体各单位标志值对算术平均数的绝对离差的算术平均数。图示如下:70平均差计算公式平均差反映各标志值对平均数的平均距离,平均差越大,说明总体各标志值越分散;平均差越小,说明各标志值分布越集中。数学性质不是十分理想,实践中较少运用。71例:求平均差例如:假定某车间两个小组工人的月工资(元)资料如下。
甲:800,900,1000,1100,1200。
乙:900,950,1000,1050,1100。72四、方差与标准差测定标志变异程度最灵敏的指标。标准差与方差的数学性质较为理想,是统计中最常用、也是最重要的变异指标。7374将平均差公式中的绝对值符号换成平方,得到方差的公式,将方差开方根为标准差。公式如下:例:求方差管理学院某班学生统计学考试成绩分组资料如下表所示,试计算方差和标准差。解:学生成绩的方差和标准差计算表如下:75按成绩分组学生数fi组中值xixf60以下60~7070~8080~9090~100721251985565758595385136518751615760400100010040028002100019003200合计80—6000100010000方差的数学性质1.变量的方差等于变量平方的平均数减去变量平均数的平方。2.变量对算术平均数的方差小于对任意常数的方差。76方差的数学性质3.n个同性质独立变量和的方差等于各个变量方差的和。4.n个同性质独立变量平均数的方差等于各变量方差平均数的。5.变量线性变换的方差等于变量的方差乘以变量系数的平方。77是非标志的标准差是非标志:?成数:总体中,是非标志只有两种表现,我们把具有某种表现或不具有某种表现的单位数占全部总体单位数的比重称为成数。如,考试及格率、产品合格率等。一般而言具有某种特征的单位的成数(比重)记为p不具有某种特征的单位的成数记为q78是非标志的标准差79标志表现标志值x次数f是非10N1N2(1-p)2(0-p)2合计—N—当p=q=0.5时,0-1变量分布的方差有最大值,此时成数的标准差最大值等于0.5。总方差、组内方差和组间方差
80例:求组内方差与组间方差
81标准化值*(Z-score)假定某班学生先后两个两次进行了难度不同的综合考试,某同学第一、二次考试的成绩分别为92分和80分,那么全班相比较而言,他哪一次考试的成绩更好呢?82标准化值
8384
五、变异系数85不同的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 9、2025年度绿色建筑模板单项劳务分包合同3篇
- 个人宅基及房屋销售协议版B版
- 2025版门面租赁合同签订流程及注意事项4篇
- 游戏化教学增强小学生注意力的教育模式
- 2025版化妆品销售代理合同范本6篇
- 美容院与互联网平台2025年度线上推广服务合同4篇
- 智能化学习环境下的学生思维升级
- 二零二五年度汽车美容服务合同范本4篇
- 科技产品的动态视觉设计实践分享
- 时间管理对学习态度的积极影响
- 教师招聘(教育理论基础)考试题库(含答案)
- 2024年秋季学期学校办公室工作总结
- 铺大棚膜合同模板
- 长亭送别完整版本
- 智能养老院视频监控技术方案
- 你比我猜题库课件
- 无人驾驶航空器安全操作理论复习测试附答案
- 建筑工地春节留守人员安全技术交底
- 默纳克-NICE1000技术交流-V1.0
- 蝴蝶兰的简介
- 老年人心理健康量表(含评分)
评论
0/150
提交评论