




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、一些人使用统计就像喝醉酒的人使用街灯柱支撑的功能多于照明。 Andrew Lang,第五章 统计分布的数值特征,第一节 平均指标 第二节 标志变异指标,1.当代美国的平均人是女人 2.平均每个女人有2.1个孩子 3.这些女人住在平均价值为 $80000的住房中,第一节 平均指标,集中趋势 指一组数据向某一中心值靠拢的倾向,衡量集中趋势的指标,平均指标,同质总体各单位某一数量标志值在具体时间、地点、条件下达到的一般水平。 概括一组数据的一个单一数值,它位于所有数值的中心,一、平均指标概述,(一)概念,例如,2002-03第2学期会计2班管理学考试平均78分 姚明上赛季平均每场上场29分钟,平均每
2、场得分13分 2003年下半年兴达公司职工平均月收入1000元。 康隆农场2003年平均从业人员数700人 兴隆铁矿年均产量400万吨 ,“平均”,抽象性:是对总体单位数量差异的一种抽象 说明总体综合数量特征的一般水平 平均化的过程就是一个抽象化过程 平均指标则是一种抽象化的代表值。,(二)平均指标特点,(三)平均指标的种类,按反映的时间状况不同,按平均指标计 算方法不同,位置平均数,算术平均数 调和平均数 几何平均数,数值平均数,众数 中位数,静态平均指标,动态平均指标,一、算术平均数,算术平均数总体标志总量同一总体单位总数 例如:平均工资额工资总额/职工人数=6001060(元) 特点:
3、计量单位应当和标志总量的计量单位一致 分子分母为同一总体,分母是分子的承担者 数量标志能平均,品质标志不能平均,注意:平均指标与强度相对指标的区别,二、算术平均数,(一)简单算术平均数,条件:掌握了没有分组的总体各单位的标志值或已经有了 标志总量和总体总量的资料,89、88、76、99、74、60、82、60、89、86、 92、85、70、93、99、94、82、77、79、97、 78、95、84、79、63、72、87、84、79、65、 98、67、59、83、66、65、73、81、56、77,01-02第一学期会计2班40名学生市场营销学成绩抄录如下:,01-02第一学期会计2班4
4、0名学生市场营销学的平均成绩:,切尾均值,62,99,90,97,93,81,82,75,3,去掉一个最高分 去掉一个最低分,3号参赛选手的最终得分是85.71分。”,89、88、76、99、74、60、82、60、89、86、 92、85、70、93、99、94、82、77、79、97、 78、95、84、79、63、72、87、84、79、65、 98、67、59、83、66、65、73、81、56、77,如何计算 平均分数呢?,01-02第一学期会计2班市场营销学成绩,(二)加权算术平均数,条件:分组资料 特点:平均数的大小既受其变量值大小的影响,又受其次 数多少的影响,影响加权算术平均
5、数的两个因素:变量值本身大小和权数,组距式分组,X此时为组中值,因此由此计算出的平均数也近似值。,例,单项式分组,思考:若分组资料中的各组权数f均相等,即,简单算术平均数,加权算术平均数,注意公式变形,绝对权数,相对权数,思考: 绝对权数与相对权数的区别,第69分钟区楚良被符宾换下,摘自区楚良 符宾 谁更强足球俱乐部1996年9月5日第17期,从“区楚良符宾谁更强”谈权数的作用,算术平均数的性质,1、,2、,3、,4、,问题:学校的采购员从两个厂家买回一批粉笔,具体情况 如下 单价 (元) 2.5 3 金额 (元) 500 900 问:该批粉笔平均每盒的价格是多少?,三、调和平均数(H),概念
6、 是总体各单位标志值倒数的算术平均数的倒 数,也称倒数平均数。,(一)简单调和平均数,注意与简单算术平均数的不同,调和平均数举例1,2.50 元/kg,2.00元/kg,1.00元/kg,我各买1元的吃,苹果价格及购买情况表,求平均价格,(二)加权调和平均数,注意与加权算术平均数的不同,权数,变量,调和平均数举例2,苹果价格及购买情况表,购买数量,模拟计算,体会含义并进行比较,某种水产品早中晚价格各不相同,分别为3元/kg 、2元/kg和1元/kg (1)消费者早中晚各买一公斤时; (2)消费者早中晚各买一元时; 请计算两种情况下,消费者购买这种水产品的平均价格(元/kg),加权算术平均,加权
7、调和平均, 当m=xf时: 加权调和平均数公式就变成加权算术平均数公式,结论是:调和平均与算术平均的计算只是由于资料不同而出现的差异,其经济含义完全一致.,注意,算术平均数与调和平均数的其他应用,某行业产值和利润情况表,问题:请计算该行业一季度和二季度的平均产值利润率,一季度的平均产值润率,二季度的平均产值利润率,四、几何平均数,某产品的完整生产包括三个流水作业的连续工序。三道工序的产品合格率分别为:80%、90%、95%,那么: 1.该产品的合格率是多少? 2.三道工序的平均合格率是多少?,(一)简单几何平均数,表示几何平均数;x表示变量值;n表示变量值个数。,适用于计算平均比率和平均速度,
8、是n个比率乘积的n次方根,几何平均数举例,若已知条件中使用的利率为2%、5%、8% 注意应把基数1(100%)考虑在内对于本利率、发展速度类的计算。,我们根据假设连续三年的银行利率求平均利率。,(二)加权几何平均数,我们假设连续10年的银行利率,求平均利率。,G=(x1+x2+xn)/n=xi/n G=(f1x1+f2x2+fnxn)/(f1+f2+fn) =fixi/fi,几何平均数(算例),【例10】一位投资者持有一种股票,1996年、1997年、1998年和1999年收益率分别为4.5%、2.0%、3.5%、5.4%。计算该投资者在这四年内的平均收益率。,平均收益率103.84%-1=3
9、.84%,概念:是一组数据中出现次数最多的变量值 确定方法:随所掌握的资料不同而不同,五、众数Mo (mode),五、众数(概念要点),集中趋势的测度值之一 出现次数最多的变量值 不受极端值的影响 可能没有众数或有几个众数 主要用于定类数据,也可用于定序数据和数值型数据,众数(众数的不唯一性),无众数原始数据: 10 5 9 12 6 8,一个众数原始数据: 6 5 9 8 5 5,多于一个众数原始数据: 25 28 28 36 42 42,定类数据的众数(算例),【例】根据第三章表3-1中的数据,计算众数,解:这里的变量为“广告类型”,这是个定类变量,不同类型的广告就是变量值。我们看到,在所
10、调查的200人当中,关注商品广告的人数最多,为112人,占总被调查人数的56%,因此众数为“商品广告”这一类别,即 Mo商品广告,定序数据的众数(算例),【例】根据第三章表3-2中的数据,计算众数,解:这里的数据为定序数据。变量为“回答类别”。甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即 Mo不满意,某鞋厂市场需求调查情况,众数MO 24 结论:根据定义确定单项式分布数列的众数,数值型分组数据单项式数列确定众数,组距式数列的众数,1. 众数的值与相邻两组频数的分布有关,4. 该公式假定众数组的频数在众数组内均匀分布,2. 相邻两组的频数相等时,众数组的组中值
11、即为众数,3. 相邻两组的频数不相等时,众数采用下列近似公式计算,数值型分组数据的众数(算例),【例1】根据第三章表3-5中的数据,计算50名工人日加工零件数的众数,六、中位数(概念要点),集中趋势的测度值之一 排序后处于中间位置上的值,不受极端值的影响 主要用于定序数据,也可用数值型数据,但不能用于定类数据 各变量值与中位数的离差绝对值之和最小,即,中位数(位置的确定),未分组数据:,组距分组数据:,未分组数据的中位数(计算公式),定序数据的中位数(算例),【例2】根据第三章表3-2中的数据,计算甲城市家庭对住房满意状况评价的中位数,解:中位数的位置为: 300/2150 从累计频数看,中位
12、数的在“一般”这一组别中。因此 Me一般,数值型未分组数据的中位数 (5个数据的算例),原始数据: 24 22 21 26 20 排 序: 20 21 22 24 26 位 置: 1 2 3 4 5,中位数 22,数值型未分组数据的中位数 (6个数据的算例),原始数据: 10 5 9 12 6 8 排 序: 5 6 8 9 10 12 位 置: 1 2 3 4 5 6,数值型分组数据的中位数(要点及计算公式),根据位置公式确定中位数所在的组 采用下列近似公式计算:,一家洗衣机服务公司想为其运货车队确定一个新的 总站。 服务的区域包括9个汽车道上的城镇: 城镇 A B C D E F G H I
13、 离A点距离 0 5 10 15 20 25 40 50 60 经理希望用从A开始的平均值来确定他的选择,他的助手建议选择中位数城镇更好。,问题,1. 这两个人分别指定哪个城镇? 2.对两项作为可能的总站提议分别计算9个城镇的平均 距离。 3.根据手头的所有信息阐明你认为总站应选址在哪里?,助理:中位数所在镇是第5镇,即E镇,经理:平均数所在镇与A镇的距离为 (0+5+10+15+20+25+40+50+60)/9=25 ,即为F镇,解答,中位数的重要性质,好有用吆!,七、其他分位数,1四分位数(Q) 将序列化的数列等分为四等分的3个临界点数值,数列项数 奇数,数列项数偶数时,2十分位数(D)
14、,概念:将全部总体单位按标志值的大小等分为十个部分 的九个临界点数值,1/10分位数 2/10分位数 3/10分位数 4/10分位数 5/10分位数,也即中位数 6/10分位数 7/10分位数 8/10分位数 9/10分位数,八、位置平均数与算术平均数的关系,(对称分布),正偏态分布(右),负偏态分布(左),在偏斜不大时,数据类型与集中趋势测度值,想一想?,假设你在政府的运输部门工作,你在计算26条公路的平均投资额时,具体情况是这样的: 一条新公路的投资额最大为2200万美元, 另外的25条公路,每项投资在20万与100万之间.总的中位数是25万,均值是100万,众数是20万. 你会选择哪一种
15、平均数来代表每一条高速公路从政府获得的投资呢?你选择的这种平均数的缺点是什么?,第二节 分布的离散程度,变量取值在平均数周围分布的密集程度 例 第一组 5 5 6 4 5 平均值=5 比较集中 第二组 2 3 9 7 4 平均值=5 比较分散,离散程度(离中趋势),一、极差(也称全距)R,极差:就是总体单位中最大值与最小值之差,它说明标 志值的变动范围 例 第一组 R=6-4=2 第二组 R=9-2=7 优点:计算简便、易懂 缺点:1受极端值影响较大; 2不能全面反映各单位标值差异 。,二、分位差(对极差指标的改进),四分位差、八分位差、十分位差等 四分位间距 Q.R=Q3-Q1 四分位差 Q
16、.D=Q.R/2=(Q3-Q1)/2 = (Q3-Me)+(Me-Q1) /2 例:2 34 5 5 6 6 6 7 8,n=10,Q3=Q 8.25=60.75+7 0.25=6.25 Q1=Q 2.75=3 0.25+4 0.75=3.75 Q.R=6.25-3.75=2.5 Q.D=2.5/2=1.25,三、平均差A.D,概念:是总体各单位的标志值与算术平均数的离差绝对值的平均。,未分组资料,分组资料,优点:1分析意义完整; 2反映各标志值差异。 缺点:不便于数学处理,平均差 (例题分析),平均差 (例题分析),含义:每一天的销售量与平均数相比, 平均相差17台,统计函数AVEDEV,四
17、、方差和标准差(variance and standard deviation),数据离散程度的最常用测度值 反映了各变量值与均值的平均差异 根据总体数据计算的,称为总体方差或标准差,记为2();根据样本数据计算的,称为样本方差或标准差,记为s2(s),总体标准差的计算,未分组数据: 分组数据:,例1 单项式资料,例2 组距式资料,样本方差和标准差 (simple variance and standard deviation),未分组数据,组距分组数据,未分组数据,组距分组数据,方差的计算公式,标准差的计算公式,自由度 (degree of freedom),自由度是指附加给独立的观测值的约
18、束或限制的个数 从字面涵义来看,自由度是指一组数据中可以自由取值的个数 当样本数据的个数为n时,若样本平均数确定后,则附加给n个观测值的约束个数就是1个,因此只有n-1个数据可以自由取值,其中必有一个数据不能自由取值 按着这一逻辑,如果对n个观测值附加的约束个数为k个,自由度则为n-k,自由度 (degree of freedom),样本有3个数值,即x1=2,x2=4,x3=9,则 x = 5。当 x = 5 确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值 为什么样本方差的自由度是n-1呢?因为在计算离差平方和
19、时,必须先求出样本均值x ,而x则是附加给离差平方和的一个约束,因此,计算离差平方和时只有n-1个独立的观测值,而不是n个 样本方差用自由度去除,其原因可从多方面解释,从实际应用角度看,在抽样估计中,当用样本方差s2去估计总体方差2时,它是2的无偏估计量,样本标准差 (例题分析),样本标准差 (例题分析),含义:每一天的销售量与平均数相比, 平均相差21.58台,统计函数STDEV,五、相对离散程度:变异系数,概念:用来说明变量取值之间差异的 相对程度的变异指标,适用:不同计量单位或不同平均水平的总体之间变异状况的比较,问题:有三组数据资料如下 1、年龄(岁) 14 15 15 16 16 1
20、6 17 19 2、零件数(个) 14 15 15 16 16 16 17 19 3、工资额(元) 1400 1500 1500 1600 1600 1600 1600 1700 1900 三组数据的均值分别为 16岁 16个 1600元 三组数据的方差分别为 2 2 20000 标准差分别为 1.414岁 1.414个 141.4元,变异系数(coefficient of variation),1.标准差与其相应的均值之比 2.对数据相对离散程度的测度 3.消除了数据水平高低和计量单位的影响 4.用于对不同组别数据离散程度的比较 5. 计算公式为:,【 例 】某管理局抽查了所属的8家企业,其
21、产品销售数据如表。试比较产品销售额与销售利润的离散程度,离散系数 (例题分析),结论: 计算结果表明,v1v2,说明产品销售额的离散程度小于销售利润的离散程度,六、 是非标志的平均数和标准差,是非标志:反映总体单位的某一种属性,标志的表现 只有两种情况,具体体现在各总体单位 要么具有该种属性,要么不具有该种属性。 例:性别 男性 女性 x 1 0 设总体中共有n各个体,其中取值为1的单位数为 n1个,取值为0的个体有n0个,P是一种特殊的平均数,七、相对位置的度量:标准分数,标准分数(standard score),1. 也称标准化值 2.对某一个值在一组数据中相对位置的度量 3.可用于判断一
22、组数据是否有离群点(outlier) 4.用于对变量的标准化处理 5. 计算公式为,标准分数(性质),均值等于0 2.方差等于1,标准分数(性质),z分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数分布的形状,而只是将该组数据变为均值为0,标准差为1,例3 标准化成绩的计算,承上例,2.经验法则,当一组数据对称分布时 有68.27的数据将分布在平均数加减1个标准差的范围之内。 有95.45的数据将分布在平均数加减2个标准差的范围之内。 有99.73的数据将分布在平均数加减3个标准差的范围之内。,课堂小练习,一个独自生活的老年人每月在食品上的支出额的样本
23、具有近似对称、钟型频数分布的特点,样本均值是150美元,标准差为20美元。使用经验法则: 1.大约68%月度食品支出分布在哪两个值之间? 2.大约95%月度食品支出分布在哪两个值之间? 3.几乎全部的月度食品支出分布在哪两个值之间?,1.一家公司在招收职员时,首先要通过两项能力测试。在A项测试中,其平均数是100分,标准差是15分;在B项测试中,其平均分是400分,标准差是50分,一位应试者在A项测试中得了115分,在B项测试中的了425分。与平均分数相比,该位应试者哪一项测试更为理想? 2.一条成品生产线平均每天的产量为3700件,标准差为50件。如果某一天的产量低于或高于平均产量,并落入正负两个标准差的范围之外,就认为该生产线“失去控制”。下面是一周内各天的产量,该生产线哪几天失去了控制?,切比雪夫不等式(Chebyshevs inequality ),如果一组数据不是对称分布,经验法则就不再适用,这时可使用切比雪夫不等式,它对任何分布形状的数据都适用 切比雪夫不等式提供的是“下界”,也就是“所占比例至少是多少” 对于任意分布形态的数据,根据切比雪夫不等式,至少有1-1/k2的数据落在k个标准差之内。其中k是大于1的任意值,但不一定是整数,切比
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030年中国石棉制品行业发展趋势及投资战略研究报告
- 厦门工学院《供应链管理实验》2023-2024学年第二学期期末试卷
- 温州理工学院《居住建筑设计原理》2023-2024学年第二学期期末试卷
- 贵州城市职业学院《化工原理实验一》2023-2024学年第二学期期末试卷
- 南京工业职业技术大学《儿重发育保健护理》2023-2024学年第二学期期末试卷
- 河南质量工程职业学院《数字媒体后期制作》2023-2024学年第二学期期末试卷
- 山东现代学院《宝石合成与优化》2023-2024学年第二学期期末试卷
- 河南应用技术职业学院《建筑风格史》2023-2024学年第二学期期末试卷
- 四川音乐学院《ED器件与应用技术》2023-2024学年第二学期期末试卷
- 聊城大学《幼儿心理学》2023-2024学年第二学期期末试卷
- 初中语文九年级下册阅读理解50篇附答案解析
- 《陶瓷造型工艺》课程标准
- 火电厂各指标指标解析(最新版)
- 病毒性脑炎患者的护理查房ppt课件
- TPU材料项目可行性研究报告写作参考范文
- 第二编 债权总论
- 试用期考核合格证明表
- 常见八种疾病
- 胶粘剂基础知识及产品详解(课堂PPT)
- 铁路总公司近期处理的七起突出质量问题的通报
- 常用洪水预报模型介绍
评论
0/150
提交评论