版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、南京财经大学统计学系第四章数据的描述性分析高等教育出版社 高等教育电子音像出版社本章内容一、相对程度的描述二、集中趋势的描述三、离散程度的描述四、分布的偏度与峰度单变量截面数据有限总体与样本1、计划完成程度相对指标2、结构相对指标3、比例相对指标4、比较相对指标5、动态相对指标6、强度相对指标7、相对指标应用的原则 一、相对程度的描述数值平均数1. 算术平均数2. 调和平均数3. 几何平均数二、集中趋势的描述位置平均数1. 中位数2. 众数对比绝对指标 1. 极差与四分位差 2. 平均绝对差 3. 标准差与方差相对指标 - 离散系数三、离散程度的描述数据标准化 无量纲, 不改变次序; 离群点,
2、 异常点一个特殊的均值和方差 (0-1标志, 贝努利分布)相对程度的概念相对程度是指由两个有联系的指标之比值。其表现形式有两种: 1、无名数 (即无计量单位) 2、有名数 公斤/人,人/平方公里无名数又分为系数和倍数、成数、百分数、千分数等。计划完成程度相对指标计划完成程度相对指标是实际完成数与计划任务数之比。计划任务为绝对数或平均数时,可直接用实际数与计划数对比;如果计划任务为相对数时,则需要考虑上期的实际水平。 比例相对指标比例相对指标是指同一总体中,部分与部分之比。反映总体内部不同部分之间的比例关系。其特点是: 1、分子分母可以互换 2、多用几比几表示比较相对指标比较相对指标是指同一时间
3、,不同总体的同一指标之比,反映同类事物在不同空间的对比关系。其特点是: 1、分子分母可以互换 2、多用几比几表示动态相对指标动态相对指标是指同一总体的不同时间的同一指标之比,反映同一现象在不同时间上的发展变化情况。其特点是: 1、分子分母不能互换 2、多以%表示基期:作为比较标准或参照的时期报告期:当期,本期,感兴趣或所关心的时期相对指标应用的原则1、可比性原则 (1) 正确选择对比基数 (2) 保持对比指标的可比性2、相对指标与总量指标结合运用原则3、多种相对指标结合运用原则集中趋势 集中趋势(Central Tendency)反映的是一组数据向某一中心值靠拢的倾向,在中心附近的数据数目较多
4、,而远离中心的较少。对集中趋势进行描述就是寻找数据一般水平的中心值或代表值。描述集中趋势的指标分为: 数值平均数 和 位置平均数简单算术平均数AVERAGE函数样本均值加权算术平均数权数单项数列组距数列加权算术平均数与简单算术平均数没有本质区别,只是表达形式不同而已!单项数列的算术平均数该班同学的平均年龄.下 表算术平均数的数学性质权数 次数f的作用:当变量值比较大的次数多时,平均数就接近于变量值大的一方;当变量值比较小的次数多时,平均数就接近于变量值小的一方。次数对变量值在平均数中的影响起着某种权衡轻重的作用,因此被称为权数。权重调和平均数 调和平均数(Harmonic mean)是各变量值
5、倒数的算术平均数的倒数。由于它是根据变量值倒数计算的,所以又称作倒数平均数,通常用 表示。简单调和平均数加权调和平均数调和平均数是算术平均数的变形 HARMEAN函数加权调和平均数调和平均数是算术平均数的变形 必须结合问题的实际背景来理解!不能死套公式! 本质上与算术平均数相同,只是已知数据不同而带来的表达形式的不同而已!简单几何平均数加权几何平均数注意:不能直接求平均增长速度中位数 中位数(Median)是一组数据按大小顺序排列后,处于中间位置的那个变量值,通常用 表示。其定义表明,中位数就是将某变量的全部数据均等地分为两半的那个变量值:一半数值小于中位数,另一半数值大于中位数。中位数是一个
6、位置代表值,因此它受极端变量值的影响较小。未分组数据的中位数单项数列的中位数组距数列的中位数 (略)分位数由未分组数据确定中位数对未分组数据资料,先将各变量值按大小顺序排列,并根据数据个数n的奇偶性确定中位数的位置。若序列的项数为奇数时,则处于序列中间位置的变量值就是中位数。 (n+1)/2例: 7、6、8、2、3 若序列的项数是偶数时,则应取中间位置上的两个数的中点作为中位数,即取中间两个变量值的平均数为中位数。 n/2 和 n/2+1例: 2、5、7、8、11、12 MEDIAN函数由单项数列确定中位数先计算总次数(即数据总数) ,根据其奇偶性确定中位数所在位置(类上),并对照向上累积数确
7、定中位数所在的组,进而确定中位数。分位数四分位数:三个数值可以将变量数列划分为项数相等的四部分,这三个数值就定义为四分位数(Quartiles)。十分位数:十等分百分位数(Percentile):一百等分p分位数众 数 众数(Mode)是一组数据中出现次数最多的那个变量值,通常用 表示。由未分组数据确定众数由单项数列确定众数由组距数列确定众数 (略)MODE函数由未分组数据确定众数例1: 7、6、8、2、3例2: 7、6、8、2、3 、4、3、2、3例3: 7、6、8、2、3 、4、3、2、3、2注:有多个众数时, mode函数只返回一个值!由单项数列确定众数比较容易,直接观察1. 众数、中位
8、数和算术平均数的关系2. 众数、中位数和算术平均数的特点与应用场合众数:峰值,受极端值的影响较小,不唯一;中位数:受极端值的影响较小;算术平均数:具有优良的数学性质,受极端值的影响 较大,有时代表性较差。极差与四分位差 极差(Range)也叫全距,是一组数据的最大值与最小值之离差,即: 四分位差(quartile range)是指第三四分位数与第一四分位数之差,也称为内距或四分间距,用 表示。四分位差的计算公式为: 平均绝对差平均绝对偏差(Mean absolute deviation)也称平均离差,是各变量值与其平均数离差绝对值的平均数,通常用 表示。简单平均绝对差加权平均绝对差AVEDEV
9、( )函数简单平均绝对差加权平均绝对差 标准差(Standard deviation), 又称均方差,它是各单位的变量值与其平均数离差平方的平均数的方根。它是测度数据离散程度的最主要方法。两种形式:总体标准差(常用 表示)和样本标准差(常用 s 表示) 总体 方差(Variance)是各个体的变量值与其算术平均数离差平方和的平均数,即标准差的平方。也有两种形式,总体方差和样本方差,用 表示总体方差;用 表示样本方差。 总体:VARP( )函数 样本:VAR( )函数 标准差与方差总体与样本标准差简单标准差 加权标准差简单标准差总体:STDEVP( )函数,样本:STDEV( )函数加权标准差总
10、体与样本标准差简单式加权式总体样本离散系数 (变异系数) 对于平均数不等或计量单位不同的变量值,是不能直接用离散程度的绝对指标比较其离散程度的。为了消除变量平均数不等和计量单位不同对离散程度测度值的影响,需要计算离散程度的相对指标,即离散系数,其一般公式是:数据标准化 标准化数值是变量值与其平均数的离差除以标准差后的值,也称为z分数或标准分数。若原始数据为标准化后为zi,则有:根据中心极限定理,样本量较大时,标准化后的Z近似服从标准正态分布。标准正态分布的常用分位数为 可知标准分大于1.65的人占5%另一例:薪水数据原点矩K阶原点矩一阶原点矩分组数据未分组数据的原点矩一阶K阶中心矩一般式二阶中
11、心矩未分组数据的中心矩分组数据二阶k阶k 1偏 态(度) 偏度(Skewness)系数是对分布偏斜方向和程度的测度。变量分组后,总体中各个体在不同组中的分布有时并不均匀对称,而呈现出偏斜的状况, 称为偏态分布。 偏态系数 的数值一般在0与3之间,越接近0,分布的偏斜度越小;越接近3,分布的偏斜度越大。对称,正偏或右偏,负偏或左偏例题SKEW( )函数薪水数据例题峰 度 峰度(Kurtosis)是分布集中趋势高峰的形状。在变量的分布特征中,常以标准正态分布为标准,观察变量分布曲线顶峰的尖平程度,称之为峰度。标准正态分布的峰度系数为0; 当 时,与N(0,1)顶部形状类似,当 时,比N(0,1)分布的顶部要尖,为尖峰分布,值越大分布的顶峰越尖;当 时,比N(0,1)分布的顶部要平,为平顶分布,值越小分布的顶峰越平。例题KURT( )函数薪水数据
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 豌豆思维课程设计待遇
- 2025年度个人自建住房施工监理服务合同样本4篇
- 砌墙工程施工方案
- 楼房加固施工方案模板
- 食工原理课程设计果蔬汁
- 年度医疗健康大数据战略市场规划报告
- 年度化学材料:灌浆料产业分析报告
- 二零二五版智能门窗系统安装与远程监控服务合同4篇
- 影视剧制作方与临时演员的2025年度聘用合同6篇
- 2025年猪圈配套设施安装服务合同124篇
- 冷库存储合同协议书范本
- AQ/T 4131-2023 烟花爆竹重大危险源辨识(正式版)
- 武术体育运动文案范文
- 设计服务合同范本百度网盘
- 2024年市级专科护士理论考核试题及答案
- 肺炎临床路径
- 供应商供货服务方案(2篇)
- JB∕T 3077-2019 汽轮机图形符号
- 《药物临床试验机构备案评估指南及检查细则(试行)》
- 河北省2022年中考数学真题及答案
- 氨水安全技术说明书msds
评论
0/150
提交评论