




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、南京财经大学统计学系,第四章 数据的描述性分析,本章内容,第一节 集中趋势的描述 第二节 离散程度的描述 第三节 分布的偏态与峰度,集中趋势的描述,一、数值平均数 1. 算术平均数 2. 调和平均数 3. 几何平均数,第一节 集中趋势的描述,二、位置平均数 1. 中位数 2. 众数,对比,离散程度的描述,一、绝对指标 1. 极差与四分位差 2. 平均差 3. 标准差与方差 二、相对指标离散系数,第二节 离散程度的描述,数据标准化,是非标志标准差,分布的偏态与峰度,一、原点矩 二、中心矩,第三节 分布的偏态与峰度,三、分布的偏态 四、分布的峰度,集中趋势,集中趋势反映的是一组数据向某一中心值靠拢
2、的倾向,在中心附近的数据数目较多,而远离中心的较少。对集中趋势进行描述就是寻找数据一般水平的中心值或代表值。,算术平均数,算术平均数是总体中各个体的某个数量标志的总和与个体总数的比值,一般用符号 表示。,简单算术平均数 加权算术平均数 算术平均数的数学性质,简单算术平均数,加权算术平均数,权数,算术平均数的数学性质,权数,次数f的作用:当变量值比较大的次数多时,平均数就接近于变量值大的一方;当变量值比较小的次数多时,平均数就接近于变量值小的一方。可见,次数对变量值在平均数中的影响起着某种权衡轻重的作用,因此被称为权数。,权数,次数f的作用:当变量值比较大的次数多时,平均数就接近于变量值大的一方
3、;当变量值比较小的次数多时,平均数就接近于变量值小的一方。可见,次数对变量值在平均数中的影响起着某种权衡轻重的作用,因此被称为权数。,调和平均数,调和平均数(Harmonic mean)是各变量值倒数的算术平均数的倒数。由于它是根据变量值倒数计算的,所以又称作倒数平均数,通常用 表示。,简单调和平均数 加权调和平均数 调和平均数是算术平均数的变形,简单调和平均数,加权调和平均数,调和平均数是算术平均数的变形,几何平均数,几何平均数是n个变量值连乘积的n次方根。几何平均数是计算平均比率和平均速度最适用的一种方法。通常用 表示。,简单几何平均数 加权几何平均数,简单几何平均数,加权几何平均数,注意
4、:不能直接平均增长速度,中位数,中位数是一组数据按大小顺序排列后,处于中间位置的那个变量值,通常用 表示。其定义表明,中位数就是将某变量的全部数据均等地分为两半的那个变量值:一半数值小于中位数,另一半数值大于中位数。中位数是一个位置代表值,因此它不受极端变量值的影响。,由未分组数据确定中位数 由单项数列确定中位数 由组距数列确定中位数,分位数,由未分组数据确定中位数,对未分组数据资料,需先将各变量值按大小顺序排列,并按公式 确定中位数的位置。,当一个序列中的项数为奇数时,则处于序列中间位置的变量值就是中位数。 例: 7、6、8、2、3 当一个序列的项数是偶数时,则应取中间两个数的中点值作为中位
5、数,即取中间两个变量值的平均数为中位数。 例: 2、5、7、8、11、12,由单项数列确定中位数,先计算各组的累计次数,再按公式 确定 中位数的位置,并对照累计次数确定中位数。,由组距数列确定中位数,下限公式:,上限公式:,分位数,三个数值可以将变量数列划分为项数相等的四部分,这三个数值就定义为四分位数。 十分位数和百分位数分别是将变量数列十等分和一百等分的数值 。,众数,众数是一组数据中出现次数最多的那个变量值,通常用 表示。,由未分组数据确定众数 由单项数列确定众数 由组距数列确定众数,由未分组数据确定众数,例1: 7、6、8、2、3 例2: 7、6、8、2、3 、4、3、2、3 例3:
6、7、6、8、2、3 、4、3、2、3、2,由单项数列确定众数,由组距数列确定众数,下限公式:,上限公式:,对比,1. 众数、中位数和算术平均数的关系,2. 众数、中位数和算术平均数的特点与应用场合,极差与四分位差,极差也叫全距,是一组数据的最大值与最小值之离差,即:,四分位差是指第三四分位数与第一四分位数之差,也称为内距或四分间距,计算公式为:,平均差,平均差也称平均离差,是各变量值与其平均数离差绝对值的平均数,通常用 表示。,简单式平均差 加权式平均差,简单式平均差,加权式平均差,标准差与方差,标准差又称均方差,它是各单位变量值与其平均数离差平方的平均数的方根,通常用 表示。它是测度数据离散
7、程度的最主要方法。 方差是各变量值与其算术平均数离差平方和的平均数,即是标准差的平方,用 表示总体的方差;用 表示样本的方差。,总体与样本标准差,简单式标准差 加权式标准差,简单式标准差,加权式标准差,总体与样本标准差,简单式,加权式,总体,样本,数据标准化,标准化数值是变量值与其平均数的离差除以标准差后的值,也称为z分数或标准分数。设标准化数值为z,则有:,离散系数,对于平均数不等或计量单位不同的不同组别的变量值,是不能直接用离散程度的绝对指标比较其离散程度的。为了消除变量平均数不等和计量单位不同对离散程度测度值的影响,需要计算离散程度的相对指标,即离散系数,其一般公式是:,是非标志标准差,是一个比率,它表示具有某种特征的个体的数量占总体中个体总数的比重,即总体成数。 是非标志的平均数为: 是非标志的标准差为:,原点矩,一般式,一阶原点矩,中心矩,一般式,二阶中心矩,偏态,偏态是对分布偏斜方向和程度的测度。变量分组后,总体中各个体在不同的分组变量值下分布并不均匀对称,而呈现出偏斜的分布状况,统计上将其称为偏态分布。,偏态系数 的数值一般在0与3之间,越接近0,分布的偏斜度越小;越接近3,分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 标准汽车租赁合同协议
- 农业灌溉系统设计与安装手册
- 少年英雄传记的读后感
- 无人机在物流领域的应用合作协议
- 环境管理体系认证服务合同
- 零售业行业-销售数据统计表
- 成长的烦恼故事评析报告
- 小学语文成语故事解读
- 西餐原料知识培训课件
- 种子委托生产合同
- 国家基本药物临床应用指南最完整版
- 急性髓系白血病小讲课
- 大气冬季滑雪旅游宣传
- 2016-2023年株洲师范高等专科学校高职单招(英语/数学/语文)笔试历年参考题库含答案解析
- 项目成本管控要素清单
- 歌唱二小放牛郎 金巍 女声合唱谱
- 基层公职人员禁毒知识讲座
- 中小学生综合实践基地(学校)考核指标体系评分标准
- 2024深海矿产资源开采系统技术指南
- 一+《展示国家工程++了解工匠贡献》(教学课件)-【中职专用】高二语文精讲课堂(高教版2023·职业模块)
- 北京长峰医院4.18火灾事故案例分析
评论
0/150
提交评论