描述性统计分析_第1页
描述性统计分析_第2页
描述性统计分析_第3页
描述性统计分析_第4页
描述性统计分析_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 数据描述分析1前言在做数据分析的时候,一般首先要对数据进行描述性分析,以便于描述测量样本的各种特征及其所代表的总体的特征以及发现其数据的内在规律,再选择进一步分析的方法。2数据描述分析要对调查总体所有变量的有关数据做统计性描述,主要包括频数分析集中趋势分析离散程度分析分布形态分析目录3频数分析相关概念频数:是指一群数据在各个值(或区间)上所出现的数据的个数,也称为次数。频数分布:是数据集的表格式汇总,表示几个互不重叠组中的每一个项目的频数,是对原始资料进行加工整理的一种常用方法。4频率分析步骤1、排列数据2、确定组别数3、计算组距4、选择组限5、绘制频数分布表5频数分析的必要性采用频数分布方

2、法有助于研究者对数据分布状态、分布特征以及构成状况进行整体把握。6集中趋势定义 在绝大多数情况下,观测值总是集中出现在某一区域内,呈现出一种趋向中央变化的态势,在统计学中称为数据分布的集中趋势。度量方法 集中趋势的度量包括了均值(mean),中位数(median),众数(mode)。7均值、中位数、众数的渊源均值:表示一系列数据或统计总体的平均特征的值中位数:将总体单位的某一数量标志的各个数值按照大小顺序排列,居于中间位置的那个数值就是中位数。众数:众数是指变量数列中出现次数最多或频率最大的变量值。8众数、中位数、算术平均数数值关系(一)对称分布情况下(二)偏态分布情况下9数据类型与集中趋势测

3、度值为该数据类型最适合用的测度值.10均值、中位数、众数的代表性衡量及使用前面我们知道均值、中位数、众数的定义不同,特点和适用范围不同,在衡量这些平均指标的代表性时要根据不同的情况加以具体分析。1.对于不同的总体在平均指标相等的情况下,我们一般用总体的标准差这个指标来衡量这些平均指标的代表性大小,一般来说,标准差较大的总体其平均指标的代表性较小。2.对于不同的总体在其平均指标不相等的情况下,我们一般用离散系数来衡量这些平均指标的代表性,一般来说,这时离散系数较小的总体其平均指标的代表性较大。3.对于同一总体中算术平均数、中位数、众数的代表性高低的衡量。由于这些起代表意义的平均指标本身所具有的特

4、点不同,应用范围不同,在描述和反映不同现象时的代表性也不同,只有根据它们的不同特点,正确恰当地根据不同的情况选择不同的平均指标,才能够提高这些平均指标的代表性,更客观、准确地反映和描述事物现象的本质特征。11离散趋势 1. 离散趋势的各测度值是对数据离散程度所做的描述2. 反映各变量值远离其中心值的程度,因此也称为离中趋势3. 从另一个侧面说明了集中趋势测度值的代表程度。12离散趋势测度指标 1、极差2、四分位差3、平均差4、标准差5、方差6、离散系数四分位差是四分位数中间两个分位之差。平均差是总体各单位标志值对其算术平数的离差绝对值的算术平均数。总体各单位标志值对其算术平均数离差平方的算术平均数的平方根又称均方差或均方根差标准差的平方即为方差一组变量值的最大值与最小值之差13离散趋势分析的意义反映的是各变量值偏离其中心值的程度,是个案与个案之间的差异情况。这种测量法,与前面所讲的集中趋势测量法具

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论