浅谈描述性统计分析过程(共18页).ppt_第1页
浅谈描述性统计分析过程(共18页).ppt_第2页
浅谈描述性统计分析过程(共18页).ppt_第3页
浅谈描述性统计分析过程(共18页).ppt_第4页
浅谈描述性统计分析过程(共18页).ppt_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、本资料来源 所谓描述性统计分析,就是对一组数据的各种特征进行所谓描述性统计分析,就是对一组数据的各种特征进行分析,以便于描述测量样本的各种特征及其所代表的总体的分析,以便于描述测量样本的各种特征及其所代表的总体的特征。描述性统计分析的项目很多,常用的如平均数、标准特征。描述性统计分析的项目很多,常用的如平均数、标准差、中位数、频数分布、正态或偏态程度等等。这些分析是差、中位数、频数分布、正态或偏态程度等等。这些分析是复杂统计分析的基础。复杂统计分析的基础。第二章第二章 描述性统计分析过程描述性统计分析过程 严格地讲,在方差和标准差的计算中,分母应取严格地讲,在方差和标准差的计算中,分母应取n-

2、1n-1,因为,因为数据变异的自由度是数据变异的自由度是n-1n-1。但在大样本情况下,使用。但在大样本情况下,使用n n和和n-1n-1差别差别不大。不大。 频数频数 (Frequency) 就是一个变量的各个观测值出现的次就是一个变量的各个观测值出现的次数。比如某班语文考试的成绩,可以统计出各分数值的人数数。比如某班语文考试的成绩,可以统计出各分数值的人数。 峰度(峰度(Kurtosis) : 是描述某变量所有取值的分布形态陡缓是描述某变量所有取值的分布形态陡缓程度的统计量,而峰度对陡缓程度的度量是与正态分布进行比程度的统计量,而峰度对陡缓程度的度量是与正态分布进行比较的结果。如果峰度等于

3、较的结果。如果峰度等于 0 ,其数据分布的陡缓程度与正态分,其数据分布的陡缓程度与正态分布相同布相同 ;峰度大于;峰度大于 0,其数据分布比正态分布更陡峭;峰度小,其数据分布比正态分布更陡峭;峰度小于于0,其数据分布比正态分布更平坦,其数据分布比正态分布更平坦。实例演示实例演示 偏度(偏度( Skewness ) 是描述数据分布对称性的统计量是描述数据分布对称性的统计量 ,而,而且也是与正态分布的对称性相比较而得到的。如果分布的偏度且也是与正态分布的对称性相比较而得到的。如果分布的偏度等于等于0 ,则其数据分布的对称性与正态分布相同,则其数据分布的对称性与正态分布相同 ;如果偏度大;如果偏度大

4、于于0,则其分布为正偏或右偏则其分布为正偏或右偏,即在峰的右边有大的偏差值即在峰的右边有大的偏差值,使使右边出现一个拖得较远的尾巴;如果偏度小于右边出现一个拖得较远的尾巴;如果偏度小于 0,则为负偏或,则为负偏或左偏,即在峰的左边有大的偏差值左偏,即在峰的左边有大的偏差值,使左边出现一个拖得较远使左边出现一个拖得较远的尾巴。的尾巴。实例演示实例演示 Z分数:从平均数为分数:从平均数为 ,标准差为,标准差为 的总体中抽取一观测值,该的总体中抽取一观测值,该观测值的观测值的Z分数是其距离总体平均值的标准差数。标准分数反映的分数是其距离总体平均值的标准差数。标准分数反映的是一观测值与其他分数相比的相

5、对位置。比如是一观测值与其他分数相比的相对位置。比如Z 分数为分数为 1.5 ,则其,则其比平均数大比平均数大 1.5 个标准差。在实际应用中个标准差。在实际应用中 ,为了避免小数的不便,为了避免小数的不便,可以对标准分数进行线性转换:可以对标准分数进行线性转换:T10Z50 比如某人在艾森克人格问卷的测量中比如某人在艾森克人格问卷的测量中 ,其精神质得分比同年,其精神质得分比同年龄人的平均成绩高龄人的平均成绩高2.0个标准差,则其换算后的标准分数为个标准差,则其换算后的标准分数为 70 分分 ;如果另一人的测试分数正好等于平均数,则其标准分数为如果另一人的测试分数正好等于平均数,则其标准分数

6、为50。 探索分析是对一组或多组数据的总体分布特征进行分析,以探索分析是对一组或多组数据的总体分布特征进行分析,以考察其中有无奇异值、极大或极小值等;考察各组数据或全部考察其中有无奇异值、极大或极小值等;考察各组数据或全部数据是不是正态或接近于正态分布;探索多组数据之间的方差数据是不是正态或接近于正态分布;探索多组数据之间的方差是否齐性,以确定是否可以采用某种统计分析技术对数据进行是否齐性,以确定是否可以采用某种统计分析技术对数据进行检验等等。我们这里介绍:检验等等。我们这里介绍: 1. 用直方图反映数据的分布直观形式;用直方图反映数据的分布直观形式; 2. 用箱图用箱图 (或叫框图)反映数据

7、的集中趋势和奇异值;(或叫框图)反映数据的集中趋势和奇异值; 3. 用用Levene检验考察多组间方差是否齐性检验考察多组间方差是否齐性; 4. 用用Q-Q概率图检验数据是否正态分布或接近正态分布。概率图检验数据是否正态分布或接近正态分布。选择反应时间600.0575.0550.0525.0500.0475.0450.0425.0400.0375.0350.0325.0300.0HistogramFrequency3020100Std. Dev = 48.43 Mean = 435.8N = 120.00直方图直方图:是一种频数分布图是一种频数分布图, 它它反映处在某一观测值范围内的反映处在某

8、一观测值范围内的个案数。图中每个直方条下部个案数。图中每个直方条下部的中点坐标是该观测值范围的的中点坐标是该观测值范围的中点、直方条的宽度代表该观中点、直方条的宽度代表该观测值范围、直方条的高度代表测值范围、直方条的高度代表该观测值范围内的个案数或人该观测值范围内的个案数或人数比例。数比例。2. 用箱图用箱图 (或叫框图)反映数据的集中趋势和特异值(或叫框图)反映数据的集中趋势和特异值调调用用数数据据文文件件并并得得到到箱箱图图30303030N =不同颜色的灯光刺激4321选择反应时间700600500400300200100733649552027批注批注 : 箱图可以直观地反映箱图可以直

9、观地反映一组观测值的集中趋势、离一组观测值的集中趋势、离散趋势、不正常观测值(奇散趋势、不正常观测值(奇异值和极值,均可被排除后异值和极值,均可被排除后重新分析)。左图中箱图的重新分析)。左图中箱图的高度代表了高度代表了25 位数到位数到 75 位数的距离;箱图中的位数的距离;箱图中的粗线代表中位数;箱图上下粗线代表中位数;箱图上下中央的垂直线叫触须线,触中央的垂直线叫触须线,触须线的上下截止线分别对应须线的上下截止线分别对应于观测值的最大值和最小值;于观测值的最大值和最小值;用用 O标记的是奇异值标记的是奇异值(与框与框边距离超出框高边距离超出框高1.5倍倍)、用、用*标记的为极大值或极小标

10、记的为极大值或极小值值(与框边距离超出框高与框边距离超出框高3倍倍) 。3. 3. 用用LeveneLevene检验方差是否齐性检验方差是否齐性 方差齐性检验是统计分析中的一种常见过程,它是从样本方方差齐性检验是统计分析中的一种常见过程,它是从样本方差以至样本各自所代表的总体方差是否相同而判断两个样本同质差以至样本各自所代表的总体方差是否相同而判断两个样本同质性(性(homogeneity) 的方法。简单地说,方差齐性检验就是检验各的方法。简单地说,方差齐性检验就是检验各个方差是否存在显著性差异。一般采用个方差是否存在显著性差异。一般采用Levene方法:先将各组观方法:先将各组观测值均转换为

11、离差绝对值,然后对各组离差绝对值进行方差分析,测值均转换为离差绝对值,然后对各组离差绝对值进行方差分析,如果方差分析的结果中如果方差分析的结果中p 0.05,则认为方差齐性(即方差具有相,则认为方差齐性(即方差具有相同性);方差分析的结果中同性);方差分析的结果中p0.05,则认为方差不齐性(即方差,则认为方差不齐性(即方差具有不同质性)。具有不同质性)。4. 4. 用用Q-QQ-Q概率图检验数据是否正态分布概率图检验数据是否正态分布 可以用正态概率可以用正态概率Q-Q图和离散正态概率图和离散正态概率Q-Q 图检验观测值的图检验观测值的分布是否是或接近于正态分布。正态概率图是由观测值与按正态分

12、布是否是或接近于正态分布。正态概率图是由观测值与按正态分布的预期值作出来的散点图分布的预期值作出来的散点图 ,如果实际值为正态分布,如果实际值为正态分布 ,则其,则其与预期值具有线性对应关系,散点图回归一条斜线,该斜线是正与预期值具有线性对应关系,散点图回归一条斜线,该斜线是正态分布的标准线,散点图组成的回归线越接近于标准线,表示实态分布的标准线,散点图组成的回归线越接近于标准线,表示实际观测数据越接近正态分布;如果以观测值、其与正态分布期望际观测数据越接近正态分布;如果以观测值、其与正态分布期望值的离差值做散点图,则当散点近似随机地落在过原点的中间横值的离差值做散点图,则当散点近似随机地落在

13、过原点的中间横线周围时,数据分布接近于正态分布。线周围时,数据分布接近于正态分布。Normal Q-Q Plot of 选择反应时间Observed Value700600500400300200100Expected Normal3210-1-2-3Detrended Normal Q-Q Plot of 选择反应时间Observed Value700600500400300200100Dev from Normal1.51.0.50.0-.5-1.0-1.5-2.0 描述性统计,是心理学研究、教育研究中资料分析的基描述性统计,是心理学研究、教育研究中资料分析的基本内容和进一步分析的基础。常

14、用的除上述介绍之外,还包本内容和进一步分析的基础。常用的除上述介绍之外,还包括交叉列联表分析,我们将交叉列联表的分析转入非参数检括交叉列联表分析,我们将交叉列联表的分析转入非参数检验部分讨论。验部分讨论。 本章要求熟练掌握的内容包括:平均数、标准差、中位本章要求熟练掌握的内容包括:平均数、标准差、中位数、众数、频数分布、标准分数数、众数、频数分布、标准分数 (Z)(Z)及其线性转换、峰度计及其线性转换、峰度计算、偏度计算、奇异值和极值检测、方差齐性检验等方面的算、偏度计算、奇异值和极值检测、方差齐性检验等方面的SPSSSPSS过程;准确理解直方图和箱图的各种特征及其所代表的过程;准确理解直方图和箱图的各种特征及其所代表的含义。含义。练习题练习题1. 表表2-lx-1所示的数据是某中学初二所示的数据是某中学初二5班学生的期末考试成绩。班学生的期末考试成绩。 (1)请建立)请建立SPSS数据文件,然后计算全班同学各门功课成绩的平均数据文件,然后计算全班同学各门功课成绩的平均数、标准误、标准差、中位数、众数、全距;数、标准误、标准差、中位数、众数、全距; (2)作出各门课程成绩的直方图,从直方图大致判断其偏度、峰度)作出各门课程成绩的直方图,从直方图大致

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论