第4章 SPSS 20.0基本统计量的描述_第1页
第4章 SPSS 20.0基本统计量的描述_第2页
第4章 SPSS 20.0基本统计量的描述_第3页
第4章 SPSS 20.0基本统计量的描述_第4页
第4章 SPSS 20.0基本统计量的描述_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章SPSS基本统计分析频数分析计算基本描述统计量探索性数据分析交叉分组下的频数分析(卡方检验)多选项分析比率分析涉及的统计过程:“描述统计”的全部“比较均值”的均值过程“多重响应”过程用途:主要用来描述一个或多个变量的描述性统计量以及分布特征,分析变量间的关系。统计基础:随机变量与概率分布随机变量:有些变量在观察前事先不能确定数值,但其取值又有一定规律性。概率(probability):描述随机事件发生的规律性、可能性。取值界于0和1之间。离散性随机变量:如击中次数,常用概率分布列表示具体取值的概率。连续性随机变量:如身高、体重等变量,常用概率分布密度函数表示某取值范围的概率。概率分布密度函数常见的概率分布曲线描述数据分布形状的特征量偏度g1:分布形状的左右对称性。g1>0,正偏态;g1<0,负偏态峰度g2:以正态分布为标准,描述分布峰态的指标。g2>0,尖峭峰;g2<0,平阔峰正态性检验一、频数分析目的:粗略把握数据的分布特征功能:编制频数分布表:频数、百分比、累计百分比绘制频数分析中常用统计图:条图、饼图、直方图计算基本描述统计量基本操作:分析-描述统计-频率选项按钮:统计:选择输出统计量:集中、离散趋势、分布特征、百分位数。图标:选择绘制的图形:条图、饼图、直方图(仅用于定量变量)。格式:定义频数表输出格式分析-描述统计-频率界面统计选项计算分位数计算常用描述统计量频数分布表格式定义频数分析应用举例储户的户口、职业(分类数据):使用频数、百分比描述,累计百分比无太大意义。储户收入水平(定序数据):除使用频数、百分比外,还有累计百分比。取款目的排名:频数分布表输出按频数降序输出频数—格式—降序个数数据中若存在缺失值,使用有效百分比。取款金额(定量数据)的分析不显示频数分析表统计图表:直方图不同户口(城镇、农村)的人群取款目的分析:首先做数据拆分,再进行频数分析条图饼图直方图二、计算基本描述统计量目的:精确把握变量的总体分布状况。基本操作:描述统计-频率过程:统计描述统计-描述过程描述统计-探索过程均值比较-均值过程(分组显示)用途:计算变量的集中趋势、离散趋势、偏度、峰度等指标,绘制统计图。几个过程的基本描述统计量比较“探索”过程可计算分组或不分组的描述性统计量几个过程的其他功能描述统计-描述过程的独有功能例:你能很快找到取款数目异常(>3σ)的储户吗?标准化变换均值比较-均值过程的独有功能分层输出结果分组输出结果三、探索性数据分析基本操作:分析-描述统计-探索过程目的:对数据进行初步考察用途:计算整体或分组数据的描述性统计指标输出描述性统计图:茎叶图、直方图、箱式图正态性检验、方差齐性检验检查数据的错误,辨认奇异值

选项:缺失值处理

1、某观测在所选择的变量中有缺失值时,该观测不参与全部分析

2、仅在与该变量有关的分析中视为缺失值

3、缺失值做为一个组别输出绘制:1、输出图形:箱式图、茎叶图、直方图

2、正态性检验及图示

3、Levene方差齐性检验例:居民储蓄调查描述城乡居民存取款金额的差别检查存取款金额的奇异点和极端值对存取款金额进行正态性检验和方差齐性检验,以便进一步选择分析方法。箱式图是在剔除了变量的极端值、奇异点后计算统计量并绘制的。中间的黑粗线为中位数,红框为四分位间距的范围,上下两个细线为最大、最小值。

四、交叉分组下的频数分析目的:掌握多变量的联合分布特征,分析变量间的关系。功能:产生描述多变量联合分布的列联表比较两个(或以上)样本率或比例差异(卡方检验)变量间的关联度分析1、变量关系概述变量间的关系:有关与无关。有关:如果一个变量的取值发生变化,另外一个变量的取值也相应发生变化无关:如果一个变量的变化不引起另一个变量的变化。性别与四级英语考试通过率的相关统计表述:结果显示,当性别取值不同时,通过率变量的取值并未发生变化,因此性别与考试通过率无关。自变量的不同取值在因变量上无差异,两变量无关。自变量的不同取值在因变量上有差异,两变量有关。因变量自变量表述:统计结果显示,当性别取值不同时,收入变量的取值发生了变化,因此性别与月收入有关。自变量因变量2、双变量关系的统计类型列联表的格式列联分析——行列变量间的关系

两变量是否相互独立。两变量是否有共变趋势。一变量的变化多大程度上能由另一变量的变化来解释。卡方测量的原理:卡方测量用来考察两变量是否独立(无关)。其原理是根据这一概率定理:若两变量无关,则两变量中联合事件发生的概率应等于各自独立发生的概率乘积。在列联表中,这一定理就具体转化为:若两变量无关,则两变量中条件概率应等于各自边缘概率的乘积。反之,则两变量有关,或两变量不独立。由此可见,期望值与观察值的差距越大,说明两变量越不独立,也就越相关。因此,Pearson卡方的表达式如下:当为四格表时,卡方的取值在0~∞之间。卡方值越大,行列变量的关联性越强。列联表的产生:

分析-描述统计-交叉表界面说明【行】:用于选择行*列表中的行变量。【列】:用于选择行*列表中的列变量。【层】:层变量。【显示复式条形图】:显示复式条图。【取消表格】:不输出行*列表。【精确】:针对2*2以上的行*列表设定计算确切概率的方法。注:安装SPSS时除非特别选定,否则“精确”模块一般不安装。列联表所研究的问题城镇和农村的储户收入水平状况相同吗?行变量:户口列变量:收入水平不同班级的患病情况一致吗?行变量:班级列变量:患病城乡储户认为存钱合算的比例是否相同?行变量:户口列变量:什么合算回答不同班级患病

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论