




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章SPSS描述性统计分析本章主要内容:
SPSS频数分析
SPSS描述统计分析SPSS摸索性分析SPSS列联表分析统计分析目标,是研究总体数量特性。但是,实践中能够得到往往是从总体中随机抽取一部分观测对象,它们组成了样本。通过对样本样本研究,来对总体实际情况作出也许判断。因此,在数据搜集、整顿完成,进行深入分析之前,首要工作就是去理解数据整体情况,随后才能做深入推断。为了实现上述分析,往往有两种实现方式:1)数值计算,通过数值来精确反应数据基本统计特性;2)图形绘制,即绘制常见基本统计图形,通过图形来直观展现数据分布特点。一般,两种方式混合使用。SPSS许多模块均可完成描述性分析,但专门为该目标而设计几个模块则集中在菜单栏“分析→描述统计”子菜单中。第1页SPSS频数分析概述:频数分析是描述性统计中最常用办法之一,他能够理解变量取值情况,对把握数据分布特性非常有用。频数分析过程是专门为产生频数表而设计。它不但能够产生详细频数表,还能够按要求给出某百分位数值以及常用条形图、饼图等统计图。整体分析与设计内容
SPSS频数分析一、操作(实践数据:产品销售量.sav)1)菜单“分析→描述统计→频率”。2)对话框中,左侧选择一种或多种待分析变量,移入右侧。3)“显示频率表格”,勾选该复选框,可输出频数分析表。第2页整体分析与设计内容
SPSS频数分析二、几个主要设置对话框“统计量”按钮对应对话框:1)四分位数:显示25%、50%、75%分位数。2)割点:勾选后可输入数值A,将数据平分为A等分。例如,输入5,表达输出20%、40%、60%、80%百分位数。3)百分位数:选中后,可激活右侧文本框和列表。可输入、更改和删除自定义百分位数。输出反应数据离散程度统计量。输出反应数据集中程度统计量。输出描述数据分布形状及特性统计量。第3页整体分析与设计内容
SPSS频数分析“图表”按钮对应对话框:注:1)选择直方图选项,则不能再设置图表值选项。2)在选中直方图选项后,能够深入选择在直方图上显示正态曲线。3)仅适用于连续型数值型变量。“格式”按钮对应对话框:将所有变量集中在一种图形中输出,方便比较。每个变量单独输出一种图形。控制频数表输出分类数量,当频数表分组数大于设定值时,严禁其输出。用以避免产生巨型表格。第4页整体分析与设计内容
SPSS频数分析基本统计信息汇总表。N表达进行统计分析样本总量;Valid表达有效样本量:Missing表达缺失样本数目。Percentiles列出了销售数据四分位数频数分析表。Frequency表达变量值落在某个区间(或类别)中次数;Percent是各频数占总样本数百分比;ValidPercent是有效百分比;CumulativePercent是累积百分比,指各百分比逐层累加起来成果。三、输出成果分析第5页整体分析与设计内容
SPSS频数分析从图形特性看,数据呈右偏分布。历史销售数据总体数值偏大;同步,最大值“27”差不多是最小值“14”一倍,说明这种产品销售量不是很稳定,具有较大波动性。第6页整体分析与设计内容
SPSS描述统计分析一、原理统计量是研究随机变量变化综合特性主要工具,描述性统计量分类如下:对数据特性描述集中趋势离散程度分布形态均值众数中位数其他指标全距标准差方差离散系数其他指标偏度峰度第7页整体分析与设计内容
SPSS描述统计分析1、集中趋势集中趋势是指一组数据向某一中心值靠拢倾向。均值(Mean):反应了某变量所有取值集中趋势或平均水平。均值往往会受到异常大和异常小数值影响,因此对于严重偏态分布,均值会失去应有代表性。众数(Mode):分布数列中最常出现标志值,频数或频率最大。众数适用于单峰对称情况。对于多峰分布则不适用。中位数(Median):指将分布数列中各单位标志值依其大小次序排列,位于中间位置标志值称为中位数。中位数来描述连续变量,会损失很多信息。例如,其他变量比中位数大多少或小多少等。第8页整体分析与设计内容
SPSS描述统计分析2、刻画离散程度描述性统计量离散程度是指一组数据远离其中心值程度,即考查数据分布疏密程度。全距(Range):也称“范围”,是数据中最大值和最小值之差,又称“极差”。
Range=最大值-最小值全距说明了数据整体变动范围,但不能反应其间变量分布情况。标准差(StandardDeviation):指变量取值距离均值平均离散程度统计量。方差(Variance):是标准差平方。方差在使用上存在一点不足:量纲不统一。第9页整体分析与设计内容
SPSS描述统计分析3、刻画分布形态描述性统计量分布形态是指数据是否对称,偏斜程度如何,分布陡缓程度如何等。偏度(Skewness):是描述变量取值分布形态对称性统计量。
当偏度值为0,说明数据对称分布;当偏度值大于0,表达变量取值右偏,在直方图中有一条长尾拖在右边;当偏度值不大于0,表达变量取值左偏,在直方图中有一条长尾拖在左边。峰度(Kurtosis):用来描述变量取值分布形态陡缓程度统计量,是指分布图形尖峰程度。当数据分布和标准正态分布陡缓程度相同步,峰度为0;峰度大于0说明数据分布比正态分布陡峭,为尖峰分布;峰度不大于0为平峰分布。第10页整体分析与设计内容
SPSS描述统计分析二、操作描述性统计分析过程是统计描述应用最多一种过程。在这个过程中,能够将原始数据转换为标准值,并以变量形式保存,供后来分析。菜单:“分析→描述统计→描述”。示例数据:奥斯卡获奖者年纪.sav
标准化处理,同步产生对应Z得分,并作为新变量保存在数据窗口。新变量为原变量名+前缀Z。标准化计算公式:Xi
是变量X第i个取值;S是标准差。第11页整体分析与设计内容
SPSS描述统计分析三、输出分析N栏显示男、女样本容量相同;从均值上看女<男;男全距和标准差都不大于女,说明男演员获奖年纪波动幅度不大于女演员;从峰度和偏度看,两组数都不服从正态分布。第12页整体分析与设计内容
SPSS摸索性统计分析一、办法原理摸索性数据分析(ExplorataryDataAnalysis,简称EDA)基本思想是从数据本身出发,而不拘泥于模型假设;采取灵活办法来探讨数据分布大体情况,为深入结合模型研究提供线索,为传统统计推断提供良好基础,并且减少盲目性。在实践中,数据分析往往分两个步骤,即摸索性数据分析和实证分析。摸索性数据分析是从复杂数据中分离出数据基本模式和特点,让分析者发觉其中规律,方便选择分析办法;而对于摸索性数据分析中发觉数据规律,分析者需要使用特定统计模型进行实证分析,以确定规律是否正确。一般,摸索性分析主要考查下列内容:1)检查数据是否有错,并决定是否删除异常数据。2)取得数据分布特性。3)对数据初步观测,发觉某些内在规律。第13页整体分析与设计内容
SPSS摸索性统计分析二、操作摸索性数据分析过程用于计算指定变量摸索性统计量和有关图形。从这个过程中能够取得箱图、茎叶图、直方图、多种正态检查图、频数表、方差齐性检查等成果,以及对非正态或正态非齐性数据进行变换,以表白和检查连续变量数值分布情况。菜单:“分析→描述统计→摸索”(示例数据:中国南北都市温差.sav)因变量列表,即待分析变量列表。可从左侧列表中选择一种或多种变量。因子列表,用作数据分组分析。假如选择了多种变量,则组合分组。标注个案,可选择一种变量做标签。当发觉异常值时,可利用该变量做标识。若不选这个变量,系统默认以id变量为标签。第14页整体分析与设计内容
SPSS摸索性统计分析二、按钮对应界面介绍统计量对话框输出前面所讲述各个描述统计量,并可设置均值置信区间。求出中心趋势最大似然比稳健估计量。界外值要求输出显示5个最大值与最小值。在输出窗口被表白为极端值。输出成果显示5%,10%,25%,50%,75%,90%和95%百分位数。“选项”对话框从所有分析中,将因变量或分组变量中带有缺失值观测量给予剔除。从目前分析中,将有缺失值观测量均给予剔除。将分组变量中缺失值单独分组进行统计。第15页整体分析与设计内容
SPSS摸索性统计分析二、按钮对应界面介绍“图”对话框箱图。1)按因子水平分组,每个因变量生成一种单独箱图,便于组间比较。2)不分组:所有因变量生成一种复合箱图。描述性图。分茎叶图和直方图两种。输出显示正态概率与离散正态概率图。幂估计:对每一组数据产生一种中位数自然对数与四分位数自然对数散列点图,达成方差齐次性要求幂次估计;并据此散布图,来估计将各组方差转换成同方差所需幂次。转换:对原始数据进行变换。可在下拉列表中选择转换幂值。未转换:不对数据进行转换,产生原始数据散布图。注:“无”是不产生该选项图形。第16页整体分析与设计内容
SPSS摸索性统计分析三、输出成果北方都市温度标准差大于南方都市,说明北方都市一年温度变化较南方大。从分布形态上来看,南方都市为尖峰、右偏特性;北方都市体现为平峰,左偏特性。基本信息汇总,无缺失值。第17页整体分析与设计内容
SPSS摸索性统计分析三、输出成果茎叶图。1)Frequency表达观测值频数;2)Stem(茎)表达实际观测值除以图下方茎宽(StemWidth)整数部分;3)Leaf(叶),表达观测值除以茎宽小数部分。4)“EachLeaf”:表达每片叶子代表n个观测量。茎叶图在反应整体趋势同步,还能反应详细数值大小,因此,在分析小样本时优势显著。M估计量:1)Huber,稳健估计量;2)Tukey,复权估计量;3)Hampel,非稳健估计量;4)Andrew,波估计量。例子中来看:二者差距较大,差异性显著。南方温度均值都高于北方,数据呈正偏态分布,平均值受影响较大。第18页整体分析与设计内容
SPSS摸索性统计分析三、输出成果箱图:1)中间粗线为中位数;2)方框两端分别表达上四分位数(75%)和下四分位数(25%);3)二者之间距离为四分位数间距。--可知,整个方框内包括了中间50%样本数据;4)方框外上、下两个细线分别表达除去异常值外最大、最小值;5)箱图上、下两端圆圈和星号,表达异常值。基本概念:1)上四分位数和下四分位数之间差,称为四分位数差(IQR,InterQuartileRange)。2)大于上四分位数1.5倍四分位数差,或不大于下四分位数1.5倍四分位数差,称为异常值。3)极端异常值,是超出3倍四分位数差值第19页整体分析与设计内容
SPSS列联表统计分析一、办法原理在实践中,研究者往往希望对两个甚至多种分类变量频数分析进行联合观测。例如,考查不一样年纪阶段和不一样行业人群购买商品房意愿,就需要将年纪和行业这两个分类变量交叉起来组成复合频数表,简称为列联表。列联表是指一种频率对应两个变量表(一种变量用来对行分类,另一种变量用来对列分类),经常被用于分析调查成果,其基本任务有两个:1)根据搜集到样本数据产生二维或多维交叉列联表。2)在列联表基础上,对两两变量之间是否存在有关性进行分析。第20页整体分析与设计内容
SPSS列联表统计分析一、办法原理交叉列联表:两个或两个以上变量交叉分组后想成频数分布表。一种二维rxc列联表如下所示:第21页整体分析与设计内容
SPSS列联表统计分析一、办法原理行列变量间关系:行、列变量独立性检查。独立性检查是指对列联表中行变量和列变量无关这样一种零假设进行检验,即检查行、列变量之间是否独立。常用衡量变量间有关程度统计量是简单有关系数,但在交叉列联表分析中,由于行、列变量往往不是连续等距变量,不符合计算简单有关系数前提纲求,因此一般采取检查办法是卡方检查,其公式为:实际观测频数盼望频数观测频数和盼望频数之间距离一种度量指标。值越小,说明行、列之间有关程度越密切。SPSS在自动计算统计量之后,会给出对应概率P值,通过比较概率P和显著性水平值a大小,来判断是否接收零假设。P≤a,回绝零假设,以为行、列变量不独立;不然,接收零假设。第22页整体分析与设计内容
SPSS列联表统计分析二、操作菜单:“分析→描述统计→交叉表”示例数据:大学生身体素质调查.sav1)选择行、列变量行:选择一种或多种变量,作为列联表行变量。列:选择若干变量,作为列联表列变量。2)选择层变量进行三纬或多维列联表分析,可选择控制变量,添加至“层11”选项组列表框。该变量决定列联表层。若要增加另外控制变量,首先单击“下一张”按钮,再选入另一种变量。选择“上一张”按钮,能够重新选择此前确定变量。显示条形图不输出表格,只输出统计量第23页整体分析与设计内容
SPSS列联表统计分析三、按钮所对应对话框界面1)“精确”按钮—精确检查对话框由此计算显著性水平低于0.05时被以为是显著。此办法适用于较大数据集。当数据少或没有显著分布特性时候,得到结论也许不稳定。对精确显著性水平无偏估计。它先从一种参照样本中反复抽取样本量相同子样本,再通过子样本显著性水平推导总样本显著性水平。使用大数据量情况。由此计算显著性水平低于0.05时被以为是显著,即行、列存在有关性。选中复选框,表达:只有当精确检查办法对单个检查计算时间低于限制条件时,才用它取代蒙特卡洛办法。第24页整体分析与设计内容
SPSS列联表统计分析三、按钮所对应对话框界面2)“统计量”按钮卡方检查计算Pearson有关系数,检测变量线性有关程度;计算Spearman有关系数,检查秩次之间关联。二者取值介于-1(完全负有关)和1(完全正有关)之间。取值为0,则表达二者不存在线性有关性。两个有序变量对称关联程度,取值范围-1~1.取0表达低度或无线性关系。关联性检查,是对Gamma系数非对称性推广。对有关有序变量进行非参数有关检查,适合行、列数相同表。反应忽视定序变量之间有关关系非参数关联程度。取值0~1.取0表达无关联;越接近1,关联度越高。自变量用于预测因变量时,该检查反应预测误差。等于1,表白自变量完全预测因变量;等0,则表白自变量无助于预测因变量。也用来反应关联程度,0~11)Kappa:内部一致性;2)Risk:反应一种原因与某事件发生关联度大小。3)McNemar:用于两个二分变量非参数检查。检查两个二分变量独立性统计量第25页整体分析与设计内容
SPSS列联表统计分析三、按钮所对应对话框界面3)“单元格”按钮假如行、列具有统计上互相独立意义,将显示盼望或预测观测值频数。即单元格中观测值减预测值之差。即Pearson残差,其均值等0,标准差等1非整数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 广告位租赁合同协议围挡
- 劳务合同移交协议
- 书本代理协议合同
- 种植转让协议合同
- 合同变更协议期限
- 废旧车辆买卖合同协议书
- 品牌维护合同协议
- 购销合同撤销协议
- 废旧回收协议合同
- 房地产装修协议合同
- 站台保洁服务方案
- DL-T5190.1-2022电力建设施工技术规范第1部分:土建结构工程
- 2024-2030年中国高端半导体激光芯片行业市场全景调研及发展前景研判报告
- TD/T 1044-2014 生产项目土地复垦验收规程(正式版)
- 脑胶质瘤诊疗指南2022年版
- 儿童通信知识科普
- 2024年长春医学高等专科学校单招职业技能测试题库及答案解析
- 尸僵形成后肌肉组织的形态学变化
- 小儿川崎病护理查房课件
- 银行流动性风险报告
- 设备购置分析报告
评论
0/150
提交评论