SPSS教程第四章 基本统计分析课件_第1页
SPSS教程第四章 基本统计分析课件_第2页
SPSS教程第四章 基本统计分析课件_第3页
SPSS教程第四章 基本统计分析课件_第4页
SPSS教程第四章 基本统计分析课件_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章 基本统计分析 一、SPSS统计分析功能概述1、SPSS数值分析过程2、SPSS图形分析过程1、SPSS数值分析过程Descriptive Statistics Compare means General linear model CorrelateRegressionLoglinearClassifyData reduction ScaleNonparametric tests SurvivalMultiple response2、SPSS图形分析过程专门作为一章讲授基本统计分析功能包括:1、报告分析(Report)2、描述性统计分析(Descriptive Statistics)二、

2、基本统计分析功能按AnalyzeReportsOLAP Cubes顺序单击打开如下对话框:摘要变量框:进入此框变量为数值型变量分层变量框:进入此框变量为数值型或字符型变量1、OLAP(在线分析处理过程)可选择的统计量:Sum 总和Number of Cases 观测量数目Mean 均值 Standard Deviation 标准差Percent of Total Sum 占总和的百分比Percent of Total N 占观察量总数的百分比Medina 中位数Grouping Median 分组中位数Std.Error of Mean 均值标准误Minimum 最小值Maximum 最大值R

3、ange 范围First 首值Last 尾值Variance 方差 Skewness 偏度Std.Error of Skewness 偏度的标准误Kurtosis 峰度Std.Error of Kurtosis 峰度的标准误Harmonic Mean 调和均数Geometric Mean 几何均数30名少儿身高数据1、操作步骤:1)按AnalyzeReportsOLAP Cubes顺序单击打开OLAP Cubes对话框2)打开数据文件“少儿身高.sav”,将height变量选入Summary Variable框中,将sex变量作为分组变量选入Grouping Variable 框中;3)单击S

4、tatistics按钮,在 Statistics框中选择Sum、Mean、Median项作为要输出的统计量;4)单击Title按钮,在Title框中输入“少儿身高分层报告”,单击Continue返回;单击OK2、输出结果及分析表4-3 观测量摘要 表4-2说明观测量的一些基本情况,包括总个数、有效值个数和缺省值个数。表4-3是分层报告,输出了总和、均值和中位数。可在参数框中输入数值,该数值表示分析过程只对前几个观测值进行带有缺省值的观测值不被显示在列出观测值的同时,显示观测值的序号可选择一个或多个变量进入此框分组变量可是数值型或短字符型变量。图4-5 Summarize CASES 对话框见图

5、4-62 、观测值摘要分析过程输入脚注在输出结果中显示各分组统计量的标题在分析过程中剔除带有缺失值的观测量键入一个字符以便在输出结果中标记缺失值输入标题三、例题分析: 将表4-1资料(数据文件为“少儿身高.sav”)进行观测值摘要分析。Options 对话框表4-4 观测量处理摘要 表4-4说明观测量的总个数、有效值个数和缺省值个数以及各占的百分比。2、输出结果及分析分组统计量 表4-5分三部分,1、男生的基本统计量,2、女生的基本统计量3、男女生的基本统计量,每部分包括分年级进行的统计和总的统计,这就是交叉分组。一、主要功能 把观测量的统计结果用一种简单扼要的表格打印出来有助于更好的把握数据

6、特征。二、行形式摘要报告 1)按AnalyzeReportsReport Summaries in Rows顺序,打开Summaries in Rows 对话框。3、摘要报告分析过程将要分析的变量选入此框,每选一个变量进入框内,则需单击Format按钮,打开Format对话框,设置该变量输入格式。进入该框中的变量作为分组变量,可有多个。选中变量后激活Summary、Options、Layout、Titles。输出一个单独的观测量列表。只输出报告的第一页Summarize in Rows 对话框输入变量的列标题,不输入则将输出变量的标签或名称选择列标题对齐的方式选择变量值所处的位置以缩进的形式输

7、出,可输入缩进数值;变量值位于列中央键入列宽数值,如不设列宽,则:如输出数值标签,则列宽为数值标签中的最长者;如输出变量值,则列宽为变量所定义的宽度;如设置了列标题,则列宽为标题的最长者;如未设置列标题,则列宽为输出的变量标签的最长者;选择输出的内容:将输出变量值将输出变量标签Format 对话框输出列变量之和。输出列变量的均值。输出列变量中的最小值。输出列变量中的最大值。输出列变量中观测量的数目。输出列变量中高于Value框中设定值的观测量占总数的百分比输出列变量中低于Value框中设定值的观测量占总数的百分比输出列变量中位于Low和Hight框中设定值的观测量占总数的百分比输出标准差。输出

8、输出峰度。输出方差。输出偏度。Summary对话框所输数值表示报告的每一页输出从第几行开始所输数值表示报告的每一页输出在第几行结束规定每一页输出的左边间距规定每一页输出的右边间距选择报告输出内容的对齐方式设置页面的标题、脚注和页面的距离:设置标题与报告的距离设置注脚与报告的距离决定分组变量显示的位置:所有的分组变量值均位于第一列,激活Indent an each break参数框在此框中设置分类变量值缩进的位置。默认为2空格设置列标题的输出格式:在标题下添加下划线设置列标题下的空白行(默认为2)选择列标题的对齐方式设置分组变量的显示位置:显示在统计量的上一行显示于统计量的同一行,并覆盖统计量标

9、题设置分组变量与统计量之间的空白行数Report栏的Layout对话框按Next进入下一行的设置,按 Previous返回上一行对齐方式选择特殊变量的值作为标题与注脚在此对话框可规定标题与注脚的输出内容和格式,可设置最多10行Report栏的Titles 对话框 Summaries in Column对话框 将要分析的变量选入此框,每选一个变量进入框内,则需单击Format按钮,打开Format(见下图)对话框,设置该变量输入格式。1、Data Columns栏 1)Summary 对话框与行形式基本同,不同是只能选择一个统计量 2) Format 对话框与行形式同 3) Insert Tot

10、al按钮按Summary按钮,出现Summary对话框Insert Total按钮的Summary 对话框选择要计算和的变量将其移入右边变量框,至少挑选2个变量。在Summaries in Column 对话框中单击Insert Total按钮,新增Total变量, 1)Options对话框 2) Format对话框与“行形式”同 3) Sort Sequence拦:确定分组变量升降排序规则 4)Data are already sorted复选框,已将分组变量排序 Break Columns栏中的Options对话框显示每一类分组变量小计结果,在Label框中键入分组变量的标签在此栏中设置页

11、面:输入不超过20分组变量间的间距行数每个分组变量都在新的一页输出在新的一页输出下一个分组变量,并接着上一页顺序编写页码在此栏中设置小计前的空白行数3、Preview复选框:只输出报告的第一页,便于用户预览4、Report栏 Options如下图 Layout对话框与“行形式”同 Titles对话框与“行形式”同 Options对话框在每一页的底部显示该列的总和,在Label框中键入标签剔除带有缺失值的观测量输入一个代表系统和用户的缺失值的字符设置报告的起始页将表4-1资料(数据文件“少儿身高.sav”)进行分析:先做行形式报告输出,再做列形式报告输出。1、单个分组变量的行形式报告按Analy

12、zeReportsReport Summaries in Rows顺序,打开Summaries in Rows 对话框。挑height变量进入Data框,grade变量进入Break框。单击Break Columns栏的 Summary按钮,打开 Summary Lines for grade对话框,选中Sum of Values、Number of Cases复选框,再按Continue返回 Summaries in Rows对话框。选中Display cases复选框。单击Titles 按钮,打开Titles对话框,在标题栏的Center 框中输入标题“少儿身高分组统计”,再按返回。单击“

13、OK”完成, 输出结果见表46。三、例题分析观测量分组报告 少儿身高分组统计 年级 身高 四年级 121.40 134.10 135.80 135.50 133.40 140.30 120.90 141.40Mean 132.85N 8五年级 131.50 132.60 140.40 137.40 128.20 129.00 129.30 132.70 130.10 139.70 133.00 124.00 138.80 138.60MEAN 133.24N 14六年级 129.20 136.00 132.20 140.90 136.70 137.50 125.40 137.50Mean 13

14、4.42N 8列出了按年级分组后的观测量表打开Summaries in Rows 对话框,挑height变量进入Data框,sex、grade变量进入Break框。选中Break 栏中的sex变量,单击 Summary按钮,打开 Summary Lines for sex 对话框,选中Mean of Values、 Number of Cases、Minimum Value和 Maximum Value 复选框,再按Continue返回 。选中Break 栏中的grade 变量,单击 Summary按钮,选中Mean of Values、 Number of Cases复选框,再按Contin

15、ue返回 。单击“OK”完成, 输出结果见表。2、两个分组变量的行形式报告 少儿身高分组统计性别 年级 身高 男 四年级 Mean 131.70 N 4 五年级 Mean 132.63 N 7 六年级 Mean 134.57 N 4Mean 132.90Minimum 121.40Maximum 140.90N 15女 四年级 Mean 134.00 N 4 五年级 Mean 133.84 N 7 六年级 Mean 134.27 N 4Mean 134.00Minimum 129.90 Maximum 141.40N 15Grand Total Std.Dev 5.70Ketosis .29S

16、kewness .63表分为3部分:1.男生统计量表:各年级的均值和个数,全体男生的均值、个数、最大值和最小值;2.女生统计量表:各年级的均值和个数,全体女生的均值、个数、最大值和最小值;3.全体的统计量:标准差、偏度和峰度。 多分组统计量(行形式)3、两个分组变量的列形式报告打开Summaries in Columns 对话框,挑height变量进入Data框,单击 Summary按钮,选中Mean of Values,再按Continue返。 先后挑选sex、grade变量进入Break框。单击Report 栏中的Options对话框,选中Display grand total复选框,再按

17、Continue返回 。单击Titles 按钮,打开Titles对话框,在标题栏的Center 框中输入标题“少儿身高分组统计”,再按Continue返回。单击“OK”完成, 输出结果见下表。 少儿身高分组统计Page 身高性别 年级 Mean_ _ _男 4 133.4 5 131.3 6 134.6女 5 134.0Grand Total 133.5表分为3部分:1.男生的均值表,按各年级算出均值;2.女生的均值表,按各年级算出均值;3.全体的均值。多分组均值表(列形式)(二)描述性统计分析(Descriptive Statistics)1、 Frequencies 频数分析表2、 Des

18、criptive 描述性统计分析过程3、 Explore 探索分析过程4、 Crosstabs 列联表分析过程1、频数分析表一、主要功能 可对数据按组进行归类整理,形成变量不同水平的频数分布表和图形,对数据的分布趋势进行初步分析。二、频数分析1)按AnalyzeDescriptive StatisticFrequencies顺序,打开Frequencies对话框如图。选择一个或多个变量右移入Variable(s)框。按Statistics按钮,打开Statistics对话框显示频数分布表按Chart按钮,打开Chart 对话框按Format按钮,打开Format 对话框 Frequences主

19、对话框 输出百分位数:输出四分位数,显示25%、50%、75%的百分位数;将数据平均分为所设定的相等等份,可输入2100 的整数,如键入4则输出第25、50、75百分位数自定义百分位数,可输入0100 的整数。输入值后: 按Add:输入值后按此键,可反复操作键入多个百分位数; 按Remove:删除已键入的数值 按Change:重新输入新数离差栏分布参数栏在计算百分位数值和中位数时,假设数据已分组,且用各组的组中值代替各组数据中心趋势栏输出统计量对话框Chart 对话框不输出任何图形,为默认 输出条形图,各条高度代表变量各分类的频数输出圆图,圆图中各块的数值表示各分类变量的频数输出直方图,此图仅

20、适用于区间型数值变量。选择此项后,还可选择With normal curve,画出的直方图带有正态曲线只有选择了条形图和圆图项才有效,决定纵轴表示的统计量纵轴表示频数图纵轴表示百分比Format 对话框控制频数表输出的分类数量。默认为10多变量框中可设定多变量表格输出的格式设置频数表输出的格式选择频数表中排列顺序按变量升序排列,此为默认按变量降序排列按变量各种取值发生的频数的升序排列按变量各种取值发生的频数的降序排列表49 100名大学生血清蛋白含量(%)三、例题分析对某高校100名大学生血清蛋白含量(g%)做频数分析,数据如表49 1、具体步骤按AnalyzeDescriptive Stat

21、isticFrequencies 顺序,打开Frequencies对话框。打开数据文件“大学生血清.sav”,挑xdh变量进入Variable框,grade变量进入Break框。选中Display frequency tables复选框,要求输出频数分布表。单击Statistics按钮,选择要输出的统计量。单击Chart 按钮,选择Histogram项,输出直方图,并选择With normal curve复选框,输出正态曲线。单击Format 按钮,选Ascending项。单击“OK”完成。2、 输出结果及分析结果如下表、图 血清蛋白含量的直方图 血清蛋白含量的统计表血清蛋白含量的频数分布表一

22、、主要功能:调用此过程对变量进行描述性统计分析,计算均值、标准差、全距和均值标准误差等,并可将原始数据转换成Z分数。二、描述统计量分析按Analyze Descriptive Statistics Descriptives顺序单击,打开 Descriptives主对话框。如图选一个或多个变量移入如选中此框,将对Variables框中选择的变量进行标准化产生相应的Z分值,并作为新变量保存到数据窗口,其变量名在原变量名前加z。Descriptive 对话框 2、描述性统计分析过程Options 对话框 基本统计量当Variables框中有多个变量时,此框确定其输出顺序:按Variables框中的排

23、列顺序输出按各变量的字母顺序输出按均值的升序排列按均值的降序排列分布三、例题分析 已知20个初生婴儿的体重数据如下表,对其进行描述统计。2770291527952995286029703087312631254654227235034218341839212669370723102573388120个初生婴儿的体重(g)1、操作步骤:打开数据文件“婴儿体重.sav”。打开 Descriptives主对话框,选定变量t进入Variable栏中。选中Save standardized values as variables 复选框,要求计算变量的z值,并保存结果到当前数据集中。单击Options

24、按钮,选中Mean、Std.Deviation、Minimum、Maximum 、Variance 项。2、输出结果及分析婴儿体重的描述统计量这时打开原数据集,可看到多了一列zt,这是t 的z 分数,如下图所示:保存了z 分数的数据集一、主要功能: 调用此过程可检查数据是否有错误、考察样本分布特征及对样本分布规律作初步考察。剔除奇异值和错误数据。探索分析过程将提供在分组和不分组的情况下常用的统计量与图形。二、探索分析 按Analyze-Descriptive Statistics-Explore 顺序单击,打开 Explore 主对话框。如图3、 探索分析过程选择一个或多个变量进入Depend

25、ent框作为因变量,单击OK可获得因变量的一系列基本统计量和图形。此作为分组变量,可以是字符变量,对因变量的分析将按该变量的观测值进行分组分析。可有多个分组变量,这时会按多个变量的交叉组合进行分组。该框中的变量作为标识符,在输出诸如异常值时,用该变量进行标识,只允许有一个标识符。可同时输出基本统计量和图形只输出基本统计量只输出图形Explore 主对话框输出基本统计量 均值的置信区间,可键入199%的任意值,根据该值算出置信区间的上下限。给出中心趋势的最大拟然比的稳健估计量,当数据分布均匀,且两尾较长,或当数据中存在极端值时,可给出比均值或中位数更合理的估计。输出最大和最小的5个数,且在输出窗

26、口中加以标明。输出5%、10%、25%、50%、75%、90%和95%的百分位数。Statistics对话框只有指定分组变量才有效,可输出分布水平图,同时输出回归直线斜率以及对方差的Levenes检验不输出分布水平图对每组数据产生一个中位数与四分位范围的自然对数散点图,同时在满足每组中数据方差相等的条件下对数据进行幂变换的估计。根据在Power参数框中指定的变换对原始数据进行变换。不对数据进行转换 Explore 栏中Plots对话框在此对话框中可选择要输出的统计图形及其参数。只有在主对话框中指定了一个以上变量时,Boxplot栏才有效。在该栏选择盒形图的输出方式:每一个因变量生成一个盒形图所

27、有因变量生成一个盒形图不显示任何盒形图生成茎叶图,为默认生成直方图输出正态概率和离散正态概率图,同时输出K-S统计量中的Liliefors显著水平检验,如果观测数不超过20,将用W-S统计量代替K-S。确定缺失值的处置:因变量或分组变量中带有缺失值的观测量都将在分析过程中被剔除。在分析过程中根据分组变量产生的组中带缺失值的观测量都将被剔除。分组变量的缺失值被单独分为一组,输出频数时将标出缺失组。Explore 栏中Options对话框三、例:下表为30名10岁少儿的身高(cm)数据,对其进行探索分析编号身高编号身高编号身高男女男女男女1131.5132.76135.5137.511132.21

28、24.02137.4133.07121.4141.412129.0140.33128.2139.78129.2138.813132.6130.14136.0125.49135.4120.914140.9133.45140.4138.610135.8137.515129.3136.71、操作步骤:打开 Explore主对话框,打开数据文件“Explore分析.sav”选变量height进入Dependent List栏中,选sex变量进入Factor List栏中;在Display栏中选择 Both项;打开Statistics对话框,选中Descriptives 、M-estimation、 O

29、utliers复选项,单击Continue返回;要求计算变量的z值,并保存结果到当前数据集中。打开Plot对话框,选择Boxplots栏中的Factor levels together项,选择Descriptives栏内的 Stem-and-leaf复选项,选择Spread vs level with levene Test栏中的 Power estimation项,单击 Continue 返回。单击OK2、输出结果及分析 输出结果如下表观测量摘要表M估计量表少儿身高的分组描述统计量少儿身高的极端值方差一致性检验HIGHT Stem-and-Leaf Plot forSEX= 1 Freque

30、ncy Stem & Leaf 1.00 12 . 1 4.00 12 . 8999 3.00 13 . 122 5.00 13 . 55567 2.00 14 . 00 Stem width: 10.00 Each leaf: 1 case(s)少儿身高的茎叶图少儿身高的盒形图 结果分析表4-13摘要性地说明了数据的基本情况,包括总数、有效值数目和缺失值数。 表4-14是按性别分组后的统计量表,上半部分是男生,下半部分是女生的。 表4-15下面的a、b、c、d分别表示四种加权常数,此表的结果是使用四种不同的方法计算出的M估计量的结果。 表4-16显示分组后少儿身高的极端值分布,最大值和最小值

31、各取5个。 表4-17是方差的一致性检验,零假设是分组后的方差为相等的。表中四行是依据不同的统计量得到的检验,分别是基于均值、基于中位数与调整后的自由度和基于调整后的均值。由于其显著值均大于0.05,不能否定零假设,即可以认为男生和女生的身高的方差是无差异的。茎叶图从左到右分为三部分:频数、茎和叶、茎是整数部分,叶是小数部分,Stem width表示茎宽。每行的茎和叶组成的数字再乘以茎宽,即得到实际数据的近似值,实际数据中与该近似值靠近的值的个数即为频数表示的个数。盒形图各部分的含义:方箱是盒形图的主体,上下边为四分位数,中心粗线为中位数,变量的50%的观测值落在这一区域中。方箱上下两条纵向直

32、线是触须线,触须线外的两端线为本体的最大值和最小值。本体指除奇异值外的变量值。奇异值用“0”表出,本例中无奇异值。 4、列联表分析过程主要功能: 调用列联表分析过程可进行计数资料和某些等级资料的列联表分析,一个行变量和一个列变量可组成一个二维列联表,如再加一个控制变量则可组成一个三维列联表。而多个行、列、控制变量就可组成一个复杂的多维列联表。在分析中可对二维和多维列联表资料进行统计描述和x2检验,并计算相应的百分数指标。此外,还可计算四格表确切概率(Fishers Exact Test),且有单双侧(One-Tail、Two-Tail)、对数拟然比检验( Likelihood Ratio)以及

33、线性关系的Mantel-Haenszel x2检验。4、列联表分析过程列联表分析程序 按Analyze-Descriptive Statistics-Crosstabs 顺序打开 Crosstabs 主对话框。如图该框中的变量作为分布表中的行变量,必须是数值型或字符型等分类变量。该框中的变量作为控制变量,决定频数分布表中的层,可有多个控制变量,如要增加新的控制变量,按Next 键,要修改以前的变量按Previous 键显示每一组中各变量的分类条形图。只输出统计量,不输出多维列联表。Crosstabs 对话框进行行和列变量相互独立的假设检验,有多种检验法。(注)进行相关系数的检验,有两项结果显示:Pearson相关系数和 Spearman相关系数适用于定类变量的统计量:基于卡方检验基础上对相关性的检验用来描述相关性当用自变量预测因变量时,此系数反映这种预测降低错误的比率。显示不确定系数,表示用一个变量来预测其他变量时降低错误的比率适用于定序变量:Gamma系数反映两个有序变量间的对称相关性。是Gamma检验的非对称推广。对有序变量和秩变量相关性的非参数检验。与Kendalls tau-c相似适用于定序变量:用于检验相关性用于检验两个评估人对同一对象的评估是否具有一致系。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论