基本统计工具_第1页
基本统计工具_第2页
基本统计工具_第3页
基本统计工具_第4页
基本统计工具_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第7章基本统计分析本章内容SPSS统计分析功能概述SPSS数值分析过程基本统计分析概述7.1一维频数分布表Frequencies7.2描述统计分析过程Descriptives7.3探索分析Explore7.4多维频数分布表(交叉表,列联表)7.5OLAP报告摘要表OLAPCubes补充:Reports的其他分析过程练习题SPSS统计分析功能概述有了数据,可以利用SPSS的各种分析方法进行分析,但选择何种统计分析方法,即调用哪个统计分析过程,是得到正确分析结果的关键。SPSS有数字分析和作图分析两类方法SPSS数值分析过程SPSS数值统计分析过程均在Analyze菜单中,包括:a、基本统计分析:Reports,DescriptiveStatisticsb、均值比较与检验:CompareMeansd、方差分析:ANOVAModelsb、相关分析:Correlatee、回归分析:Regressionf、聚类与判别:Classifyg、因子分析:DataReductionh、非参数检验:NonparametricTests

等等基本统计分析概述基本统计分析是进行其他更深入的统计分析的前提,通过基本统计分析,用户可以对分析数据的总体特征有比较准确的把握,从而选择更为深入的分析方法对分析对象进行研究。在SPSS的Analyze菜单中包括了一系列统计分析过程。其中Reports和DescriptiveStatistics命令项中包括的功能是对单变量的描述统计分析。DescriptiveStatistics包括的统计功能有:Frequencies:频数分析Descriptives:描述统计量分析Explore:探索分析Crosstabs:多维频数分布交叉表(列联表)Reports包括的统计功能有:OLAPCubes:OLAP报告摘要表CaseSummaries:观测量列表ReportSummariesinRow:行形式输出报告ReportSummariesinColumns:列形式输出报告7.1一维频数分布表Frequencies1、了解变量的取值分布情况对整体把握数据的特征是非常有利的。2、求分类(定类、定序)变量的频数和作Bar图3、求定距变量(连续变量)的分布情况和作直方图Histogram比Descriptives多百分位,在Statistics选项(见Excel第三章数据描述与分析)和Format选项)4、对连续变量进行分组(recode)后再求频数,如老中青(35,60)的比例,文化程度(中学、大学及以上)的人数及比例等5、Analyze+DescriptiveStatistics+Frequencies6、例子p105-106:对1991年美国社会调查情况数据(data07-01)进行统计处理。分析不同年龄(age变量)和最高受教育年限(educ变量)各水平的频数分布情况。7.2描述统计分析过程Descriptives1、功能:了解数据的基本统计特征和对指定的变量值进行标准化处理(标准化后的新变量的均值为0,标准差为1,目的是为了消除各变量间变量值在数量级上的差异,从而增强数据间的可比性)。2、描述统计分析过程通过平均值(Mean)、算术和(Sum)、标准差(StdDev)、最大值(Maximum)、最小值(Minimum)、方差(Variance)、范围(Range)、平均数标准误(S.E.Mean)等统计量对变量进行描述。3、一般是求定距变量的描述统计量,从中分析差异性(max,min)4、Analyze+DescriptiveStatistics+Descriptives5、例子:1985年美国联邦调查局对50个州各种犯罪情况调查的数据(data07-02)进行描述统计分析50个州总的情况不同地区region的情况(2种方法:SplitFile+Descriptives,第8章的Means)7.3探索分析Explore1.考察数据的奇异性和分布特征奇异性:数据的过大或过小(找出、分析原因、是否剔除)分布特征:数据是否来自正态分布总体考察方法:统计量和统计图形(箱图、茎叶图(频数、茎和叶)、方差齐次性检验Spreadvslevel图)2.一般是考察定距变量3.Analyze+DescriptiveStatistics+Explore因(分析)变量(DependentList):定距变量分组变量(FactorList):分类变量标识变量(LabelCasesby):为方便查找输出观测量如id4.例子p112:考察银行数据(data07-03)中的不同性别的工资情况7.4多维频数分布表(交叉表,列联表)二维或多维交叉频数表(列联表),分析事物(变量)之间的相互影响和关系Analyze+DescriptiveStatistics+Crosstabs行变量(Row):需分类变量列变量(Column):需分类变量分层变量(Layer):条件(若有,需分类变量)Statistics选项:Chi-square复选项及其四种检验结果Correlations复选项:相关系数例子:银行数据(data07-03)中:如求男女的民族分布情况,可得到白种人多,男性多的结论(注意cell选项,一般选频数和百分比),如求每一工种的男女分布情况(人数)P118:1991年美国社会调查情况数据(data07-01):男女对生活的认识。7.5OLAP报告摘要表OLAPCubesOLAP(OnlineAnalyticalProcessing)在线分析处理过程以分组变量为基础,计算各组的总计、均值和其他统计量。而输出的报告摘要则是指每个组中所包含的各种变量的统计信息。Analyze+Reports+OLAPCubesSummaryVariables:要进行统计汇总的数值型变量GroupingVariables:分组变量(分类变量),注意:此分组变量在实际的运算过程中并不发挥分组的功能,而是确定进入统计的观测量的范围。如选择数学成绩作为摘要分析变量,而性别作为分组变量,要计算数学平均成绩,则结果中显示的并不是男生的数学平均成绩和女生的数学平均成绩,而是所有男女生观测量的数学成绩的总平均值。即所有性别有值(非MissingValue)的Case,才参与分析计算Statistics选项:Sum和、NumberofCases观测量数目、Mean均值、Median中位数、Maximum最大…等等例子p122:1991年美国社会调查情况数据(data07-01):对不同种族race的孩子childs和教育educ情况进行报告摘要分析。补充:Reports的其他分析过程Reports的其他分析过程有:CaseSummaries:观测值摘要分析ReportSummariesinRow:行形式输出报告ReportSummariesinColumns:列形式输出报告CaseSummaries:观测量列表察看或打印所需要的变量值Analyze+Reports+CaseSummariesVariables:要显示的变量名GroupingVariables:分组变量(分类变量)结果显示:多行或单行行形式输出报告Summary按行,如:sum、mean、max、min、count、stddev、variance、percentage(above,below,inside)等菜单:Analyze+Reports+ReportSummariesinRowsDataColumn:报告变量BreakColumn:分组变量及其Summary(多个交叉)Report:可对全部数据进行描述统计(GrandTotal)DisplayCases:是否显示每一个观测量列形式输出报告Summary按列,如:sum、mean、max、min、count、stddev、variance、percentage(above,below,inside)等菜单:Analyze+Reports+ReportSummariesinColumnsDataColumn:报告变量一一对应的Summary

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论