版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章SPSS各统计分析模块介绍陈道平重庆师范大学数学与计算机学院1ChongQingNormalUniversity第二章SPSS各统计分析模块介绍陈道平1ChongQing描述性统计分析--DescriptiveStatistics菜单均数间的比较--CompareMeans菜单一般线性模型――GeneralLinearModel菜单相关分析――Correlate菜单SPSS的主要分析工具——Analyze菜单2ChongQingNormalUniversity描述性统计分析--DescriptiveStatistic线性回归与曲线拟合――Regression菜单对数线性模型——Loglinear菜单聚类分析与判别分析——Classify菜单因子分析与对应分析——DataReduction菜单信度分析与多维尺度分析——Scale菜单非参数检验――NonparametricTests菜单Survival菜单看图3ChongQingNormalUniversity线性回归与曲线拟合――Regression菜单3Chong1、描述性统计分析--DescriptiveStatistics菜单描述性统计分析是统计分析的第一步,做好这第一步是下面进行正确统计推断的先决条件。SPSS的许多模块均可完成描述性分析,但专门为该目的而设计的几个模块则集中在DescriptiveStatistics菜单中,最常用的是列在最前面的四个过程:4ChongQingNormalUniversity1、描述性统计分析--DescriptiveStatist1.1Frequencies过程的特色是产生频数表;
1.2Descriptives过程进行一般性的统计描述;
1.3Explore过程用于对数据概况不清时的探索性分析;
1.4Crosstabs过程则完成计数资料和等级资料的统计描述和一般的统计检验。看图5ChongQingNormalUniversity1.1Frequencies过程的特色是产生频数表;
1.2、均数间的比较--CompareMeans菜单该菜单集中了几个用于计量资料均数间比较的过程。具体有:2.1Means过程对准备比较的各组计算描述指标,进行预分析,也可直接比较。2.2One-SamplesTTest过程进行样本均数与已知总体均数的比较。
6ChongQingNormalUniversity2、均数间的比较--CompareMeans菜单2.3Independent-SamplesTTest过程
进行两样本均数差别的比较,即通常所说的两组资料的t检验。
2.4Paired-SamplesTTest过程
进行配对资料的显著性检验,即配对t检验。
2.5One-WayANOVA过程
进行两组及多组样本均数的比较,即成组设计的方差分析,还可进行随后的两两比较。看图7ChongQingNormalUniversity2.3Independent-SamplesTTest3、一般线性模型――GeneralLinearModel菜单
一般线性模型可不是用一章就可以说清楚的,因为它包括的内容实在太多了。那么,究竟我们用到的哪些分析会包含在其中呢?简而言之:凡是和方差分析粘边的都可以用他来做。比如成组设计的方差分析(即单因素方差分析)、配伍设计的方差分析(即两因素方差分析)、交叉设计的方差分析、析因设计的方差分析、重复测量的方差分析、协方差分析等等。因此,能真正掌握GLM菜单的用法,会使大家的统计分析能力有极大地提高。实际上一般线性模型包括的统计模型还不止这些,我这里举出来的只是从用SPSS作统计分析的角度而言的一些。8ChongQingNormalUniversity3、一般线性模型――GeneralLinearModel好了,既然一般线性模型的能力如此强大,那么下属的四个子菜单各自的功能是什么呢?请看:3.1Univariate子菜单:四个菜单中的大哥大,绝大部分的方法分析都在这里面进行。3.2Multivariate子菜单:当结果变量(因变量)不止一个时,可用他来分析。
9ChongQingNormalUniversity好了,既然一般线性模型的能力如此强大,那么下属的四3.3RepetedMeasures子菜单:顾名思义,重复测量的数据就要用他来分析;用前两个菜单似乎都可以分析出来结果,但在许多情况下该结果是不正确的,应该用重复测量的分析方法才对。
3.4VarianceComponents子菜单:用于作方差成份模型的(这个模型实在太深,不是一时半会能说清的,所以在这里就干脆不讲了)。
看图10ChongQingNormalUniversity3.3RepetedMeasures子菜单:顾名思义,4、相关分析――Correlate菜单在数据分析中经常要遇到分析两个或多个变量间关系的情况,有时是希望了解某个变量对另一个变量的影响强度,有时则是要了解变量间联系的密切程度,前者用下一章将要讲述的回归分析来实现,后者则需要用到本章所要讲述的相关分析实现。SPSS的相关分析功能被集中在Analyze菜单的Correlate子菜单中,他一般包括以下三个过程:
11ChongQingNormalUniversity4、相关分析――Correlate菜单在数据分析中4.1Bivariate过程:此过程用于进行两个/多个变量间的参数/非参数相关分析,如果是多个变量,则给出两两相关的分析结果。这是Correlate子菜单中最为常用的一个过程,实际上我们对他的使用可能占到相关分析的95%以上。4.2Partial过程:如果需要进行相关分析的两个变量其取值均受到其他变量的影响,就可以利用偏相关分析对其他变量进行控制,输出控制其他变量影响后的相关系数。Partial过程就是专门进行偏相关分析的。4.3Distances过程:调用此过程可对同一变量内部各观察单位间的数值或各个不同变量间进行距离相关分析,前者可用于检测观测值的接近程度,后者则常用于考察预测值对实际值的拟合优度。该过程在实际应用中用的非常少。看图12ChongQingNormalUniversity4.1Bivariate过程:此过程用于进行两个/多个变量5、线性回归与曲线拟合――Regression菜单下面三个过程是Regression菜单的子菜单,是SPSS提供的用于回归分析的工具:5.1Linear过程——调用此过程可完成二元或多元的线性回归分析。在多元线性回归分析中,用户还可根据需要,选用不同筛选自变量的方法(如:逐步法、向前法、向后法,等)。5.2CurveEstimation过程——CurveEstimation过程可以用与拟合各种各样的曲线,原则上只要两个变量间存在某种可以被它所描述的数量关系,就可以用该过程来分析。但这里我们要指出,由于曲线拟合非常的复杂,而该模块的功能十分有限,因此最好采用将曲线相关关系通过变量变换的方式转化为直线回归的形式来分析,或者采用其他专用的模块分析。13ChongQingNormalUniversity5、线性回归与曲线拟合――Regression菜单下5.3BinaryLogistic过程——所谓Logistic模型,或者说Logistic回归模型,就是人们想为两分类的应变量作一个回归方程出来,可概率的取值在0~1之间,回归方程的应变量取值可是在实数集中,直接做会出现0~1范围之外的不可能结果,因此就有人耍小聪明,将概率做了一个Logit变换,这样取值区间就变成了整个实数集,作出来的结果就不会有问题了,从而该方法就被叫做了Logistic回归。随着模型的发展,Logistic家族也变得人丁兴旺起来,除了最早的两分类Logistic外,还有配对Logistic模型,多分类Logistic模型、随机效应的Logistic模型等。看图14ChongQingNormalUniversity5.3BinaryLogistic过程——所谓Logis6、对数线性模型——Loglinear菜单对数线性模型是一种纯粹应用于分类变量分析的多元统计方法。它是一种比较新型的分析方法,在分析高维列联表时优势尤为突出。由以下三个过程组成:6.1General过程——用于进行一般对数线性模型分析,主要用于证实性研究。此时研究人员只对某些特定效应感兴趣,即已经有关于模型的假设,此时就可以采用一般模型来检验这一假设是否正确、充分,它可以对总模型和各个参数给出详细的检验结果。对变量不分因变量自变量,在分析中一视同仁,最后在结果解释时才由研究人员来做出判断。15ChongQingNormalUniversity6、对数线性模型——Loglinear菜单对数线性模型6.2Logit过程——当研究人员已经有了一些线索,知道因变量自变量时,如果应变量为两分类,就可以用这个过程来分析。
6.3ModelSelection过程——分层对数线性模型。一般线性对数模型可以对每个系数及总模型给出非常丰富和详细的信息,但是它要求研究人员心中已经有了一定的思路或线索,或只对某些特定效应项感兴趣,即已经有关于简约模型的假设。如果在探索性分析中研究人员中只是设想若干分类变量之间可能有关系,但是并无明确假设,也没有具体分出哪个是应变量、哪个是自变量,此时比较适宜采用分层对数线性模型分析。16ChongQingNormalUniversity6.2Logit过程——当研究人员已经有了一些线索,知道因7、聚类分析与判别分析——Classify菜单聚类分析和判别分析都是将记录或变量分类的方法,所不同的是聚类分析是把没有分类信息的资料按相似程度归类,有一定探索性的味道;而判别分析则是从已知的分类情况中总规律,为以后判断新观测所属类别提供依据。Classify菜单提供如下三个过程:7.1K-meansCluster过程——对记录进行快速聚类,当明确所需要分出的类别数时,采用快速聚类可以节省运算时间。根据经验,如果样本量大于100,则有必要考虑是否使用快速聚类。17ChongQingNormalUniversity7、聚类分析与判别分析——Classify菜单聚类7.2HierarchicalCluster过程——习惯上翻译成系统聚类法,该过程提供了全面而强大的聚类分析能力,可对记录或变量进行聚类。更为重要的是,参与系统聚类分析的变量不再像快速聚类一样限于连续性变量,它们可以是两分类或多分类变量。7.3Discriminant过程——提供了全面的类别分析功能,所用变量可一次进入,也可以使用逐步法筛选出最优类别方程。看图18ChongQingNormalUniversity7.2HierarchicalCluster过程——习惯8、因子分析与对应分析——DataReduction菜单该方法主要目的都是浓缩数据,或称数据化简,即以最少的信息丢失为代价将众多的观测变量浓缩为少数几个因素,从而简化问题,或发现事物的内在联系。8.1Factor过程——提供因子分析/主成分分析方法,它们是最为常用的数据简化方法,用于考察多个定量变量间的内在结构,或者提取数据的主要信息。19ChongQingNormalUniversity8、因子分析与对应分析——DataReduction菜8.2CorrespondenceAnalysis过程——进行简单对应分析,该方法同样以数据简化的原则力图直观的给出各两个分类变量各个类别之间的联系,当各个变量的类别越多时,该方法的优势就越明显。8.3OptimalScaling过程——进行最优尺度分析,该方法的核心目的也是力图在低维度空间表述两个或多个变量之间的内在联系。所分析的变量以分类变量为主,但也可以为连续性变量。该方法实际上包括,但不仅仅限于对应分析方法。看图20ChongQingNormalUniversity8.2CorrespondenceAnalysis过程—9、信度分析与多维尺度分析——Scale菜单
在Scale菜单提供的几种统计方法都属于尺度分析的范畴,它们是探索研究事物间的相似性/不相似性的专用技术。具体来说,这些方法和用途是:9.1ReliabilityAnalysis过程:用于评价问卷这种测量工具的稳定性或可靠性,具体来说就是用问卷对同一事物进行重复测量时,所得结果的一致性程度。可以进行内在信度分析,即评价问卷中各个问题是否测量的是同一个概念。21ChongQingNormalUniversity9、信度分析与多维尺度分析——Scale菜单在Sc10、非参数检验――NonparametricTests菜单作为二十一世纪统计理论的三大发展方向之一,非参数统计是统计分析的重要组成部分。可是与之很不相称的是他针对一般性统计分析的理论发展远远不及参数检验完善,因而比较完善的可供使用的方法也不多。比如多组均数间的两两比较,虽然已有好几种方法可资利用,但由于在理论上仍存在争议,几种权威的统计软件(如SAS和SPSS)均没有提供这方面的方法。虽然这些洋统计软件没有提供两两比较的非参数方法,但国产的统计软件大都是提供了的(国情不同嘛),因此建议大家:如果真的要做这方面的非参数分析,不如直接用PEMS、SPLMWIN、NOSA等国产软件,免得用SPSS等只能做一半。在SPSS中,几乎所有的非参数分析方法都被放入了NonparametricTests菜单中,具体来讲有以下几种:22ChongQingNormalUniversity10、非参数检验――NonparametricTests菜Chi-squaretest:用卡方检验来检验变量的几个取值所占百分比是否和我们期望的比例没有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%,我随便写的)。请注意该检验和我们一般所用的卡方不太一样,我们一般的卡方要用crosstable菜单来完成,而不是这里。
23ChongQingNormalUniversityChi-squaretest:用卡方检验来检验变量的几个取BinomialTest:用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以使连续性变量,然后按你给出的分界点一刀两断。RunsTest:用于检验某变量的取值是否是围绕着某个数值随机地上下波动,该数值可以是均数、中位数、众数或人为制定。一般来说,如果该检验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变量存在自相关。24ChongQingNormalUniversityBinomialTest:用于检测所给的变量是否符合二项分One-SampleKolmogorov-SmirnovTest:采用柯尔莫诺夫-斯米尔诺夫检验来分析变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、Poission分布和指数分布。Two-Independent-SamplesTests:即成组设计的两样本均数比较的非参数检验。
25ChongQingNormalUniversityOne-SampleKolmogorov-SmirnovTestsforSeveralIndependentSamples:成组设计的多个样本均数比较的非参数检验,此处不提供两两比较方法。Two-Related-SamplesTests:配对设计两样本均数的非参数检验。TestsforSeveralRelatedSamples:配伍设计多个样本均数的非参数检验,此处同样不提供两两比较。看图26ChongQingNormalUniversityTestsforSeveralIndependent11、生存分析——Survival菜单生存分析的主要研究内容:1、描述生存过程:研究人群生存状态的规律,如生存时间的分布的特点,计算某个时间点的生存率、生存率曲线的变动趋势等。这是人寿保险研究中的一项重要内容。2、生存过程的影响因素分析:比较不同亚人群的生存状况,进行两组或多组生存率的比较,以了解哪些因素会影响目标人群的生存过程,这是生存分析方法最重要的研究内容,在临床医学中应用得非常广泛。SPSS提供了四个过程:27ChongQingNormalUniversity11、生存分析——Survival菜单生存分析的主要研11.1Lifetables过程:用于分析分组生存资料,求出不同组段时的生存率。或者当样本量较大时(如n>50),可以把资料按不同时间段分成几组,观察不同时间点的生存率。11.2Kaplan-Meier过程:用于样本含量较小时,不能给出特定时间点的生存率。这样就不用担心每个时间段内只有很少的几个观测,甚至没有观测的尴尬局面。28ChongQingNormalUniversity11.1Lifetables过程:用于分析分组生存资料,11.3CoxRegression过程:用于拟合Cox比例风险模型,这是生存分析中最重要的一个分析方
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 房产项目转让我合同样本
- 店面转让合同示范
- 面对挫折课程设计
- 2024购房合同协议书样式参考
- 户外广告牌安装合同范文
- 托幼机构卫生评价报告
- 二婚自愿离婚协议书样本
- 工程机械转租合同
- 2024年版知识产权合作协议书范本
- 弱电系统工程合同格式
- 四级劳动关系协调员题库+答案
- 建筑架子工(普通脚手架)模考试题及答案
- 2024~2025学年七年级上册数学第五章 一元一次方程章节测试(含简单答案)
- 2024年银行外汇业务知识理论考试题库及答案(含各题型)
- 2022年高考数学试卷(上海)(春考)(解析卷)
- 古代小说戏曲专题-形考任务4-国开-参考资料
- 药品不良反应与药物警戒智慧树知到答案2024年山东药品食品职业学院
- 2024年全国职业院校技能大赛高职组(建筑装饰数字化施工赛项)备赛试题库(含答案)
- 2-1、职业生涯规划概述
- 高级厨师基础知识题库100道及答案
- 2024年历年考研英语真题与答案
评论
0/150
提交评论