SPSS使用方法培训讲座课件_第1页
SPSS使用方法培训讲座课件_第2页
SPSS使用方法培训讲座课件_第3页
SPSS使用方法培训讲座课件_第4页
SPSS使用方法培训讲座课件_第5页
已阅读5页,还剩99页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本资料来源本资料来源1讲座:SPSS使用方法吴志强信息管理学院wuzhiqiang518@讲座:SPSS使用方法吴志强2关于SPSSSPSS原意为StatisticalPackagefortheSocialSciences,即“社会科学统计软件包”。随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司于2000年将英文全称更改为StatisticalProductandServiceSolutions,意为“统计产品与服务解决方案”。关于SPSSSPSS原意为StatisticalPacka3社会科学研究中的统计数据的描述性统计频次分布集中趋势:平均数、众数、中位数等;离散趋势:方差和标准差、极差等;数据分析数据预测社会科学研究中的统计数据的描述性统计4一、SPSS常用菜单的功能Data菜单:对数据进行排序、转置以及观测记录的选择;Transform菜单:数据转换功能,常用的有Compute、Recode以及Count。Analyze菜单:各种统计分析。Graphs菜单:制图工具。一、SPSS常用菜单的功能Data菜单:对数据进行排序、转置5二、SPSS的数据管理常用的功能有:数据转换;数据聚合。二、SPSS的数据管理常用的功能有:61.数据转换-Compute对数据进行规律性的整理和计算。步骤:Transform->ComputeIf条件的设置新变量设定示例说明1.数据转换-Compute对数据进行规律性的整理和计算。72.数据转换-Recode对数据按分段模式转换,如:把数据中的年龄转换为年龄段。步骤:Transform->Recode选择需要转换的变量,并设置转换后的变量;设置旧变量转换为新变量的条件;运行OK即可。示例2.数据转换-Recode对数据按分段模式转换,如:把数据中83.数据聚合-Aggregate把数据按照某一变量进行分类汇总。步骤:Data->aggregate选定分类变量到BreakVariables框选定聚合变量到AggregateVariables框Function设置聚合函数选择创建新文件运行OK即可示例3.数据聚合-Aggregate把数据按照某一变量进行分类汇9示例:Recode和Aggregate的组合使用示例:Recode和Aggregate的组合使用10三、数据的描述统计包括:频数分析均值标准差三、数据的描述统计包括:11数据的集中趋势统计量频数:各个组内含个体的个数平均数(均值):众数:频数出现最多的变量值中位数:第50个百分位数点上的值数据的集中趋势统计量频数:各个组内含个体的个数121.频数SPSS操作:打开数据文件,执行Analyze->DescriptiveStatistics->Frequencies.选择分析变量Statistics按钮设置频数Charts设置直方图以及正态曲线OK即可。1.频数SPSS操作:132.平均数与标准差SPSS操作:打开数据文件,执行Analyze->DescriptiveStatistics->Descriptive.选择分析变量Option按钮设置统计量OK即可。2.平均数与标准差SPSS操作:14数据的离散趋势统计量方差和标准差极差:最大值与最小值之间的距离四分位数差:第25、50、75个百分位数点之间的距离数据的离散趋势统计量方差和标准差153.分组求均值对数据分组描述,可以输出分组数据的均值、标准差、极值等,即对数据进行多层分类汇总。SPSS操作Analyze->CompareMeans->Means.示例:求不同性别的人在各工资段上的平均值。3.分组求均值对数据分组描述,可以输出分组数据的均值、标准差164.数据探测(Explore)计算描述统计量,通过各类统计图等描述数据的分布类型。SPSS:Analyze->DescriptiveStatistics->Explore。4.数据探测(Explore)计算描述统计量,通过各类统计图175.交互分析目的:描述同一组样本中不同变量之间是否存在显著联系。SPSS:Analyze->DescriptiveStatistics->Crosstabs.Rows和columnsChi-Square,PhiandCramer’sVrow示例:性别与工资的联系。5.交互分析目的:描述同一组样本中不同变量之间是否存在显著联18交互分析的结果卡方检验。P<0.05,则拒绝0假设,变量之间具有显著联系。Phi值反应变量之间的关系强度,0.5表示高,0.3表示一般,0.1表示低。交互分析的结果卡方检验。P<0.05,则拒绝0假设,变量之间19四、SPSS数据的推断性统计分析T检验方差分析……四、SPSS数据的推断性统计分析T检验201.T检验T检验的目的是检验两个样本中存在的差异在总体中是否也同样存在。T检验的先决条件是:两个样本是随机取样的;被比较的变量属于区间或比率等级;样本的抽样分布呈正态分布。T检验是0假设,即两者之间不存在差异。T检验的结果:如果在置信度为95%下,显著性水平>0.05,则接受假设;如果<0.05,拒绝假设。1.T检验T检验的目的是检验两个样本中存在的差异在总体中是21T检验的SPSS操作Analyze->CompareMeans->IndependentTTest.确定T检验的变量;确定T检验的分组变量。Ok即可。示例:不同性别工资差异的T检验。T检验的SPSS操作Analyze->CompareMea222.方差分析分析变量之间是否存在相关性。例如:人的年龄是否受到地域的影响。不同地域的人的年龄,其平均年龄是否存在差异。要求:因变量在影响因素的各个水平上的分布必须服从正态分布。2.方差分析分析变量之间是否存在相关性。23方差分析的原理—以单因素分析为例假定H0:在某一自变量下的不同水平下,总体均值μ没有差异。将原始数据按照自变量的水平不同随机分成c个组,然后进行分析:如果组内差异大而组间差异下,则说明两个变量之间没有什么关联性;如果组间差异大而组内差异小,则说明两个变量之间有某种关联性。方差分析的原理—以单因素分析为例假定H0:在某一自变量下的不24例子:人年龄与地域之间是否存在关联性要解决的问题:他们之间是否存在关联性?如果有,则:不同地域对人年龄的影响程度如何?哪些地域对人的年龄的影响明显?哪些地域对人年龄的影响最不明显?例子:人年龄与地域之间是否存在关联性要解决的问题:25解题步骤1)原始数据按地域随机抽样。结果如下表:地域1地域2地域3828182828379808081808384838585=82=80=84解题步骤1)原始数据按地域随机抽样。结果如下表:地域1地域226解题步骤2)假定:由于三个样本取自同一总体,因而其均值μ相同。但各自的有差异。因此假设H0:μ1=μ2=μ3(含义:地域对人的年龄没有影响,其本身的样本均值与总体均值不同是由于抽样的波动引起的。)解题步骤2)假定:27解题步骤3)求组间变差与联合方差组间样本总平均值:组间样本总方差:联合方差:解题步骤3)求组间变差与联合方差组间样本总平均值:组间样本总28解题步骤4).F检验:如果Ho为真,F比值将围绕着1波动;如果Ho不真,F值将倾向于比1大很多。1)F值:2)F的自由度分子自由度:df1=c-1=3-1=2分母自由度:df2=c(n-1)=3(5-1)=123)用F分布表查Ho的概值。其概值远远小于0.001,趋近于0。Ho的概值小于0.05(μ的显著水平),拒绝Ho。解题步骤4).F检验:1)F值:2)F的自由度Ho的概值小29解题步骤5)对方差的方差齐性检验该检验是对自变量不同水平下各观测变量总体方差是否相等进行检验。因为方差分析的前提是“自变量不同水平下观测变量总体方差无显著差异”。分析过程:用t检验,首先分析p值(概值)是否大于a(=0.05),如果大于,方差无显著差异;然后,比较两个总体均值的t检验结果,如果t统计量对应的两端的概率p值大于a,无显著差异,如果小于,则有显著差异。解题步骤5)对方差的方差齐性检验30解题步骤6).多重比较检验确定自变量的不同水平对观测变量的影响程度。这种检验比较复杂,方法也很多,其中LSD敏感性最强。解题步骤6).多重比较检验31结果总体描述及95%置信区间地域1地域2地域3结果总体描述及95%置信区间地域132检验结果1)概值趋近于0,小于0.05,拒绝Ho,不同地域下人的年龄有显著差异。2)回归的概值为0.002,地域与人的年龄之间不是零线性相关。检验结果1)概值趋近于0,小于0.05,拒绝Ho,不同地域下331).单因素方差分析Analyze->CompareMeans-OnWayANOVA.Dependentlist选择因变量;Factor选择自变量。posHoc选择R-E-G-WQ和Tukey。Option选择Describtive和HomogeneityofVtest.结果:如果PostHocTests检验中p<0.05,则具有显著差异。例子:职务与工资的方差分析。1).单因素方差分析Analyze->CompareMe342).多因素方差分析SPSS:Analyze->GeneralLinearModel->Univariate.DependentVariable,FixedFactors.Options选择DescriptiveSt.例子:职务、性别与工资的方差分析。2).多因素方差分析353.卡方检验目的:检验样本中自变量与应变量之间的关系在总体中是否存在。0假设:自变量与应变量之间的关系在总体中不存在。结论:如果p>0.05,拒绝0假设。卡方检验要求自变量与因变量都是分隔变量。3.卡方检验目的:检验样本中自变量与应变量之间的关系在总体中36卡方检验的SPSS操作SPSS:Analyze->DescriptiveStatistics->Crosstabs.Rows和columnsChi-SquareOk.卡方检验的SPSS操作SPSS:Analyze->Desc37五、SPSS数据的预测分析线性回归对数回归……五、SPSS数据的预测分析线性回归38关于回归分析回归分析是社会研究中进行定量分析的基本方法,主要解决3个方面的问题:①确定几个变量间是否存在相关关系;若存在,则找出它们之间合适的数学表达式。②据一个或几个变量值,预测或控制另一个或几个变量的值,且要知道这种控制或预测可达何种精确度。③进行因素分析,即在共同影响一个变量的多个变量(因素)间,找出主要和次要因素及其相互关系。关于回归分析回归分析是社会研究中进行定量分析的基本方法,主要39变量之间的两种关系确定性关系问题1:正方形的面积y与正方形的边长x之间的函数关系是y=x2。--确定性关系非确定性关系--相关关系问题2:某水田水稻产量y与施肥量x之间是否有一个确定性的关系?变量之间的两种关系确定性关系40相关关系的回归分析对具有相关关系的两个变量进行统计分析的方法叫回归分析。注:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。相关关系的回归分析对具有相关关系的两个变量进行统计分析的方法41现实生活中的相关关系人的身高与年龄;产品的成本与生产数量;商品的销售额与广告费;家庭的支出与收入。现实生活中的相关关系42回归方程对具有相关关系的现象,选择一适当的数学关系式,用以说明一个或一组变量变动时,另一变量或一组变量平均变动的情况,这种关系式称为回归方程。如果所择关系式是线性的,就称为线性回归分析;反之,则称为非线性回归分析。线性回归是回归分析的基本模型,很多复杂的情况都是转化为线性回归进行处理。回归方程对具有相关关系的现象,选择一适当的数学关系式,用以说43线性回归分析--最小二乘法线性回归分析--最小二乘法44例子:大学生身高与体重的关系从某大学中随机选出8名大学生,其身高和体重数据如下表:编号12345678身高165165157170175165155170体重4857505464614359求大学生的身高与体重的回归方程。例子:大学生身高与体重的关系从某大学中随机选出8名大学生,其45结果回归方程:结果回归方程:46相关系数r>0正相关;r<0负相关。通常,r>0.75,认为两个变量有很强的相关性。本例中,由上面公式r=0.798>0.75.相关系数r>0正相关;r<0负相关。471.利用SPSS求线性回归SPSS:Analyze->Regression->Linear.因变量dependent和自变量IdependentOK即可。示例:工作年限与工资水平的线性回归。1.利用SPSS求线性回归SPSS:Analyze->Reg48线性回归的结果ModelSummary:R方用来解释应变量中有多少可以被自变量所解释。ANOVA方差分析:判断回归模型是否有统计学意义。如果P<0.05,具有意义。Coefficients:具体的数学模型y=a+bx。线性回归的结果ModelSummary:R方用来解释应变量492.利用SPSS求对数回归非线性回归。通常用来求应变量是分隔变量的回归模型,而且要求应变量只有两个值,因此需要对变量进行重新编码。SPSS:Analyze->Regression-BinaryLogistic.示例:职务与工资之间的对数回归模型。2.利用SPSS求对数回归非线性回归。50SPSS的使用心得要掌握统计学的基本知识;使用SPSS之前要先对数据进行宏观把握;要根据数据以及分析思路选择合适的SPSS命令。SPSS的使用心得要掌握统计学的基本知识;51演讲完毕,谢谢观看!演讲完毕,谢谢观看!52本资料来源本资料来源53讲座:SPSS使用方法吴志强信息管理学院wuzhiqiang518@讲座:SPSS使用方法吴志强54关于SPSSSPSS原意为StatisticalPackagefortheSocialSciences,即“社会科学统计软件包”。随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司于2000年将英文全称更改为StatisticalProductandServiceSolutions,意为“统计产品与服务解决方案”。关于SPSSSPSS原意为StatisticalPacka55社会科学研究中的统计数据的描述性统计频次分布集中趋势:平均数、众数、中位数等;离散趋势:方差和标准差、极差等;数据分析数据预测社会科学研究中的统计数据的描述性统计56一、SPSS常用菜单的功能Data菜单:对数据进行排序、转置以及观测记录的选择;Transform菜单:数据转换功能,常用的有Compute、Recode以及Count。Analyze菜单:各种统计分析。Graphs菜单:制图工具。一、SPSS常用菜单的功能Data菜单:对数据进行排序、转置57二、SPSS的数据管理常用的功能有:数据转换;数据聚合。二、SPSS的数据管理常用的功能有:581.数据转换-Compute对数据进行规律性的整理和计算。步骤:Transform->ComputeIf条件的设置新变量设定示例说明1.数据转换-Compute对数据进行规律性的整理和计算。592.数据转换-Recode对数据按分段模式转换,如:把数据中的年龄转换为年龄段。步骤:Transform->Recode选择需要转换的变量,并设置转换后的变量;设置旧变量转换为新变量的条件;运行OK即可。示例2.数据转换-Recode对数据按分段模式转换,如:把数据中603.数据聚合-Aggregate把数据按照某一变量进行分类汇总。步骤:Data->aggregate选定分类变量到BreakVariables框选定聚合变量到AggregateVariables框Function设置聚合函数选择创建新文件运行OK即可示例3.数据聚合-Aggregate把数据按照某一变量进行分类汇61示例:Recode和Aggregate的组合使用示例:Recode和Aggregate的组合使用62三、数据的描述统计包括:频数分析均值标准差三、数据的描述统计包括:63数据的集中趋势统计量频数:各个组内含个体的个数平均数(均值):众数:频数出现最多的变量值中位数:第50个百分位数点上的值数据的集中趋势统计量频数:各个组内含个体的个数641.频数SPSS操作:打开数据文件,执行Analyze->DescriptiveStatistics->Frequencies.选择分析变量Statistics按钮设置频数Charts设置直方图以及正态曲线OK即可。1.频数SPSS操作:652.平均数与标准差SPSS操作:打开数据文件,执行Analyze->DescriptiveStatistics->Descriptive.选择分析变量Option按钮设置统计量OK即可。2.平均数与标准差SPSS操作:66数据的离散趋势统计量方差和标准差极差:最大值与最小值之间的距离四分位数差:第25、50、75个百分位数点之间的距离数据的离散趋势统计量方差和标准差673.分组求均值对数据分组描述,可以输出分组数据的均值、标准差、极值等,即对数据进行多层分类汇总。SPSS操作Analyze->CompareMeans->Means.示例:求不同性别的人在各工资段上的平均值。3.分组求均值对数据分组描述,可以输出分组数据的均值、标准差684.数据探测(Explore)计算描述统计量,通过各类统计图等描述数据的分布类型。SPSS:Analyze->DescriptiveStatistics->Explore。4.数据探测(Explore)计算描述统计量,通过各类统计图695.交互分析目的:描述同一组样本中不同变量之间是否存在显著联系。SPSS:Analyze->DescriptiveStatistics->Crosstabs.Rows和columnsChi-Square,PhiandCramer’sVrow示例:性别与工资的联系。5.交互分析目的:描述同一组样本中不同变量之间是否存在显著联70交互分析的结果卡方检验。P<0.05,则拒绝0假设,变量之间具有显著联系。Phi值反应变量之间的关系强度,0.5表示高,0.3表示一般,0.1表示低。交互分析的结果卡方检验。P<0.05,则拒绝0假设,变量之间71四、SPSS数据的推断性统计分析T检验方差分析……四、SPSS数据的推断性统计分析T检验721.T检验T检验的目的是检验两个样本中存在的差异在总体中是否也同样存在。T检验的先决条件是:两个样本是随机取样的;被比较的变量属于区间或比率等级;样本的抽样分布呈正态分布。T检验是0假设,即两者之间不存在差异。T检验的结果:如果在置信度为95%下,显著性水平>0.05,则接受假设;如果<0.05,拒绝假设。1.T检验T检验的目的是检验两个样本中存在的差异在总体中是73T检验的SPSS操作Analyze->CompareMeans->IndependentTTest.确定T检验的变量;确定T检验的分组变量。Ok即可。示例:不同性别工资差异的T检验。T检验的SPSS操作Analyze->CompareMea742.方差分析分析变量之间是否存在相关性。例如:人的年龄是否受到地域的影响。不同地域的人的年龄,其平均年龄是否存在差异。要求:因变量在影响因素的各个水平上的分布必须服从正态分布。2.方差分析分析变量之间是否存在相关性。75方差分析的原理—以单因素分析为例假定H0:在某一自变量下的不同水平下,总体均值μ没有差异。将原始数据按照自变量的水平不同随机分成c个组,然后进行分析:如果组内差异大而组间差异下,则说明两个变量之间没有什么关联性;如果组间差异大而组内差异小,则说明两个变量之间有某种关联性。方差分析的原理—以单因素分析为例假定H0:在某一自变量下的不76例子:人年龄与地域之间是否存在关联性要解决的问题:他们之间是否存在关联性?如果有,则:不同地域对人年龄的影响程度如何?哪些地域对人的年龄的影响明显?哪些地域对人年龄的影响最不明显?例子:人年龄与地域之间是否存在关联性要解决的问题:77解题步骤1)原始数据按地域随机抽样。结果如下表:地域1地域2地域3828182828379808081808384838585=82=80=84解题步骤1)原始数据按地域随机抽样。结果如下表:地域1地域278解题步骤2)假定:由于三个样本取自同一总体,因而其均值μ相同。但各自的有差异。因此假设H0:μ1=μ2=μ3(含义:地域对人的年龄没有影响,其本身的样本均值与总体均值不同是由于抽样的波动引起的。)解题步骤2)假定:79解题步骤3)求组间变差与联合方差组间样本总平均值:组间样本总方差:联合方差:解题步骤3)求组间变差与联合方差组间样本总平均值:组间样本总80解题步骤4).F检验:如果Ho为真,F比值将围绕着1波动;如果Ho不真,F值将倾向于比1大很多。1)F值:2)F的自由度分子自由度:df1=c-1=3-1=2分母自由度:df2=c(n-1)=3(5-1)=123)用F分布表查Ho的概值。其概值远远小于0.001,趋近于0。Ho的概值小于0.05(μ的显著水平),拒绝Ho。解题步骤4).F检验:1)F值:2)F的自由度Ho的概值小81解题步骤5)对方差的方差齐性检验该检验是对自变量不同水平下各观测变量总体方差是否相等进行检验。因为方差分析的前提是“自变量不同水平下观测变量总体方差无显著差异”。分析过程:用t检验,首先分析p值(概值)是否大于a(=0.05),如果大于,方差无显著差异;然后,比较两个总体均值的t检验结果,如果t统计量对应的两端的概率p值大于a,无显著差异,如果小于,则有显著差异。解题步骤5)对方差的方差齐性检验82解题步骤6).多重比较检验确定自变量的不同水平对观测变量的影响程度。这种检验比较复杂,方法也很多,其中LSD敏感性最强。解题步骤6).多重比较检验83结果总体描述及95%置信区间地域1地域2地域3结果总体描述及95%置信区间地域184检验结果1)概值趋近于0,小于0.05,拒绝Ho,不同地域下人的年龄有显著差异。2)回归的概值为0.002,地域与人的年龄之间不是零线性相关。检验结果1)概值趋近于0,小于0.05,拒绝Ho,不同地域下851).单因素方差分析Analyze->CompareMeans-OnWayANOVA.Dependentlist选择因变量;Factor选择自变量。posHoc选择R-E-G-WQ和Tukey。Option选择Describtive和HomogeneityofVtest.结果:如果PostHocTests检验中p<0.05,则具有显著差异。例子:职务与工资的方差分析。1).单因素方差分析Analyze->CompareMe862).多因素方差分析SPSS:Analyze->GeneralLinearModel->Univariate.DependentVariable,FixedFactors.Options选择DescriptiveSt.例子:职务、性别与工资的方差分析。2).多因素方差分析873.卡方检验目的:检验样本中自变量与应变量之间的关系在总体中是否存在。0假设:自变量与应变量之间的关系在总体中不存在。结论:如果p>0.05,拒绝0假设。卡方检验要求自变量与因变量都是分隔变量。3.卡方检验目的:检验样本中自变量与应变量之间的关系在总体中88卡方检验的SPSS操作SPSS:Analyze->DescriptiveStatistics->Crosstabs.Rows和columnsChi-SquareOk.卡方检验的SPSS操作SPSS:Analyze->Desc89五、SPSS数据的预测分析线性回归对数回归……五、SPSS数据的预测分析线性回归90关于回归分析回归分析是社会研究中进行定量分析的基本方法,主要解决3个方面的问题:①确定几个变量间是否存在相关关系;若存在,则找出它们之间合适的数学表达式。②据一个或几个变量值,预测或控制另一个或几个变量的值,且要知道这种控制或预测可达何种精确度。③进行因素分析,即在共同影响一个变量的多个变量(因素)间,找出主要和次要因素及其相互关系。关于回归分析回归分析是社会研究中进行定量分析的基本方法,主要91变量之间的两种关系确定性关系问题1:正方形的面积y与正方形的边长x之间的函数关系是y=x2。--确定性关系非确定性关系--相关关系问题2:某水田水稻产量y与施肥量x之间是否有一个确定性的关系?变量之间的两种关系确定性关系92相关关系的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论