版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
[SPSS培训课程大纲]
SPSS数据分析高级应用培训班
培训资料
(仅供培训使用)
0
目录
第1讲统计工具与SPSS软件..............................................................................1
1.1统计工具含义.................................................................................1
1.2统计工具作用.................................................................................1
L3运用统计工具注意事项.........................................................................1
1.4统计工具与SPSS软件关系....................................................................1
第2讲SPSS入门..........................................................................................2
2.1SPSS历史沿革...............................................................................2
2.2SPSS基本界面...............................................................................2
2.3常规功能设置................................................................................3
2.3数据变量(详细介绍在课堂上演示)...........................................................3
2.3.1计量尺度...............................................................................3
2.3.2常量与变量.............................................................................3
2.3.3变量标签...............................................................................3
2.3.4变量缺失值.............................................................................4
第3讲数据采集与整理...................................................................................5
3.1数据编辑器简介..............................................................................5
3.2数据文件的建立..............................................................................5
3.3数据的编辑...................................................................................5
3.3.1查看数据信息...........................................................................5
3.3.2数据定位...............................................................................5
3.3.3插入与删除变量和观测量................................................................5
3.3.4实用数据文件操作......................................................................6
3.4单选题、多选题与开放题的数据录入,检查异常值...............................................8
3.5SPSS函数...................................................................................10
第4讲描述性统计分析..................................................................................12
4.1常用统计量..................................................................................12
4.1.1描述集中趋势的统计量(将融合在后续演示中)..........................................12
4.1.2描述离散程度的统计量(将融合在后续演示中)..........................................13
4.1.3描述分布形态的统计量(将融合在后续演示中)..........................................13
4.2常用统计表..................................................................................13
4.2.1在线处理分析报告(OLPA)..............................................................................................................................13
4.2.2个案摘要报告..........................................................................13
4.2.3行形式摘要报告和列形式摘要报告(略,学员可独立学习)................................14
4.3频数分析....................................................................................14
4.4描述性分析..................................................................................15
4.5探索性分析..................................................................................16
4.6常用统计图(课堂现场演示).................................................................16
第5讲一般推断性统计分析..............................................................................17
5.1统计推断理论(课堂现场讲授)...............................................................17
5.2均值比较....................................................................................17
5.2.1均值过程..............................................................................17
5.2.2单样本t检验..........................................................................18
5.2.3独立样本f检验........................................................................19
5.2.4配对样本t检验........................................................................20
5.3相关分析....................................................................................22
5.3.1简单相关分析..........................................................................22
5.3.2偏相关分析............................................................................23
5.3.3距离分析..............................................................................25
5.4回归分析....................................................................................27
5.4.1线性回归分析..........................................................................28
5.4.2曲线回归分析..........................................................................29
5.4.3非线性回归分析........................................................................31
5.5方差分析....................................................................................32
5.5.1单因素方差分析........................................................................32
5.5.2多因素方差分析........................................................................35
5.5.3重复测量方差分析.....................................................................37
5.5.4协方差分析............................................................................39
第6讲多元统计分析....................................................................................42
6.1聚类分析....................................................................................42
6.1.1理论背景..............................................................................42
6.1.2距离和相似系数.......................................................................42
6.1.4K-Means聚类.........................................................................46
6.1.5分层聚类..............................................................................47
6.3判别分析....................................................................................48
6.3因子分析....................................................................................54
6.3.1基本概念..............................................................................54
6.3.2基本步骤..............................................................................54
6.3.3实例演示..............................................................................55
6.4主成分分析.................................................................................57
6.4.1基本概念..............................................................................57
6.4.2基本步骤..............................................................................57
6.4.3实例演示..............................................................................59
第7讲定性数据分析....................................................................................60
7.1列联表......................................................................................60
7.1.1基本概念..............................................................................60
7.1.2实例演示..............................................................................61
7.2Logistic回归.................................................................................62
7.2.1基本概念..................................................................................62
7.2.2实例演示..................................................................................63
第8讲时间序列分析....................................................................................65
8.1组成要素....................................................................................65
8.2ARMA模型.................................................................................65
8.2.1ARMA模型及基本原理................................................................65
8.2.2ARMA模型的基本形式................................................................65
8.3实例演示....................................................................................66
第9讲其他统计分析....................................................................................67
9.1信度分析....................................................................................67
9.1.1基本分类..................................................................................67
9.1.2实例演示..................................................................................67
9.2生存分析....................................................................................68
9.2.1生存分析的目的........................................................................68
9.2.2生存数据..............................................................................69
9.2.3生存时间函数..........................................................................69
9.2.4生存分析的基本方法...................................................................70
9.2.5实例演示..............................................................................71
第10讲综合案例分析...................................................................................76
10.1案例背景...................................................................................76
10.2RFM模型简介..............................................................................76
10.3实例演示(课堂演示)......................................................................77
第11讲SPSS编程简介...................................................................................78
11.1程序编辑窗口操作入门......................................................................78
11.1.1Syntax与UI...................................................................................................................................................78
11.1.2生成和运行syntax..........................................................................................................................................78
11.2syntax基本规贝|............................................................................80
11.2.1syntax简介...........................................................................80
11.2.2命令分类.............................................................................82
11.3结构化语句.................................................................................84
11.3.1分支语句(条件语句)................................................................84
11.3.2循环语句.............................................................................84
11.4实例演示...................................................................................85
第1讲统计工具与SPSS软件
1.1统计工具含义
统计学是通过搜索、整理、分析数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科
学。其中用到了大量的数学及其它学科的专业知识,它的使用范围几乎覆盖了社会科学和自然科学的各个领域。
统计工具是实现上述过程的手段与方法,包括理论方法与计算软件。
1.2统计工具作用
在古代,治国安天下多数通过逻辑分析和简单计算就能满足,在现今社会,单纯靠逻辑分析和推断无法满足实
际需要,人们往往需求的是隐藏在表面之后的规律,需要借助统计工具加以实现,比如:利用C-D生产函数来判断
国家的GDP中,多大程度受固定资产影响,多大程度受人力资本影响,科技进步有多大。诸如此类问题都需要通过
统计工具实现,由此,可以得出统计工具的主要作用就是实现人们想了解到的、可以了解到的那些潜在的关系和规
律。
1.3运用统计工具注意事项
在说明统计工具在使用中需注意问题之前,举个实际例子。
【例1.1】有人说:“统计方法没什么用,我想知道明天几点几分下雨,统计方法根本无法实现这样的说法正
确吗?
分析与解答:该种说法错误,从供给和需求角度进行分析。
需求方面:实际生活中,人们期望获取一具体点值,属于微观问题
供给方面:利用统计方法得到的点估计属于宏观问题,只有在大量重复情况下才能实现,举点估计的评价标准
为例说明(课堂讲授)。
从供给和需求方面可以看出,统计工具是在满足某些约束条件下得出的结果,具体在统计工具运用中需注意如
下事项:
1、注意统计工具满足的基本假定;
2、统计工具计算的结果一定存在误差;
3、只要不影响实际决策的误差可以认为是统计上允许的误差;
4、统计结果往往具有实际意义,不要为了面子而滥用统计工具。
1.4统计工具与SPSS软件关系
SPSS软件是一种实现理论计算方法,帮助统计研究者简化计划,提高工作效率的电脑软件,通过该软件可迅速
实现描述性统计分析、确定性统计分析、随机统计分析等。
第2讲SPSS入门
2.1SPSS历史沿革
SPSS是世界上最早的统计分析软件,全称为StatisticalPackageforSocialScience,也称社会科学统计软件。由美
国斯坦福大学的三位研究生NormanH.Nie、C.Hadlai(Tex)Hull和DaleH.Bent于1968年研究开发成功,同时成立
了SPSS公司,并于1975年成立法人组织、在芝加哥组建了SPSS总部。1984年SPSS总部首先推出了世界上第一
个统计分析软件微机版本SPSS/PC+,开创了SPSS微机系列产品的开发方向,极大地扩充了它的应用范围,并使其
能很快地应用于自然科学、技术科学、社会科学的各个领域。世界上许多有影响的报刊杂志纷纷就SPSS的自动统计
绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价。随着应用领域的不断扩大,SPSS已经有原
来的名字改为StatisticsProductandServiceSolution,即统计产品与服务解决方案。
SPSS15.0.1-2006年11月
SPSS16.0.2-2008年4月
SPSSStatistics17.0.1-2008年12月
PASWStatistics17.0.2-2009年3月
PASWStatistics17.0.3-2009年11月
PASWStatistics18.0.0-2009年8月
PASWStatistics18.0.1-2009年12月
PASWStatistics18.0.2-2010年4月
PASWStatistics18.0.3-2010年9月
IBMSPSSStatistics19.0-2010年8月
IBMSPSSStatistics20.0-2011年8月
IBMSPSSStatistics21.0-2012年8月
IBMSPSSStatistics22.0-2013年8月
2.2SPSS基本界面
安装SPSS22.0之后,第一次启动将出现如下界面。
在点击“取消”可出现以下常规界面。
2.3常规功能设置
通过“编辑”一“选项”,获取如下对话框
对第一行命令逐一点开,会出现关于SPSS如阿年常规功能设置的所有界面(课堂演示)
2.3数据变量(详细介绍在课堂上演示)
2.3.1计量尺度
无论是观测数据还是试验数据,都需要度量。统计数据是对客观现象进行计量的结果,按照对事物的精确程度,
可将所采用的计量尺度有低级到高级分为:名义尺度、定序尺度和间隔尺度(又分为定距尺度和定比尺度)
2.3.2常量与变量
常量分为数值型常量、字符型常量、日期型常量
变量分为数值型变量、字符型变量、日期型变量。
数值型变量包括:标准型、逗号型、圆点型、科学计数法型、美元型和自定义货币型。
2.3.3变量标签
变量标签是对变量名进一步解释和说明,包括变量名标签和变量值标签。
变量名标签是对变量名含义的进一步解释和说明,在SPSS界面中表现为“标签”列。
变量值标签是对数值型变量各个取值的含义进行解释和说明,尤其是定型数据,在SPSS界面中表现为“值”列。
2.3.4变量缺失值
在调查问卷中,被调查者没有填写调查表要求填写的某些数据或填写的数据失真,造成缺失值。这些情况称为
数据缺失或数据不全,缺失或不完全的数据在统计分析中不能使用,需标出,在在SPSS界面中表现为“缺失”列。
第3讲数据采集与整理
3.1数据编辑器简介
刘怔)*a(£>幅图也*8©WIXD例MN■“¥)8B用@无用1»眇@)■口(]g>睫6但)
mH昌回■-,,.©&>藏T曲画苞寤吃小台口♦2
3«200
»1KRffi(Ol««UBM
数据编辑器主要由标题栏、当前数据栏、输入数据栏和数据显示区组成。
3.2数据文件的建立
建立数据文件可通过如下两种方式实现:
1、“文件”一“新建”命令
2、在启动SPSS时选择“输入数据”选项
数据录入方法包括:按单元格输入数据、按变量录入数据、按观测量录入数据和输入带有变量标签的数据。
3.3数据的编辑
3.3.1查看数据信息
1、查看变量信息
在数据编辑器窗口中切换到“变量视图'’区域查看变量信息或者执行菜单“应用程序变量''命令
2、查看文件信息
执行菜单“文件”显示数据文件信息“命令
3.3.2数据定位
1、按个案序号自动定位
执行菜单“编辑”一"转至个案''命令
2、按变量值自动定位
执行菜单“编辑”一“查找”命令
3.3.3插入与删除变量和观测量
插入变量可通过以下三种方式实现:
1、通过数据编辑器窗口中相关快捷命令
2、利用鼠标右键完成
3、执行菜单“编辑”-“插入变量”命令
删除变量可通过以下两种方式实现:
1>利用鼠标右键完成
2、执行菜单“编辑”一“清除”命令
观测量(个案)的插入和删除方法同变量类似,课堂演示。
3.3.4实用数据文件操作
1、数据的打开和保存(略)
2、数据排序
(1)执行菜单“数据”—“排序个案”命令
(2)需要根据哪个变量排序,则单击该变量-“排序依据
(3)选择“升序”还是“降序”
(4)点击“确定”
3、数据文件的分解
(1)执行菜单“数据”一“拆分文件”命令
(2)选择不同的拆分方式:分析所有个案,不创建组(默认方式)、比较组或按组组织输出
(3)选择不创建组(默认方式)、比较组或按组组织输出需选取“分组方式”
(4)点击“确定”
4、数据文件的合并
1、增加变量
(1)执行菜单“数据”一“合并文件”-“添加变量”命令
(2)选中所添加的变量后点击“继续”命令
畛添加变量从数据集1
(3)点击“确定”
2、增加观测值
(1)执行菜单“数据”一“合并文件”—“添加个案”命令
(2)选中所添加的变量后点击“继续”命令
(3)点击“确定”
5、数据文件的转置
执行菜单“数据”一“变换”命令
3.4单选题、多选题与开放题的数据录入,检查异常值
1、单选题的数据录入
通过具体例子说明
【例3.1】对马航失联客机的结果有如下几种,选择最可能的一种?()
A坠入海洋B恐怖分子劫机C被海盗劫机D政府行为
具体实现方法有两种:
(1)二分法。对每个选项赋值“0”或者“1”
(2)对每个选项分别赋值“1,2,3,4”
卜(£)编辑(g)视图00数括©)转换①分析叱)直销迪)图形(g)实用程序窗口色)藉助他)
坞属rr葡褊墉期都引豳霹宓霸I
-称胆宽度—II小数一I标签值缺失
1,对马航失联客机的转果有—数值8|2{1.00,
2、多选题的数据录入
(1)多重二分法
处理方法同单选题数据录入的(1),此处略。
(2)多重分类法
若假定最多选2个,先对对每个选项分别赋值“1,2,3,4”,后给出2个备选变量即可。
日牛(E)编辑丘)视图世)数据©)转换CD分析®)直销®)图形在)实用程序也)窗口也)帮助此)
宅H母皿GT圃至弱醉附■留蠢为I
名称类型宽度小数标签值
1选项结果1数值H2[{too.1=-£...关
2选项结果2数值81(1.00,1="K...关
若没有限制选项个数,则将所有的备选变量给出。
3、开放题的录入
开放型问题的处理一般不需要编码的操作,当然也不需要输入到SPSS中进行分析处理,只能通过调查者的汇总
归纳概括,因此开放型问题在问卷中应该尽可能的减少;原因在于一是不便于分析处理,二是开放型问题的回答率
一般较低。
4、异常值的查找
离群值:(箱图)值与框的上下边界的距离在1.5倍框的长度到3倍框的长度之间的个案。框的长度是内距。
极端值:(箱图)值距离框的上下边界超过3倍框的长度的个案。框的长度是内距
在回归模型诊断里面,一般称预测值与实际值的偏差为“残差”,按照需要取一残差,再按照某种标准取一个阀值
来限定异常点,只要那个点的残差大于阀值,就可以认为它是异常点。
在时间序列分析中,异常值的统计检验方法可以通过残差的正态性检验实现。
3.5SPSS函数
SPSS函数是一个常用程序(rountine),并且利用一个或多个自变量(参数)来执行。每个SPSS函数均有一个关
键名称(keywordname),且绝不能写错。通常,函数的格式为:函数名称(自变量,自变量,……),某些函数可能
只含有一个自变量,而有些函数则可能含有多个自变量,当一个函数含有多个自变量时,各自变量间用逗号(,)隔
开,而函数的自变量通常又可分为以下三种:1)常数,如SQRT(IOO):2)变量名称,如MEAN(VARl,VAR2,VAR3);
3)表达式,如MIN(30,SQRT(100))。总之,SPSS函数和我们平时EXCEL里面函数格式规则并无差别。
SPSS提供了180多种函数,共可分为十多类。和EXCEL一样,我们也不可能记住所有函数,只要知道一些常
用函数,至于其他函数要用的时候再去查找也不迟,下面本人将列举一些常用函数:
1算术函数
函数说明范例(x=2.6,y=3)
ABS(numbexpr)绝对值函数ABS(y-x)=0.4
RND(numbexpr)四舍五入函数RND(x)=3
TRUNC(numbexpr)取整函数TRUNC(x)=2
SORT(numbexpr)平方根函数SQRT(y)=1.71
MOD(numbexpr,modulus)求算两数相除后的余数MOD(y,x)=0.4
EXP(numbexpr)以e为底的指数函数EXP(y)=20.09
LG10(numbexpr)以10底的对数函数LG10(x*10)=1.41
LN(numbexpr)自然对数函数LN(y)=l.l
2统计函数
函数说明范例(X1=2X2=5X3=8)
MEAN(numexpr,numexpr,...)自变量的平均值MEAN(X1,X2,X3)=5
MIN(value,value,...)自变量的最小值MIN(X1,X2,X3)=1
MAX(value,value,...)自变量的最大值MAX(X1,X2,X3)=8
SUM(numexpr,numexpr,...)求和SUM(X1,X2,X3)=15
SD(numexpr,numexpr,...)求标准差SD(X1,X2,X3)=3
VARIANCE(numexpr,numexpr,...)求方差VAR(X1,X2,X3)=9
CFVAR(numexpr,numexpr,...)求变异系数CFVAR(Xl,X2,X3)=0.6
3缺失值函数
函数说明范例
MISSING(X1)=1
MISSING(variable)若变量缺失,则为T或1,否则为F或。MISSING(X2)=1
MISSING(X3)=0
SYSMIS(X1)=O
若变量是系统缺失值则为T或1,如为自
SYSMIS(numvar)SYSMIS(X2)=1
定缺失或非缺失则为F或0
SYSMIS(X3)=0
NMISS(variable,...)缺失值个数NMISS(X1,X2,X3)=2
NVALID(variable,...)有效值个数NVALID(X1,X2,X3)=1
VALUE(variable,...)忽略自定义缺失值,当作非缺失VALUE(X1)=X1
注:XI为使用者界定缺失值,X2为系统缺失值,X3为非缺失值
4字符串型函数
函数说明范例
若自变量1和后面自变量窜相同则为ANY(is,this)=O
ANY(test,value,value)
真,记为1ANY(is,this,is)=l
CONCAT(strexpr,strexpr)将自变量连成一个新自变量CONCAT(th,is)=this
Divisor在needle最左侧开始出现的INDEX(4thisis?is,)=3
INDEX(haystack,needle,divisor)
位置
自变量所含文字的个数(包括特殊字
LENGTH(strexpr)LENGTHCthis,)=5
符和空格)
LOWER(strexpr)自变量中的大写字母改为小写字母LOWER('This')='this'
UPCASE(strexpr)将自变量中的小写字母改为大写字母UPCASE('this'尸'THIS'
在strexpr开始处去除char所形成的LTRIM(lhis',‘t'尸'his'
LTRIM(strexpr,char)
常量,如无char则去除strexpr左侧的空LTRIM('this','is'尸'th'
格LTRIM('this'尸'this'
NUMBER(strexpr,format)当自变量为数字的文字变量时,按文NUMBERC23,,F8.1)=2.3
字变量指定格式转换为数字变量NUMBER('23',F8.0尸23
如果自变量1的值包含在自变量集10RANGE(<c,;a,,,k,)=T
RANGE(test,lo,hi,lo,hi)
至hi的范围内,则为T或1
STRING(strexpr,format)按指定格式将自变量转换为文字型STRING(3+4,F8.2)=,7.00,
变量
从strexpr子窜的第pos位置开始取
SUBSTR(sterxpr,pos,length)SUBSTRCthisis',6,2)='is'
length的字符串长度
5时间日期函数
函数说明范例
DATA.DMY(d,m,y)与指定日月年对应的日期DATA.DMY(3,5,99)=05/03/99
DATA.MDY(m,d,y)与指定月日年对应的日期DATA.MDY(5,3,99)=05/03/99
DATA.YRDA(y,d)与指定年日对应的日期DATA.YRDA(99,35)=02/04/99
DATA.QYR(q,y)指定的季节年份对应的日期DATA.QYR(2,99)=04/01/99
DATA.MOYR(m,y)与指定的月年度对应的日期DATA.MOYR(5,99)=05/01/99
DATA.WKYR(w,y)与指定的周年度对应的日期DATA.WKYR(38,98)=9/17/98
注:1.要正确显示以上函数值,必须先赋予其SPSS得日期型变量(DATA)格式,假设以上日期用mm/dd/yy
格式显示,时间则用hh:mm:ss格式表示
2.l<=d<=31,l<=m<=12,l<=w<=52、l<=q<=4
(六)其他函数
SPSS除了上述函数外,尚有日期和时间转换函数(YOMODA\CTMIESDAYS\CTIMEHOURS\MDAYS等)、连
续几率密度函数(CDF\BINOM\CHISQ\CDF\EXP\LOGISTIC等),此外还有NORMAL(stddev)可产生平均数为0,
标准差为stddev的正态分布随机数字。UNIFORM(max)可产生平均数为0与max间呈均等分布的随机数字。
第4讲描述性统计分析
4.1常用统计量
4.1.1描述集中趋势的统计量(将融合在后续演示中)
1、均值
2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 专利技术所有权变更服务合同版
- 2025年度智能装备行业派遣人员劳动合同模板3篇
- 二零二五年度医疗健康行业聘用合同范本
- 2025年度水资源抽水利用技术合作开发合同4篇
- 二零二五年度临时餐饮场地租赁合同标准范本2篇
- 2025年度塑料袋品牌授权使用合同
- 2025年度新型木模板工程承包合同范本4篇
- 临时工用工劳动合同范本2025年全新发布
- 二零二五版木材加工设备融资租赁合同4篇
- 2025年度房地产分销推广合同范本:全国市场适用2篇
- 2024-2029年中国制浆系统行业市场现状分析及竞争格局与投资发展研究报告
- 大门封条模板
- 洛奇化石复原脚本
- 人教版三年级上册竖式计算练习300题及答案
- 【“凡尔赛”网络流行语的形成及传播研究11000字(论文)】
- ppr管件注塑工艺
- 液化气站其他危险和有害因素辨识及分析
- 建筑工程施工安全管理思路及措施
- 高中语文教学课例《劝学》课程思政核心素养教学设计及总结反思
- 中国农业银行小微企业信贷业务贷后管理办法规定
- 市政道路建设工程竣工验收质量自评报告
评论
0/150
提交评论