SPSS实验指导书_第1页
SPSS实验指导书_第2页
SPSS实验指导书_第3页
SPSS实验指导书_第4页
SPSS实验指导书_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SPSS统计分析软件实验指导书统计软件SPSS for Windows是基于Windows操作系统下的统计软件。SPSS是StatisticalPackage for the Social Sciences英文名称的首字母缩写,即“社会科学统计软件包”。最近,伴随SPSS公司产品与服务领域的扩大和服务深度的增加,SPSS公司已决定将之英文全称更改为Statistical Product and Service solutions,意为“统计产品与服务解决方案”。 SPSS是一个统计功能极强,内容及其庞大的统计软件。从1968年,三位美国斯坦福大学的学生开发了最早的SPSS统计软件系统至今,SP

2、SS在通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研教育等很多领域和行业得到了应用,是当今世界上最流行的三大统计分析软件包(SPSS、SAS、S-PLUS)之一。近些年SPSS统计软件系统在我国得到了迅速的普及,以至于在很多行业里与统计数据有关和使用统计数据的众多人士都需要使用和掌握SPSS。SPSS版本的更新速度很快,本手册主要以11.5版本为依据来介绍SPSS的使用方法。SPSS11.5主要具有以下的特点和功能:1使用简单。除了原始数据需要人工录入以外,对于大量的统计分析和计算,只需要通过选择菜单、填写对话框和选择按钮等简单操作即可轻松完成,而不必记忆大量的命令和语句,因此学习和

3、使用都很简单。2 统计功能强。SPSS既有简单的描述统计,也包含各种推论统计。尤其是大量的、多变量的统计分析实现起来很容易。3 方便快捷的绘图。SPSS的图形自动生成功能使图形的制作非常方便。其较强的图形编辑功能可以使根据自己的需要随心所欲地绘制出自己满意的图形。4 汉字操作。通过中文版的Windows可以很方便地在SPSS中使用汉字。目录实验一:数据文件的建立与编辑实验二:数据整理1、 个案的排序 2、合并文件实验三:描述统计分析1、 频数分析2、 统计图的绘制实验四:相关分析与回归分析实验五:聚类分析实验六:判别分析实验七:主成分分析与因子分析实验八:对应分析实验九:典型相关分析实验一:数

4、据文件的建立与编辑一、实验学时:2学时二、内容:假设你手头有100份调查问卷,需要你录入形成SPSS数据文件,如其中一份问卷的部分内容如下:生活满意度调查1姓名 周周 性别 女 年龄 28 文化程度 本科17你的职业是 B A教师 B工人 C医生 D作家 E其他18你的工资收入是 19你旅游的目的是 C A打发时间 B放松心情 C增加见闻 D交友 E其他21你对目前的家庭住房情况满意程度为 D A很不满意 B不满意 C一般 D还行 E很满意三、要求:请按照以上问卷设置变量属性并录入这份问卷。需要学生重点掌握如下知识点:1认识数据的类型2常量与变量3定义一个变量4学会数据的输入5数据的输入方法6

5、输入带有值标签的数据四、实验具体内容或步骤:(一)启动可以在Windows的“开始”菜单的“程序”菜单里找到“SPSS for Windows”,在它的右侧出现带有图标的SPSS菜单。单击“SPSS 12.0 windows”即可进入SPSS的数据窗口,同时出现文件选择对话框,如图1所示。图1文件选择对话框选择Cancel直接进入数据编辑窗口SPSS Data Editor,见图2:图2变量设置窗口(二)变量定义数据编辑窗口SPSS Data Editor,有两个页签,即Data View和Variable View, 输入数据以前首先要定义变量,定义变量首先要定义变量名,变量类型,变量长度,

6、变量标签,变量格式等。点击Variable View进行变量属性设置,定义变量的步骤如下: 1、定义变量名(Name)。将光标移至Name列对应的第一行,在光标格内输入变量名。系统默认的变量名的长度是8个字符,如输入汉字是4个汉字,超过的部分会被自动去掉。系统默认的变量名为Var00001、Var00002、Var00003等等以此类推。如果不定义变量名,在数据编辑窗口(Data view)中直接输入数据,系统会自动生成上述变量名。如要自定义变量名,可删去上述变量名,另行输入。2、定义变量类型(Type)。系统默认的变量类型是数值型变量(Numeric)。如要确定其它类型的变量可自己设定。方法

7、是:将光标移至Type列下面的相应的单元格上,用鼠标单击右侧的 会出现如图3所示的对话框。在对话框中选择需要的变量类型,然后单击“OK”按钮予以确认。图3变量类型设置对话框3、定义变量宽度(Width)和小数点位数(Decimals)。在Width列下面显示的是系统默认的变量值的宽度。在Decimals列的下面显示的是系统默认的小数点数。如要自己定义变量宽度和小数点位数,可将光标移至相应位置后,在单元格的右侧出现增加和减少键。向上的箭头是增加,向下的箭头是减少。通过单击增加和减少键来改变变量宽度和小数点位数。也可以直接输入小数点位数。4、定义变量标签(Label)和变量值标签(Values)。

8、(1)定义变量标签。因为变量名不宜使用过多的字符,当变量名包含的内容比较复杂,需要对变量名进行进一步的解释说明时可以使用变量名标签。对上述几个变量名标签的输入结果如图4所示。对变量名的标签可以进行修改。修改变量名标签很容易,只要在Label下的矩形框中删除原标签,重新输入即可。图4变量名标签(2)定义变量值标签。对于定类和定序变量,变量的取值是可列有限多个,取值是以数字或字符形式出现的,每个数字或字符所代表的实际意义可以用值标签予以说明。方法是: 打开定义变量值标签对话框。通过单击要说明的变量名与Values列相交的单元格,将光标移至该格。然后单击按钮,出现定义值标签对话框,如图5所示。图5定

9、义值标签对话框输入变量值标签。在上面Value后面的窗口中输入变量值,在下面的Value后面的窗口中输入变量值的标签,此时Add按钮被激活。然后单击Add按钮,输入的变量值和变量值的标签将成对的显示在下面的窗口中。如图6所示。以此类推输入完全部的标签后单击“OK”按钮。输入的标签的部分内容将显示在Values列下相应的格内。图6定义值标签对话框修改变量值的标签:修改值标签时,须先进入定义值标签对话框。在最下面的窗口中选择要修改的值和标签,同时激活Remove按钮。可以单击“Remove”按钮,即删除原来的值标签。可另行输入新的值标签,也可以在上面的两个窗口中改变变量值和标签,同时激活Chang

10、e按钮。单击Change按钮,完成修改。5、 定义缺失值(Missing):对于一个变量来说,有些取值是合理的,有些取值是不合理的。这些不合理的取值可能是由于问卷填写错误或数据输入错误造成的。这些不合理的取值一旦进入分析中,就会造成统计结果的偏差。这些不合理的取值可以通过定义缺失值的方法来消除。定义缺失值的方法如下: (1)打开定义缺失值对话框。在Variable View窗口中,将光标移至Missing列下与要说明的变量名相对应的单元格上。然后单击按钮,出现定义缺失值对话框,如图7所示。图7定义缺失值对话框(2)定义缺失值内容。在定义缺失值对话框中有三个选项。 No Missing Valu

11、es是没有缺失值。这是系统默认状态。 Discrete missing values是定义离散缺失值。选择该选项后,激活下面三个窗口。可以选择三个缺失值分别输入到三个窗口中,缺失值的数量也可以少于三个。系统在进行统计分析时遇到这三个值时将作为缺失值来处理。例如对于性别变量正常值为1和2,但在录入时,0、3、是容易被录入的错误值。将其定义为缺失值后,系统将认为它们是非法值,在统计时会被剔除。Range of missing values是定义缺失值范围。如果变量取值是连续的,则非法的取值区间可以被定义为缺失值范围。选择该选项后,激活下面三个窗口。将缺失值范围的最大值输入到High后面的窗口中。将

12、缺失值范围的最小值输入到Low后面的窗口中。这样就定义缺失值区间。此外还可以定义一个不包括在该区间内的缺失值。6、定义变量的显示格式变量的显示格式包括两个内容,即变量的显示宽度和对齐方式。(1)Column是显示变量的宽度。该项的系统默认值是8,如要改变的话可以选择变量值的宽度和变量名的宽度中较大的一个。(2)Align是定义对齐方式。有Left(左对齐)、Right(右对齐)、和Center(居中)可供选择。可以通过单击该单元个右侧的箭头按钮进行选择。(三)数据的输入定义了变量以后就可以输入数据了,可按以下几种方法输入。1、按单元格输入将光标移至相应的单元格中,单击鼠标左键,被定位的单元格边

13、框加黑,显示可以输入。2、按变量输入将光标移至该变量的第一个格,输入数据后击Enter键使光标依次向下移动。3、按个案输入(Case)将光标移至该个案最左侧格中,输入数据后击Tab键或右移建依次向右移动。注:输入带有值标签的数据如果对离散变量的值定义了标签,则输入变量值时既可以按数据输入,也可以按标签输入。如果在View下拉菜单中,Variable Labels项的前面有,说明数据文件处于显示标签的状态下。如果Variable Labels项的前面没有,说明数据文件处于显示数据状态。可以通过单击Variable Labels项来确定是以数据方式还是以标签方式来显示变量内容(1)按数据输入。在显

14、示数据的状态下,只能通过键盘来输入数据或字符。如果忘记了变量值所代表的意义,可以察看变量信息。方法是:在Utilities下拉菜单中选择Variables,打开对话框,如图8所示。图8察看变量信息对话框对话框的左半部分是变量列表,右半部分是变量信息显示区。在左侧的列表栏中选定变量后,右侧的Variable Information(变量信息)窗口可显示出指定变量的属性、变量名标签、变量值标签等。(2)按变量值标签输入。在显示标签的状态下,可以通过单元格的下拉菜单按钮拉出变量值标签的选项。如图9所示。可以通过选择变量值标签来进行录入。图9值标签下拉菜单(四)退出完成SPSS的统计分析之后,选择“F

15、iles”菜单的“Exit”项,或是单击屏幕左上角的按钮,回答系统提出的是否存储原始数据或计算结果之后即可退回到Windows状态下。实验二:数据整理一、实验学时:1学时二、内容:个案的排序、数据文件的合并三、要求:掌握数据的排序、数据文件的合并、数据的分类汇总;了解其他数据整理功能四、实验具体内容或步骤:(一)个案的排序虽然系统已经按录入的先后将所有的Cases排队了。但是在进行数据处理时,有时需要按某个变量值重新排序,排序的功能可以通过下述过程来实现:1打开待分析某一数据文件:桌面/SPSS实验/数据加工(职工数据)2打开个案排序对话框执行下述操作:DataSort Cases打开对话框,

16、如图10 图10 个案排序对话框3选择排队变量从左侧的源变量窗口中选择一个或多个变量,通过单击中间的箭头按钮,使之进入到Sort by窗口中,这些变量将作为排队依据的变量。如果选择的是多个变量,系统先按选择的第一个变量排队,第一个变量值相等时,按第二个变量排队,以此类推。4选择排队规则Sort Order是排队规则选项栏,栏中包括两个选项。(1)Ascending是按照升序的顺序排序。即第一个Case的变量值是最小的。这是系统默认选项。(2)Dscending是按照降序的顺序排序。即第一个Case的变量值是最大的。上述操作完成以后,单击“OK”按钮,提交运行。可以在数据编辑窗口看到重新排队的数

17、据文件。(二) 合并文件合并文件的功能是将一个外部文件与当前文件合并成一个新的数据文件。合并时既可以增加个案,也可以增加变量。执行下述操作: data Merge files(合并文件)拉出三级菜单,如下图11所示。 图11可以看到三级菜单中有两个命令Add Cases(增加个案)和Add Variable(增加变量)。即文件的合并有两种方法。一种是将两个文件中的个案和并在一起,另一种是将两个文件中的变量和并在一起。1、增加个案(Add Cases)增加个案是指将外部数据文件中,与现在的工作变量具有相同变量名的个案追加到现在的工作变量中。也称纵向合并。(1)打开待分析的数据文件:桌面/SPSS

18、实验/数据加工(职工数据)(2)打开合并个案对话框在当前工作文件的数据窗口下执行下述操作:dataMerge files Add Cases打开读取文件(read File)对话框,如下图12所示。图12(3)选择要合并的外部文件。从read File的文件列表窗口中选择要合并的外部文件的文件名,单击“打开”按钮,打开Add cases from对话框,如图13所示。图13Unpaired variable是不匹配变量窗口。该窗口中的变量是两个文件中变量名不相同的变量或变量名虽相同而变量定义不同的变量。执行合并的命令后,这些变量在新的数据文件中将消失。在该窗口的下面有两项说明:*=Workin

19、g Data File:星号表示工作数据文件。+=后面标出的是外部文件。Variables in new working data File是新的工作变量窗口。执行合并命令后,在该窗口中的所有变量都在新的数据文件中存在。Indicate case source as variable是指明Case来源的选项。如果选择此项,执行和并命令后,系统将生成一个新的数据文件,并在这个数据文件最右侧生成一个表示个案来源的新变量。系统默认的变量名是Source01。也可以输入任意变量名作为表示个案来源的变量。系统默认的该变量的取值为0和1。数值0表示该个案来源于原工作数据文件,数值1表示该个案来源于外部数据

20、文件。(4)单击“OK”后,执行合并命令,生成新的数据文件。2、增加变量(Add Variable)增加变量是将外部数据文件中的变量增加到当前的工作文件中。也称横向合并。合并的方法有两种。一种是直接合并,另一种是按关键变量合并。(1)直接合并打开读取文件对话框。在当前工作文件的数据窗口下执行下述操作:date Merge files Add Variable打开read File(读取文件)对话框,如图14图14选择要合并的外部文件。在read File对话框中的文件名列表窗口中选择要合并的外部数据文件的文件名。单击“打开”按钮,打开增加变量(ADD Variables from)对话框,如图

21、15图15Excluded Variables是拒绝变量窗口。在将要和并的外部数据文件中,如果存在与当前工作文件的变量名同名的变量,这部分变量被拒绝加到合并后的新的数据文件中去。该窗口中所显示的即是这部分变量。New working data File是新的工作数据文件窗口。该窗口中包括了原工作数据文件中的全部变量及和并进来的外部数据文件中与原工作数据文件不同名的变量。该窗口中的所有变量将存在于新生成的数据文件中。*=Working Data File:星号表示工作数据文件+:加号表示外部文件。单击“OK”,执行合并命令,系统将生成新的数据文件。(2)按关键变量合并的方法用上述方法可以对任意两

22、个数据文件进行合并。但如果合并进来的变量的不属于原文件中的个案时,这种合并便毫无意义。为使合并进来的变量确属于原来文件中的个案,可以采用按关键变量合并的方法。按这种方法合并时,要求两个文件至少有一个共同的关键变量。关键变量是具有相同变量名的变量。按关键变量合并的过程如下。打开读取文件对话框。在当前工作文件的数据窗口下执行下述操作:data Merge files Add Variable打开read File(读取文件)对话框,如图14所示。选择要合并的外部文件。在read File对话框中的文件名列表窗口中选择要和并的外部数据文件的文件名。单击“打开”按钮,打开增加变量对话框,如图15所示。

23、确定关键变量。Key Variables是关键变量窗口。选择在两个文件中具有相同变量名的变量作为关键变量。方法是,从图15中的Excluded Variables窗口中选择一个关键变量,使之进入到Key Variables窗口中。对两个文件按关键变量的升序进行排序。按关键变量合并数据文件时,系统要求对两个数据文件按关键变量的升序来排序。如果没有排序就直接合并,系统会给出提示。确定个案的匹配方法。Match cases on key variables in sorted files是按排序的关键变量匹配个案的选项。选中Match cases on key variables in sorted

24、 files选项后,会激活下面的三个选项。Both files provide case是由外部文件和当前文件两者提供个案的选项。如选择此项可以激活Indicate case source as variable(生成一个表明个案来源的变量)选项。选择此项后系统将生成一个变量名为Source01的新变量。其值为0表示个案来自当前数据文件,为1表示个案来自外部数据文件。External file is keyed table是以外部文件为关键表的选项。选择该选项,则保持当前数据中的个案数不变,外部文件匹配当前数据文件的关键变量值。如匹配成功,外部文件的新变量加入到当前数据文件中。匹配不成功则不加

25、入。Working Data File is keyed table是以当前数据文件为关键表的选项。保持外部数据文件中的个案数不变,当前数据文件匹配外部文件的关键变量值。如匹配成功,外部文件中的变量加入到当前数据文件的变量中。匹配不成功则舍去当前数据文件中的个案。上述选项作完以后,单击OK按钮提交运行。系统将生成一个变量合并后的新的数据文件。实验三:描述统计分析一、实验学时:1学时二、内容:描述性分析的操作、统计作图;三、要求:1学会应用两种以上的方法完成描述统计学所学的统计量的计算程序;如列出数据的频数分布表;计算算术平均数、中位数、众数;计算全距、四分位差、标准差、方差等。2能够完成统计图

26、的绘制(主要包括直方图、曲线图、饼形图、茎叶图);3能够撰写出规范的描述统计分析报告。四、实验具体内容或步骤:(一)频数分析下面给出的一个例题是来自SPSS软件自带的数据文件“Employee.data”,该文件包含某公司员工的工资、工龄、职业等变量,我们将利用此例题给出相关的描述统计说明,本例中,我们将以员工的当前工资为例,计算该公司员工当前工资的一些描述统计量,如均值、频数、方差等描述统计量的计算。计算各项描述统计量值的程序使用步骤如下:1、用SPSS打开已知的数据文件选择菜单“FileOpenData”,在对话框中找到需要分析的数据文件“SPSS/Employeedata”,然后选择“打

27、开”。打开的数据文件显示如下:2、计算所要求的描述统计量值及频数分布打开文件之后,选择菜单“AnalyzeDescriptive StatisticsFrequencies”。见下图。出现如下窗口之后,按后面的说明进行选项。3、确定所要分析的变量本例中假设要分析的变量是雇员的当前工资(Current Salary)。此时,要在“Frequencies对话框”中选中左侧列表框中的“Current SalarySalary”,之后点击列表框中间的箭头按钮,将变量Current Salary加入到右侧Variable(s)列表框中。然后,选择位于小窗口下端的“Display frequency ta

28、bles复选框”,以确定要输出频数分布表。4、选择所要计算的统计量在变量选择确定之后,在同一窗口上,点击“Statistics”按钮,打开统计量对话框,如下图所示,选择统计输出选项。(1)Percentile Values栏Quartiles:显示25%,50%,75%的四分位数值在Cut points for _equal groups小框内,输入整数k时,表示将所选变量的数值从小到大划分为k等分,并将输出各等分点处的变量数值在Percentile(s)右边的小框内,键入0100间的一个数之后,单击Add按钮添加到下面的方框内,此操作过程可以重复。例如输入15,55,85时,输出结果将会显示

29、15%,55%,85%百分位处的变量值。单击Change和Remove按钮可以修改或删除框内的数值(2)Dispersion(离中趋势)栏各统计量符号表示如下:Std deviation标准差 ;Minimum最小值;Variance方差 ;Maximum最大值;Range极差(3)Central Tendency(集中趋势)栏各统计量符号表示如下:Mean均值(算术平均数);Mode众数;Median中位数;Sum总和(4)Distribution(分布特征)栏各统计量符号表示如下:Skewness偏度;Kurtosis峰度5、结果输出与分析点击Frequencies对话框中的“OK”按钮,

30、即得到下面的结果。(1) Statistics(统计量)汇总表从Statistics表中可以清楚的看到当前薪水(Current Salary)的各项描述统计量的数值,这些数值是按我们上一步选定的计算统计量的要求而计算的。我们可以看出,要求计算的均值、众数、标准差、方差等都在其中,分别为$34419.6、$30750、$784.311、$2.9E+08。(2) Frequencies(频数)分布表从Frequencies表中可以清楚的看到在不同薪酬档次上员工的人数、所占比例。例如,薪水为$15750的员工有1人,占所有员工的0.2%。本处,没有对结果进行详细说明,希望同学们要学会解释所计算的结果

31、。到此为止,有关描述统计量与频数分布的spss计算步骤演示完毕。(二)统计图的绘制SPSS绘图功能很强,能绘制许多统计图形,这些图形既可以在统计分析过程中产生,也可以直接由Graphs图形菜单中所包含的一系列选项来实现。下面采用的数据文件同前例题,它是来自SPSS软件自带的数据文件“Employee.data”,该文件包含某公司员工的工资、工龄、职业等变量,我们利用该数据文件学习统计图的绘制。1、用SPSS打开已有的数据文件选择菜单“FileOpenData”,在对话框中找到需要分析的数据文件“SPSS/Employee data”,并“打开”。2、绘制条形图(Bar Charts)作图要求:

32、以该数据为例,先按员工教育水平分类(教育水平是按接受教育的年限为主的),然后在分好的类别中,再按员工职业类别分类(经理、保管员、服务员),最后计算各种类别人员的平均工资水平并绘制条形图。作图步骤如下:(1) 打开文件并选择绘制条形图选项。选择菜单“GraphsBar”,打开Bar Charts(条形图)选择对话框,见下图。出现下图所示之后,选择合适的命令选项,各项命令选项说明如下:(2)命令选项的选择条形图形状的选择条形图图标说明 Simple:将各类别数值用平行且等宽的条形简单地并列在一起的图形。 Clustered:有两种以上分类的数据显示方式,首先将数据分为第一类,然后各类数据再进一步细

33、分为第二类,并用两个以上的条形图并列来分别表示。 Stacked(分段条形图):有两种以上分类的数据显示方式,首先将数据分为第一类,然后各类数据再进一步细分为第二类。作图时,以条形的全长代表分成的第一大类别,条形内部各段的长短代表第二类别的组成部分,各段之间是用不同的线条或颜色表示。计算数据统计量的方式选择Data in Chart AreSummaries for groups of cases:先对所有数据分类,然后对每类创建条形图Summaries of separate variables:对每个变量创建条形图Values of individual cases:对每个数据创建条形图(

34、3)条形图变量及参数选择在Bar Charts对话框中选定条形图类型后,单击Define按钮,打开条形图变量及参数选择对话框Category Axis:表示坐标轴上的分组变量(第一次分类的变量)。Define Clusters by:第二次分类的变量Bars Represent:确定条形图所显示的数值。有如下选项可供选择: N of cases:显示总的观测值数% of cases:分组个数所占的比例Cumulative n of cases:累计频数(按个数统计)Cumulative % of cases:累计频率(按比例统计)Other summary function:其他描述统计量(4

35、)条形图输出3、绘制饼形图(Pie Chars)作图说明,仍然利用上面的数据文件,想通过饼形图(Pie Chars)来了解该公司各员工类别在公司总人数中所占的比例,员工类别构成比例。作图步骤如下:(1)打开已有数据文件并选择绘制饼形图命令选项选择菜单“GraphsPie”,打开Pie Charts选择对话框。见下图,(2)命令选项的选择Data in Chart Are(图中数据的描述)Summaries for groups of cases:根据分组变量先对所有个案进行分组,然后对分组个案创建条形图Summaries of separate variables:对每个变量创建条形图Valu

36、es of individual cases:对每个个案创建条形图(3)饼形图变量及参数选择Slices Represent:确定扇形片的代表含义。有如下选项: N of cases:总观测值 % of cases:分组个数所占的比例 Cumulative n of cases:累计频数 Cumulative % of cases:累计频率Other summary function:其他统计量Define Slices by:确定扇形片代表的分类变量(4)输出饼形图(略)实验四:相关分析一、实验学时:1学时二、内容:例题:道琼斯工业指数(DJIA)和标准普尔500种股票指数(S&P),都是用

37、来衡量股票市场变动情况的。DJIA是基于30个大公司的股价变动,而S&P是基于500种股票股价的变动。有人说后者衡量股市的变动情况更合适,因为它包含的股票数量多。下面给出两者的数据表化,计算它们的相关系数。三、要求:掌握相关分析的具体操作步骤四、实验具体内容或步骤:(一)打开数据打开:桌面/ SPSS实验/股票指数.sav (二)散点图的绘制在SPSS Data Editor窗口,打开Graphs下拉菜单,点击Scatter,并按下顺序依次操作后,得到散点图。 (三)计算简单相关系数1、打开相关分析命令选择菜单“AnalyzeCorrelateBivariate”,打开Bivariate Co

38、rrelation对话框。2、变量选择从源变量框中将djia和sp移入Variables框中。在Correlation Coefficients框中选择相关系数的类型,共有3种:Pearson简单相关系数、Kendalls tua-b和Spearman等级相关系数,本例选用Pearson系数。在Test of Significance框中可选择相关系数的单侧(One-tailed)或双侧(Two-tailed)检验,本例选择双侧检验。本例中还选中了Flag significations correlations选项,它表示相关分析结果中将不显示统计检验的相伴概率,而以星号(*)表示。一个星号表

39、示当用户指定的显著性水平为0.05时,统计检验的相伴概率值小于等于0.05,即总体无显著线性相关的可能性小于等于0.05;两个星号表示当用户指定的显著性水平为0.01时,统计检验的相伴概率值小于等于0.01,即总体无显著线性相关的可能性小于等于0.01。显然,两个星号比一个星号的检验更准确。3、结果输出及相关矩阵分析单击“OK”按钮,输出结果如下图所示。(1) 表下对表中双星号标记的相关系数作出注释,即在显著性水平在0.01下,认为标记的相关系数是显著的。(2) 表中显示djia和sp的相关系数为0.995,表明这两个指数之间具有非常密切的关系。实验五:回归分析一、实验学时:1学时二、内容:线

40、性回归的操作步骤三、要求:1. 学会在SPSS上实现一元及多元回归模型的计算与检验;2学会回归模型的散点图与样本方程图形;3学会对所计算结果进行统计分析说明。四、实验具体内容或步骤:(一)导入数据打开:桌面/ SPSS实验/股票定价.sav (二)执行回归分析,具体如下:1、打开回归模型程序选择菜单“AnalyzeRegressionLinear”,打开Linear Regression对话框。2、变量选择(1)从源变量清单中选择数值型变量“期望价格”作为因变量移入Dependent框中。(2)选择“销售数量”作为自变量移入Independent(s)框中。(3)在Method框中选择Ente

41、r选项,表示所选自变量全部进入回归模型。3、结果输出及分析单击“OK”按钮,输出结果如下图所示。(1)模型概述(Model Summary)表表中显示,相关系数R=0.862,判定系数R2 =0.744,调整后的判定系数R2 =0.712,估计标准误为1.42。由此说明“期望价格”与“销售数量”有比较显著的线性相关关系。(2)方差分析(ANOVA)表Sum of Squares,表示项目平方和,如表所示,Regression:回归平方和为46.784, Residual:残差平方和为16.116,Total:总平方和为62.900;df,表示自由度,分别为1、8、9;Mean Square,表

42、示均方和,分别为46.784和2.015;F,表示统计量值,为23.233;Sig.,表示F分布的P-值,Sig.=0.0010.05,因此拒绝原假设,说明回归方程获得通过。(3)模型系数(Coefficients)表表中显示回归模型中的回归系数:Constant(常数项)为9.265,自变量系数为0.711,可知回归方程为:期望价格=9.265+0.711销售数量回归系数的显著性水平为0.000和0.001,表明两变量分别是统计显著的,回归变量引入是有效的。(4)残差统计(Residuals Statistics)表表中依次列出预测值、非标准化残差、标准预测值、标准化残差。横行依次列出上述各

43、值的最小值、最大值、均值、标准差及参与计算的观测量数目N。 实验六 聚类分析一、实验学时:1学时二、内容:聚类分析的操作三、要求:1.通过上机操作使学生掌握系统聚类分析方法在SPSS软件中的实现,熟悉系统聚类的用途和操作方法,了解各种距离,能按要求将样本进行分类;2.要求学生重点掌握该方法的用途,能正确解释软件处理的结果,尤其是冰柱图和树形图结果的解释;3要求学生阅读一定数量的文献资料,掌握聚类分析方法在写作中的应用四、实验具体内容或步骤SPSS软件中聚类分析的过程有三个,系统聚类、K均值聚类和两步聚类。聚类分析在SPSS中的实现较为简单,有现成的窗口菜单操作,这里以系统聚类为例。(一)导入数

44、据打开:桌面/SPSS实验/1990年人口文化程度.Sav(二)执行系统聚类分析,具体如下:1、打开聚类分析模型程序选择菜单“AnalyzeClassifyHierarchical Cluster”,打开Hierarchical Cluster对话框。 2、变量选择(1)指定参与聚类的变量:将选定变量放到“Variables”下的矩形框中(2)指定标识变量“地区”及聚类对象:Case(样品)(3) 在method对话框中指定聚类方法,相似测度的方法和标准化数据的方法。(4)在Stat对话框中选择要输出的统计量;在plot对话框中选择输出树状图或冰柱图;在save对话框中确定把聚类结果做为变量保

45、存在数据工作文件中。3、输出结果及分析(1)聚类过程表 反映每一阶段聚类的结果。第2列和第3列表示聚合的类。比如第一阶段时第11个样品(浙江)和第26个样品(陕西)聚为一类。(2)树状聚类图 从图中可以由分类个数得到分类情况。如果我们选择分类数为3,则从距离10的地方往下切,得到相应分类结果。第一类:北京、天津、山西、辽宁、吉林、黑龙江、上海;第二类:安徽、宁夏、青海、甘肃、云南、贵州;第三类:西藏;第四类:其他。 实验七 判别分析一、实验学时:1学时二、内容:判别分析的操作三、要求:1.通过上机操作使学生掌握判别分析方法在SPSS软件中的实现,了解判别方法的分类、适用条件和结果验证方法;2.

46、要求学生熟悉判别分析的用途和操作,重点掌握对软件处理结果的解释(未标准化典型判别函数、Bayes判别函数)和如何使用分析结果对新样品进行分类;3.要求学生阅读一定数量的文献资料,掌握判别分析方法在写作中的应用。四、实验具体内容与步骤(一)导入数据打开:桌面/SPSS实验/人文发展指数.Sav(二)执行判别分析,具体如下:1、打开判别分析模型程序选择菜单“AnalyzeClassifyDiscriminant”,打开Discriminant对话框。2、变量选择及定义(1)指定分组变量“类型”,定义全距,即分类的最大最小值。(2)指定参与判别的变量:“预期寿命,识字率,调整后GDP”(3)在Sta

47、t对话框中选择要输出的统计量 (4)在classify对话框中选择先验概率的计算,及display中要求显示内容等(5)在save对话框中选择要有关结果保存到数据工作文件中。3、输出结果及分析(1)判别函数的特征值、解释方差的比例和典型相关系数,指出只选取了一个判别函数就解释了全部的方差;并对判别函数的显著性进行检验,由wilklambda检验,认为判别函数在0.05的显著性水平下是显著的。(2)标准化的典型判别函数及结构矩阵(即判别载荷矩阵)a(3)非标准化的典型判别函数及各组的重心(4)fisher判别(实质上是bayes判别)的各组的先验概率及分类判别函数系数(5)样品类别判定、判别得分

48、及判别概率 实验八 主成分分析一、实验学时:1学时二、内容:主成分分析的操作三、要求:1、使学生掌握主成分分析方法在SPSS软件中的实现,熟悉主成分分析的用途、目的,掌握如何判断主成分分析的适用条件,能正确选择适当的主成分;2、要求学生能正确解释软件处理的分析结果;3、要求学生阅读一定数量的文献资料,掌握主成分分析方法在写作中的应用。四、实验具体内容与步骤(一)导入数据打开:桌面/SPSS实验/自治区基本发展情况.Sav(二)执行主成分分析,具体如下:1、打开主成分分析模型程序选择菜单“AnalyzeData ReductionFactor”,进入Factor Analysis对话框(在SPSS中主成分分析和因子分析均在Factor Analysis模块中完成)2、变量选择及定义(1)分析变量选入variable框,在 descriptives对话中选中球形检验,明确数据是否适宜主成分分析(2)进入extraction对话框,在display中选中scree plot复选框以输出碎石图帮助确定应保留主成分个数,继续,其他设置保持默认值不变,ok,得出输出结果3、输出结果及分析(1)KMO和bartlett检验P值为0.00小于显著性水平0.05,可以进行主成分分析(2)由碎石图和总方差分解表可知,保留三个主成分是合适的,这时

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论