数学建模常见SPSS_教程过程_第1页
数学建模常见SPSS_教程过程_第2页
数学建模常见SPSS_教程过程_第3页
数学建模常见SPSS_教程过程_第4页
数学建模常见SPSS_教程过程_第5页
已阅读5页,还剩218页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、12第一节第一节 SPSSSPSS简介简介nSPSSSPSS的含义的含义nSPSS for WINDOWSSPSS for WINDOWS的特点的特点nSPSS for WINDOWSSPSS for WINDOWS的启动与退出的启动与退出nSPSS for WINDOWSSPSS for WINDOWS系统运行方式系统运行方式nSPSS for WINDOWSSPSS for WINDOWS窗口类型窗口类型nSPSS for WINDOWSSPSS for WINDOWS系统参数设置系统参数设置3vSPSSSPSS是软件英文名称的首字母缩写。原意为是软件英文名称的首字母缩写。原意为Stati

2、stical Package for the Social SciencesStatistical Package for the Social Sciences,即即“社会科学统计软件包社会科学统计软件包”。SPSSSPSS公司于公司于20002000年正年正式将英文全称更改为式将英文全称更改为Statistical Product and Statistical Product and Service SolutionsService Solutions,意为意为“统计产品与服务解决方统计产品与服务解决方案案”。v我们现在讲授的主要我们现在讲授的主要是是SPSS for Windows 1

3、1.0SPSS for Windows 11.0版。版。4n操作界面极为友好,易于学习,易于使用,是非专业统计操作界面极为友好,易于学习,易于使用,是非专业统计人员的首选统计软件。人员的首选统计软件。n无需花费大量时间记忆大量命令、过程、选择项等。无需花费大量时间记忆大量命令、过程、选择项等。n只要粗通统计分析原理,就能得到统计分析的结果。只要粗通统计分析原理,就能得到统计分析的结果。n可以根据计算机的设备来选择安装,灵活方便。可以根据计算机的设备来选择安装,灵活方便。n能非常方便地与其他软件的数据进行转换。能非常方便地与其他软件的数据进行转换。n分析方法丰富,图表功能强大,输出结果美观漂亮。

4、分析方法丰富,图表功能强大,输出结果美观漂亮。5nSPSSSPSS的启动的启动n使用开始菜单启动使用开始菜单启动SPSSSPSSn双击双击SPSSSPSS图标启动图标启动SPSSSPSSnSPSSSPSS的退出的退出n使用使用FILEFILE菜单中的菜单中的“EXIT SPSS”EXIT SPSS”菜菜单项退出单项退出SPSSSPSSn单击数据编辑窗右上角单击数据编辑窗右上角“x”x”的退出的退出SPSSSPSS6进入SPSS后显示的文件对话框在数据窗口输在数据窗口输入数据选项入数据选项运行一个运行一个已存在的已存在的文件选项文件选项打开一个已打开一个已存在的数据存在的数据源程序源程序使用数据

5、库使用数据库向导来创造向导来创造一个新的文一个新的文件选项件选项打开一个其它打开一个其它类型的文件类型的文件以浏览运行以浏览运行操作指导操作指导7Spss11.0的界面数据窗口变量定义窗口8n文件(文件(FileFile);); 编辑(编辑(EditEdit) ;n视图(视图(ViewView) ; 数据(数据(DataData) ;n转换(转换(TransformTransform) ;统计分析(统计分析(Analyze Analyze ) ;n作图(作图(GraphsGraphs) ;工具(工具(UtilitiesUtilities) ;n 窗口转换(窗口转换(WindowsWindows

6、);); 帮助(帮助(HelpHelp) 9nSPSSSPSS系统运行的三种方式:系统运行的三种方式:n完全窗口菜单运行管理方式完全窗口菜单运行管理方式n程序运行管理方式程序运行管理方式n混合运行管理方式混合运行管理方式10n完全窗口菜单运行管理方式主要在数据编辑窗口完全窗口菜单运行管理方式主要在数据编辑窗口和输出观察窗口中进行操作。运行方式操作简便、和输出观察窗口中进行操作。运行方式操作简便、直观,特别适合于初学者,也是本门课程讲授的直观,特别适合于初学者,也是本门课程讲授的主要方式。主要方式。n缺点:对话框中包括的是基本参数和基本统计量缺点:对话框中包括的是基本参数和基本统计量的选择项,对

7、于某些专业人员来说,可能不能充的选择项,对于某些专业人员来说,可能不能充分满足需要。分满足需要。11n程序运行管理方式是在语句窗口(程序运行管理方式是在语句窗口(SyntaxSyntax)中)中直接运行编写好的程序的一种方式。直接运行编写好的程序的一种方式。n分析结果仍然是显示在输出观察窗中。分析结果仍然是显示在输出观察窗中。n主要用于习惯使用主要用于习惯使用 程序的用户(程序的用户(SPSSSPSS最初是最初是使用程序来进行统计分析的)。使用程序来进行统计分析的)。12n混合运行方式是以上两种方法的结合方式。混合运行方式是以上两种方法的结合方式。n操作程序:首先在数据窗中输入数据或利用主菜单

8、操作程序:首先在数据窗中输入数据或利用主菜单中的(中的(FileFile)菜单项打开已经存在的数据文件,然)菜单项打开已经存在的数据文件,然后利用对话框选择分析过程和分析参数。选择后不后利用对话框选择分析过程和分析参数。选择后不马上执行,而是用马上执行,而是用PastePaste将选择的过程与参数变换将选择的过程与参数变换成相应的命令语句。在语句窗口中可以进行修改,成相应的命令语句。在语句窗口中可以进行修改,然后再将程序提交系统执行。然后再将程序提交系统执行。13n数据编辑窗口数据编辑窗口(Newdata)n输出窗口输出窗口(Output1)n语句窗口语句窗口(Syntax)n统计图表编辑窗口

9、统计图表编辑窗口(Chart)n帮助窗口帮助窗口(Help)14数据编辑窗口是一个可扩展的二维表格,用户可在该窗口中建立或编辑数据文件。其主要功能有:定义变量属性;录入数据;修改变量属性;移动记录指针;插入记录;插入新的变量等。在一个SPSS运行期间不能同时打开两个以上的数据编辑窗口。15输出窗口是一个文本窗口,其功能是用来显示系统处理的输出结果或系统运行过程中所发生的错误信息。在一个SPSS运行期间可以同时打开两个或两个以上的输出窗口。其中只有一个为主输出窗口。16语句窗口可以用来粘贴SPSS过程的命令语句以及各选项对应的子命令语句,也可以用来手工编辑命令语句。然后将这些命令提交给系统进行运

10、行。在一个SPSS运行期间可以同时打开两个或两个以上的语句窗口。其中只有一个为主语句窗口。171819n系统初始状态和系统默认值的设置是通过options选择对话框完成的。具体操作是通过打开Edit菜单中的options打开系统参数设置对话框。n参数与状态的设置生效的时间不同,有的在确认后立即生效,有的要在下一次启动spss系统时才生效。202122n通用参数的设置 (General)n观察窗口参数设置 (Viewer)n草稿窗口参数设置 (Draft Viewer)n标签输出设置 (Output Labels)n统计图形参数设置 (Charts)n交互图形窗口参数设置 (Interactiv

11、e)n要点表参数设置 (Pivot Tables)n数据功能卡设置 (Data)n数值型变量自定义格式设置 (Currency) n稿本窗口参数设置 (Scripts)23n设置日志文件n设置内存工作区的大小n启动启动spss spss 时语句窗口状态的设置时语句窗口状态的设置n测度系统参数设置n设置显示变量表顺序的方式n文件表中文件数的设置n启动时输出窗口类型的设置启动时输出窗口类型的设置n输出通告设置n临时文件路径设置24日志文件:日志文件:在日志文件中记录在日志文件中记录 系统系统 执行语句执行语句将每次运行的语句将每次运行的语句 记录记录 在前次运行语在前次运行语 句之后,句之后, 并

12、存入日并存入日 志文件志文件将每次存入日志文将每次存入日志文 件时覆盖前次所存件时覆盖前次所存设定内存设定内存测度单位选择测度单位选择语句窗口状态设定语句窗口状态设定声音设置:无声;默认声;自选声音文件启动时输出窗类型:启动时输出窗类型:产生交互式要点图和统计图产生交互式要点图和统计图输出文本格式要点图和统计图输出文本格式要点图和统计图变量显示方式顺序变量显示方式顺序变量标签显示在前变量标签显示在前变量表中只显变量名变量表中只显变量名变量名按字母顺序变量名按字母顺序 按数据文件中变量类按数据文件中变量类 型顺序型顺序文件表中文件数设定文件表中文件数设定系统使用过的文件数系统使用过的文件数设定文

13、件暂存处设定文件暂存处输出声明设置输出声明设置产生新结果时屏幕显产生新结果时屏幕显 示导航器示导航器产生新结果时屏幕显产生新结果时屏幕显 示新输出信息示新输出信息25n主要项目:n初始输出状态设置初始输出状态设置n输出文本的字体、字号设置输出文本的字体、字号设置n文本输出页面设置文本输出页面设置n文本输出字型、字号设置与颜色文本输出字型、字号设置与颜色26初初始始输输入入状状态态设设置置文本标文本标题字体题字体和大小和大小选择选择文本输文本输出字型、出字型、字号、字号、颜色设颜色设置置文本输文本输出页面出页面设置设置27n主要项目:nDisplay Output Items显示输出项的设置。n

14、Page Breaks Between分页位置设置。n在Front栏中设置使用在新的输出中的字体。nTabular Output平面表格输出栏,控制将要点表转换成平面表,即文本输出。nText Output文本输出栏,控制文本输出页的尺寸。28日志中是否显日志中是否显示命令示命令显示警告显示警告显示说明信息显示说明信息显示标题显示标题显示统计图形显示统计图形显示文本输出显示文本输出显示运行日志显示运行日志显示表格输出显示表格输出分页设置分页设置在每个程序之间在每个程序之间分页分页在每个输出之间在每个输出之间插入一个分割符插入一个分割符字体设置字体设置列表输出列表输出指定列宽和列分割指定列宽和列

15、分割 符形式符形式使用空格为分割符使用空格为分割符. .重复占多个页面表的重复占多个页面表的 标题标题单元格周围显示格线单元格周围显示格线输出表时每栏均为输出表时每栏均为 最大列宽和标签长度最大列宽和标签长度在在charactercharacter栏内设定栏内设定 列宽和标签最大宽度列宽和标签最大宽度; ; 在在cellcell栏指定行分割栏指定行分割 符和列分割符符和列分割符. .标准页宽标准页宽, ,每行每行8080字符字符; 132; 132字符字符; ; 自定义字符数自定义字符数标准页长标准页长, ,每页每页5959行行; ; 尽可能的页长尽可能的页长; ; 自定义页长自定义页长29n

16、主要项目:n在Outline Labeling结果标签栏中,设置输出图形时是否使用标签。n在Pivot Table Labeling要点表格标签栏中,设置输出表格时是否使用标签。30 用于设定在输出图形时是否使用标签控制新的要点表中的变量名和描述性变量标签的输出。Labels:使用变量标签来标识每个变量。Names使用变量名来标识每个变量。Names and labels:使用 变量名和变量标签来标识每个变量。控制新的要点表中的变量名和描述性变量标签的输出。Labels使用变量标签值来标识每个变量。 Values使用变量值来标 识每个变量。LabelsandValues使用 变量值和变量标签值

17、来标识每个变量。要点表标签栏:用于设定在输出图形时是否使用标签控制在新的要点表中的变量名和描述性的变量标签值的输出。Labels:使用变量标签来标识每个变量。Names使用变量名来标识每个变量。Names and labels:使用 变量名和变量标签来标识每个变量。控制新的要点表中的数据值和描述性的变量标签值的输出。Labels使用变量标签值来标识每个变量。 Values使用变量值来标识每个变量。Labels and Values使用 变量值和变量标签值来标识每个变量。31n主要项目:n图形模板栏 Chart Templaten图形的宽与高比设置参数框 Chart Aspectn图形中文字字体

18、设置栏 Fontn图形填充和线条样式栏 Fill Patterns and Line Stylesn图形变框栏 Frame32 图形模板栏新的图形属性采用本对话框之中设置使用一个图形模板来确定图形属性图形宽高设置栏:可输入宽高比值框架栏为整个图形画一个框,包括标题和图例为输出的图形部分画出边框单元格栏在线上标志刻度在线上标志分类当前设置当前设置字体字体选择图形填充和线选择图形填充和线条样式条样式使用使用14种颜色调色种颜色调色板,后根据需要给颜板,后根据需要给颜色增加样式色增加样式使用样式来代替颜使用样式来代替颜色色33n主要项目:主要项目:nChartLook交互图形外观样式栏nData S

19、aved with Chart栏,控制与交互图形同时保存的信息。nPrint Resolution 栏,控制交互图形打印的精度。nMeasurement System栏,设置交互图形的度量系统。nReading Pre-8.0 Data Files 栏,读取8.0以前版本的数据文件选择项。34图形外观样式栏可单击Browse选择样式目录图形数据存储栏当生成图表的数据文件与图表分开时,控制信息与交互图形一起保存只保存综合数据打印精度栏测度单元栏读取8.0前版本的数据文件栏可对数值型变量描述最小值以便将数据分类或指明刻度。35n主要项目:nTable Look 表格外观样式栏,可选择新表格的表格样

20、式。nSet Table Look Directory 按钮允许改变系统默认的Table Look目录。nAdjust Column Width for 控制要点表列宽的自动调整栏。 nDefault Edit Mode 设置默认的编辑表格模式。36表格外观栏选择系统提供的表格输出时的外观样式调整要点表列宽栏列宽调整为标签列宽列宽调整为标签列宽和数据值列宽中较大的一个。默认编辑模式栏Edit all tables in viewer:控制在观察窗口中的要点表或一个单独窗口的激活Edit only small tables in viewer:在观察窗口仅能编辑小的要点表Edit small a

21、nd medium tables in viewer:在观察窗口仅能编辑小的或中等的要点表Edit all but very large in viewer:在观察窗口不能编辑非常大的要点表Open all tables in a separate windows :在一个单独窗口打开表样本栏预览Table Look中选定的样式37n主要项目:nTransformation and Merge Options 选择数据转换和合并栏.nDisplay Format for New Numeric Variables 新数值变量指定系统默认的显示宽度和小数位数。nSet Century Range

22、 for 2-Digit Years栏,对日期型数据中的年份指定用两位数字输入和显示。38设置两位年表示法变动范围自动选择自定义为新数值型变量指定格式栏宽度小数点数据转换与合并栏立刻执行要求的转换同时读取数据文件在遇到命令时才执行转换和合并39n主要项目:nCustom Output Formats用户定义输出格式栏nAll Values设置数值的首尾字符栏nNegative Value设置负数的首尾字符栏nDecimal Separator设置小数点符号栏40自定义输出格式设置首尾字符栏在此框输入一个字符,此字符将成为在所有值前都显示的前缀。在此框输入的值成为在所有值后都显示的后缀设置负数的

23、首尾字符栏在此框内输入在所有负值前都显示的前缀在此框内输入的值成为在所有负值后都显示的后缀输出样本栏显示变量格式的预览小数点分割符设置栏采用圆点作小数点采用逗号作小数点41n主要项目:nGlobal Procedures 全局过程栏nAutoscripts 自动稿本栏,自动稿本文件是稿本子程序的组合,在每次运行建立某一输出对象类型的过程时都要自动运行这些稿本子程序。nAutoscript subroutine status矩形框中包含当前所有自动稿本文件的所有子程序。42全局过程栏自动脚本栏 4344n1 1、进入、进入spssspss前的准备工作前的准备工作 资料的审查、数据编码、资料资料的

24、审查、数据编码、资料的登录、制定分析计划等等。的登录、制定分析计划等等。n2 2、SpssSpss运行的基本程序与使用方法运行的基本程序与使用方法 录入、定义、保存、分析录入、定义、保存、分析45数据资料的形式: 封闭性问卷资料与开放性问卷资料。 不同的资料形式均要求对资料进行审查,但在编码时有不同的要求。资料的资料的审查审查编码编码46n主要考察三个方面:n资料的完整性审查n资料的统一性审查n资料的合格性审查47n包括资料总体上的完整性和每份资料的包括资料总体上的完整性和每份资料的完整性。完整性。n资料总体的完整性主要考虑问卷发放的资料总体的完整性主要考虑问卷发放的数量、回收率等。数量、回收

25、率等。n每份资料的完整性主要看问卷的填答情每份资料的完整性主要看问卷的填答情况,是否是有效问卷。况,是否是有效问卷。48n1 1、检查所有问卷、报表填答的方法是否统、检查所有问卷、报表填答的方法是否统一。一。n2 2、检查统一指标的数值所使用的单位是否、检查统一指标的数值所使用的单位是否一致。一致。n3 3、审查指标的定义和分析的标准是否与自、审查指标的定义和分析的标准是否与自己的研究分类相一致。己的研究分类相一致。n4 4、审查指标统计的总体是否一致。、审查指标统计的总体是否一致。49n审查提供资料的人的身份是否符合规定审查提供资料的人的身份是否符合规定的调查对象的身份。的调查对象的身份。n

26、审查所提供的资料是否符合填答的要求。审查所提供的资料是否符合填答的要求。n审查所提供的审查所提供的资料是否正确资料是否正确。50n1 1、判断检验:依据已知情况来判断是、判断检验:依据已知情况来判断是否真实正确。否真实正确。n2 2、逻辑检验:从资料的逻辑关系来检、逻辑检验:从资料的逻辑关系来检验是否正确。验是否正确。n3 3、计算检验:通过各种数字的运算来、计算检验:通过各种数字的运算来检验是否正确。检验是否正确。51 根据一定的规则将研究资料转换为可进行统计分析的数码资料的过程。问题问题025:您认为打工的外地人对武汉市的:您认为打工的外地人对武汉市的社会秩序是否有影响?(单选)社会秩序是

27、否有影响?(单选) 1有很大影响 2有较大影响 3没有影响 4不好说 4编码答案521、确定变量、确定变量 变量:变量:用来反映概念的量化形式。在统计中往往指最小的分析单位。编码就是对变量进行编码。变量由两个部分构成:变量名变量名和变量值变量值。要注意区分何为变量变量,何为变量值变量值。在调查问卷中还要注意区分问题问题和变量变量。53问题问题009:您有几个儿子?几个女儿?:您有几个儿子?几个女儿? 1儿子_人 2女儿_人 23问题变量1变量2变量1的值变量2的值54n封闭性问卷的处理方法n单项选择题n多项选择题n多项排序选择题n固定选择项n不固定选择项n开放性问卷的处理方法55问问题题 00

28、1:您您的的性性别别: 1男 2女 问问题题 002:您您目目前前的的婚婚姻姻状状况况(单单选选) : 1未婚 2已婚 3离婚后未再婚 4离婚后再婚 5丧偶后未再婚 6丧偶后再婚 7未婚同居 2256问问题题 011:您您家家中中是是否否有有下下列列物物品品: (可可多多选选) 1电电话话 2传传真真机机 3有有线线电电视视 4卫卫星星电电视视 5手手机机 6BP 机机 有6个选项,故应设6个变量,运用0-1编码方法编码,即:1,0,1,0,1,1。此外,多选还有另外一种编码方法,即直接编码输入法,编码为1,3,5,6,0,0。1 3 5 6573 1 6问题问题012012:您择业中考虑的主

29、要因素有(依据重要:您择业中考虑的主要因素有(依据重要性大小排列,限选三项)性大小排列,限选三项)1经济收入 2 专业对口 3发展前途 4 地理区位5个人爱好 6 风险大小7劳动强度 8 社会福利9社会地位 10其他 因为是依据重要性大小排列,限选三项,故因为是依据重要性大小排列,限选三项,故应设三个变量,编码依次为应设三个变量,编码依次为3,1,6。58择业中考虑的主要因素择业中考虑的主要因素(依据重要性先后排列依据重要性先后排列)1经济收入 2 专业对口 3发展前途 4 地理区位5个人爱好 6 风险大小7劳动强度 8 社会福利9其他3 1 6 4 7 8 5因为是依据重要性排列,不限制选项

30、,因为是依据重要性排列,不限制选项,故应设九个变量,编码依次为:故应设九个变量,编码依次为:3,1,6,4,7,8,5,0,0。59择业中考虑的主要因素择业中考虑的主要因素(多选)(多选)1经济收入 2 专业对口 3发展前途 4 地理区位5个人爱好 6 风险大小7劳动强度 8 社会福利9其他编码应为:1,0,1,1,1,0,1,1,0。或1,3,4,5,7,8,0,0,0。60n1、对回答进行分类。一般首先随机抽取一部分问卷,了解回答的情况,依据回答对问卷进行分类,主要考虑语气强弱、观点确定等方面。n2、建立回答类别与对应的数量关系,进行编码。61n在大型社会调查中通常要进行数据登录,现在一般

31、采用问卷页边编码方式,以避免转录中增加误差。n数据登录的主要作用:n输入更快捷、准确。n有利于多人分工合作、共同输入。n便于核查数据。62 外部式录入内部式录入采用DOS、WPS、CCED等软件,按ASCII码方式录入成文本文件(*.dat;*.txt)。这种录入方式的特点是,数据之间没有间隔,录完一个数码后自动后移,录入速度较快。缺点是容易错位。采用SPSS数据编辑器(SPSS Data Editor)录入。其优点是不容易错位,缺点是不能自动后移,录入速度慢,数据错误不容易修改。数据录入数据录入63录入数据定义数据整理数据统计数据查看结果64 概率事件概率事件(观测量观测量):在数据编辑器的

32、二维表中在数据编辑器的二维表中, 每列为一个变量每列为一个变量,每行记录每行记录 一次观测一次观测(Case)一次观一次观测的值测的值 输入数据输入数据数据编辑器数据编辑器录入数据录入数据65保存数据保存数据n单击保存类型列表框,可以看到SPSS所支持的各种数据类型,有DBF、FoxPro、EXCEL、ACCESS等,这里我们仍然将其存为SPSS自己的数据格式(*.sav文件)。在文件名框内键入变量名并回车,可以看到数据管理窗口左上角由Untitled变为了现在的新变量名。 66SPSSSPSS变量定义变量定义nSpss7.5、Spss8.0、Spss9.0的定义变量均通过Data菜单菜单中

33、Define Variable子菜单子菜单的对话框中完成。nSpss10.0中变量定义只需在Data和Variable中进行转换即可进行变量定义。nSpss10.0中的变量定义。67Spss11.5Spss11.5变量定义项目变量定义项目nSpss11.5中变量定义的一共有10个项目:变量名(name)、变量类型(变量类型(typetype)、变量长度(width)、小数位数(decimals)、变量标签(label)、变量值标签(values)、缺省值(missing)、变量显示宽度(columns)、变量对齐方式(align)、变量测量尺度(measure)。n注意区分变量的标签(Vari

34、able Labels)与变量值的标签(Value Labels)。68变量的类型表变量的类型表SPSS变量变量类型类型系统默认系统默认长度长度小数位数小数位数输入方式输入方式显示方式显示方式范例范例输入输入显示显示Numeric82标准格式或科学记标准格式或科学记数法数法标准格式数值变量原点表标准格式数值变量原点表示小数点的数值示小数点的数值38.4238.42Comma82带逗点的数值或科带逗点的数值或科学记数法学记数法原点做小数点,逗点做三原点做小数点,逗点做三位分割符的数值位分割符的数值1,343,438.11,343,438.1Dot82带圆点的数值或科带圆点的数值或科学记数法学记数

35、法逗点做小数点,原点做三逗点做小数点,原点做三位分割符的数值位分割符的数值34,3434E23.434,34Scietific notation82科学记数法科学记数法标准格式或标准格式或科学记数法科学记数法457.8E4457.8E4Date日期格式非常多日期格式非常多显示格式非常多显示格式非常多Dollar82可带可带$或不带或不带$输入输入或科学记数法或科学记数法有效数值前带有效数值前带$以逗点为分以逗点为分割符割符$12343$12343Custom CurrencyString8无无一串字符串一串字符串一串字符串一串字符串believebelieve 69变量标签变量标签(Varia

36、ble Labels):(Variable Labels): 为进一步描述变量所表示的意义,特别是当变量名不能充分描述变量所表述的意义时。变量值标签变量值标签 (Value Labels):(Value Labels):为进一步说明变量的可能取值,它可以定义,也可不定义。 如,变量取值为:grade1、 grade2、 grade3、 grade4,其表示年级,则变量标签为年级,而变量值标签对应变量取值为:本科一年级、本科二年级、本科三年级、本科四年级。70Spss11.5Spss11.5中变量定义的操作中变量定义的操作单击单击Variable View 进入;进入;单击,单击,定义定义变量变

37、量名名单击,定义单击,定义变量类型变量类型定义变量标签定义变量标签变量标变量标签值签值定义测度层次定义测度层次定义变定义变量宽度量宽度定义定义对齐对齐方式方式 定义变量类定义变量类型对话框型对话框 定义变量标签定义变量标签值对话框值对话框定义变量定义缺定义变量定义缺省值对话框省值对话框71 插入变量与删插入变量与删除变量除变量插入量与删除插入量与删除观测量观测量数据的剪数据的剪切、粘贴切、粘贴与复制与复制 1.插入变量插入变量在添加处单击Var,单击右鼠标键出现右侧对话框, 单击Insert Variables2.删除变量删除变量1.插入观测量插入观测量在添加处单击观测量,单击右鼠标键出现右侧

38、对话框, 单击Insert Case2.删除观测量删除观测量剪切剪切复制复制粘贴粘贴若想恢复,打开若想恢复,打开Edit-Undo72 1、寻找某个观察量:、寻找某个观察量:单击Data-Go to Case 打开对话框:输入要寻找观输入要寻找观测量序号测量序号2、在某个变量中寻找指定数据、在某个变量中寻找指定数据1)单击某变量如stock所在列的任意一单元格2)单击Edit-Find,打开对话框3)在Find中输入要找数据某变量 Find Data in Variable SALARY对话框对话框Go To Case对话框对话框数据的简单编辑数据的简单编辑7374n数据编辑器的功能数据编辑器

39、的功能n数据文件的整理数据文件的整理n数据文件的加权数据文件的加权n重编码重编码n数据的变换和计算数据的变换和计算n缺失值的处理缺失值的处理75数据编辑器数据编辑器图标菜单栏菜单栏标题栏输入输入数据数据栏栏数据显示区数据显示区: :变量名变量名观察序号观察序号数据编辑器的构成数据编辑器的构成76数据编辑器的功能主要是通过主菜单的数据编辑器的功能主要是通过主菜单的“Edit”和和“Data”两个菜单项来实现的。两个菜单项来实现的。其主要功能有:其主要功能有:1)变量和观测量的编辑功能)变量和观测量的编辑功能2)数据编辑功能)数据编辑功能77命令命令功能功能Undo删除刚输入的数据或者恢复刚修改的

40、数据Redo恢复刚撤消的操作Cut将选定数据剪切到剪贴板Copy将选定数据拷贝到剪贴板Paste将剪贴板的数据粘贴到指定位置Clear清除选定的变量和观测值Find查找数据78命令命令功能功能对变量操作的命令对变量操作的命令Define Variables定义与编辑变量属性定义与编辑变量属性Define Dates定义与编辑日期变量或日期时间定义与编辑日期变量或日期时间变量变量Templates定义与修改一个变量模板定义与修改一个变量模板Insert Variables插入变量插入变量对观测量操作的命令对观测量操作的命令Insert Case插入观测量插入观测量Go to Case定位到指定的

41、观测量定位到指定的观测量DataData菜单的各项命令菜单的各项命令79对文件操作的命令对文件操作的命令Sort Cases按选定的变量对观测量排序按选定的变量对观测量排序Transpose对数据文件的转置对数据文件的转置Merge Files合并数据文件合并数据文件Aggregate对数据进行分类与不分类的汇总对数据进行分类与不分类的汇总进行分析前的处理命令进行分析前的处理命令Split File折分数据文件折分数据文件Select Cases选择观测量选择观测量Weight Cases加权处理观测量加权处理观测量DataData菜单的各项命令菜单的各项命令80n主要内容:主要内容:n观测量

42、数据的排序观测量数据的排序n变量值排秩变量值排秩n拆分数据文件拆分数据文件n合并数据文件合并数据文件81n首先在数据窗中建立或读入一个数据文件。n按Data Sort Cases顺序逐一单击鼠标键,打开Sort Cases观测量排序对话框。n依据需要进行选择,然后单击OK按纽即可。82在左边的源变量框源变量框中选择排序变量进入Sort by框。如果选择2个以上的变量,观测量的排序结果与排序变量在Sort by框中的顺序有关。列于首位的为第一排序变量。在Sort Order 栏栏内选择排序方式升序与降序83n运用Transform 命令实现。求得的秩在数据窗中建立一个新变量来保存。n具体操作方法

43、:n按Transform Rank Cases顺序逐一单击鼠标键,打开Rank Cases对话框。n依据需要进行选择,然后单击OK按纽即可。新生成的秩变量的名称以原变量名称前加字母“R”的形式出现在数据文件中。8485n在Assign rank 1 to 栏中可选择秩的排列方式。n如选择一个或多个分组变量进入By栏,系统将按By变量分组排秩。n当所选择的变量具有相同值时称为Tie(结),其秩次的决定原则可以在Rank Cases:Ties对话框中指定。n在Rank Type中可以选择获得秩次的其他方法。nDisplay summary Tables 复选项为默认选择,表示要在输出结果窗中显示新

44、变量的名称、标签、秩类型等总结性信息。86n在进行数据处理时经常要对数据文件中的观测量进行分组分析,如分性别的平均分数。进行分析之前必须对 数据文件进行拆分。n拆分分件并不是将一个数据文件分为两个或几个独立的数据文件,而是在同一个数据文件中按某个条件分组。这种拆分在以后的运算中一直有效直到取消或更改拆分变量。87n读取一个数据文件。n按Data Split Files顺序逐一单击鼠标,打开Split Files对话框。n根据对数据的具体需要选择相应的选项。n按Ok完成。8889n合并数据文件是指将外部数据中的观测量或变量合并到当前的数据文件中去。n合并数据文件包括两种方式:n从外部数据文件增加

45、观测量到当前数据文件中纵向合并或称追加观测量。n从外部数据文件增加变量到当前数据文件中横向合并。90n首先打开一个数据文件。n按Data Merge Files Add Cases顺序逐一单击鼠标,打开:Read File对话框,依据需要选择文件,然后进入Add Cases From对话框,选择相应的选项或做适当的修改即可。91纵纵 向向 合合 并并92纵纵 向向 合合 并并93横横 向向 合合 并并n横向合并有两种方式:n从一个指定的外部数据文件中取得一个或几个变量的数据(包括变量名称)增加到 当前工作数据文件中,实际上相当于两个数据文件的横向合并。n按关键变量合并,即要求两个数据文件必须有

46、一个共同的关键变量,而且这两个文件中的关键变量还存在一定数量的相同值的观测量。94横向合并的具体操作横向合并的具体操作n首先打开一个数据文件。n按Data Merge Files Add Variables顺序逐一单击鼠标,打开Add Variables :Read File对话框,依据需要选择相应的选项或做适当的修改即可。95横向合并横向合并96三、三、 对观测量加权处理对观测量加权处理n在计算的过程中需要利用变量对数据进行加权处理时采用。n加权处理的具体方法:n按DataWeight Cases,打开Weight Cases对话框,依据需要进行适当的选择即可。97对观测量加权处理对观测量加

47、权处理98对观测量加权处理对观测量加权处理n在选择加权变量时应注意:n加权变量中含有零、负数或缺省值的观测量将被排除在分析之外。n分数值有效。n一旦对数据进行了加权处理,那么在以后的分析中加权处理一直有效,直到关闭加权处理过程或选择其他的加权变量进行加权处理。99四、重编码四、重编码重编码的步骤及两种方式重编码的步骤及两种方式:(1)Into Same Variables ;(2) Into Different Variables.100重编码的应用重编码的应用n高一层次的变量,转化为低一层次的变量时,高一层次的变量,转化为低一层次的变量时,常常需要重编码。常常需要重编码。n当采用量表来进行测

48、量,而量表中变量取值当采用量表来进行测量,而量表中变量取值有正反两种方向的设置,需要转化为同一方有正反两种方向的设置,需要转化为同一方向时,常常需要重编码。向时,常常需要重编码。101第一种方式重编码第一种方式重编码102If Case If Case 对话框对话框n用于设置变量重编码的条件103Old and New ValuesOld and New Values对话框对话框n设置旧变量转变为新变量的对应方式104第二种方式重编码第二种方式重编码n第二种重编码方式需要在Output Values中定义新变量的变量名与变量标签。n第二种重编码方式中 If 和 Old and New Valu

49、es按钮展开的对话框形式与结构、内容是一样的。105五、对数据进行变换和计算五、对数据进行变换和计算n利用菜单“Transform”下的“Compute”命令实现数据的变换和计算n利用菜单“Transform”下的“Compute”命令,可以完成以下工作:n1、计算数值或字符型变量的值n2、创建新的变量或取代已存在的变量,对于新的变量,依然可以定义n3、可以利用已建立的函数进行变量的计算和转换106创建新的变量对话框创建新的变量对话框107创建新的变量创建新的变量108六、缺失值的处理六、缺失值的处理nSPSS中缺失值默认为圆点“.”nDATA中设置了3种设置缺失值的方式nTRANSFORM下

50、设置了5中不同的替代缺失值的方法。n缺失值的处理方法109缺失值定义方法缺失值定义方法110111缺失值处理方法缺失值处理方法nExclude cases pariwise 成对删除含缺失值的个案nExclude cases listwise 删除所有含有缺失值的个案nReplace with mean 用均值代替缺失值nExclude cases analysis by analysis 统计检验时,删除含有缺失值的个案nReport values 报值1121131 1、SPSSSPSS数值分析过程数值分析过程2 2、SPSSSPSS图形分析过程图形分析过程1141、SPSS数值分析过程n

51、Descriptive Statistics nCompare means nGeneral linear model nCorrelatenRegressionnLoglinearnClassifynData reduction ScalenNonparametric tests nSurvivalnMultiple response1152、SPSS图形分析过程116基本统计分析功能包括:基本统计分析功能包括:描述性统计分析(描述性统计分析(Descriptive StatisticsDescriptive Statistics)二、基本统计分析功能117n1 1、 Frequencies

52、 Frequencies 频数分析表频数分析表n2 2、 Descriptive Descriptive 描述性统计分析过程描述性统计分析过程n3 3、 Crosstabs Crosstabs 列联表分析过程列联表分析过程1181、频数分析表一、主要功能一、主要功能 可对数据按组进行归类整理,形成变量不同水平的频数分布表和图形,对数据的分布趋势进行初步分析。二、频数分析二、频数分析 按AnalyzeDescriptive StatisticFrequencies顺序,打开Frequencies对话框如图。119选择一个或多个变量右移入Variable(s)框。按Statistics按钮,打开S

53、tatistics对话框显示频数分布表按Chart按钮,打开Chart 对话框按Format按钮,打开Format 对话框 Frequences主对话框120 输出百分位数:输出四分位数,显示25%、50%、75%的百分位数;将数据平均分为所设定的相等等份,可输入2100 的整数,如键入4则输出第25、50、75百分位数自定义百分位数,可输入0100 的整数。输入值后: 按Add:输入值后按此键,可反复操作键入多个百分位数; 按Remove:删除已键入的数值 按Change:重新输入新数离差栏分布参数栏在计算百分位数值和中位数时,假设数据已分组,且用各组的组中值代替各组数据中心趋势栏输出统计量

54、对话框121Chart 对话框对话框不输出任何图形,为默认 输出条形图,各条高度代表变量各分类的频数输出圆图,圆图中各块的数值表示各分类变量的频数输出直方图,此图仅适用于区间型数值变量。选择此项后,还可选择With normal curve,画出的直方图带有正态曲线只有选择了条形图只有选择了条形图和圆图项才有效,和圆图项才有效,决定纵轴表示的统决定纵轴表示的统计量计量纵轴表示频数图纵轴表示频数图纵轴表示百分比纵轴表示百分比122Format 对话框对话框控制频数表输出的分类数量。默认为10多变量框中可设定多变量表格输出的格式设置频数表输出的格式设置频数表输出的格式选择频数表中排列顺序按变量升序

55、排列,此为默认按变量降序排列按变量各种取值发生的频数的升序排列按变量各种取值发生的频数的降序排列1237.437.886.887.87.048.056.977.127.358.057.27.127.437.27.27.27.887.567.957.356.736.736.887.727.047.277.656.727.277.276.86.977.127.436.57.587.437.887.357.57.357.357.436.978.037.586.437.27.57.357.27.046.87.047.58.127.127.047.656.887.548.167.656.57.477.3

56、57.957.357.437.58.167.277.357.357.277.57.357.587.276.737.57.047.657.58.437.727.277.657.047.957.357.437.037.26.737.767.657.657.587.58表表49 100名大学生血清蛋白含量(名大学生血清蛋白含量(%)三、例题分析三、例题分析对某高校100名大学生血清蛋白含量(g%)做频数分析,数据如表49 1241、具体步骤、具体步骤按AnalyzeDescriptive StatisticFrequencies 顺序,打开Frequencies对话框。打开数据文件“大学生血大学生血

57、清清.sav”,挑xdh变量进入Variable框,grade变量进入Break框。选中Display frequency tables复选框,要求输出频数分布表。单击Statistics按钮,选择要输出的统计量。单击Chart 按钮,选择Histogram项,输出直方图,并选择With normal curve复选框,输出正态曲线。单击Format 按钮,选Ascending项。单击“OK”完成。125S St ta at ti is st ti ic cs sXDH10007.36523.940E-027.35007.35.3940.1552.066.241.036.4782.006.43

58、8.43736.527.12007.35007.5800ValidMissingNMeanStd. Error of MeanMedianModeStd. DeviationVarianceSkewnessStd. Error of SkewnessKurtosisStd. Error of KurtosisRangeMinimumMaximumSum255075PercentilesXDH8.508.258.007.757.507.257.006.756.50XDHFrequency3020100Std. Dev = .39 Mean = 7.37N = 100.00血清蛋白含量的直方图血清

59、蛋白含量的直方图 血清蛋白含量的统计表血清蛋白含量的统计表2、 输出结果及分析输出结果及分析结果如下126X XD DH H11.01.01.022.02.03.011.01.04.044.04.08.022.02.010.033.03.013.033.03.016.011.01.017.077.07.024.044.04.028.077.07.035.077.07.042.01212.012.054.077.07.061.011.01.062.077.07.069.011.01.070.011.01.071.055.05.076.077.07.083.022.02.085.011.01.08

60、6.011.01.087.033.03.090.033.03.093.011.01.094.022.02.096.011.01.097.022.02.099.011.01.0100.0100100.0100.06.43006.50006.72006.73006.80006.88006.97007.03007.04007.12007.20007.27007.35007.43007.47007.50007.54007.56007.58007.65007.72007.76007.80007.88007.95008.03008.05008.12008.16008.4300TotalValidFrequ

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论