二SPSS应用基础数据文件的建立与管理PPT课件_第1页
二SPSS应用基础数据文件的建立与管理PPT课件_第2页
二SPSS应用基础数据文件的建立与管理PPT课件_第3页
二SPSS应用基础数据文件的建立与管理PPT课件_第4页
二SPSS应用基础数据文件的建立与管理PPT课件_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 SPSS数据文件的结构 数据文件的每一行代表一条记录,即每一行代表一个个体、一个个案、一个样品(Case) 每一列代表一个变量或一个被观测量的特征(Variable) 单元(Cell)是某个个体与某个变量的交叉。即每个单元是一个观测或测定值。单元与电子表格不同,单元只包括数据值而不能含公式。(在数据编辑器中可以输入和编辑数据,但是不能输入数学表达式和函数)第1页/共64页n数据文件的范围是由记录和变量的数目决定的。可以在任一单元中输入数据。如果在定义好的数据文件边界以外键入数据,SPSS 将数据长方形延长到包括那个单元和文件边界之间的任何行和列。n如果要分析的数据还没有录入,可用数据编辑器来

2、键入数据并保存为一个SPSS 数据文件(其默认扩展名为.sav)记录Case单元Cell变量Variable单元编辑器长方形数据区当前单元数据位置信息第2页/共64页 变量的定义 步骤如下:单击数据编辑窗口中的Variable View 标签或双击列的题头(Var),显示如下面所示的变量定义视图,在出现的变量视图中定义变量。 每一行存放一个变量的定义信息,包括Name、Type、Width、Decimal、Label、Value、Missing、Columns、Align和Measure 。第3页/共64页变量名 变量类型数据或字符串宽度变量值及标签缺失值定义变量的显示宽度变量对齐方式定义测量

3、变量类型变量值小数位数变量名标签第4页/共64页 Name:定义变量名 (Variable name) 变量名是变量存取的唯一标志,变量名必须以字母或字符开头,其他字符可以是任何字母、数字句点或_、#、$等符号 变量名长度不能超过8 个字符(即4 个汉字) 变量名不能以句点或下划线“ ”结尾,能用空格和特殊字符(如!、?、和*等),不区分大小写 不能用作变量名的关键词有:ALL、NE、EQ、TO、LE、GE、BY、OR、GT、AND、NOT、WITH第5页/共64页 Type:定义变量类型 单击Type相应单元中的按钮,显示下图对话框,主要变量类型有:Numeric(标准数值型,默认)、Com

4、ma(逗点型数值型)、Dot(句点数值型)、Scientific Notation (科学记数型) Date(日期型)、 Dollar(带美元符数值型)、Custom Currency(自定义型)、String(字符串型)。选择合适的变量类型并单击OK确定。第6页/共64页 逗号型变量和句点型变量数据示例 科学记数型:a.bEc来表示,a为原数据最高位数字,b为除最高位数据以外的数字,c为最高位数10的次方数 Width:数据或字符串宽度 设置数值型变量的宽度,默认8位,当变量为日期型时无效。 默认类型8,2。如:12345678、12345.67、-1234.56原变量数据逗号型表示句点型表

5、示1234567.891,234,567.89 1.234.567,89第7页/共64页 Decimal:变量小数点位数 设置数值型变量的小数位数,变量为日期型时无效。 Label:变量标签 变量标签是对变量名的进一步描述,而变量标签可长达120 个字符,标签可对变量名的含义加以解释。 Value:变量值标签 值标签是对变量的每一个取值的进一步描述,当变 量 是 定 类 或 定 序 变 量 时 , 非 常 有 用 。 单 击Value相应单元,在下图所示的对话框中进行设置。第8页/共64页 Missing:缺失值的定义方式 系统缺失值,用点号(.)表示,用户缺失值有2类见上右图第9页/共64页

6、 Column:变量的显示宽度 输入变量值的显示宽度,默认为8个字符 Align:变量显示的对齐方式 Left(左对齐)、Right(右对齐)、Center(居中对齐) Measure:定义测量变量类型 Scale 变量可为数值型、日期型和货币型,但不能为字符串型变量 Ordinal 可为字符串型和数值型,为定序变量,如年龄、身高等 Nominal 可为字符串型和数值型,为定类变量,如性别等第10页/共64页 数据录入 新建数据文件-数据编辑窗口直接输入 定义变量名 定义变量的类型 输入数据第11页/共64页 数据录入 打开其他格式的数据文件 直接打开 使用数据库查询打开 利用通用数据库ODB

7、C接口读取数据文件(在9.0及以前版本中非常重要)步骤: 选择菜单File=Open Database=New Query,系统会弹出数据库向导的第一个窗口,其中会列出你使用的机器上已安装的所有数据库驱动程序,选中所需的数据源,然后单击下一步,向导会一步一步的提示你如何做,直至将数据读入SPSS。 使用文本导入向导读入文本文件 第12页/共64页SPSS(*.sav) SPSS 数据文件(6.010.0 版本) SPSS/PC+(*.sys) SPSS4.0 版本数据文件 Systat(*.syd) *.syd 格式的 Systat 数据文件 Systat(*.sys) *.sys 格式的 S

8、ystat 数据文件 SPSS portable(*.por) SPSS 便携格式的数据文件 EXCEL(*.xls) EXCEL 数据文件 Lotus(*.w*) Lotus 数据文件 SYLK(*.slk) SYLK 数据文件 DBase(*.dbf) DBase 系列数据文件 Text(*.txt) 纯文本格式的数据文件 Data(*.dat) 纯文本格式的数据文件 选择菜单FileOpen Data或直接单击快捷工具栏上的“ ”按钮,系 统 就 会 弹 出Open File对话框,单击“文件类型”列表框,在里面能看到直接打开的数据文件格式 如右图:第13页/共64页 使用文本导入向导读

9、入文本文件 选择菜单File=Read Text Data,系统就会弹出Open File对话框,打开固定格式.txt文件。 第14页/共64页你的文件符合以前定义的格式吗?选Yes时通过Browse指定一个数据文件套用其格式。默认No 不套用,需自己定义格式。按下一步。显示*.txt文件的数据第15页/共64页你的变量是如何排列的?Delimite用特殊方 式 分 隔 , F i x e d width固定宽度。变量名是不是在文件的最上面一行?如果选No,则系统自动给变量命名为V1、V2*第16页/共64页第一条记录从第几行开始?你的数据是如何呈现的?选一、表示文本文件中的一行数据代表一条记

10、录;选二、在后面填写每条记录(one case)的变量数你要调用多少行数据?全部第17页/共64页数据用什么符号界定的?无变量值间是用那种方法分隔的?空格第18页/共64页在数据预览时,所选变量的特殊说明数据预览,可修改变量名和数据的类型。注意:在*.txt文件中第一行的变量名不能有数字。第19页/共64页你已成功定义了数据文件的格式,是否想保存这个文件的格式以便将来使用呢?是否要粘贴Syntax语句到Syntax窗口第20页/共64页完成后导入的数据文件,可以将其保存为新文件。第21页/共64页 数据文件的编辑 修改撤消(Undo) 恢复修改(Redo) 数据剪切(Cut) 数据复制(Cop

11、y) 数据粘贴(Paste) 数据删除(Clear) (以上操作等均和Word,Excel等相同或相似)第22页/共64页 数据文件的整理 个案排序、文件转置、文件合并、分类汇总 数据加工 计算变量、产生计数变量、个案选取 数据分组 手工分组 数据文件的其他处理功能 指定加权变量、SPSS变量集的定义和使用第23页/共64页 个案排序(sort) 将 所 有 个 案 按 照 用 户 指 定 的 某 一 个 或 多 个 变 量 的 变 量 值 的 升 序(Ascending)或降序(Desending)重新排列。 快速查找异常值、极端值 例:打开SPSS数据文件Employee data.sav

12、,点Data选Sort Cases将educ降序和升序排列结果;选Edu和Jobcat两个变量按升或降序排列;同样选Jobcat和Edu分别升、降序排列,看后两种也即Edu在前和在后两种排序结果有无差异。第24页/共64页 文件转置(transpose) 将数据文件行列互换,即:将个案转为变量,变量转为个案,就象矩阵的转置一样。 例:打开SPSS数据文件Employee data.sav,点Data选Transpose选项,在弹出的对话框中,将左边窗口中的所有变量选中,按箭头全部移到右边Variables窗口中,单击Ok实施转置。注意如果只选部分变量转置后,未被选择的变量在新文件中将会消失。如

13、将Edu选到Name Variable窗口后注意转置后变量名的变化。第25页/共64页 文件合并(merge file) 将两个SPSS数据文件合并到一个数据文件中。 个案合并(要求两个数据文件有一定数量的相同的变量,合并使相同变量所对应的个案集中到一个文件中)、变量合并(要求两个数据文件要有一定数量的相同的个案,合并使相同个案所对应的变量集中到一个文件中)第26页/共64页 例:打开addcase文件夹中的Merge add case 1文件。第27页/共64页 打开Data中的Merge Files中的Add Cases,打开Merge add case 2,在Add Cases对话框中的

14、Unpaired Variables中显示非配对的变量,带*号的是工作文件中的变量,带+号的为外部文件中的变量。第28页/共64页 如两变量实质一样就可以匹配(Pair)方法是: 在Unpaired Variables中单击来自工作文件中的变量名(带*号的),然后按Ctrl,同时选外部文件的变量名(带+号的),此时Pair变黑,按Pair匹配实现。在Variable in New Working Data窗口中两个变量用相连。通过Unpaired Variable 窗口下的Rename对话框更改变量名。第29页/共64页 选择Indicate case source as variable核选

15、框,在合并的新文件中产生一个新变量,默认为source01,用来表明新文件中数据的来源,如果数据来源于工作数据文件则取值0,来源于外部数据则取值1。按OK后生成右图数据, 然后保存为新文件即可。第30页/共64页 分类汇总(aggreate) 基于一个或多个变量的不同值进行分类后形成各组数据的特征数。也即: 按指定的分类变量的变量值对个案分组; 计算每组个案的汇总变量的基本统计量; 将计算结果生成到一新文件中,即:在新文件中对应分类变量的每一个分类值产生一个个案。第31页/共64页 分类汇总(aggreate) 例:打开两因子资料(有重复观察值)数据文件,选Data中的Aggregate后出现

16、如下对话框:第32页/共64页 分类汇总(aggreate) 将 产 前 产 后 和 药 物 两 变 量 移 入 分 类 变 量 B r e a k Variable(s)框内,将收缩高度变量选入汇总变量框内。第33页/共64页 分类汇总(aggreate) Name & Label是重新命名汇总变量的名称和标签。第34页/共64页 分类汇总(aggreate) Function对话框是计算汇总变量各个案的基本统计量,但每次只能计算一个基本统计量。第35页/共64页 分类汇总(aggreate) Save number of cases in break group as variab

17、le可以为新数据文件建立关于各分类组个案数的新 变 量 , 在 后 面 的 框 中 可 以 输 入 新 变 量 , 默 认 为N_BREAK。Create new data file是产生一个新文件,后面是新文件的存储路径和默认文件名。第36页/共64页 分类汇总(aggreate) 打开分类汇总文件后可见总共分为4组,每组的平均数列在了第三列,就是收缩高_1,最后一列是每个分类组中有多少个数据组成的,这里为4,也即19.13、26.85、21.05和28.38是4个数据(个案)的平均数。第37页/共64页 数据文件的拆分(Split file) 如果对基于一个或几个变量分类以后形成的个组数据

18、的个体(个案)感兴趣,可考虑用拆分文件(Split file).要注意的是:所谓拆分并不是要把文件真的分成几个,而是根据需要,依据某个或几个变量按照一定顺序把原数据重新排列,把与一个或几个变量共同相关的数据在数据编辑窗口中集中到一起,以便集中操作和对比。第38页/共64页 个案选取(select cases) 个案选取方式(就是自大量的原始数据中选择我们所需要),SPSS提供了4种选择数据的方法,分别是: 根据逻辑关系表达式选择数据; 随机选取数据 在给定的范围(日期、时间或个案号)内选择数据 用过滤器变量选取数据第39页/共64页 变量计算(compute) 产生新变量或对原变量进行必要的转

19、换 SPSS算术表达式和逻辑表达式 SPSS函数 产生计数变量(count) 对所有或部分个案,计算若干个变量中有几个变量的值落在指定的区域内,并将结果存入新变量中。相关函数及事例第40页/共64页 手工分组(recode) 将指定按哪个变量分组,即:指定分组变量;定义分组变量的分组区间(不重、不漏);指定一个存放分组结果的标志变量 自动分组(Categorize Variables) 将连续性变量自动按分位数要求分成几类第41页/共64页 第42页/共64页例:将200头金华猪2月龄体重(单位:公斤)资料分成12组,组限依次为89,9101920(组距为1)。请利用SPSS统计软件作次数分布

20、。p选Transform中的Compute,在弹出的对话框的Target Variable(目标变量)中输入group(组区间),在Type和Label对话框的Label中输入“组别”,在Compute Variable 对话框的Numeric Expression(数值表达式)框中输入代码1(表示第一组)。第43页/共64页 按If,在弹出的对话框中选Include if case satisfies condition,然后将左框中的体重变量选到右上框中,选=8和,然后再选体重变量到右上框中,选= 8 & 体重 = 9 & 体重 10,按Continue后,按Ok,体重在大于等于9小于10的数据,group的取值为2,即为第二组

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论