版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一篇 SPSS数据处理基础第一篇 SPSS数据处理基础本篇要点导读:第1章 SPSS数据的录入 数据录入的一般步骤,数据结构的定义,文件合并,文本数据的导入; 第2章 数据文件的操作和预处理 【Data】菜单中对变量和案例的操作,【Transform】菜单中计数和分类赋值的操作。本篇说明:1. 本篇重点说明数据录入和文件整理的整个过程,以及过程中特别需要读者注意的问题,对于SPSS操作简明扼要,没有对每一个选项进行详细说明,只是配合例题针对常用和重点选项进行说明,如读者想了解详细说明请查阅相关书籍,本书会给出标示。在以后的章节中我们也会遵循这一原则,不再特别说明;2. 如果读者是有一定的SP
2、SS使用基础,了解SPSS的一些基本操作,对数据录入和预处理比较清楚,可以简略浏览本篇,重点了解数据录入的一般流程和预处理中注意的问题。也可直接略过本篇从第二篇开始学习;3. 如果读者是SPSS初学者,由于本篇在软件操作上的介绍比较简略,请初学者在学习此篇的时候一定遵循我们的例题操作并注意图例标示,必要时查阅书中列出的相关参考书籍,并完成课后两道以上的习题操作,务求掌握此篇内容,为以后SPSS软件学习奠定基础。第1章 SPSS数据的录入SPSS既是Statistical Package for the Social Science(社会科学统计软件包)的缩写,也是Statistical Pro
3、duct and Service Solution (统计产品与服务解决方案)的缩写,是世界上几大统计分析软件(SPSS、SAS、S-plus/R、STATA、GUASS)中使用最广泛,界面最友好,操作最方便的统计软件,其强大的功能和易掌握性对于非统计专业特别是经济和管理专业的学生和工作人员,是一个不可多得的统计分析和数据处理的好工具、好助手。本书将基于SPSS 17.0给读者介绍SPSS的强大功能,关于SPSS的安装和一般Windows应用软件没有什么不同,让我们从SPSS的基础建立数据文件和录入数据开始吧。1.1 SPSS数据文件的建立和数据录入在本节中我们从一个简单例题入手,让读者了解S
4、PSS是如何建立数据文件,以及如何录入数据的。例1-1下表是某保险机构收集的车险投保人数据,请根据数据特点建立SPSS数据文件。表1.1车险投保人的数据为节省篇幅,表中仅列出部分投保人案例,完整数据请见光盘中的数据集1-1性别年龄交通事故数性别年龄交通事故数男232女251男351女243男261女311男250女260男282女260男311女290男231女222男313女255 首先,进入SPSS软件,双击桌面上的SPSS图标,或者从“开始”菜单“所有程序”“SPSS Statistics”“SPSS Statistics”图标进入软件,将会看到如图1-1的软件界面: 在启动SPSS后,
5、一般先进入一个导航框,其中有一些常用操作和上次使用过的数据文件和结果文件等,不用太过理会导航框,直接选择Cancel就可以进入软件主界面。在软件界面中,除了看到与一般软件相同的菜单、快捷按钮以外,还可以看到灰色的“变量(英文界面是Var)”和“1、2、3”分别代表变量和案例,由于我们还没有建立任何变量和案例,所以这些都是灰色的。在界面的右上角可以看到“Visible:0 of 0 Variables”表明数据中共有0个变量,可见的是0个变量。接下来我们就在这个操作界面中建立变量和案例。 关于变量和案例,分别对应操作界面的列和行,这与一般的数据库软件相同,有些书称为变量和记录,统计上通常称为指标
6、和样本,意思大同小异。数据视图和变量视图总共有多少个变量,其中可见的有多少个变量案例1、案例2变量图 1-1 SPSS软件界面建立SPSS数据文件和一般的数据库文件建立的考虑基本相同,主要是两个步骤:Step1:定义文件的数据结构;Step2:录入数据。在Step1中,重点需要考虑用多少个变量,每个变量的结构,例如是整数型变量还是浮点小数型变量,小数位数取多少合适,变量取值是否代表某种分类,需要如何显示等等;在Step2中,主要考虑根据案例的多少来决定是一个人单独输入所有数据还是多人分别输入然后合成完整的数据。下面我们结合例题具体讲解。1.1.1 SPSS的数据文件结构在本例中,我们主要考虑三
7、个变量,分别是投保人的性别、年龄和发生的交通事故次数。其中性别是一个分类变量,它只有男、女两个值;对于年龄,是一个整数型变量;而交通事故次数也是一个整数型变量。以上就是对变量的考虑。对于案例,由于总共有500个案例,单独输入工作量过大,因此可以考虑分别录入再进行合并。接下来我们就在SPSS中定义变量的结构。图1-1的软件操作界面左下角有两个类似Excel工作表一样的选项卡,分别叫做【Data View】和【Variable View】,其作用和Excel工作表的平行数据表大不相同,有着严格的分工:【Variable View】称为【变量视图】,专门用于定义SPSS变量的结构,而【Data Vi
8、ew】称为【数据视图】,用于对案例的录入;换言之,变量视图只用于定义结构,不能用于录入数据,相反数据视图只用于录入数据,不能定义变量结构,对于不同的操作要在不同的视图中完成,这一点请读者务必明确。例如,接下来我们要先定义变量的结构,就应该在【Variable View】中定义。点击【Variable View】选项卡,进图1-2如下操作界面:可以看到在此视图中,每一行代表一个变量,本例题定义3个变量,因此有3行,列名称中分别有“Name”、“Type”等,我们已经在图上做出了标示,此处就不赘述了,只是对于重点的几个列进行说明:“Name”菜单表示变量名称,可以用英文字母、数字和下划线给变量命名
9、,也可用中文命名,但是不推荐使用中文作为变量名。 从SPSS 10.07后,就可以用汉字给变量命名,以前要求变量名长度不超过8个字符,即4个汉字,在SPSS 13.0以后放宽到64个字符,所以可以用汉字命名;但是SPSS的汉字兼容性不太好,以前笔者使用汉字命名时,不止一次分析结果的变量名出现乱码,因此不推荐使用汉字作为变量名,强烈推荐用英文命名变量,变量名标签用汉字说明变量的含义。变量名标签变量尺度对齐方式变量缺省值变量显示宽度变量类型变量值标签小数位数变量位数变量名图1-2 Variable View 操作界面 “Type”表示变量类型,总共有“Numeric”数值型、“Comma”逗号型、
10、“String” 字符串型等八种类型供选择,一般使用数值型就可以了关于变量类型的说明,可以参看薛薇编著,统计分析与SPSS应用,北京人民大学出版社;需要特别说明的是,字符串型变量不能用SPSS进行分析,只能起案例名称标注的作用,因此要分析的变量都要转化为数值型变量,例如,本例题中性别这个变量就要转化为取值为1和2的变量,不能直接使用“男”、“女”作为变量值。“Label”变量名标签的作用非常巨大,由于变量名标签和变量是绑定显示的,在变量分析和显示分析结果时可以一目了然了解变量的含义,对于SPSS的使用者都要养成给变量添加变量名标签的习惯,本例中,对每个变量我们都根据其含义指定了变量名标签,在以
11、后的学习中读者将体会到变量名标签的方便。“Value”变量值标签也是非常重要的,对于分类变量和定序变量,一般只能取有限的几个值,前面已经了解必须要对其进行编码才能用于SPSS分析,这可以通过编制变量值标签来实现,还可以说明每个取值代表什么含义,例如,本例题性别变量中,我们用1代表“男”,用2代表“女”,这就需要在变量值标签中说明,一旦编制了变量值标签,软件在分析时按照数字进行分析,在显示时按照变量值对应的文字进行显示,这样大大方便对结果的理解。我们通过下述操作编制变量值标签:点击变量值标签“Value”下对应变量的单元格,出现,点击右边的三个小点,出现如图1-3所示对话框,在Value框中填写
12、“1”,在Label框中填写“男”,说明在SPSS性别变量中取值为1代表是男性,定义好后,点击添加定义,将在右边的框中显示定义,以后还可以对右边框中定义进行修改(对应按钮)和删除(对应按钮)。重复操作可以定义取值为2代表是女性。定义好的标签如图1-4。定义好标签以后,点击,完成变量值标签的定义,以后可以类似定义变量值标签。另外两个变量“年龄”和“交通事故数”由于不是分类变量,不需要编制变量值标签。添加定义取值的实际含义,文字在SPSS数据文件中的取值,数字 图1-3 添加变量值标签的操作 图1-4 添加好的变量值标签“Measure”变量的尺度,分为三种, “Scale”称为间隔尺度,说明变量
13、取值有大小之分,并且变量值的差代表差异程度,本例中的“年龄”和“交通事故次数”就属于间隔尺度,有些书籍也称为“定量变量”; “Ordinal”称为顺序尺度,说明变量取值有大小之分,但是变量值仅表示顺序先后,变量值的差不能代表差异程度,本例中没有顺序尺度变量,但是我们经常接触到的产品分级,职称高低、学历高低都属于顺序尺度变量,有些书籍也称为“定序变量”; “Nominal”称为名义尺度,说明变量取值没有大小之分,不同变量取值只表示案例属于不同的分类,例如本例中的性别就属于名义尺度,1和2仅仅代表“男”和“女”两个分类,也称为“定类变量”。 其实变量的尺度非常好判断,首先判断变量取值有没有代表大小
14、,如果没有,那一定是名义尺度,如果取值代表了大小,再看取值相减有没有意义,如果没有意义,那就是顺序尺度,有意义就是间隔尺度。根据本例中的变量尺度,我们应该将第一个变量“性别”定义为名义尺度,第二个变量和第三个变量定义为间隔尺度。对于尺度的定义很简单,用鼠标点击“Measure”下变量对应的单元格,点击右侧的箭头打开下拉菜单,进行相应选择就可以了。通过以上的定义,我们基本定义好了变量结构关于变量其他属性的定义和说明,请参看张文彤SPSS11统计分析教程,北京希望电子出版社。,回到【Data View】,我们看到有三个变量的名称变成了我们刚才定义的变量名,并且变黑了,但是案例的1、2、3还是灰色的
15、,说明虽然定义了变量结构,但还没有输入任何的案例数据。 如果读者对变量要求不高,也可以不定义变量直接在【Date View】中输入案例数据,此时会使用缺省变量名“var00001”、“var00002”等来命名变量,但是在以后的分析中我们将发现没有定义变量结构将会有许多不便,想节省时间,结果反而浪费更多时间。所谓“磨刀不误砍柴工”,推荐读者在使用SPSS分析数据时,都先定义变量结构再录入数据。1.1.2 SPSS的数据录入现在我们开始变量录入的工作了,如果说变量结构定义是设计整个数据文件的框架和大梁,那么现在的工作就是往框架中添砖加瓦,这是整个数据录入阶段最基础,也是最累人,工作量最大的操作了
16、,但是没有办法,只有一条条案例往数据里敲。这个和任意一个数据录入软件如Excel没有太大差异,只是中间有一些技巧和窍门,是笔者使用的心得,现在和读者共享,读者在使用SPSS中多多总结,也会发现自己的窍门。数据录入的一些技巧:1. Copy & Paste 方法,在数据录入过程中,要充分利用Copy & Paste 方法,例如,变量输入中有多个单元格数值相同,则可以输入第一个单元格数值,然后Copy单元格数值,选中第二个单元格,按住Shift键再点最后一个单元格,再点鼠标右键,选择Paste,就可以一次输入多个单元格内容,例如在本例中前250个性别变量取值都是1,则可以如此操作,一次输入所有的1
17、;2. 如果数据在Excel或者其他数据库文件中,则可以直接在Excel中复制数据内容,再在SPSS中点击第一个单元格,选择Paste,就可以输入数据了,最后别忘了,如果数据没有定义变量结构一定要补充定义变量结构;3. Word,或者文本格式中,也可以选择复制和粘贴,只不过必须确定全部是数值,否则在粘贴的过程中会出现问题,会使得文本在SPSS中变成缺失值,这是因为SPSS默认变量类型是数值型,对于字符型变量就处理成缺失值了。对于此种情况的处理办法我们在第二节将介绍。数据编辑的一些技巧1. 如果在数据录入中想快速找到某一条案例,可以选择Edit菜单Go to case,输入案例编号,点确定系统就
18、会定位到该案例的位置,如果不知道案例号,只是知道某变量的取值,可以选择Edit菜单Find,输入要查找的值,一个个查找案例即可;2. 充分利用变量值标签,此处显示出变量值标签的一个优势,只需选择View菜单Value labels或者点击快捷按钮上的,此时所有定义了变量值标签的变量输入可以利用下拉菜单完成,点击每个单元格时,右侧会出现箭头,点击会出现下拉菜单,选择下拉菜单的选项就可以完成输入,本例中性别变量就可以按此快速输入;用此功能检查变量输入是否出错也很方便,选择Value labels后,有变量值标签的变量所有单元格将显示变量值的说明,例如在本例中,取值为1的单元格中将出现“男”,取值为
19、2的单元格中将出现“女”,如果单元格中不出现“男”或“女”而出现数值,那就说明输入时出错了。 3. 如果数据量较大,此时单独录入容易疲劳,越到后面越容易出错,此时最好在定义好了数据结构以后,将案例分成多份,由多人输入,形成多个数据文件再合并,这样可以提高录入效率,减少录入错误,例如本例就可以将案例数据分成两份,男性案例和女性案例各为一份,由两人分别录入,再进行文件合并,文件合并的操作将在下一小节介绍。1.1.3 SPSS数据文件的合并上一小节我们将数据量较大的数据分成两份录入,形成了两个数据文件,比如1-1-1和1-1-2,接下来的问题是如何将两个数据文件的数据合并到一个问卷中,有读者会问,直
20、接把1-1-2的内容复制下来粘贴到1-1-1中不就完了吗?实际上没有这么简单,SPSS是单窗口软件,打开1-1-1文件必须先关闭1-1-2,伴随文件关闭,剪贴板中的内容也不在了,复制粘贴操作必须借助第三方软件,例如Excel;但是随着SPSS版本的升高,SPSS已经从一个单窗口软件变成多窗口软件,这个问题已经不再那么突出,但是我们还是加以介绍,让读者了解文件合并的操作。 以前SPSS是一个单窗口的软件,不能同时打开两个数据集文件1-1-1和1-1-2,这就使得Copy & Paste数据必须先打开1-1-2,将其内容复制粘贴到Excel中,再打开1-1-1,将Excel中的内容复制粘贴到1-1
21、-1。SPSS17.0已经可以同时打开多个数据集文件了,复制粘贴也可以直接从1-1-2到1-1-1,因此以前的困难现在已经不再存在,这也算是一个进步吧。读到此处,读者也许会觉得,问题已经解决了,不需要再往下说了,但是这其中还有问题,比如,两个文件完全采用了不同的变量顺序,比如1-1-1按照性别、年龄、交通事故次数的顺序输入数据,1-1-2却按照年龄、交通事故次数、性别的顺序输入数据,此时直接复制粘贴就会张冠李戴,行不通了;也许读者会问,那我调整一下变量顺序不就行了,没什么问题啊,在变量不多的情况下,例如本例,确实可以这样操作,但是如果变量很多,要调整顺序也许就是一个非常麻烦的事情了。有没有一个
22、让变量自动“识别”,自动“对齐”的办法呢?办法就是SPSS文件合并。SPSS的文件合并分为纵向合并和横向合并,因为纵向合并是在已有数据的下面增加案例,所以称为“Add Cases”,同理,横向合并是在已有数据的右边增加变量,因此称为“Add Variables”。到底采用横向合并还是纵向合并是根据待合并文件的结构和数据录入的分工来决定的。 如果数据录入分工是每人录入一部分案例(通常的情形),那待合并文件的结构就是全部的变量相同,但是案例不同,此时该使用纵向合并增加案例;如果数据录入分工是每人录入一部分变量(当然这样做效率比较低),那待合并文件的结构就是全部的案例相同,变量不同,当然选横向合并增
23、加变量,很简单吧!无论是纵向合并还是横向合并,都有一个如何对齐的问题,我们先来介绍纵向合并,既然是纵向增加案例,当然是按照变量对齐,按照如下操作:Step1:打开第一个文件1-1-1,Step2:选择【Data】菜单【Merge Files】菜单【Add Cases】菜单选择文件后点击此按钮从指定路径选择一个磁盘文件选择一个已打开的文件图1-5 纵向合并文件选项出现图1-5对话框该对话框是询问待合并文件是已打开的文件还是磁盘上存储的文件,选择已打开的文件可以在已打开文件列表中直接选取,选择磁盘文件必须指定路径,由于本例中文件1-1-2已经打开,故直接选取,如果没有打开请从第二个选项中指定路径。
24、 Step3:选择文件,点击按钮重命名按钮未配对变量框文件来源复选框变量不配对进入合并后文件的按钮合并以后文件中的变量配对按钮图1-6 纵向合并文件选项对话框出现图1-6对话框,左边框中是为配对的变量,分别来自两个文件,来自当前文件变量名后有“*”,来自打开或者磁盘文件的变量名后有“+”,右边框中是合并后文件的变量,我们通过中间两个按钮将变量从左边选到右边,可以选择两个文件中意义相同的变量,点击“pair”按钮配对生成右边一个变量,表示这两个变量的值对齐生成合并后文件的一个变量,也可以直接选择一个变量,不经过配对,直接点击箭头按钮直接进入合并后文件,此时由于没有变量与之对齐,将会在相应位置出现
25、缺省值;还可以勾选文件来源复选框,将在合并后的文件中新生成一个变量用来记录案例是来自哪个文件。 感觉很复杂吧,其实不难,对于两个文件中变量名相同的变量,SPSS会自动配对,比如本例就是自动配对的;所以如果想操作简单,就把两个文件中意义相同的变量取同样的名字吧!当然名字不同也可以配对,例如第一个文件中性别变量名是gender,第二个文件中是sex,选择两个变量点pair,右边会生成一个新变量gender&sex,&前面是第一个文件中的变量名,&后面是第二个文件中的变量名,是不是感觉容易些了?当然,你也可以通过rename按钮将第二个文件的变量名改为gender,那么点配对以后,右边框中只会出现g
26、ender这个变量名了。 关于缺省值,我们说明如下:变量配对以后不会在合并后的文件中产生缺省值,变量不经过配对直接进入合并后文件,会产生缺省值,如果变量来自第一个文件,那第二个文件没有变量与之对齐,所以第二文件的案例在该变量上是缺省值,反之,第一个文件案例在变量上时缺省值;判断变量有没有配对主要看右边框中变量名后面有没有跟着“*”或者“+”。Step4:选项选择完成后,点击按钮,完成文件的纵向合并由于本例题中所有意义相同的变量的名称都一样,因此变量自动配对对齐,纵向合并的操作非常简单,这从一个方面说明预先定义变量结构的方便性。下面介绍横向合并,需要说明的是,纵向合并在实际中使用比较多,而横向合
27、并使用很少;这一方面是因为它效率低,另一方面也是因为它在SPSS上的操作比纵向合并复杂,假如我们在进行输入工作分工的时候不是按照案例将输入分工,而是按照变量将输入分工,当然这样分工比较奇怪,因为对于不同案例的输入可以同时进行,而对于不同变量的输入一般不能同时进行,除非有很多个数据的备份,否则在甲输入第一个变量的时候,他必须使用所有的数据,其他输入员就只有等着,效率当然就低了,这个现象在市场调查问卷录入时尤其明显;但是横向合并也有自己的用武之地,比如已有许多变量数据了,后来需要补充输入几个变量,此时可以将要补充的数据形成一个新的文件,再运用横向合并添加到已有文件中,这种情况在市场补充调查中有一些
28、应用。我们先不管基于什么原因,我们的输入工作确实是按照变量分工的,各录入员也录入数据得到了各自的文件,比如本例中,一个输入员输入性别和年龄变量,另一个输入员输入交通事故次数这个变量,得到两个文件1-1-3和1-1-4,下面将两文件合并。横向合并是在横向增加变量,当然其对齐的标志只能是案例了,必须清楚每个变量值添加到那个案例后面,为此需要建立一个关键变量,每个案例在此变量上取值都不同,关键变量通常是编号(ID),两个文件都有编号这个关键变量以后,我们就知道5号案例的交通事故次数要加在5号案例的性别和年龄之后,而不会加在2号案例的后面,这样就实现了对齐,不会出错了。 纵向合并要求变量和变量能区分,
29、以便清楚性别的值接在性别后面而不是年龄的值后面,这很容易,因为SPSS中不同变量的变量名必须是不同的,变量是自然区别的;横向合并要求案例能区分,这就不那么容易了,因为两个案例完全可以在所有变量上取值都相同,因此,本例中我们需要增加一个编号变量,保证每个案例在编号上取值不同!当然,如果数据本身有编号这个变量,我们就省下力气了。 当然,用于区分案例的变量不一定是编号,只要是每个案例取值全不相同的变量就可以作为关键变量,所以,关键变量就好像是一个“案例识别器”,运用它就可以把每个案例准确识别出来,就好像给每个案例发一个“身份证”,每个案例的“身份证号”都不相同。当保证两个数据文件中都有关键变量以后,
30、就可以进行横向合并了,其操作如下:Step1:打开第一个文件1-1-3,Step2:选择【Data】菜单【Merge Files】菜单【Add Variables】菜单图1-7 合并文件选项 出现图1-7对话框,设置基本相同,此处是选择磁盘文件1-1-4而不是已打开文件。Step3:选择文件,点击Continue按钮,出现图1-8对话框对于此选项框,按照图上标示,将关键变量“编号(ID)”选入“Key Variable”框中,并确定案例是按此变量升序排列,右边的“New Active Dataset”框中是合并后新文件中将出现的变量,左边的“Excluded Variables”框中是剔除的变
31、量,将不会出现在新文件中,选中一个变量,点击中间箭头按钮,就可以将变量从一个框移到另一个框,这样就可以决定新文件中将出现哪些变量了,例如,本例中,新文件中将会有性别、年龄和交通事故次数,当然,还有关键变量“编号”。案例来源单选框然后选择关键变量-ID首先勾选此项最后点此确定关键变量图1-8 横向合并选项框Step4:选项选择完成后,点击按钮,完成文件的横向合并关于案例来源单选框,解释起来很复杂,而且用处不大,就用默认选项就好了,有兴趣读者可以参看相关书籍。 感觉横向合并比纵向合并更难了,事实确实如此,横向合并的关键是选择关键变量(Key Variable),关键变量找好了就成功了一半,然后再将
32、需要在新文件中出现的变量选入“New Active Dataset”就大功告成,可以直接点OK了,这个讲解不太难了吧。现在我们已经能够建立SPSS数据文件的变量结构,并通过键盘输入数据了,如果输入工作量太大,还可以进行分工后运用文件合并功能高效的生成文件;但是在数据分析中,数据用SPSS格式保存的太少了,接下来的一节将介绍如何利用SPSS将已有的其他格式文件转化为SPSS格式。1.2 从其他文件中导入数据建立SPSS数据文件SPSS不仅可以自己建立数据文件,还可以将其他应用程序生成的数据文件转化为SPSS的数据文件,SPSS良好的兼容性也是其广泛应用的基础;我们从互联网上,数据库中,或者其他数
33、据处理软件上得到的数据,都能够方便的转化为SPSS数据文件进行分析处理,SPSS不能处理的数据文件是很少的。由于数据文件主要以三种形式存储:应用软件数据文件形式、数据库文件形式还有文本形式,下面我们就分小节对这三种形式的文件分别说明。1.2.1 从电子表格文件中读入数据随着MS Excel广泛用于办公和简单数据处理,电子表格文件(后缀名为.xls)成为非常常见的一类数据文件,对于小型或者零散的数据,多数用电子表格文件记录;另外,中国统计年鉴以及一些省市的年鉴数据,也是用电子表格文件发布的,因此,掌握了电子表格文件转化为SPSS数据文件的方法,无形中我们的数据来源就丰富了许多。下面通过一个具体的
34、例子让大家了解转化的过程。例1-2 在随书的光盘中,有一个电子表格文件1-2.xls,记录了一些数据,要求把它转化为SPSS数据文件。由于SPSS能够直接打开电子表格文件,因此,转化的过程可以归纳为三步:Step1:选择【File】菜单【Open】菜单【Data】打开电子表格文件,或者直接点击快捷按钮,进入如图1-9打开文件对话框,按照图上表示,点击打开类型下拉菜单,选择Excel文件类型,电子表格文件1-2将会出现,再选中此文件,点,出现如图1-10对话框,该对话框询问是否要从第一行读取变量名,以及读取变量的范围,点击复选框,其他选项用默认值,点,将数据读入到SPSS;选择文件类型下拉菜单中
35、的Excel文件类型 图1-9 打开文件对话框 图1-10 读取变量对话框Step2. 处理缺失值(如果出现缺失值)或者字符变量的值数据读入以后,我们看到变量已经有变量名了,但是有两个变量取值是字符型,分别是“Ptid”变量和“Clinic”变量,通过查看变量,我们了解了前一个变量是类似编号的编号,可以保持字符型,但是后一变量是表示案例来自那个诊疗科的类别数据,因此要对此变量进行重新编码,将A、B、C、D对应编码为1、2、3、4,将该变量转化为数值型。Step3. 定义变量结构为每个变量添加变量名标签,为“Clinic”和“Sex”变量添加变量值标签,定义好变量结构。正确的变量结构如图1-11
36、所示图1-11 变量结构示例图这样,数据就导入完毕,可以将数据保存为SPSS数据文件了(见光盘1-2.sav)。SPSS从其他的应用软件(如SAS)中读取文件操作类似,这里就不再赘述了,留作读者练习。1.2.2 从数据库文件中读入数据 数据库文件是另外一种常用的数据存储格式文件,从专业数据库中得到的数据大多采用此种格式存储,现今使用越来越多的数据仓库,从中获取的数据也多是用数据库文件格式存储的;因此,掌握从数据库文件中读入数据对于扩展SPSS数据源是非常重要的。下面通过一个例子说明如何读取:例1-3 随书光盘中有一个名为1-3.dbf的数据库文件,记录了2007年7月-2009年6月全国经济一
37、致指数和部分企业家信心指数数据来源:中经网数据库,请将其读入SPSS中并定义变量结构。从数据库文件中读取数据类似于从电子表格中读取数据,大体也分为三步(和上面相同,此处不列出):Step1:选择【File】菜单【Open】菜单【Data】出现如图1-9所示打开文件对话框,点击打开类型下拉菜单,选择数据库格式“.dbf”,选择文件“1-3.dbf”点,将数据读入SPSS;Step2:对数据集文件进行必要的修改如图1-12可以看到,读入的数据不很规范,因此需要对数据文件进行整理,将中文变量名改成英文,去掉多余的变量“D_R”,将变量名“n1”改为“yearmon”,表示年月,对数据也进行整理,去掉
38、第一个无效案例。图1-12 数据库文件的读入数据结构Step3:定义变量结构除“yearmon”保持不变,其余变量全部转化成数值型,变量长度指定为8,同时添加变量名标签,将变量显示宽度调整为8,变量尺度也全部变成“Scale”。修改好的数据文件保存为SPSS文件(见光盘“1-3.Sav”)。上面介绍的是比较简便的读取数据库文件的方法,另外SPSS还提供数据库向导的方式读入数据库文件,分为三步:Step1:选择【File】菜单【Open DataBase】菜单【New Query】将看到图1-13所示的数据库向导窗口,看到SPSS提供三种数据库读入向导:dBase、Excel、Access格式,
39、光盘中有1-3.xls的Excel文件,因此我们选择第2种文件格式,因此选择第2个向导选项,点击“Next”;进入一个文件路径对话框,指定路径后点击“Ok”,即进入如图1-14所示的变量选择对话框;Step2:选择变量、案例、变量名等相关设置图1-14左边变量框列出Excel工作表中的所有变量,可以将变量选到右边的变量框中,右边的变量框中是将被读入SPSS文件的变量,中间按钮用于选择变量,右边的两个按钮用于调整变量的顺序,选择好变量后,点击“Next”,进入案例选择对话框,如图1-15所示;一般说来都会读取全部案例,所以这个对话框将不会有任何操作,直接点“Next”进入下一对话框。 读者可以通
40、过指定条件只读取满足条件的案例,但是我们并不推荐这样做,一方面是因为此处指定条件比较麻烦,必须熟悉数据库的操作,另一方面也因为读取全部案例以后在SPSS中进行选取更加方便。图1-16是变量名称、变量类型和变量显示长度定义对话框,将名称改为英文,将变量类型修改为数值型,再将变量长度修改为8个字符,点击“Next”进入最后一个对话框,显示数据库选择语法,不用理会,直接点击“Finish”完成设置,读入数据。Step3:定义变量结构为每个变量添加变量名标签,需要的话添加变量值标签,指定变量类型,这些操作和上面类似,就不再赘述了。调整变量顺序按钮选择变量按钮选择Excel Files后点此按钮 图1-
41、13 数据库向导窗口 图1-14 变量选择对话框变量名称中文改成英文变量长度改成8个字符 图1-15 案例选择对话框 图1-16 变量名、变量类型、长度等定义对话框1.2.3 从文本文件中读入数据文本格式文件是另外一大类数据存储格式,由于文本文件容量小,便于存储和传输,我们从互联网下载的数据,就有很多是用文本格式存储的;国外的很多研究机构和调查公司发布数据,也偏爱文本格式,因此,我们必须掌握将文本格式数据导入SPSS中,才能将数据文件的建立掌握的更全面。SPSS能够导入两种格式的文本文件,分别是后缀名为.txt和.dat的文件,从文本文件向SPSS导入数据相对比较复杂,我们也为读者准备了一个例子,用这个例子一步步讲解数据导入的过程。例1-4 在随书附赠的光盘中,有一个1-4.txt的文件,记录了一些个人信息数据,请将其读入SPSS中形成数据文件。Step1:选择【File】菜单【Read Text Data】进入如图1-9的打开文件对话框,然后在文件类型下拉菜单中选择“Text”,在文件列表中选中1-4.txt文件,点击“Open”,进入文本文件向导。 读者也可以选【File】菜单【Open】【Data】进入打开文件对话框,然后在文件类型下拉菜单中选择文本文件(后缀名为.txt),点击,同样会进入文本文件向导流
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 语文大专论述习作练习解答习题卷
- 货物运输与全球供应链协议
- 购车合同范本格式
- 购销石子合同协议
- 走进大别山人文世界
- 超市生肉采购合约
- 转学承诺保证书范本
- 软件系统解决方案服务合同
- 轻松学习英语选修外研版课件来助力
- 运动员公正竞赛自律
- 2024年演出经纪人之演出经纪实务真题(夺冠)
- 《精神障碍护理学》复习题及答案2022年
- GB/T 44013-2024应急避难场所分级及分类
- 《湖南省医疗保险“双通道”管理药品使用申请表》
- 《海滨小城》第二课时 公开课一等奖创新教学设计
- 仪器分析(山东联盟-青岛农业大学)智慧树知到期末考试答案2024年
- MOOC 宪法学-西南政法大学 中国大学慕课答案
- 中华民族共同体概论课件第七讲华夷一体与中华民族空前繁盛(隋唐五代时期)
- (正式版)SHT 3223-2024 石油化工给水排水泵站设计规范
- MOOC 航天推进理论基础-西北工业大学 中国大学慕课答案
- 第三单元名著导读《朝花夕拾》课件(共71张PPT)
评论
0/150
提交评论