第四周 数据录入与获取02_第1页
第四周 数据录入与获取02_第2页
第四周 数据录入与获取02_第3页
第四周 数据录入与获取02_第4页
第四周 数据录入与获取02_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2022-3-271外部数据的获取2022-3-272如果我们直接开启spss软件进行数据的录入与整理,那么数据创建后可以立即进行统计分析程序。但是如果我们不是使用spss数据编辑工作窗口来建立变量与数据文件,而是利用其它的软件来建立数据,则可以利用spss转文件的方法将数据文件输入在spss数据编辑窗口中。在实际工作中excel电子表格、access等数据处理软件非常普及,因此我们有必要学习常用格式但非spss数据文件的导入方法。2022-3-273对于spss格式的数据,只要选择【文件】【打开】【数据】菜单项,然后选择文件路径和文件名打开即可。如果不是spss格式的文件,也可以直接读入sp

2、ss,用spss进行分析。spss可以读入许多非spss默认类型的数据文件,方式主要有三种,包括直接打开、利用文本向导读入文本数据,以及利用数据库ODBC接口读取数据。对于这三种方法,下面将以常见的EXCEL格式的数据、TXT数据和ACCESS数据为例,介绍spss获取数据的功能。2022-3-2741.spss可支持的文件类型可支持的文件类型在spss中可以直接读入许多常用格式的数据文件,选择【文件】【打开】【数据】菜单项,或直接单击快捷工具栏上的快捷按钮,系统就会弹出【打开数据】对话框,在【文本类型】列表框中可以看到直接打开的数据文件格式,spss在这方面的兼容性做的非常出色,和许多常见的

3、数据格式都有直接读取的接口。2022-3-2752.读取读取excel文件程序(以文件程序(以spss自带文件自带文件demo.xls为例)为例)该文件位于spss安装目录下的samples子目录中。首先在excel中打开demo.xls,了解一下文件的结构,重点了解这样几项内容:第一,该文件中包含几个数据表,具体应打开哪个表;第二,如果不需要该表所有数据,而只需要读取一部分,这时需要了解要读入数据的精确位置,如单元格A2:F5;第三,此部分数据的第一行是否是变量名。从这个文件中可以看出,第一行是变量名,该文件只有一个表,要读取的是该表单中的全部数据。2022-3-276第一步,在“打开文件”

4、对话框中,选择路径(文件存储位置),选择文件类型excel(.xls),文件列表中出现所有的excel文件,单击demo.xls;第二步,打开如图所示对话框:在“工作表”下拉表框中选择一个表;在“范围”文本框中指定读取的数据的具体位置,用单元格的起(左上角单元格名称如A2)止(右下角单元格名称如F5)位置来表示,中间用冒号“:”隔开;上方的复选框用于确定单元格范围的第一行是否为变量名。指定完毕,单击“确定”按钮,数据就会被顺利的读入spss中。2022-3-277这种直接读取的方法要优于“复制+粘贴”,采用这种方法不仅可以顺利地进行变量名的转化,最重要的是可以直接读取字符型变量,若采用“复制+

5、粘贴”的方法,字符型 变量就会全部变成缺失值了,并且操作简单,不易出错,就和读取 s p s s 自 己 的 文 件 一 样 方 便 。2022-3-278spss可以通过两种菜单操作方式读取文本数据:一种是选择【文件】【打开文本数据】(检索)菜单项;另一种是选择【文件】【打开】【数据】菜单项,这两种操作是一样的,系统会弹出打开数据对话框,只是前者的文件类型自动跳到了text(*.txt),后者需要在“文件类型”下拉表框中进行选择。 2022-3-279与读取excel数据一样,首先打开该数据,观察这个数据基本结构,如变量间是固定宽度还是用某种分隔符区分,第一行是否为变量名等。然后关掉这个文本

6、文件。接着打开spss软件。首先,在“打开文件”对话框选择相应文件并单击“确定”按钮,系统会自动打开“文本导入向导”对话框,如图所示,从对话框标题可以看出该向导分为六步。 2022-3-2710(1)系统会首先询问有无预定义格式,如下图所示,如果有则在此处选择相应文件。一般而言,使用者所建立的数据文件通常不会符合预先定义的格式,因此选【否】选项,按【下一步】按钮。(2)在“第2步”对话框中,“变量是如何排列的?”按钮组中有两个选项:【分隔】、【固定宽度】,文本文件中如果以逗号、Tab键、空白字段来分隔变量,可以选取【分隔】按钮。(一般文本文件采取固定字段宽度的方式较为简便。因为使用者以分隔方式

7、创建文件较为不便。)如果变量间以空白字段来分隔变量,也可以采用【固定宽度】的方式。2022-3-2711“变量名称是否包括变量名称是否包括在文件顶部?在文件顶部?”按钮组有两个选项:【是】和【否】,如果文件中有变量名,则需要将点选【是】。如果文件没有把变量名输入在第一横行中,则需选择【否】。然后单击【下一步】按钮。2022-3-2712(3)第3步:“第一个第一个数据个案从哪个行号开数据个案从哪个行号开始?始?”可以点选相关的数值,默认值为1,表示数据的第一个个案从第一个横行开始。如果数据文件不是从第一横行开始,则需要更改。(这里主要要考虑数据文件第一行是否为变量名)2022-3-2713“如

8、何表示个案?如何表示个案?”按钮组按钮组用于设置个案的表示方式,绝大数情况下点选“每一行表示一个个案”即可。“您要导入多少个个案您要导入多少个个案?”按钮组有三个选项:全部个案、前多少个个案、个案的随机百分比。“全部个案”选项表示将读入全部数据文件的个案。“前多少个个案”选项表示读入数据文件前多少笔的观察值,内定值为1000,若我们只要读取前200笔观察值的数据,则方格中的数字键入200;“个案的随机百分比”后面的方格中可设定数值,内定为10%,表示读入全部数据文件中的10%的观察值。2022-3-2714(4)第四步:第四步:进行变量分隔符和文本限定符设定。“变量间有哪些分隔符”,一般情况下

9、spss会自动识别。如果数据文件中字符串变量使用限定符进行了分隔,则需要在右边的文本限定符单选按钮进行设定。(5)第五步)第五步:对变量进行进一步属性设置,包括更改变量名和数据格式,在数据预览窗口中选择某一变量即可进行操作。(6)第六步:)第六步:用于设定是否希望重复利用本次操作的选择,可以考虑将这次的文件设定保存为预定义格式文件,或者将其粘贴为语法。一般情况下,按默认设定即可。最后,单击【完成】则向导结束,随后即可看到spss成功读入了该文本数据。2022-3-2715介绍固定宽度固定宽度格式文本数据导入spss的过程。读取文本文件固定宽度2022-3-2716如何判断变量排列类型?文本导入

10、向导第2步中的“变量是如何排列的?”按钮组是导入txt格式数据的一个重难点,比较难理解。“分隔”和“固定宽度”是该按钮组表示的变量排列的两种方式。选择不同的排列方式,后续的设置也有所不同。那我们如何判断数据文件中的变量类型呢?其实很简单。我们只要理清一个思路,那就是:我们将txt等格式数据导入spss,其逻辑是:我们是这个数据的创建者或者完全熟悉者,我们用txt、excel或者Access保存数据,是由我们决定的,数据以什么样的形式输入到txt、excel、access中去也是由我们决定的。也就是说,我们是完全“懂得”这个文件中数据呈现形式背后的含义的。2022-3-2717请体会下面的两个数

11、据文件。2022-3-2718所以判断变量排列类型的关键是我们“读懂”了这个txt数据的意义。比如说,上面的数学效能的txt数据,我们开始是看不懂的,因为这是别人的数据,我们只看到两大排数据,我们不明白到底有多少个变量,多少个个案。当他把这个数据的意义告诉我们的时候,(也就是数学效能excel数据呈现的内容)我们终于明白,原来这个txt数据的变量有多个,在输入到txt中去的时候,他将变量值都排在了一起。现在我们终于读懂了这个数据,像这种各变量“混”在一起的txt数据,我们肯定要在后面的设置中将这些变量“拉开来”,使其呈现真实面目。像这种将各个变量“混在一起“的txt格式数据,其变量排列类型就是

12、”固定宽度“。2022-3-2719那什么是间隔型的数据呢?很简单,间隔型的数据就是“一眼就能看得懂”的数据。体会下列数据。左边数据在左边数据在txt中排列的很整齐,很容易让人看懂,这个数据本质上是按中排列的很整齐,很容易让人看懂,这个数据本质上是按照空白字段将变量和值隔开的,所以理所应当是照空白字段将变量和值隔开的,所以理所应当是“间隔型间隔型”。而右边的数据。而右边的数据看起来有点乱,不过,仔细看,我们发现虽然数据排列不整齐,但是我们看起来有点乱,不过,仔细看,我们发现虽然数据排列不整齐,但是我们还是能读懂或者说看得明白这个数据,在这种情况下,该数据也是还是能读懂或者说看得明白这个数据,在

13、这种情况下,该数据也是“间隔间隔”型。实际上它真的是型。实际上它真的是“间隔间隔”型数据,因为,间隔型数据的本质意义就是说型数据,因为,间隔型数据的本质意义就是说,txt中数据变量是按照一定的方式间隔的,这种间隔保持了数据原有的中数据变量是按照一定的方式间隔的,这种间隔保持了数据原有的真实的呈现形式和意义。真实的呈现形式和意义。2022-3-2720spss可以直接读取很多类型的数据文件,对于不能直接打开的数据格式,spss提供了利用通用的数据库ODBC接口读取数据的方法。这里依然以spss自带文件demo.mdb为例来介绍如何使用数据库查询方法读取这个文件。首先,选择【文件】【打开数据库】【

14、新建查询】菜单项,系统会自动打开数据库向导的第一个对话框,其中会列出本机上已经安装的所有数据源,如图所示:其中列出了需要的MS Access DataBase数据源。2022-3-2721选中并单击【下一步】按钮,则打开ODBC驱动程序登陆对话框,要求选择数据库文件,在该对话框中选中demo.mdb文件并单击【确定】按钮,系统就会进入数据库向导的第2个对话框,采用拖放式操作将所需变量拖入右侧列表框中。数据库向导的第3、4部用于进行数据的选择性读入、字符串到数值与值标签的转换等操作。第5步则提供了将生成的SQL语句保存为文件以供再次使用,以及将前面的指定粘贴成Syntax语句等功能。一般情况下这些设置我们都不需要,可以直接在第2步时直接单击【完成】按钮,数据就被成功导入了。2022-3-2722将下

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论