第2章SPSS 数据文件的管理_第1页
第2章SPSS 数据文件的管理_第2页
第2章SPSS 数据文件的管理_第3页
第2章SPSS 数据文件的管理_第4页
第2章SPSS 数据文件的管理_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、q1 数据的编辑数据的编辑q2 变量的操作变量的操作1 数据的编辑q1.1 单元值的修改q1.2 增加和删除一个个案q1.3 数据的排序q1.4 数据的行列互换q1.5 选取个案子集q1.6 重复个案识别q1.7 数据分类汇总q1.8 缺失值的替代q1.9 数据次序确定1 1.1 .1 单元值的修改单元值的修改 由于各种原因,已经输入的数据有时会需要修改,由于各种原因,已经输入的数据有时会需要修改,这就需要进行编辑,可用方向键或鼠标将黑框移动这就需要进行编辑,可用方向键或鼠标将黑框移动到要修改的单元,键入新值。到要修改的单元,键入新值。 1 1.2 .2 增加和删除一个个案(增加和删除一个个案

2、(CaseCase)1 1增加一个新的个案(即增加一个新的行)增加一个新的个案(即增加一个新的行)2 2删除一个个案删除一个个案1 1.3 .3 数据的排序数据的排序 在数据文件中,可根据一个或多个排序变量的在数据文件中,可根据一个或多个排序变量的值重排个案的顺序。值重排个案的顺序。 注意:是整个案例一起变动排序,而不是仅仅变量变动,多重排序时,指定排序变量的次序很重要,注意保留原来顺序的文件,以免发生混乱。1 1.3 .3 数据的排序数据的排序排序的目的:q有时需要改变数据排列的顺序,按照一定的顺序重新排列;q便于浏览,了解数据的整体情况;q便于找出最大最小值;q能够快捷的发现异常值;q可以

3、按照一个或者多个变量排序。1 1.4 .4 数据的行列互换数据的行列互换1 1.5 .5 选取个案子集选取个案子集 1 1.5 .5 选取个案子集选取个案子集条件表达式可使用现有变量名称、常数、算术运算符、逻辑运算符、关系运算符和函数。q点击点击Filter out unselected cases ,会生成一个名为,会生成一个名为filter_$的新变量,表示选中还是没有选中,一旦该变量被删除,的新变量,表示选中还是没有选中,一旦该变量被删除,将自动取消样本抽样;将自动取消样本抽样;q点击点击Deleted unselected cases ,不符合条件的个案将被删,不符合条件的个案将被删除

4、,保存文件后将无法恢复;除,保存文件后将无法恢复;q完成以上操作后,完成以上操作后, SPSS的分析只对那些选中的个案进行,的分析只对那些选中的个案进行,直到用户重新选取。直到用户重新选取。q点击点击Copy selected cases to a new dataset,可生成一个新,可生成一个新的文件,只包含符合条件的个案。对当前文件没有影响。的文件,只包含符合条件的个案。对当前文件没有影响。1 1.5 .5 选取个案子集选取个案子集 1 1. .6 6 重复个案识别重复个案识别 1 1. .7 7 数据分类汇总数据分类汇总 用户还可对数据编辑器中的数据按指定变量的数用户还可对数据编辑器中

5、的数据按指定变量的数值进行归类分组汇总。值进行归类分组汇总。 SPSSSPSS中实现数据文件的分类汇总需要中实现数据文件的分类汇总需要3 3个步骤个步骤: : 首先,需要指定分类变量和汇总变量。首先,需要指定分类变量和汇总变量。 然后,计算机根据分类变量的若干个不同取值将然后,计算机根据分类变量的若干个不同取值将个案数据分成若干类,并对每类个案计算汇总变量个案数据分成若干类,并对每类个案计算汇总变量的描述统计量。的描述统计量。 最后,将分类汇总计算结果保存到一个文件中。最后,将分类汇总计算结果保存到一个文件中。1 1. .8 8 缺失值的替代缺失值的替代1 1. .9 9 数据次序确定数据次序

6、确定 Proportion estimated:比例估计,是以:比例估计,是以一个特别秩次对应分布的累积比的估计一个特别秩次对应分布的累积比的估计Normal score:正态分数:正态分数1 1. .9 9 数据次序确定数据次序确定平均秩次、最小值、最大值或当作一个记录处理 2 变量的操作q2. 1 2. 1 增加和删除一个变量增加和删除一个变量q2 2.2 .2 指定加权变量指定加权变量q2.3 2.3 根据已存在的变量建立新变量根据已存在的变量建立新变量q2.4 2.4 产生计数变量产生计数变量q2.5 2.5 变量的重新赋值变量的重新赋值q2.6 2.6 变量的自动赋值变量的自动赋值q

7、2.7 2.7 变量定义信息的查询变量定义信息的查询q2.8 2.8 变量集的定义和使用变量集的定义和使用q2. 2.9 9 数据文件的合并数据文件的合并q2. 2.1010 数据文件的分组数据文件的分组2. 1 2. 1 增加和删除一个变量(增加和删除一个变量(VariableVariable)1 1)增加一个变量)增加一个变量(1 1)菜单操作法;)菜单操作法;(2 2)选中某列法,右击;)选中某列法,右击;(3 3)Variable ViewVariable View标签页法。标签页法。 2 2)删除一个变量)删除一个变量 删除一个变量,即删除一列数据。其方法和上面的增加删除一个变量,即

8、删除一列数据。其方法和上面的增加一个变量相对应。例如,要删除第一个变量相对应。例如,要删除第5 5个变量列,则可先单击第个变量列,则可先单击第5 5列的列头,这时整个第列的列头,这时整个第5 5列被选中,然后按列被选中,然后按“DeleteDelete”键或选键或选择择“EditEdit”菜单的菜单的“ClearClear”命令,或者单击鼠标右键,在其快命令,或者单击鼠标右键,在其快捷菜单中选择捷菜单中选择“ClearClear”项,该列即被删除。项,该列即被删除。2. 1 2. 1 增加和删除一个变量(增加和删除一个变量(VariableVariable) 在变量浏览窗口,单击变量的行头,这

9、时整个行被选中,在变量浏览窗口,单击变量的行头,这时整个行被选中,然后单击鼠标右键,在其快捷菜单中选择然后单击鼠标右键,在其快捷菜单中选择“ClearClear”项。项。2 2.2 .2 指定加权变量指定加权变量 在实际的统计中,经常需要计算数据的加权平在实际的统计中,经常需要计算数据的加权平均数。例如,希望了解某超市中某天售出商品的平均数。例如,希望了解某超市中某天售出商品的平均价格。如果仅以各种商品的单价平均数作为平均均价格。如果仅以各种商品的单价平均数作为平均价格是不合理的,还应考虑到各商品的销售量对平价格是不合理的,还应考虑到各商品的销售量对平均价格的影响。因此,以商品的销售量作为权重

10、计均价格的影响。因此,以商品的销售量作为权重计算各种商品单价的加权平均数,才是我们需要求的算各种商品单价的加权平均数,才是我们需要求的数据。在数据。在SPSSSPSS处理中就需要将商品销售量作为加权处理中就需要将商品销售量作为加权变量。变量。 2.3 2.3 根据已存在的变量建立新变量根据已存在的变量建立新变量 有时需要通过对已经存在的变量进行处理,从有时需要通过对已经存在的变量进行处理,从而生成新的变量。选择而生成新的变量。选择“Transform”菜单的菜单的“Compute Variable”项,弹出项,弹出 “Compute Variable”(计算变量)对话框。在该对话框中的(计算变

11、量)对话框。在该对话框中的“Target Variable(目标变量)(目标变量)”框中输入符合变量命名规则框中输入符合变量命名规则的变量名,目标变量可以是现存变量或新变量。的变量名,目标变量可以是现存变量或新变量。 - -2.4 2.4 产生计数变量产生计数变量 在统计过程中,往往需要进行一些计数工作。在统计过程中,往往需要进行一些计数工作。产生计数变量就是实现计数功能,它对所有个案或产生计数变量就是实现计数功能,它对所有个案或满足一定条件的个案,计算若干个变量中有几个变满足一定条件的个案,计算若干个变量中有几个变量的值落在指定的区间内,并将计数结果放入一个量的值落在指定的区间内,并将计数结

12、果放入一个新变量中。新变量中。 -单个值;系统缺失值;系统缺失值或者用户缺失值;最大最小值区间;小于等于最大值的区间;大于等于最小值的区间。2.5 2.5 变量的重新赋值变量的重新赋值 在数据编辑过程中,用户可对个案的某个变量的数在数据编辑过程中,用户可对个案的某个变量的数值重新赋予新值。该操作只适用于数值型变量。值重新赋予新值。该操作只适用于数值型变量。 在在“Transform”菜单中的有菜单中的有“Into Same Variables”和和“Into Different Variables”两种赋值方两种赋值方法供选择。其中法供选择。其中“Into Same Variables”是对变

13、量自是对变量自身重新赋值;身重新赋值;“Into Different Variables”是赋值到其是赋值到其变量或新生成的变量。变量或新生成的变量。 当相邻组的组限间断时,区间的上、下限均计入当相邻组的组限间断时,区间的上、下限均计入对应组;对应组; 当相邻组的组限重叠时,则遵循当相邻组的组限重叠时,则遵循“先定义的区间先定义的区间优先优先”原则,即重叠的组限值计入第一次出现该原则,即重叠的组限值计入第一次出现该值的组;值的组; 对于离散变量,应尽可能地采用间断组限;对于离散变量,应尽可能地采用间断组限; 对于连续变量,为实现对于连续变量,为实现“上组限不计入上组限不计入”,应按,应按照变量

14、值从高向低依次定义各组区间;为实现照变量值从高向低依次定义各组区间;为实现“下组限不计入下组限不计入”,应按照变量值从低向高依次,应按照变量值从低向高依次定义各组区间。定义各组区间。 在上述两种赋值情况下,用户均可通过单击在上述两种赋值情况下,用户均可通过单击“If”If”按钮指定条件,来确定参与重新赋值的个案。按钮指定条件,来确定参与重新赋值的个案。 与前面根据已存在的变量建立新变量方法不同的与前面根据已存在的变量建立新变量方法不同的是:变量的重新赋值是:变量的重新赋值RecodeRecode不能进行运算,只能根据不能进行运算,只能根据指定变量值作数值转换,且这种转换是单一数值的指定变量值作

15、数值转换,且这种转换是单一数值的转换。转换。2.6 2.6 变量的自动赋值(变量的自动赋值(Automatic RecodeAutomatic Recode) 变量的自动赋值可以将字符型、数字型数值转变量的自动赋值可以将字符型、数字型数值转变成连续的整数(排序),并将结果保存在一个新变成连续的整数(排序),并将结果保存在一个新的变量中,其中字符型数据按照字母的顺序排序的变量中,其中字符型数据按照字母的顺序排序(大写字母优于小写字母)。(大写字母优于小写字母)。 新变量将保留原变量标签和变量值标签,同时新变量将保留原变量标签和变量值标签,同时新变量的值按原变量的顺序重新赋予从新变量的值按原变量的

16、顺序重新赋予从1 1开始的连续开始的连续整数值;如果原变量没有标签,新变量将原变量值整数值;如果原变量没有标签,新变量将原变量值作为新变量的变量值标签。作为新变量的变量值标签。 2.7 2.7 变量定义信息的查询变量定义信息的查询 在在SPSSSPSS数据编辑窗口中的数据编辑窗口中的“Variable ViewVariable View”标签中可以看到变量的定义信息,在其中还可标签中可以看到变量的定义信息,在其中还可以进行修改。在以进行修改。在SPSSSPSS的的“UtilitiesUtilities”菜单中还提菜单中还提供了变量信息的查询功能。供了变量信息的查询功能。2.8 2.8 变量集的

17、定义和使用变量集的定义和使用 在在SPSSSPSS的统计过程中,有时候收集到的变量会的统计过程中,有时候收集到的变量会有很多个。在进行各种数据处理和统计分析时,所有很多个。在进行各种数据处理和统计分析时,所有变量都会显示在各个处理对话框的变量列表框中有变量都会显示在各个处理对话框的变量列表框中供用户选择。在众多变量中选择几个变量进行处理供用户选择。在众多变量中选择几个变量进行处理以及分析是很麻烦的,尤其是对于某几个经常需要以及分析是很麻烦的,尤其是对于某几个经常需要进行操作的变量。进行操作的变量。SPSSSPSS提供了变量集(提供了变量集(Variable SetVariable Set)的概

18、念,可以很好地解决上面所提出的问题。的概念,可以很好地解决上面所提出的问题。1 1)变量集的定义)变量集的定义变量集是指一些变量的集合。变量集是指一些变量的集合。SPSS变量集的分类:变量集的分类:q系统变量集系统变量集是是SPSS系统已经定义好的,它包括以系统已经定义好的,它包括以下两个集合:下两个集合:q ALL VARIABLES:存放数据编辑窗口中所有的变量。:存放数据编辑窗口中所有的变量。q NEW VARIABLES:存放数据编辑窗口中所有尚未保存:存放数据编辑窗口中所有尚未保存的新定义变量。的新定义变量。q用户自定义变量集用户自定义变量集是用户根据实际数据分析需要定是用户根据实际

19、数据分析需要定义的,它可以有许多个。一般把需要经常处理的、义的,它可以有许多个。一般把需要经常处理的、处理过程类似的若干个变量存放在一个用户自定义处理过程类似的若干个变量存放在一个用户自定义变量集中。变量集中。2 2)定义用户变量集)定义用户变量集3 3)用户变量集的使用)用户变量集的使用 如果仅仅定义用户变量集,而没有指定如果仅仅定义用户变量集,而没有指定SPSSSPSS使用使用该变量集,那么这个定义的用户变量集是不会自动该变量集,那么这个定义的用户变量集是不会自动发生作用的。也就是说用户应该告知发生作用的。也就是说用户应该告知SPSSSPSS系统要使系统要使用哪个变量集。用哪个变量集。 S

20、PSSSPSS默认使用系统变量集,也就是说,默认使用系统变量集,也就是说,SPSSSPSS默认默认在数据处理中,屏幕上列出数据文件所有的变量。在数据处理中,屏幕上列出数据文件所有的变量。如指定如指定SPSSSPSS使用用户定义的变量集,那么在分析时,使用用户定义的变量集,那么在分析时,屏幕上就会只列出用户变量集中的那几个变量,从屏幕上就会只列出用户变量集中的那几个变量,从而简化了变量的选择过程。而简化了变量的选择过程。 统计分析的首要任务是将数据输入到计算机中。统计分析的首要任务是将数据输入到计算机中。在数据量较大时,经常需要将一份大的数据文件分在数据量较大时,经常需要将一份大的数据文件分成几

21、个小部分,分别由几个人输入,然后将若干个成几个小部分,分别由几个人输入,然后将若干个小的数据文件合并成一个大的数据文件。小的数据文件合并成一个大的数据文件。 数据文件的合并有两种方式:纵向合并和横向合数据文件的合并有两种方式:纵向合并和横向合并。并。 在纵向合并的两个数据文件中,数据含义不同的变量,在纵向合并的两个数据文件中,数据含义不同的变量,变量名不应取相同的名称。变量名不应取相同的名称。 必须有一个相同的公共变量,是两个数据文件横向对应连接必须有一个相同的公共变量,是两个数据文件横向对应连接的依据。合并前先按照该公共变量排序。的依据。合并前先按照该公共变量排序。2. 2.1010 数据文

22、件的分组(数据文件的分组(SplitSplit) 在统计中,经常需要先按某个变量进行分组,在统计中,经常需要先按某个变量进行分组,然后再求各个组的统计分析。例如,想分别了解男然后再求各个组的统计分析。例如,想分别了解男生和女生的成绩情况。这时就需要按照性别变量,生和女生的成绩情况。这时就需要按照性别变量,进行数据文件的分组(这种分组是系统内定义的,进行数据文件的分组(这种分组是系统内定义的,在数据管理器中并不一定明确体现,故亦可称之为在数据管理器中并不一定明确体现,故亦可称之为分割)。分割)。 用户一旦设置了分组,那么此后的所有分析都用户一旦设置了分组,那么此后的所有分析都将按这种分组进行,除非取消数据分组的命令。将按

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论