数据文件的处理PPT课件_第1页
数据文件的处理PPT课件_第2页
数据文件的处理PPT课件_第3页
数据文件的处理PPT课件_第4页
数据文件的处理PPT课件_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 数据文件的处理数据文件的处理是指把科研、教学工作过程中的各种信息、数据(Data)以某种方式存入到计算机的磁盘中,并进行随时存取、修改、统计分析的全过程。一般来说,它包括数据编码、建立数据文件的框架结构、数据录入、选定数据文件名及保存数据等几个步骤。第1页/共33页第二章第二章 数据文件的处理数据文件的处理数据编码 定义变量 数据录入 数据编辑 第2页/共33页数据编码数据编码: : 根据一定的规则将研究资料转换为可进行统计分析的数码资料的过程。问题问题025:您认为打工的外地人对北京市的社会秩:您认为打工的外地人对北京市的社会秩序是否有影响?(单选)序是否有影响?(单选)1有很大影响 2有

2、较大影响 3没有影响 4不好说 4编码答案第3页/共33页编码的步骤:编码的步骤:1)确定变量;变量:用来反映文意概念的量化形式。在统计中往往指最小的分析单位。编码就是对变量进行编码。变量由两个部分构成:变量名和变量值。要注意区分何为变量,何为变量值。在调查问卷中还要注意区分问题和变量。第4页/共33页问题问题009:您有几个儿子?几个女儿?:您有几个儿子?几个女儿? 1儿子_人 2女儿_人 23问题变量1变量2变量1的值变量2的值第5页/共33页2)制作编码表第6页/共33页变量名变量名码位码位码数码数尺度尺度编码编码不适用不适用不知道不知道未回答未回答缺失值缺失值备注备注num1-44In

3、tervalDirectW0151CategoryD99W01a6-72ID9999W0281CD99W0391OrdinalD99W04101OD0,9W05.1111C0-199W05.2121C0-199W05.3131C0-199W05.4141C0-199W05.5151C0-199W05.6161C0-199W05.7171C0-199W06181CD99W07191CD79W08.120-212ID97989999W08.222-232ID97989999W08.324-252ID97989999直接过录0-1编码变量名: 一个数据文件中,一个变量只能有一个唯一名称。码位:某一变

4、量在数据文件中占据的栏位码数:某一变量由几位数组成。该变量是数值型(Numeric)如定距、定比,还是字串型(String),如定类、定序。前者在统计中可以做高级运算,后者则不可以。不适于被访人回答的问题的编码。一般采用7,97,997等。被访人回答不知道时的编码。一般采用8,98,998等。被访人拒绝回答某变量时的编码。一般采用9,99,999等。问卷中出现漏答时的处理编码。一般采用9,99,999等。第7页/共33页问题问题 001:您的性别:您的性别:1男2女问题问题 002:您目前的婚姻状况:您目前的婚姻状况(单选) :(单选) :1未婚2已婚3离婚后未再婚4离婚后再婚5丧偶后未再婚6

5、丧偶后再婚7未婚同居23第8页/共33页100011第9页/共33页3)编码:根据编码表对问卷进行编码,而后将编码结果记录在问卷上或编码纸上。第10页/共33页定义变量:定义变量:即即定义变量名定义变量名、变量类型变量类型、变量长度变量长度、变量名标签变量名标签、变量值标签变量值标签和缺失值缺失值等等。定义变量名(Name)的要求:变量名不能超过8个字符;变量名不能以数字开头;变量名中不能包含,/、?、等运算和逻辑符号。变量名必须唯一,系统中不区分变量名中的大小写字符。第11页/共33页第12页/共33页 定义变量类型(定义变量类型(TypeType)Numeric数值型数值型Comma加显逗

6、号的数值型,即整数部分每加显逗号的数值型,即整数部分每3位数加一个位数加一个逗号,其余定义方式同数值型逗号,其余定义方式同数值型Dot3位加点数值型,无论数值大小,均以整数形式位加点数值型,无论数值大小,均以整数形式显示,每显示,每3位加一小点,可定义小数位置,但都位加一小点,可定义小数位置,但都显示显示0,且小数点用逗号表示。,且小数点用逗号表示。Scientific N0tation科学计数法科学计数法Date日期型日期型Dollar带有美元符号的数值型带有美元符号的数值型Custom currency用户自定义型用户自定义型String字符串型字符串型第13页/共33页第14页/共33页

7、第15页/共33页第16页/共33页变量名标签定义命令:Variable labels 该命令是给变量名一个说明标注。命令格式: Variable labels 变量1名 标签 /变量2名 标签 /变量3名 标签 /变量n名 标签 .第17页/共33页示例:Variable Labels num Variable Labels num 编号 /W01 /W01 性别/W01a /W01a 出生年 /W02 /W02 婚姻状况 /W03 /W03 文化程度 . .或: Variable Labels Variable Labels num num 编号 /W01 /W01 性别/W01a /W0

8、1a 出生年 /W02 /W02 婚姻状况 /W03 /W03 文化程度 . .或: Variable Labels Variable Labels num num 编号 W01 W01 性别W01a W01a 出生年 W02 W02 婚姻状况 W03 W03 文化程度 . .第18页/共33页要求:变量名要和已定义过的名称相一致;标签用中、西文均可,但长度不要超过120个字符,即60个汉字。第19页/共33页第20页/共33页变量值标签定义命令:Value labels该命令是给变量的每一取值加一个说明标注。格式: Value Labels 变量名 值1 标签 值2 标签 值3 标签 /变量

9、名 值1 标签 值2 标签 值3 标签 .第21页/共33页第22页/共33页第23页/共33页第24页/共33页第25页/共33页数据录入外部式录入内部式录入采用DOS、WPS、CCED等软件,按ASCII码方式录入成文本文件(*.dat;*.txt)。这种录入方式的特点是,数据之间没有间隔,录完一个数码后自动后移,录入速度较快。缺点是容易错位。采用SPSS数据编辑器(SPSS Data Editor)录入。其优点是不容易错位,缺点是不能自动后移,录入速度慢,数据错误不容易修改。第26页/共33页数据编辑命令数据编辑命令 数据搜索 按指定观察量序号搜索:Data Go to Case 搜索指

10、定数据:Edit Find 数据排序:Data Sort Cases(对观察量进行排序) 数据行列互换: Data Transpose第27页/共33页数据编辑命令数据编辑命令数据子集的选择:Data Select Cases All cases:选择所有的观察量,该选项可以用于解除先前的选择。 If condition is satisfied:按指定条件选择。 Random sample of cases:对观察单位进行随机抽样。 Based on time or case range:顺序抽样。 Use filter variable:用指定的变量做过滤器。第28页/共33页数据编辑命令

11、数据编辑命令 数据的分类汇总: Data Aggregate 数据次数的确定: Transform Rank Cases 数据重新编码: Transform Recode第29页/共33页数据编辑命令数据编辑命令 产生计数变量:Transform Count 产生分组变量: Transform Categorize Variables 数据文件的拆分:Data Split File 数据文件的合并: Add Cases(纵向合并) Data Merge File Add Variables (横向合并)第30页/共33页练习练习 表1是10个学生的资料,要求:(1)定义变量,录入数据并将文件存储位SPSS类型的文件;(2)搜索高考分数为607分的纪录;(3)对该文件按照高考分数分别进行降序、升序排序;(4)将政治面貌为团员的学生记录选择出来;(5)根据高考分数分别产生计数变量和分组变量;(6)进行数据文件的拆分和合并。第31页/共33页表表1 101 10个学生的资料个学生的资料姓名姓名性别性别籍贯籍贯高考分数高考分数 民族民族政治面貌政治面貌李菊李菊张力张力刘美刘美李慧李慧孙浩孙浩何峰何峰李晓林李晓林黄晴黄

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论