SAS系统和数据分析输入输出格式_第1页
SAS系统和数据分析输入输出格式_第2页
SAS系统和数据分析输入输出格式_第3页
SAS系统和数据分析输入输出格式_第4页
SAS系统和数据分析输入输出格式_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五课 输入输出格式一、 SAS数据集中变量的类型SAS共有两种类型的变量:l 字符型变量以ASCII码存放,最大长度不超过200字符l 数据型变量以浮点数存放,长度为8个字节SAS数据集的矩阵式结构要求每个观测的每个变量值都必须存在,因此如果某个数据值缺失,系统会自动补上一个缺失值。对于数字型变量,这个值显示为一个点“.”,而对于字符型变量,这个值显示为空格。二、 输入和输出格式SAS数据集的数据值的内部存放格式并不一定与该数据值的输入和输出格式一致,这取决于SAS的两个重要功能:输入格式(Informats)和输出格式(Formats)。输入格式指示SAS系统如何读入数据,而输出格式指示S

2、AS系统如何输出数据。它们的一般形式如下:l 输入格式:informat.l 输出格式:format.其中,$符号指示这是个字符输入输出格式,没有$符号表示是数值输入输出格式;Informat是一个输入格式的名字,format是一个输出格式的名字;w是宽度值,对许多输入输出格式这个值是输入输出数据的列数;d在数值输入输出格式中是小数部分的长度;点“.”是所有输入输出格式中必须包含的分隔符,作为名字的一部分。如果在格式中省略w和d值,SAS系统使用缺省的值。在SAS系统6.12版本中有五类输入格式,字符输入格式共有14种,数值输入格式共有35种;四类输出格式,字符输出格式共有13种,数值输出格式

3、共有41种。三、 日期时间值在SAS系统中的存储当变量的值表示日期、时间和日期时间时,在这种特殊的情况下,用户还需了解日期时间值在SAS系统中是怎样被存储的。SAS系统存储日期值为:l 1960年1月1日和这个日期之间的天数例如,1962年3月8日被存储为797(即366+365+31+28+7),1958年10月1日被存储为457(即365313031)。SAS系统存储时间值为:457l 从午夜开始到此刻的秒数例如,8:18存储为29880(86060+1860)。一个日期时间值存储为1960年1月1日午夜到这个日期时间之间的秒数。例如,1962年3月8日8:18存储为6915960(797

4、24360+29880)。SAS系统6.12版本提供了17种日期、时间和日期时间的输入格式,31种输出格式。四、 几种常用的输入输出格式如表5.1所示。表5.1 常用的输入输出格式主要的输入输出格式名描述w.d标准的数值数据型格式$w.标准的字符数据型格式COMMAw.d含有逗号、小数点的数值数据型格式DOLLARw.d含有美元号$、逗号和小数点的数值数据型格式DATEw.日、月份、年形式的日期值(ddmmmyy),例如,w=7时,18jan97; w=9时,18jan1997MMDDYYw.月份、日、年形式的日期值(mmddyy),例如,w=8时,01/18/97; w=6时,011897五

5、、 数据格式变换举例设有一个SAS数据集survey,其中有一个数字变量INCOME和一个日期变量BDATE,针对不同的采样数据格式,我们对变量采用对应的输入格式,得到在SAS系统中实际存储的数据值,然后根据报表的输出要求,选定一种输出格式,将实际存储的数据值按所选输出格式显示结果。如表5.2所示。表5.2 INCOME 和BDATE变量的输入输出格式输入数据变量和输入格式实际存储数据值变量和输出格式显示结果12345.1234Income 8.212345.12Income 8.212345.1212,345.1234Income comma8.212345.12Income comma8.

6、212,345.12$12,345.1234Income dollar8.212345.12Income dollar8.2$12,345.1208MAR62Bdate date7.797Bdate mmddyy6.03086203/08/62Bdate mmddyy8.797Bdate date9.08MAR1962第六课 建立SAS系统的数据集(ASSIST)得到SAS数据集的五种途径l 用SAS/ASSIST 通用菜单系统创建数据集l 用SAS/FSP系统的FSEDIT过程创建数据集l 用SAS数据步(DATA STEP)将外部文件转换为数据集l 用SAS/ACCESS系统访问其他数据库

7、l 用FILE/IMPORT或EXPORT输入输出数据库其中,如何使用SAS数据步读入外部原始数据文件,并将它们转换为SAS数据集是我们要重点掌握的。一、 用ASSIST通用菜单援助系统创建数据集下面我们通过创建一个SURVEY数据集,并用报表形式显示的例子,来说明SAS/ASSIST软件的具体的操作步骤。1. 启动SAS/ASSIST软件最简单的方法是单击工具拦上的SAS/ASSIST按钮,或选择菜单命令:l Globals/SAS/ASSIST或在左上角的命令框直接键入Assist并按Enter键,都可启动SAS/ASSIST软件,主菜单如图6.1所示。共有11个子系统:TUTORIALD

8、ATA MGMT (DATA Management)REPORT WRITINGGRAPHICSDATA ANALYSISPLANNING TOOLSEISREMOTE CONNECTRESULTSSETUPINDEX图6.1 SAS/ASSIST软件的主菜单2. 选择主菜单中的DATA MGMT(数据管理)项选择主菜单上的DATA MGMT(数据管理)子菜单,如图6.2所示。图6.2 数据管理的主菜单3. 选择CREATE/IMPORT(创建数据集或输入数据)的方法选择CREATE/IMPORT菜单后,提供几种创建数据集的方法供用户选择,如图6.3所示。假设我们:(1) 选择用交互式方法录入

9、数据:l Enter data interactively.(2) 选择第二种以表格的形式输入记录的方式图6.3 创建和输入菜单图6.4 选择以表格的形式输入记录的方式如图6.4所示,又提供了两种输入观测的方法供用户选择:Enter data one record at a time(一次输入一条记录的方式)和Enter data in tabular form(以表格的形式输入)。假设我们选择第二种以表格的形式输入记录的方式。4. 指定新创建数据集的名字和说明是永久的或临时的在选定数据输入方式后,系统出现一个如图6.5所示的窗口:Select a New SAS Data Set to Cr

10、eate。让用户指定要创建的新数据集名字并说明该数据集是临时的(Temporary)或永久的(Permanent)。若是永久的,还必须在已有库标记中指定一个。例如,我们在Data Set中 :l 输入数据集的名字:SURVEYl 单击单词Temporary系统自动出现提示In temporary library:WORK,已指定临时库标记为WORK;最后单击OK,这时系统生成一个名为SURVEY的空数据集。图6.5 创建临时数据集SURVEY5. 命名和描述新建数据集中的变量在输入SAS数据集名字SURVEY和选定Temporary并OK确定后,系统显示如图6.6所示一个标题为:ASSIST:

11、NEW WORK.SURVEY(E)的菜单。在屏幕中共列出五项数据集的描述项:Name,Type,Length,Label,Format。可以让用户输入数据集的变量名、变量类型、长度、标签和格式。其中只有Name(变量名)是必需的,其他几项若用户没有特殊要求可使用SAS系统提供的缺省值。例如,我们为数据集Work.Survey,在Name、Type和Format三项上输入了如图6.6所示的相应描述值。因为变量NAME和SEX是字符型变量,所以在Type项上需要说明“$”。变量描述完毕后选择菜单命令File/End。图6.6 描述临时数据集SURVEY的变量6. 用步骤3确定的方法输入观测的值接

12、着系统显示FSVIEW窗口,如图6.7所示。用户可以用交互的方式输入数据集的观测值,因为在步骤三中确定的是以表格的形式输入观测,所以出现的是全屏幕输入界面。输入数据时,要注意使键盘上的Insert键处于非插入状态。每输入完一条观测后,还可以返回上面已输入的观测进行立即修改,只要单击所需要修改的观测,左右移动光标到某位置进行修改。FSVIEW窗口菜单栏上的一个Delete工具按钮,可用来删除当前选中的观测。当所有观测都输入完毕后,选择菜单命令File/End来存储这个SAS数据集。图6.7 在FSVIEW全屏幕编辑窗口输入各条观测选择REPORT WRITING(编写报表)通过连续选择菜单界面的

13、Goback项,返回到Primary Menu主菜单后,选择REPORT WRITING(编写报表)。7. 选择LISTING(列表显示)在Report Writing Menu菜单中选择第一个LISTING子菜单。如图6.8所示,在SAS/ASSIST:List a Data Set对话界面让用户做以下几方面的选择:l 给出生成报表的那个SAS数据集的名字。单击Active data set按钮,在Directory目录对话框的列表栏中,通过单击选择数据集SURVEY,被选中的数据集前带有一个“*”号。l 用户可以通过单击选项Subset data按钮,选择子集。l 用户可以通过单击选项Va

14、riables to appear in report按钮,选择出现在报表中的变量,如NAME、SEX、AGE和INCOME,选择的方法是单击一下变量名。l 用户可以通过单击选项Additional options按钮,规定一些另外的选择项,如求部分观测的和、对变量加标签等。在这里我们通过Specify Labels选项指定变量INCOME加上标签STIPEND,通过Summary Variables选项指定的数字变量INCOME进行汇总求和。l 用户可以通过在屏幕上方菜单栏中选择Customize实现对报表加上标题(Titles)或脚注(Footnotes)。如加上How to use SAS/ASSIST标题和Designed by DZX 副标题。图6.8 选择LISTING后显示的对话框界面8. 选择RUN菜单命令显示用户要求的报表l 单击主菜单上Locals命令l 从下拉菜单中选择RUN子菜单命令即可在OUTPUT窗

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论