版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、595380569.docSAS系统和数据分析电子商务系列第三课SAS数据集一、SAS数据集的结构SAS数据集是关系型的,它通常分为两部分:描述部分一一包含了一些关于数据属性的信息数据部分包括数据值SAS的数据值被安排在一个矩阵式的表状结构中,如图3- 1所示。表的列称之为变量(Variable),变量类似于其他文件类型的域或字段(Field)表的行称之为观察(Observation),观察相当于记录(Record)变量1变量2变量3变量4NameTest1Test2Test3观察1Xiaoer908688观察2Zhangsan1009889观察3Lisi797670观察4Wan gwu687
2、164观察5Zhaoliu1008999图3.1 一个SAS数据文件二、SAS数据集形式SAS系统中共有两种类型的数据集:SAS 数据文件(SAS data files)SAS 数据视窗(SAS data views)SAS数据文件不仅包括描述部分 ,而且包括数据部分。SAS数据视窗只有描述部分,没有数据部分,只包含了与其他数据文件或者其他软件数据的映射关系,能使SAS的所有过程可访问到,实际上并不包含SAS数据视窗内的数据值。自始至终,在SAS语言中,“SAS数据集”与这两种形式中之一有关。在下面的例子中,PRINT过程用相同方法处理数据集 aaa.abc而忽略它的形式:PROC PRINT
3、 DATA=aaa.abc三、SAS数据集的名字SAS数据集名字包括三个部分,格式如下:Libref.data-set-name .membertypeLibref (库标记)这是 SAS数据库的逻辑名字data-set-name (数据集名字)这是 SAS数据集的名字membertype (成员类型) SAS数据集名字的这一部分用户使用时不必给出。SAS数据文件的成员类型是 DATA ; SAS数据视窗的成员类型是 VIEW上海财经大学经济信息管理系 IS/SHUFEzxdengPage 1 of 9595380569.docSAS系统和数据分析电子商务系列例如,上面例子中的 aaa.abc
4、这个SAS数据集名字,aaa是库标记,abc是数据集名字, 成员类型没有写出,应该是DATA或VIEW中的一个。四、永久的和临时的SAS数据集SAS的存储方式有两种:永久的SAS数据集临时的SAS数据集一个SAS数据集是临时地或者是永久地存在,取决于该数据集所附属的 SAS数据库是临时的或永久的。一般用 LIBNAME 语句把主机系统下某个目录与库标记联系起来,并用这个 库标记作为SAS数据集名字的第一部分(或称第一级),这样规定的SAS数据集是永久的;如果只有第二部分(或称第二级)数据集的名字或库标记为WORK时,这样规定的 SAS数据集是临时的。永久库中的所有文件将被保留,但库标记仍然是临
5、时的。每次SAS启动时都自动指定两个库标记:SASUSER和 WORK。分另U联系目录“ C:SASSASUSER ”和-|n|x|Host Fmth N曰m巳图3.2 SAS系统的库标记与对应的目录C:SASmaps1 r:SASSASCFG11SASafsasheC:3hSsasu3erC: SASSASWORK*=TD8S157.File Edll t Vi ew Glcsbils Options Window HelpMAPSSASHELPSASUSERW2UOFtKEnt i n 巳“C:SASSASWORK#TDxxxxx ”。如图 3.2 所示。1.对永久SAS数据集的命名假定你
6、想创建一个数据集名为Class的永久数据集,这个数据集中的观测值和变量定义为图3.1所示。首先,你要确定 Class的数据集在哪里存储,然后使用LIBNAME语句来定义库标记;若选择Study作为库标记,那么在 DATA语句中你应该这样命名 SAS数据:上海财经大学经济信息管理系IS/SHUFE-|n|x|File Edi t i Glibils Options Wirt dew Help33 土 oLgLgj副贞|為|關富興 LMMEr-aEna in 已Nmme-I0MAPSVG12SASHELPVS1Z前SUSERV612STUDYUG12UOHKV612F阿】匚:5ASmaps slC
7、:SASShSCFGss S1C ;XSASafsashe C:SASsesuser d: XsasdataXmd ir-C:SASSHSW0RK*TD88157JnTEI00002 00003 00004 OOOOS 0000& oooor ooooa 00009 00010 0001 I 000121 i bname study d ; sasdata(nyd ir !; data study匚1吕$呂;input name $ testl test? test3: cards; X i aoerZhangsan 1ListUanguuzliaol im 1aJrun ;8 9 0 4 9
8、8 8 7696 8 619B 9 TV 7 80 0 9809 0 7 6 0图3.3 创建永久性数据集 STUDY.CLASSlibnamestudy d:sasmydir;datastudy.class;当这个DATA步执行时,名为class的SAS数据集被存储在用库标记Study联系的目录里。图3-3所示的是创建永久性数据集 STUDY .CLASS的程序,注意在第一条LIBNAME 语句执 行后,将在 LIBNAME 窗口出现第五个新的库标记“STUDY ”和用户自定义联系目录d:sasmydir ”。在这次SAS会话后面的两级名字。例如:proc print data=study.
9、class ;如果你想在另一次 SAS会话里读这个DATA步或PROC步使用这个数据集时,必须规定 class数据集,你必需再定义一个库标记。2.对临时SAS数据集的命名为了创建或读一个临时 SAS数据集,通常你只要规定单级名字,即这个数据集名字。SAS 系统自动地使用 WORK作为库标记。这对于开发和检查新程序非常有用,但每次结束SAS后WORK库标记中的所有文件将被删除。例如,下面语句:data class;产生SAS数据集的全名为 work.class (或work.class.data,该数据集的成员类型data是SAS系统自动产生的,不必写出)。上海财经大学经济信息管理系 IS/SH
10、UFEzxdengPage 3 of 9如果你执行DATA步但不想创建SAS数据集,可在DATA语句里规定关键字_NULL_作 为这个数据集的名字。如果你在DATA语句中没有规定数据集的名字或保留名字_NULL_ ,那么SAS系统自动地创建一些 SAS数据集,并命名为 DATA1、DATA2、这些数据集被存 在WORK库中。五、SAS数据集的索引SAS数据集可以用一个或几个被称为关键字变量的变量来索引。SAS索引根据用它们的值组成索引的关键字的个数多少而分为:简单索引Fil& Edi t ft# LocaIe Globals Opti one Aindww复合索引刁-R兰口|闵巳I劃时糾轲息N
11、OTE, a llne(s) included图3.4 为STUDY.CLASS数据集建立关键字是 NAME的索引1.简单索引简单索引是用一个关键变量的值来对观测定位指针。这个关键变量可以是数值变量或字符变量。当你创建一个简单索引时,SAS系统自动地以关键变量相同的名字给这个索引命名。下面的例子显示 PROC DATASETS语句为 Study.class数据集创建一个简单索引。用library=study指明库标记 study,用 modify class语句说明在已指定 d:sasdatamydir目录下所 要修改的数据集名为class,真正建立索引的语句为index create nam
12、e, name是数据集class中的一个字段名,被指定为关键变量, 然后用contents data=class语句打印这个class数据集的 内容资料。如图3.4所示。上海财经大学经济信息管理系IS/SHUFE595380569.docSAS系统和数据分析电子商务系列2.复合索引复合索引引用两个或两个以上变量的值来确定观测的指针位置。用在复合索引中的这些变量可以是数值类型或字符类型或两者兼有。当创建这个索引时必须规定一个唯一的索引名。下例如图3.5所示,给出PROC DATASETS语句为数据集 Study.Class创建一个复合索引。File Idli t Vi Locals Global
13、s Options Iind&w K-elp0n 土 口启|日|副对应I电I龍INOTE: 6 Line(s) recalled.图3.5为数据集Study.Class创建复合索引TEST1、TEST2和TEST3三个变量被指定为关键变量。第四课 In dex create TEST=(test1 test2 test3)语句中,TEST变量是建立复合索引 时,必须由用户自行规定一个唯一的索引 名,小括号内的数据集变量的次序表示复 合索引的关键字次序,即test1是第一关键 字,test2是第二关键字,test3是第三关键 字。SAS数据库SAS 数据库(SAS data library )的
14、成员一个目录里的所有 SAS文件都是一个 SAS数据库(SAS data library)的成员。一个目录 可以包含外部文件(非 SAS文件)以及SAS文件,但只有这些 SAS文件才是SAS数据库的 成员。SAS数据库是一个逻辑概念, 没有物理实体。图4.6描述了 SAS数据库、SAS文件和SAS 文件的元素之间的关系。注意,这个库对应于主机操作系统的一个目录,而SAS文件对应于目录内的一个文件。图4.6在SAS数据库中的成员类型例如,我们前面定义的 Study永久库就是一个 SAS数据库,对应的目录为d:sasdatamydir, 在此目录内有SAS数据集文件:Class.sd2 (包含两种
15、成员类型 DATA和VIEW)索引文件Class.si2其他SAS文件如用BASE SAS软件的存储程序功能产生的成员类型为:PROGRAM程序文件SAS的目录是具有成员类型为:CATALOG 的 SAS 文件此文件用来存储许多称为目录条目( catalog entries)的不同类型的信息,用于SAS系统识别它的结构。典型地,像BASE SAS软件,如果存储目录条目信息对于处理是必要的话,就自动地存储SAS目录条目,而在其他SAS软件中,用户必须在各个过程中规定这个目录条目,用下面完整的四级名字形式来识别:libref.catalog.entry-name.entry-type (库标记.目
16、录名.条目名.条目类型)。SAS系统有一些特性帮助你管理目录中的条目,一是CATALOG过程,它是BASE SAS软件中的一个过程;另一个是显示管理的CATALOG窗口。SAS访问描述器是一个允许用户创建SAS/ACCESS视图的工具,访问描述器的成员类型为:ACCESS的一些文件我们可以用SAS/ACCESS软件里的ACCESS过程创建它们。访问描述器描述存储在 SAS 系统外部的数据,如一些公开的数据库管理系统(DBMS )中的数据,每个访问描述器保存我们想要访问的有关 DBMS文件的必要信息,如它的名字、列名和列类型等。二、对SAS数据库的管理1.联系和删除库标记的方法可以使用LIBNA
17、ME语句把库标记与一个物理名字联系起来.例如上面例子中:libname Study d:sasdatamydir;也可以使用LIBNAME语句删除这个库标记,提交的形式如下:libname Study clear ;上海财经大学经济信息管理系 IS/SHUFEzxdengPage 9 of 9595380569.docSAS系统和数据分析电子商务系列所谓的SAS数据库的物理名字,是指在你的主机系统下的SAS文件名,因此必须符合主机系统下文件名的法则,如在Windows环境下,文件的路径(也称主机的目录名)命名法则为如d:sasdatamydir的形式。库标记是在 SAS系统中用来标识 SAS系
18、统一组文件的方式,它 是一个临时的名字,使得我们在每一个SAS系统作业或会话中与 SAS数据库联系在一起。2.查看SAS数据库及其内容图4.7创建和查看STUDY数据库及其内容如图4.7所示,操作步骤如下:在命令框中键入 LIB或LIBNAME,进入LIBNAME 窗口,列出了所有已指定库 标记的SAS数据集在想要查看的库前面的横线上键入S (即SELECT )并回车,进入 DIR窗口,列上海财经大学经济信息管理系 IS/SHUFEzxdengPage 7 of 9595380569.docSAS系统和数据分析电子商务系列出了指定数据库中的所有 SAS文件在想要查看的数据集前面的横线上键入S并回车,进入VAR窗口,列出了指定数据集的描述部分的信息在想要修改的变量前面的横线上键入R (即RENAME )并回车,可以改变这个变量的属性。发布END命令退出当前窗口或用 MOUSE单击一下窗口右上角的关闭窗口按钮。3.用Libraries对话框进行管理用MOUSE单击一下SAS系统的标准工具栏上的Libraries按钮(最后一组命令按钮的第一个),或选择菜单命令:GlobalsAccessDisplay librarie
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 乡村道路沥青重铺施工方案
- 餐饮行业菜品研发管理方案
- 小学科学社区合作教育方案
- 市政工程铣刨路面施工方案
- 物流行业新冠安全防控措施方案
- 生态农业养殖场废水治理方案
- 河南省济源市2023-2024学年高二上学期期末质量调研生物试题(解析版)
- 广东省茂名市滨海华附2023-2024学年高二上学期12月月考生物试卷(解析版)
- 卫生间防水材料选用方案
- 2024年糖、加工糖及制糖副产品项目综合评估报告
- 砌筑工-技能评分记录表3
- 司索工安全操作规程
- 人教版数学五年级上册课本习题(题目)
- 钢筋合格证(共6页)
- BIM技术全过程工程管理及应用策划方案
- 弯扭构件制作工艺方案(共22页)
- 水利工程填塘固基、堤身加固施工方法
- 中医针灸的骨边穴怎样定位
- 人教版八年级上册英语单词表默写版(直接打印)
- 电脱水、电脱盐讲解
- 违约损失率(LGD)研究
评论
0/150
提交评论