![第十章-sas软件主要功能模块简介.ppt_第1页](http://file1.renrendoc.com/fileroot_temp2/2020-4/1/2cee3630-8b0a-42d6-8ef4-d3a6d4a1a9ae/2cee3630-8b0a-42d6-8ef4-d3a6d4a1a9ae1.gif)
![第十章-sas软件主要功能模块简介.ppt_第2页](http://file1.renrendoc.com/fileroot_temp2/2020-4/1/2cee3630-8b0a-42d6-8ef4-d3a6d4a1a9ae/2cee3630-8b0a-42d6-8ef4-d3a6d4a1a9ae2.gif)
![第十章-sas软件主要功能模块简介.ppt_第3页](http://file1.renrendoc.com/fileroot_temp2/2020-4/1/2cee3630-8b0a-42d6-8ef4-d3a6d4a1a9ae/2cee3630-8b0a-42d6-8ef4-d3a6d4a1a9ae3.gif)
![第十章-sas软件主要功能模块简介.ppt_第4页](http://file1.renrendoc.com/fileroot_temp2/2020-4/1/2cee3630-8b0a-42d6-8ef4-d3a6d4a1a9ae/2cee3630-8b0a-42d6-8ef4-d3a6d4a1a9ae4.gif)
![第十章-sas软件主要功能模块简介.ppt_第5页](http://file1.renrendoc.com/fileroot_temp2/2020-4/1/2cee3630-8b0a-42d6-8ef4-d3a6d4a1a9ae/2cee3630-8b0a-42d6-8ef4-d3a6d4a1a9ae5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、黄冈师范学院数信学院,数学模型与实验 Mathematical modeling,黄冈师范学院数信学院,第十章 SAS软件主要功能模块介绍,SAS是Statistical Analysis System(统计分析系统)的缩写, 美国于1966年开始研制SAS,并且一直在不断更新版本。有关SAS的最新信息,可以查看http:/www.SAS。 SAS软件是模块式结构,有SAS/BASE(基础)、SAS/STAT(统计)、SAS/GRAPH(图形),SAS/ETS(预测)、SAS/IML(矩阵运算)和SAS/QC(质量控制)等约20个模块,最常用的3个模块是SAS/BASE(基础)、SAS/STA
2、T(统计)和SAS/GRAPH(图形),这3个模块可单独使用、也可,黄冈师范学院数信学院,互相配合起来使用。其中的SAS/STAT模块是目前功能最强的多元统计分析程序集,可以做回归分析、聚类分析、判别分析、主成分分析、因子分析、典型相关分析以及各种试验设计的方差分析和协方差分析等。,黄冈师范学院数信学院,10.1 SAS系统基本操作及基本概念,启动计算机,点击SAS图标后,即可进入SAS的显示管理系统DMS。DMS是Display Manager System的缩写。在中有四个主要的窗口: ()编辑窗口(PROGRAM EDITOR)编辑程序和数据文件; ()日志窗口(LOG)记录运行情况,显
3、示ERROR信息; ()输出窗口(OUTPUT)输出运行的结果;()图形窗口(GRAPH)输出图形。,黄冈师范学院数信学院,点击 Globals 菜单中的 Program editor、Log、Output、Graph 命令可以进入编辑、日志、输出及图形窗口。,点击 Globals 菜单中的 Program editor、Log、Output、Graph 命令可以进入编辑、日志、输出及图形窗口。 按功能键F5、F6、F7也可以进入编辑、日志及输出窗口。,SAS主窗口标题栏下是主菜单。SAS菜单是动态的,其内容随上下文而不同,即光标在不同窗口其菜单也不同。其中,File(文件)菜单主要是有关SA
4、S文件调入、保存及打印的功能。Edit (编辑)菜单用于窗口的编辑(如清空、复制、剪切、粘贴、查找、替换)。,黄冈师范学院数信学院,Locals(局部)菜单与当前正在进行的操作有关,如果你正在程序窗口中编辑程序,则Locals菜单有提交运行、调回修改等项,如果在运行记录窗口或输出窗口则Locals菜单项根本不出现。Globals 菜单内容比较复杂,它可以打开被关闭的程序窗口、运行记录窗口、输出窗口、图形窗口,可以进入SAS提供的各个独立模块。主菜单下是一个命令条和工具栏菜单。命令条主要是用于与SAS较早版本的兼容性,可以在这里键入SAS的显示管理命令。工具栏图标提供了常见任务的快捷方式,比如保
5、存、打印、帮助等等。鼠标光标在某一工具栏图标上停留几秒可以显示一个说明。工具栏图标的解释如下:,黄冈师范学院数信学院,Submit 提交编辑窗口中的程序。 New 清空编辑窗口。 Open 打开文件到编辑窗口。用户指定一个文 件调入到编辑窗口内。这个文件从此与编辑窗口 相关联,以后的存盘操作将自动存入这个文件。 Save 存盘,保存编辑窗口内容,注意如果此 窗口已经与一个文件相联系的话此功能将覆盖文 件的原有内容而不提示。 Print 打印当前窗口内容。 Print preview 打印预览,黄冈师范学院数信学院,Cut 剪切选定文本。 Copy 复制选定文本。 Paste 粘贴。注意这些操作
6、是对Windows 剪 贴板进行的,可以用来与其它Windows应用程序 交换文本、数据等。剪切或复制到剪贴板的内容 可以被其它应用程序粘贴,其它应用程序放到剪 贴板的内容也可以粘贴到SAS的编辑窗口中。 Undo 撤销刚才的编辑操作。 DOS prompt 临时进入DOS。,黄冈师范学院数信学院,Browse 打开WWW浏览器并进入SAS公司的主 页 www.SAS.com。 Directories 进入Directory(目录)窗口, 可以浏览各SAS数据库的内容,可以浏览数据库 中的数据集、SAS目录的内容。 SAS/ASSIST 启动SAS的菜单驱动界面 SAS/ASSIST 。 He
7、lp 启动Windows的帮助系统进入SAS 的 帮助。,黄冈师范学院数信学院,退出SA有两种方法: (1) 点击 File 菜单中的 Exit 命令; (2) 点击窗口右上角的。,黄冈师范学院数信学院,10.1.2 SAS程序的输入及运行,SAS程序的输入及运行步骤如下: (1) 进入SAS的显示管理系统; (2) 进入并扩大编辑窗口; (3) 调出、编辑或修改SAS程序或数据文件; (4) 将编辑窗口的SAS程序或数据文件存盘; (5) 按功能键F8或点击“跑步”键运行SAS程序并注意观察日志窗口中的信息,如有ERROR出现,应将光标移到日志窗口,用PU和两键翻页,找到错误的所在; (6)
8、 将光标移到编辑窗口,按功能键F4或点击 Locals菜单中的 Recall text命令调出已经运行的SAS程序,改正错误后转入步骤(4),直到日志窗口中的信息没有ERROR出现为止; (7) 将光标移到输出窗口,用和两键翻页阅读输出的结果。,黄冈师范学院数信学院,简单运行样例,假设我们有一个班学生的数学成绩和语文成绩,数学满分为100,语文满分为120,希望计算学生的平均分数(按百分制)并按此排名,可以在程序窗口输入此程序: title 2000级2班学生成绩排名; data X2000; INPUT name $ 1-10 sex $ math chinese; avg = math*0
9、.5 + chinese/120*100*0.5; cards; 张三 男 92 98 李艺 女 89 106 王明 男 86 90 张聪 男 98 109,黄冈师范学院数信学院,proc print;run; proc sort data=c9501; by descending avg; proc print; run; 要运行此程序,有四种方式: 方式一:鼠标点击执行按钮; 方式二:按功能键“F8”; 方式三:执行菜单命令RunSubmit ; 方式四:在命令框输入SUBMIT 命令并执行 ; 运行后,出现以下结果:,黄冈师范学院数信学院,2000级2班学生成绩排名 OBS NAME S
10、EX MATH CHINESE AVG 1 张三 男 92 98 86.8333 2 李艺 女 89 106 88.6667 3 王明 男 86 90 80.5000 4 张聪 男 98 109 94.4167,黄冈师范学院数信学院,2000级2班学生成绩排名 OBS NAME SEX MATH CHINESE AVG 1 张聪 男 98 109 94.4167 2 李艺 女 89 106 88.6667 3 张三 男 92 98 86.8333 4 王明 男 86 90 80.5000,黄冈师范学院数信学院,上面的例子程序可以看出SAS程序的一些特点。SAS程序由语句组成,语句用分号结束。S
11、AS程序中大小写一般不区分(字符串中要区分大小写)。SAS程序中的空格、空行一般可以任意放置,这样我们可以安排适当的缩进格式使得源程序结构清楚易读,但是单个名称中不能空格,不同名称间必须空格。SAS程序由两种“步”构成,一种叫数据步(data step),一种叫过程步(proc step),分别以DATA语句和PROC语句开始。数据步和过程步由若干个语句组成,一般以RUN语句结束。 SAS还规定,每个语句的后面都要用符号“;”,数据行后不加分号,数据最后单独加一分号行。 在编辑SAS程序时,一个语句可以写成多行,多个语句也可以写成一行,可以从一行的开头写起,也可以从一行的任一位置写起。每一行输
12、入完成后,用ENTER键可以使光标移到下一行的开头处。,黄冈师范学院数信学院,10.2 SAS对数据的管理,表 10-1 SAS数据集的结构 NAME SEX MATH CHINESE 李明 男 92 98 张艺 女 89 106 王明 男 86 90,10.2.1 SAS数据集 SAS数据集的构成 在SAS系统中,只有SAS数据集才能被SAS过程所使用,因此创建SAS数据集是应用SAS过程的前提。 SAS数据集(SAS Datasets)可以看作由若干行和若干列组成的表格,类似于一个矩阵,如表10-1 所示。,黄冈师范学院数信学院,数据集的每一行叫做一个观测(Observa
13、tion),每列叫做一个变量(Variable)。观测描述被观测对象的单一整体(如一个人、一个实验动物等)某些所研究特性的一系列数据值称为一个观测,又称观察。在SAS数据集中每一行数据是一个观测。 SAS变量指定了数据的某一特性。在SAS数据集中,每一个观测是由各个变量的数据值组成。在数据集中每一列数据是一个变量。 变量名最多8个字符长,一般由字母、数字、下划线组成。第一个字符必须是字母或者下划线,不能有空格。特殊字符(如$,#)也不允许在SAS名中使用。,黄冈师范学院数信学院,合法变量名如:A A1 abc name age total 。SAS系统保留的特殊变量名,以下划线开始和结尾。如:
14、_N_和_ERROR_等。 变量特性:名称、类型、长度、输入格式、输出格式和标记。两种类型:数值型,字符型(后跟“$”符号);长度特性:是指存贮的字节数。缺省长度是8(为了存贮长度与缺省值不同的变量,需使用LENGTH语句)。,黄冈师范学院数信学院,多个变量的简化表示:如果要一次定义或指定多个同种类型变量,可以使用缩写形式: INPUT NAME $ VAR1 VAR2 VAR3 VAR4 VAR5 VAR6; 可以写成:NPUT NAME $ VAR1-VAR6; 注意: 字符型变量NAME不包含在这个缩写清单中。这些变量要求类型相同,或全是数值型的或全是字符型的。 缺失值:当一个变量由于某
15、种原因没有得到(可能没有观测到,或由于数据错误,或由于计算错误),称该值为缺失值。数值型在SAS中用“.”表示;字符型在SAS中用“ ”表示。,黄冈师范学院数信学院, SAS数据集的创建 数据必须以SAS数据集的格式存放才能够被SAS过程所处理。因此,运用SAS系统进行数据处理,必须首先创建SAS数据集。得到SAS数据集主要有以下几条途径: (1) 用VIEWTABLE创建数据集 单击数据库名称在数据库中单击鼠标右键在菜单中选择NEW选择TABLE为了输入表内变量的名称和属性,在变量名称A上单击鼠标右键选择COLUMN ATTRIBUTES选择GENERAL输入相应内容单击AP
16、PLY在表格中输入数据。 注:NAME:最长不超过32个字符; LABEL:变量的标签,最长不超过256个字符;,黄冈师范学院数信学院,LENGTH:规定变量的数据的长度,默认为8; FORMAT:修改数据的存储格式; INFORMAT:修改数据的输入格式; TYPE:选择变量是数值型(NUMERIC)还是字符型(CHARACTER);,黄冈师范学院数信学院,(2) 用SAS/INSIGHT软件创建SAS数据集 在进入SAS系统,可以任选以下方法中的任何一种进入INSIGHT模块。 ()在命令行中直接键入INSIGHT命令,此时就进入了INSIGHT模块。 ()调用GlobalsAnalyze
17、Interactive data analysis菜单。 ()调用Globals(单击)Desktop(单击) Data Analyze(双击)Interactive data analysis(双击)菜单。 接着进行数据的输入,并进行命名,建立新的数据集。 注意:输入数据时要用TAB键和上、下、左、右键,不能用鼠标来选择单元格。,黄冈师范学院数信学院,(3) 利用SAS/ACCESS软件访问其他的数据文件 SAS系统提供了一个把其他格式的数据文件转化为SAS数据集的导入向(import wizard),用户利用SAS/ACCESS软件可以直接把其他格式的数据文件转化为SAS数据集。具体操作方
18、法如下: 启动导入向导。选File Import,出现导入向导界面。此时你可以选择输入的是 标准格式文件(standard file format)或是用户自定义格式(user defined format),然后按Next按钮,此时对话框要求你选择存放数据集的库名并输入文件名,按Finish键即完成数据间的转换。,黄冈师范学院数信学院,(4) 利用DATA步从原始数据创建SAS数据集 DATA语句的作用是表明数据步的开始并给出数据集的名称。 DATA语句的格式为: DATA 数据集的名称; 数据集的名称必须以英文字母开始,最长不超过个字符。,黄冈师范学院数信学院,数据集的名称都是由符号“”分
19、隔的两个部分所组成。第一部分标记数据集所存储的位置,称作一级名或库逻辑名。第二部分标记一个特定的数据集,称作二级名。如果不想把数据集永久储存在指定的磁盘上,可以只使用二级名。例如建立一个名为的数据集的语句为“DATA EX;”,这时SAS系统会自动地把作为数据集的二级名,并添加WORK作为数据集的一级名,因此在日志窗口显示的信息中记该数据集为WORKEX。但是这个数据集是临时的,它仅仅在程序运行期间有效,过后它就被复盖,不能重新调用。,黄冈师范学院数信学院,DATA步是用DATA语句开始的一组SAS语句。如: Data shujuji; Impot name$ X1 X2 X3; Y=X1+X
20、2+X3; Cards; M 3 1.3 0.5 M 2 2.4 0.9 F 5 3.2 0.8 M 8 4.1 1.1 F 7 3.3 0.6 ; run;,黄冈师范学院数信学院,以上这些语句组成DATA步。提交后,SAS系统自动创建一个数据集名为shujuji 的SAS数据集,它包含五个变量,分别为name, X1, X2, X3,Y,和五个观测。 (5)由外部数据文件转化为SAS数据集 实际运用中常常会遇到其他外部文件,比如,在一张软盘上的其他格式的数据文件,此时要想把数据转化为SAS数据集,可以使用以下一般形式的DATA步: DATA data-set-name; INFLEfilen
21、ameoptions; INPUT variables ($) startcol-endcol; (用于DATA部的其他语句); RUN;,黄冈师范学院数信学院,NFILE语句的作用是指明外部数据文件的名称,并从这个外部数据文件中读取数据。这里INFLE语句中的filename表示要读入的外部数据文件,而options用来提供一些选择项。,黄冈师范学院数信学院,假设在D盘下存在数据文件test.dat:结构为 123.5 2.108 141.5 301.8 146.1 9.213 168.9 396.1 133.9 1.905 154.8 328.2 128.5 0.815 146.5 307
22、.4 151.5 1.061 172.8 362.4 136.2 8.603 160.1 369.5 92.0 1.125 108.5 229.1,黄冈师范学院数信学院,则将其转化为一个临时性的SAS数据集: data da1; infile d:test.dat; INPUT x1-x4; sum=x1+x2+x3+x4; (此行根据条件可以不要) run; proc print data=da1; run; data new data-set-name; set old data-set-name (options); 其他SAS语句; run;,黄冈师范学院数信学院,(6) 通过已存在的
23、SAS数据集创建新的SAS数据集 可通过SET语句可以从一个已经存在的SAS数据集创建新的SAS数据集。SET语句的作用是按照指定的条件从指定的数据集中读取数据建立新的数据集或将两个数据集中的观测值纵向连接建立新的数据集。 SET语句的格式为:SET 数据集名表; 例如,从数据集中读取数据建立新的数据集EX1,可编辑语句: DATA EX1; SET EX;,黄冈师范学院数信学院,将两个数据集D1和D2中的观测值纵向连接建立新的数据集D3,可编辑语句: DATA D3; SET D1 D2; 利用SET语句可以从一个已经存在的SAS数据集创建新的SAS数据集,其一般形式如下: DATA new
24、 data-set-name; SET old data-set-name(options); 其他SAS语句; RUN;,黄冈师范学院数信学院,10.2.2 SAS数据库 SAS系统中,所处理的数据文件都必须放在一个SAS数据库中。所谓SAS数据库是指一个或几个DOS目录下的SAS文件的集合。 在MS DOS/Windows环境中,SAS数据库与某一个文件夹相对应,我们要为每一个数据库制定一个库名(Libname)来识别该库,其命名遵循上述SAS名字命名原则,使用LIBNAME可以指定库名。它的一般格式为: libname 库名 “文件夹的位置”; 例如在视窗中输入如下语句 libname
25、A C:X2007 表示在C:X2007中保存了库名为A的SAS数据集。,黄冈师范学院数信学院,SAS数据库可分为永久库和临时库两种。临时库只有1个,名为WORK,存放在其中的SAS文件叫临时文件,这些临时文件当退出SAS系统时会被自动删除。永久库有2个,名为SASUSER、SASHELP。SASUSER库保存与用户个人设置有关的文件,它是永久的,即退出SAS时文件不会被删除。SASHELP库保存与SAS帮助系统、例子有关的文件,是永久的。 从上面看出,SAS文件分为临时文件和永久文件:临时文件在退出SAS系统时自动被删除,永久文件在退出SAS系统时不自动被删除。所以,我们把作为中间结果使用的
26、数据集或练习用的数据集作为临时数据集保存,而需要以后再用的数据集则可以保存为永久数据集。,黄冈师范学院数信学院,临时数据集和永久数据集的区别是:临时数据集可以用单水平名,即只有数据集名,比如TEACH,而永久数据集名由两部分组成,前一部分是它的库名,后一部分才是数据集名,两部分中间用小数点连接,比如放在MYLIB库(即C: X2007 子目录)中的数据集STUDENT必须用MYLIB. STUDENT表示。这样指定的数据集名在生成时可以放到由库名指定的子目录中,在读取时可以到指定的子目录读取,并且不会被自动删除。 临时数据集除用单水平名外 ,也可以用库名为WORK的两水平名,如WORK. TE
27、ACH和TEACH 是一样的。,黄冈师范学院数信学院,要生成永久数据集,只要在指定要生成的数据集名时使用两水平名且库名已有定义,比如,要把上面的STUDENT数据集在生成时就放到C: X2007子目录中,可以用如下语句: libname mylib c: X2007;data mylib. STUDENT;,黄冈师范学院数信学院,10.3 SAS编程基础,10.3.1 SAS 语法基础 SAS常量 SAS常量为其值是固定不变的量,经常用于赋值、运算等语句中。 常量分为以下三类: (1)数值常量:1.5 -2.79 1.75E-5 (2)字符常量:“Hello” “ABC” Z
28、hangli (3)日期、时间、日期时间常量:后接D,T,DT 如 1JAN2000D,9:25:19T, 1JAN2000:10:30:05DT,黄冈师范学院数信学院, SAS操作符(运算符) SAS操作符是一些符号,主要有算术操作符、比较操作符、逻辑操作符、其它操作 符四类。 (1)算术操作符 * * / + - 作用:进行数学运算,得到数值结果。 例: y = x * 2 + b;C = (12 4) * 2; (2)比较操作符 = = “ABD”(结果x值为 0)。 (3)逻辑操作符 函数名:SUM 参数:1, 2, 3 返回值:6 (函数运算结果),黄冈师范学院数信学
29、院,参数格式: 1. 用逗号分割:SUM(x1, x2, x3) 2. 用简化形式:SUM(OF x1-x3) 3. 用列表形式:SUM(OF x1 x2 x3),黄冈师范学院数信学院,10.3.2 SAS常用语句 CARDS语句 CARDS语句的作用是与“;”呼应,标志数据行的开始与结束。 CARDS语句的格式为: CARDS; 数据行 ; 如果使用CARDS语句,在CARDS的后面必须紧跟数据行,并且在一个数据步中最多只能有一个CARDS语句。,黄冈师范学院数信学院, INPUT语句 INPUT语句的作用是描述输入记录中的数据,并把输入值赋给相应的变量。
30、INPUT语句的格式为: INPUT 数据的变量名、顺序及类型; 用INPUT语句是为了读外部文件的数据或跟在CARDS语句后面的数据。除非在INPUT语句中的变量名后有串符号或用字符的输入格式表示、或该变量事先已被定义为字符型,否则SAS认定用INPUT语句读入的是数值型变量的值。,黄冈师范学院数信学院,用INPUT语句时,外部文件中的数据和CARDS语句后面的数据都采取列表输入的方法,各个变量的值由它们之间的空格来分隔。为从一行读入多个观测值,应使用行保持符限制读数指针,使其保持在这一行上读数,直到数据读完为止。 例如:INPUT ; CARDS; . . . . .,黄冈师范学院数信学院
31、, MERGE语句 MERGE语句的作用是将两个数据集中的各个观测值横向合并建立新的数据集。MERGE语句的格式为: MERGE 数据集名表; 例如,将数据集D1与D2中的观测值横向合并建立新的数据集D,可编辑语句: DATA D; MERGE D1 D;,黄冈师范学院数信学院,编程实例: data d1;INPUT a b c ; cards; 1 5 7 1 7 9 1 3 4 1 2 6 ; data d2;INPUT x y z ; cards; 2 4 8 2 6 6 ; data d3;merge d1 d2; proc print;run; 返回值:6 (函数运算
32、结果),黄冈师范学院数信学院,本程序运行的结果如下: OBS A B C X Y Z 1 1 5 7 2 4 8 2 1 7 9 2 6 6 3 1 3 4 . . . 4 1 2 6 . .,黄冈师范学院数信学院, DROP语句 DROP语句的作用是指定不写到数据集中的变量。 DROP语句的格式为: DROP 变量名表; 如果在DATA步中有DROP语句,那么DROP语句中已出现的变量的观测值被删除,未出现的变量的观测值仍保留在新的数据集中。,黄冈师范学院数信学院, KEEP语句 KEEP语句的作用是指定要写到数据集中的变量。 KEEP语句的格式为: KEEP
33、 变量名表; 如果在DATA步中有KEEP语句,那么KEEP语句中未出现的变量的观测值被删除,已出现的变量的观测值被保留在新的数据集中。,黄冈师范学院数信学院, IF语句 IF语句的作用是使SAS继续处理符合IF条件规定的观测值,因而所得到的数据集是原数据集的子集。 IF语句的格式为: IF 条件表达式; 如果表达式的值是真,SAS处理当前的观测值,执行DATA步中的语句。如果表达式的值是假,SAS马上返回到DATA步的开始,不处理当前的观测值,不执行DATA步中的语句。,黄冈师范学院数信学院,编程实例: data ex;INPUT group$ age ; cards; x
34、23 y 10 x 7 y 22 x 8 y 4 x 21 y 12 x 9 y 22 x 6 y 2 ; data ex1;set ex;if group=x; proc print; data ex2;set ex;if age20; proc print;run;,黄冈师范学院数信学院,本程序运行的结果如下: OBS GROUP AGE 1 x 23 2 x 7 3 x 8 4 x 21 5 x 9 6 x 6,黄冈师范学院数信学院,OBS GROUP AGE 1 y 10 2 x 7 3 x 8 4 y 4 5 y 12 6 x 9 7 x 6 8 y 2,黄冈师范学院数信学院,10.
35、3.2.7 PROC语句 PROC语句的作用是指定需要调用的过程以及该过程的若干选择项。 PROC语句的格式为: PROC SAS的过程名; 例如,调用PRINT过程,打印数据集的内容: PROC PRINT DATA; 这里的DATA数据集名,用来指定本过程所要处理的数据集名,如缺省则处理最新建立的数据集。,黄冈师范学院数信学院,在PROC步中,还必须确认一些最基本的信息,包括: (1) 处理的数据集名,格式为DATA 数据集名; (2) 所涉及的变量名,格式为VAR 变量名; (3) 分组处理的标志,格式为BY 组变量名。,黄冈师范学院数信学院, CLASS语句 CLASS
36、语句的作用是在分析的过程中定义分类变量,再按分类变量的值分组进行数据分析。 CLASS语句的格式为: CLASS 变量名; CLASS语句对数据分析所起的作用类似于BY语句,但是它们打印输出的格式不相同,并且BY语句要求先对变量排序后才能使用。,黄冈师范学院数信学院, FREQ语句 FREQ语句的作用是规定一个变量,以它的值作为数据集中观测值出现的频数。 FREQ语句的格式为: FREQ 变量; 假定某观测值的FREQ变量的值为,在分析时,该数据集中这个观测值出现的频数便是。若,则观测值不参加分析。若不是整数,则自动取整。观测值的总数等于FREQ变量的和。,黄冈师范学院数信学院
37、,编程实例: data ex;INPUT group$ sex$ age number ; cards; x f 23 10 y f 22 8 x m 21 12 y m 22 6 ; proc means maxdec=3;class group;var age; proc means maxdec=3;class group;freq number;var age;run;,黄冈师范学院数信学院,本程序运行的结果如下: Analysis Variable : AGE GROUP N Obs N Minimum Maximum Mean Std Dev - x 2 2 21.000 23.0
38、00 22.000 1.414 y 2 2 22.000 22.000 22.000 0.000,黄冈师范学院数信学院,- Analysis Variable : AGE GROUP N Obs N Minimum Maximum Mean Std Dev - x 22 22 21.000 23.000 21.909 1.019 y 14 14 22.000 22.000 22.000 0.000,黄冈师范学院数信学院,10.3.4 SAS的一些基本服务过程 SAS服务过程不能直接给出统计值,专门用来准备或整理统计资料。使用比较多的SAS语服务过程有:,黄冈师范学院数信学院,
39、PRINT过程 PRINT过程可以打印一个SAS数据集中的全体或部分观测值,还可以打印数值变量的总和或部分和。 在PRINT过程中经常使用的语句有: PROC PRINT选择项; VAR 变量表; BY 变量表; SUM 变量表; 在PROC PRINT语句中可能出现的选择项有DATA数据集名,如果省略这一选择,则打印最新建立的数据集中的数据。 SUM语句被用来求变量表中诸变量的总和。,黄冈师范学院数信学院, SORT过程 SORT过程将SAS数据集中的观测值按一个或多个变量的值进行排序,以便其他的SAS过程利用BY语句对这些观测值进行分组处理,排序后的观测值存放在一个新的SA
40、S数据集中或者代替原来的数据集。 在SORT过程中经常使用的语句有:PROC SORT选择项; BY 变量表; 在PROC SORT语句中可能出现的选择项有DATA数据集名,用来说明要排序的数据集名,如果省略这一选择,则指定最新建立的数据集。还有OUT数据集名,用来说明要输出的数据集名,如果省略这一选择,则原来的数据集被输出的数据集替换。,黄冈师范学院数信学院,编程实例: data ex;length name$ 9; INPUT name sex$ group$ t1-t3 ; s=sum(of t1-t3); cards; wangdong 1 1 90 70 60 xueping 2 2
41、 85 95 88 zhouhua 1 1 77 84 69 heyan 1 2 95 78 88 sunhong 2 3 89 97 87 zhaobin 2 3 66 98 86 huangshan 2 3 67 75 76 hufang 1 2 78 77 69 lili 2 2 70 82 63 zhaoli 2 3 95 90 91 zhangqun 1 1 93 91 89 iping 1 3 59 88 93 liyun 1 1 89 96 76 liyu 2 1 79 89 87 huajin 2 2 89 97 80; proc sort;by group s; proc p
42、rint;by group;run;,黄冈师范学院数信学院,程序中的length name$ 9用来定义字符串的长度,当全部字符串的长度为时,可以省略这个语句。 本程序运行的结果如下: - GROUP=1 - OBS NAME SEX T1 T2 T3 S 1 wangdong 1 90 70 60 220 2 zhouhua 1 77 84 69 230 3 liyu 2 79 89 87 255 4 liyun 1 89 96 76 261 5 zhangqun 1 93 91 89 273,黄冈师范学院数信学院,- GROUP=3 - OBS NAME SEX T1 T2 T3 S 11
43、 huangshan 2 67 75 76 218 12 iping 1 59 88 93 240 13 zhaobin 2 66 98 86 250 14 sunhong 2 89 97 87 273 15 zhaoli 2 95 90 91 276,黄冈师范学院数信学院, FORMAT过程 FORMAT过程可以对字符或数值变量定义一个所需要的输出格式,使DATA步以及含有FORMAT语句的过程步中的变量都受到这一输出格式的限制。 通过PROC FORMAT过程所定义的格式包括: ()将输出值转变成不同的值、数值可以变成字符、字符可以变成另外的字符。 ()使输出值保留一定的小
44、数位,否则输出值将有个小数位。 FORMAT过程由下列语句控制: PROC FORMAT; VALUE 格式名 格式的定义; 为便于识别,格式名通常是原变量名加,如果原变量是字符串,则应当在格式名前加串符号。后面的过程中,如果涉及到某变量的输出格式,必须有语句: FORMAT 变量名 格式名;,黄冈师范学院数信学院,编程实例: data ex;length name$ 10; INPUT name sex$ group$ t1-t3 ; cards; (数据同上机练习) ; proc format; value $sexfmt 1=m 2=f; value $groupfmt 1=a 2=b
45、3=c; value t1fmt 0-60=C 60-80=B 80-100=A;,黄冈师范学院数信学院,proc print; format sex $sexfmt. ; format group $groupfmt. ; format t1 t1fmt. ; format t2 t3 4.1;run; 这里的sex、group是串变量,格式名为$sexfmt、$groupfmt,t1为数值变量格式名为t1fmt,t1的格式定义是0-60变换为 C、60-80变换为 B、80-100变换为 A。,黄冈师范学院数信学院,本程序运行的结果如下: OBS NAME SEX GROUP T1 T2
46、T3 1 wangdong m a A 70.0 60.0 2 xueping f b A 95.0 88.0 3 zhouhua m a B 84.0 69.0 4 heyan m b A 78.0 88.0 5 sunhong f c A 97.0 87.0 6 zhaobin f c B 98.0 86.0 7 huangshan f c B 75.0 76.0 8 hufang m b B 77.0 69.0 9 lili f b B 82.0 63.0 10 zhaoli f c A 90.0 91.0 11 zhangqun m a A 91.0 89.0 12 iping m c
47、 C 88.0 93.0 13 liyun m a A 96.0 76.0 14 liyu f a B 89.0 87.0 15 huajin f b A 97.0 80.0,黄冈师范学院数信学院, STANDARD过程 STANDARD过程按给定的平均值和标准差对SAS数据集中的部分或全体变量进行“标准化”变换,并形成新的数据集。 在STANDARD过程中经常使用的语句有: PROC STANDARD选择项; VAR 变量表; FREQ 变量表; BY 变量表;,黄冈师范学院数信学院,在PROC STANDARD语句中可能出现的选择项有DATA数据集名,用来说明要“标准化”变
48、换的数据集名,如果省略这一选择,则指定最新建立的数据集。还有OUT数据集名,用来说明含有“标准化”变量的新数据集名,如果省略这一选择,SAS将按内部程序给出新的数据集名。 此过程将打印输出每个“标准化”变量的输入频数、平均值及标准差,黄冈师范学院数信学院,编程实例: data ex;length name$ 10; INPUT name sex$ group$ t1-t3 ; cards; (数据同上机练习) ; data st;set ex;st1=t1;st2=t2;st3=t3; proc standard mean=80 std=5 out=new; var st1-st3;forma
49、t st1-st3 5.2; proc print data=new; proc means data=new(drop=name group) maxdec=1;run;,黄冈师范学院数信学院,程序中的format st1-st3 5.2用来定义新变量的格式、即小数点前两位、小数点后两位、包括小数点共计五位,可以省略这个语句 本程序运行的结果如下: NAME MEAN STD N ST1 81.40 11.58 15 ST2 87.13 9.04 15 ST3 80.13 10.68 15,黄冈师范学院数信学院,OBS NAME SEX GROUP T1 T2 T3 ST1 ST2 ST3
50、1 wangdong 1 1 90 70 60 83.71 70.52 70.57 2 xueping 2 2 85 95 88 81.55 84.35 83.68 3 zhouhua 1 1 77 84 69 78.10 78.27 74.79 4 heyan 1 2 95 78 88 85.87 74.95 83.68 5 sunhong 2 3 89 97 87 83.28 85.46 83.22 6 zhaobin 2 3 66 98 86 73.35 86.01 82.75 7 huangshan 2 3 67 75 76 73.78 73.29 78.06 8 hufang 1 2
51、 78 77 69 78.53 74.39 74.79 9 lili 2 2 70 82 63 75.08 77.16 71.98 10 zhaoli 2 3 95 90 91 85.87 81.59 85.09 11 zhangqun 1 1 93 91 89 85.01 82.14 84.15 12 iping 1 3 59 88 93 70.33 80.48 86.03 13 liyun 1 1 89 96 76 83.28 84.90 78.06 14 liyu 2 1 79 89 87 78.96 81.03 83.22 15 huajin 2 2 89 97 80 83.28 85
52、.46 79.94,黄冈师范学院数信学院,OBS NAME SEX GROUP T1 T2 T3 ST1 ST2 ST3 1 wangdong 1 1 90 70 60 83.71 70.52 70.57 2 xueping 2 2 85 95 88 81.55 84.35 83.68 3 zhouhua 1 1 77 84 69 78.10 78.27 74.79 4 heyan 1 2 95 78 88 85.87 74.95 83.68 5 sunhong 2 3 89 97 87 83.28 85.46 83.22 6 zhaobin 2 3 66 98 86 73.35 86.01
53、82.75 7 huangshan 2 3 67 75 76 73.78 73.29 78.06 8 hufang 1 2 78 77 69 78.53 74.39 74.79 9 lili 2 2 70 82 63 75.08 77.16 71.98 10 zhaoli 2 3 95 90 91 85.87 81.59 85.09 11 zhangqun 1 1 93 91 89 85.01 82.14 84.15 12 iping 1 3 59 88 93 70.33 80.48 86.03 13 liyun 1 1 89 96 76 83.28 84.90 78.06 14 liyu 2
54、 1 79 89 87 78.96 81.03 83.22 15 huajin 2 2 89 97 80 83.28 85.46 79.94,黄冈师范学院数信学院,N Obs Variable N Minimum Maximum Mean Std Dev 15 T1 15 59.0 95.0 81.4 11.6 T2 15 70.0 98.0 87.1 9.0 T3 15 60.0 93.0 80.1 10.7 ST1 15 70.3 85.9 80.0 5.0 ST2 15 70.5 86.0 80.0 5.0 ST3 15 70.6 86.0 80.0 5.0,黄冈师范学院数信学院,10.
55、3.4.5 TRANSPOSE过程 TRANSPOSE过程将一个数据集进行转置,使行变为列而列变为行,也就是使原数据集中样品的观测值变换成新数据集中变量的观测值,而原数据集中变量的观测值则变换成新数据集中样品的观测值。 TRANSPOSE过程的格式为: PROC TRANSPOSE选择项; VAR 变量表; BY 变量表;,黄冈师范学院数信学院,在PROC TRANSPOSE语句中可能出现的选择项有: ()DATA数据集名,用来说明要转置的数据集名,如果省略这一选择,则指定最新建立的数据集。 ()OUT数据集名,用来说明转置所建立的新数据集名,如果省略这一选择,SAS将按内部程序给出新的数据集
56、名。 ()PREFIX字母(指定一个前缀,用来构成新变量名)。 ()NAME字母(为含有输入数据集中被转置的变量名的输出数据集中的变量命名,如果省略这一选择,SAS将按内部程序指定)。,黄冈师范学院数信学院,在VAR语句中应列出要被转置的变量名,否则原数据集中未在其他语句中列出的所有数值型变量都将被转置,字符型变量必须在VAR语句中列出才能被转置,未被转置的变量不进入新的数据集,除非它们已列入COPY或BY语句。 BY语句使输入数据集分组转置,分组变量被包括在输出数据集中。,黄冈师范学院数信学院,编程实例: data ex;INPUT a b c ; cards; 50 147 183 49 85 136 77 195 244 ; proc transpose pr
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年全球及中国瓦楞纸板输送带行业头部企业市场占有率及排名调研报告
- 2025-2030全球RF IC 设计服务行业调研及趋势分析报告
- 2025年全球及中国拖拽式滴盐撒播机行业头部企业市场占有率及排名调研报告
- 2025年全球及中国运水式模温机行业头部企业市场占有率及排名调研报告
- 中国居民膳食指南准则一食物多样合理搭配讲解
- 作用于中枢神经系统的药物讲解
- 2025软件产品代理版合同书
- 安防设备采购政府采购合同
- 2025房屋抵押贷款的合同范本
- 2025承运合同书范本范文
- 施工现场人力资源施工机具材料设备等管理计划
- 第八章《运动和力》达标测试卷(含答案)2024-2025学年度人教版物理八年级下册
- GB/T 13813-2023煤矿用金属材料摩擦火花安全性试验方法和判定规则
- 动物检疫技术-动物检疫的方法方式(动物防疫与检疫技术)
- DB31 SW-Z 017-2021 上海市排水检测井图集
- 日语专八分类词汇
- GB/T 707-1988热轧槽钢尺寸、外形、重量及允许偏差
- GB/T 33084-2016大型合金结构钢锻件技术条件
- 高考英语课外积累:Hello,China《你好中国》1-20词块摘录课件
- 茶文化与茶健康教学课件
- 降水预报思路和方法
评论
0/150
提交评论