第5章SAS过程步应用_第1页
第5章SAS过程步应用_第2页
第5章SAS过程步应用_第3页
第5章SAS过程步应用_第4页
第5章SAS过程步应用_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第4章SAS过程步应用过程步概述SAS过程步(procstep)是SAS系统的另一个核心步,用来对生成的数据集进行分析和处理,是SAS内部已经编译好的过程。用户可根据业务需求,直接调用SAS内部过程并对所调用过程选项设置进行分析处理、作图和报表,然后根据调用过程输出的信息写出分析报告做总结性评价。SAS系统中所谓的过程步是指调用SAS内部已经编译好的过程对数据集进行动态分析的过程。过程步内部处理机制和作用过程步以“proc”关键字为开始标志,通过“proc”语句调用过程名和数据集,输出分析报告或图形或对数据集变换处理的动态执行过程。过程步的主要作用是分析数据或对数据集做变换处理,输出分析报告或图形等分析信息,然后用户根据输出信息写出分析报告,做总结性评价。过程步语法格式Proc过程名<data=数据集名><选项>;

过程语句<参数选项>;run;【注意】对于调用SQL过程,结束标志是Quit.表5-1过程步语法说明过程步操作语句

功能proc过程步开始过程关键字,告诉SAS系统此处为过程步过程名SAS系统内部编译好的过程,直接写过程名Data=指定过程步处理的数据集选项控制过程的选项。每个过程都有自己的选项,同时还有通用选项过程语句过程内部分析数据集用到的语句参数选项过程语句具有的选项,如分析变量选项run告诉过程步到此处结束,也可以省略此语句,在下一个过程步或数据步的开始处结束表5-2过程步通用基本语句过程语句

功能var指定分析变量,多个变量以空格分隔by指定一个或多个分组变量对数据集分组,数据集要先排序class指定一个或多个分类变量,不需要实现对数据集排序model建模中指定模型的因变量和自变量,以及相关模型选项freq指定用于分析变量的频数变量weight指定权数变量,以获得该变量占百分比的权重id指定观测标识,输出会去掉obs选项标识output将过程分析结果输出到新数据集where条件选项语句title输出文件加入标题信息footnote输出文件加入脚注信息options

通过此语句设置,改变SAS系统的默认设置注意过程步中的过程语句与数据步中的语句不同,数据步中的语句不能用到过程中,过程步中的过程语句以某一个关键字开始,如by、var、class、weight、freq、model等。过程步基本语句1.var语句过程步中通过var语句指定分析变量,告诉SAS系统过程步对所要分析数据集的哪些变量进行分析,多个分析变量之间用空格分隔。省略该语句时默认对数据集的所有变量进行统计分析.语法格式:var变量名1变量名2变量名3…变量名N;功能:指定要分析的变量。【注意】此处的变量名为过程步指定的数据集中所具有的变量名。过程步基本语句1.by语句By语句指定一个或几个分组变量,根据by语句中指明的分组变量对数据集中的观测记录进行分组,然后对每一组观测记录通过所调用过程进行组内分析,多个变量之间用空格分隔.语法格式:by变量名1变量名2变量名3…变量名N;功能:by语句对数据集按指定变量先进行分组,然后对分好的组进行组内分析。【注意】使用by语句的过程步中,对所分析的数据集要先通过sort过程对数据集排序,方可在用by语句的过程对排序后的数据集分组。过程步基本语句3.class语句class语句指定一个或几个分类变量,对分析的数据集不需要按分类变量先通过sort过程排序后再分析.这是Class语句与by语句的不同之处。在方差分析过程中,class语句中指定的变量是因变量,在均值过程(means)中,class语句和by语句功能相同。调用不同的过程,class语句中分析变量表示的意义也不同。语法格式:class变量名1变量名2…变量名N;功能:过程步中用class语句可以指定分类变量,然后过程步再对分好类的组进行组内分析。过程步基本语句4.model语句model语句指定模型的样式。通过model语句可以寻找变量与变量之间的关系,在销售领域或风险控制领域经常用到此语句寻找变量之间呈现的关系,来帮助决策控制销售和风险。语法格式:model因变量=自变量表/选项;功能:过程步中为所用到的分析过程指定分析模型,并给出模型用到的因变量和自变量的个数和变量名。【注意】因变量=自变量表/选项语句就相当于医院直线方程y=kx+b,y变量因自变量x变化而变化。过程步基本语句5.freq语句SAS用freq语句分析数据集中某个变量出现的次数。语法格式:freq变量名;功能:对freq中指定的变量求出数据集中观测出现的频度,即出现的次数,是对变量的一个累加过程。【注意】freq语句中指定的变量只能是数值型变量。过程步基本语句6.weight语句通过weight语句对某个变量进行统计分析,可以看出此变量在总体中的相对重要程度。语法格式:weight变量名;功能:分析变量在所观测记录中占总观测记录的比重,即百分比。【注意】weight语句中指定的变量只能是数值型变量,当变量值对应值为零或缺失时此观测记录不作为分析数据,该观测记录被剔除出分析过程。过程步基本语句7.id语句过程步用id可以替代SAS默认的obs标识,id省略时用SAS默认obs来标识观测记录。语法格式:id标识变量名;功能:区分不同观测记录的变量,相当于指定一个区别标识,每个观测有唯一标识。【注意】weight语句中指定的变量只能是数值型变量,当变量值对应值为零或缺失时此观测记录不作为分析数据,该观测记录被剔除出分析过程。过程步基本语句8.output语句output语句把过程步分析的结果输出到指定的数据集语法格式:outputout=新数据集名<关键字=变量名>;功能:将调用过程的分析结果输出到一个新数据集中。【注意】如果分析的输出结果想永久保留,必须建立永久逻辑库,然后通过二级名方式存储新数据集,即逻辑库名.新数据集名。过程步基本语句9.where语句Where语句为过滤条件语句。语法格式:where过滤条件;功能:根据条件取出数据集中的数据。10.title语句title语句用于加入标题信息,对输出报告需要加入标题信息的可以通过此语句输入标题内容。语法格式:titlen‘标题信息’;功能:为过程分析输出信息加入标题信息。【注意】title语句中的“n”为整数,用于告诉SAS系统在第几行显示标题信息。过程步基本语句10.footnote语句footnote语句用于加入脚注信息。语法格式:footnote脚注信息;功能:在输出页底部打印脚注信息。11.options语句options语句主要是改变SAS系统的默认设置,属于全局性的变量设置,在SAS会话没有退出会话期间有效,当前会话执行时,options语句改变属性设置,上一个会话的options语句设置失效。语法格式:options选项1

<选项2>…;功能:改变SAS系统默认设置。表5-4options常用选项说明选项功能date输出页显示日期,SAS系统默认输出页显示日期nodate输出页不显示日期Linesize=指定显示日志和输出信息的行宽度number输出显示页号,SAS系统默认输出页显示页号nonumber输出不显示页号Pagesize=指定每个输出页显示的行数,取值范围为[15,32767]中的整数值center输出页信息居中,SAS系统默认输出信息居中nocenter输出页信息不居中notes日志窗口默认显示注释nonotes

设置日志窗口不显示注释nosource日志窗口不显示编写的程序信息过程步变量属性语句表5-5常用变量属性语句变量属性语句

功能label指定变量标签,相当于指定解释变量意义的功能format指定变量输出格式,用于对变量输出显示属性的定义attrib定义变量属性,与数据步中的用法一样label语句用label语句给变量指定一个可以识别的名字,其语法格式与数据步中定义的语法格式相同。Label语句可以出现在过程步中的任意位置,只对该过程中定义的标签有效。语法格式:Label变量名1=‘标签名’变量名2=‘标签名’…;功能:给变量指定一个标签名,便于理解变量。【注意】label语句中的多个变量标签之间用空格分隔。format语句format语句定义输出变量的格式,与数据步中定义的语法格式相同,定义输出变量的字符或数值类型。语法格式:format变量名类型定义;功能:对变量定义输出格式。【注意】变量类型定义与数据步input语句中定义变量类型的方式相同。Artrib语句在过程步中通过artrib语句可以指定变量的属性,与数据步中定义的语法格式相同。其定义的变量属性在过程步中有效。语法格式:Attrib变量名定义变量属性;功能:attrib语句对过程步中的变量定义属性,这个属性是永久的,通过length=、format=、informat=和label=语句定义变量的具体属性。Artrib语句Attrib语句可以定义变量属性,通过以下语句指定。(1)length=<$>w.d:字符变量前面加$符号。(2)format=:定义变量的输出格式。(3)informat=:定义变量的输入格式。(4)label=:定义变量标签。【注意】通过attrib语句定义变量时上面所列的4个语句可以同时使用,也可以任取一个或几个,根据需求选择匹配项定义变量属性。过程步选项参数过程步选项参数是所调用过程控制分析数据集的设置项。有些选项参数设置只对所调用过程有效,只有此过程具有,其他过程不具有此选项参数。对此选项参数的设置要具体过程具体分析。所有过程名所具有的选项参数的设置方法相同。表5-6print过程选项参数说明选项参数

功能no

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论