统计分析系统--SAS简介_第1页
统计分析系统--SAS简介_第2页
统计分析系统--SAS简介_第3页
统计分析系统--SAS简介_第4页
统计分析系统--SAS简介_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计分析系统SAS简介1.1 SAS系统简介概况SAS是美国SAS软件研究所研制的一套大型集成应用软件系统,具有完备的数据存取、数据管理、数据分析和数据展现功能。尤其是创业产品统计分析系统部分,由于其具有强大的数据分析能力,一直为业界著名软件,在数据处理和统计分析领域,被誉为国际上的标准软件和最权威的优秀统计软件包。经过多年的发展,SAS已被全世界120多个国家和地区的近三万家机构所采用,直接用户则超过三百万人,遍及金融、医药卫生、生产、运输、通讯、政府和教育科研等领域。相关网络学习资料SAS软件下载/incoming/Science/statSAS6.12-9.0的各相应版本SAS的一些网络

2、资源SAS公司官方网站SAS简体中文官方网站SAS中文论坛1.1 SAS系统简介概述SAS系统全称为Statistical Analysis System。SAS系统最早由美国北卡罗来纳州立大学的两位生物统计学研究生编制,并于1976年成立了SAS软件研究所,正式推出SAS软件。SAS现在的最新版本为9.2版,根据不同的安装方式,所占硬盘空间大约为1-2G。目前应用比较广泛的版本还有6.12版和8.2版。1.1 SAS系统简介SAS的特点功能强大,统计方法齐、全、新SAS提供了从基本统计数的计算到各种试验设计的方差分析,相关回归分析以及多变量分析的各种统计分析过程,几乎囊括了所有的最新统计分析

3、方法,其分析技术先进,可靠。素以严谨著称的美国食品药物管理局评审新药时只承认用SAS软件进行统计分析所得的研究报告。使用简便,操作灵活SAS以一个通用的数据步产生数据集,尔后以不同的过程用以完成各种数据分析。其编程语句简洁,短小,通常只需很小的几个语句即可完成一些复杂的运算,得到满意的结果。联机帮助功能强大1.1 SAS系统简介SAS 全球专业认证 SAS专业认证是一项拥有极高国际声誉的专业认证,在欧美等国的职场上流行的一句话“If you have a SAS certification, You will never lose your job”。获取SAS全球专业认证,既是你自身技术能力

4、的体现,也将帮助您开创美好的未来,在激烈的竞争中处于领先位置。 在北美95%以上的大学把SAS列为统计课程中的必修课,在其他各国的主要大学中,也将SAS作为一门重要的课程要求学生学习。SAS在全球有着无数的成功案例,SAS认证的适用行业非常广泛,从金融、电信、保险、交通、制造、政府到科研、教育等部门,SAS认证在很多行业都可作为能否胜任工作的凭证。 1.1 SAS系统简介SAS的模块化结构SAS系统是一个组合软件系统,连同正在开发的模块,它一共由50个左右的功能模块组合而成。SAS的基本部分是SAS/BASE模块,该模块是SAS系统的核心,承担着主要的数据管理任务,并管理SAS的用户使用环境,

5、进行用户语言的处理,调用其它SAS模块和产品。在SAS/BASE的基础上,用户还可以增加各种模块而增加不同的功能,如SAS/STAT(统计分析模块)、SAS/GRAPH(绘图模块)、SAS/OR(运筹学模块)、SAS/IML(交互式矩阵程序设计语言模块)等。1.1 SAS系统简介SAS的操作方式经过多年的发展,SAS现在已经成为一套完整的第四代计算机语言,使用程序方式,用户可以完成所有工作,包括统计分析、预测、建模和模拟抽样等。此外,SAS还提供了各类概率分析函数、分位数函数、样本统计函数和随机数生成函数,使用户能方便地实现特殊统计要求。1.2 界面操作入门SAS的主窗口菜单栏命令栏工具栏窗体

6、窗口栏状态栏1.2.2 SAS的子窗口SAS启动时,默认会打开以下五个窗口:增强型程序编辑器(Enhanced Editor)窗口日志(Log)窗口结果输出(Output)窗口资源管理器(Explorer)窗口结果(Results)窗口1.2.2 SAS的子窗口增强型程序编辑器(Enhanced Editor)窗口系统默认提供的程序编辑窗口以不同的颜色显示出SAS程序中不同的部分,并同时进行语法检查如用深蓝色表示数据步/程序步开始;蓝色表示关键字;棕色表示字符串;浅黄色表示数据块;红色表示可能的错误。增强型程序编辑器窗口中的内容在保存时应当被存为SAS程序格式,实际上就是扩展名为“.sas”的

7、纯文本文件。1.2.2 SAS的子窗口Log窗口Log窗口用于输出程序在运行时的各种有关信息。主要有以下几种内容:程序行,黑色,记录执行过的每一条语句。提示,蓝色,以NOTE开始,提供系统或程序运行的一些常规信息,大多数时候我们可以视而不见。警告,绿色,以WARNING开始,一般在程序中含有系统可以自动更正的小错误时出现,此时会提供错误序列号。错误,红色,以ERROR开始,当出现该信息说明程序有错误,执行结构必然是不正确的。Log窗口中的内容在保存时应当被存为扩展名为“.log”的纯文本文件。1.2.2 SAS的子窗口结果输出(Output)窗口从该窗口中,可以对SAS程序的输出结果进行阅读。

8、结果输出窗口中的内容是分页显示的,每一页最上方均显示相应的页标题,结果生成时的日期和时间。当结果输出非常长时,为了能够方便地查阅某一部分结果,可以利用结果(Results)窗口中的目录树进行快速定位。结果输出窗口中的内容可以保存为扩展名为.lst的纯文本文件。1.2.2 SAS的子窗口结果(Results)窗口结果窗口帮助用户浏览和管理所提交SAS程序的输出结果。在该窗口中将SAS系统的所有输出结果依次按照目录树的结构加以排列,每一个过程步的结果被表示为一个结点,展开该结点就可进一步看到表示不同输出内容的子结点,使用鼠标右键单击每个结点,就可对输出结果的各部分进行察看、存储、打印、删除等操作。

9、1.2.2 SAS的子窗口资源管理器(Explorer)窗口资源管理器窗口的作用类似于Windows操作系统的资源管理器,用于浏览和管理SAS系统中的各种文件。其它子窗口除了增强型编辑器外,SAS还提供了普通的程序编辑(program editor)窗口;当使用SAS作图时,相应的统计图会在专门的Graph窗口中输出;SAS的数据集显示窗口Viewtable等。1.2.3 SAS的菜单SAS系统工作过程中,系统主菜单是动态变化的,随当前激活的窗口不同而有不同的组织结构,提供不同的主菜单命令。其中的主要命令及功能:File(文件)支持SAS文件的调入、保存及打印的功能。Edit(编辑)支持编辑窗

10、口的基本编辑操作(例如:清空、复制、剪切等)View(浏览)支持SAS系统用户在多窗口之间切换Tools(工具)提供对各种输出结构进行编辑的工具,如:表格、图形、报告等,并支持进行系统环境和状态的设置Run(运行)用于执行或调用程序Solutions(解决方案)支持用户进行统计分析1.2.4 SAS的工具栏工具栏图标提供了常见任务的快捷操作方式新建打开保存打印打印预览剪切复制粘贴撤销建立新库资源浏览器窗口执行清除暂停帮助1.3 SAS系统的文件管理SAS的逻辑库在SAS系统中为了使众多SAS文件的管理和使用更为清晰方便,将它们按照不同需要归入若干个SAS逻辑库,以此来对SAS文件进行访问和管理

11、。一个SAS逻辑库实际上就是一个SAS文件的集合,因此在SAS系统的信息组织中,总共有两个层次:逻辑库是高一级的层次,低一级的层次就是SAS文件本身。1.3 SAS系统的文件管理永久库和临时库SAS的逻辑库可以分为永久库和临时库两种。临时库只有1个,名为work,它在每次启动SAS系统后自动生成,关闭SAS时库中的所有SAS文件会被自动删除。永久库可有多个,用户可以使用Libname语句指定永久库名称所对应的文件夹,永久库中的所有文件都将被保留,但库名仍是临时的,每次启动SAS系统后都要重新指定。如:libname a c:user;2 SAS编程入门SAS程序使用常识SAS程序的数据步SAS

12、程序的过程步程序的修改与调试结构化语句简介SAS函数简介2.1 SAS程序的使用常识SAS语句的基本结构SAS程序由若干个语句组成,多数语句都由特定的关键字开始,语句中可包含变量名,运算符等,它们之间以空格分隔。所有的语句都以分号“;”结束,SAS对语句所占的行数并无限制,一个语句可占一行,也可占多行;反之,多个语句语句也可在同一行内。2.1 SAS程序的使用常识数据步和过程步在SAS中只有两种程序步:数据步(Data Step)和过程步(Proc Step)。数据步是用来创建和修改用于统计分析的数据集。过程步则利用已创建的数据集完成特定的统计分析任务。SAS程序的运行选择菜单【run】【su

13、bmit】F8 一个简单的SAS程序数据步过程步2.1 SAS程序的使用常识SAS程序中的注释为了使得长程序更为清晰易读,在相应程序段间可以考虑使用空行分隔,也可以使用注释加以说明。其基本格式为:注释语句: 使用星号“*”开始,可占多行,以分号“;”作为结束。注释段落:用字符组“/*”和“*/”包括起来的任何字符内容,可占多行。注释语句显示为绿色。2.2 SAS程序的数据步逻辑库和逻辑文件名在PC系统中,SAS数据库与某一个文件夹相对应,我们要为每一个数据库指定一个库标记来识别该库,此处利用Libname命令。基本格式为:Libname 库标记 文件夹位置 选项例如要指定目录“C:”为库标记A

14、,可以输入以下语句:Libname a c:;在调用时每一个数据集都需要使用两级名称来指定,第一级是库标记,第二级是数据集名,中间用“.”隔开。其一般形式为:库标记.数据集名如数据文件“c:abc.sas7bdat”在上面的libname语句运行完毕后,就可以在程序中使用“a.abc”来调用。2.2 SAS程序的数据步数据步的基本结构数据步均以DATA语句开始,用于创建和处理数据集。其中最常用的语句有:data、input、cards/datalines、infile、output和set。DATA语句它用于标志数据步的开始,同时命名将要创建的SAS数据集其一般形式为:DATA 数据集名;例如

15、Data work.abcData abcData a.abc2.2 SAS程序的数据步Input 语句主要功能是确定变量的读入模式,即数据域中的数据对应了哪些变量。基本格式为:input 变量名 ;例如:Input x y z; *确定x、y、z三个变量;Input x1-x10; *确定x1-x10十个变量;Input x $ y ; *$指明变量x为字符变量,表明数据是连续读入的;2.2 SAS程序的数据步Cards/datalines语句Cards语句或datalines语句的功能相同,只是前者适用于任何版本,而后者只在8.0以后的版本中才适用。它们均可用于标志数据块的开始,随后紧跟需

16、要读入的数据。格式为:Cards;数据块;需要注意的是数据块必须单独占一行或多行,最后表示数据块结束的分号也必须另起一行书写。2.2 SAS程序的数据步数据步实例1连续性读入数据的使用data temp; 命名将要建立的数据集为work.tempinput x y; 要输入的变量为x、y,并且连续输入cards; 直接输入数据,数据块开始34 56 78 90 35 67 89 10 23 65 77 45 数据块; 数据块结束2.2 SAS程序的数据步数据步实例2多种变量类型读入2.2 SAS程序的数据步数据步实例3用Data步创建永久SAS数据集2.2 SAS程序的数据步Infile语句主

17、要功能是指定一个包含原始数据的外部文本文件,从而使得数据步可以从这一文本文件读入数据块。在数据步中必须在input语句之前,其语法格式为:Infile 外部文件的位置及名称 选项;例data new;infile e:2-2.txt;input x;run;2.2 SAS程序的数据步使用向导实现数据的导入和导出SAS可以利用FILE菜单上的import命令将其他格式的数据文件导入SAS系统,创建SAS自己的数据集。可以导入的数据文件格式有:dBase数据库,EXCEL工作表,LOTUS的数据库,纯文本的数据文件等 2.3 SAS程序的过程步通俗的讲,SAS程序的过程步就是已经编好的用于实现各种

18、统计分析功能的计算机程序,我们只需按照规定好的格式调用它们就是了。程序步总是用一个proc语句开始,后面紧跟着过程步名,用以区分不同的过程步。过程步一般以RUN语句结束,若省略RUN,则过程步在下一个过程步或数据步开始处结束。常用过程步的名称及功能两个实用的过程简介PRINT过程读入SAS数据集中的数据,将变量排成易读的形式输出。例如PROC PRINT DATA=new;VAR x1 x2 x3 x4 x5 y;RUN;读入SAS数据集new中的数据,对其中的变量x1、x2、x3、x4、x5和y排成易读的方式输出。两个实用的SAS过程简介SORT过程用于对数据集中的数据按指定的变量进行排序排

19、序结果存入新数据集或存回原数据集中。2.3.1 过程步的基本结构过程步的基本结构2.3.1 过程步的基本结构过程步的基本结构上述尖括号里的语句或选项可以省略,此时该过程按最通常的情况来处理,即:处理最新建立的SAS数据集。处理所有的变量(或对一个计算过程来说处理全部数值变量)。一次处理整个数据集而不是某个子集。2.3.2 过程步的语法说明Data选项用于指明所需处理的数据集名,在这里它是一个可选项参数。Var语句如果只想分析某一个或几个特定的变量,则可用var语句指定它们。例如在数据集中有x、y、z三个变量,如果只想显示变量x的列表,则print过程如下:Proc print; var x;R

20、un;2.3.2 过程步的语法说明Var语句如果想显示x和y两个变量,则将VAR语句改为如下形式即可:Proc print; var x y;Run;2.3.2 过程步的语法说明Where语句如果你想处理的不是整个数据集而只是其中符合某种条件的子集,那么WHERE语句将会非常有用。如上例中我们只想显示大于50的x变量的值,则在PRINT过程中加入where语句如下:Where x50;如果条件变为x、y两个变量的值都要大于50,则where语句改为:Where x50 and y50;2.3.2 过程步的语法说明By语句用于指定分组变量。如果你需要分组处理数据,例如要按性别分组输出统计结果,你

21、有两种选择,一是用不同的where语句将同一个程序步反复写几遍;另一种显然更酷的方法就是采用by语句。注意:在适用by语句时,SAS要求数据集已经使用sort过程按照相应的分组变量进行了排序。格式为:PROC SORT ; BY 变量名列;RUN;如我们想按不同的y值输出x值,则加入by语句如下:By y;2.4 结构化语句简介分支(条件)语句IFTHEN语句语法格式为:IF 条件 THEN 语句1;ELSE 语句2;Else语句及其后的语句块可以省略。SAS的IF语句结构允许嵌套使用,即在语句“THEN 语句1”部分或“ELSE 语句2”部分包含另一个结构完整的IF语句。应用实例在产生数据集

22、temp的同时为其增加变量class,当x50时class=1,否则class=2。程序如下data temp; 数据步开始,定义要建立的数据集为WORK.TEMP input x y; 要输入的变量为X和Y,采用数据连续读入方式 if x50 then class=1; 建立新变量,如果X50,则CLASS=1 else class=2; 否则,CLASS=2cards; 数据块开始34 56 78 90 35 67 89 10 23 65 77 45 数据块; 数据块结束proc print; 列表输出数据集中的数据,检查有无错误run; 程序结束,开始运行以上程序 2.4 结构化语句简介

23、分支(条件)语句SELECTWHEN语句SAS的SELECT语句提供了灵活的多分支控制结构。基本格式为:SELECT;WHEN (条件1) 执行语句A;WHEN (条件2) 执行语句B;OTHERWISE 执行语句Z;END;实例上例使用select语句,则程序为:Data new; 数据步开始,定义要建立的数据集为WORK.NEWInput x y; 输入变量x和y,采用连续性输入方式Select; slect条件语句开始 when (x=50) class=2; 指定条件2 otherwise; 其它情况End; select语句结束Cards; 数据块开始34 56 78 90 35 6

24、7 89 10 23 65 77 45 数据块; 数据块结束Run; 程序结束,开始运行以上程序2.4 结构化语句简介循环语句DOEND语句基本格式:Do 起始条件 to 终止条件;程序块End;DO和END语句之间的SAS语句称为循环体,当条件满足时,循环体语句被重复执行。实例在产生上述的数据集时为其增加变量,取值依次为1、2。程序如下:Data new; 定义要建立的数据集为work.new do class=1 to 2; 循环开始,控制变量为class,取值为1到2 Input x y; 要输入的变量x和y,采用连续读入方式 output; 用output语句将变量值写成数据集中的记录

25、End; 循环结束Cards; 数据块开始35 46 78 90 35 67 89 10 23 65 77 45 数据块; 数据块结束Run; 数据步结束,开始运行以上程序2.4 结构化语句简介循环语句除DO END之外,另外两种循环的实现语句为DO WHILE和DO UNTIL,它们的语法和使用方式比较简单。其语法结构分别为:2.4 结构化语句简介2.5 SAS函数简介在SAS的统计分析系统中提供了大量的SAS函数(SAS Functions),用以计算和赋值,熟练掌握这些函数的功能和使用方法,将为数据的整理、交换、编程及统计学分析、作图等带来很大的方便。2.5 SAS函数简介算术函数ABS(argument)绝对值函数MAX( argument , argument ,)最大值函数MIN( argument , argument , )最

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论