文库发布:sas课件_第1页
文库发布:sas课件_第2页
文库发布:sas课件_第3页
文库发布:sas课件_第4页
文库发布:sas课件_第5页
已阅读5页,还剩88页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计软件SAS:这是功能非常齐全的软件;尽管价格不菲,许多公司还是因为其功能众多和某些美国政府机构认可而使用。尽管现在已经尽量“傻瓜化”,仍然需要一定的训练才可以进入。SPSS:这是一个很受欢迎的统计软件;它容易操作,输出漂亮,功能齐全,价格合理。对于非统计工作者是很好的选择。STATA:这是众多统计软件的后起之秀;它操作灵活、简单、易学易用,同时具有数据管理软件、统计分析软件、绘图软件、矩阵计算软件和程序语言的特点。占用计算机系统资源少,绘图漂亮,对有简单编程基础者来讲十分容易上手,有专门出版的专业刊物。以上三种软件并称为新的国际三大权威统计软件Excel:它严格说来并不是统计软件,但作为数据表格软件,必然有一定统计计算功能。而且凡是有MicrosoftOffice的计算机,基本上都装有Excel。但要注意,有时在装Office时没有装数据分析的功能,那就必须装了才行。当然,画图功能是都具备的。对于简单分析,Excel还算方便,但随着问题的深入,Excel就不那么“傻瓜”,需要使用函数,甚至根本没有相应的方法了。多数专门一些的统计推断问题还需要其他专门的统计软件来处理。统计软件S-plus:这是统计学家喜爱的软件。不仅由于其功能齐全,而且由于其强大的编程功能,使得研究人员可以编制自己的程序来实现自己的理论和方法。它也在进行“傻瓜化”以争取顾客。但仍然以编程方便为顾客所青睐。R软件:这是一个免费的,由志愿者管理的软件。其编程语言与S-plus所基于的S语言一样,很方便。还有不断加入的各个方向统计学家编写的统计软件包。同时从网上可以不断更新和增加有关的软件包和程序。这是发展最快的软件,受到世界上统计师生的欢迎。是用户量增加最快的统计软件。对于一般非统计工作者来说,主要问题是它没有“傻瓜化”。统计软件Minitab:这个软件是很方便的功能强大而又齐全的软件,也已经“傻瓜化”,在我国用的不如SPSS与SAS那么普遍。Statistica:也是功能强大而齐全的“傻瓜化”的软件,在我国用的也不如SAS与SPSS那么普遍。Eviews:这是一个主要处理回归和时间序列的软件。GAUSS:这是一个很好用的统计软件,许多搞经济的喜欢它。主要也是编程功能强大。目前在我国使用的人不多。FORTRAN:这是应用于各个领域的历史很长的非常优秀的编程软件,功能强大,也有一定的统计软件包。计算速度比这里介绍的都快得多。但需要编程和编译。操作不那么容易。MATLAB:这也是应用于各个领域的以编程为主的软件,在工程上应用广泛。编程类似于S和R。但是统计方法不多。第一章SAS基础1.1初识SAS1.2SAS编程初步1.1初识SAS1.1.1SAS简介1.1.2使用SAS1.1.3SAS对数据文件的管理1.1.1SAS简介1.SAS与统计分析在众多的统计软件中,SAS以运行稳定、功能强大而著称。近20年来,SAS一直占据着统计软件的高端市场,用户遍及金融、医药卫生、生产、运输、通讯、政府和教育科研等领域。在数据处理和统计分析领域,SAS系统被誉为国际上的标准软件,堪称统计软件界的巨无霸。1.1.1SAS简介1.SAS与统计分析在国际学术界有条不成文的规定,凡是用SAS统计分析的结果,在国际学术交流中可以不必说明算法,由此可见其权威性和信誉度。2.SAS的版本介绍

SAS是在1960年代末期由两位北卡州立大学(NorthCarolinaStateUniversity)统计系的教授开发.第一版的SAS只含一般线性模型的分析法,而且只适用于IBM的主机;1976年成立SAS公司负责软件的发展、维护并提供相关服务.PC版本的SAS于1987年推出(V6.02),1989年推出SAS/PC(V6.04)版本;1997年下半年推出适用于多种操作系统的V6.12版本(Windows版);2000年2月又推出SAS系统V8版本,2001年推出SAS系统V8.2版本;目前SAS最新版本为V9.13.3.SAS的功能模块

SAS系统由三十几个模块组成,其分析功能散布在几乎所有的模块之中,较为集中的具有统计分析功能的是SAS/BASE、SAS/STAT、SAS/QC、SAS/INSIGHT、SAS/ETS等一些模块,通过编程可以调用各种分析功能。对于常用的一些统计分析方法,SAS系统中的如下三种方法可以达到同样的目的:●INSIGHT(“交互式数据分析”)●Analyst(“分析家”)●直接编程

我们重点讲述BaseSAS,它是SAS提供的各种数据管理和分析软件组件的核心基础。BaseSAS提供了一些基本工具,可用于完成程序员通常要做的一些基本数据驱动型任务:数据访问管理分析呈现

可以使用SAS编程语言、现成的过程以及窗口界面

访问多种资源中的数据管理数据对数据进行分析并将其作为有意义的信息呈现在报表中,还可将该报表以希望的格式发送到任何平台访问数据

可以使用SAS访问任何数据源或平台中的数据,而不受其位置的限制。也就是说,可以访问:位于任意位置的数据,如系统中的文件、存储在远程服务器上的数据或其他数据库系统中的数据。使用任意格式的数据,如原始数据、SAS数据集以及由其他厂商的软件创建的文件。

可访问的文件类型

可读取任意格式、任意类型的原始数据,包括变长记录、二进制文件、自由格式的数据,甚至是包含混乱或缺失数据的文件。可直接访问某些厂商的文件,如:BMDP、SPSS和OSIRIS文件。对于其他格式的文件,可以使用SAS/ACCESS,它可以如同访问SAS内部数据一样访问外部数据。例如,可以读取存储在MicrosoftExcel电子表格、MicrosoftAccess表、dBASE

文件中的数据。管理数据

访问数据后,可以使用SAS编程语言以任意方式对数据进行处理。例如,可以

设置数据的格式取数据子集创建变量(列)执行条件处理使用运算符求解数据值合并各种数据源使用函数创建并重编码数据值创建、检索并更新数据库信息

分析

BaseSAS提供了强大的数据分析工具。您可以生成表、频数统计以及交叉表创建各种图表和点/线图

计算各种描述性统计量,包括均值、总和、方差、标准偏差等等

计算相关量和其他关联测度,以及多向交叉表和推理统计量

1.1.2使用SAS1.SAS的启动在Windows环境中,用如下方法可以进入SAS系统的窗口运行环境:●用鼠标选择系统菜单项:“开始”→“程序”→“TheSASSystem”→“TheSASSystemforWindowsV8”●如果SAS安装系统在桌面上建立有快捷方式图标,双击SAS.EXE图标启动SAS。

2.SAS的操作界面

SAS系统启动后,进入SAS操作界面。SAS操作界面的标准名称为SASApplicationWorkSpace(SAS应用工作空间),简称SASAWS。如同其它许多Windows应用程序一样,SASAWS是一个多窗口界面:在一个主窗口内包含若干个子窗口,并有菜单栏、工具栏、状态栏等。(1)子窗口

SASV8.2的子窗口有十几个,但初始状态下能见到的是最常用的五个子窗口:

●Editor窗口:增强的程序编辑器。

在Windows操作系统中,你可以使用一个或者多个Editor窗口来进行输入、编辑和提交SAS程序。Editor窗口提供了大量的编辑功能,包括:对SAS语言的彩色编码和语法检查可展开或折叠程序片段支持键盘快捷方式(Alt或Shift加上其它键)初始化的Editor窗口标题是Editor-Untitledn,只有当你打开一个文件或把editor窗口中的内容保存成文件时,它才变为所属文件的文件名;当修改窗口中内容时,标题中将出现一个星号。通常,在Editor窗口输入SAS程序,选择菜单项“Run”→“Submit”,或者直接点击工具栏上的按钮就可以运行程序。用功能键F5或选择菜单项“View”→“EnhancedEditor”可以打开Editor窗口。●Log窗口:记录程序的运行情况。用功能键F6或选择菜单项“View”→“Log”可以打开Log窗口。Log窗口显示了关于你的SAS会话以及你提交的SAS程序的信息。

●Output窗口:显示SAS程序中各过程的运行结果。用功能键F7或选择菜单项“View”→“Output”可以打开Output窗口。在Output窗口中,你可以浏览你所提交的SAS程序的输出结果。在默认情况下,Output窗口是藏在Editor和Log窗口后面的,一旦你产生了输出,Output窗口将自动显示到前端。

●Results窗口:管理SAS程序的输出结果。选择菜单项“View”→“Results”可以打开Results窗口。Results窗口能帮助你操作和管理所提交的SAS程序的输出结果,你可以查看、保存和打印输出。默认情况下,Results窗口藏在Explorer窗口的后面并且是空的,直到你提交了产生输出的SAS程序,它才会显示到前端。●Explorer窗口:管理SAS逻辑库和存放在逻辑库中由SAS系统创建的数据文件和其它类型的SAS文件。选择菜单项“View”→“Explorer”可以打开Explorer窗口。在Explorer窗口中,你可以查看和管理你的SAS文件并为非SAS文件创建快捷方式、使用窗口来创建新的数据库和SAS文件、打开任何SAS文件以及完成大部分的文件管理工作,例如:移动、复制和删除文件。你可以选择以树形结构来显示Explorer窗口中的内容。使用SAS窗口功能

SAS窗口具有许多帮助你完成工作的功能,下图为你显示了如何管理SAS窗口,使用菜单和弹出菜单,使用工具栏以及得到帮助。管理SAS窗口

在窗口环境中,你可以把不是当前使用的窗口变为SAS窗口条点击Editor窗口中最小化按钮()把它变为SAS窗口条点击SAS窗口条中的Editor将使窗口恢复原状。

使用菜单在工作环境中的每一个窗口都有自己相应的菜单选项,通过它们你可以完成窗口的相应操作。

点击Explorer窗口;

选择查看菜单,列出了Explorer窗口中的内容显示形式;

点击Editor窗口,选择查看菜单,注意到它提供了不同的选项。

使用工具栏

工具栏为许多常用的SAS任务提供了图标,某些图标是为当前窗口特定的。点击Explorer窗口并查看工具栏上的可用图标,注意到当前不可用的图标是灰色的。把鼠标指针移到图标下面并停留一会,屏幕提示将给出相应图标的名字。

点击Editor窗口查看可用图标。

打开SAS系统帮助选择帮助→SAS系统帮助;从左边窗格的内容清单中选择主题,即可在右边窗格中阅读相关帮助内容。

3.SAS的退出在SAS应用工作空间中用鼠标单击关闭按钮,或者选择菜单“File”→“Exit”,打开“Exit”对话框,单击“确定”按钮,即可退出SAS。1.1.3SAS对数据文件的管理在SAS系统中建立的众多SAS文件,可按不同需要将其归入若干个SAS逻辑库,以便对SAS文件进行访问和管理。Explorer窗口可以管理逻辑库和各种SAS文件,一般的,对于SAS文件的复制、查看和删除等操作。在Explorer窗口中,你可以查看和管理保存在数据库中的SAS文件,库标记是保存文件的物理位置(例如目录)的逻辑名字。你可以把库标记想象为一个临时的呢称或快捷方式

逻辑库和SAS文件一个逻辑库就是存放在同一文件夹中的一组SAS文件。在SAS系统的信息组织中,总共只有两个层次:SAS逻辑库是高一级的层次,低一级的层次就是SAS文件本身。

SAS的逻辑库分为临时库和永久库两种。临时库只有一个,名为Work,存放在Work中的SAS文件叫临时文件,这些临时文件当退出SAS系统时会被自动删除。

SAS每次启动时会自动指定4个库标记:Work,Sasuser,Sashelp,Maps。Sasuser库保存与用户个人设置有关的文件,Sashelp库保存与SAS帮助系统、例子有关的文件。

SAS文件是指储存在SAS逻辑库中的成员,SAS的用户文件的主要类型有:●SAS数据集●SAS程序访问一个SAS文件,一定要指明它所在的逻辑库,格式为:逻辑库名.文件名。如在Sasuser库下建立一个名为Mydata的数据集,访问的时候,要用Sasuser.mydata。如果不指明逻辑库名,则表示存储在临时逻辑库WORK中的SAS文件。2.SAS的名字

SAS的名字(数据集名、变量名、逻辑库名等等)有以下命名规则:

1)由英文字母、数字、下划线组成;

2)第一个字符必须是字母或下划线;

3)不区分大、小写字母。另外,SAS逻辑库名最多用8个字符;数据集和变量的名字最多用32个字符。3.SAS数据集在SAS中使用数据之前,它必须以名为SAS数据集的特殊形式存在。因此,学习SAS编程的第一步就是了解SAS数据集。从概念上讲,SAS数据集(亦称“表”)是包含描述符信息和相关数据值的文件,该文件是一个以观测为行、以变量为列的、SAS可以处理的表。

SAS的核心是SAS数据集。SAS数据集是SAS文件的一种,一般由以下两部分组成:(1)描述部分包含该数据集的一般信息,包括:数据集的名字及其成员类型、数据集建立的日期和时间、观测的数目、变量的数目以及数据集中每一个变量的特征信息,包括:Name(变量名)、Type(类型)、Length(长度)、Format(输出格式)、Informat(输入格式)、Label(标签)。(2)数据部分包含该数据集中收集的数据的值,可以看作是一个矩形的表格。下图所示的数据表就是SASV8自带的数据集Sasuser.Class,其中包含了19个学生的有关信息。

4.数据集的导入导入Excel数据表的步骤如下:

1)在SAS应用工作空间中,选择菜单“File”→“ImportData…”,打开导入向导“ImportWizard”第一步:选择导入类型(Selectimporttype)。

2)在第二步的“Selectfile”对话框中,单击“Browse”按钮,在“打开”对话框中选择所需要的Excel文件,返回。然后,单击“Option”按钮,选择所需的工作表。

3)在第三步的“Selectlibraryandmember”对话框中,选择导入数据集所存放的逻辑库以及数据集的名称。

4)在第四步的“CreateSASStatements”对话框中,可以选择将系统生成的程序代码存放的位置,完成导入过程。1.2SAS编程初步1.2.1SAS程序概述1.2.2指定逻辑库1.2.3数据步简介1.2.4过程步简介1.2.1SAS程序概述1.数据步与过程步

SAS程序包括多个步骤和一些控制语句,一般情况下由两种类型的程序步(steps)组成:数据步(DATAsteps)和过程步(PROCsteps)。有时SAS程序还包括一些全程语句,用以控制贯穿整个SAS程序的某些选项、变量或程序运行的环境。1.2.1SAS程序概述1.数据步与过程步●数据步通常用于创建SAS数据集,但也可以用于产生特别设计的报表。可以使用DATA步执行以下任务:将数据放入SAS数据集计算新变量的值检查并更正数据中的错误通过对现有数据集取子集、合并和更新来生成新的SAS数据集1.2.1SAS程序概述●过程步通常用于分析和处理SAS数据集中的数据,但有时候也可用于创建数据集。可以使用PROC步执行以下任务:列显报表生成描述性统计量创建表格式报表生成点/线图和图表一个SAS程序就是由数据步、过程步或两者的任意组合而成。每一个程序步通常由若干语句(statements)构成。2.书写规则一个SAS语句有两个重要特征:●由SAS关键词(keyword)开始;●总是以分号“;”结束。datac200501;inputname$sex$mathchinese;cards;李家富男9298张丽萍女89106王春雷男8690刘刚男98109张颍女80110;procprintdata=c200501;procmeansdata=c200501;

varmathchinese;run;

说明:

1)一个数据步由关键词DATA开始,而一个过程步由关键词PROC开始。

2)SAS语句是自由格式的:一个语句可以由几行组成,可以在任一列开始和结束,几个语句可以在同一行内。SAS每看到一个分号,就将其以前、上一个分号以后的所有字符当作一条语句来处理,而不管它们处在多少个不同的行中(如代码中的二三两行为一个语句)。

说明:

3)SAS语句对字母的大小写不敏感,可以根据个人习惯决定字母的大写或小写。

4)SAS语句中的词之间用空格或特殊符号分隔。3.SAS程序中的注释在SAS程序中可以加入注释,注释使用C语言语法,用/*和*/在两端界定注释,这种注释可以出现在任何允许加入空格的位置,可以占多行。另一种注释是把以星号开头的行作为注释。一般只把注释单独占一行或若干行,不把注释与程序代码放在同一行。注释的另一个作用是把某些代码暂时屏蔽使其不被运行。下面是一个注释的例子:/*生成2005级1班考试成绩的数据集*/datac200501;4.SAS程序的提交

SAS程序在Editor窗口中编写,欲使SAS运行所编写的程序,就需要“提交(submit)”,单击热键F8,或者选择菜单项“Run”→“Submit”,或者直接点击工具栏上的按钮均可以提交程序。当一个SAS程序被提交(submit)时,每一个DATA、PROC或RUN语句会导致前面的程序步被执行。所以,一个SAS程序应以RUN语句结束,否则,最后一个程序步不会被执行。每一个程序步被分别执行。执行时,SAS系统会产生一个日志(log窗口),记录执行过程中的信息和可能发生的任何错误。执行的结果根据SAS程序的不同而有所不同:●通常SAS程序包括一些过程步,它们会创建报表形式的输出(Output窗口)。●有些SAS程序执行诸如排序或数据处理过程,除了在日志中的记录之外,不产生可见的输出结果。1.2.2指定逻辑库1.一个逻辑库连接一个文件夹建立逻辑库,又称为指定逻辑库,其实质是把一个库名和一个实际文件夹联系起来,指定逻辑库的命令语句为全程语句,其格式如下:LIBNAME<逻辑库名>"<路径>";例如指定的库名为“Mylib1”,路径为:“e:\data\”,SAS语句如下:libnamemylib1"e:\data\";

在Explorer窗口中,单击工具按钮,或是在右键菜单中选择“New”,打开“NewLibrary”对话框,可以建立新库。如果选中“Enableatstartup”复选框,则每次打开SAS时所建逻辑库都有效。复制一个数据表到新逻辑库在Explorer窗口中,你可以轻易地把文件从一个数据库复制到另一个数据库。激活Explorer窗口,选择查看

显示树形结构,Explorer分成两部分;

在左方框,单击Sashelp

数据库,可以在右方框看到数据库的内容,下拉滚动条找到Prdsale

数据表;点击Prdsale

数据表,要把数据表复制到Mylib

数据库,只需把它拖拉到左方框的Mylib

上面。重新命名数据表

1.2.3数据步简介1.建立SAS数据集利用数据步建立SAS数据集,有两种方式可以输入数据:一是将数据排列在变量名串之后;二是指定一个外部数据文件供读取。第一种方式的一般语法为:DATA<数据集名>;INPUT<变量名1>[$]<变量名2>[$]…<变量名k>[$];CARDS;d11d12…d1kd21d22…d2k….…;RUN;

例如:dataf2005;inputnumbername$@@;cards;200541001zhao200541002qian200541003sun200541004li;run;

第二种方式的一般语法为:DATA<数据集名>;INFILE'<文件名>';INPUT<变量名1><变量名2>…<变量名k>;RUN;

例如:datac200501;infile'g:\data\c2005.txt';

inputname$sex$mathchinese;run;2.数据集的复制与修改可以用SET语句把一个已有数据集复制到一个新数据集,同时还可以进行修改。如果只是复制数据集,也可以用SAS管理器(SASExplorer)完成。SET语句的语法格式有两种,有些功能有重复。格式一:DATA<新数据集名>;SET<数据集名>;[KEEP<欲保持的变量名列表>;][DROP<欲丢弃的变量名列表>;][IF<条件>[THEN<语句>];]RUN;

格式二:DATA<新数据集名>;SET<数据集名>[<选项>];[IF<条件>[THEN<语句>];]RUN;3.拆分数据集使用SET和OUTPUT语句可以根据某一分类原则把数据行分别存放到不同的数据集,语法格式为:DATA<新数据集1><新数据集2>…;SET<数据集名>[<选项>];[WHEN(<条件1>)OUTPUT<新数据集1>;][WHEN(<条件2>)OUTPUT<新数据集2>;]…RUN;

比如,希望把数据集c200501中的所有男生的观测放到数据集c200501m中,把所有女生的观测放到c200501f中,可以使用如下程序:datac200501mc200501f;setc200501;

select(sex);when('男')outputc200501m;when('女')outputc200501f;otherwise;end;dropsex;run;4.数据集的纵向合并使用SET语句可以将几个结构相同的数据集上下连接到一起。其语法格式为:DATA<新数据集名>;SET<数据集1><数据集2>…;[IF<变量名1>=1THEN<变量名>=<值1>;][IF<变量名2>=1THEN<变量名>=<值2>;]…RUN;5.数据集的横向合并两个(或多个)数据集如果包含了同样的一些观测的不同变量,且各数据集的观测按顺序是一一对应的,就可以用如下带有MERGE语句的数据步把它们左右横向合并到一个数据集,其语法格式为:DATA<新数据集名>;MERGE<数据集列表>;[BY<变量1>[<变量2>…]];RUN;比如,数据集c200501u包含学生的姓名、性别,数据集c200501v包含学生的数学成绩,数据集c200501w包含学生的语文成绩,且各数据集的观测是按顺序一一对应的,就可以用如下带有MERGE语句的数据步把它们左右横向合并到一个数据集New:datanew;mergec200501uc200501vc200501w;run;1.2.4过程步简介1.SAS过程步的一般形式

SAS过程步的一般形式为:PROC<过程名>[DATA=<输入数据集>][<选项>];<过程语句>/<选项>;<过程语句>/<选项>;RUN;2.过程步常用语句(1)VAR语句

VAR语句在很多过程中用来指定分析变量,其格式为:VAR<变量名1><变量名2>...<变量名n>;2.过程步常用语句(2)BY语句和CLASS语句

BY语句在过程中一般用来指定一个或几个分类变量,根据这些分类变量值把观测分组,然后对每一组观测分别进行本过程指定的分析。其格式为:BY<变量名1><变量名2>...;在使用带有BY语句的过程步之前一般先用SORT过程对数据集排序。

(3)OUTPUT语句OUTPUTOUT=<输出数据集名><关键字>=<变量名><关键字>=<变量名>...;其中用OUT=给出了要生成的结果数据集的名字,用“关键字=变量名”的方式指定了输出哪些结果(关键字是如MEANS过程中的MEAN,VAR,STD那样的要输出的结果名),等号后面的变量名指定了这些结果在输出数据集中叫什么名字。(4)FORMAT语句和LABEL语句过程步中的FORMAT语句可以为变量输出规定一个输出格式,比如:procprintdata=c200501;formatmath9.1chinese9.1;run;使得列出的数学、语文成绩宽度占9位,带一位小数。

LABEL语句为变量指定一个临时标签,很多过程可以使用这样的标签。LABEL语句的格式为:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论