It计算机课件 SAS统计分析基础_第1页
It计算机课件 SAS统计分析基础_第2页
It计算机课件 SAS统计分析基础_第3页
It计算机课件 SAS统计分析基础_第4页
It计算机课件 SAS统计分析基础_第5页
已阅读5页,还剩168页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计分析软件包

一SAS统计分析基础

学习目标

A1、了解SAS系统的功能特点;

>2、熟悉SAS系统的操作环境;

>3、掌握SAS系统的有关概念;

»4、学会使用DADAStep(数据步)建立数据集,能对现有

数据集进行读入、修改、拼接及合并;

>5、学会使用PROCStep(过程步)的几个重要过程对数据

集进行常规的统计分析和显示;

>6、学会自己查看系统帮助;

>7、能够利用SAS系统处理常见的临床研究数据。

2

基本内容

>1、SAS概述;

>2、SAS显示管理系统;

>3、SAS编程基础:

ASAS语句;SAS表达式;SAS常量;

ASAS变量;SAS算符;SAS函数;

>4、DADAStep(数据步);

>5、PROCStep(过程步);

>6、常用统计分析模块。

3

第一章SAS系统简介'

>1、SAS的含义

tatisticalAnalysisystem

>2、SAS系统

>数据处理和统计分析领域的国际标准软件

>世界领先的数据分析和信息系统

>3、SAS软件的发展

>SAS系统于1966年由美国NorthCarolina州立大学开始研制,

1976年成立美国SAS软件研究所公司。1998年已推出适用于

多种操作系统的版本SAS6.12,现在最新版本是SAS9.1。

>目前,世界上有120多个国家和地区的31000多个机构在使用

SAS系统,直接用户超过3500000。SAS系统在世界范围内

被广泛地应用于政府、科研、教育、生产和商业等不同领域,

发挥着积极的作用。

4

4、SAS系统的特点

>SAS系统是用于数据分析与决策支持的大型集成式模块化软件包,

是一种组合软件系统。核心部分是BaseSAS软件,其它可选模块

有:SAS/STAT软件、SAS/GRAPH软件、SAS/IML软件、

SAS/OR软件、SAS/ETS软件等30多个。

>1、操作简便SAS的宗旨是为所有需要进行数据处理、数据分析

的非计算机专业人员提供一种易学易用、完整可靠的软件系统。

用户把要解决的问题用SAS语言(近乎自然英语的非过程语言)表达

出来,组成SAS程序,提交给SAS系统就可以解决所提出的问题。

>2、SAS系统将数据管理与统计分析溶为一体SAS程序的结构由两

个基本步骤任意组合而成。DATA步用于对数据的加工处理;

PROC步用于分析数据和编写报告。SAS系统克服了通常软件或偏

重于数据管理功能或偏重于统计分析的弊病,把数据管理与统计

分析有机地结合在一起。

>3、适用性强、应用面广SAS系统适用于任何经验的人员(初学

者或有经验的用户);适用于任何类型的数据;适用于几乎是任何

应用的需要;适用于任何计算机环境;扩展性能强。

5

5、SAS软件的启动:

>用如下方法可以进入SAS系统的窗口运行环境:

»菜单方式:

A依次点击“开始”——>“程序”----->wTheSAS

System^^----->“TheSASSystemforWindowsv6.12"即

可。

»快捷方式:Sas.exe

A在Windows桌面系统下双击SAS图标

6

6、SAS工作界面

菜单条

快捷

<工具栏

命令框

水平

<-垂宾

潦动条

消息栏当前文件夹名

7

7、SAS显示管理系统

>SAS显示管理窗口可分为两大类:

基本窗口和其它窗口。

>基本窗口(三个):

>PROGRAMEDITOR窗口(程序编辑窗,缩写为PGM);

>LOG窗口(登录窗或日志窗);

AOUTPUT窗口(输出窗);

>PGM窗口:

输入和编辑文本,包括SAS语句;提交SAS语句;拷贝一个外部

文件到PGM窗口,或拷贝窗口内容到外部文件上;

>LOG窗口

LOG窗口包含SAS日志,它是当前SAS会话的记录。一个典型的

记录显示:在当前会话中发布的SAS语句;注释、警告和出错

(红色一错误兰色一正常绿色一警告)

>OUTPUT窗口:

这个窗口也称为LISTING窗口,它包含由大多数SAS过程产生的

输出。在SAS会话期间相继产生的输出都附加到OUTPUT窗口内

容中。

>其它窗口:

除了三个基本窗口以外,显示管理包含很多其它窗口。各个窗

口均可在任何一个窗口的命令行键入相应的命令来打开。下面按

字母顺序列出包括三个基本窗口在内的主要显示管理窗口,并给

出简单描述。

9

Command===>

14:36Sunday,February1,2004Command===>

00001

TheSASSystem00002

00003datag.xx4;

0bsgrpcolf00004inputgrpcolf;

00005cards;

\\300006113

22800007128

3135nnnnniaG

1A

00009148窗

OUTPUT®°00010156PGM

g00011213

~22~:00012228

23

p00013234

24

700014248

1025

00015257

00016;;

00017procfrt>q;

00018tablegr*p*col/chisq

17procprin;run;_.00019weighti>・

ERROR:ProcedurePR1Nnotfound..

00020run;

VOTE:TheSASSystemstoppedprocess00021

VOTE:PROCEDUREPRINused:

rea1time0.04seconds

VOTE:SCLsourceline.

18procprintdats=a;run;

Jf^RNING1-322:flsymbolDATAwasmisspelledasdats.

VOTE:WritingHT「H_otiuy.iib:sashtml.htm

VOTE:Therewere1observationsreadfromthedatasetWORK.A.

MOTE:PROCEDUREPRINTused:

rea1time0.10seconds

10

常用显示管理窗口及调用命令

窗口描述如何调用

PROGRAMEDITOR允许插入、编辑和提交SAS语句及存贮源PGM|F5

(程序编辑窗)文件

LOG对当前SAS会话显示信息和SAS语句LOG|F6

(日志窗)

OUTPUT显示过程输出OUTPUT|F7

(输出窗)

VAR显示有关SAS数据集中变量及它们属性的VAR

信息

8、显示管理命令

>SAS显示管理系统包括众多的命令让用户完成各种任务。根据发

布命令的位置可将其分为命令行命令和行命令。显示管理命令按

为惯是从命令行comman&===>^入箱应的命令发布的,因此称这

些命令为命令行命令;而一些文本编辑命令按习惯是从显示的行

号上发布的,因止匕这些命令称为行命令(Windows环境下较少应

用)。

>几个重要的命令行命令:

1)窗口切换命令:

PGM|F5:切换到PGM窗口

LOG|F6:切换到LOG窗口

OUTPUT|F7:切换到OUTPUT窗口

2)编辑命令:

CLEAR|Ctr+E:清除当前工作窗口的所有信息

RECALL|F4:将运行过的程序调回到PGM窗口

SUBMIT|F8:将PGM窗中的所有程序提交运行

HOME:将光标移到命令行

12

9、文件的保存与打开

>保存文件:

方法1(命令法):

FILE命令:将当前工作窗口的内容写到外部文件中。

例如:FILEtD:\Myfile.SAS,回车后将信息写到D盘根目录下

一个名为Myflle.SAS的文件上。

方法2(菜单法):

“File一"SaveA§”,输入文件名“Myflle”点“保存”即可。

>打开文件:

方法1(命令法):INCLUDE|INC:将指定的外部文件调入

PGM窗。

例如:INCR:\Myflle.SAS,回车后将D盘根目录下一个名为

Myflle.SAS的外部文件调入PGM窗。

注1:该命令只能在PGM窗使用;如果PGM窗已有文本,则该命

令将指定的外部文件调入窗口文本的后面。

方法2(菜单法):“File”9“Open…”,找到相应的文件,点“打开”

即可。

13

上机练习题

1、SAS常用的窗口有哪三个?请在三个基本窗口之间切换并记住这些

命令。

2、请在PGM窗口中输入如下几行程序,提交系统执行,并查看

OUTPUT窗和LOG窗中内容,注意不同颜色的含义;并根据日志窗

中的信息修改完善程序。

datsexl;

inputtname$agesex;

cards;

xiaomin191

lidong201

nana182

prod,prontdats=exl;

run;

procprintdats=exl;

Varnameagesex;

run;

14

上机练习题(Cont.)

3、在D:盘根目录下建立一个文件夹,取名为:

SASEX2004o将上题(题2)修改好的程序、输出结

果及日志窗中的内容保存在前面建立的文件夹中。

15

第一章结束

SASwebsite:WWW.SAS.COM

16

第二章SAS编程语言基础

同其它计算机语言一样,SAS语言也有它自己的语

法:关键词和连结关键词与其它辅助信息的规则。用户

使用SAS语言来定义数据和规定对数据怎样做统计分析

的问题。由SAS语句组成的序列称为SAS程序。

A§1、SAS语句

一.SAS语句的含义

我们先来看一个实例:

17

例1:我校2001级某班16名学生4门功课成绩表如下,

试计算这16名学生英语、生理的平均得分。

学号高数英语生理思品

20010873687165良好

20010874746168良好

20010875737546良好

20010876798079优秀

20010877757168良好

20010884S5S587优秀

20010885787975优秀

20010886807679优秀

20010887858082良好

20010888777175良好

20010889677371优秀

20010890758170良好

20011118705475及格

20010893706684及格

20010894627365及格

20010909827079优秀

18

DATAscore;PROCPRINTData=score;

INPUTnoxlx2x3x4$;VARnoxlx2x3x4;

CARDS;RUN;

20010873687165良好

20010874746168良好

20010875737546良好PROCMEANSData=score;

20010876798079优秀VARx2x3;

20010877757168良好

20010884858587优秀RUN;

20010885787975优秀

20010886807679优秀

20010887858082良好dataexl;

20010888777175良好inputname$agesex;

20010889677371优秀cards;

20010890758170良好

xiaomin191

20011118705475及格

lidong201

20010893706684及格

20010894627365及格nana182

20010909827079优秀r

procprintdata=exl;

run;

RUN;procprintdata=exl;

Varnameagesex;

run;第一章练习题

19

TheMEANSProcedure

VariableNMeanStdDevMinimumMaximum

x21672.87500007.872949554.000000085.0000000

x31673.00000009.791152546.000000087.0000000

在这个例子中,我们看到:

DATA,INPUT,CARDS,PROC,VAR,RUN是关键词;

score是数据集名;

no,xl,x2,x3,x4是变量名;

MEANS是过程名;

Data=是MEANS语句中的选项。

现在,我们给出SAS语句的定义:

SAS语句是由关键词、SAS名、特殊字符或运算符组成并以分号结尾

的字符串。

20

二.几个概念'■

LSAS关键词

位于句首的用以说明语句类型和功能的单词称为SAS语句的美

键词。它是SAS语句的主要成份。如:PROC、DATA、VAR、RUN

等。

2.SAS名

SAS语句中出现的SAS名有很多种类,如变量名、SAS数据集名

等。

>SAS命名规则:

1)由1至8个字符组成;

2)由三种字符构成:

英文字母A-Z,a-z,下划线」数字0-9;

3)每个名字的第一个字符不能为数字;

4)SAS系统保留了一些名字作为特殊的变量名,这些变量名的开头

和结尾都用特殊字符下划线表示(如_N_、_ERROR_等)。

21

3.特殊字符和运算符

特殊字符包括:

圆括号()、单引号''、双引号”“、美圆符号$、列指针

控制符@、行指针控制符#、冒号:、句号.、分号;等;

运算符包括:

加号+、减号-、乘号*、除号/、乘方**等,等号=、不等号

八=、小于号<、大于号>、小于等于号<=、大于等于号>=等。

三.语句格式

SAS语句的基本格式是:

KEYWORDParmeter...[item|item|item]options;

关键词参数选项1选项2选项3选择值

>关键词:用以说明语句类型和功能的单词;

>参数:要求用户提供的信息。不用括号,不是任选项。

22

例如:INPUTxyz;

其中:INPUT是关键词,它说明要把数据提供给哪些

变量。后面跟的变量名x、y、z都是参数,即要求用户

提供的信息。

>…表示参数可以不止一个。

>[选项1]选项2|选项3]中的竖线用来分隔各选择项,

表示其中任选一个;方括号内的信息是可以选择的。

例如:PROCMEANSdata=storemaxdec=3;

其中:PROC是语句的关键词,它说明本语句是过程

语句;MEANS是过程名,它说明要调用的过程名称;

data=>maxdec=都是选项的关键词,等号后面是用户

提供的选择信息。

23

A§2、SAS程序

一系列SAS语句组成一段SAS程序。SAS程序中的

语句可分为两类步骤:DATA步和PROC步。这两类步

骤是所有SAS程序的模块。通常用DATA步产生SAS数

据集而用PROC步对SAS数据集内的数据进行分析处理

并输出结果。一段SAS程序可由一个DATA步或一个

PROC步组成;或者由DATA步和PROC步两部分组成;

也可由多个DATA步和多PROC步组成。

24

1.DATA步(数据步)〜

DATA步包括:创建一个或几个新的SAS数据集的语句和创建数据

集所必须的运算操作语句。每个DATA步以DATA语句开头,可以包含

任意多个SAS程序语句。

一个DATA步的基本语句有:

DATA语句:表示创建SAS数据集;

INPUT语句:对SAS数据集中的变量进行描述;

CARDS语句:用来指示数据行的开始;

;语句:表示数据行的结束。

请看如下的例子:

25

DATA关键词告诉系

统,要创建一个SAS数、"DATAscore;

据集,命名为score

INPUTnoxlx2x3x4$;

/CARDS.-------一CARDS关键词告诉系统,其后

INPUT关键词告诉系J紧随着的便是数据。

统,数据在程序流中,

并且指明数据所对应

的变量名及类型。$符20010873687165良好

号说明它前面的一个20010874746168良好

变量为字符型。

20010875737546良好

20010876798079优秀

20010877757168良好

20010884858587优秀\

20010885787975优秀\

优秀,

20010886807679\___

20010887858082良好数据行,数据源中不能有分号(;)。

20010888777175良好

20010889677371优秀

20010890758170良好

20011118705475及格

;表示数据行\20010893706684及格

\20010894

的结束627365及格

\20010909

827079优秀

RUN;

26

2.PROC步(过程步)

>PROC步要求SAS系统从过程库中调出一个过程模块并执行它。

>PROC步以PROC语句开始,其后紧跟一个过程名(英文关键字);

一个过程步可以包含多个相应的SAS语句。

例如:

PROCMEANSData=score;

VARx2x3;

PROCPRINTData=score;

VARxlx3x4;

注意:一个完整的SAS程序必须以RUN语句结尾方能提交运行。

27

A§3、编写SAS程序

DATAscore;

INPUTnoxlx2x3x4iPROCPRINTData=score;

CARDS;iVARnoxlx2x3x4;

iRUN;

20010873687165良好I

20010874746168良好I

I

20010875737546良好

20010876798079优秀!PROCMEANSData二score;

20010877757168良好!VARxlx2x3;

20010884858587优秀

20010885787975优秀!RUN;

20010886807679优秀I

20010887858082良好I

20010888777175良好

20010889677371优秀

20010890758170良好<以上一个DATA步和

20011118705475及格

20010893706684及格Q两个PROC步就构成了

20010894627365及格

20010909827079优秀一个SAS程序。

RUN;

28

上面SAS程序的输出结果如下:

TheSASSystem09:22Monday,August200410

Obsnoxlx2x3x4

120010873687165良好

220010874746168良好

320010875737546良好

420010876798079优秀

520010877757168良好

620010884858587优秀

720010885787975优秀

820010886807679优秀

920010887858082良好

1020010888777175良好

1120010889677371优秀

1220010890758170良好

1320011118705475及格

1420010893706684及格

1520010894627365及格

1620010909827079优秀

TheMEANSProcedure

VariableNMeanStdDevMinimumMaximum

——

x21672.87500007.872949554.000000085.0000000

x31673.00000009.791152546.000000087.0000000

29

1.SAS程序的书写方法

(1)书写格式

•SAS语句可以从一行上的任意位置开始;

•几个SAS语句可以写在同一行上;

•一个语句也可以写成几行,只要语句中的单词不被断开即可;

•在一个语句中各项之间至少要有一个空格;

•一些特殊符号(如等号=,加号+)可以占据空格的位置,如:

total=a+10;与total=a+10;

是等价的;

•SAS语句用大写字母、小写字母或大、小写混合书写均可。

⑵注释

SAS语句中有一个注释语句,形式为:

/*注释内容*/

凡是空格可以出现的地方,以上形式的注释语句也能出现。例如:

PROCSORT/*对数据集排序*/;

就是一个合法的语句。

30

⑶变量的缩写

变量在数据集中的实际位置按它们第一次出现的

次序被定义。

例如:前面的例子的INPUT语句中,no被定义为第一

个变量,接着是xl,x2,x3,x4。在一些SAS语句中,需要

对变量进行集中处理,SAS采用如下的方式来解决这

个问题:

>形如xl,x2.x3…xn的带序号的变量名,缩写为xl-xn;

>形如xlab.x2.x3.d的不带序号的变量名,缩写为xl--d;

>特殊的SAS变量,_numeric_表示所有数值变量;

_character_表示所有字符变量;

_all_表示所有变量。

31

2.SAS程序的的执行与输出'

>程序的执行

当我们在PGM窗口将程序输入完毕,检查修改后就

可以提交给SAS系统执行。在LOG窗口显示程序执行中

记录的信息,它包括:执行哪些语句;生成的数据集

中变量个数及观测个数是多少;程序执行所消耗的时

间及出错信息等。

>SAS过程的输出

前例提交执行以后,DATA步产生一个名为score的

SAS数据集;后面的两个PROC步产生的结果输出到

OUTPUT窗口(如前例的输出)。

33

>§4SAS表达式

前面简单介绍了SAS语句和SAS程序的构成。要灵活的完成

日常的数据管理和统计分析工作,还得很好掌握SAS表达式。

SAS表达式是由一系列算符和运算对象形成的一个指令集,

它被执行后产生一个目标值。运算对象是SAS变量和SAS常数;

算符是特殊的运算符、函数和括号。

表达式分为简单表达式和复合表达式。下列式子都是表达式。

X+13LOG(X)LOGIO(X)P/A*100AGE<100

1-EXP(N/(N-1))A=B=CSTATE-CA'

在DATA步中,为了对变量进行变换,建立新变量、条件处

理、计算新值及指定新值,都需要使用SAS表达式。

一.SAS常数

SAS常数用来表示固定的值,它或者是一个数字,或者是用

引号引起来的字符串、或者是其它特殊记号。

34

SAS使用的常数有五种类型:数值常量、字符常量、

日期、时间和日期时间常量、十六进制数值常量、十

六进制字符常量。我们主要介绍数值常量和字符常量。

1.数值常量:

一个数值常量就是出现在SAS语句里的数字。很多

数值常量完全像通常的数据值一样书写。数值常量可

以包括小数点,负号和E记号。

例如:1-51.231.2E230.10.5E-10。

用E表示法时,如2E4,它表示2x10%或者20000。

SAS系统中,缺失值用小数点来(.)表示。

35

2.字符常量:

字符常量是由(单)引号括起来的1〜200个字符组成的

字符串.

例如,在下面的语句中:

IFname='TOM'THENDO;

'TOM,就是一个字符常量。

如果字符常量含有引号,则用两个连续的单引号

来处理。例如,字符值为TOM'S时,输入:

name='TOM''S'

缺失的字符常量值为空字符,表示为‘'(两个连续

的单引号)。

36

二SAS变量:

描述给定特征的数值集合的指标称为变量。

SAS变量的特征:

变量名、类型、存储长度、标签、输入格式、输出格式

#VariableTypeLenPosFormatInfonnatLabel

1nameChai、8245NameofStudent

2ageNum804.1Age

3sexNum88SEXFMT.Sex

4expendNum816C0MMA8.D0LLAR10.Expenditurein2003

存储长度指变量在存储时所需要的字节数。默认情况下所有的变量都定

义为8字节。字符变量的长度可为1-200字节,数值变量的长度可为3-8字

节。

标签是对变量的补充说明,可以为任意字符,长度可多达257个字符。

37

Variables

nox1age1x2x3x4x5

>

11151'44-i-1

2i240342i

33518311

44第:8311

552835181

6617053~r-2

ObservationsT------96-110I422

住8266-LR.121

Value"g~2

99—180._2

10101一番〕.5J381

1111w708231

SAS数据集(部分)

38

输入输出格式'

丁「____濠:一

Informatformat|蔡式化的一|

1原始数据值.•SAS

输出格式)"变量值

输入格式)变量的值ISAS

InformatiFormat

_____________dollarlO.__________Jcomma8j厂

$548,231\-------------,548231;---------.548,231

jInformatjFormat

Date9i-;MMDDYY10.

25JAN2004---------»16095」------------►01/25/2004

39

日期和时间数据的存储

SAS采用数值存储日期和时间形式的数据。

在默认情况下,SAS系统以0代表1960年1月1日0时。

其它日期在SAS系统中被存储为与该日期相差的天数。

例如,1960年1月3日,在系统中存为2。

2004年1月25日,在系统中存为16095。

注意:为了使数值型变量显示日期形式,必须使用日期型

的输出格式,同样地为了以日期形式输入日期必须使用

日期型的输入格式。

40

SAS变量分为两类,数值变量(Num)与字符变量(Char)。

>数值型变量只能取数值为值。可以有正负号及小数点

(+、—、•),但不能看逗号(,)o

数值型是SAS的默认变量类型,默认长度为8位。

>字符型变量可以取字符、字母、特殊字符以及数字为

值。

在DATA步中某些SAS语句所使用的变量名后跟一个

美元符号($),即表明该变量是字符型变量,如、

name$或name$。如果变量后不加$符号,SAS将该变

量认为数值型。因此,对字符型变量应加$符号予以说

明。

在SAS中一个字符变量的取值可以有1—200个字符

长,默认长度为8个字符长。

41

三SAS算符

SAS算符是一些符号,它们要求作比较、算术运

算或逻辑运算。

SAS使用两种主要类型的算符:

前缀算符和中缀算符

♦前缀算符用于变量、常数、函数或者用括号括起来的表达式。

例如:+Y-25-COS(A)-(xl+x2-100)

前缀算符有:加号,减号,NOT和符号屋

♦中缀算符作用在算符两边的运算对象上,例如6<8o

中缀算符一般分为四类:算术算符、比较算符、逻辑算符和

其它算符(最大、最小和连接)。

42

1.算术算符:

算术算符表示执行一种算术运算,包括:

**乘方*相乘/相除+相加-相减

如果算术算符有一个运算对象是缺失值,运算结果也是缺失值。

例如,y=x3+.;贝Uy的值为缺失值(.)

2.比较算符:

比较算符确定两个量之间的一种关系,如果这种关系成立,则

输出结果为1(真);如果它不成立,则输出结果为0(假)。比较算符包

括:

=(EQ)等于A=(NE)不等于

>(GT)大于<(LT)小于

>=(GE)大于等于v=(LE)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论