统计分析软件教程(第版)(概述)_第1页
统计分析软件教程(第版)(概述)_第2页
统计分析软件教程(第版)(概述)_第3页
统计分析软件教程(第版)(概述)_第4页
统计分析软件教程(第版)(概述)_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

管理统计软件应用

<SAS篇>郑州航院经贸学院贺书平

zdhsp@163.com一、课程名称:管理统计软件应用二、学时学分:40学时+20上机,学分2.5三、先修课程:统计学四、使用教材:自编五、教学参考书 1.《SASforWindows实用基础教程》洪楠、侯军,北京:清华大学出版社,2003年。2.《统计分析系统SAS》何宁、吴黎兵,武汉:武汉大学出版社,2005年8月第一版。3.《SAS统计分析》沈其君,北京:高等教育出版社,2005年8月第一版。4.《统计分析方法——SAS实例精选》曲庆云等,北京:清华大学出版社,2004年第一版。IfyouhaveaSAScertification,Youwillneverloseyourjob.”美国SAS专业认证和SPSS数据分析师认证都拥有较高国际声誉。关于sas的论坛/forum/http:///index.phphttp:///第一章42/5/2023教学目的与要求

1掌握SAS软件的基本操作

2掌握SAS软件的简单编程

3掌握基本统计分析过程

4熟练掌握SAS分析结果教学内容第一章52/5/2023一系统概述四统计图表制作六假设检验七方差分析三描述统计分析二数据管理五相关回归分析八多元统计分析第一章系统概述内容与要求熟悉SAS系统的操作环境掌握SAS系统的功能特点掌握SAS系统的相关概念第一章72/5/2023第一章82/5/2023一SAS系统产生与发展二SAS系统的基本特点三SAS系统的基本结构四SAS系统的基本概念五SAS系统基本程序语句目录一

SAS系统产生与发展

SAS系统:统计分析系统(StatisticalAnalysisSystem)1966年由美国NorthCarolina州立大学研发,1976成立美国SAS软件研究所,正式推出SAS系统,较常用的版本为SAS8.2,最新版本SAS9X系列。是目前数据处理和统计分析领域的国际标准软件,广泛应用于政府、科研、教育、生产和商业等领域。具有完备的数据访问、管理、分析、呈现及应用开发等功能。已经成功应用于120多个国家和地区的3万多个机构中。第一章92/5/2023二

SAS系统的特点

SAS系统提供了四十多个模块,各个模块之间既相互独立又相互交融补充,SAS系统的功能覆盖了信息处理和信息系统开发的各个环节,用户根据自身需要从其模块结构中灵活选择、适当组合相应的功能模块用于:数据输入、数据检索、数据管理、数据分析、图形显示、图形分析、报表生成、统计计算、工程计算、质量控制、市场研究、调查分析、建立预测模型、管理信息系统、行政信息系统等方面工作。第一章102/5/2023特点1使用灵活方便、功能齐全

SAS是为所有需要进行数据处理、数据分析的非计算机专业人员提供的一种完整可靠的专业数据分析软件。例如:回归分析使用的SAS程序:

procregdata=A;

modely=x1-x10/selection=stepwise;

ploty*x1=‘$’/*绘制回归线*/;

run;第一章112/5/20232编程能力强且简洁易学的非过程语言

SAS语言类似C语言,且综合了各种高级语言的功能和灵活的格式,SAS语言的特点是用户不需要告诉SAS“怎样作”,而只需告诉SAS“作什么”。3数据处理与分析结合在一起

SAS程序的结构由两个基本步骤任意组合而成其中:DATA步用于数据的加工;

PROC

步用于分析数据和编写报告2/5/2023第一章124适用性强、应用面广

SAS系统能提供多种界面以满足从生产第一线到管理部门各方面人员对数据信息的需求,可以访问各种数据资源,包括各种数据库文件。5扩展性能强

SAS系统的模块式结构,可以让用户灵活的按自己的需要去选择相应的功能模块,还可以利用SAS系统的功能扩充工具扩充系统功能或利用编程语言编写特殊的应用程序。第一章13三SAS系统的基本结构SAS系统由四部分构成:(1)SAS基础(BaseSAS)

完成SAS系统的数据管理功能,BaseSAS是SAS系统的基础应用平台,既可以单独使用,也可以与其它模块组成一个用户个性化的SAS系统,其它模块必须与之结合起来使用。第一章142/5/2023(2)SAS应用分析模块这部分是SAS系统的灵魂,也是SAS与其它软件的本质区别。属于这一部分的主要模块有:

SAS/ETS:用于经济预测和时间序列分析。

SAS/IML:用于进行矩阵运算,解决系统没有现成方法的工具。

SAS/INSIGHT:可视化的数据探索工具,是进行数据挖掘的有力工具。

SAS/OR:用于运筹学和线性规划。

SAS/QC:提供了根据产品观测数据进行产品质量管理的各种分析工具。

SAS/STAT:各种主要统计分析方法。2/5/2023第一章15

(3)SAS开发及呈现工具

主要由SAS/AF、SAS/EIS与SAS/GRAPH模块提供便捷的面向对象的开发工具,该工具支持客户/服务器的应用开发。2/5/2023第一章16

(4)数据仓库设计属于这一部分的主要模块有:

SAS/ACCESSSAS/SHARESAS/CONNECTSAS/WA

这些开发工具使得用户可以在SAS系统众多产品的基础上快速开发出功能强大的应用系统。2/5/2023第一章17四SAS基本概念(一)SAS常量:

指一个数值、一个括在引号中的字符串或是表示某一固定值的特殊标记。

SAS系统有5种类型的常量。包括:数值型常量字符型常量日期、时间、日期时间常量第一章182/5/20231、数值型常量:

指出现在SAS系统中的数字,其书写方式有3种。①日常书写方式;②科学计数法;③特殊标记;

特殊的数值常量,用“●”表示缺失值。第一章192/5/20232、字符型常量

SAS的字符型常量是由1—32k个字符组成的字符串。一般情况下用单引号括起。

如果在一个表示字符型常量的字符串中含有单引号或特殊字符时要用双引号括起来。

例如:“TheSASSYSTEM”SAS系统用空格表示字符型的缺失值。2/5/2023第一章203、日期、时间、日期时间常量

SAS系统中表示时间的字符串。

①将一个日期表示为一个常量:将日期加上单引号,后面加上D或(d),如’01JAN96’d。

②将一个时间表示为一个常数:将时间加上单引号,后面加上T或(t)。如’20:35:30’t

③将一个日期时间表示为一个常数:将日期时间加上单引号,后面加上DT。如2010年3月23日17点45分可以表示为:’23MAR2010:17:45’DT

第一章212/5/2023

SAS系统通过输入格式和输出格式将日期值与其他较易阅读的日期形式联系起来。例如2007年2月14日可表示为:格式①

MMDDYYw.

021407(MMDDYY6.)02/14/07(MMDDYY8.)

格式②

DDMMYYw.

140207(DDMMYY6.)14/02/07(DDMMYY8.)

格式③DATEw.

14FEB07(DATE7.DDMMMYY)14FEB2007(DATE9.DDMMMYYYY)2/5/2023第一章22例1-1:DATAMYDATA;INPUTTIME@@;INFORMATTIMEMMDDYY6.;FORMATTIMEDATE9.;CARDS;010108021408030108050806091401061090;PROCPRINT;RUN;ObsTIME101JAN2007214FEB2007301MAR2007408MAY2006514SEP2001610JUN1990第一章232/5/2023(二)SAS变量:

1、变量命名:

SAS变量由1—8个字符成,以英文字母开头,后面7个字符可以是英文字母、数字和下划线但不能有空格和特殊字符。

例:NAMEAGEDA_123

2、变量类型:

SAS变量有3种类型:

字符型变量;数值型变量;日期、时间、日期时间型变量2/5/2023第一章243、变量的长度:

指变量的每个值所占的字节数,系统默认的变量长度为:

数值型变量-8个字节字符型变量-由第一次赋值的长度决定4、特殊标记:

数据录入时在字符型变量后面加‘$’符号。5、变量标记:

是由1—40个字符组成的字符串,该字符串是对变量的描述,在输出结果时代替变量名,系统提供LABEL语句指定变量标记,默认值是空格。2/5/2023第一章25

6、输入(Informat)与输出(Format)格式

一般形式如下:

<$>informat-name<w.><d><$>format-name<w.><d>

其中:

$代表变量是字符型的

informat-name输入格式名

format-name输出格式名

w输入或输出的宽度

必须的分隔符

d小数部分的长度2/5/2023第一章26

SAS系统提供的几种常用输入输出格式:

w.d

标准的数字型格式

$w.标准的字符型格式

commaw.d

数字中加入逗号(如123,456.78)

datew.日期格式

bestw.SAS选择最佳表示法第一章272/5/2023(三)观测:

同一对象的一组变量值构成一个观测。

例:某数据集中的数据

OBSX1X2X3Y1Y2Y3112333322464443369555

本数据集有六个变量,三个观测,观测的数量决定样本的大小。2/5/2023第一章28观测编号变量名一个观测(四)表达式与操作符

①SAS表达式:

指用各种操作符把SAS常量、变量、SAS函数连接起来的算式,是SAS的一组指令,提交运行后产生运算结果。

例:Y=a+b*x;z=SIN(X)+COS(Y);

②SAS操作符

(1)算术操作符:+-*/**(乘方)

如果算术运算符连接的表达式中有一个运算对象是缺失值,其运算结果也是缺失值2/5/2023第一章29

(2)比较操作符:=(EQ)等于;^=(NE)不等于;

>(GT)大于;>=(GE)大于等于;<(LT)小于;

<=(LE)不大于如果算式中如果有一个运算对象是缺失值,它比任何数都小。

(3)逻辑操作符:&(AND)与∣(OR)或^(NOT)非

(4)其他操作符:><(MIN)<>(MAX)‖(连接)

例1:如果A=3B=5

则A><B=3A<>B=52/5/2023第一章30

例2:如果A=‘1’B=‘AND’C=‘2’

D=A‖B‖C;则D=‘1AND2’

注意:连接运算符不清理开头或结尾的空格

(5)运算次序

准则1:括号里的先算

准则2:同优先级的左边的先算

准则3:较高优先级的先算2/5/2023第一章31优先级列表:第一级:**(乘方)+(正号)-(负号)^(非)><(MIN)<>(MAX)第二级:*(乘)/(除)第三级:+(加)-(减)第四级:‖(连接)第五级:比较操作符第六级:&(与)第七级:∣(或)2/5/2023第一章32(五)SAS函数

SAS函数是一个子函数,每个SAS函数都有一个关键词,在应用中只要调用其关键词即可。

SAS函数分为十七种类型,178个。

包括:算术函数、数组函数、数学函数、三角和双曲函数、概率函数、分位数函数、非中心函数样本统计函数、随机数函数、财政金融函数、数字函数逐位逻辑、操作函数、字符函数、日期和时间函数、特殊函数、(美国)州和ZIP换算函数。2/5/2023第一章33

SAS函数的表达方式:

(1)函数关键词(OF变量1-变量n)

例:SUM(OFXYZ);

(2)函数关键词(变量1,…,变量n)

例:SUM(X,Y,Z);2/5/2023第一章34例1-2DATADA1;INPUTXYZ@@;A=(X+Y+Z)/3;B=SUM(X,Y,Z)/3;C=MEAN(X,Y,Z);CARDS;12345.789;PROCPRINT;RUN;TheSASSystem

ObsXYZABC1123222.0245..34.53789888.0第一章352/5/2023五SAS系统基本程序语句(一)SAS程序

SAS程序用来管理数据、选择确定统计分析方法和过程,由SAS语句组成。

SAS语句

SAS语句是由SAS关键词,SAS名字,特殊字符和运算符组成的字符串,以分号(;)结尾,要求SAS系统执行一种操作或给SAS系统提供信息。第一章362/5/2023②SAS程序

由一序列SAS语句组合成为SAS程序,完成指定的数据处理过程。

SAS程序的结构包括:DATA步和PROC步

DATA步(数据步):要求创建新的SAS数据集,或对已有的数据集进行运算操作。

PROC步(过程步):要求系统从过程库中调出一个过程并执行,以数据集作为工作对象。2/5/2023第一章37(二)数据步(DATA步)

①DATA步:是指用DATA语句开始的一组SAS语句。2/5/2023第一章38

以上语句组成DATA步,提交后系统创建一个名为da1的SAS数据集,包含4个变量,3个观测。例1-3例1-3datada1;inputx1x2x3;y=x1+x2+x3;cards;21.30.552.40.982.64.5;run;第一章392/5/2023DATA步的作用检索:把输入数据转化为SAS数据集。编辑:检查数据中的错误并修改,计算新变量。数据输出:按照设计规格输出报告。数据管理:对已存在的SAS数据集进行复制、合并、更新、转置、创建子集。2/5/2023第一章40DATA步语句及其类型:

用于DATA步的SAS语句有四类56个。①文件操作语句:进行文件操作,用于输入输

出数据集。②运行语句:在创建SAS数据集时,用以创建

和修改变量,或创建子集。③控制语句:实现程序之间控制功能。④信息语句:给出数据集的各种信息,是非执

行语句,可以出现在DATA步的任何位置,并具有同样的功能。第一章412/5/2023

DATA步的一般形式:

DATASAS数据集名;

inputSAS变量名列表;

cards;

输入数据

RUN;2/5/2023第一章42(三)PROC步(过程步)

PROC步是用PROC语句开始的一组或几组SAS语句完成一个SAS过程,以另一个“PROC”、“DATA”或“

RUN”语句结束。

1.PROC语句的一般形式语句格式:PROC过程名<选择项>;语句功能:指定PROC步调用的SAS程序,选择项指明分析的数据集,分析结果的输出要求,以及分析过程中需要用到的一些参数。2/5/2023第一章432.PROC步的常用选择项:

(1)“DATA=”指定该过程分析处理的SAS数据集,也称为输入数据集。

例:PROCMEANSDATA=DA1;RUN;(2)“OUT=”命名一个输出数据集,存放分析处理的结果数据。例:PROC

SORT

DATA=DA1OUT=DA2;RUN;2/5/2023第一章443.

通用PROC语句

(1)VAR语句

语句格式:VAR变量表;

语句功能:定义分析变量。例:VARABC;

VARX1-X5;

(2)BY语句

语句格式:

BY变量表;

语句功能:定义分组变量,以指定变量的取值分组处理分析数据。2/5/2023第一章45

(3)CLASS语句

语句格式:CLASS分类变量表;

语句功能:定义分类变量,对分类变量的不同值分别进行处理。两者区别:

BY语句:分组变量一般是区间变量

CLASS语句:分类变量可以是名义变量2/5/2023第一章46

(4)FREQ与WEIGHT语句

FREQ语句(权数语句):

语句格式:FREQ变量名;

语句功能:指定数据集中重复数变量,每一观测中此变量的值说明这个观测实际代表多少个完全

相同的重复观测。

WEIGHT语句(权重语句)

语句格式:WEIGHT变量名;

语句功能:指定数据集中代表观测权重的变量。2/5/2023第一章47

“FREQ”与“WEIGHT”的区别:

WEIGHT语句代表观测的比重,FREQ语句代表观测的次数。

(5)LABEL语句

语句格式:LABEL变量名=‘变量标记’;

语句功能:在输出结果中用变量标记代替变量名。第一章482/5/2023例1-2例1-4datada1;

inputAgeWeightHeightSex$@@;cards;1126140f1230145f1351153m1334152m;procprintlabel

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论