




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SAS软件实用教程
一、为什么学习SAS?二、学习哪些内容?三、使用教材四、学习要求及考核方法一、为什么学习SASSAS(StatisticalAnalysisSystem)是管理和分析数据、编写报告、商业智能的大型集成应用软件系统,具有完备的数据访问、管理和分析、呈现、应用开发及决策支持等功能。在数据处理和统计分析领域,SAS系统被誉为国际上的标准软件系统,尤其是在医学统计、生物统计,更认可SAS运行结果。在此仅举一例如下:在以苛刻严格著称于世的美国FDA新药审批程序中,新药试验结果的统计分析规定只能用SAS进行,其他软件的计算结果一律无效!哪怕只是简单的均数和标准差也不行!由此可见SAS的权威地位。萝卜白菜各有所爱,每个人擅长使用和偏好不同。SAS系统的长处,体现于它的编程操作功能的无比强大。二、学习哪些内容软件简介SAS软件概述数据集的建立2.统计分析与应用描述统计统计分析三、使用教材SAS软件实用教程(第2版)张瑛雷毅雄科学出版社;参考资料:(1)SAS统计分析,沈其君,高等教育出版社,以统计方法为主线介绍SAS程序的编写,并将统计方法与SAS软件有机结合;每章在简要介绍各种统计方法的基础上重点叙述SAS程序各个过程及选项的应用和结果解释。(2)SAS系统.SAS/STAT软件使用手册,高惠璇,中国统计出版社。SAS/STAT软件是SAS系统的核心和精华.它用于数据的分析处理。本书全面介绍SAS/STAT软件产品提供的八大类统计方法共44个过程。且每个过程都给出一些例子,介绍如何使用这个过程。内容极为丰富。(3)英文文献四、学习要求软件学习:教程、练习;课堂要求:出勤:旷课1-3次:扣2、5、10分;因事请假1-4次:扣2、3、5、10分;作业:不交作业每次扣3分。第一章SAS软件概述一、SAS简介二、SAS窗口工作环境三、SAS语言的语句和程序一、SAS简介SAS系统数据处理和统计分析领域的国际标准软件世界领先的数据分析和信息系统SAS软件的发展SAS系统于1966年由美国NorthCarolina州立大学开始研制,1976年成立美国SAS软件研究所公司。1998年已推出适用于多种操作系统的版本SAS6.12,现在最新版本是SAS9.4。目前,世界上有120多个国家和地区的50000多家在使用SAS系统,直接用户超过3500000。SAS系统在世界范围内被广泛地应用于政府、科研、教育、生产和商业等不同领域,发挥着积极的作用。一、SAS简介SAS系统的组成部分SAS系统是一个组合软件系统,它由多个功能模块组合而成,其基本部分是BASESAS模块。BASESAS模块是SAS系统的核心SAS在BASESAS的基础上,还可以增加如下不同的模块而增加不同的功能:SAS/STAT(统计分析模块)、SAS/GRAPH(绘图模块)、SAS/ETS(经济计量学和时间序列分析模块)、SAS/OR(运筹学模块)、SAS/IML(交互式矩阵程序设计语言模块)等等。此外,SAS还提供了各类概率分析函数、分位数函数、样本统计函数和随机数生成函数,使用户能方便地实现特殊统计要求。SAS系统特点1、操作简便SAS的宗旨是为所有需要进行数据处理、数据分析的非计算机专业人员提供一种易学易用、完整可靠的软件系统。用户把要解决的问题用SAS语言(近乎自然英语的非过程语言)表达出来,组成SAS程序,提交给SAS系统就可以解决所提出的问题。2、SAS系统将数据管理与统计分析溶为一体SAS程序的结构由两个基本步骤任意组合而成。DATA步用于对数据的加工处理;PROC步用于分析数据和编写报告。SAS系统克服了通常软件或偏重于数据管理功能或偏重于统计分析的弊病,把数据管理与统计分析有机地结合在一起。3、适用性强、应用面广SAS系统适用于任何经验的人员(初学者或有经验的用户);适用于任何类型的数据;适用于几乎是任何应用的需要;适用于任何计算机环境;扩展性能强。二、SAS的窗口环境启动:(QQ、SPSS等软件的启动方法)窗口环境:datasas1_1;inputidname$heightweight;bmi=weight/height**2;/*把weight除以height平方的值赋给bmi*/cards;/*数据流开始*/1judy1.56452lucy1.6753;/*数据流结束*/Procprintdata=sas1_1;Run;三、SAS语言的语句和程序三、SAS语言的语句和程序datascore;inputname$1-10sex$mathchinese;avg=math*0.5+chinese*0.5;cards;李明男9278张红艺女8962王思明男9690张聪男9879刘颍女8068;run;procprint;run;procsortdata=score;bydescendingavg;run;procprint;run;
SAS语句特点SAS程序由语句组成,语句用分号结束。语句一般由特定的关键词开始,语句中可包含变量名、运算符等,它们以空格分隔。SAS对语句所占的行数无限制,一个语句可占多行,同样,多个语句也可占一行。SAS程序的程序组成SAS程序可以非常复杂,但其基本结构一般由数个完成单个动作的程序步和环境设置语句构成。而程序步分为两种,一种叫数据步(datastep),一种叫过程步(procstep),分别以DATA语句和PROC语句开始。数据步和过程步由若干个语句组成,一般以RUN语句结束。前者用来创建和修改用于统计分析的数据集,后者则利用已创建的数据集完成特定的统计分析任务。比如下面的例子:
SAS程序的书写规则与程序注释前面已经提到,SAS对程序的书写格式比较灵活,大小写一般不区分(字符串中要区分大小写),但我们仍提倡SAS程序与其它编程语言相似,采用缩进格式,使得源程序结构清楚,容易读懂。SAS程序的程序注释有以下两种格式:注释语句:以星号“*”开始,可占多行,以分号“;”结束。注释段落:用“/*”和“*/”包括起来的任何字符,可占多行。同样,我们提倡在程序中要有适当的注释,使程序的可读性强。SAS关键字datainputcardsprocrun等DATA语句格式:DATA[数据集名];功能:标志数据步的开始,并指明所建立的SAS数据集的名称。INPUT语句格式:INPUT[变量说明]….;功能:描述输入记录中数据,并把输入值赋给相应的变量。INPUT语句主要用于读CARDS语句后的数据或者一个外部数据文件中的数据。[变量说明]主要格式:(1)列表或自由格式INPUT变量[$]变量….;变量简单的列在INPUT语句中,各变量间用一空格分开,使用这种格式,用户不用了解在输入记录中数据所占的列数。(3)行保持符@@通常执行一次INPUT语句后,再次执行INPUT语句,SAS系统要从下一数据行去读取数据,行保持符@@可改变其读取方法。INPUT变量@@;@@用来从一行读入多个观察值,INPUT语句读完一个观察值后,标记@@把控制指针仍保持在当前行,继续用INPUT语句中的变量读取本行的剩余数据,直到全部数据读完。*CARDS语句格式:CARDS;功能:表明数据行的开始与数据步的结束。*RUN语句格式:RUN;功能:执行刚发送的SAS语句。例datatemp;inputxy@@;cards;3456789035678910236577;Run;procprintdata=temp;run;变量y后面的@@表示数据可以在一行里连续读入,SAS默认按列来分隔变量,可是这里只有两个变量,输成两列数据太长,因此加上两个@@,SAS见到这个符号,在按变量名依次读取完数据后,不是跳到下一行,而是继续在该行读数据,直至本行结束或到达分号为止。
数据步以DATA语句开始,在遇到run语句或另一个数据步/过程步时就结束了。每一个程序应至少在最后有一个run语句,表明前面的所有语句可以提交运行了。Submit命令和run语句有什么区别?run是程序语句,可在程序中多次出现,它表示前面的程序段已经全部写完,可以作为一个或几个整体提交运行了,而Submit则是SAS命令,只在最后程序运行的时候发出,表示将程序正式提交运行。SAS数据集名和SAS变量名SAS名由1-8个字符组成,且必须以字母或下划线开头,后续字符可以是字母、数字或下划线。系统不区分大小写,但是字符串变量区分大小写(参考例1.1字符串变量name的具体观测值Judy,Lucy)空格和特殊符号不允许在SAS名称中使用。SAS运算符算术运算符比较运算符逻辑运算符其他SAS函数密度函数分位数函数其他SAS程序练习:第二章建立SAS数据集一、SAS数据概述SAS数据集基本格式临时和永久SAS数据集二、SAS数据集的简历数据步创建Import导入三、SAS数据集的修改合并建立子集变量标签和输出格式SAS数据基本格式数据集的扩展名*.sas7bdat变量:字符串型变量数值型变量缺失数据数据集分为两类:临时数据集;永久数据集临时数据集:仅在当前会话期间有效,一旦退出SAS系统,临时数据集就被删除。永久数据集:是指存储在外部存储介质上的数据集。数据集的性质以数据集的名称来标识。所有的SAS数据集名都是由“.”分隔的两部分组成,第一部分称为一级名(或称库逻辑名),它指明该数据集所存储的位置,第二部分(二级名)标识特定的数据集。SAS系统将本次建立的临时数据集全部暂存入SASWORK目录下,系统指定WORK.作为临时数据集的第一级名,通常可省略,而永久数据集需要指出其存储的地方,不能省略第一级名,所以永久数据集必须由两级名来标识。1)临时数据集的建立程序基本结构:DATA语句;INPUT语句;[用于数据步的其它语句];CARDS;若干数据行RUN;2)永久数据集的建立程序的基本结构LIBNAME库逻辑名"路径";DATA语句;INPUT语句;[用于数据步的其它语句];CARDS;若干数据行RUN;*LIBNAME语句格式:LIBNAME库逻辑名"路径";功能:以库逻辑名代替其后所指的路径。SAS数据库对应文件夹,如SASUSER对应c:\sas\sasuser,WORK对应c:\sas\saswork。每一个数据集都有一个两级名,第一级是库标记,第二级是数据集名,中间用“.”隔开,在程序中通过指定两级名来识别文件。文件两级名的一般形式如下:库标记.数据集名如在a库中的数据集abc可以这样来引用:a.abc。用数据步创建SAS数据集数据集修改数据集连接:SET数据集1数据集2;数据集合并:MERGE数据集1数据集2数据集子集的建立*删除变量语句格式:DROP变量表;功能:删除DROP指定的变量进入数据集。*保留变量语句格式:KEEP变量表;功能:对正在建立的数据集,只有KEEP语句指明的变量才能保存在数据集中。*认识增加变量(SPSS中重新编码为不同变量)描述给定特征的数值集合的指标称为变量。SAS变量的特征:变量名、类型、存储长
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 培训教育课程销售协议
- 公交公司进社区活动方案
- 公交车信用卡活动方案
- 公众号抽奖活动方案
- 公众评议活动方案
- 公会相亲活动方案
- 公共艺术活动方案
- 公关策划捐赠活动方案
- 公司一甲子庆祝活动方案
- 2025至2030年中国便携式X射线应力仪行业投资前景及策略咨询报告
- 《中南大学》课件
- 医疗器械使用错误评估报告-可用性工程
- 北师版七年级数学下册期末复习课件2024版
- 医院反腐倡廉廉洁行医专题党课宣讲课件
- 2025版《VOCs废气处理设施安全检查表》(全)
- 企业环保知识培训课件
- 《PLC光分路器》课件
- 小额贷款公司数据安全管理制度
- 护理学基础无菌技术说课
- 燃气服务数据分类分级管理标准
- 商混站(商品混凝土公司)安全风险分级管控和隐患排查治理双体系方案全套资料汇编完整版
评论
0/150
提交评论