




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SAS概述上海交通大学医学院生物统计教研室宋艳艳
SAS历史简介SAS—StatisticalAnalysisSystem1966年美国北卡州立大学A.J.Barr开始1972年推出SAS72供大学使用1976年成立SAS研究所(SASInstituteInc.),总部在美国北卡州凯瑞市现已是全球最大的私人软件公司和全球排名第九位的独立软件商.SAS功能和应用国际上通用的数据分析的标准软件 权威性的统计分析软件大型集成应用软件,具有完备的数据访问、管理、分析、呈现及应用开发功能运用统计分析、时间序列、运筹决策等科学方法进行质量控制、财务管理、生产优化、风险管理、市场调查和预测等,为金融、制造、电信、政府及教育部门提供数据仓库和决策支持系统。120多个国家和地区,三万一千多机构,直接用户超过三百五十万。(按行业划分的全球客户群企业: 商业:73.3%;教育机构:16.8%;政府部门:9.9%)案例中国海关使用SAS来审核偷税漏税、指导地方当局和打击走私()上海宝钢使用SAS软件来提高产品质量和改进供货流程(在竞争中领跑)() 解决方案:SAS解决方案,包括SAS/IntrNet和EnterpriseMiner,增强数据仓库、数据挖掘和在线报告技术和服务。SAS分析核心:SAS/STAT
统计分析软件包,覆盖所有的实用数理统计分析方法,是国际统计分析领域的标准软件SAS/IML提供面向矩阵运算的编程语言,是用户研究新算法解决新问题的工具SAS/OR运筹学和工程管理的软件,提供运筹学方法,是强有力的决策支持工具SAS/ETS用于计量经济学和时间序列分析,是研究复杂系统和进行预测的工具SAS/QC用于质量的专用软件,为全面质量管理提供一系列工具,进行标准的过程控制以及试验设计分析智能:
数据挖掘和统计分析 预测和计量经济学 运筹调研 质量改进
商业智能:
应用开发|内容提供|查询和报表
数据仓库:医学统计中的应用为绝大多数医学研究所采用论文上写明:
“采用SAS9.1进行数据的统计分析”2.Sas界面界面(显示管理系统):三个基本窗口PROGRAMEDITOR编辑窗:编辑SAS程序LOG记录窗:程序运行过程、时间、错误信息(红色---错误兰色---正常绿色---警告)OUTPUT结果输出窗:当程序运行无误,且有结果输出时显示其他:var窗、keys窗、lib窗(在命令行command===>输入相应的命令激活)(1)窗口转换:
PGM:转换到PGM窗口。
LOG:转换到LOG窗口。
OUTPUT:转换到OUTPUT窗口。
HELP:转换到HELP窗口。
KEYS:转换到功能键窗口。
OPTIONS:转换到系统设置窗口。功能键的使用F1:HELPF4:RECALLF5:PGMF6:LOGF7:OUTPUTF9:KEYS自己定义功能键的作用,然后保存关于HELP-提供SAS帮助(程序、理论,函数)现场演示关于OPTIONS窗口非OPTINONS 下拉菜单--查看及改变SAS的系统设置。一般默认即可。现场演示SAS文件系统*.sd2SAS数据集(6.12版)(必须以字母开头,长度不超过8位);8.0以上版为*.sas7bdat;*.sasSAS程序文件*.loglog窗口输出*.lstSAS结果文件SAS程序程序组成Dataprocedure-数据录入Procprocedure-调用SAS命令,进行统计分析等数据步和过程步都由一个或多个语句组成。注意事项SAS语句每一句以分号,“;”结束。一行可写几个语句,一个语句可写几行。语句中的关键词或选择项都用空格分开。程序以run结束。SAS程序用SUBMIT命令执行。最简单方法:用按钮。例2.1SAS数据集建立1、直接输入-用input和cards语句直接输入2、外部数据集调入1、直接输入例2.2datastudent;/*建立临时数据集child.sd2,自动放在saswork子目录下*/inputsexageheightweight;/*指明要输入的变量*/index=weight/height**2;/*产生新变量*/cards;/*标志数据区开始,数据之间以一个或几个空格分隔*/1181.7471.30191.5854.20181.6258.91181.7875.20181.6261.81191.7672.6;/*标志数据区结束,分号必须单独一行*/procprintdata=student;/*sas数据集显示在输出窗口*/varsexageheightweightindex;/*指定要显示哪些变量,缺省,则默认为所有变量*/run;/*告诉SAS系统程序结束*/不分行符@@的使用
dataesr;inputx@@;/*每读入一条记录后,数据指针保持原位不换行,继续读下一条记录*/cards;39865573108104;procmeans;run;SAS中的常用变量类型数值型:不需特殊定义字符型:定义方式变量名$日期型:多种形式如:变量名mmddyy6.
实际记录为距1960/01/01的天数缺失值的输入---以.表示,缺失值不进入分析
datachild;inputidx1$x2x3x4x5x6;cards;1m3295.514.053.549.642m35.13.052.041.613m3389.012.553.535.81254m176168.053.582.0100.14255f3091.011.048.035.39256f3391.011.547.044.98521f178163.051.079.087.42;procmeans;run;SAS数据集建立结果VariableNMeanStdDevMinimumMaximum--------------------------------------------------------------ID7184.5714286194.96397711.0000000521.0000000X2773.857142970.477960130.0000000178.0000000X36116.250000038.241012089.0000000168.0000000X4723.785714319.482593011.000000053.5000000X5759.285714314.736171947.000000082.0000000X6756.427142926.254044635.3900000100.1400000--------------------------------------------------------------SAS数据集建立字符型变量的输入(1)在INPUT语句中,变量名后面加上$符号,定义该变量为字符型变量。(2)字符型变量的长度默认8位,如超过8位,要在INPUT语句前面用LENGTH语句定义长度。(3)字符的大小写是有区别的。(4)调用字符型变量时,其内容要用单引号括起来。datastudent;infile'st.dat';inputsex$ageheightweight;index=weight/height**2;run;procprintdata=student;run;datab1b2;setstudent;Ifsex=‘male’thenoutputb1;Elseoutputb2;Run;Sasdata输入格式自由格式列输入格式区别-是否在变量名后面给出相应数据项的起始列号和结束列号。2、外部数据文件的调入1.先建立外部数据文件(只有数据),在数据步中用INFILE和INPUT语句读入数据建立数据集。(例)2、Import把EXCEL等其它数据库文件直接转换成SAS数据集(1)Excel文件另存为Excel5.0/95工作簿,然后关闭文件。(2)SAS下拉菜单:File-Import,出现窗口(3)选择数据文件类:Excel5or7spreadsheet(4)Next,选择要转换的Excel文件(5)Next,指定转换成的SAS数据集名及路径(6)Finish3、数据量小的情况下excel数据的转换。(1)在Excel中把选择数据部分复制(2)在SAS中把这些数据粘贴到PGM窗口中(3)用Cards语句读入这些数据建立SAS数据集。Excel数据文件中如有的数据缺失,不要留空格,用指定的数据中不可能取到的数字,如999.99,表示该数据缺失。以后转换成SAS数据集后,再用条件语句表示该数据是缺失的。IfX=999.99thenX=.;Sas的永久数据集和临时数据集SAS数据集名称的表示方式:两级文件名库关联名.数据集名
如work.esr,a.esr(.sas7bdat
省略)库关联名代表硬盘上某一(子)目录,esr即放在该目录下定义库关联名:用libname命令格式:libname库关联名“盘符:\路径”;
如:libnamea‘c:\teach’;a为库关联名,代表路径c:\teach;库关联名可任意取,一旦定义,只要不退出SAS,始终有效()。但路径必须实际存在临时数据集:每次启动SAS时,会自动开辟一个临时存储区,用于存储data步或其它过程生成的SAS数据集。它库关联名为WORK,代表\sas\saswork子目录。一旦退出sas,临时存储区自动删除,存放在其中的数据集也会被自动删除。即\sas\saswork子目录下的数据集被删除,称为临时数据集临时数据集的库关联名默认为work,均省略不写。如dataesr;(实际为work.esr)
永久数据集:通过两级文件名的形式,将生成的数据集存放到saswork以外的任意路径中(库关联名所指向的路径),即可以生成永久数据集,退出时不会被删除。如:libnamea‘c:\teach’;
dataa.esr;/*在c:\teach生成esr.sas7bdat数据集*/inputx1x2x3;(略)
退出SAS后再进入:
libnameaa‘c:\teach’;库关联名一旦定义,它所代表的目录下所有SAS数据集均可使用,不必再定义。1、从已建立的SAS数据集中读入数据建立新的SAS数据集---set命令libnamea‘c:\teach’;dataa.child;setchlid;procprint;run;
注:Proc步的操作对象总是最新生成的SAS数据集。也可通过在proc语句后加data=来指定要分析的数据集。dataa;seta.child;procprint;run;Datab;Seta;Run;2、拆分SAS数据集例2.4用“SET语句”定义已建立的SAS数据集,用条件语句选择观测,用KEEP语句选择指标,或用DROP语句去除不需要的指标。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024育婴师考试核心资料试题及答案
- 2025-2030图文书籍行业市场发展分析及发展前景与投资机会研究报告
- 2025-2030国内儿童安全手表行业市场发展现状及发展前景与投资机会研究报告
- 2025-2030团膳产业园区定位规划及招商策略咨询报告
- 2025-2030商贸物流行业并购重组机会及投融资战略研究咨询报告
- 2025-2030咖啡胶囊包装机行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030合成和生物基己二酸行业市场现状供需分析及投资评估规划分析研究报告
- 陪诊师职业价值观与试题及答案探讨
- 2025-2030反绒皮鞋行业并购重组机会及投融资战略研究咨询报告
- 2025-2030卫生纸行业市场深度调研及发展趋势与投资战略研究报告
- 人教B版新课标高中数学选择性必修第三册电子课本
- 广东省深圳市宝安区2022-2023学年八年级下学期期中语文试题
- 2024年房屋租赁合同电子版pdf
- 【高尔夫挥杆技术训练探究8700字(论文)】
- 国际航空货运代理实务
- 《咯血的诊治》课件2
- 江苏省连云港市赣榆智贤高中20222023学年高一下学期3月阶段检测语文试题(解析)
- 火力发电厂消防知识培训课件
- MSOP(测量标准作业规范)测量SOP
- 仓库温湿度记录表
- 营养风险筛查(NRS2002)解读
评论
0/150
提交评论