统计分析系统_第1页
统计分析系统_第2页
统计分析系统_第3页
统计分析系统_第4页
统计分析系统_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计分析系统第一页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO几种统计软件SAS-StatisticalAnalysisSystemSPSS-StatisticalProductandServiceSolutions是世界上最早采用图形菜单驱动界面的统计软件,它最突出的特点就是操作界面极为友好,输出结果美观漂亮,但其统计分析功能与SAS相比仍有一定欠缺。MINITABMinitab是为质量改善、教育和研究应用领域提供统计软件和服务的软件。第二页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO几种统计软件MATLAB-MatrixLaboratory是矩阵实验室(MatrixLaboratory)的简称,是美国MathWorks公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境。S-PLUS由AT&T贝尔实验室开发的一种用来进行数据探索、统计分析、作图的解释型语言。R研究统计算法的实现,希望自己可以修改程序中的代码(免费,原代码开放)第三页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGOSAS简介1.SAS与统计分析在众多的统计软件中,SAS以运行稳定、功能强大而著称。近20年来,SAS一直占据着统计软件的高端市场,用户遍及金融、医药卫生、生产、运输、通讯、政府和教育科研等领域。在数据处理和统计分析领域,SAS系统被誉为国际上的标准软件,堪称统计软件界的巨无霸。在国际学术界有条不成文的规定,凡是用SAS统计分析的结果,在国际学术交流中可以不必说明算法,由此可见其权威性和信誉度。第四页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGOSAS简介2.SAS的版本介绍

SAS是在1960年代末期由两位北卡州立大学(NorthCarolinaStateUniversity)统计系的教授开发.1976年,SAS软件研究所(SASInstituteInc.)成立,开始进行SAS系统的开发、维护、销售和培训工作。早期SAS只能运行在大型机上,现在SAS系统可以在各种大型机、小型机、工作站和微机上运行PC版本的SAS于1987年推出(V6.02),1989年推出SAS/PC(V6.04)版本;1997年下半年推出适用于多种操作系统的V6.12版本(Windows版);2000年2月又推出SAS系统V8版本,2001年推出SAS系统V8.2版本;2002年推出SASV9,最新版本为9.2目前本课程教学版本为V9.1.3第五页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGOSAS简介3.SAS的应用领域SAS广泛应用于金融、保险、临床研究、医药开发、市场调查、政府监管和教育部门等。《财富》杂志评出的世界500强中,有90%都使用SAS软件和方案。领跑国内BI市场SAS是全球领先的商业智能软件供应商,全球用户超过43,000家企业。SAS软件能够帮助客户从海量数据中获取智能信息以提高企业绩效,从而更快、更准确地传达决策信息,加强和伙伴、供应商之间的互利合作关系,从战略管理和运营管理两个层面同时推动企业发展。教育清华大学经济管理学院使用SAS作为MBA高级数据模型决策课程的伙伴软件。北京大学光华管理学院的硕士和博士生要求必修《统计分析计算机软件》课程.政府中国海关使用SAS来审核偷税漏税、指导地方当局和打击走私五角大楼官员依赖SAS智能来出台政策健康、保险、电信、制造、生命科学等第六页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGOSAS简介4SAS认证与数据挖掘、商业智能职业发展数据挖掘数据挖掘(DataMining)就是从大量数据中发现潜在规律、提取有用知识的方法和技术。因为与数据库密切相关,又称为数据库知识发现(KnowledgeDiscoveryinDatabases,KDD)。SAS的一个组件EnterpriseMiner是最流行的数据挖掘工具之一,和IBM的DB2IntelligentMiner、微软的MicrosoftSQLServer2005DataMining以及SPSSClementine等齐名,而且SAS公司一直是数据仓库的引导者.

第七页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGOSAS简介4SAS认证与数据挖掘、商业智能职业发展商业智能SAS不止是一个统计软件,它已经发展成为一个大型的商业智能(BI)平台。商业智能(BusinessIntelligence),简称BI,就是将智能计算技术应用于传统商业领域,从而提高数据分析能力,优化业务过程,提高企业竞争力。虽然商业智能的普及仅仅是最近几年的事情,但已经渗透到金融,电信,零售,医药,制造,政府等各个行业和领域,成为大中型企业经营决策的重要组成部分。第八页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGOSAS简介4.SAS认证与培训SAS认证从/国际站点(不点网站首页上的中国)预约。绝大多数省会城市有考点,基本上每个工作日都可以机考。目前初级和高级考试都是115USD(信用卡付款)。对高校师生有优惠。SAS培训官方北京面授培训10000RMB*折扣(不推荐)官方在线自学培训300USD*折扣(不推荐)自学(推荐)注意:不考统计应用只考编程基础第九页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO1.1SAS系统的组成SAS系统是由众多模块组成的系统。其中BaseSAS模块是SAS系统的核心。其它各模块均在BaseSAS提供的环境中运行。用户可选择需要的模块与BaseSAS一起构成一个用户化的SAS系统。第十页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO常用模块BaseSAS作为SAS系统的核心,负责数据管理,交互应用环境管理,进行用户语言处理以及调用其它SAS模块。BaseSAS为SAS系统的数据库提供了丰富的数据管理功能,还支持标准的SQL语句对数据进行操作。SAS/GHAPH可将数据及其包含着的深层信息以多种图形生动地呈现出来,如直方图、饼图、星形图、散点相关图、曲线图、三维曲面图、等高线图及地理图等。

第十一页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO常用模块SAS/ASSIST为SAS系统提供了面向任务的菜单界面,借助它可以通过菜单系统来使用SAS系统的其它产品。SAS/AF是一个应用开发工具。用户使用SAS/AF可将包含众多功能的SAS软件作为方法库,利用SAS/AF的屏幕设计能力以及SCL语言的处理能力来快速开发各种功能强大的应用系统。第十二页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO常用模块SAS/EIS是决策工具,也是一个快速应用开发工具。SAS/ACCESS:为了对众多不同格式的数据进行查询、访问和分析,SAS/ACCESS提供了与目前许多流行数据库软件的接口,利用SAS/ACCESS可建立访问外部其他数据库的一个统一的公共数据界面。SAS/STAT覆盖了所有的实用数理统计分析方法,是国际统计分析领域的标准软件。SAS/STAT提供了十多个过程,可进行各种不同模型或不同特点数据的回归分析,如正交回归/面回归、响应面回归、logistic回归、非线性回归等,且具有多种模型选择方法。

第十三页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO常用模块SAS/ETS提供丰富的计量经济学和时间序列分析方法,是研究复杂系统和进行预测的有力工具。它提供方便的模型设定手段、多样的参数估计方法。SAS/GIS是集地理信息系统与空间数据显示分析于一体的软件。第十四页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGOSAS系统的特点信息存储简便灵活语言编程能力强丰富的统计分析方法较强的统计报表与绘图功能友好的用户界面第十五页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGOSAS系统的特点宏功能支持分布式处理采用输出分发系统功能强大的系统阅读器第十六页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO1.2SAS系统的安装修改机器时间为2006年,安装虚拟光驱运行安装文件夹下的setup.exe。安装程序首先提示用户选择安装语言,如图1-1所示。第十七页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGOSAS系统的安装选择“中文(简体)”后单击“确定”按钮,打开SAS9.1.3安装主界面,如图1-2所示。第十八页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGOSAS系统的安装SAS系统安装成功后,在“开始/程序”菜单下创建有“TheSASSystem”程序组,如图1-3所示。第十九页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGOSAS的启动退出在Windows系统中,单击“TheSASSystemforWindows9.1(简体中文)”菜单项,即可启动SAS系统。也可在“开始”菜单的“运行”对话框中输入命令“<SAS安装路径>\sas.exe”运行SAS,或在资源管理器中双击SAS安装目录中sas.exe文件图标启动SAS系统。第二十页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO退出SAS系统用户需要关闭SASforWindows9.1.3时,有两种方法可以选择:单击“文件”菜单中的“退出”菜单项单击窗口右上角的关闭按钮执行以上操作后,系统会弹出如图1-7所示对话框,用户可单击“确定”按钮退出SAS系统,也可以单击“取消”按钮返回SASforWindows继续使用。第二十一页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGOSAS系统的主要界面介绍SASforWindowsV9.1.3的主画面如下图所示。第二十二页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGOSAS帮助和文档SAS是一个迅速发展的大型软件系统,对用户而言,要想掌握每一个技术细节是非常困难的,因此,多使用SAS的帮助系统也就显得尤为重要。SAS的帮助系统如图1-10所示。第二十三页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGOSAS的工具栏一些常见的任务可以不需调用菜单而直接用鼠标单击工具栏中的图标即可完成。把鼠标指向图标并停留几秒可以显示其功能,常见工具图标如图1-11所示。第二十四页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO添加新库单击添加新库图标,系统弹出如图所示对话框。在“名称”域中输入新的逻辑库标识,在“路径”域中填入逻辑库标识所对应的文件夹。用户可以点击“浏览”按钮浏览文件夹并进行选定。信息设定完成后单击“确定”按钮完成逻辑库标识的定义,单击“取消”按钮放弃添加。第二十五页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO中断任务有的时候可能需要撤消已提交的任务,一个简便的方法是单击工具栏中的中断任务图标,弹出如图所示任务管理器对话框。用户可以选择“取消提交的语句”撤消已提交的语句;选择“取消对话框”关闭此对话框;选择“终止SAS系统”退出SAS系统。第二十六页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO资源管理器窗口在资源管理器窗口包含有四个图标,分别是:逻辑库(Libraries),文件快捷方式(FileShortcuts)、收藏夹(Favorite)、我的电脑(MyComputer)第二十七页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO结果窗口用户选择“查看”菜单中的“结果”或单击“结果(Results)”标签可以切换到结果窗口,在结果窗口中列出了SAS系统的输出过程。第二十八页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO程序编辑窗口程序编辑窗口是SAS系统中最常用的窗口之一,其主要功能如下:①输入并编辑文字,包括程序语句。②提交程序文件执行。③保存或回调源文件。保存程序文件的扩展名是*.sas。回调已执行的SAS程序语句,加以修改后,再提交执行。第二十九页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO增强型编辑器增强型编辑器是一个ASCII编辑器,它使用视觉辅助系统如不同颜色、代码分段等帮助用户编写调试SAS程序。第三十页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO日志窗口日志窗口用于输出程序在运行时的各种有关信息。主要有以下几项内容:程序行:用黑色表示提示:用蓝色表示警告:用绿色表示错误:红色用户可以保存日志窗口中的信息,其文件扩展名为*.log。第三十一页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO输出窗口输出窗口的主要功能是显示各个过程的分析结果,用户可以保存结果并进行修改、打印等处理。保存的结果文件扩展名为*.lst。第三十二页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGOSAS/ASSIST窗口SAS/ASSIST提供了一个非编程的菜单式操作界面,可以输入、转换、编辑数据,管理、分析数据并生成报表。新用户和没有经验的用户可以不需学习、记忆复杂的SAS程序语言就可以利用SAS强大的数据管理、分析、报表功能。熟练的SAS用户可以利用SAS/ASSIST快速高效地开发应用程序原型并测试,可以利用SAS/ASSIST自动生成程序代码的功能学习SAS语言的使用,并可以把生成的程序编辑后组合到自己的应用中。第三十三页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO启动SAS/ASSISTASSIST窗口的启动方法有二种:用鼠标选择“解决方案”菜单中的“ASSIST”在命令框中输入ASSIST回车第三十四页,共五十八页,编辑于2023年,星期三SAS编程序基础第三十五页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGOSAS每次启动时会自动指定4个库标记:Work,Sasuser,Sashelp,Sasmap。Sasuser库保存与用户个人设置有关的文件,Sashelp库保存与SAS帮助系统、例子有关的文件。永久文件保存在永久库中,在退出SAS系统时不会自动被删除。逻辑库和SAS文件第三十六页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGOSAS文件是指储存在SAS逻辑库中的成员,SAS的用户文件的主要类型有:●SAS数据集●SAS程序访问一个SAS文件,一定要指明它所在的逻辑库,格式为:逻辑库名.文件名。如在Sasuser库下建立一个名为Mydata的数据集,访问的时候,要用Sasuser.mydata。如果不指明逻辑库名,则表示存储在临时逻辑库WORK中的SAS文件。逻辑库和SAS文件第三十七页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO2.SAS的名字

SAS的名字(数据集名、变量名、逻辑库名等等)有以下命名规则:

1)由英文字母、数字、下划线组成;

2)第一个字符必须是字母或下划线;

3)不区分大、小写字母。另外,SAS逻辑库名最多用8个字符;数据集和变量的名字最多用32个字符。逻辑库和SAS文件第三十八页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO3.SAS数据集

SAS的核心是SAS数据集。SAS数据集是SAS文件的一种,一般由以下两部分组成:(1)描述部分包含该数据集的一般信息,包括:数据集的名字及其成员类型、数据集建立的日期和时间、观测的数目、变量的数目以及数据集中每一个变量的特征信息,包括:Name(变量名)、Type(类型)、Length(长度)、Format(输出格式)、Informat(输入格式)、Label(标签)。(2)数据部分逻辑库和SAS文件第三十九页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO1.数据步与过程步

SAS程序包括多个步骤和一些控制语句,一般情况下由两种类型的程序步(steps)组成:数据步(DATAsteps)和过程步(PROCsteps)。有时SAS程序还包括一些全程语句,用以控制贯穿整个SAS程序的某些选项、变量或程序运行的环境。SAS程序概述第四十页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO数据步与过程步●数据步通常用于创建SAS数据集,但也可以用于产生特别设计的报表。●过程步通常用于分析和处理SAS数据集中的数据,但有时候也可用于创建数据集。一个SAS程序就是由数据步、过程步或两者的任意组合而成。每一个程序步通常由若干语句(statements)构成。SAS程序概述第四十一页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO数据步语句SAS语言构成数据步data过程步procSAS语句关键字开始,分号结束SAS表达式常量数字型12,3.14159,1.5E-8字符型“Linming”日期型‘15jul2007’d日期时间型’15JUL200714:13:20’DT缺失值数字型缺失值用句点表示第四十二页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO数据步语句SAS表达式变量数字型字符型运算符算术运算符:+,-,*,/,**比较运算符号:=,^=,>,<,>=,<=,in逻辑运算符:&(and),|(or),^(not)AAin(“北京”,“上海”,“武汉”)age>=5andsex=“女”第四十三页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO数据步的工作流程数据步开始有未读入的观测值吗?用数据读入语句读入一个观测值用其它语句对观测值进行运算或处理把当前的观测值写入数据集数据集建立完毕,开始下一个数据步或过程步YN第四十四页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO数据步语句DATA语句DATA[数据集名[(选择项)]…;表明数据步的开始,定义新数据集名常用选项:DROP=变量名表

KEEP=变量名表

RENAME=(老变量名=新变量名)第四十五页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO数据步语句INPUT语句INPUT变量[$][起始列[-末列]];INPUT变量[$]SAS输入格式;读数据指针@的使用行保持符@或@@的使用第四十六页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO数据步语句注释语句/*sklfjsdkfjsdkslkdjfsldk*/赋值语句变量名=表达式;第四十七页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO数据步语句IF语句IF表达式;仅对符合条件的观测值处理或IF表达式THEN语句1;[ELSE语句2;]如果THEN后有多句THENDO;语句序列1END;第四十八页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO数据步语句简单DO语句DO;若干SAS语句END;第四十九页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO数据步语句循环DO语句DO变量=初值[TO终值[BY增量]][while|untill(表达式)];END;例DOI=1TO8BY2;DOI=2TO16BY2UNTIL((X/2)>Y);DOI=1TO10WHILE(X<Y);第五十页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO数据步语句DOWHILE语句DOwhile(表达式);END;例N=0;DOWHUILE(N<5);X=N;N=N+1;END;第五十一页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO数据步语句DOUNTIL语句DOUNTIL(表达式);END;例N=0;DOUNTIL(N>=5);X=N;N=N+1;END;第五十二页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO数据步语句OUTPUT语句OUTPUT[数据集名]…;把当前的观测值写入正在建立的数据集中[例]Libnameaa“e:\sasdata”;Dataclassbclassg;Setaa.class1;Ifsex=‘b’thenoutputclassb;Elseoutputclassg;Run;第五十三页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO1.临时数据集的建立程序的基本结构DATA数据集名;INPUT变量名表[@@];其他数据步语句;CARDS;若干数据行RUN;第五十四页,共五十八页,编辑于2023年,星期三武汉大学计算中心LOGO1.临时数据集的建立[例1]创建一临时数据集class1DATACLASS1;INPUTNAME$AGESEX$HEIGHTWEIGHTBUST;CARDS;

刘明3男0.9413.5950.4

蔡行3男0.9114.2050.0

李敏4女1.3916.1551.6

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论