3章SAS系统功能基础.ppt_第1页
3章SAS系统功能基础.ppt_第2页
3章SAS系统功能基础.ppt_第3页
3章SAS系统功能基础.ppt_第4页
3章SAS系统功能基础.ppt_第5页
免费预览已结束,剩余95页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章SAS系统的基础功能 3 1SAS过程初步 3 2制作列表报告 3 3产生汇总表格 3 4SAS图形入门 3 5定量资料的统计描述 数据集包含较少数据时 数据集包含大量信息时 3 1SAS过程初步 SAS过程步的一般形式 PROC过程名DATA 输入数据集选项 过程语句 选项 过程语句 选项 RUN SAS过程步中常用语句 VAR语句 指定分析变量MODEL语句 指定统计建模的模型BY语句 指定分组变量CLASS语句 指定分类变量OUTPUT语句 指定输出结果存放的数据集FREQ语句 指定一个重复数变量WEIGHT语句 指定一个权重变量ID语句 指定用来标识观测的变量WHERE语句 选择输入数据集的一个行子集进行分析LABEL语句 为变量指定一个临时标签FORMAT语句 为变量输出规定一个输出格式 VAR语句 在过程步中用来指定分析变量 SAS过程步常用语句 MODEL语句 在统计建模过程中用来指定模型的形式 SAS过程步常用语句 如 用语文成绩预测数学成绩时 可用Modelmath chinese SAS过程步常用语句 BY语句 指定一个或几个分组变量 根据这些分组变量的值把观测分组 然后对每一组观测分别进行本过程指定的分析 SAS过程步常用语句 CLASS语句 在一些特定的过程 如方差分析 中 用来指定一个或几个分类变量 而在另一些过程 如MEANS 中 其作用与BY语句类似 SAS过程步常用语句 OUTPUT语句 指定输出结果存放的数据集 指定要输出的结果 输出结果在输出数据集中的名称 SAS过程步常用语句 FREQ语句 指定一个重复数变量 每个观测中此变量的值说明这个观测实际代表多少个完全相同的重复观测 WEIGHT语句 指定一个权重变量 在某些允许加权的过程中代表权重 其值与观测对应的方差的倒数成比例 ID语句 指定一个可以用来区分观测的变量 如人名 省市名等 作为观测标志 用于某些需要输入观测代号的过程 如print 来代替观测序号使用 SAS过程步常用语句 WHERE语句 选择输入数据集的一个行子集进行分析 SAS过程步常用语句 LABEL语句 为变量指定一个临时标签 FORMAT语句 为变量输出规定一个临时输出格式 procprintdata sunny bclasslabel idname varheightweight labelname 姓名 height 身高 weight 体重 formatheight5 1weight5 1 run 例 第三章SAS系统的基础功能 制作列表报告 数据集包含较少数据时 3 2制作列表报告 PROCPRINTDATA 数据集名选项 过程语句 选项 RUN 用PROCPRINT产生列表报告 与PRINT有关的其他常用语句及选项 PROCPRINT DATA 数据集名 NOOBS ID变量 VAR变量序列 WHERE条件表达式 SUM变量序列 BY变量序列 PAGEBY变量序列 RUN NOOBS选项 去掉OBS列VAR语句 控制变量的出现与否及出现顺序WHERE语句 控制哪些观测将出现在报告中SUM语句 计算变量的总和BY语句 对数据进行分组并求每一组的小计 需事先用SORT过程对同一变量进行排序 ID语句 取消OBS列 把指定变量排列在报告的最左边 且只在每个组的开始处出现一次PAGEBY语句 使产生的报告按组分页 说明 PROCPRINTDATA SUNNY LONPARNOOBS VARFLIGHTDATEDESTBOARDEDREVENUE WHEREREVENUEBETWEEN155000AND170000 RUN 选择数据集的观测 用PROCPRINT产生列表报告 例 PROCPRINTDATA SUNNY LONPAR VARFLIGHTDATEDESTBOARDEDREVENUE SUMBOARDEDREVENUE RUN 计算变量的总和 用PROCPRINT产生列表报告 例 数据的分组和小计 用PROCPRINT产生列表报告 例 用PROCPRINT产生列表报告 使报告按组分页及ID语句的应用 用PROCPRINT产生列表报告 例 用PROCPRINT产生列表报告 TITLEn 文本 加入标题 FOOTNOTEn 文本 加入脚注 用PROCPRINT产生列表报告 为全程语句 既可用在数据步或过程步中 也可单独使用 其作用具有持续性 PROCPRINTDATA SORTED IDFLIGHT VARDATEDESTBOARDEDREVENUE SUMBOARDEDREVENUE BYFLIGHT PAGEBYFLIGHT TITLE InternationalAirlines TITLE2 FlightstoLondonandParis FOOTNOTE PreparedMarch12 1990 FOOTNOTE2 bytheCorporateInformationCenter RUN 例 用PROCPRINT产生列表报告 PROCPRINTDATA SORTEDLABEL IDFLIGHT VARDATEDESTBOARDEDREVENUE SUMBOARDEDREVENUE BYFLIGHT PAGEBYFLIGHT TITLE1 StatisticsforFlightstoLondonandParis FOOTNOTE1 LABELFLIGHT FlightNumber DATE DateofFlight DEST FlightDestination BOARDED NumberofPassengers REVENUE TotalRevenue RUN 例 用SPLIT 选项控制表头的分割 输出结果 用PROCPRINT产生列表报告 用户化格式可以被赋予单个数字 某一数字范围 字符 字符串或某一范围的字符 VALUEsexfmt1 女 2 男 other Miscoded VALUEboardfmtlow 49 低于平均 50 99 平均 100 high 高于平均 VALUE grade A Good B D Fair F Poor I U SeeInstructor other Miscoded PROCFORMAT VALUE DESTFMT LON London PAR Paris PROCPRINTDATA SORTEDSPLIT IDFLIGHT VARDATEDESTBOARDEDREVENUE SUMBOARDEDREVENUE BYFLIGHT TITLE1 StatisticsforFlightstoLondonandParis LABELFLIGHT Flight Number DATE Date of Flight DEST Flight Destination BOARDED Number of Passengers REVENUE Total Revenue FORMATDATEYYMMDD8 REVENUEDOLLAR10 DEST DESTFMT RUN 例 输出结果 CENTER NOCENTER 结果居中 不居中 DATE NODATE 显示 不显示运行时间日期 NUMBER NONUMBER 显示 不显示页号 LINESIZE width 每行最宽不超过的字符数 PAGESIZE n 每页输出的行数 PAGENO n 输出的起始页码 用PROCPRINT产生列表报告 也可由OPTIONS语句或窗口定义 全程有效 OPTIONSNODATENOCENTER PROCPRINTDATA SORTED IDFLIGHT VARDATEDESTBOARDEDREVENUE SUMBOARDEDREVENUE BYFLIGHT PAGEBYFLIGHT RUN 例 用PROCPRINT产生列表报告 SAS中对输出结果的管理 输出的HTML格式 网页格式 由Assist提供的菜单制作列表报告 用Report窗口产生列表报告 进入Report窗口的方法 用Report窗口产生列表报告 然后可利用下拉菜单对显示的缺省输出报告进行加工 用Report窗口产生列表报告 输出结果 第三章SAS系统的基础功能 3 1SAS过程初步 3 2制作列表报告 3 3产生汇总表格 3 4SAS图形入门 3 5定量资料的统计描述 数据集包含较少数据时 数据集包含大量信息时 3 3产生汇总表格 当一个SAS数据集包含的数据较少时 用列表报告可以很好地描述数据 但当数据集包含大量的信息时 就需要用汇总报告来描述 制作汇总表格需明确的要素 分类变量的特性 可以是数值型或字符型变量 若为数值型变量 则代表某些离散的类 能够将数据分类 以便在每个类上进行计算和分析 分析变量的特性 一定是数值型变量 适合于作各种统计运算 如计数 求和 平均 百分比等 用PROCTABULATE产生汇总表格 控制表格结构 格式化输出表格中的数据值 在表格的每一维拥有多个变量 支持一个ALL类变量用以计算总和 产生用户化的行标题和列标题 功能1 产生格式化的汇总表格 功能2 计算统计量 N含有有效数据的观测数 NMISS含有缺失值的观测数 MEAN算术平均数 STD标准差 MIN最小值 MAX最大值 RANGE取值的范围 SUM总和 USS加权平方和 CSS加权离差平方和 PCTN某一类中某一小类观测所占百分比 PCTSUM某一类观测在全部数据中所占百分比 等等 TABULATE过程的一般形式 PROCTABULATEDATA 数据集options CLASSclass variables VARanalysis variables TABLEpage expression row expression column expression options RUN 如果程序中没有定义分析变量 则默认的统计量为N TABLE语句中使用的变量必须在CLASS或VAR语句中定义过 说明 用PROCTABULATE产生汇总表格 TABLE语句中表达式的构成 用PROCTABULATE产生汇总表格 TABLE语句 运行结果 运行结果 运行结果 运行结果 运行结果 用TUBULATE语句的FORMAT 选项控制每一格的宽度 用TABLE语句的RTS 选项控制第一列的宽度 用FORMAT语句格式化变量名 使用WHERE语句选择所需要的观测 用PROCTABULATE产生汇总表格 例 已知SAS数据集SUNNY FLTATEN的资料如下 PROCFORMAT VALUE GENFMT F 女 M 男 PROCTABULATEDATA SUNNY FLTATENFORMAT 5 0 WHEREJOBCODEIN FA2 FA3 CLASSGENDERJOBCODE FORMATGENDER GENFMT TABLEGENDERALL JOBCODEALL RTS 12 RUN 运行结果 使用FORMAT LABEL TITLE以及FOOTNOTE语句 使用KEYLABEL语句为ALL类变量以及所有统计量加入标记 说明 TABULATE过程能够自动使用所有标签 不需要LABEL或SPLIT 选项 用PROCTABULATE产生汇总表格 PROCFORMAT VALUE GENFMT F 女 M 男 PROCTABULATEDATA SUNNY FLTATENFORMAT DOLLAR10 0 CLASSGENDERJOBCODE VARSALARY FORMATGENDER GENFMT TABLEGENDER JOBCODE SALARY MEANALL SALARY MEAN RTS 8 KEYLABELALL OVERALL MEAN AVERAGE LABELJOBCODE JOBCODES SALARY ANNUALSALARY TITLE AVERAGESALARY FOOTNOTE BYJOBCODEANDGENDER RUN 例 运行结果 由Assist提供的菜单制作汇总表格 第三章SAS系统的基础功能 3 1SAS过程初步 3 2制作列表报告 3 3产生汇总表格 3 4SAS图形入门 3 5定量资料的统计描述 数据集包含较少数据时 数据集包含大量信息时 3 4SAS图形入门 SAS GRAPH模块能实现强大的图形功能 可以处理 散点图及折线图 plots 图表 charts 地图 maps 三维图形 three dimensionalgraphics 文本缩放及其它 textslides 由PROCGPLOT作散点图和折线图 PROCGPLOTDATA 数据集 PLOT纵坐标变量 横坐标变量 选项 其他SAS语句 RUN 控制坐标轴 HAXIS Values Axisn定义水平轴的刻度VAXIS Values Axisn定义垂直轴的刻度NOAXIS取消坐标轴及相关的文字CAXIS Color定义坐标轴的颜色CTEXT Color定义坐标轴文本的颜色加框 FRAME加框CFRAME Color给坐标轴包围的区域填色 PLOT语句的选项 由PROCGPLOT作散点图和折线图 主要选项有 VALUE V symbol定义代表数据点的符号I interpolation定义数据点之间的连线方式COLOR C color定义颜色WIDTH W width定义连线的宽度 由PROCGPLOT作散点图和折线图 TITLE语句及FOOTNOTE语句 图形中标题 Title 和脚注 Footnote 的选项有 C 颜色H 高度及单位F 字体 由PROCGPLOT作散点图和折线图 DATAGRAPH SETSUNNY COLUMN WHEREDEST LON PROCGPLOTDATA GRAPH PLOTBOARDED DATE VAXIS 125TO225BY25 SYMBOLV STARI NONEW 5C RED LABELDATE CALENDARDATE BOARDED PASSENGERONBOARD TITLE PASSENGERCOUNTSFORDESTFORLONDON FOOTNOTEH 1 2 28FEB 2001 RUN 运行结果 DATAGRAPH SETSUNNY COLUMN WHEREDEST LON PROCGPLOTDATA GRAPH PLOTBOARDED DATE VAXIS 125TO225BY25 SYMBOLV SQUAREI JOINW 5C RED LABELDATE CALENDARDATE BOARDED PASSENGERONBOARD TITLE PASSENGERCOUNTSFORDESTFORLONDON FOOTNOTEH 1 2 28FEB 2001 RUN 运行结果 由Assist菜单系统作散点图和折线图 进入Assist主菜单 由Assist菜单系统作散点图和折线图 由Assist菜单系统作散点图和折线图 用PROCGCHART过程产生柱状图和圆饼图 柱状图和圆饼图的作用是展示分类汇总信息 分类变量的不同值对应不同的柱或饼的不同部分 各个类的频数或某分析变量的指标用柱的高度或饼的角度表示 主要选项有 用PROCGCHART过程产生柱状图和圆饼图 PATTERNc 颜色v 花纹 PATTERN语句的应用 用来逐个指定柱状图等每个柱的颜色和花纹 可位于PROCGCHART之中或之前 花纹 empty solid x3 r3 l3 用PROCGCHART过程产生柱状图和圆饼图 运行结果 图中显示了雇员工资的分布 图中显示了各工种的平均工资 运行结果 运行结果 PROCGCHARTDATA CHART PATTERN1C RED PATTERN2C GREEN PATTERN3C BLUE PIEJOBCODE SUMVAR SALARYTYPE SUMEXPLODE FA1 FILL S TITLE TOTALSALARYPAID TITLE2 TOFLIGHTATTENDANTSBYJOBLEVEL RUN 例 使用EXPLODE选项来强调圆饼图的某些块 运行结果 由Assist菜单系统作柱状图 由Assist菜单系统作圆饼图 第三章SAS系统的基础功能 3 1SAS过程初步 3 2制作列表报告 3 3产生汇总表格 3 4SAS图形入门 3 5定量资料的统计描述 数据集包含较少数据时 数据集包含大量信息时 3 5定量资料的统计描述 UNIVARIATE过程 提供单个变量的详细描述和对其分布类型的检验 MEANS过程 提供单个或多个变量的简单描述 对于多个变量 它的输出格式紧凑 便于阅读 FREQ过程 对离散变量计算频数分布 为对定量变量进行统计描述 SAS系统提供了UNIVARIATE MEANS和FREQ三个过程 UNIVARIATE过程 语法格式 PROCUNIVARIATE DATA 选项 VAR BY FREQ WEIGHT ID OUTPUTOUT 关键字 pctlpts pctlpre VAR语句 指定要分析的变量名列 BY语句 按变量名列分组统计 数据集需事先按该变量名列排序 FREQ语句 表明该变量为分析变量的频数 WEIGHT语句 表明分析变量在统计时要按该变量加权 ID语句 输出时加上该变量作为索引 OUTPUT语句 指定统计量输出的数据集及输出的内容和形式 OUT指定统计量的输出数据集名 关键字指定统计量对应

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论