SAS软件应用之统计图.ppt_第1页
SAS软件应用之统计图.ppt_第2页
SAS软件应用之统计图.ppt_第3页
SAS软件应用之统计图.ppt_第4页
SAS软件应用之统计图.ppt_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第25章统计图 学习目标 了解统计图的特点 熟悉统计图绘制的一般原则 掌握根据数据特征选择统计图的方法 掌握各种统计图的意义以及绘制统计图的SAS程序 概述 统计图是用点 线 面 体来形象地表达数量资料的1种方式 常用的统计图有条图 棒图 圆图 饼图 统计地图 线图 直方图 散点图等 统计图的种类很多 应根据资料的类型和目的选用合适的统计图 定性资料可选用的统计图有条图 圆图 统计地图等 定量资料可选用的统计图有直方图 或多边图 普通线图 半对数线图 散点图等 不同的统计图 以不同的方式或姿态来形象化地表达资料 因此 掌握各种统计图的特征 有助于正确选用统计图 统计图制作的一般原则 根据资料性质和分析目的正确选用适当的统计图 例如分析比较独立的 不连续的 无数量关系的多个组或多个类别的统计量宜选用直条图 分析某指标随时间或其它连续变量变化而变化的趋势宜选用线图 描述某变量的频数分别宜选用直方图 描述或比较不同事物内部构成时用圆图或百分条图等 统计图制作的一般原则 统计图必须有标题 概括统计图资料的时间 地点和主要内容 统计图的标题在图的下方 统计图一般有横轴和纵轴 并分别用横标目说明横轴和纵轴代表的指标和单位 一般将两轴的相交点即原点处定为0 统计图用不同线条和颜色表达不同事物和对象的统计量 需要附图加以说明 直条图 直条图用来表示各相互独立的统计指标的数量大小 通常 纵轴表达数量 横轴表达分组标志 用绝对数或相对数均可表达数量 其数量大小用图中各长条的高度来反映 直条图用相同宽度的直条长短表示相互独立的某统计指标值的大小 直条图按照是横放还是竖放分卧式和立式两种 按对象的分组是单层次和两层次分单式和复式两种 直条图 直条图的直条尺度必须从0开始 各直条的宽度相等 间隔一般与直条等宽或为其一半 直条排列的顺序可按指标值大小排列 也可按分组的自然顺序排列 GCHART过程步 SAS系统中采用GCHART过程步绘制直条图 GCHART过程步的语法格式如下 PROCGCHART DATA 选项 HBAR 选项 VBAR 选项 BLOCK 选项 PIE 选项 STAR 选项 AXISn 选项 BY RUN GCHART过程步 HBAR选择项指令系统绘制立式直条图 VBAR选择项指令系统绘制水平直条图 BLOCK选择项指令系统绘制三维直方图 PIE选择项指令系统绘制饼图 STAR选择项指令系统绘制星状图 AXISn选择项控制坐标轴的形状和颜色 BY选择项指令系统按该变量取值分层绘制 要求数据集已按该变量排序 GCHART过程步 MISSING指定绘图时要将变量的缺失值也包括在内 TYPE 做图类型关键字 指定要做图的类型 即图中条块代表的含义 缺省值是频数 FREQ 如果指定了选择项SUMVAR 则缺省值为总和 SUM 可选的关键字有 FREQ要求按指定变量的频数做图 PERCENT要求按在横轴刻度表示范围内出现的频数占总数的百分比做图 CFREQ 按累计频数做图 CPERCENT 按累计百分比做图 GCHART过程步 SUM只能与SUMVAR选项同时使用 要求图中的每一条代表 变量在横轴表示的取值范围内时 SUMVAR指定变量的总和 MEAN只能与SUMVAR选项同时使用 要求图中的每一条代表 变量在横轴表示的取值范围内时 SUMVAR指定变量的均数 SUMVAR 求和变量 指定使用TYPE SUM或MEAN时 用于求总和 均值的变量 GCHART过程步 LEVAL n 如果绘图变量是连续变量 用该选项产生有N个组段的图形 GROUP 分组变量 要求产生以分组变量的值分组的并排图 SUBGROUP 亚组变量 要求每个图形内部再按亚组变量的值分块 CAXIS 颜色 指定坐标轴的颜色 CTEXT 颜色 指定坐标轴文本的颜色 百分条图和圆图 圆图用来表示事物内部的构成情况 必须用相对数 且各项之和为100 图中各扇形面积表示数量的大小 将360度圆心角看成100 把每一部分所占的百分数折算成圆心角的度数 根据圆心角的度数就可画出代表各部分数量大小的扇形来 百分条图是以矩形总长度作为100 将其分割成不同长度的段来表示各构成的比例 圆图和百分条图适合描述分类变量的各类别所占的构成比 线图 线图也称折线图 是用线段的升降来表示数值的变化 适合于描述某统计量随另一连续性数值变量变化而变化的趋势 它分为普通线图和半对数线图 普通线图 资料中包含着2个计量指标 放在横轴上的计量指标通常是时间 放在纵轴上的计量指标通常是某种率 画图时 纵 横轴上的尺度一律用算术尺度 它适合于表达1个或多个事物或现象随着时间的推移 数量的增减幅度 GPLOT过程步 SAS系统中采用GPLOT过程步绘制线图 GPLOT过程步的语法格式如下 PROCGPLOT DATA 选项 PLOT 选项 PLOT2 选项 SYMBOLn 选项 BY RUN GPLOT过程步 PLOT2选择项指令系统在原图基础上重叠绘制第二幅散点图 SYMBOLn选择项定义符号 添加趋势线 定义点和线的颜色 BY选择项指令系统按该变量取值分层绘制 要求数据集已按该变量排序UNIFORM要求用BY语句分组打印的散点图的坐标刻度相同 便于比较 VTOH 数值 指定纵横坐标的比例 OVERLAY 同一语句做的图重叠在同一个坐标系中显示 GPLOT过程步 HAXIS 数值 定义横坐标的刻度 VAXIS 数值 定义纵坐标的刻度 CAXIS 颜色 定义坐标轴的颜色 CTEXT 颜色 定义坐标轴文本的颜色 I 连线方式 JOIN用直线连接 SPLINE用光滑的曲线连接 NEEDLE向横坐标画垂线 RL添加回归直线 WIDTH 宽度 定义数据点和连线的宽度 COLOR 颜色 定义数据点和连线的颜色 半对数线图 半对数线图是一种基本的统计图形 特别适宜作不同指标变化速度的比较 它与普通线图 习惯简称线图 一样均可通过线段的上升或下降来表示一个指标随另一指标 常为时间 变化而变化的情况 两者的区别在于普通线图的横 纵坐标均为算术尺度 在某两个不同的时间段上 如果终点相对于起点的 绝对改变量 相同 将在图形上表现为相同的增幅 或减幅 直观呈现的是数量变化的态势 半对数线图 半对数线图的横坐标仍为算术尺度 如时间 纵坐标指示的观察指标 常为研究的指标 如发病率 病死率等 则实施了对数转换 即对数尺度 在某两个不同时间段上 如果终点相对于起点的 相对改变量 相同 将在半对数线图上表现为相同的增幅 或减幅 所以半对数线图适用于呈现事物发展变化的速度 半对数线图 故两种图形从不同的角度反映被观察指标的变化情况 但二者的意义和适用场合区别甚大 使用时要根据具体情况正确选用 如果研究者一概应用普通线图来反映动态数据的变化情况 则可能导致无法正确呈现资料所蕴涵的信息 半对数线图 当研究两组或多组数据的变化情况时 普通线图用来说明研究指标的波动态势 半对数线图用来说明研究指标的变化速度 以两个观察指标 和 变化速度的比较为例 在某一时间段当指标 发生10 100的变化 指标 发生100 1000的变化时 绝对增长量 分别是90和900 相差较远 相对增长量 却都是10倍于起点水平 半对数线图 显然 变化速度的比较所注重的正是 相对增长量 因此 普通线图不能对指标 的变化速度相等 均为10倍 这一事实给予正确呈现 正确的做法应该是纵坐标采用对数尺度 与线性尺度的横坐标构成所谓的 半对数线图 则前述设定的时间段上的指标 变化量 lg100 lg10 指标 变化量 lg1000 lg100 提示指标 与 的发展变化速度相等 箱图 箱线图是由一组数据的5个特征值绘制而成的 它由一个箱子和两条线段组成 5个特征值依次是最大值 上四分位数 中位数 下四分位数和最小值 通过箱线图 可以反映出数据分布的特征 箱线图一般有单批数据箱线图和多批数据箱线图两种 在SAS系统中通过UNIVARAITE过程步就可以绘制箱线图 散点图 散点图表示两种事物变量的相关性和趋势 医学上常用于观察两种生理指标之间的动态变化关系 或临床上两项检测结果之间的量变关系 资料中包含着2个计量指标 如果2变量之间有自变量与因变量之分时 通常把自变量放在横轴上 把因变量放在纵轴上 将成对的数据 X Y 在直角坐标系中用圆点表示出来 就称为散点图 它可以形象地反映出在专业上有一定联系的2个连续变量之间的变化趋势 可借助它帮助判断是否值得进行直线相关和回归分析或拟合何种类型的曲线方程 直方图 数值型数据表现为数字 在整理时通常进行数据分组 分组是根据统计研究的需要 将数据按照某种标准分成不同的组别 直方图是用矩形的宽度和高度来表示频数分布的图形 用横轴表示数据分组 纵轴表示频数或频率 直方图 直方图是以直方面积描述各组频数的多少 面积的总和相当于各组频数之和 适合表示数值变量的频数分布 直方图的横轴尺度是数值变量值 纵轴是频数 注意如各组组距不等时 要折合成等距后再绘图 即将频数除以组距得到单位组距的频数作为直方的高度 组距为直方的宽度 SAS系统中通过CAPABILITY过程步绘制直方图 统计地图 统计地图用来表示事物的数量在地域上的情况 如反映疾病的地区分布情况 统计地图用不同的颜色和花纹表示统计量的值在地理分布上的变化 适宜描述研究指标的地理分布 统计地图先绘制按行政区域或地理特征分区的地图 然后按各区域统计指标值分别标记不同颜色或花纹 并加以图例说明不同颜色或花纹的意义 注意颜色或花纹的选择最好与统计量数值增减的趋势一致 利用SAS的GMAP可以在地图上制作二维或三维的统计图 直观地显示地区性的差异 本章小节 统计图的种类很多 应根据资料的类型和目的选用合适的统计图 定性资料可选用的统计图有条图 圆图 统计地图等 定量资料可选用的统计图有直方图 或多边图 普通线图 半对数线图 散点图等 不同的统计图 以不同的方式或姿态来形象化地表达资料 因此 掌握各种统计图的特征 有助于正确选用统计图 本章小节 直条图用来表示各相互独立的统计指标的数量大小 通常 纵轴表达数量 横轴表达分组标志 用绝对数或相对数均可表达数量 其数量大小用图中各长条的高度来反映 SAS系统中采用GCHART过程步绘制直条图 圆图用来表示事物内部的构成情况 必须用相对数 且各项之和为100 图中各扇形面积表示数量的大小 将360度圆心角看成100 把每一部分所占的百分数折算成圆心角的度数 根据圆心角的度数就可画出代表各部分数量大小的扇形来 SAS系统中采用GCHART过程步绘制圆图 本章小节 线图也称折线图 是用线段的升降来表示数值的变化 适合于描述某统计量随另一连续性数值变量变化而变化的趋势 它分为普通线图和半对数线图 普通线图适合于表达1个或多个事物或现象随着时间的推移 数量的增减幅度 SAS系统中采用GPLOT过程步绘制线图 半对数线图是一种基本的统计图形 特别适宜作不同指标变化速度的比较 适用于呈现事物发展变化的速度 SAS系统中也是采用GPLOT过程步绘制半对数线图 本章小节 箱线图是由一组数据的5个特征值绘制而成的 它由一个箱子和两条线段组成 5个特征值依次是最大值 上四分位数 中位数 下四分位数和最小值 通过箱线图 可以反映出数据分布的特征 在SAS系统中通过UNIVARAITE过程步就可以绘制箱线图 SAS系统中需要通过BOXPLOT过程步完成多选数据箱线图比较 本章小节 散点图表示两种事物变量的相关性和趋势 医学上常用于观察两种生理指标之间的动态变化关系 或临床上两项检测结果之间的量变关系 在SAS系统中利用GPLOT过程绘制散点图 直方图是以直方面积描述各组频数的多少 面积的总和相当于各组频数之和 适合表示数值变量的频数分布 直方图的横轴尺度是数值变量值 纵轴是频数 SAS系统中通过CAPABILITY过程步绘制直方图 本章小节 统计地图用来表示事物的数量在地域上的情况 如反映疾病的地区分布情况 统计地图用不同的颜色和花纹表示统计量的值在地理分布上的变化 适宜描述研究指标的地理分布 利用SAS的GMAP可以在地图上制作二维或三维的统计图 直观地显示地区性的差异 第3章SAS宏编程 学习目标 掌握宏变量的定义以及引用 熟悉宏变量的特殊用法 掌握宏的定义 掌握宏的调用 SAS宏功能 将一个变量 一段程序或者一个文本命名 供以后调用 是用于扩充和制做用户化SAS系统的工具 利用宏功能用户可以减少在完成一些共同任务时必须输入的文本量 当用户在某个SAS程序中使用宏功能时 这个宏功能产生所需要的SAS语句和命名 SAS系统的其余部份接受这些语句和命令 SAS宏的主要功能 获取SAS的系统信息 SAS在启动时就创建了一些自动宏变量 用以存储当前SAS进程启动的日期 时间 版本号及其它信息 用户可以在任何情况下使用这些宏变量 有条件的执行数据步和过程步 例如每天提交一份生产情况的详细报告 每周五增加一份汇总报告 使用宏功能每天运行同一个程序就可以实现上述任务 开发交互式系统 使用SAS宏语言的 WINDOW语句及一些基本的编程语句可开发交互式用户界面 SAS宏的主要功能 产生与数据无关的SAS程序 但可展示与数据相关的结果 宏功能可保持SAS程序的独立性和移植性 一段程序在多种情况下均可运行 得到期望的结果 在不同的SAS数据步和过程步之间传递数据 SAS宏变量可在SAS的任何地方被引用 具有全局性 所以成为不同过程间传递数据最方便的手段 重复执行SAS程序码 凡用到SAS宏语言的变量和语言成分 都以符号 或 开始 当SAS程序提交后 在编译阶段 系统对程序逐词扫描过程中 凡遇到 或 开始的词 就启动宏语言处理器对此进行处理 宏变量 宏变量属于SAS宏语言 但不同于DATA步变量 可以在SAS程序除数据行之外的任何地方定义并使用宏变量 一个DATA步变量仅与一个SAS数据集有联系 而宏变量不依赖于SAS数据集 宏变量与数据步中变量的主要区别是 数据步中变量的值往往与被处理观测有关 而宏变量有唯一确定的值 一个宏变量存放的值保持不变直到被修改 宏变量 宏变量具有唯一确定的值 可以存储字符串 是全局变量 可以在数据步中被引用 但不能在数据步中用赋值语句定义 引用时 在变量名前加 号 引用效果是变量值代替变量名 宏变量在引用时放在单引号之间不会被解读 只能在双引号之间 宏变量的产生 SAS系统包含两种类型的宏变量 自动宏变量 由SAS系统提供 用户定义的宏变量 由用户在程序中定义 自动宏变量 在SAS进程开始时 或程序运行过程中由系统自动创建 在SAS退出前一直保持有效 是全局宏变量 能在SAS任何地方被引用 以下是一些主要的自动宏变量 SYSDATESAS进程开始的日期 SYSDATE9以Date9 格式显示SAS进程开始的日期 SYSTIMESAS进程开始的时间 SYSSCP使用的操作系统 SYSDAYSAS进程开始是为星期几 SYSVERSAS的版本 SYSLAST最新创建的SAS数据集的名字 定义宏变量 有两种方式定义宏变量 LET和callsymput 定义宏变量并分配一个值给宏变量的最简单方法是使用宏程序语句 LET 格式如下 LET变量名 变量值 另一个语句就是callsymput 其格式如下 callsymput 变量名 变量值 宏变量的引用 为了引用一个宏变量的值 放一个 多次引用宏变量 用户根据SAS程序中的需要可以多次引用宏变量 宏变量的值保持不变直到其被修改 每次出现引用 exa 宏处理器用score替代它 改变宏变量的值 在上例中 如果用户想要改变SAS数据集名字 可以在它出现的这段程序中通过改变宏变量的值来实现 嵌套宏变量引用 可以使用嵌套的宏变量引用来改变一个长的宏变量值而不必重新定义这个变量 例如 为了改变在PROCPLOT步中的两个画图变量 在PLOT的这个值中使用宏变量引用 宏的定义 宏是一个被存贮的文本 用一个名字识别它 最简单的宏就像一个宏变量一样工作 但复杂的宏可以完成许多宏变量不能做的事 定义宏的语句格式为 MACRO宏名称 宏文本 MEND 默认存放在work sasmacr中 MACRO语句是每一个宏的开始 同时必须给出这个宏的名字 宏名字的命名准则与SAS名字一样 宏的文本也就是宏的内容 宏内的字符串称为固定文本或模型文本 该文本将变为用户SAS程序的一部分 MEND语句必须围住每个宏并表示宏的介绍 MEND语句也可以放上宏名字来说明该宏已结束 宏的调用 为了调用一个宏 放一个百分数符号 在宏名字前面就可以了 比如 study模式 宏名称 称为宏的调用 当用户定义一个宏之后 可以在SAS程序中调用它 如 Title Displayofschool study 宏处理器执行宏STUDY 把宏里面的固定文本替代到TITLE语句中 TITLE语句变为 Title DisplayofschoolStudentscore 宏的调用 SAS程序可以包括任意多个宏 且在一个程序中可以多次调用一个宏 对于简单文本的阐明 使用宏变量比定义一个宏更有效 然而 当任务比较复杂时 宏比宏变量更有优势 把宏变量和宏结合在一起 将给出一种用宏工具编程的强有力的方法 下面我们将介绍在宏中使用宏变量的多种方法 宏参数 可以定义宏变量作为 macro语句的一部分 如 macroprintClass class procprintdata 宏参数 对参数分配的值只在这个宏执行过程中有效 因此第二次调用宏时 还是要给出参数的值 宏参数是局部宏变量的一个例子 而宏变量是从用户创建它们直到SAS作业或SAS会话结束都存在 故前面介绍的宏变量为全局宏变量 使用参数有以下几个优点 用户可以少写几个 LET语句 调用宏时不需要知道这些参数的名字 只需要提供这些值的类型 使用参数可以保证该变量在宏之外的程序部份不会被引用 宏的循环结构 宏的循环语句有三种类型 分别是宏中DO循环语句的格式为 do指标变量 始点 to终点 BY增量 文本或宏程序语句 end do while 表达式 先判断再执行 文本 end do until 表达式 先执行再判断 文本 end 宏的循环结构 以生成重复的文本段为例说明如何使用宏的循环结构 假定用户想生成一系列名字用于某个SAS语句 可以写一个宏来产生具有相同前缀的一系列名字 用示例说明宏CREATE用重复 DO循环开生成名字 本章小节 SAS宏功能将一个变量 一段程序或者一个文本命名 供以后调用 是用于扩充和制做用户化SAS系统的工具 利用宏功能用户可以减少在完成一些共同任务时必须输入的文本量 介绍了SAS宏的主要功能 包括 获取SAS的系统信息 有条件的执行数据步和过程步 开发交互式系统 产生与数据无关的SAS程序但可展示与数据相关的结果 在不同的SAS数据步和过程步之间传递数据和重复执行SAS程序码 我们对SAS宏功能作略微了解 本章小节 宏变量属于SAS宏语言 但不同于DATA步变量 宏变量具有唯一确定的值 可以存储字符串 是全局变量 SAS系统包含两种类型的宏变量 自动宏变量 由SAS系统提供 用户定义的宏变量 由用户在程序中定义 有两种方式供用户定义宏变量 为了引用一个宏变量的值 放一个 号在宏变量名字的前面 通过对本节对宏变量的介绍 我们需要注意宏变量与数据步变量的区别 了解两种类型的宏变量 掌握如何定义宏变量 本章小节 本章阐述了引用宏变量的四种方式 多次引用宏变量 改变宏变量的值 创建包含SAS语句的宏变量值和嵌套宏变量引用 同时 介绍了宏变量的一些特殊用法 包括 STR宏函数 eval宏函数 sysfunc宏函数 字符串中引用宏变量 在数据步执行中生成宏变量和 symget宏函数 我们需要掌握引用宏变量的方法 并了解其特殊用法 本章小节 详细讲解了宏的定义和调用问题 尤其是在宏中使用宏变量的方法 包括宏参数 宏调用宏 宏的分支结构 宏的循环结构 文章用实例说明了各种应用方法以及注意要点 在学习过程中 我们需要深刻理会这些实例的含义 通过本章的学习需要掌握定义宏的语句格式以及如何调用定义的宏 并在学习中注意宏与数据步中条件表达式的区别 谢谢 SAS输出传送系统 ODS 学习目标 熟悉ODS的功能以及传送目标 掌握几类常见的ODS语句格式 掌握常见的ODS语句的作用 应用以及注意事项 ODS功能 在以前各章提到的数据及其加工结果的输出中 最常用的方式是在OUTPUT窗口以文本的形式显示分析结果 而图形则在GRAPH窗口显示图形 这些显示方法都有一定的局限性 在OUTPUT窗口的结果不便于转换成SAS数据集作进一步的分析处理 在OUTPUT窗口是等宽的字体列表方式显示的 它的表格无法在其它字体的环境下使用 每个过程提交后其输出是一个整体 难于进行挑选 ODS功能 SAS系统中仅有部份过程可以将输出的结果存为SAS数据集 而且存入SAS数据集的数据也不全面 此外 为了便于利用INTERNET进行交流沟通 迫切需要将数据加工输出的各种信息存为HTML 超文本 文件格式 基于以上考虑 SAS系统开始提供了ODS OutputDeliverySystem输出传用系统 它主要就是为了更方便 灵活地使用SAS系统的各个过程的加工结果

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论