SAS基本图形输出_第1页
SAS基本图形输出_第2页
SAS基本图形输出_第3页
SAS基本图形输出_第4页
SAS基本图形输出_第5页
已阅读5页,还剩73页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SAS/GRAPH模块的特点:(1)是SAS系统的一部分;(2)提供了许多产生图形的过程;(3)支持众多的图形设备;(4)提供对文本的广泛控制,包括标题和脚注;(5)提供改善图形的工具;(6)提供存储和再现图形的机制;(7)能够重叠图形;(8)能够在每页产生多个图形。SAS/GRAPH模块可以处理的图形有:(1)散点图及折线图(plots)(2)图表(charts)(3)地图(maps)(4)三维图形(three-dimensionalgraphics)(5)文本缩放及其他(textslides)§1SAS程序的过程步SAS的过程步可看作是已经编写好的子程序,用户可以在需要的时候调用它们。过程步的一般形式:PROC过程名<DATA=数据集名><选项>;

过程的专用语句描述;<VAR变量序列;><WHERE条件表达式;><BY变量序列;>

RUN;

说明:过程步都是以PROC语句开始,后面紧跟过程名,用以区分不同的过程步。尖括号中的内容是可选项,省略时对应的系统默认值如下:处理最近建立的数据集;处理所有变量(对于一个计算过程步处理所有数值变量);处理数据集中的所有观测。§2制作散点图和连线图散点图——以数据集中某两个变量为纵坐标变量和横坐标变量,每条观测对应于图中的一个点,数据集中的多条观测就在平面上构成一幅散点图。连线图——是将散点图中的各点之间以一定的方式用直线或曲线相连所形成的图形。散点图和连线图的作用:1)揭示一个变量随另一个变量的变化2)显示变量间的关系3)对不同的数据进行比较4)显示数据值的分析实现:调用过程步GPLOT或PLOT。前者是在GRAPH窗口中以精确方式绘图,后者是在OUTPUT窗口中以非精确方式绘图。1.图形选项设置一般形式:GOPTIONS图形选项;功能:根据需要来进行图形选项的设置,设置有关图形输出的各项参数。

说明:此操作一般在绘图之前进行。

此语句属于环境设置语句。恢复系统的缺省设置图形选项:RESET=ALL|GOPTIONS|GLOBAL|……

说明:GOPTIONS:将所有全局语句(如TITLE等)的设置恢复为缺省状态。

GOPTIONS:将所有关于图形的设置恢复为缺省状态。

ALL:同时实现上述两种功能。

2.基本散点图一般形式:

PROCGPLOT<DATA=数据集名>;PLOT纵坐标变量*横坐标变量;RUN;

说明:

1)DATA=数据集名:此选项指定数据集的名称,要求用二级文件名表示;

2)PLOT语句中指定纵坐标变量和横坐标变量,要求必须是数值型变量;

3)每条观测对应图上的一个点。

例1:假设数据集dst.airqual中保存的是在一段时间内美国47个州的逐月的空气质量监测数据。其中包含下列变量:变量名类型

说明STATE字符型州名,用2个字母的缩写表示REGION数值型州所在地区,用1~7的数字表示MONTH数值型月份,用1~12的数字表示AVE_TSP数值型悬浮颗粒物含量的平均值AVE_LEAD数值型铅含量的平均值取纽约州的数据制作平均悬浮颗粒物含量随月份变化的散点图:libnamedst

'd:\dst';goptions

reset=all;proc

gplot

data=dst.airqual;

plotave_tsp*month;

wherestate='NY';run;注意:绘制高分辨率的统计图非常耗费系统资源,因此当我们提交作图语句时,SAS系统只是把它们送入程序缓冲区。只有当用户打开GRAPH窗口时,程序才真正执行,绘出统计图。然后此过程步处于驻留状态,系统可以继续执行所提交的语句,从而实现了用户和系统之间的交互操作。结束驻留状态的方法有:(1)提交另一个程序步;(2)提交QUIT语句。

3.散点图和连线图的修饰

点的符号、大小、颜色;点间连线、连线方式、线型、宽度;坐标轴:包括刻度、标签、颜色等;图例的配置与修饰。

3.1SYMBOL语句

一般形式:

SYMBOL<n>选项;

功能:用于控制图中点和连线的显示方式。说明:n是SYMBOL语句序号,取值范围:1~99。系统缺省值为1。取消SYMBOL语句的设置

不加选项的SYMBOL语句SYMBOL<n>;

通过恢复系统缺省设置的图形选项语句取消前面对所有SYMBOL语句的设置。

GOPTIONSRESET=SYMBOL;

性质

全局性:可以出现在过程步内或过程步之外,一旦定义则一直保持到重新定义或退出SAS系统;可加性:一个选项的定义不影响其他选项。

1)设置点

VALUE|V=符号:设置图中点的表示符号

符号名称符号表示PLUS+(缺省方式)XXSTAR*SQUARE□DIAMOND

TRIANGLE△HASH#PAW::POINT.DOT●CIRCLE○NONE无符号COLOR|C=颜色:设置图中点和连线的颜色。CV=颜色:设置图中点的颜色。BLACK黑色(缺省方式)RED红色GREEN绿色BLUE蓝色YELLOW黄色CYAN青色MAGENTA洋红PINK粉红ORANGE橙色BROWN棕色GREY灰色HEIGHT|H=n<单位>:设置图中点的大小。CELL单元,SAS默认单位CM厘米PCT屏幕画面大小的百分数

PT象素IN英寸

POINTLABEL:在图中每个点的旁边标注纵坐标变量的值。例2:对于例1我们作如下修饰:goptions

reset=all;symbol

v=diamondcv=redh=1.5

pointlabel;proc

gplot

data=dst.airqual;

plotave_tsp*month;

wherestate='NY';run;2)设置连线

选项:INTEPOL|I=连线方式:设置相邻点之间的连线方式。名称连线方式NONE不连线(缺省方式)JOIN直线SPLINE光滑的样条曲线NEEDLE通过点的并且垂直于横坐标轴的直线SMnn绘制不经过散点的样条曲线。nn曲线光滑性与拟合度的折衷,取值:00~99。RL<CLInn>线性回归直线,CLInn:另外绘制预测值的置信区间曲线,nn:置信区间大小。RQ二次曲线RC三次曲线CI=颜色:设置连线的颜色。

LINE|L=n:设置连线的线型。n为线型号码,取值范围:0~46。其中常用的有:0(空)、1(实线,缺省值)、2(由点组成的虚线)……。WIDTH|W=n:设置连线的宽度。n为宽度值。系统缺省值为1。例3:对例1的修饰改为如下形式:goptions

reset=all;symbol

v=diamondh=2

cv=redi=joinci=bluel=2

w=2

pointlabel;proc

gplot

data=dst.airqual;

plotave_tsp*month;

wherestate='NY';run;

说明:连线是对数据(子)集中的每一对表示相邻观测的点之间连线的,所以在绘图前要首先处理好观测在数据集中的顺序。最好是首先将数据集按横坐标变量进行排序。例4:对sashelp.class作图,显示变量身高(Height)和体重(Weight)之间的关系。goptions

reset=all;symbol

v=squarei=join;proc

gplot

data=sashelp.class;

plotweight*height;run;对数据集sashelp.class按变量height排序后描散点图。goptions

reset=all;symbol

v=squarei=join;Procsortdata=sashelp.class;Byheight;proc

gplot

data=sashelp.class;

plotweight*height;run;3.2设置标题和脚注

设置标题的一般格式:

TITLE<n><选项>‘字符串’<选项>‘字符串’……;设置脚注的一般格式:

FOOTNOTE<n><选项>‘字符串’<选项>‘字符串’……;

功能:设置在图上显示的标题和脚注。

选项:

FONT|F=字体:设置字符串的字体。COLOR|C

=

颜色:设置字符串的颜色。HEIGHT|H

=

n<单位>:设置字符的高度。说明:

1)TITLE和FOOTNOTE语句都是全局语句,性质与SYMBOL语句相同。

2)可选项<n>标明了TITLE或FOOTNOTE语句的序号,n的取值范围1~99,缺省值为1。

3)希望在标题或脚注位置显示的信息在TITLE或FOOTNOTE语句中用字符串的形式给出。在字符串前面的选项是对字符串显示性质的控制,如果不给出,则系统以缺省方式显示字符串。4)SAS系统提供的2类字体:硬字库:由操作系统提供的字库;软字库:由SAS系统提供的字库。注意:软字库的字体名直接输入即可,而硬字库的字体名两端需加引号。

获得想用的字体名:1)在命令框中输入FONTLIST并提交;2)在屏幕上出现的SelectFont(选择字体)对话框中选择;

软字库的所有字体点击可获得硬字库中的字体名称例5:在例3中加入title语句:goptions

reset=all;symbol

v=diamondh=2

cv=redi=joinci=bluew=2

pointlabel;titlef='隶书'c=green'纽约州每月的悬浮颗粒物平均值';title2h=1.2

'2002';proc

gplot

data=dst.airqual;

plotave_tsp*month;

wherestate='NY';run;

3.3设置坐标轴

AXIS语句的一般形式:

AXIS<n>选项;

功能:设置坐标轴的显示形式,包括:坐标轴在画面中的位置和长度,变量值在轴上的出现次序、尺度、刻度的标注,相关文字的字体、颜色、布局。

说明:可选项<n>标明了AXIS语句的序号,n的取值范围1~99,缺省值为1。AXIS语句也是全局语句。取消设置:

要取消第n号坐标轴的设置

AXIS<n>;要取消所有坐标轴的设置

GOPTIONSRESET=AXIS;

选项:COLOR|C=颜色:设置坐标轴及相关文字的颜色。LABEL=(字符属性‘字符串’)|NONE:设置轴的标签及其属性。说明:轴的标签就是轴的说明信息,可在括号中的字符串给出。系统缺省设置是显示对应变量的标签或名字。VALUE=(字符属性‘字符串’)|NONE:设置轴的主刻度的描述字符及其属性。

ORDER=(值列表):设置主刻度位置依次出现的数值。MINNOR|N=n|NONE:设置在主刻度之间加入的次刻度数n。标签和主刻度的字符属性:C=颜色:设置字符颜色;F=

字体:设置字符字体;H=n<单位>:设置字符高度;R=

角度:设置单个字符的旋转角度,单位是度,逆时针方向为正。A=角度:设置整个字符串的旋转角度。J=LEFT|CENTER|RIGHT:设置字符串的对齐方式。例6:设置如下坐标轴:axis1

label=(f=complexc=blueh=3pct)c=magentaw=3

minor=none;axis2

label=(a=-90

r=90

f=complexc=blueh=3pct'PartPerMillion')c=magentaw=3;3.4PLOT语句中的选项

PLOT语句的一般形式:

PLOT纵坐标变量*横坐标变量

/选项;

选项:FRAME|NOFRAME:设置图中是否显示边框。AUTOHREF|AUTOVREF:自动在图中添加经过主刻度的水平/垂直参考线。NOAXIS:取消坐标轴以及与坐标轴相关的图形元素。CAXIS=

颜色:设置坐标轴的颜色。CTEXT=

颜色:设置坐标轴旁字符的颜色。HAXIS|VAXIS=AXIS<n>|值列举:设置图中的横坐标轴或纵坐标轴。

例6:对于例1中的数据集,绘制如下连线图:goptions

reset=all;symbol1

v=triangleh=1.5

i=joinc=greenw=2;titlec=blue'NewYorkSuspendedParticleAverage';title2c=blueh=1.2

'2002';axis1

label=(f=complexc=blueh=3pct)c=magentawidth=3

minor=none;axis2

label=(a=-90

r=90

f=complexc=blueh=3pct'PartsPerMillion')c=magentawidth=3;proc

gplot

data=dst.airqual;

plotave_tsp*month/haxis=axis1vaxis=axis2noframe;

wherestate='NY';run;4.多条连线的图形绘制

4.1多幅图形的绘制

在一个过程步中绘制多幅图形,可以采用以下几种方法:(1)使用BY语句对数据集中的观测分组;(2)在PLOT语句中给出多个纵横轴变量的组合;;(3)在过程步中使用多个PLOT语句。

说明:在PROCGPLOT过程中给出可选项UNIFORM可使不同图中同一变量的坐标轴尺度相同。

例7:分别绘制纽约州每月平均悬浮颗粒物和含铅量的连线图。goptions

reset=all;proc

gplot

data=dst.airqual;

wherestate='NY';

plotave_tsp*monthave_lead*month/caxis=bluectext=blue;

symbol1

v=trianglei=join;

titlef=swissic=red'NewYorkSuspendedParticleAverage';run;

4.2将多条连线图绘制在同一幅画面上

1)在PLOT语句中给出选项OVERLAY;

2)在同一个过程步中使用语句PLOT、PLOT2绘制多条连线;

3)按第三个变量的值对数据集进行分组作图。1)选项OVERLAY例8:将纽约州每月平均悬浮颗粒物和含铅量的连线绘制在同一幅图中。goptions

reset=all;proc

gplot

data=dst.airqual;

wherestate='NY';

plotave_tsp*monthave_lead*month/overlaylegendhminor=0

vaxis=axis1;

symbol1

v=diamondi=joinc=bluel=1

w=3;

symbol2

v=stari=joinc=redl=2

w=3;

axis1

label=(a=-90

r=90

f=swiss

'PARTSPERMILLION');

titlef=swissic=magentah=6pct'DelawareMonthlyPollutantAverages';run;说明:1)在同一幅画面中坐标轴尺度相同,因此无需UNIFORM选项;

2)为了区分图中的不同连线,每条连线的显示形式应该不同。我们可以通过SYMBOL语句设置连线的参数。系统默认每条SYMBOL语句设置的连线依次使用一次。

3)PLOT语句中的选项LEGEND的功能是在图中加入图例以说明每条连线的含义。

2)PLOT2语句一般形式:

PLOT2纵坐标变量*横坐标变量

……/<选项>;功能:为纵坐标变量在图的右侧另外设置一个纵坐标轴,它与用PLOT语句在图的左侧设置的纵坐标轴可以用不同的AXIS语句设置。例9:修改例8,为变量ave_lead在图的右侧建立一个纵坐标轴。goptions

reset=all;proc

gplot

data=dst.airqual;

wherestate='NY';

plotave_tsp*month/overlaylegendhminor=0;

plot2ave_lead*month/overlaylegend;

symbol1

v=diamondi=joinc=bluel=1

w=3

h=1.5;

symbol2

v=stari=joinc=redl=2

w=3

h=1.5;

titlef=zapfc=blueh=6pct'DelawareMonthlyPollutantAverages';run;3)按照第三个变量分类作图

一般形式:PLOT纵坐标变量

*横坐标变量

=第三变量

</选项>;

功能:绘图时将数据集中的观测按第三个变量的值分类(第三变量值相等的观测分为一类),然后分别绘制不同的连线并置于同一幅图中。

例10:将纽约、特拉威和新泽西三个州的逐月平均悬浮颗粒物的连线图画在同一幅画面中。goptions

reset=all;proc

gplot

data=dst.airqual;

wherestatein('NY'

'DE'

'NJ');

plotave_tsp*month=state/hminor=0;

symbol1

v=diamondi=joinc=bluel=1

w=2

h=1.5;

symbol2

v=stari=joinc=redl=2

w=2

h=1.5;

symbol3

v=squarei=joinc=greenl=3

w=2

h=1.5;

titlef=zapfc=blueh=5pct'NewYork,Delaware,NewJerseyTSPAverage';run;说明:(1)在按第三个变量分类作图时,系统缺省的提供图例。(2)由于新泽西州后几个月的数据没有提供,所以在图中只显示了前几个月的连线。

4.3LEGEND语句

主要用于对图例进行设置的全局语句。一般形式:

LEGENDn

选项;

功能:设置图例。说明:n为LEGEND语句的序号,取值范围1~99,缺省值为1。

恢复所有LEGEND语句的缺省设置:

GOPTIONSRESET=LEGEND;

在图中显示我们已设置的图例:

PLOT纵坐标变量*横坐标变量/LEGEND=LEGENDn;选项:

ACROSS=n:将图例元素排为包含n个元素的行;

DOWN=n:将图例元素排为包含n个元素的列;POSITION=(bottom|middle|topleft|center|rightoutside|inside):设置图例在画面上的位置,画横线的是缺省值;

FRAME:设置图例区加边框;CFRAME=颜色:设置图例区边框的颜色;CSHADOW=颜色:设置图例区边框阴影的颜色;LABEL=(字符属性‘字符串’):设置图例标签;VALUE=(字符属性1‘字符串1’……):设置图例中的每条连线的说明标签。例11:修改例10中的图例。goptions

reset=all;proc

gplot

data=dst.airqual;

wherestatein('NY'

'DE'

'NJ');

plotave_tsp*month=state/hminor=0

legend=legend1;

symbol1

v=diamondi=joinc=bluel=1

w=2

h=1.5;

symbol2

v=stari=joinc=redl=2

w=2

h=1.5;

symbol3

v=squarei=joinc=greenl=3

w=2

h=1.5;

legend1

down=3

position=(toprightinside)frame

cshadow=blacklabel=(f=duplexh=1.5)value=(f=duplex);

titlef=zapfc=blueh=5pct'NewYork,Delaware,NewJerseyTSPAverage';run;§2制作柱状图和饼图SAS系统提供GCHART过程绘制二维或三维的柱状图或饼图,用于表现某种分类下某个变量的统计量的汇总信息。

1.GCHART过程步

1.1一般形式PROCGCHARTDATA=数据集名;

图形名

作图变量

</选项>;

RUN;1.2

定义要素

1)定义图表的形式;

2)定义一个作图变量(ChratVariable)用于决定图表的自变量,也称分类变量;

3)定义一个分析变量用于计算各种统计量。1.3

图表的形式

图形形式图形名自变量的值对应的图形元素分析变量的值水平柱状图HBAR一个柱柱长三维水平柱状图HBAR3D一个柱柱长垂直柱状图VBAR一个柱柱高三维垂直柱状图VBAR3D一个柱柱高三维平铺柱状图BLOCK一个柱柱高饼图PIE饼的一角扇形的角度三维饼图PIE3D饼的一角扇形的角度星形图STAR一条射线射线长度2.基本汇总图

系统根据作图(分类)变量的值将观测分类,再用柱状图或饼图展示汇总结果。说明:1)作图变量:字符型:变量的一个值是一类;数值型:系统认为值是连续的,会自动将值的变化范围分为若干等长区间。并以区间的中点作标签。2)不指明分析变量,系统默认的统计量是频数(Freq);若指明分析变量,系统默认的统计量是总和(Sum)。3)可添加TITLE、FOOTNOTE等语句修饰图。例:假设数据集dst.airqual中保存的是在一段时间内美国47个州的逐月的空气质量监测数据。其中包含下列变量:变量名类型

说明STATE字符型州名,用2个字母的缩写表示REGION数值型州所在地区,用1~7的数字表示MONTH数值型月份,用1~12的数字表示AVE_TSP数值型悬浮颗粒物含量的平均值AVE_LEAD数值型铅含量的平均值例1:用垂直柱状图显示不同区域的监测次数goptions

reset=all;proc

gchart

data=dst.airqual;

whereregion=1;

vbarstate;titlec=redh=5pctf=swissl

'RegionalContrctFrequencies';run;例2:用数值变量作分类变量,以垂直柱状图显示纽约州不同含铅量的监测次数goptions

reset=all;proc

gchart

data=dst.airqual;

wherestate='NY';

vbarave_lead;

titlec=redh=5pctf=swissl

'RegionalContrctFrequencies';run;3.与分类有关的选项说明:在CHART语句的选项中设置。LEVELS=n:对数值型变量设置其分类数n;MIDPOINTS=值列:对字符型分类变量依次列出每类的值,对数值型分类变量依次列出每个区间的中点;格式:值列形式:值1值2……初值to终值by步长DISCRETE:对于每个数值型分类变量取值作为一类,适用于离散型数值变量;ASCENDING|DESCENDING:按统计量值的升序或降序排列各柱或饼的各角。例:在下面的过程步中分别以下列vbar语句代替原有的vbar语句,可以看到不同效果。goptions

reset=all;proc

gchart

data=dst.airqual;vbarave_lead;run;vbarave_lead/levels=2;vbarmonth/discrete;vbarmonth/midpoints=1to12by3;vbarstate/midpoints='NY'

'DE'

'NJ';4.选择分类变量和统计量说明:在CHART语句的选项中设置。SUMVAR=变量名:设置分析变量;TYPE=FREQ|CFREQ|PERCENT|CPERCENT|MEAN|SUM:设置统计量。FREQ:频数;CFREQ:累积频数;PERCENT:百分数;CPERCENT:累积百分数;MEAN

:均值;SUM:总和。例:以水平柱状图显示各地区悬浮颗粒物含量的平均值的平均值goptions

reset=all;proc

gchart

data=dst.airqual;

hbarregion/sumvar=ave_tsp

type=mean;run;5.显示统计量说明:在CHART语句的选项中设置。NOSTAT:在图中不显示统计量;OUTSIDE=统计量:在柱的外部显示;INSIDE=统计量:在柱的内部显示;例:以三维垂直柱状图显示各地区悬浮颗粒物含量的平均值的平均值,并标注频数和累计频数。proc

gchart

data=dst.airqual;

vbar3dregion/sumvar=ave_tsp

type=mean

inside=freqoutside=cfreq;run;6.柱状图的修饰6.1在CHART语句的选项中设置。1)坐标轴NOAXIS:不显示与坐标轴有关的内容;CAXIS=颜色:设置坐标轴的颜色;CTEXT=颜色:设置轴旁文字的颜色;MAXIS=AXISn:设置分类变量的坐标轴;RAXIS=AXISn:设置统计量的坐标轴;MINOR=n:统计量坐标轴的主刻度之间加入的次刻度数;AUTOREF:自动显示参照线,垂直于统计量坐标轴。2)边框NOFRAME:不显示边框;CFRAME=颜色:设置边框的颜色。3)柱宽WIDTH=n:设置柱宽(单位:CELL)SPACE=n:设置柱间宽度(单位:CELL)6.2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论