




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章统计图表与SAS过程5.1统计报表与TABULATE过程5.2统计图与SAS过程5.1统计报表与TABULATE过程统计表的概念:是以表格的形式简明地反映事物间数量关系的一种重要的整理成果表达方式.构成要素:标题、横行栏目、纵行栏目和统计数字四部分。结构如表横行总标目,通常为分组标志;
其子标目是其标志值,说明每一行的内容纵行总标目,一般指统计指标;
其子标目为具体统计指标,说明每一列的内容统计表的种类:按用途分为调查表、整理表和分析表;按主词的分组分为简单表、简单分组表和复合表。简单表:主词未经任何分组简单分组表:主词按一个标志进行分组所得到的统计表复合表:主词按两个或两个以上标志进行分组所得到的统计表主要功能:可以对总体按一个标志进行简单分组汇总。可以对总体按两个或两个以上标志进行复合分组汇总。可以以比较灵活的方式对每组进行合计,还可以计算每个分组单元的百分比。TABULATE过程的功能和一般格式proc
tabulatedata=cjl.qiye;classpeopletype;varamountoutputprofit;tabletype,amountoutputprofit;tablepeople*type,amountoutputprofit;run;例5.1某市200家企业2008年产值、利润情况的整理数据资料存放在数据集cjl.qiye中,包含变量people(企业人数)、type(所有制形式)、amount(企业数)、output(产值)、profit(利润)。根据以上资料,完成以下问题:(1)按所有制形式对200家企业进行分组。(2)先对企业人数分组,再按所有制形式进一步细分。tabletype,amountoutputprofit;对所有制形式(type)进行分组求和tablepeople*type,amountoutputprofit;先对企业人数分组,再对所有制形式(type)进行分组求和TABULATE过程的一般格式:1、PROCTABULATE语句一般格式:PROCTABULATE<option-list>;TABULATE过程常用语句说明:option-list中可以选择:(1)data=data-set(2)noseps:要求表中不出现水平分隔线(3)fromat=格式名:对每个报表单元规定输出格
式,缺省以BEST12.2代替。2、CLASS语句一般格式:CLASSclass-variable-list;该语句规定报表中的分组标志在TABLE语句中出现的任一个分组标志必须事先在CLASS语句中予以定义。该语句规定报表中的分析变量(数值型)。所有在TABLE语句中出现的分析变量必须事先在该语句中定义。3、VAR语句一般格式:VARanalysis-variable-list;4、TABLE语句一般格式:TABLE<expression,><row-expression,>column-expression</option-list>;输出报表的内容、形式、结构都是通过该语句中的各表达式通过组合得到。即通过维表达式、行表达式和列表达式组合得到。(1)维表达式:TABLE语句由一至三个用逗号隔开的维表达式和选项组成。三维:最左边定义页,中间定义行,右边定义列两维:左边定义行,右边定义列一维:定义列维表达式由分类变量、分析变量、统计量等操作元素和操作符连接而成。如:tablepeople,
type,
amountoutputprofit;tabletype,
amountoutputprofit;tableamountoutputprofit;proc
tabulatedata=cjl.qiye;classpeopletype;varamountoutputprofit;tablepeople,type,amountoutputprofit;tabletype,amountoutputprofit;tableamountoutputprofit;run;(2)操作符星号(*):在维内对操作元素进行交叉连接,即复合分组。如:rigion*citisize
空格:空格对操作元素进行并排连接。圆括号():对操作元素分组或规定先后顺序如:Saletype*(quantityincome)逗号(,):当两个操作元素用“,”隔开时,表示分开表的维数。<>:规定分母的定义。交叉连接是在第一个操作元素的每一个水平内排列第二个操作元素的所有水平。如分类变量A和B,A有两个水平,B有三个水平A*B产生的报表B*A产生的报表连接操作是把第二项的所有水平放在第一项的所有水平之后。AB产生的报表A*BC产生的报表A*(BC)产生的报表(3)统计量说明:若没有规定分析变量,则N或PCTN可作为统计量使用。若规定了分析变量,但没有指定统计量,用SUM作为统计量。(4)全类变量ALL表示仅有一个值的特殊分类变量当ALL嵌入某个交叉时,ALL不考虑分类变量的水平,而用ALL来生成子集和及总和tabletypeall,amountoutputprofit;tabletype,(peopleall)*amount;(5)百分数:PCTN和PCTSUM一般格式:PCTN或PCTSUM<分母说明>分母的选取有下面三种:1)行总和百分数2)列总和百分数3)某一变量值总和百分数PCTN是频数的百分数,用于没有缺失的分析变量值的频数或者分类变量的某个交叉的频数。第一行分母为40=10+30;第二行分母为60=20+40(1)行总和百分数
如果只有列维中的分类变量出现在分母中式,分母值为每行的总和。如tablea,b*(npctn<b>);(分母为每行的总和)(2)列总和百分数如果只有行维中的分类变量出现在分母中时,分母值为每列的总和。第一列分母为30=10+20;第二列分母为70=30+40如tablea,b*(npctn<a>);(分母为每列的总和)分母为type的所有水平的output的总和,即143+186+30.6=359.6分子为type的每一水平的profit(利润)。3)某一变量Y值总和百分比PCTSUM是SUM的百分数,必须用于分析变量值的SUM。tabletype,outputprofit*(sumpctsum<type*output>);参考书P161TABULATE过程的应用举例5.2统计图与SAS过程统计图用点、线、面等图形直观地反映变量分布特征、内部结构,变量间关系及其变化状况。常见的统计图有:直方图、饼图、柱状图、盒状图、散点图、折线图、曲线图、星形图等。直方图:用来表示经统计分组后各组的频数分布状况,其条形的高度代表各组的频数或频率。饼图:用来反映事物的内部结构,必须用相对数,饼图的每个扇面代表某一部分占总体的比重。柱状图:用来表示不同总体某一指标的数量特征,一般用于不同时间、地点的某一指标之间的对比。散点图:用来考察两个变量间的关系,可以形象的反映出两个连续变量之间有无关系,是直线关系还是曲线关系。直方图饼图柱状图散点图主要功能有:GPLOT过程用来绘制变量间的散点图、折线图及曲线图。对图形可做到以下几点:绘图符号可以由用户选择;坐标轴的刻度间隔及标记可以选择;图的大小可以选择,可以控制同一页上图表的数量。散点图、折线图与GPLOT过程GPLOT过程的一般格式PROC
GPLOT<option-list>;PLOTrequest-list</option-list>;BYvariable-list;SYMBOL<option-list>;(1)PROCGPLOT语句:一般形式:PROCTGPLOT<option-list>;选项:(1)DATA=SAS-DATA-SET;(2)图形坐标轴选项:UNIFORM:对BY组使用一致的刻度。NOMISS:删去含有丢失值的观测。(3)图形大小选项:VPERCENT=percent-list|VPCT=percent-list;规定产生的图形在垂直方向占一页中的比例。如:vpct=33,VPCT=502525HPERCENT=percent-list|HPCT=percent-list;规定产生的图形在水平方向占一页中的比例。(2)BY语句BYvariable-list;(3)PLOT语句
PLOTrequest-list</options>;根据BY变量定义的观测组分别画出散点图当使用BY语句时,要求输入数据集已按BY变量排序的次序排列。可以规定任意多个plot语句;在每个plot语句中可以要求绘制任意多个图形。1)
垂直变量*水平变量:依次用A,B,C等作为作图符号。y*x;2)垂直变量*水平变量=‘字符’:规定一个字符作为作图符号。如y*x=‘+’3)垂直变量*水平变量=变量:如y*x=a;一般形式:plotrequest-list</option-list>;(1)request-list:规定作图变量以及作图字符。三种形式:dataone;setcjl.qiye;keepamountoutputprofit;run;proc
sortdata=one;byoutput;run;proc
gplotdata=one;plotamount*output;plotamount*output=‘A';plotamount*(outputprofit);run;(2)option-list:VAIXS(HAXIS)=tick-value-list<byn>;定义垂直或水平坐标轴相等间隔的刻度标记值。VREF(HREF)=value-list:要求在纵轴或横轴的一些规定的数上作水平或垂直参照线如果希望两张或多张图重叠,可以选择overlaydataone;setcjl.qiye;keepamountoutputprofit;run;proc
gplotdata=one;plotamount*output/haxis=0to50by5vaxis=0to40by4;run;proc
gplotdata=one;plotamount*output/href=15
vref=20;run;proc
gplotdata=one;plotamount*output='1'amount*profit='2'/overlay;run;(4)SYMBOL语句用来规定作图的符号、颜色、大小以及散点之间的连接方式value=symbol|v=symbol:定义数据点的符号。symbol主要有:PLUS(+),STAR(*),SQARE,……I=interpolation:定义数据点间的连接方式。interpolation主要有:join(连接),spline(用光滑曲线),rl(作回归直线),….width=value|w=value:定义连线的线宽,数字越大,线越宽。color=color|c=color:定义颜色:redgreenblueyellow….且其中CI表示连线的颜色,CV表示散点的颜色,CO表示置信带的颜色。dataone;setcjl.qiye;keepamountoutputprofit;run;proc
sortdata=one;byoutput;run;proc
gplotdata=one;plotprofit*output;symbolvalue=stari=joinci=redcv=bluewidth=3;run;procgplotdata=one;plotprofit*outputamount*output/overlay;symbol1value=stari=rlci=redcv=bluewidth=3;symbol2value=stari=splinec=greenwidth=3;run;legend1label=noneposition=(middlecenteroutside);axis1order=(0to50by5)offset=(0,0)label=(j=r‘output’)major=(height=2)minor=(height=1);axis2order=(0to40by5)offset=(0,0)label=(j=l'profitandamount')major=(height=2)minor=(height=1);procgplotdata=one;plotprofit*outputamount*output/overlaylegend=legend1haxis=axis1vaxis=axis2;symbol1value=stari=rlci=redcv=bluewidth=3;symbol2value=stari=splinec=greenwidth=3;run;主要功能:可以产生条形图、饼图、柱状图,通过语句来选择,VBAR表示垂直条形图,HBAR表示水平条形图,PIE表示饼形图,BLOCK表示柱状图。每种图形所代表的意义可以不同,可通过选择统计量实现。TYPE=FREQ、PCT、CFREQ、SUM、MEAN。条形图、饼图、柱状图与GCHART过程每种图形可以进行多种形式的分组,由分组变量控制。常见的分组变量:Discrete;group;subgroup;midpoints;sumvar;GCHART的一般格式PROCGCHART<option-list>;BYvariable-list;VBAR…;HBAR…;PIE…;BLOCK…;见书P176VBAR语句、HBAR语句、PIE语句、BLOCK语句VBAR语句的一般格式:VBARvariable-list</standard-option-list><VBAR-specific-option-list>;variable-list:给定作垂直条形图的变量,通常是字符型的,若是连续型,需在选项中规定discrete明确这是做每个离散值的图形,否则系统根据需要调整图形的个数。standard-option-list有以下几类:
(1)坐标轴选项:
AXIS=tick-value-list(标志值列表)|BYn(2)MIDPOINTS=value-list:规定每个图形表示的区间中点。定义沿垂直坐标轴的刻度标记值。如:VAXIS=052050100;(3)LEVELS=number:作图变量为连续变量时,规定所作条形的个数。(4)SUMVAR=variable:规定用来汇总概括数据特征的均值、频数或总和的变量。(5)TYPE=statistic:规定图形所代表的统计量的值(mean,sum,percent等)。(6)GROUP=variable:用来产生并排的一些图形。只能用在VBAR、HBAR、BLOCK语句中。(7)SUBGROUP=variable:用于产生对每个总量进行细分。变量一般为字符型变量,如是数值型的,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 陕西省汉中市汉台区2023-2024学年高三上学期1月期末考试 英语 含答案
- 如何规划部门发展图文
- 专利转让协议
- 影视制作材料招投标文件
- 展览馆绿化工程施工合同样本
- 设立分公司短期合作协议
- 市场营销策略建议管理规定
- 消防应急油罐车租赁服务合同
- 生态修复草坪施工协议
- 公园绿化建设项目合同协议书
- 如愿三声部合唱简谱
- 蒸汽云爆炸事故后果模拟分析法
- 高中物理教科版高中选修-磁场心形电磁场习题
- 国内CAR-T研发公司及进展一览CAR
- 静脉输血技术
- 《商务沟通与谈判》
- 小学数学六年级数学难题(含详细)
- 漂流项目设计书
- 《酒泉市中心城区高铁片区控制性详细规划》B-2-19地块用地调整论证报告
- 烹饪学 讲义教案
- 《韩语考级不用背单词》读书笔记思维导图PPT模板下载
评论
0/150
提交评论