复习数据步(data step)相关内容_第1页
复习数据步(data step)相关内容_第2页
复习数据步(data step)相关内容_第3页
复习数据步(data step)相关内容_第4页
复习数据步(data step)相关内容_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、复习复习数据步数据步(data step)相关内容:相关内容:1 1、主要功能、主要功能2 2、生成、生成SAS数据集的方法数据集的方法3 3、SAS数据集的要素数据集的要素4 4、基本语句、基本语句5 5、临时数据集和永久数据集的区别、临时数据集和永久数据集的区别例1:DATA CLASS1; INPUT NAME $ 1-8 AGE 10 SEX 12 HEIGHT 14-17 WEIGHT 19-23 BUST 25-28; CARDS; Lumin 3 B 0.94 13.59 50.4 caihang 3 B 0.91 14.20 50.0 limin 4 G 1.39 16.15

2、51.6 liyou 4 B 1.02 15.44 51.9 liuyin 4 B 1.06 15.30 51.0 liuyang 5 G 1.01 15.04 51.9 huye 5 G 1.02 15.07 52.7 chengbin 6 G 1.07 17.04 53.7 yangbin 6 B 1.12 18.09 54.1 liuhong 6 B 1.14 18.80 53.5 yanjin 7 G 1.16 19.93 55.5 zhangge 7 G 1.15 18.20 51.4; RUN;OBS NAME SEX S1 S2 S3 1 WANGBO M 79 78 92 2

3、HEWEI M 96 69 87 3 YANJIN F 98 87 93 4 MALIN F 88 85 90 5 HANHUI M 73 93 89 6 ZHOUBIN M 96 87 89 7 LIMIN F 87 93 90 表1 某班学生学习成绩1.将学习成绩均按良将学习成绩均按良(85)和优和优(85)分为两组,输出新的数据集分为两组,输出新的数据集;2.输出性别频数表输出性别频数表;3.判断男女生判断男女生S1的成绩是否存在差异的成绩是否存在差异;4.判断判断S1S3三组学习成绩是否存在差异三组学习成绩是否存在差异;5.确定确定S1与与S2是否有直线相关关系,若相关,相关系数是否有

4、直线相关关系,若相关,相关系数r是多少?是多少?授课内容:授课内容: 1.SAS过程步和常用统计方法过程步和常用统计方法 2.求基本统计量过程求基本统计量过程授课学时:授课学时:5个学时(理论个学时(理论3学时,实习学时,实习2学时)学时)目的:目的: 1.掌握掌握SAS过程步的通用语句和三个常用的过程步过程步的通用语句和三个常用的过程步 的格式和功能,并能够根据要求编写相应程序。的格式和功能,并能够根据要求编写相应程序。 2.正确应用正确应用means过程,过程,univariate过程和过程和freq过程过程 来计算常见的基本统计量。来计算常见的基本统计量。难点:难点: 1.“过程过程”与

5、与“语句语句”的区别的区别 2.format语句与语句与format过程的区别过程的区别 3.Univariate过程的输出结果的阅读过程的输出结果的阅读第十五章第十五章 SASSAS过程步过程步(procedure step)张建端张建端2004.3.30主要内容过程步的常用语句过程步的常用语句Proc var by format freq(Class Id Output Title)三个常用过程步三个常用过程步1.Print过程过程2.Sort过程过程3.Format过程过程求基本统计量过程求基本统计量过程1.means 过程过程2.univariate 过程过程3.freq 过程过程一、

6、一、SAS过程步过程步(procedure step)以关键字以关键字PROC开始的一个或开始的一个或多个多个SAS语句语句,用于分析和处用于分析和处理数据(子程序)理数据(子程序)二、过程步的结构和格式二、过程步的结构和格式PROC 过程名过程名过程选择项过程选择项; 其它语句其它语句/语句选择项语句选择项; PROC就是程序(就是程序(procedure)的缩写,)的缩写,而程序步的名字大都是其功能相对应而程序步的名字大都是其功能相对应的单词或词组的缩写。的单词或词组的缩写。在在PROC步里,有一些最基本的信步里,有一些最基本的信息要告诉息要告诉SAS系统系统1 1、选择的过程是什么?、选

7、择的过程是什么?2 2、要分析的数据集是什么?(永久数据集,、要分析的数据集是什么?(永久数据集,临时数据集,当前数据集和非临时数据集,当前数据集和非SASSAS数据集)数据集)3 3、要处理的变量是什么?、要处理的变量是什么?4 4、是否要分组进行处理分析?、是否要分组进行处理分析?例2:Proc sort data=CLASS1; by sex; run;PROC PRINT DATA=CLASS1; VAR NAME AGE; BY SEX; RUN;三、用于三、用于SAS过程步中的常用语句过程步中的常用语句1、PROC语句语句:表示过程步的开始及调用某:表示过程步的开始及调用某一要使用

8、的过程一要使用的过程格式:格式:proc 过程名过程名选择项选择项;2、VAR语句语句:定义被分析的变量:定义被分析的变量格式:格式:var 变量表;变量表;3、BY语句语句:按指定的变量值来分组处理数:按指定的变量值来分组处理数据集据集格式:格式:by descending变量;变量;4、CLASS语句语句:在分析中定义分类变量在分析中定义分类变量格式:格式:class 变量变量;5、ID语句语句:定义一个或多个变量识别观察值:定义一个或多个变量识别观察值格式:格式:id 变量变量;6、FORMAT语句语句:用于在过程步中调用变量:用于在过程步中调用变量的格式的格式格式:格式:format

9、变量表(变量表($)格式格式.; 格式格式 可以是标准格式,也可以是定义格式可以是标准格式,也可以是定义格式三、用于三、用于SAS过程步中的常用语句过程步中的常用语句7、OUTPUT语句语句:将过程产生的结果输出到:将过程产生的结果输出到一个新的一个新的SAS数据集中。数据集中。格式:格式:output out=数据集名数据集名统计关键字统计关键字=名字名字; 8、FREQ语句语句:指定一个数值变量,它的值:指定一个数值变量,它的值表示数据集中观测值出现的频数。表示数据集中观测值出现的频数。 格式:格式:freq 变量变量;三、用于三、用于SAS过程步中的常用语句过程步中的常用语句例3:PRO

10、C PRINT DATA=CLASS1; PROC PRINT ; ID NAME AGE; RUN; 例4:PROC PRINT DATA=CLASS1; FORMAT HEIGHT 6.1; RUN;DATA CLASS2; INPUT DATE YYMMDD10. (X1-X5) (3.); CARDS; 1995-05-20 20 50 30 25 10 1996-07-03 21 40 50 20 8 1996-12-03 19 20 25 10 15 1997-01-15 18 51 42 30 20 RUN; PROC PRINT; FORMAT DATE YYMMDD10.;

11、RUN; 例5:PROC MEANS DATA=CLASS1; VAR BUST; OUTPUT OUT=NEW MEAN=MEANBUST; RUN;例6:data a;input sex $ age number ;cards;f 20 10 f 22 23m 21 19 m 22 16proc means;freq number;var age;run; 9、TITLE语句:为语句:为SAS输出规定标题行输出规定标题行 格式:格式:title 标题标题 a.上一过程步或数据步的上一过程步或数据步的RUN语句之后;语句之后;b.如果上一步无如果上一步无RUN 语句,则放在本过语句,则放在本

12、过程的程的PROC语句之后以及下一个语句之后以及下一个DATA步或步或PROC步或步或RUN语句之前。语句之前。例7: Proc print data=class1; Title “title for two procedure”; Proc means data=class1; Var weight; Run;Proc print data=class1;run; Title “title for two procedure”; Proc means data=class1; Var weight; Run; 四、几个服务过程四、几个服务过程1.Print过程过程2.Sort过程过程3.Fo

13、rmat过程过程1.PRINT过程格式:格式: PROC PRINT data=SAS数据集数据集; VAR 变量变量; WHERE 条件表达式;条件表达式; FORMAT 变量变量 变量输出格式变量输出格式;功能:将数据集输出到功能:将数据集输出到OUTPUT窗口。窗口。例8:PROC PRINT ; DATA=CLASS1; VAR NAME SEX AGE; RUN;PROC PRINT DATA=CLASS1; WHERE SEX=B; RUN;PROC PRINT DATA=CLASS3; PROC PRINT DATA=CLASS3; FORMAT DATE DATE7; RUN;

14、2.SORT过程格式格式:PROC SORT data=SAS数据集数据集 out=SAS数据集数据集; BY descending 变量变量;功能功能:将数据集按某(些)变量排序将数据集按某(些)变量排序。 例9:PROC SORT DATA=CLASS1 OUT=SORT1; BY SEX DESCENDING HEIGHT; PROC PRINT DATA=SORT1; RUN;3.FORMAT过程格式格式:PROC FORMAT; VALUE $格式名格式名原值原值1=输出值输出值1 原值原值2=输出值输出值2 ;功能:定义功能:定义SAS系统未提供的输出格式。系统未提供的输出格式。例

15、10:PROC FORMAT; VALUE $SF B=BOY G=GIRL; VALUE HF LOW-1.0=LOW 1.0-1.2=MID 1.2-HIGH=HIGH; PROC PRINT DATA=CLASS1; FORMAT SEX $ SF. HEIGHT HF.; RUN;课堂练习课堂练习1:表表1 学生基本情况表学生基本情况表班级班级学号学号姓名姓名性别性别出生日期出生日期总学分总学分120195010101王春雷王春雷男男75年年10月月20日日3.4120295012008李富强李富强男男76年年08月月03日日2.8120295010210冯见岳冯见岳男男75年年06月月18日日2.5160395060313罗海燕罗海燕女女76年年12月月06日日3.7180195030116张丽萍张丽萍女女76年年01月月08日日3.318

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论