5.SAS格式及格式化输入_第1页
5.SAS格式及格式化输入_第2页
5.SAS格式及格式化输入_第3页
5.SAS格式及格式化输入_第4页
5.SAS格式及格式化输入_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Slide 1SAS格式与格式化输入格式与格式化输入Slide 2SAS的输入输出格式的输入输出格式 SAS的变量包含数值型和字符型变量。 SAS系统对数值型、字符型和日期时间数据提供了许多输入、输出格式。 用户可以用FORMAT过程来定义自己的格式。 什么是格式什么是格式(Format)? Format is an instruction the SAS System uses to display or write each value of a variable. SAS有输入格式和输出格式。Slide 3输入输出格式输入输出格式原始数据值原始数据值SAS变量的值变量的值格式化的格式化的

2、SAS变量值变量值Informatdollar10.Formatcomma8.548,23125JAN20041609501/25/2004InformatDate9.FormatMMDDYY10.$548,231548231Informat(输入格式)(输入格式)Format(输出格式)(输出格式)Slide 4p 输入格式输入格式 输入格式是SAS系统用来读入数据值的一个指令。 输入格式形式 INFORMAT . 选项说明: 通用规则: 所有输入格式必须包含一个点(.)作为名字的一部分; 对于省略W和D值的输入格式,使用系统缺省值。Slide 5输入格式使用方法输入格式使用方法 INPUT

3、语句; INPUT函数; INFORMAT或ATTRIB语句;Slide 6INPUT语句,最常用情况,即格式化输入语句,最常用情况,即格式化输入 格式化输入方式是INPUT语句读取非标准数据的唯一方法。即在变量名后面规定输入格式。这种输入方式不仅给出了该输入数据所对应的类型,而且给出了输入数据所在列的长度。语句格式:语句格式:INPUT variable informat. ; INPUT (variable-list) (informat-list) ; INPUT (variable-list) ( informat.); 其中:n*规定在输入列表中后面的输入格式重复n次。Slide 7

4、INPUT语句语句 例中,从第1列开始以$8. 格式读入变量name,第14列开始以yymmdd10.格式读入变量birth, 右移1列,从第25列开始以5.1读入变量height 例如,例如, datadata a; input name $11. 1414 birth yymmdd10. +1 1 height 5.15.1; cards; Wanghuacong 1995/06/09 178.5 Zuosha 1996/12/15 165.8 ; procproc printprint; runrun;Slide 8INPUT函数函数 例,字符转换数值data; x=39.8; y=in

5、put(x, 4.1); put x= y=;run;例中,INPUT函数将字符变量X的值39.8,通过输入格式 4.1 转换为一个数值39.8,赋给变量Y,因此Y为数值型变量Slide 9 例,数值转换为字符时会产生不正确结果 例中,产生的结果为255, 不正确; 除非增加输入格式的长度,如y=input(x, $15.); 此时,最常用的做法是使用put函数函数,而不是input函数data; x=2557898; y=put(x, $8.); put y;run;data; x=2557898; y=input(x, $8.); put y;run;Slide 10用用INFORMAT语

6、句或语句或ATTRIB语句语句 例, DATA步中用INFORMAT语句 datadata a; input name $11. birth height; informatinformat birth birth yymmdd10.yymmdd10. height height 5.15.1; ; cards; Wanghuacong 1995/06/09 178.5 Zuosha 1996/12/15 165.8 ; procproc printprint; runrun;Slide 11输入格式输入格式1、数值型变量输入格式、数值型变量输入格式 几个常用的格式: w.d :读入标准数值数

7、据:读入标准数值数据 COMMAw.d :用于数据中包含逗号:用于数据中包含逗号(,)的数据形式的数据形式 DOLLARw.d :用于数据前面有美元符:用于数据前面有美元符($)的数据形式的数据形式说明:w:宽度,表示数值域所含的列数。小数点占一列。 d:小数位数。d可以省略。 例如: 5.2,表示该变量的数据占5列,其中后两位是小数位。 注意:一定要弄清数据占据的列数,否则极易出错。Slide 12data a;input x comma7. y comma7.;cards;12,002 34,2312,210 21,311;run;proc print;run; OUTPUT: Obs x

8、 y 1 12002 34231 2 2210 21311例例1.有如下两列数据,数据中包有逗号,请建立一个有如下两列数据,数据中包有逗号,请建立一个SAS数据集,变量为数据集,变量为x、y。 12,002 34,231 2,210 21,311数字数字7是怎是怎么来的?么来的?Slide 13data a;input x comma7.2 y comma7.4;cards;12,002 34,2312,210 21,311;run;proc print;run; OUTPUT: Obs x y 1 120.02 3.4231 2 22.10 2.1311例例2.有如下两列数据,其中第一列后两

9、位数字为小数,第有如下两列数据,其中第一列后两位数字为小数,第二列后二列后4位为小数,例如第一个数据位为小数,例如第一个数据12,002读入后应为读入后应为120.02。请建立一个。请建立一个SAS数据集,变量为数据集,变量为x、y。 12,002 34,231 2,210 21,311Slide 14data a;input x dollar8. y dollar8.;cards;$12,002 $34,231$2,210 $21,311;run;proc print;run; OUTPUT: Obs x y 1 12002 34231 2 2210 21311例例3.有如下两列数据,数据中

10、包有有如下两列数据,数据中包有$和逗号,请建立和逗号,请建立一个一个SAS数据集,变量为数据集,变量为x、y。(例如例如$12,002读入后读入后应为应为12002 ) $12,002 $34,231 $2,210 $21,311Slide 15data a;input x dollar8.2 y dollar8.4;cards;$12,002 $34,231$2,210 $21,311;run;proc print;run; OUTPUT: Obs x y 1 120.02 3.4231 2 22.10 2.1311例例4.有如下两列数据,其中第一列后两位数字为小数,有如下两列数据,其中第一

11、列后两位数字为小数,第二列后第二列后4位为小数,例如第一个数据位为小数,例如第一个数据$12,002读入后应读入后应为为120.02。请建立一个。请建立一个SAS数据集,变量为数据集,变量为x、y。 $12,002 $34,231 $2,210 $21,311Slide 16$w. 输入格式输入格式 读入标准字符数据。在读入字符值之前,$w.输入格式清除字符值开头的空格。$w.输入格式把一个点(.)转换为空格,因为它把一个点看作缺失值。 输出结果:xyz uvw2.字符型变量输入格式字符型变量输入格式 例,读入数据时,清除数据开头空格并将(.)转换为缺失值。Data a;input name

12、$5.;cards; xyz . uvw;options nocenter;proc print noobs;run;Slide 17$CHARw. 输入格式输入格式 读含有空格的字符数据。$CHARw.输入格式除了不清除字符值开头的空作格外,它等同于标准的$w.输入格式。 例, 保留开头和结尾的空格。 data; input name $char10.; cards; xyz . uvw ; options nocenter; proc print noobs; run; INPUT语句采取自由格式输入时,INFORMAT或ATTRIB语句中不能使用$CHAR.输入格式,因为SAS把空格看作

13、数据行中数值间的分隔符。输出结果: xyz . uvwSlide 18$CHARw. :读取包含空格的连续字符:读取包含空格的连续字符 例例5.下面是一些人名,请将其读入到一个变量下面是一些人名,请将其读入到一个变量NAME中,中,注意:姓和名之间有一个空格,建立的注意:姓和名之间有一个空格,建立的SAS数据集如右数据集如右边的形式。边的形式。 Bill Clinton George Bush Tony Blair Saddam Hussein Vladimir PutinObsname1Bill Clinton2George Bush3Tony Blair4Saddam Hussein5Vl

14、adimir PutinSlide 19 data a; input name $ char14.; cards; Bill Clinton George Bush Tony Blair Saddam Hussein Vladimir Putin ; proc print; run; Obs name 1 Bill Clinton 2 George Bush 3 Tony Blair 4 Saddam Hussein 5 Vladimir Putin如果将如果将char14.去掉,语句去掉,语句改为:改为:input name $;结果是什么样的呢?结果是什么样的呢?Slide 20日期和时间

15、数据的存储日期和时间数据的存储SAS采用数值数值存储日期和时间形式的数据。在默认情况下,SAS系统以0代表1960年1月1日0时。其它日期在SAS系统中被存储为与该日期相差的天数。例如,1960年1月3日,在系统中存为2。 2004年1月25日,在系统中存为16095。注意:为了使数值型变量显示日期形式,必须使用日期型的输出格式,同样地为了以日期形式输入日期必须使用日期型的输入格式。 3、日期数据输入格式、日期数据输入格式Slide 21日期数据的读入通常需要运用日期型的格式Slide 22日期时间输出格式日期时间输出格式日期型数据的输入输出格式大部份是相同的,下面是几个常用的:日期型数据的输

16、入输出格式大部份是相同的,下面是几个常用的:Slide 23该例中日期数据的形式是什么样的?例例6.有如下的日期数据,请建立一个有如下的日期数据,请建立一个SAS数据集数据集EX6存储,存储,并以日期的形式显示出来。并以日期的形式显示出来。1Jan200203 Jan 200315/May/200412-FEB-200517*May* %20061*OCT*200730%sep%/2008DD MMM YYYY故选择DATEw.输入格式Slide 24 data b; input dd date15.; format dd date9.; cards; 1Jan2002 03 Jan 2003

17、 15/May/2004 12-FEB-2005 17*May* %2006 1*OCT*2007 30%sep%/2008 ; proc print; run;Obsdd101JAN2002203JAN2003315MAY2004412FEB2005517MAY2006601OCT2007730SEP2008Slide 25例例7.有如下的日期数据,请建立一个有如下的日期数据,请建立一个SAS数据集数据集EX7存储,存储,并以日期的形式显示出来。并以日期的形式显示出来。01312002031220035 13 20044 21 20055 25 20061/2/20073-24-2008该例

18、中日期数据的形式是什么样的?MM DD YYYY故选择MMDDYY10.输入格式Slide 2601312002031220035 13 20044 21 20055 25 20061/2/20073-24-2008data b;input dd mmddyy10.;format dd mmddyy10.;cards;01312002031220035 13 20044 21 20055 25 20061/2/20073-24-2008;proc print;run;Obsdd101/31/2002203/12/2003305/13/2004404/21/2005505/25/2006601/

19、02/2007703/24/2008Slide 27p 输出格式输出格式 选项说明: 输出格式是SAS系统用来输出数据值的一个指令。 输出格式形式 FORMAT .Slide 28通用规则: 所有输出格式必须包含一个点(.)作为名字的一部分; 省略W和D的值时,使用系统的缺省值; 无论怎样规定输出格式中的小数位,输出格式都不会影响存贮的数据值; 规定的输出格式宽度太窄小时,对字符格式截去右边的字符,对数值格式转换为BESTw.的格式; 使用一个不协调的输出格式时,SAS系统首先试着使用其它类型的类似格式。如果行不通,将输出一个错误信息在SAS日志。Slide 29输出格式类型输出格式类型 数值

20、输出格式; 字符输出格式; 日期时间输出格式; 使用FORMAT过程创建的自定义输出格式。Slide 30输出格式使用方法输出格式使用方法 DATA步中用FORMAT或ATTRIB语句; PROC步中用FORMAT或ATTRIB语句。 PUT语句; PUT函数;Slide 31FORMAT或或ATTRIB语句,最常用方式语句,最常用方式 数据步中使用数据步中使用datadata a;input x comma7. y comma7.;format x y dollar8.;cards;12,002 34,231 2,210 21,311;runrun;procproc printprint;r

21、unrun; 过程步中使用过程步中使用formatformat语句语句procproc printprint;format x comma7. y dollar8.;runrun; 过程步中使用过程步中使用attribattrib语句语句 procproc printprint; attrib x y format=comma7.; runrun;Slide 32PUT语句语句 在PUT语句中使用输出格式data; x=1145.32; put x dollar10.2; put x comma8.2; run;结果为: $1,145.321,145.32Slide 33PUT函数函数 PUT

22、函数对于将数值转换为字符,或者改变字符输出格式 datadata a; birth=1609516095; birthtext=put(birth,yymmdd10.); put birthtext= ; put birth=; runrun; LOG窗口输出结果 birthtext=2004-01-25 birth=16095Slide 34常用数值变量输出格式常用数值变量输出格式Slide 35例子例子 datadata a; a; x=x=123456789123456789; ; y=y=12300001230000; ; z=z=1234512345; ; putput x x be

23、st7.best7. / y / y best7.best7. / z / z best7.best7.; ; putput x x 8.28.2; ; putput x x 11.211.2; ; putput x x 12.212.2; ; putput y y dollar8.dollar8.; ; putput y y dollar10.dollar10.; ; runrun; ; Log窗口输出结果 -+-+-+ 1.235E8 1230000 12345 1.2346E8 123456789.0 123456789.00 $1230000 $1,230,000 可以看到SAS会根据

24、指定的输出宽度选择最合适的输出形式,以满足指定的宽度。例如,put y dollar8.; 由于数据本身有7位,因此输出时仅添加了一个$符号,而未添加千分位的逗号(,),见倒数第二输出。Slide 36p 自定义格式自定义格式 使用PROCFORMAT过程进行格式的自定义。 PROC FORMAT ; INVALUE 格式名格式名 格式格式; VALUE 格式名格式名 格式格式; 其中,其中,invalue定义输入格式,定义输入格式,value定义输出格式。定义输出格式。Slide 37p自定义输入格式,语法自定义输入格式,语法 PROCFORMAT; INVALUE 格式名格式名 定义的输入

25、格式定义的输入格式 ; RUN; 格式名格式名:应符合:应符合SAS的命名要求的命名要求(但不能超过但不能超过8个字符个字符),注意,注意最后一个字符不能是数字。最后一个字符不能是数字。定义的输入格式定义的输入格式: 原始值原始值=格式化的输入值格式化的输入值当格式化的输入值为字符时,这字符型输入格式,名字前加当格式化的输入值为字符时,这字符型输入格式,名字前加$,否则为数值型输入格式否则为数值型输入格式如,如, invalue sexinf “F”=1 “M”=2;invalue $ sexicf “F”=“Female” “M”=“Male”;Slide 38Invalue语句自定义输入格

26、式语句自定义输入格式2355 S O O S5889 2 2 2 23878 C E E E4409 0 1 1 13985 3 3 3 20740 S E E S2398 E E C C5162 C C C E4421 3 2 2 27385 C C C N例,下列数据中的字母例,下列数据中的字母O, S, E, C, N 分别赋值为分别赋值为4, 3, 2, 1, 0,使,使用输入格式读入数据,并全部转化为数值。用输入格式读入数据,并全部转化为数值。(5个变量个变量)Slide 39PROC FORMAT; INVALUE scoref O=4 S=3 E=2 C=1 N=0 ;RUN;首

27、先建立输入格式首先建立输入格式(数值型,等号右边为数值数值型,等号右边为数值)Slide 40使用自定义的格式使用自定义的格式scoref datadata a; input id x1 scoref. +1 1 x2 scoref. +1 1 x3 scoref. +1 1 x4 scoref.; cards; 2355 S O O S 5889 2 2 2 2 3878 C E E E 4409 0 1 1 1 3985 3 3 3 2 0740 S E E S 2398 E E C C 5162 C C C E 4421 3 2 2 2 7385 C C C N ; procproc p

28、rintprint; runrun;输出结果输出结果ObsObs id x1 x2 x3 x4 id x1 x2 x3 x4 1 2355 3 4 4 3 2 5889 2 2 2 2 3 3878 1 2 2 2 4 4409 0 1 1 1 5 3985 3 3 3 2 6 740 3 2 2 3 7 2398 2 2 1 1 8 5162 1 1 1 2 9 4421 3 2 2 2 10 7385 1 1 1 0Slide 41PROC FORMAT; INVALUE $ sexf M=Male F=Female;RUN;建立字符型输入格式建立字符型输入格式 data b; input

29、 sex : $sexf. age; cards; F 25 m 22 f 23 F 21 M 23 ; proc print; run; 输出结果: Obs sex age 1 Female 25 2 m 22 3 f 23 4 Female 21 5 Male 23 小写字母未正确替换!Slide 42PROC FORMAT; INVALUE $ sexf (upcase) M=Male F=Female;RUN;添加选项添加选项 upcase,重新运行,重新运行 data b; input sex : $sexf. age; cards; F 25 m 22 f 23 F 21 M 23

30、 ; proc print; run; 输出结果: Obs sex age 1 Female 25 2 Male 22 3 Female 23 4 Female 21 5 Male 23 小写字母正确替换!Slide 43p自定义输出格式,语法自定义输出格式,语法 PROCFORMAT; VALUE 自定义输出格式名字自定义输出格式名字 定义的格式定义的格式 ; RUN; 自定义输出格式名字自定义输出格式名字:应符合:应符合SAS的命名要求的命名要求(不能超过不能超过8个个字符字符),注意最后一个字符不能是数字。,注意最后一个字符不能是数字。定义的格式定义的格式: 原始值原始值=格式化的输出值

31、格式化的输出值注:注:原始值为数值型,则为数值型格式;否则为字符型格原始值为数值型,则为数值型格式;否则为字符型格式,此时格式名前需加式,此时格式名前需加$符号符号如:如:value testf 1-5=“1-5” 6-=10”; value ynf 1=“是是” 2=“否否”; value $grpf “A”=“试验组试验组” “B”=“对照组对照组”;Slide 44例例8.下面是我们班下面是我们班“问卷调查问卷调查”资料的部份数据。变量资料的部份数据。变量sex的赋值是:的赋值是:1=Male,2=Female,变量变量Band46的赋值是:的赋值是:A=增加增加, B=不变不变, C=

32、减弱减弱 ,请建立一个,请建立一个SAS数据集数据集EX8,对变量sex、Band46进行格式化。Slide 45 data qespart; input id$ sex height weight band46$; cards; cnw1r01215449C cnw1r02116964B cnw1r04116967A cnw1r05215350B cnw1r06216050A cnw2r02215646A cnw2r03117362B cnw2r04116857B cnw2r05215545B ; run; proc print; run;Obsidsexheightweightband46

33、1cnw1r01215449C2cnw1r02116964B3cnw1r04116967A4cnw1r05215350B5cnw1r06216050A6cnw2r02215646A7cnw2r03117362B8cnw2r04116857B9cnw2r05215545BSlide 46PROC FORMAT; VALUE sexfmt 1=Male 2=Female ; VALUE $bandfmt A=增加增加 B=不变不变 C=减弱减弱 ;RUN;首先建立相应的输出格式首先建立相应的输出格式上面建立了两种类型的输出格式:上面建立了两种类型的输出格式: 一种是一种是数值型数值型的,即的,即s

34、exfmt,要求,要求=号左边为数值型数值或区间,如号左边为数值型数值或区间,如上面的上面的1、2为数值;为数值; 另一种是另一种是字符型字符型的,即的,即$bandfmt,$表明该格式是字符型表明该格式是字符型,要求,要求=号号左边为字符或字符区间,如左边为字符或字符区间,如A 、 B 、 C 。Slide 47DATA qesfmt;SET qespart;FORMAT Sex sexfmt. Band46 bandfmt. ;RUN;PROC Print;RUN;Obsidsexheightweightband461cnw1r01Female15449减弱2cnw1r02Male1696

35、4不变3cnw1r04Male16967增加4cnw1r05Female15350不变5cnw1r06Female16050增加6cnw2r02Female15646增加7cnw2r03Male17362不变8cnw2r04Male16857不变9cnw2r05Female15545不变格式化后打印输出的数据格式化后打印输出的数据 对变量进行格式化Slide 48PROC FORMAT; VALUE heighfmt LOW - 150 = 150 150- 155 = 150-155 155- 160 = 155-160 160- 165 = 160-165 165- 170 = 165-1

36、70 170- 175 = 170-175 175- =180;RUN;利用格式对连续型变量的离散化分组利用格式对连续型变量的离散化分组(频数表编制频数表编制)例例9. 对对“问卷调查问卷调查”资料中的身高编制频数表,组距取资料中的身高编制频数表,组距取5CM,小,小于于150为第一组,为第一组,150-155为第二组为第二组在数据步中运用格式:在数据步中运用格式: Format height heighfmt.;加标签加标签: label height =身高身高;Slide 49Obsclassid身高身高weight134 cnw1l01175-18070.0234 cnw1l02175

37、-18070.0334 cnw1l03155-16047.0434 cnw1l04160-16548.0heightFrequencyPercentCumulativeFrequencyCumulativePercent150-1551914.181914.18155-1602216.424130.60160-1653828.367958.96165-1702014.939973.88170-1752115.6712089.55175-180107.4613097.01=18042.99134100.00打印数据集的内容打印数据集的内容(部份部份)用用FREQ过程生成的频数表过程生成的频数表S

38、lide 50 SAS system Help “索引索引” 输入输入“FORMAT procedure”Slide 51p 列表方式输入列表方式输入 简单列表方式输入简单列表方式输入INPUT variable ; 调整列表方式输入调整列表方式输入INPUT variable ;Slide 52列表方式输入使用条件输入数据值之间至少有一个空格隔开;用小数点表示表示缺失值;字符型值的默认长度为8个字节,也可以用LENGTH, ATTRIB, INFORMAT语句规定长度;数据必须是字符数据或标准的数值数据。Slide 53列表方式输入格式修饰符 :当原始数据是以空格为分隔符时,要想对变量值长度

39、不一致的变量规定统一长度就必须用到该格式修饰符。规定变量值是从非空格列中读取, 直到第一次遇到以下三种情况之一,该变量值的读取过程才结束:l 下一个空格列l 达到变量预先设定的长度l 数据行结束Slide 54例例, 空格为分隔符时,对变量值长度不一致的变量规定统一长度。data;Input Univ : $12. Plc $ Zip ;cards; MIT Boston 100023 TsinghuaUniv Beijing 100084;例中,第一个观测变量Univ的值为MIT(只读3个字符,因遇到空格而结束)第二个观测值为TsinghuaUniv(得到先前定义的变量长度12)。如果只对变

40、量Univ规定长度,而不加格式修饰符(:),在读入第一条记录时就会出错,如果不对变量Univ规定长度,读入第二条记录时就会只读入Tsinghua,而不是预先要读入的TsinghuaUniv,这是因为SAS默认的字符变量的存储长度就是8个字节。Slide 55UnivPlcZipMITBoston100023TsinghuaUnivBeijing100084加格式修饰符(:)不加格式修饰符(:)UnivPlc ZipMIT Boston 100023 .Slide 56& 读入包含空格的数据因为空格是列表读入方式默认的分隔符,所以,如果要读入的数据值本身包括空格时就必须用此格式符。注意:

41、数据项之间至少两个空格例,例, 空格为分隔符时,字符型输入值嵌有空格。data ;input name & $12. age;cards;Jiang Zhu 20Annie Zheng 31I. Altman 60;run;例中,第一个观测name 中Jiang Zhu (包含一个空格),第二个观测为Annie Zheng (包含一个空格)。分隔符为两个空格。Slide 57规定读入字符值时保留引号。此选项只在INFILE语句中与选项DSD一起使用时才有效。DSD选项的4个功能: 将默认分隔符改为逗号; 对于连续的两个分隔符,中间按缺失值处理; 将字符变量值的引号去掉; 对引号里的分隔

42、符按字符来对待。所以INFILE语句中的DSD选项自动把数据记录的分隔符设置为逗号,并且读入数据之前,把字符数据中的引号去掉,若加上“”就会保留数据中的引号。Slide 58理解DSD和“”的作用例例, 读入字符值时保留引号data topics2; infile datalines dsd; input speakers : $15. title $40. location & $10. ;datalines;Song, Credit Derivatives, Room 329Zhu, Credit Risk Management, Room 406;proc print;run;可

43、以看出,“”包含“:”选项的功能。例中,虽然title变量的长度是40,而观测值得长度都不到40,仍然可以得到正确结果。所以“”包含 “:”的功能。 Slide 59把speakers后面的“:”改成了“”也可以。例如:data topics2;infile datalines dsd;input speakers $15. title $40. location & $10.;datalines;Song, Credit Derivatives, Room 329Zhu, Credit Risk Management, Room 406;proc print;run;输出窗口信息:O

44、bs speakers title location 1 Song Credit Derivatives Room 329 2 Zhu Credit Risk Management Room 406 Slide 60但是,若把title后成的“”改成 “:”,引号就因为dsd选项的存在被去掉。如下:data topics2;infile datalines dsd;input speakers : $15. title :$40. location & $10.;datalines;Song, Credit Derivatives, Room 329Zhu, Credit Risk M

45、anagement, Room 406;proc print;run;输出窗口信息Obs speakers title location 1 Song Credit Derivatives Room 329 2 Zhu Credit Risk Management Room 406Slide 61p 列方式输入列方式输入 列输入方式是用来读入严格按列排好的标准数据INPUT 变量名变量名 开始列开始列-结束列结束列 ;条件:同一变量原始数据值在相同的列中 原始数据是标准的数值格式或一般字符格式特点:1.可以按任意顺序读入数据 2.字符型数据中间可以有空格 3.可以重复读取原始数据中的某一部份

46、4.空格和小数点都作为缺失值处理 5.忽略开始和结尾部分的空格Slide 62按列读入按列读入data a;input ques $ 1-17 age 18-20 gender$ 21-26 city $27-34 ;cards;I am here for you 23male 大 连Are you there 26female 重 庆haha male 哈尔滨yes i am here 30female ;proc print;run;Slide 63手机号码信息分解手机号码信息分解 手机号码一编码规则一般是:YYY-XXXX-ZZZZ,其YYY为号段;XXXX一般为所在地区编码;ZZZZ为对应的个人识别编号。说明: 移动:134-139、150、151、152、157、158、159、188 联通:130、131、132、155、156 电信:133、153、180、1891357851051X1508311759X1327313520X1556443719X1804346016X151

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论