




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、描画性统计过程Means过程Freq过程Tabulate过程univariate过程plot过程chart过程rank过程1.统计关键字名称所代表的统计量名称所代表的统计量n单元格频数pctn频数百分比,须指定相应的分母项nmiss缺失数据个数pctsum某变量(数值型)合计占指定合计值的百分比mean均数css离差平方和min最小值tderr均值的标准误max最大值cv变异系数sum合计t用来检测均值是否为零的单侧t值std标准差prt上述t值的统计显著程度range全距,即最大值与最小值之差var方差uss每一变量原始数据的平方和(未校正平方和) sumwgt加权值的总和2.Means过程
2、proc means 选项列表; by 变量表分组变量; class 变量表分组变量; freq 变量数值变量,用以表示相应记录出现的频数 weight变量数值变量,用以表示相应记录的权重系数 var 变量表待分析的数值变量; id 变量表待分析的数值变量; output ;run;means过程的普通格式 3.1. proc means 4.5.2. Output语句Output语句的选择项包括:out= sas数据集 指定输出数据集名。统计关键字 = 输出变量名字 指定新数据集中的统计项,并给这些统计项的变量命名。等号右边各变量名代表var语句中对应变量的相应统计量。例如:Proc mea
3、ns;var x1 x2;output out=stats mean=ma mb std=sa;Run;其中ma代表x1的均值,mb代表x2的均值,sa代表x1的规范差,x2的规范差不输出。6.例7-2-1 利用means过程按班级class进展单变量统计。Score1数据集中含有学生成果的永久数据集。留意by语句与class语句的不同。下面是Score1中的数据:7.*ex7-2-1; libname ep D:sasdataSASLX;PROC means data=ep.score1 maxdec=3; var t1-t3; class clas; title statistics wi
4、th a class variable;run;输出中最多显示3位小数8.*ex7-2-1; Proc sort data=ep.score1; by clas;run;PROC means maxdec=3; by clas; var t1-t3; Title statistics with by variable;run;9.运用class语句数据集不需求sort过程排序;运用by语句数据集事先要进展排序。而且两个语句使得输出格式也有些不同。请仔细领会他们的差别。10.例7-2-2略; 例7-2-3 在某一年级中,测得15名男生的身高,数据存于文件“e:sasdtfit1.txt中,求出身
5、高的平均值、规范差、变异系数和95%的置信区间。*ex7-2-3; DATA STUDENT; INFILE E:SASDTFIT1.TXT;LENGTH NAME $ 10; INPUT NUM $ NAME SEX $ H W;PROC MEANS DATA=STUDENT N MEAN STD CV LCML UCML;VAR H;RUN;11.Freq过程 进展统计分析首先应该对我们手头上的数据特征有一个比较明确的了解,比如数据的频率分布或者其他对数据的描画的统计量,这有助于我们对数据的特征,能够的分布有一个比较全面的了解,用于协助我们决议进一步的研讨方法和方向.我们将引见如何用编程和
6、INSIGHT模块进展描画性数据分析.12.例7-3-1对学生成果进展分段统计分析。Score2.txt为含学生成果的数据文件,把学生的平均成果分成A大于等于80、B大于等于60,小于80、C小于60三等,由FREQ过程产生每一分数段的学生人数和占总数的百分数。libname ep e:saslx;data b;/*读入数据*/infile e:sasdtscore2.txt;input num $ t1-t3;v=MEAN(OF t1-t3);run;PROC FORMAT ; /*产生成果等级的格式*/VALUE vfmt LOW-60=C60-80=B80-HIGH=A; run;PRO
7、C FREQ data=b; /*对成果各等级频数分析*/FORMAT v vfmt.;TABLES v; run;13.14. PROC FREQ DATA=数据集名; TABLES 变量; RUN;PROC FREQ DATA=数据集名; TABLES 变量*变量 变量*变量 . . ./ nocol norow nocum nofreq nopercent missing list out=数据集 outpct ; WETGHT 变量名; BY 变量名;RUN;普通是分类变量freq过程的普通格式 15.FREQ(频数)过程-定义输出格式的FORMAT过程proc format; (用于
8、Fitness数据集) value oxyfmt 32.5-37.5=32.5-37.7 37.5-42.5=37.5-42.5 42.5-47.5=42.5-47.547.5-52.5=47.5-52.5 52.5-57.5=52.5-57.5 57.5-62.5=57.5-62.5 ;run;当37.5直方图/条形图 0.31.32.(抽取)33.(输出)34.35. 分析员运用及变量的取值分布 用分析员运用进展频数统计并作分布图 1.选菜单栏目的 统计(Statistics)= 统计描画(Descriptive)= 频数统计(Frequency Counts)=弹出频
9、数统计窗口; 2.在弹出的频数统计窗口中选分析变量-产生频数表; 3.在频数统计窗口下方选 plots 纽; 4.在弹出菜单的条形图(Bar charts)框中点击在Horizontal前方的方框上,使之打勾; 5. OK = OK.那么显示结果. 6.击在屏幕左边的Code上显示完成分析的SAS程序.36.37.Tabulate过程proc tabulate 选项列表; by 变量称号分组变量; class 变量称号分组变量; freq 变量称号数值变量,用以表示相应记录出现的频数 weight变量称号数值变量,用以表示相应记录的权重系数 table , , var 变量称号待分析的数值变量
10、,统计量列入相应的表单元格;run;38. tabulate过程中table语句用来实现详细的表格绘制过程,其后是作为表格三个维度的分组变量,表示三个维度的变量间以逗号分隔,三个维度分别是页page、横轴side和纵轴top。三个维度不用全部指定,假设只指定一个维度如本例,SAS将其当作纵轴处置;假设指定两个,SAS将其作为横轴和纵轴处置,前面的变量为横轴,后面的变量为纵轴;假设指定三个维度,在最前的变量为页,中间的为横轴,最后的为纵轴。 39.同一维度可以是一个变量,也可以是多个变量的陈列组合,多个变量的陈列组合方式如下:1并列:变量间以空格相间隔,如 “a b的表格方式如下: a1a2a3
11、b1b2b32交叉:变量间以星号*相衔接,如“a*b的表格方式如下: a1a2a3b1b2b3b1b2b3b1b2b33混合方式:变量间以空格或星号分隔,必要时加圆括号,如“a*(b c)的表格方式如下: a1a2b1b2c1c2b1b2c1c240.另外,和变量一同在table语句中出现的还有一些表示特定统计量的SAS关键词,可以控制相应统计量在表格中的显示。Tabulate过程可以计算的统计量及其在table语句中的称号如下表。名称所代表的统计量名称所代表的统计量n单元格频数pctn频数百分比,须指定相应的分母项nmiss单元格上有遗漏数据的记录个数pctsum某变量(数值型)合计占指定合
12、计值的百分比mean均数css校正的总平方和min最小值tderr均值的标准误max最大值cv变异系数sum合计t用来检测均值是否为零的单侧t值std标准差prt上述t值的统计显著程度range全距,即最大值与最小值之差var方差uss未校正的总平方和sumwgt加权值的总和41.Summary过程Proc Summary与Proc Means有一样的功能与用法.后者缺省为print,将结果输出到OUTPUT窗;前者缺省为noprint, 不输出结果到OUTPUT窗.PROC Summary DATA=数据集名 maxdec=位数 fw=域宽 print 输出统计量名列; VAR 变量名列;
13、CLASS 变量名列; BY 变量名列; ID 变量名; OUTPUT OUT= 数据集名 记入数据集统计量名列;RUN;42. 在proc means或proc summary中,可用多个output语句,它有三种方式规定输出数据集中的统计量: statistic-keyword= 仅适用于一个统计量多个变量; statistic-keyword=name-list ; statistic-keyword(variable-list)=name-list ; 可指定仅对某些变量计算这一统计量. 缺省情形是在输出数据集中由变量 _stat_ 来注明统计量名 .43.例:设输入数据集有变量X1,
14、X5,以下给出OUTPUT语句及选项OUT=生成输出数据集包含统计量和名字: (1) output out=b1 mean= ; /* 输出数据集1中包含5个变量的均值,变量名为X1,.,X5 */(2) output out=b2 mean=m1 m2 var(x3)= ; /* 输出数据集2中包含变量X1,X2的均值,变量名为m1,m2;以及x3的方差,变量名字仍为X3 */(3)output out=b3 mean(x3 x4)=m3 m4 std(x5)=s5; /* 输出数据集3中包含变量X3和X4的均值,存放均值的变量名为m3和m4, 变量X5的规范差存放在S5中 */ 44. (
15、4) output out=b4 mean= max(x1)= sum(x3)= /autoname; /* 输出数据集4中包含: 5个变量的均值,变量名为x1_Mean,., x5_Mean; 变量X1的最大值,变量名为x1_Max; 变量X的总和,变量名为x3_Sum . */(5) 当运用Class语句时,与由OUTPUT语句生成的数据集内容有关的选项和语句:PROC的选项nway; WAYS语句和 TYPES语句. (见Bstat33.sas)45.univariate过程proc univariate 选项列表; by 变量称号分组变量; class 变量称号分组变量; freq 变
16、量称号数值变量,用以表示相应记录出现的频数 weight变量称号数值变量,用以表示相应记录的权重系数 histogram 变量称号/选项列表 output var 变量称号待分析的数值变量;run; univariate过程和以上两个过程的格式非常类似,一样的语句和选项其含义也一样,所不同的是某些统计量只能在univariate过程中计算如众数,以及univariate过程中所具有的绘图功能。histogram语句即用来指示SAS对其后所指定的变量绘制直方图,其后的选项用来指示SAS添加不同类型的拟合图形如正态分布的分布密度曲线。 46.UNIVARIATE过程除了可以完成与MEANS过程一样
17、的根本统计量外,还可以计算变量的极端值、分位数,生成频率表,并支持对数据进展正态性检验。UNIVARIATE与MEANS过程不同的功能包括:描画变量极端值的情况。计算分位数,如中位数,1/4和3/4分位数。生成假设干个描画变量分布的图。生成频率表。对数据进展正态性检验。47.48.RPOC UNIVARIATE DATA=数据集名 noprint mu0=值 plot normal; VAR 变量名列; BY 变量名列; ID 变量名; OUTPUT OUT= 数据集名 关键名= 变量名 . . . . . . PCTLPTS=p1,p2,. PCTLPRE=前缀词; .RUN;用户另指定要求
18、计算的p1%,p2%分位数.49. proc univariate data=fitness ; var runtime oxygen ; id age; run; proc univariate data=fitness noprint ; var runtime ; output out=percents p10=op10 p90=op90 median=median q1=q1 q3=q3 pctlpts=20 80 pctlpre=p qrange=iqrange range=range ; proc print data=percents ; run;50. proc sort da
19、ta=sasuser.fitness out=sorted; by group; run; proc univariate data=sorted; var weight; by group; run; proc univariate data=sasuser.fitness plot normal; var weight; run; 51. 直方图和分布的拟合检验 UNIVARIATE过程变量分布的图形描画 PROC UNIVARIATE DATA=数据集名 noprint ; VAR 变量名列 ; HISTOGRAM 变量名列 / midpoints=中点列 normal(mu=均值 si
20、gma=规范差 图象选项) exp(theta= 阈值 图象选项) lognormal(theta=阈值 图象选项) ; INSET 统计量关键名= 显示名 格式 ; QQPLOT 变量名列 / square . . . ; PROBPLOT 变量名列 / . . . ; BY 变量名列 ; ID 变量名 ; RUN ;52*. 直方图和分布的拟合检验 UNIVARITE过程例子proc univariate data=sasuser.fitness; var oxygen; id age;run;proc univariate data= sasuser.fitness; var oxyge
21、n; histogram;proc univariate data= sasuser.fitness noprint; histogram oxygen; title Histogram;run;(Bstat41.sas)53.proc univariate data= sasuser. fitness noprint; histogram oxygen / midpoints = 32 to 60 by 4 normal(L=2 color=orange w=4); inset n mean(4.1) std(4.2);run;proc univariate data= sasuser. f
22、itness noprint; histogram oxygen/midpoints = 32 to 60 by 4 normal(L=1 w=2) lognormal(L=2 w=3 theta=30) exponential(L=8 w=4 theta=30);run;quit;54.直方图和分布的拟合检验练习题1.翻开FITNESS数据集,并用菜单系统或编程方法完成以下分析计算:计算变量OXYGEN和RUNTIME的均值、方差、规范差、偏度和峰度;指定GROUP为BY变量后,分别计算三组数据的以上几个描画统计量;(2) 在OXYGEN的直方图中如何拟合一条正态分布曲线?这条正态曲线的均值
23、和方差是多少?怎样改动拟合曲线的均值和方差?55.直方图和分布的拟合检验练习题(3) 对变量OXYGEN绘制阅历分布函数曲线和QQ图,并检验该变量的分布能否为正态分布(=0.05和=0.15)?(4) 变量RUNTIME的规范差和极差是什么?这些值阐明什么?(5) 绘制分类变量GROUP(丈量程度指定为Nom)的条形图,并问属于组2的频数有多少?56.直方图和分布的拟合检验练习题. 翻开CLASS数据集,可类似完成题1中的练习.这里分类变量为SEX或AGE,数值变量为WEIGHT和HEIGHT.另要求:(1) 计算AGE的频数分布表,并要求输出按年龄由大到小的频数表;(2) 绘制AGE的条形图
24、,并要求生成程度条形图.3. 翻开SASUSER.GPA数据集,该数据集搜集了224名学生的资料,调查的变量有7个,包括: GPA中学生的平均等级; HSM高中数学平均等级;57.直方图和分布的拟合检验练习题 HSE高中英语平均等级; HSS高中科学平均等级; STAMSTA检验数学部分的得分; SATVSTA检验口语部分的得分; SEX学生的性别.试完成以下分析计算: (1) 作各变量的直方图,查看其分布情况并简答; (2) 研讨GPA分数的分布.阐明极端值情况. (3) 画出GPA的盒形图,并阐明如何解释.经过直方图、盒形图、各统计量、分布检验结果简述GPA分布的特点.58.Gplot /
25、 plot过程proc gplot 选项列表; bubble 散点图表达式 bubble2 散点图表达式 plot 散点图表达式 plot2 散点图表达式run; 从gplot过程的普通格式中我们就可看出,此过程只能绘制两种类型的图形,bubble语句指示SAS绘制泡状散点图,plot语句指示SAS绘制点状散点图。bubble2语句和plot2语句指示SAS在同一区域内bubble2和bubble在同一区域,plot2和plot在同一区域绘制第二个图形,两者的横坐标一样同一变量,纵坐标分别位于左右两侧可以是同一变量,也可以是两个不同的变量。 59.proc gchart 选项列表; 图形关键词
26、 变量称号/选项列表 run;gchart过程的普通格式 gchart过程可以运用的图形关键字及其所绘制的图形类型图形关键字绘制的图形类型图形关键字绘制的图形类型block方块图pie圆图hbar水平的条形图pie3d三维圆图hbar3d水平的三维条形图donut环形图vbar竖立的条形图star星形图vbar3d竖立的三维条形图60. 图形关键字后的变量名用以指定进展图形描画时的分组变量,可以是数值型的此时以各组的组中值为分组的标志,也可以是字符型的。其后的选项比较重要的有:1type=统计量关键字,表示以图形对变量sumvar所指定的变量的哪一种统计量进展描画,比如频数freq、均数mea
27、n、总计sum、频数百分比pctn等;2subgroup=变量名分组变量,指定要进展分组各组段内再分组的变量;3sumvar=变量名数值变量,指定要进展统计计算的变量,也就是“type=统计量关键字选项中统计量的计算所根据的变量。 61.proc gplot 选项列表; bubble 散点图表达式 bubble2 散点图表达式 plot 散点图表达式 plot2 散点图表达式run;gplot过程的普通格式 从gplot过程的普通格式中我们就可看出,此过程只能绘制两种类型的图形,bubble语句指示SAS绘制泡状散点图,plot语句指示SAS绘制点状散点图。bubble2语句和plot2语句指
28、示SAS在同一区域内bubble2和bubble在同一区域,plot2和plot在同一区域绘制第二个图形,两者的横坐标一样同一变量,纵坐标分别位于左右两侧可以是同一变量,也可以是两个不同的变量。 62.散点图表达式的普通方式为:1bubble和bubble2语句:纵坐标变量名*横坐标变量名=泡尺寸变量名变量值以泡的大小表示,三者均应为数值变量;2plot和plot2语句:纵坐标变量名*横坐标变量名,此处等号及其后的部分可以省略,此时SAS以默许的散点类型绘制散点图;假设等号后为nn为正整数,是散点类型的编号,SAS那么以指定的编号对应的散点类型绘制散点图;假设等号后为分类变量名可为字符型或数值
29、型,为数值型时作为离散型变量处置,每一个值将被当作一个类别,此变量的详细值或与每个详细值对应的图形将被作为散点用来绘制散点图。 chart过程和plot过程的普通格式及各选项运用方法分别与gchart过程和gplot过程是根本一样的,不同之处仅在于后两者中涉及到有关三维和图形元素颜色等的语句和选项在前两者中是无效的。例如vbar3d语句在chart过程中无效,bubble语句在plot过程中无效。其他的语句和选项运用方法完全一样,所以在掌握了gchart过程和gplot过程后,chart过程和plot过程他会不学自通。63.1. GCHART过程(1) 语法格式 GCHART过程用于绘制直方图
30、、饼形图扇形图、三维直方图等表示变量分布的图形。其语法格式为:PROC GCHART DATA = ; /RUN;64. GCHART过程可以运用的图形关键字及其所绘制的图形类型见表2-5。 图形关键字后的变量名用以指定进展图形描画时的分组变量,可以是数值型的此时以各组的组中值为分组的标志,也可以是字符型的。图形关键字绘制的图形类型图形关键字绘制的图形类型block方块图pie饼形图hbar水平的条形图pie3d三维饼形图hbar3d水平的三维条形图donut环形图vbar竖立的条形图star星形图vbar3d竖立的三维条形图65.选项比较重要的有: TYPE = 统计量关键字,表示以图形对变
31、量SUMVAR所指定的变量的哪一种统计量进展描画,比如频数FREQ、均数MEAN、总计SUM、频数百分比PCTN等; SUBGROUP = 变量名分组变量,指定要进展分组各组段内再分组的变量; SUMVAR = 变量名数值变量,指定要进展统计计算的变量,也就是“TYPE = 统计量关键字选项中统计量的计算所根据的变量。66.(2) 画条形图直方图 运用VBAR关键字可以画条形图。例如,画出数据集Mylib.sryzc中Income变量的条形图的代码如下:proc gchart data = mylib.sryzc; vbar Income;run; 结果如下图。67. 其中绘图用的变量用VBA
32、R语句给出,假设把VBAR改成HBAR那么条形方向变为横向。用GCHART绘制的条形图和在INSIGHT中绘制的直方图有所不同,它在横轴标的是区间的中点值,而在INSIGHT中横轴标的是区间的端点值。 可以指定分组的变量,例如在每个区段内再分段,可以用如下代码:proc gchart data = mylib.sryzc; vbar Income / subgroup = R_Id;run; 结果如下图。68. (3) 画三维条形图 运用BLOCK关键字可以画三维条形图。例如,画出数据集mylib.sryzc中Income变量的三维条形图的代码如下:proc gchart data = myl
33、ib.sryzc; block Income/ group = R_Id;run; 结果如下图。69.(4) 画饼形图 运用PIE关键字可以画饼形图,PIE3D关键字可以画三维饼形图。例如,画出数据集mylib.sryzc中Income变量的三维饼形图的代码如下:proc gchart data = mylib.sryzc; PIE3D Income;run; 结果如下图。70.2. 运用GPLOT过程绘制散点图和连线图 通常用散点图和连线图可以表示: 一个变量随另一个变量的变化; 变量之间的关系; 数据值的分布。(1) GPLOT过程的普通格式PROC GPLOT DATA = ; PLOT
34、 * = /; SYMBOLn ;RUN;常用的选项见表2-6。71.表2-6 PLOT语句的选项选项意义说明FRAM | NOFRAM在图形四周加入或不加入边框缺省为加入CFRAM = 颜色边框内的颜色缺省为白色AUTOHREF(AUTOVEREF)在水平(垂直)轴的每个主刻度处加入水平(垂直)参考线NOAXIS取消坐标轴及相关的图形元素CAXIS = 颜色设定轴的颜色CTEXT = 颜色设定与轴相关字符的颜色HAXIS = 值列举设定水平轴主刻度的值VAXIS = 值列举设定垂直轴主刻度的值72. SYMBOL语句用来控制表示点的符号和点间的连线。其中n是不同SYMBOL语句的序号,可以是
35、1-99,缺省为1。选项见表2-7。表2-7 SYMBOL语句的选项选项意义取值V = 符号表示点使用的符号plus, x, star, square, diamond, triangle, hash, y, z, paw, point, dot, circleC = 颜色表示点的符号及连线的颜色black, red, green, blue, cyan, magenta, gray, pink, orange, brown, yellowCV =颜色专指点的符号的颜色H = n指名符号的大小单位有:cell, cm, pct, pt, inPOINTLABEL在点的附近表明Y轴变量的值i =
36、 连线方式指明连线的方式none, join, spline, needleCI = 颜色专指连线的颜色L = nn为线型的序号0 空白线,1 - 实线,2 虚线 W = nn表示线的宽度73.(2) 散点图 绘制家庭总收入对家庭总支出的散点图,代码如下:proc gplot data = mylib.sryzc; plot Income*outgo;run; 结果显示了一个GRAPHICS窗口,绘出了以Income为纵轴、以Outgo为横轴的散点图见图。74. 可以在图中按第三个变量分组画出散点图如图2-48右,代码如下:proc gplot data = mylib.sryzc; plot
37、 Income*outgo = r_id; symbol1 color=black v = star; symbol2 color=blue v = dot;run;75.(3) 连线图 为了绘制连线,只需在SYMBOL语句中指定i = join。例如绘制家庭总收入对家庭编号的连线图图2-49左,代码如下:proc gplot data = mylib.sryzc; plot Income*id; symbol i=join v=star;run;76. 也可以分地域绘制家庭总收入对家庭编号的连线图图2-49右,代码如下:proc gplot data = mylib.sryzc; plot
38、Income*id=r_id; symbol1 color=black i=join v = star; symbol2 color=blue i=join v = dot;run;77.图形的调整与输出 在图形中也可以用TITLE语句和FOOTNOTE语句给图形加标题和脚注。 还可以在图形的标题、标签中运用TrueType字型的汉字,例如:goptions ftext=宋体 htitle=4 cells htext=3 cells;proc gplot data=sasuser.class; title 实验SAS图形的汉字功能; symbol i=none v=square; plot w
39、eight*height; label weight=体重 height=身高;run; 输出结果见图。其中GOPTIONS中的FTEXT选项指定图形中文本的字体。78. 为了把GRAPH绘制的图形保管为兼容的图形文件,只需在显示某一页图形输出时,选“File-Export菜单,在出现的输入文件名的窗口选择适当的文件类型,如BMP、WMF、JPEG、PS,等等。 要打印GRAPH生成的图形,只需选“File-Print。这样用Windows的打印驱动程序与SAS/GRAPH的图形驱动配合来打印。另外,SAS/GRAPH模块还提供了许多种打印机的独立的驱动程序,可以不依赖于Windows的打印驱
40、动,详细请参考有关资料或协助。79.例 下表为长沙市某大学160名正常成年女子1999年体检资料中的血清甘油三酯的丈量结果mmol/L,请对其进展统计描画。 0.910.881.410.961.481.460.911.101.261.680.680.831.771.231.041.080.621.101.330.730.521.011.711.370.511.011.111.090.961.371.200.611.170.711.160.800.731.660.961.370.951.300.761.390.941.251.601.541.341.561.540.851
41、.540.960.821.501.141.701.301.591.071.171.321.441.120.700.681.520.761.601.271.431.271.090.750.640.971.201.341.191.080.661.421.460.591.221.321.671.201.331.311.020.830.901.090.961.100.851.061.670.780.910.891.081.270.851.241.580.711.461.520.911.471.011.201.301.051.450.651.041.241
42、.301.111.650.870.820.761.300.631.140.831.241.481.150.991.491.021.170.990.611.330.790.951.051.641.400.721.0680.按要求我们来计算该目的的均数、中位数、规范差和假设干个重要的百分位数以及四分位数,并以直方图来表现此资料的分布特征。 先将数据转换成SAS数据集的格式,编程时直接援用就可以了。我们先来计算所要的描画性统计量。 计量资料的描画性统计功能通常用Summary过程、Means过程和univariate过程来实现。tabulate过程也可以实现描画性统计功能,但
43、它和以上三个过程来比就显得复杂了一些,其实tabulate过程的过人之处在于对含有较多分类变量的资料的汇总性分析,以后大家用到的时候会渐渐领会到这一点。这里我们分别以三个过程来完成对该例题的描画性统计分析 将上表中的数据以文本文件的方式录入,文件名为case2_1,存入目录“D:SAS_Teach下。81.1以means过程进展分析libname a D:SAS_Teach;data a.case2_1; infile D:SAS_Teach data2_1.txt; input x;run;proc means n mean median p1 p5 p95 p99 q1 q3 max min; var x;run;82.默许情况下,Means过程会给出频数、均数、规范差、最大值和最小值等,假设默许情况满足需求,那么Proc Means后的一切选项代表所要求计算的统计量皆可省略,否那么需一一写出,如以上程序。 83.2以summary过程进展分析libname a D:SAS_Teach;data a.case2_1; infile D:SAS_Teach data2_1.txt; input x;run;proc summary; var x; output out=temp1 mean=m median
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年Android性能优化最佳实践分享一点面试小经验-android 缩短inflate时间
- 建筑施工特种作业-建筑架子工附着式脚手架真题库-7
- 森林消防演练题目及答案
- 如皋中考语文题目及答案
- 04《运动和力的关系》-2025高中物理水平合格考备考知识清单+习题巩固
- 2023-2024学年云南省玉溪市高二下学期期末教学质量检测数学试卷(解析版)
- 2024-2025学年山西省部分地市高二上学期期末考试语文试题(解析版)
- 店面房屋租赁合同范本-房屋店面租赁合同模板-店面租赁合同范本
- 中国石油新疆油田油气储运分公司环境影响后评价报告书
- 上呼吸道感染的治疗讲课件
- 舌癌放疗护理
- PPH术后护理查房
- 三年级数学下册计算题大全(每日一练共18份)
- 09SMS202-1埋地矩形雨水管道及附属构筑物(混凝土模块砌体)
- 重庆市沙坪坝区南开中学校2023-2024学年八年级下学期期末英语试题(无答案)
- 2022-2023学年江苏省苏州市高二下学期学业质量阳光指标调研卷英语试卷
- 偏差行为、卓越一生3.0版
- 广告说服的有效实现智慧树知到期末考试答案章节答案2024年湖南师范大学
- 苏教版小学四年级下册科学期末测试卷及参考答案1套
- 体育场馆物业管理操作规范
- 2024年“才聚齐鲁成就未来”水发集团限公司社会招聘重点基础提升难、易点模拟试题(共500题)附带答案详解
评论
0/150
提交评论