




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1SAS—
统计分析系统StatisticalAnalysisSystem宁夏医科大学公共卫生学院流行病与卫生统计学系李吴萍2011.5SAS统计分析软件应用共128页,您现在浏览的是第1页!2节SAS软件简介1966年美国NorthCarolina州立大学的两位生物统计学研究生开始研制SAS系统,直至1976年成立了SAS软件研究所,正式推出了SAS软件,1985年推出微机版SAS。SAS是用于决策支持的大型集成信息系统,软件系统最早的功能限于统计分析,逐渐成为一个用来管理、分析数据和编写报告的大型集成应用软件系统,具有完备的数据访问、管理、分析、呈现及应用开发等功能,完全超出了单纯统计应用的功能。属于世界领先,使用最为广泛的统计软件之一。SAS统计分析软件应用共128页,您现在浏览的是第2页!3由于SAS系统是从大型机上的系统发展而来,在设计上也是完全针对专业用户进行设计,因此操作以SAS语言编程为主,另外也有非编程方式的菜单系统,但人机对话的界面不太友好。学习SAS软件时,需要用户有基本的统计学知识,对所选用的统计方法有较清楚的了解,没有统计学基础知识要掌握SAS软件较为困难。SAS统计分析软件应用共128页,您现在浏览的是第3页!4SAS/STAT提供了当今流行的主要统计分析方法,是国际上统计分析领域的标准权威软件。它具有回归分析、方差分析、属性数据分析、多元分析、聚类分析、判别分析、非参数分析、生存分析和心理测量分析等统计功能。SAS统计分析软件应用共128页,您现在浏览的是第4页!5
标题栏、菜单栏、工具栏Editor程序编辑器窗口LOG 运行过程日志窗口 Output结果输出窗口Explorer资源管理器窗口Results结果索引窗口三个窗口间切换F4Recall(调回程序)F5Editor(程序)F8Submit(发送程序)F6LOG(日志)F1Help(帮助)F7Output(结果)F9Keys(功能键列表)二、SAS的工作窗口SAS常用功能键SAS统计分析软件应用共128页,您现在浏览的是第5页!6Editor窗口主要用于打开SAS程序文件(*.sas)、编辑和修改SAS程序、并提交全部或部分SAS程序。LOG窗口 显示有关的SAS会话和提交SAS程序的信息,包括程序的出错信息等(*.log)Output窗口主要显示提交SAS程序后的运行结果(*.lst)Explorer窗口主要用于查看和管理所有SAS文件,而且可以对非SAS文件创建快捷方式。Results窗口主要用于操作和管理提交SAS程序后的输出结果。他的内容与Output窗口的内容一一对应,可以看成是Output窗口内容的名称。二、SAS的工作窗口SAS统计分析软件应用共128页,您现在浏览的是第6页!7第三节SAS语言的语句和程序一、SAS语句
(3)注释语句可以用*开始,或者用/*…*/表示中间内容是注释语句。例1.1Datasas1_1;/*sas1_1是数据集名*/Inputidname$heightweight@@;Bmi=weight/height**2;Cards;/*数据流开始*/1judy1.56452lucy1.67533lili1.5850;/*数据流结束*/Procprintdata=sas1_1;Run;SAS统计分析软件应用共128页,您现在浏览的是第7页!8第三节SAS语言的语句和程序一、SAS语句
3.SAS运算符包括比较运算、算术运算、逻辑运算(1)算数运算符+-*/**(2)比较运算符=^=>>=<<=(3)逻辑运算符and/&逻辑与x>2andy>3or/|逻辑或x>2ory>3Not/^逻辑非<>最大3<>5;结果为5><最小3><5;结果为3||连接A=‘mynameis’;B=‘SAS’;C=A||B;
那么C=“mynameisSAS”SAS统计分析软件应用共128页,您现在浏览的是第8页!9第三节SAS语言的语句和程序正态分布分位数函数:probit(p)0≤p≤1
如:y=probit(0.025),结果为-1.96t分布分位数函数:TINV(p,df)F分布分位数函数:FINV(p,df1,df2)χ2分布分位数函数:CINV(p,df)其它常用函数ABS(x)-----取X的绝对值SQRT(x)-----计算X的平方根MOD(x,y)-----求x/y的余数SAS统计分析软件应用共128页,您现在浏览的是第9页!10第三节SAS语言的语句和程序datasas1_2;y1=probnorm(-1.96);/*标准正态分布密度函数*/y2=probt(0.95,100);/*t分布密度函数*/y3=probit(0.025);/*正态分布分位数函数*/x1=log10(100);/*对自变量x求以10为底的对数*/x2=exp(2);/*计算e的x次幂*/x3=CEIL(5.7);/*取≥自变量x的最小整数*/x4=ABS(-8);
/*取X的绝对值*/x5=SQRT(36);
/*计算X的平方根*/x6=MOD(10,3);
/*求x/y的余数*/x7=FLOOR(5.7);
/*取≤自变量x的最大整数*/x8=INT(5.6874);
/*取X的整数部分*/x9=ROUND(5.4874,0.001);
/*X按n的精度取舍入值*/A='mynameis';B='SAS';C=A||B;proc
printdata=sas1_2;run;SAS统计分析软件应用共128页,您现在浏览的是第10页!11第三节SAS语言的语句和程序二、SAS程序
程序的储存:(1)键入“file‘路径+文件名.扩展名”如:file‘d:\user\sas1-1.sas\’;
(2)“文件”菜单—“保存”程序的调用:(1)键入infile‘路径+文件名+扩展名’如:infile‘d:\user\sas1-1.sas\’;
(2)“文件”菜单—“打开”SAS统计分析软件应用共128页,您现在浏览的是第11页!12第二章建立SAS数据集节SAS数据集概述一、SAS数据集基本格式SAS数据集可以看做由若干行和若干列组成的表格,一个数据集等价于关系型数据库中的一个表。idnameheightweight1Judy156452Lucy167533Susan156554tony17870变量观测变量有两种类型:数值型变量字符型变量SAS统计分析软件应用共128页,您现在浏览的是第12页!13第二章建立SAS数据集二、临时SAS数据集和永久SAS数据集临时数据集只能在SAS会话过程中创建使用,一旦退出SAS,数据集就不存在了。在Explorer窗口中可以看到一个名为work的SAS数据库,主要存放SAS临时数据集。创建时可以用两水平命名方式:如work.数据集名,也可以用一水平的命名方式:如数据集名。SAS统计分析软件应用共128页,您现在浏览的是第13页!14例2_2SAS程序举例libnametj‘d:\user\’;/*创建名为tj的sas数据库*/datatj.sas2_2;/*创建永久性数据集sas2_2,保存在‘d:\user’下*/Inputidname$heightweight;bmi=weight/height**2;cards;1Judy1.56452Lucy1.6753;run;proc
printdata=tj.sas2_2;/*将保存在’d:\user’的数据集sas2_2显示输出到output窗口*/run;第二章建立SAS数据集SAS统计分析软件应用共128页,您现在浏览的是第14页!151、从数据流中读入数据在SAS程序中,用cards语句定义数据流的开始。Input语句用于从数据流中读入数据。SAS统计分析软件应用共128页,您现在浏览的是第15页!162、从外部文件中读入数据Infile语句用来指定外部文件,通常外部文件并不是SAS文件。用input语句将外部文件中的数据读入SAS中建立SAS数据集。外部文件中的记录可以按一个变量一列的方式排列,也可以没用格式,不安列方式排列。SAS统计分析软件应用共128页,您现在浏览的是第16页!173、从SAS数据集中读入数据用set语句可以从已有的SAS数据集中创建新的数据集。运行set语句,SAS会从已有的SAS数据集中读入观测,包括原始数据集中的所有变量,还可以在原数据集变量基础上创建新的变量。SAS统计分析软件应用共128页,您现在浏览的是第17页!18例2.6利用程序语句建立SAS数据集Datasas2_6;Doi=1to10;/*do与end语句之间的语句被重复执行10次*/Y=rannor(2008);/*产生来自标准正态分布的随机数*/Output;End;Procprintdata=sas2_6;Run;4、利用程序语句建立SAS数据集SAS统计分析软件应用共128页,您现在浏览的是第18页!19第三节SAS数据集的修改例2.7按观测连接SAS数据集IdnameSexheightweight4Tonymale178705Tommale17065IdnameSexheightweight1Judyfemale156452Lucyfemale167533Susanfemale16555femalemale需要连接的SAS数据集一、SAS数据集的合并1、按观测连接SAS数据集SAS统计分析软件应用共128页,您现在浏览的是第19页!20第三节SAS数据集的修改例2.8一对一匹配合并SAS数据集Idheightweight115645216753316555IdnameSexAge1Judyfemale212Lucyfemale223Susanfemale19student1student2需要连接的SAS数据集语句merge可以合并两个或多个数据集中的变量,这些数据集中的观测是一一对应的。2、按变量合并SAS数据集SAS统计分析软件应用共128页,您现在浏览的是第20页!21第三节SAS数据集的修改例2.9利用程序语句建立SAS数据集Idheightweight115645216753417870517765IdnameSexAge1Judyfemale212Lucyfemale223Susanfemale19student3student4需要连接的SAS数据集如果需要合并的数据集中的观测并不是一一对应的关系,则需要用by语句指定各数据集中用于匹配观测的变量。(使用by语句之前,需要先对关键字段进行排序。SAS统计分析软件应用共128页,您现在浏览的是第21页!22第三节SAS语言的语句和程序如果只想保留数据集中的部分观测,有两种方式建立哑集。种可以用if条件语句告诉SAS需要保留符合条件的观测;另一种用if…thandelete语句告诉SAS将不符合条件的观测删除。二、建立SAS数据集的哑集1、删除观测SAS统计分析软件应用共128页,您现在浏览的是第22页!23第三节SAS语言的语句和程序例2.10程序1Datasas2_10;Setstudent;Ifsex=‘female’;Run;Procprintdata=sas2_10;Run;SAS统计分析软件应用共128页,您现在浏览的是第23页!24第三节SAS语言的语句和程序有时并不需要数据集中的所有变量,可以用drop或keep语句来删除或保留数据集中的变量,注意同一个数据步中drop和keep语句不能同时出现。2、删除变量SAS统计分析软件应用共128页,您现在浏览的是第24页!25第三节SAS语言的语句和程序例2.11程序2Datasas2_11;Setstudent;Dropheightweight;Run;Procprintdata=sas2_11;Run;SAS统计分析软件应用共128页,您现在浏览的是第25页!26第三章常用统计描述一、定量资料的统计描述1、定量资料的频数表先用MEANS过程找出最大值和最小值
MIN=7.42MAX=29.64RANGE=22.22确定组距(I=2)和组段的下限(L=7)然后建立新变量(x0),将变量X转化为该数据所在组段的下限值
赋值新的变量:x0=INT((X-L)/I)*I+L
或:x0=x-mod(x-L,I)
或:x0=I*INT(x/I)+I/2用FREQ过程作频数表:procfreq;tablesx0;Run;SAS统计分析软件应用共128页,您现在浏览的是第26页!27第三章常用统计描述PROCMEANS;CLASSSEX;
VARHEIGHTWEIGHT;RUN;CLASS
指定分组变量(可以不写)VAR
指定需要分析的变量(不写即分析全部变量)MAXDEC=n
指定计算结果保留小数位数(默认2位)可加的选项有:标准误(StdErr)、方差(Var)、总和(Sum)、平方和(USS)、离均差平方和(CSS)、全距(Range)、变异系数(CV)、偏度系数(Skewness)、峰度系数(Kurtosis)、可信区间(CLM)等还可以计算总体均数=0的t检验(T、Prt)不加任何选项时,自动输出5项结果:
N、Mean、StdDev、Minimum、MaximumSAS统计分析软件应用共128页,您现在浏览的是第27页!28第三章常用统计描述例3.2随机抽取15名学生,记录他们的性别(sex)、年龄(age)、体重(w,kg)、和身高(h,cm),求:(1)按性别分组分别计算学生们身高和体重的均数、标准差、变异系数、中位数和P50。(2)计算学生身高95%可信区间。要求结果保留小数点后3位。F1546156f1441149f1865165m1550160m1348155m1870180m1438150m1655165m1768176m1660170f1750160f1758160f1660165m1765175f1861162SAS统计分析软件应用共128页,您现在浏览的是第28页!29第三章常用统计描述例3.3对40名麻疹易感儿童接种麻疹疫苗一个月后,测得其血凝抑制抗体滴度如下,求其平均滴度。SAS统计分析软件应用共128页,您现在浏览的是第29页!30二、定性资料统计描述FREQ过程可以产生频数表和n维列联表PROCFREQ;TABLESA;RUN;TABLES指定要分析的定性变量TABLESA产生一维频数表TABLESA*B产生二维列联表(A是行B是列)TABLESA*B*C产生三维列联表(A是分层,B是行,C是列)TABLESA*(BC)产生A*B、A*C两个二维表TABLESX1-X3产生X1、X2、X3三个一维表TABLES(X1-X4)*Y产生X1*YX2*YX3*YX4*Y四个二维表第三章常用统计描述SAS统计分析软件应用共128页,您现在浏览的是第30页!31
一维频数表
CumulativeCumulativeAFrequencyPercentFrequencyPercent
频数构成比累计频数累计构成比
27830.27830.238532.916363.249536.8258100.0SAS统计分析软件应用共128页,您现在浏览的是第31页!32一、单样本的t检验第四章t检验例4-1以往新生儿出生体重平均为3000g,某医院对产妇开展孕期保健指导后,测得15名新生儿出生体重如下,问开展孕期保健指导后对新生儿体重是否有影响?280034002900275030003100460039002350350026003700380029503200SAS统计分析软件应用共128页,您现在浏览的是第32页!33一、单样本资料的t检验第四章t检验DATASAS4_1;INPUTX@@;cards;280034002900275030003100460039002350350026003700380029503200;RUN;PROCunivariatenormal;VARX;RUN;Procttesth0=3000;VARX;RUN;SAS统计分析软件应用共128页,您现在浏览的是第33页!34第四章t检验/*对频数分布资料的分析*/Datasas4_2;Inputxf@@;Cards;402472522261192252354391261481142221421342332181151291412441511431272462281491311281541451;Run;PROCunivariatenormal;VARX;Freqf;RUN;Procttesth0=30;VARX;Freqf;RUN;SAS统计分析软件应用共128页,您现在浏览的是第34页!35第四章t检验Datasas4_3;Inputx1x2@@;D=x1-x2;Cards;8786656674779595656055536362888561595455;Run;PROCunivariatenormal;VARd;RUN;Procttest;Pairedx1*x2;RUN;Procttesth0=0;VARd;RUN;SAS统计分析软件应用共128页,您现在浏览的是第35页!36两样本均数比较用TTEST过程(方式一)DATAsas4_4;INPUTX@@;IF_N_>11THENG=2;ELSEG=1;CARDS;0.841.051.201.201.391.531.671.801.872.072.110.540.640.640.750.760.811.161.201.341.351.481.561.87;PROCTTEST;CLASSG;VARX;RUN;SAS统计分析软件应用共128页,您现在浏览的是第36页!37结果:StatisticsLowerCLUpperCLLowerCLUpperCLVariableGNMeanMeanMeanStdDevStdDevStdDevStdErrX130.82951.08461.33970.30270.42210.69690.11711X111.23751.52091.80430.29470.42180.74020.12722XDiff(1-2)-0.795-0.436-0.0780.32640.4220.59730.1729T-TestsVariableMethodVariancesDFtValuePr>|t|XPooledEqual22-2.520.0193XSatterthwaiteUnequal21.4-2.520.0196EqualityofVariancesVariableMethodNumDFDenDFFValuePr>FXFoldedF12101.001.0000SAS统计分析软件应用共128页,您现在浏览的是第37页!38DATABB;INPUTN1X1S1N2X2S2;SE=SQRT(S1*S1/N1+S2*S2/N2);U=ABS(X1-X2)/SE;P1=1-PROBNORM(U);P=2*P1;U=ROUND(U,0.001);P=ROUND(P,0.00001);IFP<0.0001THENP=0.0001;CARDS;360466.0257.46255417.8029.10;RUN;procprint;varx1x2up;run;(方式三)SAS统计分析软件应用共128页,您现在浏览的是第38页!39GLM是数据分析过程中功能最丰富的一个过程她包括:简单回归(一元回归)加权回归多重回归及多元回归多项式回归方差分析偏相关分析协方差分析多元方差分析反应面模型分析重复测量方差分析第五章方差分析SAS统计分析软件应用共128页,您现在浏览的是第39页!40data
sas5_1;/*研究生二版ex4-2例题*/inputxc@@;cards;3.5312.4222.8630.8944.5913.3622.2831.064……;Procunivariatenormal;varx;classc;proc
glm;classc;modelx=c;meansc/snk;meansc/hovtest;run;第五章方差分析SAS统计分析软件应用共128页,您现在浏览的是第40页!41(二)各组例数不等的完全随机设计资料的方差分析第五章方差分析例5-2某机构研究婴儿出生体重与母亲生育年龄的关系,所得资料见表,试问婴儿出生体重是否受母亲生育年龄的影响?(设资料服从正态分布且总体方差齐性)母亲生育年龄婴儿出生体重(kg)20-3.54.03.23.32.92.53.23.325-3.23.42.92.52.83.53.330-3.12.72.92.92.82.4不同母亲生育年龄的婴儿出生体重SAS统计分析软件应用共128页,您现在浏览的是第41页!42例5-3某研究者采用随机区组设计进行实验,比较三种抗癌药物对小白鼠肉瘤抑瘤效果,先将15只染有肉瘤小白鼠按体重大小配成5个区组,每个区组内3只小白鼠随机接受三种抗癌药物(具体分配结果见例4-3),以肉瘤的重量为指标,试验结果见表4-9。问三种不同的药物的抑瘤效果有无差别?第五章方差分析二、随机区组设计资料的方差分析SAS统计分析软件应用共128页,您现在浏览的是第42页!43datasas5_3;
doa=1to3;dob=1to5;inputx@@;output;end;end;cards;0.820.730.430.410.680.650.540.340.210.430.510.230.280.310.24;proc
GLM;classab;modelx=ab;meansa/snk;meansb/snk;run;第五章方差分析二、随机区组设计资料的方差分析(方法二)SAS统计分析软件应用共128页,您现在浏览的是第43页!44datasaa5_4;inputrcz$x@@;cards;11C8712B7513E8114D7515A8416F6621B7322A8123D8724C8525F6426E7931F7332E7333B7434A7835D7336C7741A7742F6843C6944B7445E7646D7351D6452C6453F7254E7655B7056A8161E7562D7763A8264F6165C8266B61;proc
glm;classrcz;modelx=rcz;meansz/snk;run;第五章方差分析三、拉丁方设计资料的方差分析(方法一)SAS统计分析软件应用共128页,您现在浏览的是第44页!45例5-5将20只家兔随机等分4组,每组5只,进行神经损伤后的缝合试验。处理由两个因素组合而成,A因素为缝合方法,有两个水平,B因素为缝合后的时间,有两个水平。实验结果为家兔神经缝合后的轴突通过率%,见表,试比较不同缝合方法及缝合后时间对轴突通过率的影响,及有无交互作用?第五章方差分析四、析因设计资料的方差分析
外膜缝合(ai,i=1)
束膜缝合(ai,i=2)
1个月2个月1个月2个月(bi,j=1)(bi,j=2)(bi,j=1)(bi,j=2)1030105010302050407030705060506010303030SAS统计分析软件应用共128页,您现在浏览的是第45页!46datasas5_5;
doa=1to2;dob=1to2;doi=1to5inputx@@;output;end;end;end;cards;1010405010303070603010203050305050706030;proc
glm;classab;modelx=aba*b;run;第五章方差分析四、析因设计资料的方差分析(方法二)SAS统计分析软件应用共128页,您现在浏览的是第46页!47datasas5_6;inputt0-t4g@@;cards;12010811212011711181091151261231……;proc
glm;classg;modelt0-t4=g;repeatedtime5/printe;/*选项printe用于对数据进行球形检验*/run;第五章方差分析五、重复测量资料的方差分析SAS统计分析软件应用共128页,您现在浏览的是第47页!48节两独立样本资料的χ2
检验一、二分类情形——2×2列联表(四格表)例6-1某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组)降低颅内压的疗效。将200例颅内压增高症患者随机分为两组,结果见表7-1。问两组降低颅内压的总体有效率有无差别?
组别有效无效合计有效率(%)
试验组99(90.48)5(13.52)10495.20
对照组75(83.52)21(12.48)9678.13
合计1742620087.00SAS统计分析软件应用共128页,您现在浏览的是第48页!49datasas6_1;inputrcf@@;cards;119912521752221;proc
freq;weightf;tablesr*c/chisqexpected;run;SAS统计分析软件应用共128页,您现在浏览的是第49页!50例6-2某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非预防组,结果见表7-4。问两组新生儿的HBV总体感染率有无差别?
组别阳性阴性合计感染率(%)
预防注射组4182218.18
非预防组5(3)61145.45
合计9243327.27四格表确切概率法SAS统计分析软件应用共128页,您现在浏览的是第50页!51例6-3某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗核抗体进行测定,结果见表7-3。问两种方法的检测结果有无差别?第六章χ2检验二、配对四格表的χ2
检验免疫荧光法乳胶凝集法合计+-+11(a)12(b)23-2(c)33(d)35合计134558SAS统计分析软件应用共128页,您现在浏览的是第51页!52DATAb;INPUTf11f12f21f22;IFf12+f21<40THENchisq=(ABS(f12-f21)-1)**2/(f12+f21);ELSEchisq=ABS(f12-f21)**2/(f12+f21);p=1-PROBCHI(chisq,1);CARDS;1112233;PROC
PRINTdata=b;RUN;第六章χ2检验二、配对四格表的χ2
检验(方法二)SAS统计分析软件应用共128页,您现在浏览的是第52页!53datasas6_4;inputrcf@@;cards;11199127211642218311183226;proc
freq;weightf;tablesr*c/chisqexpectedexact;run;第六章χ2检验三、R×C列联表的χ2
检验指定精确概率SAS统计分析软件应用共128页,您现在浏览的是第53页!54datasas6_5;inputrcf@@;cards;11431124901390221388224102380031495325873395041137421794332;proc
freq;weightf;tablesr*c/chisq;run;SAS统计分析软件应用共128页,您现在浏览的是第54页!55data
sas7_1;inputx1x2@@;d=x1-x2;cards;60 76142 152195 24380 82242 240220 220190 20525 38198 24338 44236 19095 100;proc
univariatenormalmuo=0;vard;run;第七章基于秩次的非参数统计SAS统计分析软件应用共128页,您现在浏览的是第55页!56datasas7_2;inputxc@@;cards;2.7813.231……;proc
npar1waywilcoxon;varx;classc;run;第七章基于秩次的非参数统计二、两独立样本比较的Wilcoxon秩和检验SAS统计分析软件应用共128页,您现在浏览的是第56页!57datasas7_3;inputcgf;cards;1111281316141015421222232311244250;proc
npar1waywilcoxon;freqf;varg;classc;run;第七章基于秩次的非参数统计SAS统计分析软件应用共128页,您现在浏览的是第57页!58datasas7-4;inputxc@@;cards;32.5116.026.5335.5120.529.0340.5122.5212.5346.0129.0218.0349.0136.0224.03;proc
npar1waywilcoxon;varx;classc;run;SAS统计分析软件应用共128页,您现在浏览的是第58页!59datasas7_5;inputcgf;cards;110122139146213225235242315327333342413425433440;proc
npar1waywilcoxon;freqf;varg;classc;run;SAS统计分析软件应用共128页,您现在浏览的是第59页!60三、随机区组设计多个样本比较的FriedmanM检验第七章基于秩次的非参数统计datasas7-6;inputxab@@;/*x为分析变量,a为处理组变量,b为区组变量*/cards;8.4119.6219.83111.74111.61212.72211.83212.0429.4139.12310.4339.8439.8148.7249.93412.0448.3158.0258.6358.6458.6169.8269.63610.6468.9179.02710.63711.4477.8188.2288.53810.848;proc
freq;tablesb*a*x/*作列联表*//scores=rank/*对x进行排序*/cmh2;/*进行friedman检验*/run;频数表资料和等级资料的多个样本比较SAS统计分析软件应用共128页,您现在浏览的是第60页!61第八章线性相关与回归一、直线相关与回归例9-1
某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h)如表9-1。绘制散点图,进行相关分析,估计尿肌酐含量(Y)对其年龄(X)的回归方程。
表9-18名正常儿童的年龄(岁)与尿肌酐含量(mmol/24h)
编号12345678年龄X131196810127尿肌酐含量Y3.543.013.092.482.563.363.182.65SAS统计分析软件应用共128页,您现在浏览的是第61页!62第八章线性相关与回归例9-8某省调查了1995年到1999年当地居民18类死因的构成以及每种死因导致的潜在工作损失年数WYPLL的构成,结果见表9-3。以死因构成为X,WYPLL构成为Y,作等级相关分析。二、Spearman秩相关SAS统计分析软件应用共128页,您现在浏览的是第62页!63第八章线性相关与回归三、多重线性回归与相关例15-127名糖尿病人的血清总胆固醇、甘油三脂、空腹胰岛素、糖化血红蛋白、空腹血糖的测量值列于表15-2中,试建立血糖与其它几项指标关系的多元线性回归方程。SAS统计分析软件应用共128页,您现在浏览的是第63页!64第九章Logistic回归一、非条件Logistic例15-127名糖尿病人的血清总胆固醇、甘油三脂、空腹胰岛素、糖化血红蛋白、空腹血糖的测量值列于表15-2中,试建立血糖与其它几项指标关系的多元线性回归方程。SAS统计分析软件应用共128页,您现在浏览的是第64页!65第十章生存分析一、生存分析与非参数检验例15-127名糖尿病人的血清总胆固醇、甘油三脂、空腹胰岛素、糖化血红蛋白、空腹血糖的测量值列于表15-2中,试建立血糖与其它几项指标关系的多元线性回归方程。SAS统计分析软件应用共128页,您现在浏览的是第65页!66SAS系统是一个模块化的组合软件系统,它提供了约20多个模块,各个模块之间既相互独立又相互交融补充。本课程用得最多的是BaseSAS模块和SAS/STAT模块。BaseSAS是SAS系统的基础。它既可以单独使用,也可以与其他模块组成一个用户化的SAS系统,但是其他模块必须与之结合起来才能使用。BaseSAS主要承担着数据及用户使用环境的管理、SAS语言程序的处理,并具有基本的数据分析和报告等统计功能。SAS统计分析软件应用共128页,您现在浏览的是第66页!67第二节SAS软件的使用基础一、SAS的启动和退出
启动SAS双击桌面SAS图标开始菜单程序TheSasSystemTheSasSystemforWindowsV*.*直接双击SAS应用程序退出SAS标题栏关闭按钮菜单栏FileExitSAS统计分析软件应用共128页,您现在浏览的是第67页!68第二节SAS软件的使用基础SAS统计分析软件应用共128页,您现在浏览的是第68页!69第三节SAS语言的语句和程序一、SAS语句
一个SAS语句就是要求SAS系统执行某种操作或给SAS系统提供一些信息的命令。SAS语句通常由SAS关键字、SAS名称、运算符及特殊字符组成。规则:(1)以;结尾(2)以SAS关键字开始。如:data,proc,input,cards,model,class,if,keep,set,runSAS统计分析软件应用共128页,您现在浏览的是第69页!70第三节SAS语言的语句和程序一、SAS语句
1.SAS关键字几乎所有的SAS语句都是由SAS关键字开始的,说明SAS语句的类型。data语句,input语句,proc语句,run语句2.SAS数据集名和变量名
(1)32个字符之内,(2)个字母必须为字母或_;第二个以后可以为字母或数字。(3)字母不区分大小写。(4)不能使用空格和%¥#$等特殊字符SAS统计分析软件应用共128页,您现在浏览的是第70页!71第三节SAS语言的语句和程序一、SAS语句
4.SAS函数函数的一般形式:函数名(自变量,自变量,…)(1)SAS常用的概率和密度函数标准正态分布密度函数:probnorm(x)
如:y=probnorm(-1.96);结果为0.025t分布密度函数:probt(x,df)
如:y1=probt(0.95,100);结果为0.82780F分布密度函数:probF(x,df1,df2)χ2分布密度函数:probCHI(x,df)二项分布概率函数:probBNML(p,n,m)泊松分布概率函数:poisson(m,n)SAS统计分析软件应用共128页,您现在浏览的是第71页!72第三节SAS语言的语句和程序EXP(x)----计算e的x次幂LOG(x)-----对自变量x求以e为底的自然对数LOG10(x)-----对自变量x求以10为底的对数CEIL(x)-----取≥自变量x的最小整数。如CEIL(5.7)=6FLOOR(x)-----取≤自变量x的最大整数。如CEIL(5.7)=5INT(x)-----取X的整数部分ROUND(x,n)----X按n的精度取舍入值SAS统计分析软件应用共128页,您现在浏览的是第72页!73第三节SAS语言的语句和程序二、SAS程序
将一系列SAS语句按逻辑顺序排列起来,构成SAS程序。通常包括数据步和过程步两部分。数据步以data语句开头,以run语句结束。主要作用是建立数据集。过程步以proc开头,以run语句结束。主要作用是激活SAS过程对数据进行处理和分析。提交SAS程序:(1)工具栏提交图标,(2)run/submit,(3)使用F3功能键SAS统计分析软件应用共128页,您现在浏览的是第73页!74第三节SAS语言的语句和程序例1.3SAS程序举例datasas1_3;/*创建名为sas1_3的SAS数据集*/Inputidnam$heightweight;bmi=weight/height**2;cards;1Judy1.5645/*数据流中每个数据值之间最少有1各空格*/2Lucy1.6753;run;/*数据步结束*/procprintdata=sas1_3;/*显示输出sas1_3数据集到output窗口*/run;/*过程步结束*/SAS统计分析软件应用共128页,您现在浏览的是第74页!75第二章建立SAS数据集节SAS数据集概述一、SAS数据集基本格式例2_1缺失值的例子Datasas2_1;Inputidname$heightweight@@;Ifname='999'thenname=.;Ifweight=999thenweight=.;Cards;1Judy1569992Lucy167583999165554Tomy17862;Proc
printdata=sas2_1;run;SAS统计分析软件应用共128页,您现在浏览的是第75页!76二、临时SAS数据集和永久SAS数据集永久性数据集储存在硬盘里,因此,在以后的每一次SAS会话中都可以在打开。在创建和使用SAS永久性数据集之前,需要先建立一个SAS数据库来制定永久数据集存放的路径。一个SAS数据库相当于硬盘上的一个文件夹,可以将SAS数据集写入或读出。命名永久性数据集时必须用两水平的命名方式,即数据库名.数据集名,数据库名实际是一个SAS数据库的逻辑名。第二章建立SAS数据集SAS统计分析软件应用共128页,您现在浏览的是第76页!77第二章建立SAS数据集第二节SAS数据集的建立一、用数据步创建SAS数据集创建SAS数据集最主要的方式是使用BaseSAS中的数据步。一个SAS数据步由data语句开始,后面接着其他程序语句,通过从原始数据文件中读入数据或对已存在的SAS数据集进行操作来建立新的SAS数据集。在SAS程序中,用户可以使用不同的来源输入数据。常用的数据输入来源包括:(1)原始数据以数据流的方式;(2)原始数据以外部文件的方式;(3)已经存在的SAS数据集;(4)通过程序语句来建立数据集。SAS统计分析软件应用共128页,您现在浏览的是第77页!78例2.3从数据流读入数据建立数据集datasas2_3;/*创建名为sas2_3的SAS数据集*/Inputidname$heightweight@@;/*从数据流中读入数据*/cards;1Judy156452Lucy167533Susan165554tony17870;run;/*数据步结束*/procprintdata=sas2_3;/*显示输出sas2_3数据集到output窗口*/run;/*过程步结束*/SAS统计分析软件应用共128页,您现在浏览的是第78页!79例2.4从外部文件读入数据外部文本文件’k:\user\student.txt’1Judy1.56452Lucy1.67533Susan1.65554tony1.7870SAS程序:Datasas2_4;Infile‘d:\user\student.txt\’;/*指定外部文件*/Inputidname$heightweight;/*从外部文件中读取记录*/Run;Procprintdata=sas2_4;Run;SAS统计分析软件应用共128页,您现在浏览的是第79页!80例2.5从已有的SAS数据集中读入数据Datasas2_5;setsas2_4;/*从已有的数据集sas2_4中读入数据*/Bmi=weight/height**2;/*生成一个新变量*/Run;Procprintdata=sas2_5;Run;SAS统计分析软件应用共128页,您现在浏览的是第80页!81SAS中Import/Export向导可用于将其他类型的文件,如Excel、Access、dBase、文本文件等转为SAS数据集。在file菜单下点击import/export,按向导指示操作即可。二、Import/Export向导创建SAS数据集SAS统计分析软件应用共128页,您现在浏览的是第81页!82第三节SAS数据集的修改例2.7连接SAS数据集的例子Datasas2_7;Settj.femaletj.male;Run;Procprintdata=sas2_7;Run;使用set语句可以将两个或多个数据集按观测连成一个大的数据集,这也是将新变量追加已有数据集上的一种方式。SAS统计分析软件应用共128页,您现在浏览的是第82页!83第三节SAS数据集的修改例2.8按变量合并SAS数据集Datasas2_8;Mergestudent1student2;Run;Procprintdata=sas2_8;Run;SAS统计分析软件应用共128页,您现在浏览的是第83页!84第三节SAS语言的语句和程序例2.9按变量合并SAS数据集Procsortdatastudent3;byid;Procsortdatastudent4;byid;Datasas2_9;Mergestudent3student4;Run;Procprintdata=sas2_9;Run;SAS统计分析软件应用共128页,您现在浏览的是第84页!85第三节SAS语言的语句和程序例2.10删除观测的例子IdnameSexAgeheightweight1Judyfemale21156452Lucyfemale22167533Susanfemale19165554TonyMale23178705Tommale2517765studentSAS统计分析软件应用共128页,您现在浏览的是第85页!86第三节SAS语言的语句和程序例2.10程序2Datasas2_10;Setstudent;Ifsex=‘female’thendelete;Run;Procprintdata=sas2_10;Run;SAS统计分析软件应用共128页,您现在浏览的是第86页!87第三节SAS语言的语句和程序例2.11程序1Datasas2_11;Setstudent;Keepidnamesexage;Run;Procprintdata=sas2_11;Run;删除变量的例子,仅保留数据集student中的部分变量(id,name,sex,age)。可以用下面两个SAS程序。SAS统计分析软件应用共128页,您现在浏览的是第87页!88例3.1抽样调查某地120名18—35岁健康男性居民血清铁含量(μmol/L),数据如下。试编制此血清铁资料的频数分布表并描述该资料。第三章常用统计描述7.428.6523.0221.6121.3121.469.9722.7314.9420.1821.6223.0720.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.1423.7718.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.6114.2717.4022.5517.5516.1017.9820.1321.0014.5619.8919.8217.4814.8918.3719.5017.0818.1226.0211.3413.8110.2515.9415.8318.5424.5219.2626.1316.9918.8918.4620.8717.5113.1211.7517.4021.3617.1413.7712.5020.4020.3019.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.3121.7519.4715.5110.8627.8121.6516.3220.7522.1113.1717.5519.2612.6518.4819.8323.1219.2219.2216.7227.9011.7424.6614.1816.52SAS统计分析软件应用共128页,您现在浏览的是第88页!89第三章常用统计描述2、简单描述:MEANS过程输出样本含量、均数、标准差、最小值、最大值
(N、Mean、StdDev、Minimum、Maximum)3、详细描述:UNIVARIATE过程输出更多指标:样本含量、均数、标准差、最小值、最大值、方差、标准误、中位数、四分位数间距、常用百分位数、众数、平方和、离均差平方和等,可以作正态性检验另外还显示原数据中的部分极端值SAS统计分析软件应用共128页,您现在浏览的是第89页!90第三章常用统计描述Datasas3_1;Inputx@@;Gr=2;x0=gr*int(x/gr)+gr/2;/*计算组中值X0*/Cards;7.428.6523.0221.61…24.6614.1816.52;procfreqdata=sas3_1;Tablesx0/out=iron;/*out=iron表示输出变量为X0的一维频数分布表*/Procunivariatedata=sas3_1;Varx;Histogramx/midpoints=7to29by2;/*组中值的取值范围从7—29,组距为2*/Run;Procmeansdata=sas3_1;Varx;Run;SAS统计分析软件应用共128页,您现在浏览的是第90页!91Datasas3_2;Inputsex$agewh@@;Cards;f1546156f1441149f1865165m1550160m1348155m1870180m1438150m1655165m1768176m1660170f1750160f1758160f1660165m1765175f1861162;Procmeansdata=sas3_2meanstdcvmedianp50clmmaxdec=3;/*选项maxdec指小数点后保留的位数*/Varhw;Classsex;Run;SAS统计分析软件应用共128页,您现在浏览的是第91页!92Datasas3_3;/*计算几何均数*/Inputfx@@;Y=log10(x);Cards;14586162327641012842565512;Procmeansnoprint;/*选项noprint表示不打印程序运行结果*/Vary;Freqf;Outputout=bmean=my;/*选项out=b和mean=my表示把该过程步运行所得均数叫my,并放入数据集b中*/Datac;Setb;mx=10**my;Procprintdata=c;Varmx;Run;SAS统计分析软件应用共128页,您现在浏览的是第92页!93如描述以下三个定性变量(258人)A文化程度(1=文盲2=初中以下3=高中4=大学)B工作强度(1=轻2=中3=重)C月收入(1=<3002=300-3=500-4=1000-)DATASAS3_4;INPUTABC@@;CARDS;323414413……;PROCFREQ;TABLESABC;PROCFREQ;TABLESA*B;PROCFREQ;TABLESA*B*C;PROCFREQ;TABLESA*(BC);RUN;SAS统计分析软件应用共128页,您现在浏览的是第93页!94
二维频数表
A=4Frequency|Percent|CRowPct|ColPct|1|2|3|4|Total---------+--------+---------+---------+--------+--------+1|0|6|37|26|69B|0.00|6.32|38.95|27.37|72.63|0.00|8.70|53.62|37.68||.|75.00|67.27|81.25|---------+--------+---------+---------+--------+--------+
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 庆祝中国共产党成立104周年
- 某年度驱油用超高分子量聚丙烯酰胺竞争策略分析报告
- 博物馆展陈空间设计行业深度调研及发展项目商业计划书
- 婚礼摄影与跟拍服务培训行业深度调研及发展项目商业计划书
- 学科教具设计竞赛行业深度调研及发展项目商业计划书
- 民族歌唱表演在线平台行业跨境出海项目商业计划书
- 智能医疗仿生器官行业跨境出海项目商业计划书
- 智能化建筑材料管理系统企业制定与实施新质生产力项目商业计划书
- 餐饮业员工排班与劳动力分析
- 高新技术园区场地无偿租用合同范本
- 个人商业计划书范文5篇
- 2025年反恐与公共安全管理职业资格考试试卷及答案
- 2025高考语文押题作文10篇
- 福建卷-2025届高考化学全真模拟卷
- 2022隧道顺光照明技术指南
- 2025年广东省广州市增城区中考一模化学试题(含答案)
- 2025高考英语作文考前背诵(应用文+读后续写)
- 河北开放大学2025年《西方行政制度》形成性考核3答案
- 人教版九年级语文中考真题汇编 《水浒传》(2022-2024)全国中考语文真题
- 2025年铁路列车员(初级)职业技能鉴定参考试题库(含答案)
- 浙江省杭州市2025届高三下学期二模试题 数学 含答案
评论
0/150
提交评论