SAS软件的统计系统_第1页
SAS软件的统计系统_第2页
SAS软件的统计系统_第3页
SAS软件的统计系统_第4页
SAS软件的统计系统_第5页
已阅读5页,还剩119页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SAS—统计分析系统StatisticalAnalysisSystem公共卫生学院信息数据处理教学实验室SAS软件简介1966年美国NorthCarolina大学的两位生物统计学研究生开始研制SAS系统,直至1976年成立了SAS软件研究所,正式推出了SAS软件,1985年推出微机版SAS。SAS是用于决策支持的大型集成信息系统,软件系统最早的功能限于统计分析,现在统计分析功能也仍是它的重要组成部分和核心功能。SAS现在的最新版本为9.0版,大小约为1GB。

在数据处理和统计分析领域,SAS系统被誉为国际上的标准软件系统,并在96~97年度被评选为建立数据库的首选产品,堪称统计软件界的巨无霸。经过多年的发展,SAS已经被全世界120多个国家和地区的近三万家机构所采用,直接用户超过三百万人,遍及金融、医药卫生、生产、运输、通讯、政府和教育科研等领域。由于SAS系统是从大型机上的系统发展而来,在设计上也是完全针对专业用户进行设计,因此操作以SAS语言编程为主,另外也有非编程方式的菜单系统,但人机对话的界面不太友好。学习SAS软件时,需要用户有基本的统计学知识,对所选用的统计方法有较清楚的了解,没有统计学基础知识要掌握SAS软件较为困难。第一节SAS软件的使用基础一、SAS的启动和退出

启动SAS双击桌面SAS图标开始菜单程序TheSasSystemTheSasSystemforWindowsV*.*直接双击SAS应用程序退出SAS标题栏关闭按钮菜单栏FileExit在命令框键入“Bye”或“Endsas”标题栏、菜单栏、工具栏PROGRAMEDITOR程序编辑窗口LOG 运行过程日志窗口 OUTPUT结果输出窗口SAS常用功能键

三个窗口间切换F4RECALL(调回程序)F5PGM(程序)F8SUBMIT(发送程序)F6LOG(日志)F1HELP(帮助)F7OUTPUT(结果)F9KEYS(功能键列表)二、SAS的工作窗口例:一组体检资料,包括姓名、性别、年龄、身高、体重,要求分性别计算身高、体重的均数、标准差、最大值、最小值。姓名性别年龄身高体重ZHANGLINF47156.347.1ZHAOHUAM38172.461.5WANGQANGM41169.264.5LIULIF52158.253.6SHIDONGF39160.148.0KONGYINGM29174.164.6LILINGF37152.342.2GUANFENM32166.260.2MIAOQINGM26180.374.3NIUHUAM31178.280.2TANGJIEF35169.260.8GAOJUNM24176.073.3SUNHONGF27158.349.9三、SAS程序构成DATAAA1;INPUTNAME$SEXAGEHEIGHTWEIGHT;CARDS;

ZHANGLIN247156.347.1ZHAOHUA138172.461.5WANGQANG141169.264.5LIULI252158.253.6SHIDONG239160.148.0KONGYING129174.164.6LILING237152.342.2GUANFEN132166.260.2MIAOQING126180.374.3NIUHUA131178.280.2TANGJIE235169.260.8GAOJUN224176.073.3SUNHONG227158.349.9

;PROCMEANS;CLASSSEX;VARHEIGHTWEIGHT;RUN;数据步过程步DATASTEP(数据步)以DATA语句开始将数据读入SAS系统,建立SAS数据集PROCEDURESTEP(过程步)以PROC语句开始调用各种已编好的过程处理和分析数据RUN

(结束)

整个程序的最后必须要有RUN语句结束,表示要执行以上全部任务。1.必须在PGM窗口。SAS语句书写格式自由,每个语句以“;”结束,可以在一行中写几个语句或一个语句写在几行中,不区分字母大小写。

2.运行SAS程序工具栏执行按钮功能键“F8”(Submit

)菜单栏LocalsSubmit命令框键入“Submit”命令自动激活OUTPUT窗口,出现程序运行结果四、SAS程序编写、运行、调试、保存3.调试试SAS程程序没出现结果果窗口,或或结果不理理想时。激活LOG窗口(F6)查看运行过过程及出错错信息黑色文字::源程序及及运行情况况蓝色文字::程序运行行情况说明明信息红色文字::出错信息息绿色文字::警告信息息激活PGM窗口(F5)调回SAS程序((F4)修改错误后后重新发送送4.保存存SAS程程序或其他他窗口内容容激活相应窗窗口常用工具栏栏存存盘盘按钮菜单栏FileSave(或或Saveas))命令框输入入File命令可以分别保保存程序、、运行结果果、日志5.打开开已保存的的程序、结结果等只能在PGM窗口常用工具栏栏打打开开按钮菜单栏FileOpen命令框输入入Include命命令可打开以前前保存的程程序、运行行结果、日日志等文件件及其他文文本格式的的文件。第二节SAS数数据集SAS数据据集(SASDataset)数据值被安安排在一个个矩阵式的的表格结构构中每一行数据据表示一个个观测(Observation))每一列数据据表示一个个变量(Variable)变量命名::1~8个个字符,第第1个字符符必须是字字母,后面面可以是是字母、数数字和下划划线变量类型::数值型、、字符型和和日期时间间型字符型变量量名后加““$”表示,日期型:'16OCT98'D,时间型:'9:25:30'T变量缺失值值:用“.”表示一、SAS数据集的的种类临时SAS数据集不保存,一一旦退出SAS就消消失。数据集名称称为1个单单词,如DATAAA;永久SAS数据集保存在用户户指定的文文件夹里。。数据集名称称为2个单单词,中间间用“.””分开,也也称二级名名,如DATANEW.AA;LIBNAMENEW‘‘D:\MYDATA’;DATANEW.AA;在数据集的的二级名称称NEW.AA中;第1个词NEW是库标记,,代表用户户指定的保保存SAS数据文件件的位置,,前面要用用LIBNAME语句指定它它代表的文文件夹和位位置。第2个词AA是保存的SAS数据据集的文件件名。执行这个过过程的结果果将会在D:\MYDATA文件夹夹中产生1个永久SAS数据据文件AA.SD2SD2是自自动产生的的SAS数数据文件默默认扩展名名二、创建SAS数据据集1.在PGM窗口创创建数据集集DATAAA;命名将要创创建的数据据集名INPUTX1-X4;描述数据集集中的变量量名CARDS;以下开始是是数据247156.347.1138172.461.5……;数据结束INPUTXY@@@;连连续读数数据不换行行INPUTNAME$AGE;字字符型变变量名加$$2.在VIEWTABLE窗窗口创建数数据集菜单栏GlobalsManageOpentables打开VIEWTABLE窗口口直接输入入数据保存数据::FileSave(或或Saveas)在Tables右边边框中输入入数据集名名称在Path右边框中中选默认位置置*:\sas\saswork\建建立临时数数据集用户指定位位置可以建建立永久数数据集3.用分析析员模块创创建数据集集菜单栏GlobalsAnalyzeSta-tisticalAnalysis打开Analyze(分析员)窗口直接输输入数据保存数据::FileSaveLibrary:库库标记名((代表要保保存文件的的位置置,选Work可以以建临时数数据集)TableName:数据据集文件名名Description:可可以对文件件进行描述述4.由其它它类型数据据文件转换换成SAS数据集菜单栏FileimportSAS可以以直接与下下列格式文文件互相转转换dBASE/FoxBASEFile(*.dbf)Excel4.0/5.0File(*.xls)Lotus1/3/4File(*.wk1/3/4)DelimitedFile(*.*)空空格分隔TabDelimitedFile(*.txt)制制表符分分隔CommaSeparatedVelues(*.csv)逗号分隔隔注意:VisualFoxpro的数据表((*.dbf)在VFP系系统中通过过菜单栏文文件导导出类型选dBASE、FoxBASE、Excel5.0、DelimitedFile均均可以Excel97/2000/2002的文件((*.xls)在Excel系系统中通通过菜单单栏文文件另另存存为保存类型型选Excel5.0/4.0(*.xls)或或逗号分分隔(*.csv)制表符分分隔(*.txt)均均可以以Excel文件件中要求求第1行行是变量量名另外:在写字板板、记事事簿、Word或Excel中中的数数据也可可以直接接采用复复制、粘粘贴的方方式,通通过PGM窗口口创建SAS数数据集。。通过菜单栏FileExport也可以把把SAS数据集集转换成成相应的的其它类类型数据据文件5.从从已有的的SAS数据集集中创建建新数据据集DATAA1(子子集);;SETAA(原原数据集集);(1)选择部分分变量((列)保留部分分变量:KEEPDATAA1;SETAA;;KEEPX1X2;;去掉部分分变量:DROPDATAA1;SETAA;;DROPX3X4;;赋值新的的变量Y=X3+X4;LY=LOG(Y);常用SAS函数数:LOG(x)以以e为为底的自自然对数数LOG10(x)以以10为底底的常用用对数EXP(x)以以e为底的的反对数数SQRT(x)平平方根ABS(x)绝绝对值INT(x)取取整数(不不四舍五入)MOD(x,y)取取x/y的余数SIN(x)正正弦COS(x)余余弦三三角函函数(x是弧弧度)TAN(x)正正切(2)选择部分观测测(行)建子集语句::IFDATAA1;SETAA;;IFSEX=1;;DATAA1;SETAA;;IFAGE>40;IFX1^=3(不等于)IFSEX=1ANDAGE>60IFAGE>20ANDAGE<=40IFAGE<21ORAGE>40(3)数据集连接纵向连接A1DATAAA;SETA1A2;A2要求A1和和A2中的的变量相同A1中有10行,A2中中有15行,,则AA有25行。横向合并A1A2DATAAA;MERGEA1A2;;BYNum;匹配合并时,,要求A1和A2中中必须有1个个相同的变量量,且排列顺顺序也相同,,作为标识变变量用BY语句指定定。(4)数据集转置((行列互换))PROCTRANSPOSE;;BYG;VARX1-X4;OBSX1X2X3123456789OBS_Name_Col1Col2Col3X1147X2258X3369选择项项有::OUT=新新数据据集名名(缺缺省按按DATAn自动动命名名)PREFIX=新变变量名名前缀缀(缺缺省按按Coln自自动命命名))NAME=为原原变量量名列列命名名(缺缺省自自动命命名为为_Name_)第三节节统统计描描述一、定定量资资料的的统计计描述述简单描描述::MEANS过程输出样样本含含量、、均数数、标标准差差、最最小值值、最最大值值(N、Mean、、StdDev、、Minimum、、Maximum)详细细描描述述::UNIVARIATE过程程输出出更更多多指指标标::样样本本含含量量、、均均数数、、标标准准差差、、最最小小值值、、最最大大值值、、方方差差、、标标准准误误、、中中位位数数、、四四分分位位数数间间距距、、常常用用百百分分位位数数、、众众数数、、平平方方和和、、离离均均差差平平方方和和等等,,可可以以作作正正态态性性检检验验另外外还还显显示示原原数数据据中中的的部部分分极极端端值值PROCMEANS;CLASSSEX;VARHEIGHTWEIGHT;RUN;CLASS指定定分分组组变变量量((可可以以不不写写))VAR指定定需需要要分分析析的的变变量量(不不写写即即分分析析全全部部变变量量))MAXDEC=n指定定计计算算结结果果保保留留小小数数位位数数(默默认认2位位)可加加的的选选项项有有::标标准准误误(StdErr)、、方方差差(Var)、、总总和和(Sum)、、平平方方和和(USS)、、离离均均差差平平方方和和(CSS)、、全全距距(Range)、、变变异异系系数数(CV)、、偏偏度度系系数数(Skewness)、、峰峰度度系系数数(Kurtosis)、、可可信信区区间间(CLM)等等还可可以以计计算算总总体体均均数数=0的的t检检验验(T、、Prt)不加加任任何何选选项项时时,,自自动动输输出出5项项结结果果::N、、Mean、、StdDev、、Minimum、、Maximum频数表资资料:X-f2.4-52.6-102.8-123.0-233.2-243.4-223.6-173.8-74.0-3DATAAA2;INPUTXF@@;CARDS;2.552.7102.9123.1233.3243.5223.7173.974.13;PROCMEANSNMEANSTDSTDERRCLM;VARX;FREQF;RUN;数据步中中:X是是组中中值,F是频数数过程步中中:VARX;指指定分析析变量是是XFREQF;指定定F是是频数数计算几何何均数滴度人数1:411:851:1661:3221:6471:128101:25641:5125合计40DATAAA3;INPUTXF@@;Y=LOG10(X);CARDS;41851663226471281025645125;PROCMEANS;VARY;FREQF;OUTPUTOUT=CMEAN=M;&DATAB2;SETC;G=10**M;#PROCPRINTDATA=B2;VARG;*RUN;&输出临时时数据集集C,变变量M=均数,,#新建数据据集B2,取自自C,求求反对数数G=10M*输出过程程步,输输出几何何均数GPROCSORT;BYSEX;PROCUNIVARIATE;BYSEX;VARHEIGHTWEIGHT;RUN;BY指定分组组变量((可以不不写)SORT用BY之之前必须须先按分分组变量量排序加选项NORMAL可以作正正态性检检验(W)在已知资资料不服服从正态态分布时时或对资资料的分分布类型型不确定定时可以以用UNIVARIATE过过程作探探索性分分析。UNIVARIATE过程Moments样本含量量N7频数之和和SumWgts7均数Mean53.55714ΣXSum374.9标准差StdDev10.46564方差Variance109.5295偏度系数Skewness1.246峰度系数Kurtosis1.376ΣX2USS20735.75CSS657.1771变异系数CV19.54106标准误StdMean3.955638μ=0的t检验T:Mean=013.53944Pr>|T|0.0001非0变量个个数Num^=07>0变量个个数Num>07符号检验M(Sign)3.5Pr>=|M|0.0156符号秩和检检验SgnRank14Pr>=|S|0.0156正态性检验验W:Normal0.900687Pr<W0.3488Quantiles(Def=5)P100100%Max73.3P9999%73.3P7575%Q360.8P9595%73.3M50%Med49.9P9090%73.3P2525%Q147.1P1010%42.2P00%Min42.2P55%42.2P11%42.2全距Range31.1四分位数间间距Q3-Q113.7众数Mode42.2极端值ExtremesLowestObsHighestObs最小序序号最最大序序号42.2(4)48(3)47.1(1)49.9(7)48(3)53.6(2)49.9(7)60.8(5)53.6(2)73.3(6)定量资料统统计描述———非编程程方式(分分析员模块块)(1)打打开分析员员窗口菜单栏GlobalsAnalyzeStatisticalAnalysis(2)打打开SAS数据集菜单栏FileOpenbySASname(3)作作简单统计计分析菜单栏StatisticsDescriptiveSummaryStatistics在Analysis窗口口选选入入要要分分析析的的变变量量在Classification窗口口选选入入分分组组变变量量用Statistics可以以选选更更多多的的统统计计分分析析结结果果用Variables可以以对对变变量量有有更更多多的的选选择择方方式式选OK完成成二、、定定性性资资料料统统计计描描述述FREQ过过程程可以以产产生生频频数数表表和和n维维列列联联表表PROCFREQ;;TABLESA;;RUN;;TABLES指指定定要要分分析析的的定定性性变变量量TABLESA产产生生一一维维频频数数表表TABLESA*B产产生生二二维维列列联联表表(A是是行行B是是列列)TABLESA*B*C产产生生三三维维列列联联表表(A是是分分层层,,B是是行行,,C是是列列)TABLESA*((BC))产产生生A*B、、A*C两两个二二维维表表TABLESX1-X3产产生生X1、、X2、、X3三三个个一一维维表表TABLES(X1-X4)*Y产产生生X1*YX2*YX3*YX4*Y四个个二二维维表表如描描述述以以下下三三个个定定性性变变量量((258人人))A文文化化程程度度((1=文文盲盲2=初初中中以以下下3=高高中中4=大大学学))B工工作作强强度度((1=轻轻2=中中3=重重))C月月收收入入((1=<3002=300-3=500-4=1000-)DATAAA4;INPUTABC@@;CARDS;323414413………;PROCFREQ;TABLESABC;PROCFREQ;TABLESA*B;PROCFREQ;TABLESA*B*C;PROCFREQ;TABLESA*(BC);RUN;一维频数数表CumulativeCumulativeAFrequencyPercentFrequencyPercent频数构构成比累累计频数数累累计计构成比比27830.27830.238532.916363.249536.8258100.0二维频数数表A=4Frequency|Percent|CRowPct|ColPct|1|2|3|4|Total---------+--------+---------+---------+--------+1|0|6|37|26|69B|0.00|6.32|38.95|27.37|72.63|0.00|8.70|53.62|37.68||.|75.00|67.27|81.25|---------+--------+---------+---------+--------+2|0|2|18|6|26|0.00|2.11|18.95|6.32|27.37|0.00|7.69|69.23|23.08||.|25.00|32.73|18.75|---------+--------+---------+---------+--------+Total085532950.008.4257.8933.68100.00频数构成比行构成比比列构成比比定性资料料统计描描述———非编程程方式((分析员员模块))菜单栏GlobalsAnalyzeStatisticalAnalysis菜单栏FileOpenbySASname作一维频频数表菜单栏StatisticsDescriptiveFreguencycounts把变量选选入Frequencies窗口,OK作二维频频数表菜单栏StatisticsTableAnalysis分别把变变量选入入Row、、Column、Strata窗口,OK用Tables可以选每每个格中中出现更更多的结结果三、定量量资料频频数表先用MEANS过程找找出最大大值和最最小值MIN=2.5MAX=5.71RANGE=3.21确定组距距(I=0.3)和第第一组段段的下限限(L=2.5)然后用数数据步分分组赋值新的的变量::Y=INT((X-L)/I)*I+L用FREQ过程程作频频数表表:DATAAA;SETAA5;Y=INT((X-2.5)/0.3)*0.3+2.5;PROCFREQ;TABLESY;RUN;定量资资料作作直方方图PROCGCHART;VBARX/LEVELS=11SPACE=0;RUN;GCHART过程作作图VBAR作纵向向条图图;;HBAR作横向向条图图常用选选项有有:LEVELS分组的的数目目WIDTH指定竖竖条的的宽度度,以以字符符宽度度为单单位SPACE指定竖竖条之之间的的距离离,直直方图图=0MIDPOINTS=2.65TO5.65BY0.3指指定组组中值值直方图图———非编编程方方式((分析析员模模块))菜单栏栏GlobalsAnalyzeStatisticalAnalysis菜单栏栏FileOpenbySASname菜单栏栏GraphsHistogram把变量量选入入Analysis窗口,,OK用Display可以增增加更更多的的选项项第四节节定定量量资料料假设设检验验一、样样本均均数与与总体体均数数比较较以往新新生儿儿出生生体重重平均均为3000g,某某医院院对产产妇开开展孕孕期保保健指指导后后,测测得15名名新生生儿出出生体体重如如下,,问开开展孕孕期保保健指指导后后对新新生儿儿体重重是否否有影影响??280034002900275030003100460039002350350026003700380029503200样本本均均数数与与总总体体均均数数比比较较用用MEANS过程程DATAAA6;INPUTX@@;Y=X-3000;CARDS;280034002900275030003100460039002350350026003700380029503200;PROCMEANSMEANSTDSTDERRTPRT;VARY;RUN;结果果MeanStdDevStdErrorTProb>|T|236.67586.60151.461.560.1405P>0.05,,不不拒拒绝绝H0,尚尚不不能能认认为为开开展展孕孕期期保保健健指指导导对对新新生生儿儿体体重重有有影影响响。二、、配配对对设设计计t检检验验为了了比比较较新新旧旧两两个个测测声声计计的的测测定定效效果果,,随随机机选选定定10个个场场地地,,在在每每地地同同时时用用新新旧旧两两个个测测声声计计测测量量数数据据如如下下,,问问新新旧旧两两个个测测声声计计的的测测量量结结果果是是否否不不同同??场地地12345678910旧::87657495655563886154新::86667795605362855955配对设计t检验用MEANS过程DATAAA7;INPUTX1X2@@;Y=X1-X2;CARDS;8786656674779595656055536362888561595455;PROCMEANSMEANSTDSTDERRTPRT;VARY;RUN;结果MeanStdDevStdErrorTProb>|T|0.902.280.721.250.2440P>0.05,不拒绝H0,尚不能认为为新旧两个测测声计的测定定结果有差别别。三、两样本均均数比较试比较克山病病人与健康人人的血磷值(mmol/L)是否不不同?克山病人0.841.051.201.201.391.531.671.801.872.072.11健康人0.540.640.640.750.760.811.161.201.341.351.481.561.87两样本均数比比较用TTEST过程DATAAA8;INPUTX@@;IF_N_>11THENG=1;ELSEG=0;CARDS;0.841.051.201.201.391.531.671.801.872.072.110.540.640.640.750.760.811.161.201.341.351.481.561.87;PROCTTEST;CLASSG;VARX;RUN;在TTEST过程中,,分类变变量G只能是两两分类。。条件语句句IF––THEN/ELSEIF后面是条条件的表表达式,,如果满满足条件件就执行行THEN后面操作作,否则则(不满满足条件件),就就执行ELSE后面的操操作(ELSE可选)。IFX4=0THENX4=.;IFCJ<60THENS+1;IFX4>2ANDX5=1THENY=1;ELSEY=2;_N_是SAS数据步步中自定定义的变变量,它它的值表表示观测测的序号号。IF_N_>11THENG=1;ELSEG=0;也可用G=(_N_>11);赋值分组组变量G:前11个观观测G=0,超超过11时G=1。t检验验结果(1)GNMeanStdDevStdError1111.520.42180.12722131.080.42210.1171(2)Variances方差TDFProb>|T|Unequal不齐2.523921.40.0196Equal齐2.523722.00.0193(3)ForH0:Variancesareequal,方差齐性性检验F'=1.00DF=(12,10)Prob>F'=1.00结论:P<0.05,,拒绝H0,接受H1,可以认认为两组组人群血血磷值不不同,克克山病人人血磷值值较高。。两大样本均数数比较时,如如只有均数标标准差,而无无原始数据时时,无法直接接调用SAS软件中的某某个过程进行行分析,只能能在数据步中中按照计算公公式编写程序序完成。调查健康人群群红细胞数(1012/L)资料如如下:男性360人人,均数466.02,,标准差57.46;女性255人人,均数417.80,,标准差29.10。试比较男女红红细胞数有无无差别?DATABB;INPUTN1X1S1N2X2S2;SE=SQRT(S1*S1/N1+S2*S2/N2);U=ABS(X1-X2)/SE;P1=1-PROBNORM(U);P=2*P1;U=ROUND(U,0.001);P=ROUND(P,0.00001);IFP<0.0001THENP=0.0001;FILEPRINT;PUT#2@10U=@25P=;CARDS;360466.0257.46255417.8029.10;RUN;定量资料假设设检验——非非编程方式((分析员模块块)菜单栏GlobalsAnalyzeStatisticalAnalysis菜单栏FileOpenbySASname(1)样本均均数与总体均均数比较菜单栏StatisticsHypothesisTastsOne-Samplet-testforMeans往Variable窗口选入变量量,Mean窗口输入μ,OKμ和σ己知时时可选One-Samplez-testforMeansMean窗口输入μ,StdDev窗口输入σ。(2)配对t检验菜单栏StatisticsHypothesisTastsTwo-SamplePairedt-testforMeans分别选入第一一组和第二组组变量,OK(3)两样本本均数比较t检验菜单栏StatisticsHypothesisTastsTwo-Samplet-testforMeans往Dependent窗口选入要分分析的变量往Group窗口选入分类类变量,OK四、单因素方方差分析用于完全随机机设计(成组组设计)资料料例:比较三组组人群载脂蛋蛋白测定值有有无差别?糖尿病IGT异常健康人85.796.0144.0105.2124.5117.0109.5105.1110.096.076.4109.0115.295.3103.095.3110.0123.0110.095.2127.0106.599.0121.0125.6120.0115.0100.0159.0111.0单因素方差分分析用ANOVA过程DATAAA9;INPUTX@@;IF_N_<12THENG=1;ELSEIF_N_>20THENG=3;ELSEG=2;CARDS;85.7105.2109.596.0115.295.3……;PROCMEANS;CLASSG;VARX;PROCANOVA;CLASSG;MODELX=G;MEANSG/SNK;RUN;在SNK后后面面加加HOVTEST可以以作作方方差差齐齐性性检检验验AnalysisofVarianceProcedureDependentVariable:XSourceDFSumofSquaresMeanSquareFValuePr>F变异异来来源源自自由由度度SSMSFPModel模型型22384.025505051192.012752535.850.0077Error误差275497.83616162203.62356154Total总297881.86166667R-SquareR2C.V.RootMSESy.xXMean0.30247012.9351914.26967279110.31666667SourceDFAnovaSSMeanSquareFValuePr>F变异来源源自自由度SSMSFPG组间22384.025505051192.012752535.850.0077P<0.01,,拒绝H0,接受H1,可以认认为三组组人群载载脂蛋白白不同。。Student-Newman-Keulstestforvariable:X均数间两两两比较较q检验验(SNK法))Meanswiththesameletterarenotsignificantlydifferent.相同字母母表示的的均数无无显著性性差别SNKGroupingMeanNGA122.800103B105.455111BB102.38992第三组高高于前两两组,即即健康人人的载脂脂蛋白高高于两组组病人。。单因素方方差分析析时,如如只有各各组的均均数、标标准差,,而无原原始数据据时,无无法直接接调用SAS软软件中的的某个过过程进行行分析,,只能在在数据步步中按照照计算公公式编写写程序完完成。例:研究不不同季节人人体肾上腺腺皮质3ββ-HSD活性变化化季节NMeansStd春季420.780.13夏季400.690.22秋季320.680.14冬季360.580.20DATAAA;INPUTKXX@;DOI=1TOK;INPUTNXS@@;OUTPUT;SS1+(XX-X)*(XX-X)*N;SS2+S*S*(N-1);NN+N;END;SS1=SS1/(K-1);SS2=SS2/(NN-K);F=SS1/SS2;P=1-PROBF(F,K-1,NN-K);F=ROUND(F,0.001);P=ROUND(p,0.00001);IFP<0.0001THENP=0.0001;FILEPRINT;PUT#2@10F=@25P=;CARDS;40.6867(总均均数)420.780.13400.690.22320.680.14360.580.20;RUN;五、两因素素方差分析析用于随机区区组设计(配伍组设设计)资料料例:取同品品系同体重重24只小小鼠分为8组,每组组3只小鼠鼠来自同一一窝,分别别用A、B、C三种种营养素喂喂养,问三三周后所增增体重有无无差别。区组ABC150.158.264.5247.848.562.4353.153.858.6463.564.272.5571.268.479.3641.445.738.4761.953.051.2842.239.846.2两因素方差差分析用ANOVA过程DATAAA10;DOI=1TO3;DOJ=1TO8;INPUTX@@;OUTPUT;END;END;CARDS;50.147.853.163.571.241.461.942.258.248.553.864.268.445.753.039.864.562.458.672.579.338.451.246.2;PROCMEANS;CLASSI;VARX;PROCANOVA;CLASSIJ;MODELX=IJ;RUN;AnalysisofVarianceProcedureDependentVariable:XSourceDFSumofSquaresMeanSquareFValuePr>FModel模型92521.29375280.1437511.520.0001Error误差14340.5425024.32446Total总232861.83625R-SquareC.V.RootMSEXMean0.8810068.8605144.9319838155.6625SourceDFAnovaSSMeanSquareFValuePr>FI处理间2144.917572.458752.980.0836J区组间72376.37625339.4823213.960.0001处理间P>0.05,不拒绝绝H0,尚不能认认为三种营营养素喂养养小鼠增重重有差别;;区组间P<0.01,拒绝绝H0,接受H1,可以认为为8组小鼠鼠体重增加加有差别。。循环语句在数据步的的执行中反反复地执行行某一部分分语句。DO循环变量=初值TO终值BY增值;END;增量=1时时可省略。。DATAB1;DATAB2;DOI=1TO10;DOI=1TO10BY2;S+I;S+I;OUTPUT;OUTPUT;END;END;PROCPRINT;PROCPRINT;RUN;RUN;循环语句可可以嵌套((多重循环环)如打印乘法法表:1*1=1DATABB;2*1=22*2=4DOI=1TO9;3*1=33*2=63*3=9DOJ=1TOI;4*1=44*2=84*3=124*4=16X=I*J;5*1=55*2=105*3=15………OUTPUT;6*1=66*2=126*3=18………END;7*1=77*2=147*3=21………END;8*1=88*2=168*3=24………PROCPRINT;9*1=99*2=189*3=27………RUN;单因素方差差分析的数数据也可以以用双重循循环语句编编写,在各各组样本含含量不等时时,加缺失失值“.”补满。。糖尿病IGT异常健康人85.796.0144.0105.2124.5117.0109.5105.1110.096.076.4109.0115.295.3103.095.3110.0123.0110.095.2127.0106.599.0121.0125.6120.0115.0100.0159.0111.0DATABB;DOI=1TO11;DOJ=1TO3;INPUTX@@;OUTPUT;END;END;CARDS;85.796144105.2124.5117109.5105.11109676.4109115.295.310395.311012311095.2127106.599121125.6120115100.159111..;PROCANOVA;CLASSJ;MODELX=J;RUN;六、三因素素方差分析析用于拉丁方方设计资料料例:比较动动物对不同同药物和用用药次序的的反应拉丁方设计计要求三因因素水平数数相同,因因有四种药药物A、B、C、D,故取4只动物,,反复用药药4次。动物编号用药次序1234ⅠA75B29C27D42ⅡB45D71A81C53ⅢC25A71D80B23ⅣD47C31B48A87DATAAA11;DOCX=1TO4;DODW=1TO4;INPUTYW$X@@;OUTPUT;END;END;CARDS;A75B29C27D42B45D71A81C53C25A71D80B23D47C31B48A87;PROCANOVA;CLASSCXDWYW;MODELX=CXDWYW;MEANSYW/SNK;RUN;DependentVariable:XSourceDFSumofSquaresMeanSquareFValuePr>FModel96396.5625710.72924.020.0521Error61059.8750176.6458Total157456.4375R-SquareC.V.RootMSEXMean0.85785825.4674313.2908176352.1875SourceDFAnovaSSMeanSquareFValuePr>FCX3773.1875257.72921.460.3167DW3270.6875090.22920.510.6894YW35352.687501784.229210.100.0092四种药物之间间P<0.01,拒绝H0,接受H1,可以认认为动物对四四种药物的反反应不同,A>B、C。。而动物之间间和用药次序序均无影响。。七、析因试验验设计的方差差分析可以分析各因因素之间的交交互作用。例:用新、旧旧两法分别提提取某食品中中甲、乙两种种化合物,观观察回收率有有无差别(包包括方法间、、化合物间及及方法与化合合物间交互作作用)。新法(A1)旧法(A2)甲物(B1)乙物(B2)甲物(B1)乙物(B2)52845247488844644490405244882645合计188350162208DATAAA12;DOA=1TO2;DOB=1TO2;DOI=1TO4;INPUTX@@;OUTPUT;END;END;END;CARDS;52484444848890885244402647645245;PROCANOVA;CLASSAB;MODELX=ABA*B;RUN;DependentVariable:XSourceDFSumofSquaresMeanSquareFValuePr>FModel35309.001769.6733.390.0001Error12636.0053.00Total155945.00R-SquareC.V.RootMSEXMean0.89301912.828397.2856.75SourceDFAnovaSSMeanSquareFValuePr>FA11764.001764.0033.280.0001B12704.002704.0051.020.0001A*B1841.00841.0015.870.0018不同方方法、、不同同化合合物间间均有有差别别,且且交互互作用用也有有统计计学意意义。。新法高高于旧旧法,,乙物物高于于甲物物,以以新法法+乙乙物为为最佳佳组合合。八、交交叉试试验设设计的的方差差分析析研究新新药催催醒宁宁对麻麻醉剂剂的作作用,,将6只大大鼠配配成3对,,随机机决定定每对对中1只接接受处处理的的顺序序(催催醒宁宁或生生理盐盐水)),等等动物物完全全清醒醒3天天后将将实验验组和和对照照组动动物互互换,,同法法重复复试验验一次次。结结果如如下::(Y药物物组D对照照组)动物编号123456第1次Y15D31Y17D30D25Y5第2次D27Y25D28Y14Y18D26DATAAA13;DOCX=1TO2;DODW=1TO6;INPUTYW$X@@;OUTPUT;END;END;CARDS;Y15D31Y17D30D25Y5D27Y25D28Y14Y18D26;PROCANOVA;CLASSCXDWYW;MODELX=CXDWYW;RUN;DependentVariable:XSourceDFSumofSquaresMeanSquareFValuePr>FModel7621.583388.79765.850.0535Error460.666715.1667Total11682.2500R-SquareC.V.RootMSEXMean0.91107917.905473.894421.75SourceDFAnovaSSMeanSquareFValuePr>FCX118.7518.751.240.3285DW5158.7531.752.090.2470YW1444.08444.0829.280.0057药物间P<0.01,拒拒绝H0,接接受H1,可可以认为实验验组与对照组组不同,催醒醒宁有效。方差分析———非编程方式式(分析员模模块)菜单栏GlobalsAnalyzeStatisticalAnalysis菜单栏FileOpenbySASname(1)单因素素方差分析菜单栏StatisticsANOVAOne-wayANOVA变量X选入Dependent窗口,分组G选入Independent窗口。(2)两因素素、三因素及及交叉设计的的方差分析菜单栏StatisticsANOVAFactorialANOVA变量X选入Dependent窗口,分组选选入Independent窗口。需要作均数间间两两比较时时选Means,,在ComparisonMathod窗口中选两两两比较的方法法,在MainEffacts窗口选中分组组变量,AddOKOK析因设计的方方差分析:交交互作用分析析选Model,在StandardModels窗口中选Two-way(两因素)或或Three-way(三因素)第五节定性性资料假设检检验一、样本率与与总体率比较较没有SAS过过程可以直接接调用。可以按照二项项分布或Poisson分布的概率率函数在数据据步中编程计计算。己知某药治愈愈率为60%。某医生随随机抽取10名病人试用用此药加VC同服,结果果有8人治愈愈,问加服VC是否有增增效作用?该题己知π=0.6,n=10,x=8,求n≥8的概率。可以用二项分分布函数PROBBNML(π,,n,x)DATABB;Q=PROBBNML(0.6,10,7);P=1-Q;PROCPRINT;RUN;结果:OBSQP10.832710.16729P>0.05,不拒绝H0,尚不能认为为VC有增效效作用(1)二项分分布直接概率率法(2)Poisson分分布直接概率率法国家规定饮用用水中大肠菌菌数平均不得得超过3个/L。现从某某水源地抽取取水样1L测测得大肠菌4个,问该水水源是否符合合饮用水条件件?该资料服从Poisson分布,己己知μ=3,,求X≥3的的概率。可以以用Poisson分布布函数POISSON(μ,x)求得。DATABB;Q=POISSON(3,3);P=1-Q;PROCPRINT;RUN;结果:OBSQP10.647230.35277P>0.05,不拒绝H0,尚不能认为为细菌数超标标。(3)大样样本正态近似似法—u检验验一般胃溃疡患患者中有20%会发生胃胃出血症状。。某医医院观察65岁以上溃疡疡病人304例,有96人发生胃出出血。问老年年胃溃疡患者者是否容易出出血?己知π=0.2,n=304,x=96,可以以用u检验。。DATABB;INPUTPNX;S=SQRT(P*(1-P)/N);U=ABS(X/N-P)/S;P1=1-PROBNORM(U);P=2*P1;U=ROUND(U,0.001);P=ROUND(P,0.00001);IFP<0.0001THENP=0.0001;FILEPRINT;PUT#2@10u=@25P=;CARDS;0.230496;RUN;结结果果:u=5.047P=0.0001二、样本率之之间比较—χχ2检验用两种药物治治疗十二肠溃溃疡疗效比较较药物愈合未愈合合计愈合率呋喃硝胺5486287.10甲氰咪胍44206468.75合计982812677.78DATABB;DOI=1TO2;DOJ=1TO2;INPUTF@;OUTPUT;END;END;CARDS;5484420;PROCFREQ;TABLESI*J/CHISQ;WEIGHTF;RUN;WEIGHT语句指明变变量F是是频数加选项EXACT可以对>2×2表作作Fisher确切切概率EXPECTED可以显示每每个格子的的理论值CMH可以计算队队列研究和和病例对照照研究的RR值NOROW、NOCUL、NOPERCENT不显示相应应百分数NOPRINT不显示表格格,只显示示计算的统统计量χ2检验用FREQ过程程加CHISQ选项STATISTICSFORTABLEOFIBYJStatistic统计量量DFValueProbChi-Squareχ216.1330.013LikelihoodRatioChi-Square似然比χ216.3040.012ContinuityAdj.Chi-Square校正正χ215.1180.024Mantel-HaenszelChi-SquareMHχ216.0840.014Fisher‘‘sExactTest确切切概概率率(Left)0.997(Right)0.011(2-Tail)0.018PhiCoefficient(Phi系系数数)0.221ContingencyCoefficient(列列联联系系数数)0.215Cramer‘‘sV(克克莱莱姆姆系系数数)0.221SampleSize=126由原原始始数数据据计计算算::如258人人资料料,三三个定定性变变量A文化化程度度(1=文文盲2=初初中以以下3=高高中4=大大学))B工作作强度度(1=轻轻2=中3=重重)C月收收入((1=<3002=300-3=500-4=1000-)试分析析文化化程度度与月月收入入之间间的关关系DATAAA4;INPUTABC@@;CARDS;323414413………;PROCFREQ;TABLESA*C/CHISQ;RUN;三、配配对定定性资资料的的χ2检验用甲乙乙两种种血清清学方方法检检查鼻鼻咽癌癌患者者血清清410份份。问问两法法的检检出率率有无无差别别?甲法乙法+-合计+26187348-313162合计292118410DATABB;DOI=1TO2;DOJ=1TO2;INPUTF@;OUTPUT;END;END;CARDS;261873131;PROCFREQ;TABLESI*J/AGREE;WEIGHTF;RUN;AGREE选项作定性资资料的一致性性检验,计算算χ2和Kappa统计量,Kappa<0.4不满满意,>0.75很满意意。配对四格表资资料计算McNemar‘sχχ2统计量配对R×C表表(方表)计计算Bowker对称性性检验QB统计量,QB近似服从DF=R(R-1)/2的的χ2分布。当P<0.05,拒绝H0时,结论为不不服从对称分分布。结果:McNemar'sTestStatistic=26.576DF=1Prob=0.001SimpleKappaCoefficient95%ConfidenceBoundsKappa=0.182ASE=0.0510.0830.281SampleSize=410P<0.01,拒绝H0,接受H1,可以认为甲甲、乙两法的的检出率不同同,甲法检出出率高于乙法法。Kappa值值的假设检验验:H0:Kappa=0u=Kappa/ASE=0.182/0.051=3.57P<0.01拒绝H0,接受H1,虽然可以认认为甲、乙两两法有一致性性,但一致的的程度很差。。两种方法检查查冠心病人心心室壁收缩运运动的符合情情况核素法对比法正常减弱异常正常5823减弱1427异常8917结果:TestofSymmetry(对称性检验验)Statistic=2.856DF=3Prob=0.414KappaCoefficients(一致性检验)StatisticValueASE95%ConfidenceBoundsSimpleKappa0.6810.0500.5830.779WeightedKappa0.6610.0560.5520.771SampleSize=147对称性检验:P>0.05,不拒绝绝H0,认为为该资料服从从对称分布。。一致性检验:u=Kappa/Ase=13.6,P<0.01,可可以认为两种种方法检查结结果具有一致致性,且一致致性程度比较较高。χ2检验——非编程方式((分析员模块块)菜单栏GlobalsAnalyzeStatisticalAnalysis在右面窗口内内输入3列数数据:A列输输入行变量;;B列输入列变变量代码;C列输入相应应的频数。或打开己有的的SAS数据据集菜单栏StatisticsTableAnalysis把变量A选入Row,B选入Column,C选入Cellcounts,打开Statistics窗口Chi-sqareStatistics计算χ2统计量Measuresofassociation计算行列变量量的关联性统统计量Mantel-HaenszelStatistics队列研究和病病例对照研究究RR值MeasuresofAgreement一致性检验选中所要的项项目OKOKABC115412821442220第六节秩秩和检验(1)配对对设计资料UNIVARIATE过过程可以作符号检检验和符号秩秩和检验例:8名男性性服某药前后后精液中精子子浓度(万/ml)变化化病人服药前服药后1600066022200056003590037004440050005600063006650012007260001800858002200DATAAA14;INPUTX1X2@@;D=X1-X2;CARDS;60006602200056005900370044005000600063006500120026000180058002200;PROCUNIVARIATE;VARD;RUN;MomentsN8SumWgts8Mean7017.5Sum56140StdDev8746.372Variance76499021Skewness1.39594Kurtosis1.066563USS9.2946E8CSS5.3549E8CV124.6366StdMean3092.309T:Mean=02.26934Pr>|T|0.0575Num^=08Num>06M(Sign)符号检验2Pr>=|M|0.2891SgnRank符号秩和检验验15Pr>=|S|0.0391(2)成组设设计资料成组设计资料料秩和检验用用NPAR1WAY过程两组比较时,,可作Wilcoxon法计算u值值多组比较时,,可作Kruskal-Walli

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论