常用生物统计方法的SAS程序_第1页
常用生物统计方法的SAS程序_第2页
常用生物统计方法的SAS程序_第3页
常用生物统计方法的SAS程序_第4页
常用生物统计方法的SAS程序_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

畜禽场育种数据统计分析

——SAS应用初步

王楚端郑江霞一、SAS系统简介

—SAS(StatisticalAnalysisSystem)是当前使用最为广泛的统计分析软件YSTAT)之一;—1966年美国NorthCarolina州立大学开始开发

—目前国际上最流行的一种大型统计分析系统—统计分析的标准软件—其基本部分是SAS/BASE软件,在此基础上可根据需要加上SAS系统的其他模块

SAS/STAT(统计分析);SAS/ETS(经济预测或时间序列分析);SAS/QC(质量控制管理);SAS/OR(运筹学);SAS/IML(矩阵运算);SAS/GRAPH(绘图)等—信息存储简单(能读取任何形式的数据)—语言编程能力强—对数据连续处理—统计分析方法丰富,使用简单—SAS过程傻瓜系统……SAS系统的组成系统管理程序

功能程序库

SAS/BASE-SAS/STATSAS/GRAPHSAS/QCSAS/ORSAS/ETSSAS/IMLSAS/ASSISTSAS系统二、SAS系统的启动与关闭

(一)启动

在WINDOWS操作系统中,直接用鼠标双击桌面上SAS系统的快捷键图标,即进入SAS系统。☼SAS系统软件有时间租期限制,因此只有机器时间在软件有效期内才能运行

OUTPUT(SAS结果输出窗口)LOG(SAS日志窗口,随着SAS语句的执行,显示出SAS系统的信息和已执行的语句)PGM(SAS程序编辑窗口)(二)退出

安装:农大资源仅供学习启动fileeditviewtoolssolutionswindowhelp退出出四、、SAS程程序序结结构构(一一))程程序序结结构构在SAS系系统统中中任任何何一一个个完完整整的的处处理理过过程程均均可可分分为为两两大大步步————数据据步步和和过过程程步步数据据步步———将将不不同同来来源源的的数数据据读读入入SAS系系统统建建立立起起SAS数数据据集集。。由由DATA语语句句开始始,,以以RUN语句句结结束束。。—数据据可可以以由由外外部部或或过过程程读读入入;;或或者者由CARDS语句句开始,直接输入入数据,数据输输入完后后提行单单独加““;”结束简单运行样样例假设我们有有一个班学学生的数学学成绩和语语文成绩,,数学满分分为100,语文满满分为120,希望望计算学生生的平均分分数(按百百分制)并并按此排名名,可以在在程序窗口口输入此程程序:title'0401班学学生成成绩排排名';datac0401;inputname$sex$mathchinese;avg=math*0.5+chinese/120*100*0.5;cards;李明男男9298张红艺艺女女89106王思明明男男8690张聪男男98109刘颍女女80110;run;procprint;run;procsortdata=c0401;bydescendingavg;run;procprint;run;如果果数数据据要要永永久久保保存存……libnamea'd:\SAS82\SAS82\SAS\MYWORK\';/*mywork子子目目录录已已事事先先存存在在*/dataa.aaaa;inputx@@;cards;12345;procprint;varx;run;过程程步步———调调用用SAS系系统统中中已已编编好好的的各各种种过过程程来来处处理理和和分分析析数数据据集集中中的的数数据据。。—每每一一个个过过程程步步均均以以PROC语语句句开始始,,RUN语语句句结结束束,,并并且且每每个个语语句句后后均均以以““;””结结束束。。(二二))程程序序的的输输入入、、修修改改调调试试和和运运行行SAS程程序序只只能能在在PGM窗窗口口输输入入、、修修改改,,可可在在各各行行的的任任何何位位置置开开始始SAS语语句句的的书书写写。。一一个个语语句句可可以以连连续续写写在在几几行行中中,,一一行行中中也也可可以以同同时时写写上上几几个个语语句句,,但但每每个个语语句句后后面面必必须须用用““;;””隔隔开开。。当一一个个程程序序输输入入完完后后,,发发送送程程序序的的命命令令为为F10功功能能键键或或SUBMIT。。当当程程序序发发送送到到SAS系系统统后后,,PGM的的程程序序语语句句全全部部自自动动清清除除,,LOG窗窗口口将将逐逐步步记记下下程程序序运运行行的的过过程程和和出出现现的的错错误误信信息息((用用红红色色提提示示错错误误))。。—如果果过程程步没没有错错误,运行行完成成后,,通常常会在在OUTPUT窗口口打印印出结结果—如果果程序序运行行出错错,则需要要在PGM窗口口用RECALL((或F9))命令令调回回已发发送的的程序序进行行修改改。保存SAS程序序及其其他窗窗口内内容激活相相应窗窗口,,然后后选择择:方式一一:鼠鼠标点点击““存盘盘”工工具按按钮方式二二:执执行菜菜单命命令【【File】→→【Save】】/【【Saveas】】可保存存程序序、数数据文文件、、运行行结果果、日日志等等。SAS保存存成纯纯文本本格式式文件件。打开已已保存存的文文件只能在在ProgramEdit窗口口打开开文件件,选选择::方式一一:鼠鼠标点点击““打开开”工工具按按钮方式二二:执执行菜菜单命命令【【File】→→【Open】】可打开开以前前保存存的程程序、、数据据文件件、运运行结结果、、日志志等文文件及及其他他文本本格式式的文文件。。对于定定量资资料的的统计计描述述和简简单推推断,,SAS提提供了了三个个强有有力的的程序序步,,它们们是::MEANS过程程提提供单单个或或多个个变量量的简简单描描述,,对于于多个个变量量,它它的输输出格格式紧紧凑,,便于于阅读读。UNIVARIATE过过程提提供供单个个变量量的详详细描描述和和对其其分布布类型型的检检验。。TTEST过程对对变量进行行t/u检检验。四、定量资料的的统计描述述和t检验验PROCMEANS[选择项项]计算描述统统计量的MEANS过程VAR变量表BY变量表CLASS变量WEIGHT变量OUTPUT选择项FREQ变量1.N13.STDERR2.NMISS14.T3.MEAN15.PRT4.STD16.SUMWGT5.MIN17.SKEWNESS6.MAX18.KURTOSIS7.RANGE8.SUM9.VAR10.USS11.CSS12.CVPROCUNIVARIATE[选择项项]描述统计计量的UNIVARIATE过程程VAR变量表BY变量表FREQ变量WEIGHT变量OUTPUTOUT=1.DATA=SAS数据集集2.PLOT做茎叶图图、盒盒式图、、正态概概率图3.FREQ做频数分分布表4.NOORMAAL进行正态态性检验验/*LT3*/DATAA;INPUTYIELD@@;CARDS;17721519797123159245119119131149152167104161214125175219118192176175951361991161652149515883137801381511871261961342061379897129143179174159194136108101141148168163176102158145173751301491501611551112051311899114214015415216312318714915513120918397119181149254131215111186118150155197116184239160172179151198124179135151168169173181188211197175122159171166175143190213192231163159158159177147194227141169124165;PROCMEANSMEANSTDCVSTDERRMAXDEC=2;PROCCHART;VARYIELD;PROCFREQ;PROCUNIVARIATENORMALPLOT;RUN;数值值保保留留两两位位小小数数t检验验1、、样本本平平均均数数与与总总体体平平均均数数的的差差异异显显著著性性检检验验DATAA;INPUTy@@;y=y-4.50;cards;4.334.623.894.144.784.644.524.484.554.26;PROCMEANSNMEANSTDERRTPRT;RUN;程序说明::样本平均数数与总体平平均数的差差异显著性性检验可调调用MEANS过程。DATA语语句产生临时数数据集A,,表明数据据步的开始始;INPUT语句指明读取变变量y,@@表示读入一一条观测值值后不换行行,连续读读入数据,,减少数据据输入行;;CARDS语句表明以下为为数据行,,数据行下下的“;””表示数据据行结束;;PROCMEANS语句指明调调用MEANS过程程对数据集集A进行分分析,输出出样本含量量N、平均均数MEAN、平均均数的标准准误STDERR、、学生氏T值和t值概率PRT;RUN语句句表示过程步步结束,开开始运行过过程步。2、配对试验资资料的t检验DATAB;INPUTIDx1x2;d=x1-x2;CARDS;137.837.9238.239.0338.038.9437.638.4537.937.9638.139.0738.239.5837.538.6938.538.81037.939.0;PROCMEANSMEANSTDERRTPRT;VARd;RUN;3、非配对试试验资料料的t检验DATAC;INPUTbreedy@@;CARDS;1572891120236110128211372501119239111723211042571732821532961682311118;PROCTTEST;CLASSbreed;VARy;RUN;五、、方方差差分分析析固定定模模型型随机机模模型型混合合模模型型常用用的的方方差差分分析析模模型型表表达达主效效应应模模型型Y=ABC互作作效效应应模模型型Y=ABCA*BA*CB*CA*B*C嵌套套效效应应模模型型Y=AB(A)3、、方方差差分分析析SAS过过程程对于于一一般般的的方方差差分分析析((平平衡衡资资料料,,即即各各处处理理重重复复数数相相等等))可可用用ANOVA过程;对对于非平平衡资料料(各处处理重复复数不等等)的方方差分析析可用GLM过程。ANOVA过程调用用格式PROCANOVA;CLASS效效应名;;MODEL因因变量名名=效应应名;MEANS效效应列表表/选项项;LSD最最小显显著差数数法SNK最最小显显著极差差法DUNCN邓邓肯氏均均数比较较检验T两两两T检验验ALPHA=0.05检验验显著水水平GLM过程调用用格式PROCGLM;;CLASS效效应名;;MODEL因因变量名名=效应应名;MEANS效效应表/选项;LSMEANS效应应表/选选项;RANDOM;;STDERR最最小二二乘均数数标准误误TDIFF最小小二乘均均数差异异显著性性检验单因素试试验(各各处理重重复数相相等)DATAE;INPUTTR$y@@;cards;A115A116A115A117A118A245A242A250A238A239A330A335A329A331A335A431A428A420A425A430A540A535A531A532A530;PROCanova;CLASSTR;modely=TR;MEANSTR/T;RUN;ClassLevelsValuesTR5A1A2A3A4A5Numberofobservations25DependentVariable:ySumofSourceDFSquaresMeanSquareFValuePr>FModel41905.440000476.36000034.32<.0001Error20277.60000013.880000CorrectedTotal242183.040000R-SquareCoeffVarRootMSEyMean0.87283812.303793.72558730.28000SourceFAnovaSSMeanSquareFValuePr>FTR41905.440000476.36000034.32<.0001tTests(LSD)foryNOTE:ThistestcontrolstheTypeIcomparisonwiseerrorrate,nottheexperimentwiseerrorrate.Alpha0.05ErrorDegreesofFreedom20ErrorMeanSquare13.88CriticalValueoft2.08596LeastSignificantDifference4.9151Meanswiththesameletterarenotsignificantlydifferent.GroupingMeanNTRA42.8005A2B33.6005A5BB32.0005A3C26.8005A4D16.2005A1DATAF;INPUTBREED$y@@;cards;B121.5B119.5B120.0B122.0B118.0B120.0B216.0B218.5B217.0B215.5B220.0B216.0B319.0B317.5B320.0B318.0B317.0B421.0B418.5B419.0B420.0B515.5B518.0B517.0B516.0;PROCGLM;CLASSBREED;modely=BREED;MEANSBREED/T;RUN;2.单因因素试验((各处理重重复数不等等)ClassLevelsValuesBREED5B1B2B3B4B5Numberofobservations25DependentVariable:ySumofSourceDFSquaresMeanSquareFValuePr>FModel446.4983333311.624583335.990.0025Error2038.841666671.94208333CorrectedTotal2485.34000000R-SquareCoeffVarRootMSEyMean0.5448607.5656161.39358718.42000SourceDFTypeISSMeanSquareFValuePr>FBREED446.4983333311.624583335.990.0025SourceDFTypeIIISSMeanSquareFValuePr>FBREED446.4983333311.624583335.990.0025Comparisonssignificantatthe0.05levelareindicatedby***.DifferenceBREEDBetween95%ConfidenceComparisonMeansLimitsB1-B40.5417-1.33482.4181B1-B31.86670.10643.6269***B1-B23.00001.32174.6783***B1-B53.54171.66525.4181***B4-B1-0.5417-2.41811.3348B4-B31.3250-0.62513.2751B4-B22.45830.58194.3348***B4-B53.00000.94455.0555***B3-B1-1.8667-3.6269-0.1064***B3-B4-1.3250-3.27510.6251B3-B21.1333-0.62692.8936B3-B51.6750-0.27513.6251B2-B1-3.0000-4.6783-1.3217***B2-B4-2.4583-4.3348-0.5819***B2-B3-1.1333-2.89360.6269B2-B50.5417-1.33482.4181B5-B1-3.5417-5.4181-1.6652***B5-B4-3.0000-5.0555-0.9445***B5-B3-1.6750-3.62510.2751B5-B2-0.5417-2.41811.3348DATAF;INPUTA$B$y@@;cards;A1B13.5A1B22.3A1B32.0A2B12.6A2B22.0A2B31.9A3B12.0A3B21.5A3B31.2A4B11.4A4B20.8A4B30.3;PROCANOVA;CLASSAB;modely=AB;MEANSAB/DUNCAN;RUN;3.两两因素交交叉分组组单独观观察值ClassLevelInformationClassLevelsValuesA4A1A2A3A4B3B1B2B3DependentVariable:ySumofSourceDFSquaresMeanSquareFValuePr>FModel57.510833331.5021666734.890.0002Error60.258333330.04305556CorrectedTotal117.76916667R-SquareCoeffVarRootMSEyMean0.96674911.581300.2074981.791667SourceDFAnovaSSMeanSquareFValuePr>FA35.289166671.7630555640.950.0002B22.221666671.1108333325.800.0011Duncan'sMultipleRangeTestforyNOTE:ThistestcontrolstheTypeIcomparisonwiseerrorrate,nottheexperimentwiseerrorrate.Meanswiththesameletterarenotsignificantlydifferent.DuncanGroupingMeanNAA2.60003A1B2.16673A2C1.56673A3D0.83333A4DuncanGroupingMeanNBA2.37504B1B1.65004B2BB1.35004B3六、相关分分析PROCCORR选项项;VAR变变量名;WITH变变量名名;PARTIAL变变量名表;;(PEARSON)SPEARMANNOSIMPLE指明偏相关关变量(即即保持固定定的变量)),不能出出现在VAR和和WITH语句中中。DATAG;INPUTxy@@;CARDS;802350862400982720902500120315010226809526308324001133080105292011029601002860;PROCCORR;RUN;TheCORRProcedure2Variables:xySimpleStatisticsvariableNMeanStdDevSumMinimumMaximumx1298.5000012.37666118280.00000120.00000y122721274.936633265023503150PearsonCorrelationCoefficients,N=12Prob>|r|underH0:Rho=0Xyx1.000000.97740<.0001y0.977401.00000<.0001七、线性回归PROCREG选项;MODEL因变量=自自变量/选选项;BY变量量;PLOTy轴变变量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论