常用生物统计方法的SAS程序ppt课件_第1页
常用生物统计方法的SAS程序ppt课件_第2页
常用生物统计方法的SAS程序ppt课件_第3页
常用生物统计方法的SAS程序ppt课件_第4页
常用生物统计方法的SAS程序ppt课件_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、畜禽场育种数据统计分析SAS运用初步王楚端 郑江霞.一、SAS系统简介 SASStatistical Analysis System是当前运用最为广泛的统计分析软件YSTAT之一; 1966年美国North Carolina 州立大学开场开发 目前国际上最流行的一种大型统计分析系统 统计分析的规范软件 其根本部分是SAS/BASE软件,在此根底上可根据需求加上SAS系统的其他模块. SAS/STAT统计分析;SAS/ETS经济预测或时间序列分析;SAS/QC质量控制管理;SAS/OR运筹学;SAS/IML矩阵运算;SAS/GRAPH绘图等 信息存储简单能读取任何方式的数据 言语编程才干强 对数

2、据延续处置 统计分析方法丰富,运用简单 SAS过程傻瓜系统.SAS 系统的组成系统管理程序 功能程序库 SAS/BASE -SAS/STAT SAS/GRAPHSAS/QCSAS/ORSAS/ETSSAS/IML SAS/ASSISTSAS 系统.二、SAS系统的启动与封锁 一启动 在WINDOWS操作系统中,直接用鼠标双击桌面上SAS系统的快捷键图标,即进入SAS系统。 SAS系统软件有时间租期限制,因此只需机器时间在软件有效期内才干运转 OUTPUTSAS结果输出窗口 LOGSAS日志窗口,随着SAS语句的执行,显示出SAS系统的信息和已执行的语句 PGMSAS程序编辑窗口二退出 .安装:

3、农大资源 仅供学习.启动.file.edit.view.tools.solutions.window.help.退出.四、SAS程序构造一程序构造 在SAS系统中任何一个完好的处置过程均可分为两大步数据步和过程步数据步将不同来源的数据读入SAS系统建立起SAS数据集。由DATA语句开场,以RUN语句终了。 数据可以由外部或过程读入;或者由CARDS语句开场,直接输入数据,数据输入完后提行单独加“;终了.简单运转样例假设我们有一个班学生的数学成果和语文成果,数学总分值为100,语文总分值为120,希望计算学生的平均分数按百分制并按此排名,可以在程序窗口输入此程序:.

4、title 0401班学生成果排名; data c0401; input name $ sex $ math chinese; avg = math*0.5 + chinese/120*100*0.5; cards; 李明 男 92 98 张红艺 女 89 106 王思明 男 86 90 张聪 男 98 109 刘颍 女 80 110 ; run; proc print; run; proc sort data=c0401; by descending avg; run; proc print;run; .假设数据要永久保管libname a d:SAS82SAS82SASMYWORK;/*m

5、ywork子目录已事先存在*/data a.aaaa; input x ; cards; 1 2 3 4 5; proc print; var x;run; . 过程步调用SAS系统中已编好的各种过程来处置和分析数据集中的数据。 每一个过程步均以PROC语句开场,RUN语句终了,并且每个语句后均以“;终了。二程序的输入、修正调试和运转 SAS程序只能在PGM窗口输入、修正,可在各行的任何位置开场SAS语句的书写。一个语句可以延续写在几行中,一行中也可以同时写上几个语句,但每个语句后面必需用“;隔开。. 当一个程序输入完后,发送程序的命令为F10功能键或SUBMIT。当程序发送到SAS系统后,P

6、GM的程序语句全部自动去除,LOG窗口将逐渐记下程序运转的过程和出现的错误信息用红色提示错误。 假设过程步没有错误,运转完成后,通常会在OUTPUT窗口打印出结果 假设程序运转出错,那么需求在PGM窗口用RECALL或F9命令调回已发送的程序进展修正。.保管SAS程序及其他窗口内容激活相应窗口,然后选择:方式一:鼠标点击“存盘工具按钮方式二:执行菜单命令【File】【Save】/【Save as】可保管程序、数据文件、运转结果、日志等。SAS保管成纯文本格式文件。.翻开已保管的文件只能在Program Edit窗口翻开文件,选择:方式一:鼠标点击“翻开工具按钮方式二:执行菜单命令【File】【

7、Open】 可翻开以前保管的程序、数据文件、运转结果、日志等文件及其他文本格式的文件。.对于定量资料的统计描画和简单推断,SAS提供了三个强有力的程序步,它们是:MEANS过程 提供单个或多个变量的简单描画,对于多个变量,它的输出格式紧凑,便于阅读。UNIVARIATE过程 提供单个变量的详细描画和对其分布类型的检验。 TTEST过程 对变量进展t/u检验。四、定量资料的统计描画和t检验.PROC MEANS 选择项计算描画统计量的MEANS 过程VAR 变量表BY 变量表CLASS 变量WEIGHT 变量OUTPUT 选择项FREQ 变量1.N 13.STDERR2.NMISS 14.T3.

8、MEAN 15.PRT4.STD 16.SUMWGT5.MIN 17.SKEWNESS6.MAX 18.KURTOSIS7.RANGE8.SUM9.VAR10.USS11.CSS12.CV.PROC UNIVARIATE 选择项描画统计量的UNIVARIATE 过程VAR 变量表BY 变量表FREQ 变量WEIGHT 变量OUTPUT OUT=1.DATA=SAS数据集2.PLOT 做茎叶图、盒式图、正态概率图3.FREQ 做频数分布表4. 进展正态性检验. /*LT3*/DATA A;INPUT YIELD;CARDS;177 215 197 97 123 159 245 119 119 1

9、31 149 152167 104 161 214 125 175 219 118 192 176 175 95 199 116 165 214 95 158 83 80 151187 126 196 134 206 98 97 129 143 179 174159 194 108 101 141 148 168 163 176 102 158145 173 75 130 149 150 161 155 111 205 131 189 .91 142 140 154 152 163 123 187 149 155 131 209183 97 119 181 149 254 131 215 11

10、1 186 118 150155 197 116 184 239 160 172 179 151 198 124 179 151 168 169 173 181 188 211 197 175 122 159171 166 175 143 190 213 192 231 163 159 158 159177 147 194 227 141 169 124 165;PROC MEANS MEAN STD CV STDERR MAXDEC=2;PROC CHART;VAR YIELD;PROC FREQ;PROC UNIVARIATE NORMAL PLOT;RUN;数值保管两位小数.t 检验1、

11、样本平均数与总体平均数的差别显著性检验 DATA A; INPUT y; y=y-4.50; cards; 4.33 4.62 3.89 4.14 4.78 4.64 4.52 4.48 4.55 4.26 ;PROC MEANS N MEAN STDERR T PRT;RUN;.程序阐明:样本平均数与总体平均数的差别显著性检验可调用MEANS过程。DATA语句产生暂时数据集A,阐明数据步的开场;INPUT语句指明读取变量y,表示读入一条观测值后不换行,延续读入数据,减少数据输入行;CARDS语句阐明以下为数据行,数据行下的“;表示数据行终了;PROC MEANS 语句指明调用MEANS过程对

12、数据集A进展分析,输出样本含量N、平均数MEAN、平均数的规范误STDERR、学生氏T值和t值概率PRT;RUN语句表示过程步终了,开场运转过程步。.2、配对实验资料的t检验 DATA B;INPUT ID x1 x2;d=x1-x2;CARDS; 1 37.8 37.9 2 38.2 39.0 3 38.0 38.9 4 37.6 38.4 5 37.9 37.9 6 38.1 39.0 7 38.2 39.5 8 37.5 38.6 9 38.5 38.8 10 37.9 39.0;PROC MEANS MEAN STDERR T PRT; VAR d;RUN;.3、非配对实验资料的t检验

13、 DATA C;INPUT breed y;CARDS; 1 57 2 89 1 120 2 36 1 101 2 82 1 2 50 1 119 2 39 1 117 2 32 1 104 2 57 1 73 2 82 1 53 2 96 1 68 2 31 1 118; PROC TTEST; CLASS breed; VAR y; RUN;.五、方差分析固定模型随机模型混合模型.常用的方差分析模型表达主效应模型 Y=A B C互作效应模型 Y=A B C A*B A*C B*C A*B*C嵌套效应模型 Y=A B (A) .3、方差分析SAS过程 对于普通的方差分析平衡资料,即各处置反复

14、数相等可用ANOVA过程;对于非平衡资料各处置反复数不等的方差分析可用GLM过程。.ANOVA过程调用格式PROC ANOVA ;CLASS 效应名 ;MODEL 因变量名=效应名;MEANS 效应列表/选项; LSD 最小显著差数法SNK 最小显著极差法DUNCN 邓肯氏均数比较检验T 两两T检验ALPHA=0.05 检验显著程度.GLM过程调用格式PROC GLM ;CLASS 效应名 ;MODEL 因变量名=效应名;MEANS 效应表/选项;LSMEANS 效应表/选项;RANDOM; STDERR 最小二乘均数规范误TDIFF最小二乘均数差别显著性检验.单要素实验各处置反复数相等DAT

15、A E;INPUT TR$ y;cards; A1 15 A1 16 A1 15 A1 17 A1 18 A2 45 A2 42 A2 50 A2 38 A2 39 A3 30 A3 35 A3 29 A3 31 A3 35 A4 31 A4 28 A4 20 A4 25 A4 30 A5 40 A5 35 A5 31 A5 32 A5 30; PROC anova; CLASS TR; model y=TR; MEANS TR/T;RUN;. Class Levels Values TR 5 A1 A2 A3 A4 A5 Number of observations 25Dependent

16、Variable: y Sum of Source DF Squares Mean Square F Value Pr F Model 4 1905.440000 476.360000 34.32 F TR 4 1905.440000 476.360000 34.32 F Model 4 46.49833333 11.62458333 5.99 0.0025 Error 20 38.84166667 1.94208333 Corrected Total 24 85.34000000 R-Square Coeff Var Root MSE y Mean 0.544860 7.565616 1.3

17、93587 18.42000 Source DF Type I SS Mean Square F Value Pr F BREED 4 46.49833333 11.62458333 5.99 0.0025 Source DF Type III SS Mean Square F Value Pr F BREED 4 46.49833333 11.62458333 5.99 0.0025.Comparisons significant at the 0.05 level are indicated by *. Difference BREED Between 95% Confidence Com

18、parison Means Limits B1 - B4 0.5417 -1.3348 2.4181 B1 - B3 1.8667 0.1064 3.6269 * B1 - B2 3.0000 1.3217 4.6783 * B1 - B5 3.5417 1.6652 5.4181 * B4 - B1 -0.5417 -2.4181 1.3348 B4 - B3 1.3250 -0.6251 3.2751 B4 - B2 2.4583 0.5819 4.3348 * B4 - B5 3.0000 0.9445 5.0555 * B3 - B1 -1.8667 -3.6269 -0.1064 *

19、 B3 - B4 -1.3250 -3.2751 0.6251 B3 - B2 1.1333 -0.6269 2.8936 B3 - B5 1.6750 -0.2751 3.6251 B2 - B1 -3.0000 -4.6783 -1.3217 * B2 - B4 -2.4583 -4.3348 -0.5819 * B2 - B3 -1.1333 -2.8936 0.6269 B2 - B5 0.5417 -1.3348 2.4181 B5 - B1 -3.5417 -5.4181 -1.6652 * B5 - B4 -3.0000 -5.0555 -0.9445 * B5 - B3 -1.

20、6750 -3.6251 0.2751 B5 - B2 -0.5417 -2.4181 1.3348.DATA F;INPUT A$ B$ y;cards; A1 B1 3.5 A1 B2 2.3 A1 B3 2.0 A2 B1 2.6 A2 B2 2.0 A2 B3 1.9 A3 B1 2.0 A3 B2 1.5 A3 B3 1.2 A4 B1 1.4 A4 B2 0.8 A4 B3 0.3; PROC ANOVA; CLASS A B; model y=A B; MEANS A B/DUNCAN;RUN;3. 两要素交叉分组单独察看值 .Class Level Information Cl

21、ass Levels Values A 4 A1 A2 A3 A4 B 3 B1 B2 B3Dependent Variable: y Sum of Source DF Squares Mean Square F Value Pr F Model 5 7.51083333 1.50216667 34.89 0.0002 Error 6 0.25833333 0.04305556Corrected Total 11 7.76916667 R-Square Coeff Var Root MSE y Mean 0.966749 11.58130 0.207498 1.791667 Source DF

22、 Anova SS Mean Square F Value Pr F A 3 5.28916667 1.76305556 40.95 0.0002 B 2 2.22166667 1.11083333 25.80 0.0011.Duncans Multiple Range Test for y NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Means with the same letter are not significantly differ

23、ent. Duncan Grouping Mean N A A 2.6000 3 A1 B 2.1667 3 A2 C 1.5667 3 A3 D 0.8333 3 A4. Duncan Grouping Mean N B A 2.3750 4 B1 B 1.6500 4 B2 B B 1.3500 4 B3.六、相关分析PROC CORR 选项;VAR 变量名;WITH 变量名;PARTIAL 变量名表; (PEARSON) SPEARMANNOSIMPLE指明偏相关变量即坚持固定的变量,不能出如今 VAR 和WITH 语句中。.DATA G;INPUT x y;CARDS; 80 2350 86 2400 98 2720 90 2500 120 3150102 2680 95 2630 83 2400 113 3080 105 2920110 2960 100 2860;PROC CORR;RUN;. The CORR Procedure 2 Variables: x y Simple Statisticsvariable N Mean Std Dev Sum

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论