sas的glm和anova基础

上传人：9*** IP属地：天津上传时间：2022-05-05 格式：DOCX 页数：5 大小：17.18KB 积分：12 举报 版权申诉

免费预览已结束，剩余1页可下载查看

 下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、多组资料均数比较我们一般采用方差分析的方法，SAS中方差分析的功能非常全面，能实现方差分析功能的过程有anova过程和glm过程。一、anova过程和glm过程简介1.anova过程anova过程存在于stat模块，主要的功能就是进行方差分析。anova过程用以对平衡实验设计资料（各分组因素各水平的所有组合具有相同的样本量或观察值）进行分析，不能用于对非平衡实验设计资料的方差分析。它比glm过程的运行速度要快，要求的存贮空间也要小一些。anova过程的一般格式如下：PROCANOVAv选项列表；CLASS变量名列表；MODEL应变量=自变量表达式V/选项列表；ABSORB变量列表；BY变量名；

2、FREQ变量名；MANOVAV检验选项V/详细选项；MEANS自变量表达式V/选项；REPEATED变量名水平数V（各水平值）V/选项;TESTVH=变量表达式E=变量表达式；procanova语句启动anova过程的运行，其后的选项列表可含有以下项目:DATA=数据集名MANOVAMULTIPASSNAMELEN=nNOPRINTORDER=DATA、FORMATTED、FREQ、INTERNALOUTSTAT=SAS-data-set其中的“order二选项指定anova过程对分类变量(class语句指定的变量)各水平的排序方式，可选的四个条目分别表示按照原始数据中的顺序、输出格式值的顺序

3、、各水平观察值频数多少的顺序、内部值的顺序进行排序。其余选项和以前的内容相同或较少用到，这里不再一一解释。其后的class语句、by语句、freq语句等和以前的内容完全相同，我们这里着重了解一下anova过程中特有的关键语句。model语句：用来指定应变量和自变量，并且通过特定的表达式规定自变量的作用方式。如果没有指定任何自变量，则模型中仅包含常数项，此时检验的内容是应变量的均数是否为零。model语句中指定的自变量必须是class语句中声明过的分类变量，anova过程不允许自变量中有连续型变量(数值变量)，而应变量则必须是数值型变量。自变量表达式可用来表达三种不同的效应模型，即主效应模型、交

4、互效应模型、嵌套设计效应模型。我们假定应变量为y，a，b，c为模型中包含的三个自变量，各种效应模型的表达方式如下：(1) 主效应模型：y=abc；(2) 交互效应模型：y=abca*ba*cb*ca*b*c；(3) 嵌套设计模型：y=abc(ab)；其中c因素为a、b两因素各种组合下的二级因素。model语句末尾的选项有“intercept和“nouni两项，分别指定SAS进行关于常数项的假设检验和在多变量方差分析(或重复测量资料方差分析)时禁止单变量统计结果的输出。absorb语句：对于仅发挥主效应的因素，absorb语句指定SAS消除此变量的作用，只对其余变量进行分析，起到大幅度减少计算机

5、资源和时间消耗的作用。应用此功能时，须先对指定变量排序，且此变量不能再出现在class语句和model语句中。manova语句：当反应变量有多个时，此语句控制anova过程进入多元方差分析模式，其后的选项用以指定多元方差分析时的各项指标。means语句：指定anova过程计算指定变量各水平下反应变量的均值、标准差，并进行组间的多重比较。repeated语句：如果反应变量为重复测量数据，此语句用以指定anova过程进入重复测量数据方差分析模式。其中的变量名代表重复测量因素（如测量时间等），其后水平数代表重复测量的次数，如果需指定重复测量各次的具体标识，可在其后按顺序列出，并用圆括号括起来。tes

6、t语句：用以进行其他类型的f检验，这种检验不同于通常方差分析中以误差均方为分母的f检验，其中的选项'h=用以指定作为分子的变量表达式（必须在model语句中出现过），“e=用以指定一个作为分母的变量。2.glm过程glm过程也存在于stat模块中，它执行以最小二乘法进行模型拟合的功能。以此过程可以实现的统计学方法有回归分析、方差分析、协方差分析、多元方差分析以及偏相关分析。glm过程对数据的分析处理均在一般线性模型的框架下进行，反应变量可以为一个或多个连续型变量，自变量可为连续型也可为离散型。glm过程的一般格式如下：PROCGLMV选项列表；CLASS变量名列表；MODEL应变量=自

7、变量列表V/选项列表；ABSORB变量名列表；BY变量名列表；FREQ变量名列表；ID变量名列表；WEIGHT变量名列表；CONTRAST'标记'效应表达式常数向量V.效应表达式常数向量V/选项列表；ESTIMATE'标记'效应表达式常数向量V.效应表达式常数向量V/选项列表；LSMEANS效应表达式V/选项列表；MANOVAV检验选项V/详细选项；Means效应表达式v/选项列表；OUTPUTVOUT=数据集名V/选项；RANDOM效应表达式V/选项列表；REPEATED因素表达式V/选项列表；TESTVH=变量表达式E=变量表达式V/选项列表;Procglm

8、语句标志glm过程的开始，此句后的选项可有以下项目。DATA=数据集名ALPHA=pMANOVAMULTIPASSNAMELEN=nNOPRINTORDER=DATA、FORMATTED、FREQ、INTERNALOUTSTAT=SAS-data-set可以看到此选项列表仅比anova过程的多了一个项目，即“alpha=p选项，此选项用来指定计算过程中所采用的显著性水平。其余选项的用法和含义与anova过程的相同，这里不再多说了。大家可以比较一下glm过程和anova过程所涉及的语句，anova过程中涉及的所有语句都包含在glm过程所涉及的语句中，其用法和功能也都是基本相同的，这一部分语句这里

9、就不再赘述。Contrast语句使你可以用自定义的方式进行假设检验，它必须出现在model语句之后，如果用到manova语句、repeated语句、random语句或test语句，contrast语句必须出现在这些语句之前。标记用来标识所进行的检验，用以标识的文字或符号需用单引号括起来。效应表达式用以指定假设检验的因素（组合），这些因素（组合）必须是model语句中出现过的。效应表达式后的常数向量用以指定相应因素（组合）各水平的值，在指定各水平的情况下进行相关因素的分析。Estimate语句可实现对线性方程的估计，它也必须出现在model语句之后，使用的规则和contrast语句基本相同。其中的语句元素的含义和用法也与contrast语句相同。Lsmeans语句用以指示SAS对指定的因素（组合）计算应变量的最小二乘均数并输出到结果中。Output语句我们在以前的内容中接触过，其功能和用法和以前的内容也基本相同，各位请参考以前的内容使用。Random语句用以指定哪些因素（组合）是随机变量，即相对于这些因

人人文库> 全部分类> 应用文书 > 作业报告

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

sas的glm和anova基础

文档简介

温馨提示

最新文档

评论

sas的glm和anova基础

文档简介

温馨提示

最新文档

评论

相关文档