统计分析系统SAS软件 第六章 线性相关、回归分析与logistic回归_第1页
统计分析系统SAS软件 第六章 线性相关、回归分析与logistic回归_第2页
统计分析系统SAS软件 第六章 线性相关、回归分析与logistic回归_第3页
统计分析系统SAS软件 第六章 线性相关、回归分析与logistic回归_第4页
统计分析系统SAS软件 第六章 线性相关、回归分析与logistic回归_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、协方差分析过程格式PROC GLM 选项;CLASS 变量表;MODEL 依变量=效应/选项;MEANS 效应/选项;LSMEANS 效应/选项;PROC GLM 语句选项可设定分析数据集等;CLASS 指明分类变量,协方差分析时必须设定,必须在MODEL语句之前;MODEL 定义协方差分析的线性数学模型, model y=a t;一般的协方差分析模型 model y=t x(t);分离斜率模型 model y=t x x*t;共斜率模型 model后SOLUTION的选项给出参数的估计值MEANS 语句用于计算依变量的平均数,选项用于多重比较;LSMEANS 语句计算效应的最小二乘估计的平均

2、数(LSM) 选项E=效应,设定测验误差项,缺省为试验分析误差. STDERR给出LSM的标准误, TDIEF, PDIEF要求显示测验H0:LSM(i)=LSM(j)的t值和概率值.应用举例单向分组资料的协方差分析两向分组资料的协方差分析单因素试验的协方差分析第六章 线性相关、回归分析与logistic回归相关分析(CORR)回归分析(REG)广义线型模型(GLM)REG过程 语法格式 语法说明 MODEL语句,必需语句,定义回归分析模型 VAR语句为可选的,指定用于计算交叉积的变量 PLOT语句为可选的,用于绘制变量间的散点图,还可添加回归线。 【过程选项】OUTEST=数据集名 指定统计

3、量和参数估计输出的新数据集名。 NOPRINT 禁止统计结果在OUTPUT视窗中输出。 SIMPLE 输出REG过程中所用的每个变量的基本统计量。 CORR 输出MODEL语句或VAR语句中所列变量的相关矩阵。 ALL 等价于MODEL语句加上全部选项,即输出该语句所有选项分析结果。【MODEL语句】 MODEL语句定义模型中的因变量、自变量、模型选项及结果输出选项。语句中的变量只能是数据集中的变量,任何形式的变换都必须先产生一个新变量,然后用于分析。如X1的二次项,不能在模型中直接指定X1*X1,而要产生另一个新变量代表X1*X1,方可引入模型。MODEL语句中常用的选项NOINT 在模型中

4、不拟合常数项。 STB 输出标准化回归系数。 CLI 输出个体预测值的95%可信区间上下限。 CLM 输出因变量期望值(均值)的95%可信区间上下限。 R 输出个体预测值、残差及其标准误。 P 输出实际值Yi、预测值 和残差等。如已选择了CLI、CLM和R,则无需选择P。【关键字】 结果解释 如果在MODEL语句中使用CLI、CLM选项,则系统输出因变量均值以及个体预测值的95可信区间上下限,输出如下 CORR过程PROC CORR 选项 ;VAR 变量名列 ;1WITH 变量名列;2WEIGHT 变量名;FREQ 变量名;BY 变量名列;语法说明 除了PROC语句为必需,其他语句都是可选的,

5、如果省略所有的可选语句,则对所有变量作相关分析。VAR语句,可选的语句,定义相关分析的变量 WITH语句,可选的语句,定义分析相关性的另一组变量PROC CORR;VAR A B;WITH X Y Z ;结果解释 例 下表给出了12名不同年龄(岁,X)妇女的收缩压测量值(mmHg,Y),试进行回归分析。 (1) 制作散点图;(2) 建立由X预报的回归方程,制作回归直线;(3) 对回归方程及回归系数b进行假设检验;(4) 绘制的95可信区间;(5) 建立单个Y值的预报方程;(6) 计算积矩相关系数,并进行假设检验。多元线性回归 REG过程: 只要把要分析的多个自变量名放在MODEL语句中应变量后

6、即可。 语法选项 (MODEL语句选项)SELECTION=method,规定变量筛选的方法,method可以是以下几种选项FORWARD(或F),前进法,按照SLE规定的P值从无到有依次选一个变量进入模型 BACKWARD(或B),后退法,按照SLS规定的P值从含有全部变量的模型开始,依次剔除一个变量 STEPWISE(或S),逐步法,按照SLE的标准依次选入变量,同时对模型中现有的变量按SLS的标准剔除不显著的变量 MODEL语句选项NONE,即不选择任何选项,不作任何变量筛选,此时使用的是含有全部自变量的全回归模型MODEL语句选项SLE=概率值,入选标准,规定变量入选模型的显著性水平,

7、前进法的默认是0.5,逐步法是0.15 SLS=概率值,剔除标准,指定变量保留在模型的显著水平,后退法默认为0.10,逐步法是0.15 标准化偏回归系数 STB 可用来比较各个自变量作用的大小 COLLIN 要求详细分析自变量之间的共线性,给出信息矩阵的特征根和条件数,来判断自变量之间有无多重共线性。 应用实例 现有20名糖尿病人的血糖(y,mmol/L)、胰岛素(X1,mU/L)及生长素(X2,g/L)的测量数据列于中,试进行多元线性回归分析 程序如下 data bk4_1;input id y x1 x2; cards;proc reg data=bk4_1;model y=x1 x2/s

8、tb;model y=x1 x2/ selection=stepwise stb;run;程序运行的主要结果 相关和偏相关分析REG过程 logistic回归 如果应变量为分类的变量,则不符合一般回归分析模型的要求,可用logistic回归来分析。Logistic回归按反应变量的类型分为:两分类的Logistic回归 多分类有序反应变量的Logistic回归 多分类无序反应变量的Logistic回归按照设计类型可分为:非条件Logistic回归,即研究对象未经过配对条件Logistic回归,即研究对象为1:1或1:m配对 语法格式 语法说明 LOGISTIC过程,用最大似然法对应变量拟合一个L

9、ogistic模型。除了PROC 和MODEL语句为必需,其他都可省略。【过程选项】OUTEST=数据集名 指定统计量和参数估计输出的新数据集名。 NOPRINT 禁止统计结果在OUTPUT视窗中输出。ORDER=DATA|FORMATTED|INTERNAL 规定拟和模型的应变量的水平顺序 DATA :应变量的顺序与数据集中出现的顺序一致 FORMATTED:按照格式化值的顺序,为默认的选项,相当于应变量所赋值的大小顺序 INTERNAL:按照非格式化值的顺序DESCENDING|DES 颠倒应变量的排列顺序,如果同时指定了选项ORDER,则系统先按照ORDER规定的顺序排列,然后则降序排列

10、。就是说,如果应变量的赋值,死亡为1,存活0,为了得到死亡对存活的概率(或者说是死亡的风险),应选择此选项,否则得到的是存活对死亡的概率。【MODEL语句】 MODEL语句指定模型的自变量、应变量,模型选项及结果输出选项,如要拟和交互作用项,需先产生一个表示交互作用的新变量。可以拟合带有一个或多个自变量的Logistic回归模型,用最大似然估计法估计模型的参数,打印出模型估计的过程和模型参数的可信区间。NOINT 在模型中不拟合常数项,在条件的Logistic回归中用到。 SELECTION= FORWARD(或F)| BACKWARD(或B)| STEPWISE|SCORE 规定变量筛选的方

11、法,分别为向前、向后、逐步和最优子集法。缺省时为NONE,拟合全回归模型。 SLE=概率值,指定变量进入模型的显著水平,缺省为0.05 SLS=概率值,指定变量保留在模型的显著水平,缺省为0.05 CL|WALDCL,要求估计所有回归参数的可信区间 CLODDS=PL|WALD|BOTH, 要求计算OR值的可信区间 PLRL,对所有自变量估计OR的可信区间应用实例 某工作者在探讨肾细胞癌转移的有关临床病理因素研究中,收集了一批行根治性肾切除术患者的肾癌标本资料,现从中抽取26例资料作为示例进行logistic回归分析。 表中有关符号意义说明:i: 样品序号x1:确诊时患者的年龄(岁)x2:肾细胞癌血管内皮生长因子(VEGF), 其阳性表述由低到高共3个等级x3:肾细胞癌组织内微血管数(MVC)x4:肾癌细胞核组

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论