纵向数据分析方法与实现演示文稿_第1页
纵向数据分析方法与实现演示文稿_第2页
纵向数据分析方法与实现演示文稿_第3页
纵向数据分析方法与实现演示文稿_第4页
纵向数据分析方法与实现演示文稿_第5页
已阅读5页,还剩136页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

纵向数据分析方法与SAS实现演示文稿目前一页\总数一百四十二页\编于十八点优选纵向数据分析方法与SAS实现目前二页\总数一百四十二页\编于十八点目录1、什么是纵向数据?2、介绍这类数据的分析方法

基本思想软件操作目前三页\总数一百四十二页\编于十八点什么是纵向数据?纵向数据是指一个被试群体在一个或多个变量上,多个时间点的测量结果。例如,一组纵向数据中有N个个体,所关心的变量有M个,测量时间点为T个。与横向数据相比,纵向数据有多个时间点,即T>1。而横断数据T=1。纵向数据的第i个个体在第j个变量上的第t次测量结果可以表示Yijt,其(i=1,2,…,N;j=1,2,…M;t=1,2,…T),纵向数据比横断数据多了一个时间维度。目前四页\总数一百四十二页\编于十八点目前五页\总数一百四十二页\编于十八点多层(多水平)分析模型来源:《复杂数据统计方法》目前六页\总数一百四十二页\编于十八点纵向数据分析方法(1)方差分析※(2)多层线性统计分析模型&针对纵向数据的发展模型(线性随机效应混合模型)※(3)广义线性随机效应混合模型※(4)广义估计方程(GEE简介.ppt、刘静老师的pdf)(5)潜变量增长曲线模型(6)决策树及随机效应模型(了解)注:预计占用时间:1~2次课;

目前七页\总数一百四十二页\编于十八点方差分析目前八页\总数一百四十二页\编于十八点方差分析(了解)传统方法:重复测量资料的一元方差分析和多元方差分析一元方差分析是将不同时间点的几次不同测量看成是一个因变量进行分析,而多元方差分析是将不同时间点的测量看成几个因变量同时进行分析目前九页\总数一百四十二页\编于十八点目前十页\总数一百四十二页\编于十八点目前十一页\总数一百四十二页\编于十八点重复测量方差分析一般资料受试者编号放置时间(分钟)0459013515.325.324.984.6525.325.264.934.7035.945.885.435.0445.495.435.325.0455.715.495.434.9366.276.275.665.2675.885.775.434.9385.325.155.044.48实验组对照组目前十二页\总数一百四十二页\编于十八点重复测量资料方差分析(一元方差分析)的条件:

1.正态性

处理因素的各处理水平的样本个体之间是相互独立的随机样本,其总体均数服从正态分布;2.方差齐性

相互比较的各处理水平的总体方差相等,即具有方差齐同

3.各时间点组成的协方差阵(covariancematrix)具有球形性(sphericity)或复合对称性(compoundsymmetry)特征。Box(1954)指出,若球形性质得不到满足,则方差分析的F值是有偏的,这会造成过多的拒绝本来是真的无效假设(即增加了I型错误)目前十三页\总数一百四十二页\编于十八点重复测量资料的一元方差分析,总变异分解思路:总变异处理对象间的变异重复测量间

的变异处理组间的变异观察对象个体间的差异(受试者误差)测量时间之间的变异处理因素与测量时间的交互作用重复测量误差目前十四页\总数一百四十二页\编于十八点变异来源SSvMSF总变异nt-1处理(1)k-1受试者误差(2)n-k测量时间(3)t-1处理×时间(4)(k-1)(t-1)重复测量误差(5)

(n-k)(t-1)

重复测量资料的方差分析计算公式目前十五页\总数一百四十二页\编于十八点多元方差分析通过计算两个测量分数的差,用配对样本t检验方法对两次测量的差异进行检验,此种通过测量分数差值对测量之间差异进行检验的方法,正是多元方差分析处理追踪数据所有的最基本的方法。目前十六页\总数一百四十二页\编于十八点目前十七页\总数一百四十二页\编于十八点目前十八页\总数一百四十二页\编于十八点目前十九页\总数一百四十二页\编于十八点目前二十页\总数一百四十二页\编于十八点重复测量资料的方差分析(一元方差分析)多元方差分析假设条件重复测量的方差分析要求数据满足球形性条件假设,往往难以满足。多元方差分析要求数据满足多元正态分布,而重复测量的方差分析只要求数据满足一元正态分布;违背正态假设带来的检验后果远不如违背球形性假设条件严重。一类错误球形性不满足时,不加校正的重复测量方差分析所犯一类错误的概率大于指定的a,即使进行了校正后,所犯第一类错误的概率,只是接近指定的a。在假设条件满足时,多元方差分析所犯第一类错误的概率为指定的a。检验效能当满足球形假设条件时,重复测量的方差分析的检验效能要比多元分析强当不满足球形假设条件时,两种方法相比,很难说哪一种方法检验效能强;对于中等的样本容量,多元方差分析的检验力有时比重复测量的方差分析弱,但有时要强很多;在小样本时,多元方差分析往往遇到很多问题,甚至不能进行。两种方差分析方法的比较:目前二十一页\总数一百四十二页\编于十八点

SAS实现

----单因素重复测量方差分析

dataaaa;inputx1x2x3x4@@;cards;10.19.910.210.37.07.17.37.08.17.98.18.16.56.86.97.010.410.911.110.57.47.47.37.29.49.39.69.516.417.117.617.65.55.45.35.38.18.28.18.36.56.66.86.99.79.99.89.9procglmdata=aaa;modelx1x2x3x4=/nouni;repeatedtime4/printe;run;nouni表示不对x1~x4作单变量方差分析;Repeated语句指示重复测量因素为time变量,共4个水平,各水平值分别为1~4。Printe输出球对称性检验结果(即协方差阵的Mauchly检验结果)。目前二十二页\总数一百四十二页\编于十八点当不满足球形性时,一种是调整F,另一种是进行多元方差分析。目前二十三页\总数一百四十二页\编于十八点目前二十四页\总数一百四十二页\编于十八点SAS实现

----两因素重复测量方差分析目前二十五页\总数一百四十二页\编于十八点dataA;inputtype$subjecttime1time2time3time4;cards;111.4311.5191.4771.364121.3851.5621.4591.372131.4731.4871.6121.414141.4521.5351.5371.403151.3711.4691.2681.296261.2570.9760.7250.578271.2320.9340.8280.609281.2981.0360.8130.512291.2161.2470.6940.5792101.2750.9420.6750.621;procglm;classtype;modeltime1time2time3time4=type/nouni;repeatedtime4/printe;meanstype;run;目前二十六页\总数一百四十二页\编于十八点SAS实现

----多因素重复测量方差分析《用SAS软件实现多因素重复测量设计定量资料的统计分析》

胡良平;郭辰仪目前二十七页\总数一百四十二页\编于十八点DataA3;Inputgroupbdb1-bdb5nxm1-nxm5alt1-alt5ast1-ast5;Cards;1222332.21.13.34.45.51.11.31.41.51.62.12.32.22.42.511.02.03.04.05.02.21.13.34.45.52.21.13.34.45.5222332222332.21.13.34.45.51.11.31.41.51.62.12.32.22.42.521.02.03.04.05.04.21.12.34.41.52.21.13.34.45.5222331222332.21.13.34.45.51.11.31.41.51.62.12.32.22.42.5;Run;Procglmdata=A3;Classgroup;Modelbdb1-bdb5nxm1-nxm5alt1-alt5ast1-ast5=group/nouni;Repeatedreponse4identity,time5(01234);Lsmeansgroup/cl;Run;共4个因变量,重复测量了5次目前二十八页\总数一百四十二页\编于十八点结果:目前二十九页\总数一百四十二页\编于十八点趋势性分析推荐:《重复测量资料分析方法与SAS程序》余松林利用正交多项式系数表配合正交多项式模型目前三十页\总数一百四十二页\编于十八点方差分析的局限性目前三十一页\总数一百四十二页\编于十八点

多水平统计模型简介

目前三十二页\总数一百四十二页\编于十八点多层统计模型的出现目前,大家基本上接受两组人分别独立开发出同一模型的结果。双方研究成果的发布时间基本相同(上世纪80年代末90年代初)。S.Raudenbush与A.BrykH.Goldstein模型称为:hierarchicallinearmodel;软件为:HLM模型称为:multilevelmodels;软件为:MLwiN(早期版本称ML3,MLn)目前三十三页\总数一百四十二页\编于十八点横截面数据层次结构数据

临床试验和动物实验的重复测量多中心临床试验研究

纵向观测如儿童生长发育研究流行病学现场调查如整群抽样调查遗传学家系调查资料

meta分析资料多水平主成分分析多水平因子分析多水平判别分析多水平logistic回归多水平Cox模型多水平Poisson回归多水平时间序列分析多元多水平模型多水平结构方程模型多水平主成分分析多水平一般线性模型!(多层线性模型)层次结构数据嵌套型数据多水平数据multilevelmodelshierarchicallinearmodelrandom-effectmodelrandomcoefficientmodelvariouscomponentmodelmixed-effectmodelempiricalBayesmodel目前三十四页\总数一百四十二页\编于十八点

两水平层次结构数据水平2

水平1

层次结构数据的普遍性“水平”(level):指数据层次结构中的某一层次。例如,子女为低水平即水平1,家庭为高水平即水平2。“单位”

(unit):指数据层次结构中某水平上的一个实体。例如,每个子女是一个水平1单位,每个家庭是一个水平2单位。对于纵向数据,个体内不同测量时间是水平1,个体间不同个体是水平2。目前三十五页\总数一百四十二页\编于十八点

层次结构数据为一种非独立数据。?非独立数据不满足经典方法的独立性条件,采用经典方法OLS可能失去参数估计的有效性并导致不合理的推断结论,非独立数据的组内相关结构各异,理论上,不同的结构应采用相应的统计方法。多水平分析的概念为人们提供了这样一个框架,即可将个体的结局联系到个体特征以及个体所在环境或背景特征进行分析,从而实现研究的事物与其所在背景的统一。层次结构数据的特殊性目前三十六页\总数一百四十二页\编于十八点

经典模型的基本假定是单一水平和单一的随机误差项,并假定随机误差项独立、服从方差为常量的正态分布,代表不能用模型解释的残留的随机成份。

当数据存在层次结构时,随机误差项则不满足独立常方差的假定。模型的误差项不仅包含了模型不能解释的应变量的残差成份,也包含了高水平单位自身对应变量的效应成份。构建与数据层次结构相适应的复杂误差结构,这是多水平模型区别于经典模型的根本特征。

基本的多水平模型随机结局?随机斜率?加入水平1解释变量?水平2解释变量?目前三十七页\总数一百四十二页\编于十八点固定效应:某研究中有多个不同的处理因素,若研究者感兴趣的各种处理因素都设计在研究当中,则认为这一因素具有固定效应。Y0=b0+xy1=b1+x随机效应:若处理包含的各个组别是从更大的总体中得到的随机样本,则认为该处理因素具有随机效应。Y0=bj+xbj=b0+uj目前三十八页\总数一百四十二页\编于十八点多层统计分析模型目录:1.方差成分模型2.随机系数模型3.模型参数估计方法4.反应变量向量的协方差结构(了解)5.假设检验6.在多层模型中其他注意事项目前三十九页\总数一百四十二页\编于十八点方差成分模型1.1固定效应模型1.2不含协变量的随机效应方差成分模型(空模型)1.3含协变量的随机效应方差成分模型1.方差成份模型(多水平模型中最简单的)

(VarianceComponentModel)目前四十页\总数一百四十二页\编于十八点

1.1固定效应模型某研究中有多个不同处理因素,若研究者感兴趣的各种处理都设计在研究当中,则认为这一因素具有固定效应,如以下例2.1中对小白鼠给予三种不同的营养素。目前四十一页\总数一百四十二页\编于十八点目前四十二页\总数一百四十二页\编于十八点若处理包含的各个组别是从更大的总体中得到的随机样本,则认为该处理因素具有随机效应,如以下例2.2中病人对社区医生服务的满意度研究。1.2随机效应方差成分模型(不含协变量)目前四十三页\总数一百四十二页\编于十八点目前四十四页\总数一百四十二页\编于十八点假定一个两水平的层次结构数据,医院为水平2单位,患者为水平1单位,医院为相应总体的随机样本,模型中仅有一个解释变量X。1.3含协变量的随机效应方差成分模型

和分别为第j个医院中第i个患者应变量观测值和解释变量观测值,和为参数估计,为通常的随机误差项。示水平2单位示水平1单位目前四十五页\总数一百四十二页\编于十八点以医院和患者为例:目前四十六页\总数一百四十二页\编于十八点在方差成份模型中表示j个截距值,即当x

取0时,第j个医院在基线水平时y的平均估计值。为平均截距,反映与的平均关系,即当x取0时,所有y的总平均估计值。为随机变量,表示第j个医院y之平均估计值与总均数的离差值,反映了第j个医院对y的随机效应。目前四十七页\总数一百四十二页\编于十八点

方差成份模型拟合j条平行的回归线,截距不同(),斜率相同()。

解释变量xyij1固定效应模型2不含协变量的随机效应方差成分模型(空模型)3含协变量的随机效应方差成分模型通过图形展示模型目前四十八页\总数一百四十二页\编于十八点对水平2(医院水平)残差的假定对水平1(患者水平)残差的假定与传统模型一致

水平1上的残差与水平2上的残差相互独立,,了解模型假定目前四十九页\总数一百四十二页\编于十八点此模型需估计4个参数,除两个固定系数和,还需估计两个随机参数和。其中即为医院水平的方差成份,为患者水平的方差成份。这四个参数是我们运行SAS程序,重点关注的!确定了这四个参数这个模型也就知道了。模型的参数估计目前五十页\总数一百四十二页\编于十八点组内相关的度量方差成份模型中,应变量方差为总方差目前五十一页\总数一百四十二页\编于十八点应变量方差,即水平2和水平1方差之和。同一医院中两个患者(用i1,i2

表示)间的协方差为:假定同一医院的随机残差是相互独立的。组内相关的度量建立多层模型的第一步,就是检验其是否为0.目前五十二页\总数一百四十二页\编于十八点组内相关(intra-classcorrelation,ICC)代表组间方差,组水平方差。代表组内方差,个体水平方差

ICC测量了医院间方差占总方差的比例,实际上它反映了医院内个体间相关,即水平1单位(患者)在水平2单位(医院)中的聚集性或相似性。当组内各个体间趋于相互独立时,ICC趋于0,表示没有群组效应,此时多层模型可简化为固定效应模型。ICC的显著性检验相当于组间方差为“零”的假设检验。目前五十三页\总数一百四十二页\编于十八点方差成分模型SAS程序(procmixed)*emptymodel;procmixedcovtestmethod=ML;/*默认估计方法为REML;covtest选项要求打印出随机效应方差/协方差参数估计值的标准误和Z检验结果*/classsite;Modelinject=/solution;Randomint/subject=sitetype=un;Run;*拟合含年龄协变量的模型;procmixedcovtestmethod=ML;classsite;Modelinject=age/solution;Randomint/subject=sitetype=un;Run;目前五十四页\总数一百四十二页\编于十八点

2.随机系数模型(RandomCoefficientModel)

仍以医院和患者为例,水平1模型。随机斜率,表明协变量对反应变量的效应在各个医院间是不同的。

表示第j个医院的y随x变化的斜率;表示全部医院的y随x变化的斜率的平均值(平均斜率)。是指各医院的y随x变化的斜率的方差。水平2模型模型假定截距离差和斜率离差值的协方差,反应它们之间的相关关系目前五十五页\总数一百四十二页\编于十八点

随机系数模型拟合j条不平行平行的回归线,截距不同,斜率不同

解释变量xyij目前五十六页\总数一百四十二页\编于十八点

即表达为固定部分与随机部分之和。其中,固定效应用均数描述,它决定了全部医院的平均回归线,这条直线的截距即平均截距,直线的斜率即平均斜率。为随机系数。将模型改记为:目前五十七页\总数一百四十二页\编于十八点

随机效应用方差描述,它反映了各医院之间

y

的变异与协变量x的关系。模型随机部分具多个残差项,需估计4个随机参数,即方差、和以及协方差。目前五十八页\总数一百四十二页\编于十八点模型的反应变量方差为:

表明各医院间y的变异与协变量x有关,即每条回归线不仅截距不同,且斜率也不同。当x取0时每个医院y的平均估计值不同,且每个医院y随x变化的斜率不同。目前五十九页\总数一百四十二页\编于十八点组内相关与解释变量有关

值得指出,模型随机部分的解释变量常为其固定部分的一个子集,但亦可以不是。换言之,可以在模型的固定部分或随机部分纳入任何水平上测量的解释变量。目前六十页\总数一百四十二页\编于十八点3、模型参数估计方法目前六十一页\总数一百四十二页\编于十八点3.1最大似然法(ML)包括普通最大似然法(ML)和限制性最大似然法(REML);限制性最大似然法又称作残差最大似然法(residualML)。两者用于估计的残差基础不同,后者的残差包括所有的随机变异;最大似然估计(ML)限制性最大似然估计(REML)此法是SAS的MIXED过程和HLM的默认算法;通常用于组数量较少的模型模型比较时当比较随机效应相同,但固定效应不同的模型时,模型估计须采用ML;ML较灵活,当模型的固定效应和随机效应都不同时,但两者的随机效应是嵌套关系时,可以采用ML法对模型进行比较。当比较随机效应不同,但固定效应相同的模型时,模型估计需用REML较快较优,当模型比较完成后,需用REML法运行“最终”模型,并报告REML估计结果,因为REML估计较ML估计更精确。推荐(我没找到):Littell等(1996,《SASsystemformixedmodel》)如何用ML和限制性ML估计矩阵G和R。目前六十二页\总数一百四十二页\编于十八点最小二乘法(LS)包括迭代广义最小二乘法(IGLS)和限制性迭代广义最小二乘法(RIGLS)都以普通最小二乘估计(OLS)为初始值进行迭代;地位及相对关系大致等同于ML和REML;是MLwiN使用的算法。目前六十三页\总数一百四十二页\编于十八点经验Bayes方法(EB)“收缩估计(shrinkageestimator)”以可靠性权重确定最后的估计值;对于某些样本量很小的组,则更多的使用总样本的信息,进行“借力(borrowstrength)”目前六十四页\总数一百四十二页\编于十八点经验Bayes方法目前六十五页\总数一百四十二页\编于十八点目前六十六页\总数一百四十二页\编于十八点空模型的可靠性权重目前六十七页\总数一百四十二页\编于十八点对模型拟合的评价SAS给出:-2LL(-2倍的loglikelihood),AIC,AICC,BIC等统计量,其值越小越好;只在比较模型时有用;对于嵌套模型,使用LR检验(似然比检验);对于非嵌套模型,LR检验便不再适用,使用AIC,AICC和BIC检验;目前六十八页\总数一百四十二页\编于十八点4、反应变量向量的协方差结构(了解)

从最基本的两水平数据结构来考察反应变量向量的协方差结构,即只包括随机参数和。对应于方差成份模型,反应变量方差为水平1和水平2方差之和:4.1方差成分模型的协方差结构目前六十九页\总数一百四十二页\编于十八点

同一个医院所诊疗的两个患者(用,表示)间的协方差为:目前七十页\总数一百四十二页\编于十八点因此,同一医院所诊疗的三名患者的协差阵为目前七十一页\总数一百四十二页\编于十八点

对两个医院而言,若一个医院诊疗了三名患者,另一个医院诊疗了两个患者,则具有2个水平2单位的反应变量向量Y总的协差阵可表达为:目前七十二页\总数一百四十二页\编于十八点目前七十三页\总数一百四十二页\编于十八点

矩阵的这种分块对角结构表达了不同医院所诊疗的患者间的协方差为0,它可进一步扩展到任意多的医院数。将上述矩阵表达为另一种更简略的形式:目前七十四页\总数一百四十二页\编于十八点

为维的1矩阵,为维的单位阵,的下标2表明为两水平模型,的维数即水平2单位数,主对角线块的维数即水平1单位数,它们均为方阵。在传统OLS估计中,为0,则该协差阵退化为标准形式的,即残差方差。目前七十五页\总数一百四十二页\编于十八点考察包括随机系数的一般形式的两水平模型或简记为4.2随机系数模型的协方差结构目前七十六页\总数一百四十二页\编于十八点

对于具有随机截距与斜率的两水平模型,其反应变量协差阵具有以下典型的分块结构:目前七十七页\总数一百四十二页\编于十八点

矩阵为水平2的随机截距与斜率的协差阵,即随机系数协差阵,矩阵为水平1的随机系数协差阵。这里,水平1只有一个单一的方差项,可进一步采用表示这些协差阵集。将上述矩阵展开得到:目前七十八页\总数一百四十二页\编于十八点

这是具有分块结构的一个具有2个水平1单位的水平2单位的反应变量协差阵。此即构造反应变量协差阵的一般模式,它同时也概括了拟合水平1复杂变异的可能性。目前七十九页\总数一百四十二页\编于十八点

5.假设检验全局检验:F检验;局部检验:随机效应假设检验:固定效应假设检验:目前八十页\总数一百四十二页\编于十八点在残差方差/协方差的显著检验中,需注意的问题:目前八十一页\总数一百四十二页\编于十八点6.在多层模型中其他注意事项6.1跨层交互作用6.2测量中心化6.3建模的一般步骤目前八十二页\总数一百四十二页\编于十八点6.1跨层交互作用评估目前八十三页\总数一百四十二页\编于十八点*;…Procmixedmethod=REMLcontestIC;Classsite;Modelinject=HIV_Region|ethnicgendergdmc_agehighsch/SOLUTIONDDFM=BWnotest;Randomintethnic/subject=siteGtype=UN;Run;目前八十四页\总数一百四十二页\编于十八点目前八十五页\总数一百四十二页\编于十八点6.2测量中心化一个连续变量,无论是水平1还是水平2连续变量,如果没有一个有意义的零值,则需要进行中心化,又称定位(Scaling)。例如:在一个带有成人年龄观察值的回归模型中,与0岁相对应的因变量值就没有意义。必须通过中心化重新定义或转化年龄的测量值,如将样本中的每个年龄测量值减去样本平均年龄。这样,回归截距就代表样本中具有平均年龄者的结局测量相应的期望值。尤其是模型中存在跨层交互作用时,注意测量中心化解释回归截距有助于解释交互作用中变量的主效应中心化作用目前八十六页\总数一百四十二页\编于十八点

6.3多层模型建立的一般步骤:运行空模型以获得ICC,判断是否进行多层模型拟合;加入水平2解释变量;加入水平1解释变量;检验水平1随机斜率;检验跨水平交互作用(全模型)。SAS实现程序模型比较:对于非嵌套模型,LR检验便不再适用。在这种情况下,可以用信息标准测量如AIC、AICC和BIC等进行模型比较。目前八十七页\总数一百四十二页\编于十八点建模一般步骤1)运行空模型,以获得ICC,判断是否进行多层模型拟合;2)加入水平2解释变量,即在空模型中加入组水平变量来解释这种变异。(注:所考虑的组水平变量数不能多于组群数;)。区分水平2解释变量和水平1解释变量?目前八十八页\总数一百四十二页\编于十八点3)将水平1解释变量纳入截距模型。并将所有的水平1斜率看作是固定斜率。当用LR检验比较具有相同随机效应,而不同固定效应的模型时,模型估计需用ML法,而不用REML。目前八十九页\总数一百四十二页\编于十八点

4)检验水平1随机斜率;

目前九十页\总数一百四十二页\编于十八点5)检验跨水平交互作用目前九十一页\总数一百四十二页\编于十八点目前九十二页\总数一百四十二页\编于十八点

发展模型

--------针对纵向数据的多水平模型目前九十三页\总数一百四十二页\编于十八点发展模型建模的顺序1)水平1加入时间因素的随机截距模型2)随机截距斜率模型3)治疗效应的评估(加入一个水平2解释变量,影响随机结局和随机斜率)(与时间可能有交互作用的协变量)4)在模型中控制个体背景协变量(加入多个水平2解释变量,只影响随机截距,如基线年龄、性别等,不会与时间发生交互作用,因为个体背景不会随时间变化)5)加入时间变化协变量水平(水平1解释变量)

与多层线性模型,步骤基本相同。目前九十四页\总数一百四十二页\编于十八点4.6线性发展模型4.6.1结局测量随时间变化的形式4.6.2随机截距发展模型4.6.3随机截距-斜率发展模型4.6.4治疗效应的评估4.6.5在模型中控制个体背景协变量4.6.6时间尺度编码4.6.7设定残差方差/协方差结构4.6.8在模型中纳入时间变化协变量4.7曲线发展模型来源:《多层统计分析模型---方法与应用》目前九十五页\总数一百四十二页\编于十八点发展模型(示例)固定效应成分随机效应成分个体间随机效应个体内随机效应/残差项目前九十六页\总数一百四十二页\编于十八点目前九十七页\总数一百四十二页\编于十八点数据需整理成这样的形式:目前九十八页\总数一百四十二页\编于十八点结局测量随时间变化的形式目前九十九页\总数一百四十二页\编于十八点如果含有随机截距或斜率,说明了初始水平或变化率,会因j/水平2/不同个体不同而变化。随机结局发展模型的个体发展趋势线与模型估计的总体发展趋势线平行。目前一百页\总数一百四十二页\编于十八点目前一百零一页\总数一百四十二页\编于十八点*SASProgram4.6.2-1;OptionsnocenterPs=500Ls=150;libnamelib'd:\MLM\data';datadata1;setlib.ML;procmixedcovtestnoclprint;classid;ididtimeqol;/*设定哪些变量被包含在新的SAS输出数据中*//*这里变量ID,TIME和QOL,以及模型估计的结局预测值PRED同时被包括入在model语句中的outp选项所定义的SAS输出数据集PQOL中。*/modelqol=time/sDDFM=KRoutp=PQOL(keep=idtimeQOLPRED);RandomInt/subject=ID;/*要求SAS拟合随机截距模型*/Run;ProcGplotdata=PQOL;Symbol1v=nonerepeat=203i=joincolor=cyan;Symbol2v=nonei=sm50scolor=redw=4;Plotpred*time=id/haxis=0to6nolegend;Plot2PRED*Time;labelTime=Month;title'fittedindividualandaveragelinesforrandominterceptmodel';run;quit;目前一百零二页\总数一百四十二页\编于十八点目前一百零三页\总数一百四十二页\编于十八点水平2残差方差水平1残差方差显著,可以拟合多层模型目前一百零四页\总数一百四十二页\编于十八点目前一百零五页\总数一百四十二页\编于十八点目前一百零六页\总数一百四十二页\编于十八点目前一百零七页\总数一百四十二页\编于十八点*SASProgram4.6.3-1;procmixedcovtestnoclprint;classid;ididtimeqol;*设定哪些变量被包含在新输出数据中modelqol=time/sddfm=kRoutp=PQOL(keep=idtimeQolPred);randominttime/subject=idGtype=UN;run;procgplotdata=PQOL;symbol1v=nonerepeat=203i=joincolor=cyan;symbol2v=nonei=sm50scolor=redw=4;plotpred*time=id/haxis=0to6nolegend;plot2pred*time;labletime=month;title'fittedindividualandaveragelinesforrandominterceptmodel';run;quit;作图与之前的随机截距发展模型的不同之处目前一百零八页\总数一百四十二页\编于十八点目前一百零九页\总数一百四十二页\编于十八点目前一百一十页\总数一百四十二页\编于十八点加入水平2解释变量目前一百一十一页\总数一百四十二页\编于十八点*SASProgram4.6.4-1;procmixedMethod=REMLcovtestnoclprint;classid;modelqol=trt|time/sddfm=kR;/*同时设定了trt和time的主效应和交互效应*/randominttime/subject=idGtype=UN;run;目前一百一十二页\总数一百四十二页\编于十八点目前一百一十三页\总数一百四十二页\编于十八点目前一百一十四页\总数一百四十二页\编于十八点*SASProgram4.6.5-1;procmixedcovtestnoclprintIC;classid;ididtimeqol;*设定哪些变量被包含在新输出数据中modelqol=trt|timeagegenderedudiagnosis/sddfm=kRnotest;randominttime/subject=idGtype=UN;run;目前一百一十五页\总数一百四十二页\编于十八点目前一百一十六页\总数一百四十二页\编于十八点尺度:关注两个问题0值在哪?解释意义刻度大小的实际意义?需要注意的问题目前一百一十七页\总数一百四十二页\编于十八点*SASProgram4.6.6-1;time_end=time-6;*recordtimescore;procmixedcovtestnoclprintIC;classid;ididtimeqol;*设定哪些变量被包含在新输出数据中modelqol=trt|time_end/sddfm=kRnotest;randominttime_end/subject=idGtype=UN;run;目前一百一十八页\总数一百四十二页\编于十八点目前一百一十九页\总数一百四十二页\编于十八点4.6.7设定残差/协方差结构与传统的回归分析一样,目前在多层模型分析中,一般假设变量无测量误差。但新发展的多层结构方程模型(不讨论)可在分析多层数据的同时,处理测量误差。其实,这两类模型的差别不是很严格,随机系数发展模型也可视为一种特殊的协方差模型。为了确定合适的剩余方差/协方差结构,一般说,应首先检查无特定结构或非结构性残差方差/协方差以及相关系数矩阵。随机系数发展模型通过设定随机结局、随机斜率,我们分析了结局测量初始水平和变化率的个体间变异协方差模式模型我们还可以通过设定适当的残差方差/协方差结构,从分析个体内变异的角度来构建模型。从个体间变异和个体内变异两个角度来构建模型我们还可以同时设定随机效应和残差方差/协方差结构目前一百二十页\总数一百四十二页\编于十八点发展模型(示例)固定效应成分随机效应成分个体间随机效应个体内随机效应/残差项目前一百二十一页\总数一百四十二页\编于十八点目前一百二十二页\总数一百四十二页\编于十八点目前一百二十三页\总数一百四十二页\编于十八点*SASProgram4.6.7-1;timec=time;procmixedcovtestnoclprint;classidtimec;modelqol=trt|time/sddfm=kR;repeatedtimec/subject=idRRcorrtype=UN;/*将timec处理为代表时间点的一组虚拟变量,以保证在某些时间点有缺失观察值的情况下,SAS能够正确地按时间点排列数据。*/run;先前的随机系数发展模型中个,用random语句分析个体“间”变异,这里增加了repeated语句,用来分析个体“内”变异。Repeated语句中的R及Corr,分别要求打印出模型的残差方差/协方差矩阵和残差相关系数矩阵。目前一百二十四页\总数一百四十二页\编于十八点在SAS程序中,5种常见的残差方差/协方差结构来拟合模型:非结构性残差方差/协方差结构(UN):其所有的残差/协方差参数具有不同的估计值。复合对称残差方差/协方差结构(CS):假设所有的方差和协方差分别相等,仅需估计两个参数,共同方差和共同协方差;一阶自回归残差方差/协方差结构(AR(1)):是时间序列数据中很常见的一种残差方差/协方差结构,它假设残差方差相等,以及时滞残差(timelagresiuals)间的相关系数随时间而呈指数衰减。Toeplitz残差方差/协方差结构(TOEP):适用于共同方差、但任意时滞相关残差的时间序列结构。其不假设序列相关系数随时间而衰减,因此,比AR(1)局限性小。Huynh-Feldt残差方差/协方差结构(HF):选项设定异值复合对称残差方差/协方差结构,其假设残差方差不同,每个协方差由两个相关方差的均值减去一个常数参数取得。可以说AR(1)是TOEP结构的特殊形式;CS是HR结构的特殊形式。随机系数模型是将方差分成两部分:随机效应或个体间变异和残差方差或测量误差。随机系数模型通过将个体间随机变异纳入模型,但假设残差方差/协方差矩阵为单位矩阵,来分析结局总方差,事实上,随机截距模型与CS模型相同,而随机截距-斜率模型可被认为是CS模型的扩展。目前一百二十五页\总数一百四十二页\编于十八点Timec=time;%macroFit(cov);Odsexcludeclasslevelsiterhistory;ProcMixedcovtestnoclprint;Classidtimec;ModelQOL=Trt|timeddfm=KR;Repeatedtimec/subject=idRrcorrtype=&cov;Run;%mendfit;%fit(un);%fit(cs);%fit(AR(1));%fit(toep);%fit(HF)目前一百二十六页\总数一百四十二页\编于十八点目前一百二十七页\总数一百四十二页\编于十八点目前一百二十八页\总数一百四十二页\编于十八点目前一百二十九页\总数一百四十二页\编于十八点目前一百三十页\总数一百四十二页\编于十八点4.7曲线发展模型多项式曲线发展模型“加入time2”高次方多项式发展模型中共线性问题的处理分段发展模

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论