版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、协方差分析与混合线性模型详解演示文稿第一页,共三十三页。优选协方差分析与混合线性模型第二页,共三十三页。 这种不是在试验中控制某个因素,而是在试验后对该因素的影响进行估计,并对试验指标的值作出调整的方法称为统计控制,可以作为试验控制的辅助手段。以统计控制为目的,综合线性回归分析与方差分析所得到的统计分析方法,称为协方差分析,所需要统计控制的一个或多个因素,例如苹果树的长势,又如动物的初重等等称为协变量。1 协方差分析思想原理第三页,共三十三页。2 单因素协方差分析-理论第四页,共三十三页。2 单因素协方差分析-理论第五页,共三十三页。2 单因素协方差分析-理论第六页,共三十三页。2 单因素协方
2、差分析-理论第七页,共三十三页。2 单因素协方差分析-计算第八页,共三十三页。data ex; do a=1 to 3;do i=1 to 8;input x y ;output ;end;end;cards;47 54 58 66 53 63 46 51 49 56 56 66 54 61 44 50 52 54 53 53 64 67 58 62 59 62 61 63 63 64 66 69 44 52 48 58 46 54 50 61 59 70 57 64 58 69 53 66 ; proc glm;class a;model y=x a/solution;lsmeans a/s
3、tderr pdiff;run;2 单因素协方差分析-计算第九页,共三十三页。2 单因素协方差分析-计算第十页,共三十三页。 施用三种肥料的产量矫正后有极显著的差异 2 单因素协方差分析-计算第十一页,共三十三页。3双因素协方差分析-不考虑交互作用 方差来源平方和自由度 均方和 F值 显著性 A QA r-1 MQA FA B QB s-1 MQB FB 误差 QErs-r-s MQE 总和 QT rs-2第十二页,共三十三页。3双因素协方差分析-不考虑交互作用第十三页,共三十三页。 data ex;do a=1 to 3 ;do b=1 to 5 ;input x y ;output; en
4、d; end;cards;8 2.85 10 4.24 12 3.00 11 4.94 10 2.8810 3.14 12 4.50 7 2.75 12 5.84 10 4.0612 3.88 10 3.86 9 2.82 10 4.94 9 2.89;proc glm;class a b ;model y=x a b/solution;lsmeans a b/stderr pdiff;run;3双因素协方差分析-不考虑交互作用第十四页,共三十三页。3双因素协方差分析-不考虑交互作用第十五页,共三十三页。 方差来源平方和自由度 均方和 F值 显著性 A0.6046 2 0.3023 2.49
5、N B7.1245 4 1.781114.66 * 误差0.8502 7 0.1215 总和8.5793 1各小区的产量矫正后没有显著的差异,各品种的产量矫正后有极显著的差异。3双因素协方差分析-不考虑交互作用第十六页,共三十三页。 方差来源平方和自由度 均方和 F值 显著性 A QA r-1 MQA FA B QB s-1 MQB FB AB QAB(r-1)(s-1) MQAB FAB 误差 QErs(m-1)-1 MQE 总和 QT rsm-24双因素协方差分析-考虑交互作用第十七页,共三十三页。4双因素协方差分析-考虑交互作用第十八页,共三十三页。data ex; do a=1 to
6、4; do b=1 to 2;do i=1 to 2;input x y;output;end;end;end;cards;14.6 97.8 12.1 94.2 19.5 11.2 18.8110.1 1.6 100.3 12.9 98.5 18.5 119.4 12.2 114.7 12.8 99.2 10.7 89.612.2122.2 16.9 105.3 12.0 102.1 12.4 103.8 16.4 117.2 17.2 117.9proc glm; class a b;model y=x a ba*b/solution;lsmeans a b/stderr pdiff;ru
7、n;4双因素协方差分析-考虑交互作用第十九页,共三十三页。4双因素协方差分析-考虑交互作用第二十页,共三十三页。 方差来源 平方和自由度 均方和 F值显著性 A277.43485 392.4782866.51 * B 2.845259 3 2.845259 0.20 N AB 12.848100 1 4.282700 0.30 N 误差 99.441171 714.205882 A与B的交互作用矫正后不显著,促生长剂之间的差异极显著,试验批次间的差异不显著 4双因素协方差分析-考虑交互作用第二十一页,共三十三页。3.混合线性模型通过一个例子讲述混合线性模型的使用艾滋病疗法的评价艾滋病是当前人类
8、社会最严重的瘟疫之一,从1981年发现以来的20多年间,它已经吞噬了近3000万人的生命。艾滋病的医学全名为“获得性免疫缺损综合症”,英文简称AIDS,它是由艾滋病毒(医学全名为“人体免疫缺损病毒”, 英文简称HIV)引起的。这种病毒破坏人的免疫系统,使人体丧失抵抗各种疾病的能力,从而严重危害人的生命。人类免疫系统的CD4细胞在抵御HIV的入侵中起着重要作用,当CD4被HIV感染而裂解时,其数量会急剧减少,HIV将迅速增加,导致AIDS发作。第二十二页,共三十三页。3.混合线性模型艾滋病治疗的目的,是尽量减少人体内HIV的数量,同时产生更多的CD4,至少要有效地降低CD4减少的速度,以提高人体
9、免疫能力。迄今为止人类还没有找到能根治AIDS的疗法,目前的一些AIDS疗法不仅对人体有副作用,而且成本也很高。许多国家和医疗组织都在积极试验、寻找更好的AIDS疗法。第二十三页,共三十三页。3.混合线性模型请你完成以下问题:(1)利用附件1的数据,预测继续治疗的效果,或者确定最佳治疗终止时间(继续治疗指在测试终止后继续服药,如果认为继续服药效果不好,则可选择提前终止治疗)。(2)利用附件2的数据,评价4种疗法的优劣(仅以CD4为标准),并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间。(3) 艾滋病药品的主要供给商对不发达国家提供的药品价格如下:600mg zidovudine 1
10、.60美元,400mg didanosine 0.85美元,2.25 mg zalcitabine 1.85美元,400 mg nevirapine 1.20美元。如果病人需要考虑4种疗法的费用,对(2)中的评价和预测(或者提前终止)有什么改变。第二十四页,共三十三页。3.混合线性模型ID 疗法 年龄 时间 Log(CD4 count+1) 1236.427103.1355 1236.42717.57143.0445 1236.427115.57142.7726 1236.427123.57142.8332 1236.427132.57143.2189 1236.4271403.0445 24
11、47.846703.0681 2447.846783.8918 2447.8467163.9703 2447.8467233.6109 2447.846730.71433.3322 2447.8467393.0910 3160.287503.7377 4336.596904.1190 4336.59697.14294.1109 4336.596916.14294.7095 第二十五页,共三十三页。3.混合线性模型1对4种疗法的疗效评价的分析对题目所给的附件2的数据进行分析可知,决定病人的CD4的浓度的因素有年龄,检查的时刻,治疗方案这三个因素。因此我们将年龄分成5类,检查的时刻分为4个时间段,
12、治疗方案有4种。而问题是以CD4的浓度为标准来评价疗效的优劣,即CD4的浓度越大,那么疗效越好。由于考虑题中所给的样本有6000多个(病人的个数*各个病人检查的次数),因此我们考虑用MIXED(混合线性模型)。下面我们就混合线性模型的原理进行说明。第二十六页,共三十三页。3.混合线性模型混合线性模型过程是拟合许多不同数据的混合线性模型,并利用所拟合的模型对数据进行统计推断。首先混合线性模型的主要假设是数据服从正态分布,由于本题所给的数据的样本容量有6000多个,因此,我们可认为它服从正态分布。又由于正态分布的数据可完全有均值和方差确定,因此一个混合线性模型是由两个模型决定的。分别是均值模型和方
13、差模型。MIXED使用约束最大似然的方法来拟合数据的。一旦数据的模型已经建立,我们可以使用该模型通过固定效应参数和协方差参数进行统计推断。用这些统计量可以对模型进行评价。第二十七页,共三十三页。3.混合线性模型再者,该分析的重要假设是数据是正态分布的,由于我们将附录2的数据进行了分类。由于数据出现在类(如可能是同一年龄段中),那可能的情况是来自同一年龄段的这些CD4的值是相关的,不是独立的。鉴于此,由于附录2所给的数据是高度数据(即样本容量很大),那么考虑这种因素是相关。因此我们对这些因素进行相关性建模,我们使用随机效用。在本题中,我们规定年龄、检查时刻为随机效应,即使得具有相同年龄水平或相同
14、检查时刻的水平之间存在共同的相关性,那么,此模型才较为合理。第二十八页,共三十三页。3.混合线性模型2 对4种疗法的疗效模型的建立1)数据的处理a、所有病人的年龄是在14.9021,74.193的区间内,以(74.193-14.9021)/5=11.85818为区间长度。我们将患者按照年龄阶段分为5级,分别记作1至5(如表4所示);b、我们将患者所接受的治疗方法分为4种,分别记作1至4;c、我们将病人的检查的时刻0,40以10为区间长度,分为4级,分别记作1至4 第二十九页,共三十三页。3.混合线性模型第三十页,共三十三页。3.混合线性模型2)确定固定效应和随机效应固定效用是设计者所研究的因素,在此题中为4种疗法。因为病人的年龄是随机的,并且病人接受检验的时刻是也是随机进行的,故病人的年龄和病人接受检验的治疗时刻应该为随机效应。第三十一页,共三十三页。3.混合线性模型3)协方差结构的选择模型中具体选用哪种结构矩阵:在相同模型
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 施工日志填写样本的格式要求
- 设计思维在医疗技术创新中的应用
- 智能科技在家校互动中的应用与前景展望
- DB4415T 50-2025黑芝麻种植技术规程
- 个人贷款合同协议书范本
- 亲属间房产赠与合同
- 二手建筑设备买卖合同样本
- 乒乓球馆租赁合同书范本
- 不可撤销劳动合同案例析:劳动者权益保障
- 专业工作室服务合作合同样本
- 数据中心运维方案
- 小龙虾啤酒音乐节活动策划方案课件
- 运动技能学习与控制课件第五章运动中的中枢控制
- 财务部规范化管理 流程图
- 苏教版2023年小学四年级数学下册教学计划+教学进度表
- 小学作文指导《难忘的一件事》课件
- 断绝关系协议书范文参考(5篇)
- 量子力学课件1-2章-波函数-定态薛定谔方程
- 最新变态心理学课件
- 【自考练习题】石家庄学院概率论与数理统计真题汇总(附答案解析)
- 农村集体“三资”管理流程图
评论
0/150
提交评论