1_多元统计分析方法简介.ppt_第1页
1_多元统计分析方法简介.ppt_第2页
1_多元统计分析方法简介.ppt_第3页
1_多元统计分析方法简介.ppt_第4页
1_多元统计分析方法简介.ppt_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、多元统计分析方法,The Methods of Multivariate Statistical Analysis,研究生选修课,主讲教师:张家放 (副教授) 工作单位:公共卫生学院 流行病与卫生统计学系 工作地点:公共卫生学院大楼,4层 联系电话:83644195(w),85623051(h)教材:医用多元统计方法 张家放主编 教学时数:36 学 分: 2 上课时间:一、四下午 上课地点:1号楼3中,参考书:医学统计学与电脑实验 方积乾主编 上海科学技术出版社 现代统计学与SAS应用 胡良平主编 军事医学科学出版社,第一章 绪论,多元统计学简介,什么是多元统计学 多

2、元统计学与基本统计学的区别 多元统计学在医学研究中的地位 多元统计学的主要应用 如何学习多元统计分析方法,一、什么是多元统计学?,统计学,1、什么是统计学?,例如:比较甲乙两个地区学生的视力情况,地区 甲 乙 学生人数 100000 200000 抽样人数 1000 2000 近视人数 300 400,结论:甲地区的学生视力比乙地区的差。,推断:1) 这个结论正确吗? 2) 这个结论的可信度是多少?,结果: 30% 不正常 20% 不正常,统计学:,结论 conclusions,总体 population,样本 sample,利用样本推断总体特性的一门科学,统计学的主要任务:,结论 concl

3、usions,总体 population,样本 sample,Sampling,Estimation,Evaluation,SEE,统计学的主要用途:,- 比较参数:H0: =72 vs H1: 72 - 分析关联性:H0: =0 vs H1: 0 - 分析依存性:H0: =0 vs H1: 0,2、什么是多元统计学?,统计学,基本统计学的主要内容:,t-检验,方差分析 卡方检验 简单相关分析 简单回归分析,12 变量,多元统计学的主要内容:,多变量方差分析 多变量相关分析 多变量回归分析,多个变量,各种设计资料的方差分析:,完全随机设计资料的单因素方差分析 随机区组设计资料的两因素方差分析

4、析因设计资料的多因素的方差分析 拉丁方设计资料的三因素方差分析 嵌套设计资料的多因素方差分析 裂区设计资料的多因素方差分析 单因素重复测量资料的方差分析 双因素重复测量资料的方差分析 交叉设计资料的多因素方差分析,- 简单相关分析:(x,y) - 偏相关分析: (x,y|z) - 复相关分析: (y,x1,x2,.xk) - 典型相关分析:(x1,x2,.xk; y1,y2,.yp),各种类型的相关分析:,单变量回归分析 : - 线性和非线性回归分析 - Logistic回归分析 - 生存时间回归分析 - 时间序列回归分析 - 对数线性模型分析 多变量回归分析 : - 路径分析 - 结构方程模

5、型分析,各种类型的回归分析:,- 聚类分析 - 因子分析 - 主成分分析 - 对应分析,各种类型的分类分析:,二、多元统计与基本统计的区别,较少变量,较多变量,实用性较差,实用性较强,较简单,较复杂,不够准确,更准确,MSA,BSA,例如:用四种不同方法治疗8名患者,其血浆凝固时间的资料列在下表中。试分析治疗方法对血浆凝固时间的影响。 治疗方法与浆凝固时间的资料,Source DF Sum of Squares Mean Square F Value Pr F A 3 13.01625000 4.33875000 1.31 0.2909 Error 28 92.76250000 3.31294

6、643 Corrected Total 31 105.77875000,不考虑个体差异-单因素方差分析结果:,Source DF Anova SS Mean Square F Value Pr F A 3 13.01625000 4.33875000 6.62 0.0025 B 7 78.98875000 11.28410714 17.20 0.0001 Error 21 13.77375000 0.65589286 Corrected Total 31 105.77875000,考虑个体差异-双因素方差分析结果:,-四种治疗方法对血浆的凝固时间有显著性差异,-四种治疗方法对血浆的凝固时间无显

7、著性差异,例如:为了研究两种药物对癫疯病菌的治疗效果,将30名病人随机分成3组,一组使用抗生素A,一组使用抗生素D,另一组作为对照组使用安慰剂。治疗前和治疗后分别对病人身体的癫疯病菌数量进行了检测,病菌的数量是由每一个病人身体上六个部位病菌感染的程度而定的,数据列在下表3中。试对该试验研究进行统计分析。,Source DF Type I SS Mean Square F Value Pr F DRUG 2 293.60000000 146.80000000 9.15 0.0010,Source DF Type III SS Mean Square F Value Pr F DRUG 2 68.

8、55371060 34.27685530 2.14 0.1384 X 1 577.89740304 577.89740304 36.01 0.0001,未校正用药前的病菌数量:,校正了用药前的病菌数量:,-三种药物的治疗效果有显著性差异,-三种药物的治疗效果无显著性差异,doctor,patients,data,evaluate treatment,statistical analysis,improved knowledge,feedback,三、多元统计学在医学研究中的地位,Example of complexity in medical study,physical activity,e

9、ating,drinking,smoking,social economic status,endured glucose,blood pressure,weight,cholesterol,diabetes,coronary heart disease,environment,life style,endogeneous factors,diseases,它扩展了统计分析的应用范围,提高了统计分析结果的准确性; 它不仅是医学科学研究中不可缺少的一个重要工具,而且它是促进医学科学发展的一门重要相关学科。,多元统计学在医学研究中的价值,MSA是高级医科研究人员应当掌握的现代知识。,Advance

10、d,Elementary,MSA,BSA,1、分析各种复杂的研究设计所得到的数据 -多变量方差分析 2、分析多个变量之间的各种复杂的关系 -多变量回归分析,四、多元统计学的主要应用,1、各种设计资料的方差分析,完全随机设计资料的单因素方差分析 随机区组设计资料的两因素方差分析 析因设计资料的多因素的方差分析 拉丁方设计资料的三因素方差分析 嵌套设计资料的多因素方差分析 裂区设计资料的多因素方差分析 单因素重复测量资料的方差分析 双因素重复测量资料的方差分析 交叉设计资料的多因素方差分析,完全随机设计资料的应用实例: 19 只小猪被随机地分到四个试验组分别给与四种不同的饲料喂养。两个月后测量其体

11、重 (kg),数据列在下面表中。试分析用这四种饲料喂养的效果是否有显著性区别?,feed1 feed2 feed3 feed4 60.8 68.7 102.6 87.9 57.0 67.7 102.1 84.2 65.0 74.0 100.2 83.1 58.6 66.3 96.5 85.7 61.7 69.8 90.3,析因设计资料的应用实例: 在研究某防霉剂的毒性作用时, 对有关影响皮肤吸收的因素进行试验。在皮肤干式和湿式状况下,分别用密闭和敞开的方法处理4组小白鼠。经3小时后杀死,测定肝中Sn含量,数据见下表。,拉丁方设计资料的应用实例: 因子A=喂养时间,水平记为1、2、3; 因子B=

12、地区温度,水平记为1、2、3; 因子C=食品配方,水平记为a、b、c。 经过一段时间喂养后,体重的增加量y记录在下表中。,嵌套设计资料的应用实例: 在某项化合物转化率的实验研究中,涉及到催化剂的种类(因素A)和温度(因素B)。根据专业知识,催化剂对该化合物转化率的影响作用大于温度,而且在不同催化剂条件下所用的温度不完全相同。实验批次为2。转化率观测结果列在下表中。试分析催化剂和温度对该化合物转化率的作用。,不同催化剂在不同温度下对某化合物转化率的观测结果,裂区设计资料的应用实例: 为研究不同瘤株的生瘤效果和不同浓度蛇毒的抑瘤作用,先将48只小鼠按条件分成3个区组,再将每个区组的16只小鼠随机地

13、分成4组,分别接受4种不同的瘤株(因子A)。一天后再对接受同一种瘤株的4只小鼠分别腹腔注射4种不同浓度的蛇毒(0.00,0.03,0.05,0.075),连续用蛇毒抑瘤10天。停药1天后解剖测瘤重。结果列于下表。,重复测量设计资料的应用实例: 20个病人分别接受了两种不同的治疗处理(A=1,2)。治疗后以30分钟的时间间隔测量病人的前额体温(T=1,2,3,4)。测量结果列在下表中。试分析: (1)两组病人的体温有无显著性差异? (2)T2时刻测得较高的体温,问其它各时间点的体温与T2时刻有无显著性差异?,2、各种类型的回归分析,连续型因变量 (y) -多元线性回归分析,多个因变量 (y1,y

14、2yk),分类型因变量 (y) -多元Logistic 回归分析,时间序列因变量 (t) -时间序列分析,生存时间因变量 (t) -生存风险回归分析,路径分析 结构方程模型分析,一个因变量 y,简单(一元) 线性回归分析模型 Y=+ X +,例如:舒张压和血清胆固醇的依存关系,编号 舒张压 胆固醇 ( id ) ( y ) ( x ) 1 80 307 2 75 259 3 90 341 4 70 237 5 75 254 6 105 416 7 70 267 8 85 320 9 88 374 10 78 316,y = 26.622 + 0.179 x,多元线性回归分析模型 Y=+1 X1

15、 +2 X2 +3 X3 +,例如:校正性别和年龄后舒张压和血清胆固醇的依存关系 Y= 25.867 - 3.312 SEX + 0.207 AGE + 0.153 X,编号 性别 年龄 舒张压 胆固醇 1 1 47 80 307 2 1 55 75 259 3 1 79 90 341 4 1 56 70 237 5 1 65 75 254 6 2 89 105 416 7 2 45 70 267 8 2 67 85 320 9 2 77 88 374 10 2 59 78 316,三元线性回归模型: Y= 25.867 - 3.312 SEX + 0.207 AGE + 0.153 X,一元

16、线性回归模型: Y = 26.622 + 0.179 X,多变量线性回归分析模型 Y1=1 +11 X1 +12 X2 + 13 X3 +1 Y2=2 +21 X1 +22 X2 + 23 X3 +2,例如:大学与高中学习成绩的关系研究,y 1 是学生必修课的平均成绩,y 2 是选修课的平均成绩,x 1 是高中一般知识测试得分,x 2 是智商IQ得分,x 3 是学习动机平均得分。,y 1 是学生必修课的平均成绩,y 2 是选修课的平均成绩,x 1 是高中一般知识测试得分,x 2 是智商IQ得分,x 3 是学习动机平均得分。,二元线性回归分析模型,多变量路径回归分析模型 Y1=1+11 X1 +

17、12 X2 +1 Y2=2+21 X3 +22 X4 +2 Y3=3 +1 Y1 + 2 Y2 +3,例如:高血压和冠心病是两种严重影响人类身体健康的疾病。目前遗传流行病学研究中倾向于认为遗传和环境因素对这两种疾病的发病起着重要的影响作用。为了证实这一点,某研究生收集了相关的一些资料。,父母以及子女的生活环境和舒张压的相关系数矩阵(n=94),X1=父亲的生活环境,X2=母亲的生活环境,Y1=父亲的舒张压,Y2=母亲的舒张压,Y3=子女的生活环境,Y4=子女的舒张压。,Y1 = 0.3200*X1 (R2=0.10) Y2 = 0.4580*X2 (R2=0.21) Y3 = 0.3336*X

18、1 + 0.1997*X2 (R2=0.14 ) Y4 = 0.2247*Y1 + 0.0879*Y2 + 0.4266*Y3 (R2=0.27),各种回归分析的比较,例如,研究者调查了3094个学生的四个指标,x1 是母亲的学历等级 (1-6), x 2 是父亲的学历等级 (1-6),x 3 是父母亲的工资总收入等级 (1-10 ),x 4 是学生的大学学分等级(1-4),x 5是学生毕业5年后的工资等级(1-10)。其相关系数列在下表。,模型的标准估计: X1 = 0.8418 F1 + 0.5398 E1 X2 = 0.6994*F1 + 0.7147 E2 X3 = 0.6491*F1 + 0.7607 E3 X4 = 0.8448 F2 + 0.5351 E4 X5 = 0.8001*F2 + 0.5999 E5 F2 = 0.4062*F1 + 0.9138 D1,disease,source,gene,environment,health,habit,SES,gend

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论