医学多元统计分析 绪论_第1页
医学多元统计分析 绪论_第2页
医学多元统计分析 绪论_第3页
医学多元统计分析 绪论_第4页
医学多元统计分析 绪论_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多元统计分析基础(绪论)

潘发明流行病与卫生统计学系famingpan@10/6/20231医学多元统计分析讲义主要内容医用多元统计分析方法的发展多元统计分析的基本概念主要内容和任务常用的多元统计分析方法10/6/20232医学多元统计分析讲义背景:传统的医学统计学多采用单因素分析方法,如对数据作单变量的描述性分析、参数估计和假设检验等统计推断。但随着医学的发展及人类疾病谱的改变,人们逐步认识到许多人类疾病和健康问题并非单一因素所致,通常都是多个因素的综合作用结果。而多个因素的作用效应或联合作用效应有轻重之分,有的因素起主要作用,有的仅是辅助作用,因素之间的作用关系相当复杂。由于受到计算科学发展的限制,数理统计学中的多元统计分析技术在医学科研中的发展进展缓慢。直到上个世纪下半叶,由于计算机的发展和普及,医用多元统计分析得到飞速发展。

一、医用多元统计分析方法的发展

10/6/20233医学多元统计分析讲义现代医学多元分析方法的应用

随着计算机和统计分析软件的发展,医学多元统计分析方法已经构成了一门独立的学科体系,包括数据库的建立、变量的定义、预处理和常规的统计分模型应用及多种统计模型的联合分析等。这门学科的形成与发展对现代医学的发展起到了具大的推动作用。10/6/20234医学多元统计分析讲义多元统计方法的应用领域

诸多慢性病的发病原因的研究。高血压、糖尿病、肿瘤等疾病的患病率和死亡率呈逐年上升趋势,人们一直想知道这些疾病的发病原因并采取相应的控制措施。对于这些疾病,用传统的单因素分析方法很容易得出一些片面的结果,因为这些疾病的发生与发展并非单一因素可以解释的。这些都必须借助多元统计分析技术10/6/20235医学多元统计分析讲义比较关系预测分类评价多元统计分析有哪些应用?10/6/20236医学多元统计分析讲义比较比较不同地区儿童生长发育情况不同种族正常人头发中微量元素的含量不同组别的IgG,IgM,IgA,IgE不同组别的CD2,CD3,CD4,CD8,CD4/CD810/6/20237医学多元统计分析讲义关系探索病因校正混杂因素调整基线探讨巯基丁氨酸(homocysteine)与血压、冠心病的关系,需调整年龄、性别、种族、已知的与冠心病有关的其他因素。探索与预后有关的因素影响黑色素瘤患者的生存时间的因素:年龄、性别、病灶部位、浸润深度10/6/20238医学多元统计分析讲义预测疾病预后的预测是否会患某病的预测哪些人更容易患糖尿病?年龄、家族史、工作性质、BMI、腰臀比等;乳腺癌患者手术后的生存时间?年龄、家族史、并发症、复发、化疗等;法医鉴定中死亡时间的推算:根据尸体的直肠温度、环境温度、停尸物的质地等。10/6/20239医学多元统计分析讲义分类计算机辅助诊断系统临床诊断病毒鉴别判别分析

对体形进行分类,制作服装胸痛患者如何快速诊断(是否急性心肌缺血?)对口腔牙列进行分类,预制牙模等。10/6/202310医学多元统计分析讲义评价综合评价医院效益评价卫生投入产出评价健康状况评价10/6/202311医学多元统计分析讲义各种应用对应的多元统计分析方法比较:多元方差分析关系:回归模型预测:回归模型分类:聚类分析与判别分析、回归模型评价:主成分分析与因子分析多元回归、logisitic回归、Cox回归、Poisson回归10/6/202312医学多元统计分析讲义多元统计分析方法主要内容多元T检验、多元方差分析HotellingT2multivariateanalysisofvariance(MANOVA)多元线性回归(multivariatelinearregression)logistic回归(logisticregression)Cox比例风险模型(Coxmodel)Poisson回归(Poissonregression)聚类分析(clusteranalysis)判别分析(discriminantanalysis)主成分分析和因子分析生存分析10/6/202313医学多元统计分析讲义本课程的要求上机做练习,分析实际资料学会看文献,判断统计分析的应用是否正确统计软件SAS,或Stata,SPSS10.01考试:理论占30%,实验占70%10/6/202314医学多元统计分析讲义研究因素

从广义的角度看,所有可以测量的变量都可以成为研究因素,比如:年龄、性别、文化程度、人体的各种生物学特征和生理生化指标环境因素、心理因素等。狭义来看,研究因素是指可能与研究目的有关的影响因素

多元统计分析对多变量样本的要求

①分布:多元正态分布、相互独立、多元方差齐

②样本含量

目前尚没有多元分析的样本含量估计方法,一般认为样本含量应超过研究因素5-10倍以上即可。

二、多元统计分析的基本概念10/6/202315医学多元统计分析讲义变量的分类及其转换

定量资料(数值变量)定性资料(分类变量)等级资料(有序分类变量)。若收集的资料中既有数值变量,又有分类变量而统计模型要求对变量的性质做转换,则需要考虑做变量变换。也就是要考虑引入模型的变量的尺度要适宜。10/6/202316医学多元统计分析讲义

数值变量→分类成有序分类变量血压:﹤60mmHg(8KPa)低血压60~90mmHg(8~12KPa)正常﹥90mmHg(﹥12KPa)

高血压10/6/202317医学多元统计分析讲义分类变量→数值变量(伪变量,哑变量)性别:X=0男,X=1女(指示变量)血型:ABO:X1=0X2=0X3=0为A,

X1=0X2=1X3=0为B,X1=1X2=0X3=0为O,X1=0X2=0X3=1为AB哑变量的数量=K-1(K为分类数)10/6/202318医学多元统计分析讲义

有序分类变量→数值变量(伪变量)一般是按等级从低到高取0、1、2……或1、2、3……10/6/202319医学多元统计分析讲义主要内容:

多因素分析是研究多个变量之间的依存关系的统计方法。在多个研究因素中,应根据专业知识确定哪些是结果变量(反应变量),哪些解释变量(自变量),通过一些特殊的统计模型对数据进行拟合,找出众多的解释变量中与反应变量有关的因素(影响因素),并确定其作用的大小和方向。

三、多元统计分析的主要内容和任务10/6/202320医学多元统计分析讲义研究目的可以分为

2大类①研究因素的依赖性:即某一反应变量与多个解释变量间的依存关系。如多元线性回归、logistic回归、Cox回归、判别分析等。②研究因素间的互依性:即无反应变量和解释变量之分,研究多个因素间彼此关系或彼此影响。如主成份分析、因子分析、聚类分析、典型相关分析等。10/6/202321医学多元统计分析讲义主要任务

多因素间的关系错综复杂,因此多元统计分析的主要任务是使复杂问题简化,将无关的因素丢弃,即抓住西瓜丢去芝麻。即抓住主要矛盾将无关或影响甚微的因素去除。思路有2种:①直接减少研究因素;②通过变量变换减少研究因素:主成分分析、因子分析、典型相关等。目的是使复杂问题简单化。

10/6/202322医学多元统计分析讲义4.1多元线性回归分析拟合以自变量(解释变量)估计应变量(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论