多元统计分析_第1页
多元统计分析_第2页
多元统计分析_第3页
多元统计分析_第4页
多元统计分析_第5页
已阅读5页,还剩253页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

MULTIVARIATESTATISTICSANALYSIS

多元统计分析

多元统计分析简介

客观世界中的任何事物的形成,变化和发展都是受多种因素的影响。各种因素之间又存在着广泛而又错综复杂的联系.例如疾病的产生就受到多种因素的支配,各种病因之间也常存在着一定的内在联系和相互制约.需要分析哪些是主要的,本质的,哪些是次要的,片面的,它们之间的相互关系怎样等问题.多元统计分析正是为了解决这些问题而产生的。统计学基础知识的回顾统计学是一门关于如何收集、分析、解释和表达数据的科学。

---《Webster’sInternationalDictionary》统计学是研究随机现象规律性的方法学。什么是统计学?温故而知新三类现象自然界和人类社会活动中,普遍存在三类现象。确定性现象:在相同的条件下出现相同的结果,称为确定性现象或必然现象。如地球的运动。随机性现象:在相同的条件下出现不同的结果,但结果是确定的,称为随机性现象。如掷硬币。模糊性现象:在相同的条件下出现不确定的结果,称为模糊性现象。如美人与丑人。不同现象与研究方法

现象研究方法确定性现象---经典数学随机性现象---概率统计学模糊性现象---模糊数学统计学两个方面的作用一.是培养统计思维方法二.学以至用,解决实际问题统计学的知识已渗透到自然科学、社会科学以及人类生活的各个领域。统计学应用的普适性自由落体运动规律:公式:h=1/2g*t2重力加速度常数g=9.80665米/秒2公式是怎样产生的?<中学物理课实验的回顾>h经典应用1:牛顿的自由落体运动牛顿的自由落体运动实验多次重复实验,测量计录每次下落的高度与时间数据:采用什么方法找规律呢?

运用了统计学思想回归分析直线回归方程:y=a+b*x

h1/2gth牛顿发现定律方法的探究时间t高度h14.9239.1388.3…….

h。。。。。。。。

。01234t散点图牛顿的自由落体定律的产生回归方程的构造:回归方程:y=a+b*x

h01/2gt2h自由落体定律的探究影响定律公式的因素:灵感测量误差模型的选择肾脏体积的经验公式肾脏为不规则体,怎样测量?立方体体积规律:公式:V=长*宽*高=abc

a经典应用2:肾脏体积的测量bc肾脏体积计算公式:经验公式:V=π/4*长*宽*高公式怎样产生的?肾脏体积测量实验用20个肾脏标本,测量计录每个体积及其长,宽,高的数据:采用什么方法找规律呢?

回归方程的构造:y=a+b*xV=π/4*长*宽*高实验的回顾编号体积V长a宽b高c11001052.521101062.631051152.1……….….….影响公式的因素:测量误差模型的选择历史上很多非统计专业人员,通过对统计学的学习和研究,在专业和统计学取得有很深的造诣。物理学家爱因斯坦学习和研究统计,将统计学思想应用于他的物理学和哲学研究中。生物学家达尔文学习和研究统计,进化论方面的工作在本质而言是属于生物统计学。护理学的奠基人

Nightingale学习和研究统计,出版世界上第一部医院统计的专著《医院统计与医院规划》。不同科学间相互协作的重要性统计学是“对令人困惑费解的问题做出数字设想的艺术。”

---美国DavidFreedman统计学是一门处理数据中变异性的科学和艺术。

---JohnM.Last《ADictionaryofEpidemiology》

科学与艺术的不同在于不同的人处理相同的问题可能得到不同的结果现代统计学的基本内容一、试验设计二、数据管理

三、统计分析实验设计临床试验设计调查研究设计数据管理质量控制统计描述统计推断一、试验设计进行一项科研如同建造一座大厦,其设计、质量控制、分析、验收等都十分重要。如果大厦没有良好的设计和质量控制,就会出现问题,甚至倒塌,负责人会受到国家法律惩治。科研工作若没有良好的设计和质量控制,就会失败,得出错误的结果,对后来的科研产生误导作用。科研设计如同建筑设计一样举足轻重。1试验设计的三要素1)、试验因素2)、试验对象3)、试验效应2实验设计的三原则

随机对照重复(均衡)二、数据管理数据管理质量控制

三、数据分析统计描述统计推断

通过统计描述不仅可以对数据的概貌,分布,变量间的关系等有大致的了解,而且可发现数据中的异常现象。因此,统计描述在统计分析中占有相当重要的地位。1统计描述

率、构成比统计量均数、中位数相关回归系数统计表统计图条图、直方图、线图等

用样本的信息来推断总体的特征叫统计推断.统计分析的目的是由样本推断总体,故统计学的主体是统计推断2.统计推断实验设计的模型1试验因素试验效应

(自变量)(因变量)

XY试验对象Fy=f(x)+e1因果关系:实验设计的模型2A因素B因素

(X1变量)(X2变量)

X1X2试验对象FX2=f(x1)+e2相互关联:

参数点估计估计区间估计统u检验计参数t检验推F检验断假设相关与回归检验卡方检验非参秩和检验秩相关检验

统计软件的重要作用“计算机软件给统计学带来革命性变化”发表论文或进行科研课题时,注明统计软件和采用的统计分析方法.统计分析工具的选择:CHISSSAS,SPSS,STATA

实例解析3

携带火柴和发生肺癌间的关系的研究。人们观察发现那些携带火柴的人更有可能发生肺癌。难道这表明携带火柴可能引起肺癌?混杂因素这中间存在混杂因素---吸烟客观事实,携带火柴不可能引起肺癌。

混杂因素的影响

图1.1危险因素、混杂因素和结果的关系

携带火柴肺癌

吸烟

[实例解析4]喝咖啡与心肌梗塞MI关系的研究。

有人观察发现喝咖啡的人,很多人患MI,这种现象是表象还是内在因果关系的?

数据来自2000年,小儿科邀请一位美国医学及生物统计学教授来院讲学的例子。

研究者调查MI及非MI病人各150例,得到如下数据。表1.1MINoMI%Coffee906060Nocoffee609040优势比:OR=90*90/(60*60)=2.25Pearsonchi2(1)=12.0,P=0.001。说明喝咖啡人MI发生的危险性是不喝的2.25倍。两组MI发生率差异有显著意义。结论:喝咖啡与心肌梗塞MI有关!对否?

研究者怀虑结论,考虑到其中可能混杂其它因素,如吸烟对喝咖啡与心肌梗塞MI间关系的影响,进一步分层分析得到。表控制吸烟因素的干扰后结果SmokerNosmokerMINoMI%MINoMI%Coffee804067102033Noffee201067408033

优势比OR=1,OR=1P=1.00,P=1.00

表明,在吸烟组和不吸烟组中。喝咖啡与不喝咖啡的MI发生的相对危险度相同的。

喝咖啡与心肌梗塞MI关系说明当存在混杂因素时,单因素分析结论并不科学。案例:研究生招生与性别的关系研究<案例讨论>研究生招生与性别的关系研究

美国加州贝克莱分校1973年研究生的录取情况如上表.结果显示,男生报考人数据2691人,录取1197人,录取比例44.5%,女生报考人数据1835人,录取556人,录取比例30.3%。有人认为该校在研究生录取中存在性别歧视。试对此进行讨论与分析。

混杂因素的定义当某一危险因素和结果的相关性受第三个变量和危险因素及结果之间关系的影响,这第三个变量称为混杂因素。上两例中,混杂因素是吸烟排除混杂因素的两种方法

1、分层分析2、多元统计分析

分层分析是在其它影响因素保持恒定情况下,评价某一危险因素对结果的影响。例如,上面我们可以分别在吸烟者和非吸烟者之中,比较喝啡咖与和不喝啡咖的人。这可使我们在不依赖于吸烟的情况下,分析喝啡咖对MI的影响。

1分层分析方法-----控制混杂因素对结果的影响分层分析的优缺点优点:直观简洁。缺点:当考虑因素较多时分组数量倍增,需要例数较多,有时无法实现。

‘生命在于运动。’

‘运动有利于长寿’

流水不腐。。。这是人类长期经验的总结,但事实果真如此吗?是科学的结论,还是事物的假象呢?[实例解析5]运动与寿命关系的研究

许多研究表明长期运动人的寿命比久坐型生活方式人的寿命长。但是,如果运动者寿命长的真正原因是他不吸烟,没有家族病史,好的生活环境等,那么运动将不能改变一个人的寿命。

运动与人的寿命的关系

美国Aerobics中心的追踪研究

在1970-1989年间,它们追踪观察25,341男性和7084女性,研究运动和死亡率的关系。男性参加者被追踪观察平均8.4年,女性平均7.5年。所有参加者接受了基线检查,这些检查包括体检、实验室检测及踏车试验评价身体适宜运动量。结果如表1.1。

Blair,S.N.,Kampert,J.B.,Kohl,H.W.,etal.”Influencesofcardiorespiratoryfitnessandotherprecursorsoncardiovasculardiseaseandall-causemortalityinmenandwomen.”JAMA1996;276:205-10表1.3Aerobics中心追踪研究过程中生存与死亡者基线特征(男性组)指标生存死亡(n=24,740)(n=601)年龄(SD)42.7(9.7)52.1(11.4)*体重指数

26.0(3.6)26.3(3.5)收缩压121.1(13.5)130.4(19.1)*总胆固醇213.1(40.6)228.9(45.4)空腹血糖100.4(16.3)108.1(32.0)

运动量(%)低20.141.6中42.039.1高37.919.3*冠心病家族史25.433.8*吸烟26.336.9*异常心电图6.926.3*慢性病18.440.3*

分析发现,存活者和死亡者之间是有明显区别的。特点是存活者较年轻,血压较低,低胆固醇,很少吸烟并且高运动量(基于他们踏车试验时间长短及程度)。但表1.1并没有回答我们的基本问题:运动是否独立地延长寿命?它并没有回答这个问题是由于虽然高运动量组很少在研究期间死亡,但他们或者较很少吸烟,或年轻,或有较低的血压。我们应排除排除混杂因素的影响。

[分层分析法]表1.4Aerobics中心追踪研究中全因死亡患者吸烟和体质的分层分析每万人年分层相对危险度死亡数(95%CI)吸烟低运动量48.01.63(1.26-2.13)*中/高运动量29.41.0(参照组)不吸烟

低运动量44.02.19(1.77-2.70)*中/高运动量20.11.0(参照组)可见低运动量组死亡率高于中/高运动量组的死亡率,这一分层分析表明运动的作用不依赖于吸烟状态。

但是,有可能影响运动和长寿之间关系的其它变量是怎样的?你可以层层分析每一原因,来证明运动对长寿的影响不但不依赖于吸烟状态,也不依赖于年龄、性别、高血脂、高血压等等。如果分层分析3个变量[吸烟状态、年龄、体重(正常/异常)],你将需要在8个组中分析运动和死亡率的关系。

如果分层分析6个变量[吸烟状态、年龄、性别、体重、胆固醇水平、高血压状态(是/不是)],你将需要在64个组中分析运动和死亡率的关系。

[多因素分析法]为判断运动是否独立地与死亡有关,研究者们运用了COX比例风险分析(proportionalhazardsanalysis)的多元分析方法,结果如表1.2。准许引自:Blair,S.N.,etal.”Influencesofcardiorespiratoryfitnessandotherprecursorsoncardiovasculardiseaseandall-causemortalityinwomen.”JAMA1996;276:205-10.Copyright1996,AmericanMedicalAssociation.Additionaldataprovidedbyauthors.

表1.5Aerobics中心追踪研究全死亡率危险因素的多元分析自变量死亡率调整相对危险度RR(百万分数)(95%CI)运动量低38.11.52(1.28-1.82)*中/高25.01.0(参照组)吸烟状况

吸烟39.41.65(1.39-1.97)*不吸烟23.91.0(参照组)

收缩压

≥140mmHg35.61.30(1.08-1.58)*<140mmHg26.11.0(参照组)胆固醇≥240mg/dl35.11.34(1.13-1.59)*<240mg/dl26.11.0(参照组)冠心病家族史

有29.91.07(0.90-1.29)无27.81.0(参照组)体重指数

≥27Kg/m228.81.02(0.86-1.22)<27Kg/m228.21.0(参照组)

空腹血糖

≥120mg/dl34.41.24(0.98-1.56)<120mg/dl27.91.0(参照组)异常心电图

有44.41.64(1.34-2.01)*无27.11.0(参照组)慢性疾病

有41.21.63(1.37-1.95)*无25.31.0(参照组)

表明,如果你比较男性中每千人年死亡数,你可以看出在低运动组(38.1)比中/高运动量组(25.0)有较高的死亡数。其相对危险度为38.1/25.0=1.52。说明低运动量的人死亡的危险性是高运动人的1.52倍。这显示运动与生存率有关,它并不依赖于吸烟、高血压、高胆固醇及家族史。

运动与人的寿命的关系

[实例解析6]吸烟和冠状血管疾病再通术后的预后间的关系

Aerobics中心的追踪研究,他们追踪了5437例冠状血管疾病并接受再通手术(用线和球打开阻塞的冠状血管)的病人,将病人分为不吸烟、以前吸烟(至少在手术前6个月戒掉)、刚戒烟(因手术后刚戒掉)、及持续吸烟4个组。结果见表1.4.5Hasdai,D.,Garratt,K.N.,Grill,D.E.,Lerman,A.,Homes,D.R.“Effectofsamokingstatusonthelong-termoutcomeaftersuccessfulpercutaneouscoronaryrevascularization.”N.Engl,J.Med.1997;336:755-61.

表1.6吸烟状况和死亡危险性的两变量关系组别死亡相对危险度RR(95%CI)不吸烟1.0(参照组)以前吸烟1.08(0.92-1.26)刚戒烟0.56(0.40-0.77)*持续吸烟0.74(0.59-0.94)*引自:D.,etal.“Effectofsmokingstatusonthelong-termoutcomeaftersuccessfulpercutaneouscoronaryrevascularization.”N.Engl.J.Med.1997;336:755-61.

持续吸烟组的死亡相对危险度怎么比不吸烟组低呢?(烟草公司希望)在你假定在此研究中可能有差错之前,一些其它研究发现在冠状动脉疾病血栓溶解治疗中,吸烟和预后具有同样的关系,这一作用被称为“吸烟者悖论”是什么原因导致这一“悖论”呢?

Barbash,G.L.,Reiner,J.,White,H.D.,Etal.“Evaluationofparadoxicalbeneficialeffectsofsmokinginpatientsreceivingthrombolytictherapyforacutemyocardialinfarction:Mechanismsofthe‘smoker’sparadox’fromtheGUSTO-Itrial,withangiographicinsights.”J.Am.Coll.Cardiol.1995;26:1222-9.

表1.5人口学及临床因素与吸烟状况的关系不吸烟以前吸烟刚戒烟持续吸烟年龄±SD(年)67±1165±1056±1055±11心绞痛病程(月)41±6651±7221±4629±55糖尿病,%2118810高血压,%54483839冠状动脉疾病,%一枝血管50515755二枝血管36363436三枝血管1413109

表1.5可以看到,相比于吸烟者和以前吸烟者,刚戒烟者和持续吸烟者更年轻,心绞痛时间更短,较少有糖尿病和高血压,较少有严重的冠心病。看到这些,你对刚戒烟者和持续吸烟者的死亡率低于不吸烟者和以前吸烟者就不会奇怪了。因为他们比不吸烟者和以前吸烟者年轻,而且很少有医学隐患。

表1.6比较一元统计与多元统计吸烟状况与死亡危险性的关系不吸烟以前吸烟刚戒烟持续吸烟一元统计的危险相对度1.01.080.560.7495%CI(参照组)(0.92-1.26)(0.40-0.77)(0.59-0.94)多元统计的相对危险度1.01.341.211.7695%CI(参照组)(1.14-1.57)(0.87-1.70)(1.37-2.26)

表1.6将一元分析死亡危险性(未校正)和多元统计分析死亡危险性相比.在多元统计分析中,研究者校正了4组中存在的如年龄、心绞痛时间等差别。通过对这4组基线差别的统计学校正,刚戒烟者和持续吸烟者的死亡危险显著高于不吸烟者――更加灵敏的结果。一元统计和多元分析的差别表明混杂因素是存在的。

多因素分析与分层分析的比较当你用分层分析每增加一个变量,你将倍增分组的数量。一方面产生大量的打印结果、需要整本书报告你的结果。另一方面即使在开始时有很大的样本量,可能在某些分组中样本量还是不足。有时无法分层的。

多因素分析克服了这方面的限制,它将使你同时评价各种不同因素对结果的不同作用。但多因素分析需要前提条件,模型对数据的性质要作一些假定,这些假定有时候是很难证实的。多因素分析与分层分析的比较*混杂因素与干预因素关系

当危险因素和结果的相关性受第三个因素和危险因素及结果之间关系的影响,这第三个变量称为混杂因素。一个干预因素是出现结果的原因。

Camango及其同事们在研究中度酒精消费和心脏病危险性关系时校正了年龄、吸烟、运动、糖尿病及心脏病家族史,但是他们没有校正血压、体重指数、高胆固醇血症。为什么不?这些因素符合混杂因素的定义,它们与危险因素(酒精消费)有关并与结果(心肌梗塞)有因果关系,问题是酒精消费可加重导致高血压、体重指数增加及高胆固醇血症。因此,如图1.3所示。这些变量可能通过其它致病途径导致心肌梗塞,应考虑为干预变量,不应考虑为混杂因素,如果将混杂因素作为干预变量来校正,那么你需要重新考虑你的结果。

血压升高体重指数增加高胆固醇血症心肌梗塞酒精消费统计学不能区别混杂和干预变量

统计学并不能告诉你什么是混杂因素,什么是干预变量。从统计上讲,混杂因素与干预变量是一回事。在你的模型中,是因为有混杂因素而引入该变量,还是因为有干预变量而排除该变量呢?这一决定必须根据以前的研究和生物学上的可解释性作出。

一多元统计分析的概念

多元统计分析是研究客观事物中多种指标间相互依赖,相互影响的统计规律性的一个数理统计学分支.医用多元统计分析是多元统计分析在医学领域的应用.

二、学习多元统计分析的重要性

为什么开这门课?多元统计分析与已学的医学统计学的区别在哪呢?

多元统计分析能使我们对所研究的问题更全面,更深刻的认识.帮助我们透过现象看本质,发观事物之间内在的本质规律,从而推动医学科学的发展。

三.多元统计分析的特点优点有两个:一多元统计分析的资料较容易取得;二多元统计分析可以从整体上分析结果.

四、开展多元统计教学的可能性

①多元统计分析的数学理论十分复杂;②多元统计分析的计算量很大;③教学工作开展不够.个人电子计算机的飞速发展,对多元统计学产生重大影响。常用的统计软件包有CHISS,SAS、SPSS、STATISTCA,Stata等.

五关于多元统计选修课一选修课的目的二课时按排,30学时,1.5学分六多元统计的教与学一了解各种多元统计学方法的适用前提条件和用应范围二掌握一种统计软件三正确解释软件输出结果及结论讲授与上机实习结合三成绩考核七.多元统计分析的前提条件1.多元统计对资料的分布有一定的要求;

2.需要有足够大的样本,一般认为,例数m是研究因素个数P的10倍左右。

为什么在统计学常常需要足够多的观测例数呢?例甲、乙两研究者分别用某新药治疗10例和403例老年性气管炎患者,其疗效如下表。

甲治疗结果例数%临床治愈770未治愈330合计10100乙治疗结果例数%临床治愈8320未治愈32080合计403100

临床上感兴趣的问题是新药治疗老年性气管炎治愈率是多少,而不是10和403例的治愈频率,那么应用20%,还是70%,以估计新药治疗老年性气管炎治愈率呢?

概率与频率的关系什么是概率?概率是度量随机事件A发生可能性大小的一个数量.记为P(A)。什么是频率?频率若在n次同样的随机试验,事件A发生了k次,则比值k/n称为频率频率与概率的关系:抛掷硬币的试验结果━━━━━━━━━━━━━━━━━━━━━试验者抛掷次数(n)正面次数(k)频率(k/n)─────────────────────TONG331.00540.801030.302070.3550270.54100520.525002460.492━━━━━━━━━━━━━━━━━━━━━历史上许多著名科学家做过抛掷硬币的试验,抛掷硬币试验结果如表

━━━━━━━━━━━━━━━━━━━━━

试验者抛掷次数(n)正面次数(k)频率(k/n)─────────────────────DeMorgan204810610.518Buffon4,0402,0480.5069Pearson12,0006,0190.5016Pearson24,00012,0120.5005━━━━━━━━━━━━━━━━━━━━━观测例数越少,抽样误差越大,样本的对研究总体的代表性就小。所以,医学试验中需要足够多的例数。定理:若当试验次数n充分大以后,频率k/n稳定地在某一确定值P的附近摆动。即:

Lim(k/n)=P

n∞

实际工作中,常用频率求概率的近似值:P(A)≈f(A)=k/n.频率与概率的关系

八.变量类型及数量化方法在医学研究中,常常存在许多反映个体变异性的指标,统计学上称为变量,如年龄、病情、性别等。可分三类。

⑴定量变量是对研究单位的定量特征的描述。诸如个体年龄、身高、体重等变量均可经测量取得数值。将这类变量视为连续型变量,或定量变量。对于定量指标,在通常情况下以原始观察值的形式出现。有时可分段处理。如年龄分60以上、以下。⑵定性变量是对研究单位的定性特征的描述,有类别。亦称分类变量.如性别分男、女为二分类变量。血型可分为A、B、AB、O四类型,为四分类变量。二项分类变量如性别,用一个变量表示,一般可赋值为0和1,或1和2。1女X=0男无序多分类变量如血型分为A、B、AB、O四类型。

需用三个哑变量来区分。1A型1B型1O型X1=X2=X3=0其它0其它0其它当X1=0,X2=0,X3=0时,为AB型一般N分类,需要N-1个哑变量表示。⑶等级变量:是对研究单位的等级特征的描述。如病情分轻、中,重三个等级。

数值化法:只须用一个X作为分类变量,然后按等级顺序分别赋值。b例如,用X表示病情,其赋值方法分为:0轻X=1中2重

九,如何收集和整理多元分析资料设研究问题中含有p个指标变量x1,x2,…,xp.及n个观察对象.其数据结构为:编号X1X2X3….XP1x11x21x31…x1p2x12x22x32…x2p3x13x23x33…x3p………………nx1nx2nx3n…xnp━━━━━━━━━━━━━━━━━━实验数据要求完整、准确、真实。若某一观测指标的值,有空缺,应注明。在SAS中用“.”表示空缺。切忌凭主观愿望填写,

在计算机中,常采用EPI,CHISSDBASE、Excel、SAS等建立数据库.

十常用的多元统计方法1多元回归分析

多元回归分析简介

直线回归分析一个自变量和一个因变量间的关系,在医学实践中,常会遇到一个应变量与多个自变量数量关系的问题。如医院住院人数不仅与门诊人数有关,而且可能与病床周转次数,床位数等有关.多元回归分析正是为解决这些问题而产生的。多元回归分析

多元线性回归是研究多个自变量与一个因变量之间数量关系的一种统计方法。实例分析肾小球滤过率的影响因素研究临床观测61例患者的肾小球滤过率y,及10种观察指标:年龄X1,糖化血红蛋白X2,饭后两小时血糖X3,胰岛素X4,胆固醇X5,肌肝X6,平均动脉压X7,体重X8,肾脏体积X9,尿白蛋白排泄率X10。━━━━━━━━━━━━━━━━━━━━━━━━━━━━━病例X1X2X3X4X5X6X7X8X9X10y─────────────────────────────1369163155310130435511772391424177699025310231303421429748296242933101........................6145202210310190203101116━━━━━━━━━━━━━━━━━━━━━━━━━━━━━试分析这10项指标与肾小球滤过率间的关系。

变量系数标准误t值P值

截距71.0227.662.5670.0133

X10.140.270.5100.6124

X2-0.620.95-0.6560.5149

X31.010.482.0840.0423*

X40.060.160.3820.7039

X52.331.861.2550.2153

X6-0.640.19-3.3690.0015**

X70.020.180.1570.8757

X8-0.240.78-0.3080.7594

X90.230.045.0080.0001**

X10-0.210.14-1.5240.1337

P值可以看出,在十个变量中,X3饭后两小时血糖,X6肌肝t和X9肾脏体积对肾小球滤过率影响有显著性意义,其它的7个变量没有显著性意义。2曲线拟合.

1)多项式曲线

一般多项式曲线的方程为

n=2时,二次多项式曲线,即抛物线.3Logistic回归分析

Logistic回归分析简介

在医学研究中,经常要分析某种结果的产生与哪些因素有关。例如:生存与死亡,发病与未发病,阴性与阳性等结果的产生可能与病人的年龄、性别、生活习惯、体质、遗传等许多因素有关。如何找出其中哪些因素对结果的产生有显著性影响呢?Logistic回归分析能较好地解决这类问题。

Logistic回归是一种概率模型,它是以疾病、死亡等结果发生的概率为因变量,影响疾病发生的因素为自变量建立模型。它适用于因变量为二项,多项分类的资料。在临床医学中多用于鉴别诊断,评价治疗措施的好坏及分析与疾病预后有关的因素等。例号是否患病性别吸烟年龄地区101030020014613001301....2910025030100261

单因素Logistic回归分析结果

模型变量系数标准误卡方P值1X11.7040.804.530.03322X22.5640.937.500.00623X30.1420.049.340.00224X4-0.2710.730.130.7128

结果表明,性别,吸烟,年龄三个因素都与肺癌有关.由于在对某一因素进行单因素分析时没有控制其它因素的干扰,因此结果不可靠.

多元Logistic回归分析结果变量系数标准误Wald卡方P值INTERCPT-9.754.095.660.02X12.521.821.920.17X23.981.984.060.04X30.190.085.670.02X4-1.301.580.680.41由上最大似然估计分析知因素X2(吸烟),X3(年龄)对肺癌的发生有显著的影响。所得的回归方程为:Logit(P)=-9.7544+2.5152X1+3.9849X2+0.1884X3-1.3037X4.Logistic回归模型可以用于进行预测和判断工作.SurvivalAnalysis

4.生存分析

生存分析简介

疾病治疗的预后情况,一方面看结局好坏,另一方面还要看出现这种结局所经历的时间长短,这类资料一般通过随访收集。随访资料常因中途退出,失访,中止观察等原因造成某些数据观察不完全,须要用专门的方法进行统计处理,这类方法起源于对寿命资料的统计分析,故称为生存分析。Multi-ANOVAAnalysis

5.多元方差分析*

多元方差分析简介

医学工作中常从多个指标不同的角度去研究同一个问题。若用一元方差分析时,当不同的指标所表现的趋势不一致时,就得不出一个概括性的结论,难以作出明确的判断。若用多元方差分析则能作出明确的判断。使我们对所研究的问题更全面、更深刻的认识。所得到的结论更可靠、更科学。

例1调查某中学同年级22名男女生,测量其身高(cm)、体重(kg)和胸围(cm),数据见表88。试检验该中学全体男女生的身体发育状况有无差别。

某中学22名男、女生身体测量资料

─────────────────────────────男生女生───────────────────编号身高体重胸围编号身高体重胸围─────────────────────────117158.581.0115244.87421756587215346.58031593871315848.573.54155.34574415050.58751523563514436.3686158.344.5756160.554.7867154.844.5747158498481645172815450.8769165.255799153407010164.5467110159.6527611159.14872.512164.246.573────────────────────────────

一元方差分析的结果━━━━━━━━━━━━━━━━━━━━━━━━━身高体重胸围─────────────────────组别平均值标准差平均值标准差平均值标准差─────────────────────────男161.96.848.18.374.45.9女154.25.047.35.677.46.6─────────────────────────F值8.7**0.11.3**P<0.01从表可以看出,该校男、女生的身高差异有显著性意义,而体重、胸围差异无显著性意义。那么,该年级全体男女生的身体发育状况有无差别,我们不能得到一个明确的结论。我们可以采用HotellingT2或Wilks’Lamba检验进行多元方差分析.表有三个指标反映身体发育状况,可用男、女生的身高、体重、胸围组成的样本均数向量推论该年级男、女生身体发育指标的总体均数向量μ1和μ2相等与否,进而可推论该年级男女生身体发育状况有无差别。采用SAS软件分析得到Wilks'Lambda=0.40371,转化为F值,F=8.8622,P=0.0008。拒绝该年级男女生身体发育指标的总体均数向量相等的假设,从而可认为该校男女生身体发育状况不同。本讲课的主要内容混杂因素的影响单因素分析中的问题多元分析的重要性科研数据的全面分析谢谢MagneticResonanceImaging磁共振成像发生事件作者或公司磁共振发展史1946发现磁共振现象BlochPurcell1971发现肿瘤的T1、T2时间长Damadian1973做出两个充水试管MR图像Lauterbur1974活鼠的MR图像Lauterbur等1976人体胸部的MR图像Damadian1977初期的全身MR图像

Mallard1980磁共振装置商品化1989

0.15T永磁商用磁共振设备中国安科

2003诺贝尔奖金LauterburMansfierd时间MR成像基本原理实现人体磁共振成像的条件:人体内氢原子核是人体内最多的物质。最易受外加磁场的影响而发生磁共振现象(没有核辐射)有一个稳定的静磁场(磁体)梯度场和射频场:前者用于空间编码和选层,后者施加特定频率的射频脉冲,使之形成磁共振现象信号接收装置:各种线圈计算机系统:完成信号采集、传输、图像重建、后处理等

人体内的H核子可看作是自旋状态下的小星球。自然状态下,H核进动杂乱无章,磁性相互抵消zMyx进入静磁场后,H核磁矩发生规律性排列(正负方向),正负方向的磁矢量相互抵消后,少数正向排列(低能态)的H核合成总磁化矢量M,即为MR信号基础ZZYYXB0XMZMXYA:施加90度RF脉冲前的磁化矢量MzB:施加90度RF脉冲后的磁化矢量Mxy.并以Larmor频率横向施进C:90度脉冲对磁化矢量的作用。即M以螺旋运动的形式倾倒到横向平面ABC在这一过程中,产生能量

三、弛豫(Relaxation)回复“自由”的过程

1.

纵向弛豫(T1弛豫):

M0(MZ)的恢复,“量变”高能态1H→低能态1H自旋—晶格弛豫、热弛豫

吸收RF光子能量(共振)低能态1H高能态1H

放出能量(光子,MRS)T1弛豫时间:

MZ恢复到M0的2/3所需的时间

T1愈小、M0恢复愈快T2弛豫时间:MXY丧失2/3所需的时间;T2愈大、同相位时间长MXY持续时间愈长MXY与ST1加权成像、T2加权成像

所谓的加权就是“突出”的意思

T1加权成像(T1WI)----突出组织T1弛豫(纵向弛豫)差别

T2加权成像(T2WI)----突出组织T2弛豫(横向弛豫)差别。

磁共振诊断基于此两种标准图像磁共振常规h检查必扫这两种标准图像.T1的长度在数百至数千毫秒(ms)范围T2值的长度在数十至数千毫秒(ms)范围

在同一个驰豫过程中,T2比T1短得多

如何观看MR图像:首先我们要分清图像上的各种标示。分清扫描序列、扫描部位、扫描层面。正常或异常的所在部位---即在同一层面观察、分析T1、T2加权像上信号改变。绝大部分病变T1WI是低信号、T2WI是高信号改变。只要熟悉扫描部位正常组织结构的信号表现,通常病变与正常组织不会混淆。一般的规律是T1WI看解剖,T2WI看病变。磁共振成像技术--图像空间分辨力,对比分辨力一、如何确定MRI的来源(一)层面的选择1.MXY产生(1H共振)条件

RF=ω=γB02.梯度磁场Z(GZ)

GZ→B0→ω

不同频率的RF

特定层面1H激励、共振

3.层厚的影响因素

RF的带宽↓

GZ的强度↑层厚↓〈二〉体素信号的确定1、频率编码2、相位编码

M0↑--GZ、RF→相应层面MXY----------GY→沿Y方向1H有不同ω

各1H同相位MXY旋进速度不同同频率一定时间后→→GX→沿X方向1H有不同ω沿Y方向不同1H的MXYMXY旋进频率不同位置不同(相位不同)〈三〉空间定位及傅立叶转换

GZ----某一层面产生MXYGX----MXY旋进频率不同

GY----MXY旋进相位不同(不影响MXY大小)

↓某一层面不同的体素,有不同频率、相位

MRS(FID)第三节、磁共振检查技术检查技术产生图像的序列名产生图像的脉冲序列技术名TRA、COR、SAGT1WT2WSETR、TE…….梯度回波FFE快速自旋回波FSE压脂压水MRA短TR短TE--T1W长TR长TE--T2W增强MR最常用的技术是:多层、多回波的SE(spinecho,自旋回波)技术磁共振扫描时间参数:TR、TE磁共振扫描还有许多其他参数:层厚、层距、层数、矩阵等序列常规序列自旋回波(SE),快速自旋回波(FSE)梯度回波(FE)反转恢复(IR),脂肪抑制(STIR)、水抑制(FLAIR)高级序列水成像(MRCP,MRU,MRM)血管造影(MRA,TOF2D/3D)三维成像(SPGR)弥散成像(DWI)关节运动分析是一种成像技术而非扫描序列自旋回波(SE)必扫序列图像清晰显示解剖结构目前只用于T1加权像快速自旋回波(FSE)必扫序列成像速度快多用于T2加权像梯度回波(GE)成像速度快对出血敏感T2加权像水抑制反转恢复(IR)水抑制(FLAIR)抑制自由水梗塞灶显示清晰判断病灶成份脂肪抑制反转恢复(IR)脂肪抑制(STIR)抑制脂肪信号判断病灶成分其它组织显示更清晰血管造影(MRA)无需造影剂TOF法PC法MIP投影动静脉分开显示水成像(MRCP,MRU,MRM)含水管道系统成像胆道MRCP泌尿路MRU椎管MRM主要用于诊断梗阻扩张超高空间分辨率扫描任意方位重建窄间距重建技术大大提高对小器官、小病灶的诊断能力三维梯度回波(SPGR) 早期诊断脑梗塞

弥散成像MRI的设备一、信号的产生、探测接受1.磁体(Magnet):静磁场B0(Tesla,T)→组织净磁矩M0

永磁型(permanentmagnet)常导型(resistivemagnet)超导型(superconductingmagnet)磁体屏蔽(magnetshielding)2.梯度线圈(gradientcoil):

形成X、Y、Z轴的磁场梯度功率、切换率3.射频系统(radio-frequencesystem,RF)

MR信号接收二、信号的处理和图象显示数模转换、计算机,等等;MRI技术的优势1、软组织分辨力强(判断组织特性)2、多方位成像3、流空效应(显示血管)4、无骨骼伪影5、无电离辐射,无碘过敏6、不断有新的成像技术MRI技术的禁忌证和限度1.禁忌证

体内弹片、金属异物各种金属置入:固定假牙、起搏器、血管夹、人造关节、支架等危重病人的生命监护系统、维持系统不能合作病人,早期妊娠,高热及散热障碍2.其他钙化显示相对较差空间分辨较差(体部,较同等CT)费用昂贵多数MR机检查时间较长1.病人必须去除一切金属物品,最好更衣,以免金属物被吸入磁体而影响磁场均匀度,甚或伤及病人。2.扫描过程中病人身体(皮肤)不要直接触碰磁体内壁及各种导线,防止病人灼伤。3.纹身(纹眉)、化妆品、染发等应事先去掉,因其可能会引起灼伤。4.病人应带耳塞,以防听力损伤。扫描注意事项颅脑MRI适应症颅内良恶性占位病变脑血管性疾病梗死、出血、动脉瘤、动静脉畸形(AVM)等颅脑外伤性疾病脑挫裂伤、外伤性颅内血肿等感染性疾病脑脓肿、化脓性脑膜炎、病毒性脑炎、结核等脱髓鞘性或变性类疾病多发性硬化(MS)等先天性畸形胼胝体发育不良、小脑扁桃体下疝畸形等脊柱和脊髓MRI适应证1.肿瘤性病变椎管类肿瘤(髓内、髓外硬膜内、硬膜外),椎骨肿瘤(转移性、原发性)2.炎症性疾病脊椎结核、骨髓炎、椎间盘感染、硬膜外脓肿、蛛网膜炎、脊髓炎等3.外伤骨折、脱位、椎间盘突出、椎管内血肿、脊髓损伤等4.脊柱退行性变和椎管狭窄症椎间盘变性、膨隆、突出、游离,各种原因椎管狭窄,术后改变,5.脊髓血管畸形和血管瘤6.脊髓脱髓鞘疾病(如MS),脊髓萎缩7.先天性畸形胸部MRI适应证呼吸系统对纵隔及肺门区病变显示良好,对肺部结构显示不如CT。胸廓入口病变及其上下比邻关系纵隔肿瘤和囊肿及其与大血管的关系其他较CT无明显优越性心脏及大血管大血管病变各类动脉瘤、腔静脉血栓等心脏及心包肿瘤,心

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论