医学统计学:第20章 判别分析_第1页
医学统计学:第20章 判别分析_第2页
医学统计学:第20章 判别分析_第3页
医学统计学:第20章 判别分析_第4页
医学统计学:第20章 判别分析_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二十章 判别分析 (discriminant analysis) 例20-1 收集了22例某病患者的三个指标(X1,X2,X3)的资料列于表,其中前期患者(A)类12例,晚期患者(B)类10例。试作判别分析。(电脑医生)患者患者被判别为某类应用:判别模型个体类别已知的样本资料(训练样本)判别模型判别分析 表20-1 22例患者三项指标观察结果 表20-1 22例患者三项指标观察结果(Zc=-0.147)目的:作出以多个判别指标判别个体分类的判别函数式或概率公式。资料:个体分两类或多类,判别指标全部为数值变量或全部为分类变量。用途:解释和预报(主要用于计量诊断)。分类(经典): Fisher判

2、别和Bayes判别。 1.计量资料判别分析。目的是作出以定量指标判别个体属性分类或等级的判别函数。按资料类型分: 2. 计数资料判别分析。目的是作出以定性或等 级指标判别个体属性分类或等级的概率公式。按方法名称分:1. Fisher判别(计量资料)2. 最大似然判别法(计数资料)3. Bayes公式判别法(计数资料)4. Bayes判别(计量资料)5. 逐步判别(计量资料)讲述内容第一节 Fisher判别第二节 最大似然判别法第三节 Bayes公式判别法第四节 Bayes判别第五节 逐步判别第六节 判别分析中应注意的问题第一节Fisher判别适用于指标为定量指标的两类(或多类)判别 表20-1

3、 22例患者三项指标观察结果(Zc=-0.147)观察对象:A类:12B类:10观察指标数:m=31. Fisher判别的原理 一、两类判别而后运用此函数式、判别界值来判断新的个体的类别。即:Fisher判别函数,C称为判别系数20-1(20-2)(20-4)(20-3) 表20-1 22例患者三项指标观察结果(20-6)(20-5) 例20-1 收集了22例某病患者的三个指标(X1,X2,X3)的资料列于表20-1,其中前期患者(A)类12例,晚期患者(B)类10例。试作判别分析。 表20-1 22例患者三项指标观察结果 表20-2 变量的均数及类间均值差 (1)计算变量的类均数及类间均值差

4、Dj,计算结果列于表20-2。(2)计算合并协方差矩阵: 按公式(20-4),例如:代入公式(20-3)得得到合并协方差阵 表20-1 22例患者三项指标观察结果(20-5) 表20-1 22例患者三项指标观察结果(Zc=-0.147)二、判别效果的评价用误判概率P衡量 回顾性误判概率估计往往夸大判别效果。 第二级以后的判别函数可以用原来的指标,也可以更换其它指标。这种方法称为多级两类判别。进行多级两类判别时要特别注意归并类时有无实际意义。如果总类数比较少,判别效果可能较差。第二节 最大似然判别法(尤度法)适用于指标为定性指标的两类判别或多类判别。 例20-2 有人试用7个指标对4种类型的阑尾

5、炎作鉴别诊断,收集的5668例完整、确诊的病史资料归纳于表20-3。表20-3 5668例不同型阑尾炎病例的症状发生频率(%) 表20-3列出了各型阑尾炎出现的体征、症状的频率。注:用样本频率作为总体概率的估计值。表20-3 5668例不同型阑尾炎病例的症状发生频率(%) 资料:个体分两类或多类,判别指标全部为定性或等级资料。原理:用独立事件的概率乘法定理得到判别对象归属某类的概率(即:似然函数值=各指标的条件概率之积)。各条件概率之积(20-7)1.判别原理表20-3 5668例不同型阑尾炎病例的症状发生频率(%) 例如:表中情况的条件概率为: P1=0.570.730.720.950.08

6、0.310.22=P2=0.340.330.450.930.390.570.56=2.判别规则(找最大的似然函数值) 例20-2 有人试用7个指标对4种类型的阑尾炎作鉴别诊断,收集的5668例完整、确诊的病史资料归纳于表20-3。表20-3 5668例不同型阑尾炎病例的症状发生频率(%) 如:某病例昨晚开始出现右下腹痛、呕吐等症状,大便正常。经检查,右下腹部压痛,肌性防御(+)、压跳痛(+),体温36.6,白细胞23.7109/L。 3.最大似然判别法的应用 如某病例昨晚开始出现右下腹痛、呕吐等症状,大便正常。经检查,右下腹部压痛,肌性防御(+)、压跳痛(+),体温36.6,白细胞23.710

7、9/L。 根据表20-3得第三节 Bayes公式判别法适用于指标为定性指标的两类判别或多类判别。资料:个体分两类或多类,判别指标全部为定性或等级资料。原理:条件概率+事前概率(各病型或病种的总体构成比)分子: k类的似然函数值(各条件概率之积)k类的事前概率k类的(后验概率)分母: 所有类(1、2、k、g类)的似然函数值与其事前概率之积的和。1. 判别原理(20-8)2. 判别规则:(找最大的后验概率值)举例说明:例20-3 例20-2 有人试用7个指标对4种类型的阑尾炎作鉴别诊断,收集的5668例完整、确诊的病史资料归纳于表20-3。表18-3 5668例不同型阑尾炎病例的症状发生频率(%)

8、 如:某病例昨晚开始出现右下腹痛、呕吐等症状,大便正常。经检查,右下腹部压痛,肌性防御(+)、压跳痛(+),体温36.6,白细胞23.7109/L。 对例20-2中给出的待判病例有利用公式(20-8)计算得注意:Fisher判别:是寻找合适的投影方向,使样本在投影面上类内变异变小,类间变异增大,达到判别的目的;(定量资料)最大似然判别和Bayes公式判别:都是以概率为判别依据的,要求训练样本较大,否则判别效果难以保证。 (定性资料或等级资料) 第四节 Bayes判别适用于指标为定量指标的多类判别(也可用于两类判别)Bayes准则先验概率的确定判别规则Bayes判别的应用例20-4 欲用4个指标

9、鉴别3类疾病,现收集17例完整、确诊的资料,见表20-4。试建立判别Bayes函数。资料:个体分 g 类,判别指标定量(m个)。原理:Bayes准则(寻求一种判别规则使得属于第 k 类的样品,在第k类中取得最大的后验概率)。判别规则:(1)按判别函数值判别:计算判别对象的判别函数值,将判别对象判为判别函数值最大的那一类。(2)按后验概率判别:计算判别对象属于第k类的后验概率, 将判别对象判为后验概率值最大的那一类。 (两种判别规则的判别结果是完全一致的。) 例20-4 欲用4个指标鉴别3类疾病,现收集17例完整、确诊的资料,见表20-4。试建立判别Bayes函数。结果: g 个判别函数式当各类

10、的协方差矩阵不等时,得到的是非线性二次型Bayes判别函数比较复杂,不做介绍。原理:Bayes准则(寻求一种判别规则使得属于第 k 类的样品,在第k类中取得最大的后验概率)。(20-9)先验概率,一般取等概率,当样本较大且无选择性偏移使用频率代替。(20-12)(20-10)(20-11)例20-4 欲用4个指标鉴别3类疾病,现收集17例完整、确诊的资料,见表20-4。试建立判别Bayes函数。求得判别系数Cij(20-11)从而得到结果: g 个Bayes判别函数。(20-9)判别规则:应用:快速、正确。做e的(Yk-Yc)次幂的运算分母:所有类的 “做e的(Yk-Yc)次幂的运算”结果的和

11、(20-13)例20-4 欲用4个指标鉴别3类疾病,现收集17例完整、确诊的资料,见表20-4。试建立判别Bayes函数。判别规则:(1)按判别函数值判别(2)按后验概率判别:计算判别对象属于第k类的后验概率, 将判别对象判为后验概率值最大的那一类。Bayes判别函数 判别效果评价(误判概率):1)回顾性估计,见表20-62)刀切法法的误判概率: 。 目的:选取具有判别效能的指标建立判别函数(使:判别函数简洁、判别效果稳定)应用: 只适用于Bayes判别。原理:通过多元方差分析中的Wilks统计量 来筛选判别指标(判别指标的选入或剔除会导致 值的减小或增大)。第五节 逐步判别例20-4 欲用4个指标鉴别3类疾病,现收集17例完整、确诊的资料,见表20-4。试建立判别Bayes函数。例20-5 利用表 20-4的数据作逐步Bayes判别。 (筛选判别指标, ,值应大于值。)例20-4 欲用4个指标鉴别3类疾病,现收集17例完整、确诊的资料,见表20-4。试建立判别Bayes函数。例20-5 利用表 20-4的数据作逐步Bayes判别。 (筛选判别指标, ,值应大于值。)20-520-4判别效果评价: 误判概率为1/17=5.88%(回顾性估计,见表2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论