疾病诊断模型_第1页
疾病诊断模型_第2页
疾病诊断模型_第3页
疾病诊断模型_第4页
疾病诊断模型_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

疾病诊疗模型我们认真阅读了中国大学生数学建模比赛的比赛规则.我们完好理解在比赛开始参赛队员可以以任方式(包电话、电子件、网上咨询等与队外的何人(含指导教)研究议论与赛相关的题。我知道,窃他人的就是违比赛规则的,假如引用他人的成就或其余公然的资料(包含网上查到的资料),一定依照规定的参照文件的表述方式在正文引用途和参照文件中明确列出。我们郑重许诺,严格恪守比赛规则,以保证比赛的公正、公正性。若有违犯比赛规则的行为,我们将遇到严肃办理。我们参赛选择的题号是(从A/B/C/D中选择一项填写):我们的参赛报名号为(假如赛区设置报名号的话):所属学校(请填写完好的全名): 广东学院参赛队员(打印并署名):1. 邓思文2. 苏境财3. 吴妙指导师指教组责人 (打印并署名) 戴洪亮日期:2012 年8月18日1/23疾病诊疗模型2010高教社杯全国大学生数学建模比赛编号专用页赛区评阅编号(由赛区组委会评阅行进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国一致编号(由赛区组委会送交全国前编号):2/23疾病诊疗模型疾病诊疗问题跟着就压力添,降误诊的前下提诊疗率特别要的本文用确诊样数据立鉴模,并用模挑选主要素对就人员行诊。针对问(1),利用确诊数据成立Fiher鉴、回归和BP网络模型用、spss求解,定出鉴别标准,并进行明显性查验和回代查验,鉴别模型的正确率。结果显示Fisher鉴别模型的正确率为%,回归模型和BP神经网络模型正确率均为10%回归模型针对问题(2),选择问题一中查验正确率为100%的回归模和BP神经网络模型对0名就诊人员进行诊疗,结果以下表:回归模型 BP神经网络模型健康者生病者针对问题(3),成立

1822逐渐回归模型对元素进行挑选,利用

2119spss软确立Ca和Fe是影响人们患这类病的主要要素,所以在成立诊疗模型时,其余元素不作为参照指标。针对问题(4),挑选出主要影响要素后,将Ca和e作指标立回归模型和BP神经网络模型,发现两个模型的诊疗结果一致,以下:健康者 1019202223252627282930313233343637383940生病者 1 2 3 4 5 6 7 8 912345678145针对问(5),对照问题二和问题四结果,发现没关元素会影响模型进行诊疗的正确率。3/23疾病诊疗模型重点词Fisher鉴别模型回归模型BP神经网络模型逐渐回归模型人们到医院就诊的时候,往常经过化验一些指标来辅助医生诊疗。医生依据化验所得的元素含量,利用某种指标,判断病人能否生病。此题给出了附录1(确诊人数),和附录2(待诊人数),此中附录一1至30号是确立生病的病人,而31至60号是没有生病的健康人,要求回答以下问题:(1)、依据附件1中的数据,提出一种或多种简易的方法,判断属于生病者或健康人的方法,并查验你提出方法的正确性。(2)、依照(1)提出的方法,对附件2中的0名就诊人员的化验结果进行判断他(她)是生病者仍是健康人。(3)、可否依据附件1的数据特点,确立哪些指标是影响人们患这类病的重点或主要要素,一边减少化验的指标。(4)、依据(3)的结果,对附件2中的40名就诊人员的化验结果进行鉴别,判断他(她)们是生病者仍是健康人。(5)、对(2)和(4)的结果作进一步剖析。二、问题剖析跟着就医压力增大,简易的医学化验标准和方法能够大大提升医生诊疗的效率。依照已确诊的病例数据特点,对就诊病例进行分类,辅助医生做出正确的医疗判断。4/23疾病诊疗模型针对问题(1),要求利用附录1已确诊的病例数据找出一种或多种简易的方法,判断就诊人员生病与否。依照附录1中0位已确诊病例,可从生病者与健康者体内的 7种元素含量下手,即剖析确诊人员的体内元素含量和生病与否的关系。所以,可结构各种鉴别剖析法,同时对其进行查验,再利用已知数据回代,分别计算不一样鉴别方法的正确率并进行比较。针对问题(2),鉴于问题(1),可选择正确率最高的判断方法对附录2的就诊人员进行病例判诊,诊疗出就诊人员能否健康。针对问题(3),问题二中两个正确的模型出现不一样结果,所以能够确立存在扰乱要素,利用逐渐回归模型确立主要影响元素,提升诊疗的正确率与速度。针对问题(4),清除没关元素,利用问题(1)中确立的模型从头成立诊疗函数,对40名就诊人员从头进行诊疗。针对问题(5),经过比较问题(2)和问题(4)元素和结果的改变,剖析影响诊疗结果的要素是什么。三、模型假定(1)假定检测数据正确无误。(2)假定确诊人员中没有误诊的状况出现。四、符号说明符号 符号说明Gi 确诊病例整体,i1,2i 体Gi数据矩阵5/232A疾病诊疗模型2Aci 疾病鉴别函数的各系数,i 0,, ,7 Gi的鉴别值P 鉴别模型的正确率,即1-误判率(,i) 网络学习样本,iBi为 隐含层第i个神经元的输出w 各层权系数iji 阀值BP神经网络的学习率e 输出层输出值与希望输出值的偏差E( 在自变量下的希望或概率Score 单元素的得分符号 符号说明Gi 确诊病例整体,i 1,2i 整体Gi数据矩阵ci 疾病鉴别函数的各系数,i 0,, ,7 Gi的鉴别值(,Bi) 网络学习样本五、解问题一的求解依照检查结果,对就诊人员进行健康与否诊疗的方法有多种,依据已知限制条件,本文选择此中三种鉴别剖析模型:Fisher鉴别模型、二类logistic回归鉴别模型以及BP神经网络模型。同时,为了查验三种鉴别剖析模型的正确率,我们引入一个变量 P为准确率。6/232323W2 5p 5.1.1Fisher鉴别模型5.1.1.1Fisher鉴别模型的成立与求解将生病和健康为两个整体:

G1

G2

,而且都以体内检测的7个元素作为其会合元素。Fisher鉴别主要借助方差剖析的思想,利用投影,将这两个整体投影到一个方向,成立线性鉴别函数,并利用鉴别规则,经过计算后得出检查结果属于(1)确立原始数据矩阵

G G1或2。以各元素为列向量,以就诊人员为行向量,结构对于病患和健康者的两个矩阵。G1的数据矩阵为:166 1.8... 531 185 1.7... 47............178 2.8... 19G2的数据矩阵为:17019.1...8213.9...30............19 .. 302)计算两组各素数据的匀值。矩阵

W1

,W2的列均匀数散布为:X=(,,,,,)X=(,,,,,,)(3)利用微分学的方法,计算系数ci,i=1,2,3,4,5,6,7要表现出分组的两个特点:①、组间差距越大越好;②、组内差距越小越好。可得出以下公式:ll,l,l,l,l,l7)

(x1-x2)230 60(x1-x1)2 (x2

-x2)21 317/2312疾病诊疗模型12对其求偏导,得出

Cc=i。(4)确立鉴别函数y c1x1 c2x2 c3x3 c4x4 c5x5 c6x6 c7x7G G(5)计算1、2代表的鉴别值7y1 cixii 17y2 cixii 1得出鉴别值为:y0

30y1 30y260(6)上述计算过程,可由matlab编程实现,代码见附录得出结果以下:y -0.000069x1 0.00346x2-0.000337x3-0.0000624x4-0.000199x5 0.0000137x6 0.0000629x9y1 -.075y2 -0.12y0 -0.yy y G所以,在此题中1>0,当y>0时,y的样本属于1,即样本属于生病者。反之样G本属于2,即样本属于健康者。5.1.1.2Fisher鉴别法的查验利用F查验,设明显性水平=.计算统计量下:F stst-p-1 y1-y2 30303030-7-1 y1-y=st p030 7F(2)F(7,50)=所以,F>F(7,50)>F(7,52).8/23疾病诊疗模型说明鉴别函数是有效的,进而能够用来做鉴别。5.1.1.3Fisher鉴别回代查验将已确样回代判断得出生病值表 (见附和健康者查验值如表:表:健康者查验值病例号 查验值 病例号31 -0. 41

查验值 病例号 查验值-0. 5132 42 -0. 52 -0.33 43 53 -0.34 -0. 44 54 -0.35 -0. 45 5536 -0. 4637 -0. 47

-0. 56 -0.-0. 5738 48 -0. 58 -0.39 49 -0. 59 -0.40 50 60由表5.1.1-1和表,生者查正确而健被误为生的个有 4个,分别就诊员3238、39和60,它们都大。所以,Fishr鉴别型确率P为:P=56=%.605.1.2BP神经网络由定理得出,以双曲线正切函数为激活函数的三层 BP神经网络,能够以随意精度迫近随意连续函数。而且,有导师学习的BP神经网络实质是在对学习样本进行学习的过程中,利用梯度降落法,不停反应改正权值,直到网络输出与希望值的偏差小于给定标,束学训练并固联络值测样出适。以, BP网络对于解决鉴别就诊人员健康与否的问题特别适用、有效。9/23AiAiw1225.1.2.1有导师学习的BP神经网络模型的成立(1)确立学习样本以样本Ai,Bi)作为学习样本,此中,输入数据为(,,,x),Bi(,,,)为相应的希望输出值。当i 12, ,30,i表示已确诊为生病的1-0号病例;当i 3,2, ,60时,A表示已确诊为健康的31-60号病例。(2)结构前向三层网络 Lppmann研究[2]k个实数值样本,有2k+1个隐节点的三层网络能够记忆它们,这个隐以是任何渐近函数,可设隐含层节点N=5,即能使网络记忆所有样本信息。其结构如图:8

3 隐含层(节点数为5) 输出层图5.1.2-1神经网络结构图(3)计算各层输出对于隐含层的第i个神经元的输出,有11

1,in(

1) i,di2

n1 wj1 ij

f(u)j,ii此中,Sigmoid函数f(ui ) 11e

u2 ,各层权系数ij随机初始化,10/23i2ii2i id21而输出层输出值3 (0,1).(4)求各层的学习偏差输出层偏差为d3 (1,隐含层偏差为d2 (1)wd3.(5)修正权系数ij和阀值i,有:输入层与隐含层的连结权重:隐含层与输出层的链接权重:

wij(t1) w(t)w(t 2)w()i ij

ixjd .i此中,t为学习次数,为学效长,较小。(6)判断学习结束,查验网络偏差给出偏差函数e (3 )的标准若知足偏要求,学结束,固权系数,2i并从头对样本进行查验,计算出网络命中率;不然,向来循环至最大迭代次数 n。(7)输入待测病例样本,对病例样本进行健康与否分类。5.1.2.2BP神经网络模型的求解利用Matlab编程,设置学习率=,最大迭代次数为50000次,偏差为e E10,网络学训固定重后再学习本为待样进入络行健与否验分类查验果表 ::生病查验值例号 验值 例号 验值 例号 验值1 11 212 12 223 13 234 14 245 15 2511/230f0f(p)(fp)678910由查验结果表示,BP

1617181920神经网络的查验正确率

2627282930P=100%5..3Loistc回归剖析模型Loistc回归剖析是对定向变量的回归剖析,而因为因变量分为两类,取值只有1(生病者)和0(健康者),所以不可以用一般的回归剖析。此处可将和1的因变量失散值,改为连续的函数,进而获得它与7种元素关系而经过类系即判就诊员能否生。.1sc回归剖析模的立与解(1)设因变量为y,且有以下简单线性回归方程:x x x x x x xy 0 1223345567因为y取值是失散型的记p p( ,1p p( 0,即获得希望:E( 0(1 p) 1 p p则有:x x x x x xE(y) 1 1 2 2 3 3 4 4 5 5 6 6 7x7=PE(y)表示在自变量xi的条件下y1的希望或概率。即其logistic回归方程为:e e( xx x x x x x)0 1122 33 4 4 5 5 6 6 7 71ep e x x xxx x x)f(p) 0 11 2 2(334455 6 6 7 7(2)因为 对x的变化迟缓,所以引入 的logistic变换,即:g(p) ln( fp))1f(12/23疾病诊疗模型f(p)明显,g(p)以ln(

)=0为中心对称,且在(p)=0和f(p)=1间变化幅度大,如图:1 fp)图:logistics回归曲线显示(3)依据所给的样本值,进行参数预计,可利用spss求得logistic回归方程系数估计,获得方程:f(p)g( ln( ) 39.3521(

0.584x 0.4x2 1.771x 1.05x4 0.028x 0.289x 0.16x7(4)将g(p)回代,求出回归方程f(exp(39.352f(p)=1exp(39.352

0.584x0.584x

0.4x2 1.771x 1.05x40.4x2 1.771x 105x4

0.028x50.028x5

0.289x0.289x

016x)0.16x7)若f(0,),则属于健康人,记为0;反之属于生病者,记为1。(5)模型查验13/23疾病诊疗模型由上表得,-2对数似然值为0,说明模型对数据达到完满拟合,且Cox&SnlNaglkekeR方统计量分别为和1,说明说回归异比大效好。将60名已确诊生病与否的就诊人员检测结果代入f(p),获正确P=60=100%60问题二的求解鉴于问题一Fisher鉴别、BP神经网络以及logistc回归模型的正确率分别为%、100%、100%,在此处选择BP神经网络和ogistic回归模型对0名就诊人员进行健康与否鉴别,得出诊疗结果如表和表:表:BP神经网络对就诊人员的分类诊疗 1 11 21 312 12 22 323 13 23 334 14 24 345 15 25 356 16 26 367 17 27 3714/23疾病诊疗模型8 18 28 389 19 29 3910 20 30 40由上表可看出,健康者为病例号6,7,10,19,20,22,23,24,25,26,27,28,29,30,31,32,34,36,38,39,40,共21人;生病者为病例号1,2,3,4,5,8,9,11,12,13,14,15,16,17,18,21,33,35,37,共9人。表:回归剖析对就诊人员的分类诊疗查验值待查验查验值1 1 11 12 1 12 13 1 13 14 1 14 15 1 15 16 1 16 17 1 17 18 1 18 19 1 19 010 0 20 0

查验值21 1 31 022 0 32 023 0 33 124 1 34 025 0 35 026 0 36 027 0 37 128 0 38 029 0 39 030 0 40 0由上表可看出,健康者为病例号10,19,20,22,23,25,26,27,28,29,30,31,32,34,36,38,39,40,共18人;生病者为病例号1,2,3,4,5,6,7,8,9,11,12,13,14,15,16,17,18,21,24,33,35,37 ,共22人。BP神经网络和回归在6,7,24号病例就诊时出现偏差,6,7,24号病例在BP神经网络测试中分为健康者,而在回归中则为生病者。问题三的求解5.3.1二项逐渐回归模型的成立与求解15/23疾病诊疗模型鉴于问题一中二项logistic回归模型,在SPSS数据剖析选择二元logistic回归的前条件方法,经多次试验,取进入步进概率 p1=,删除步进概率p2=,进logsic逐步回归过程。(1)拟合起步前不包含查验元素(常量)的logsic模型0.05,进入logistic模型对单元素变量进行卡方查验, g0.05,不可以进入ogistic模型(2)假定已逐渐到第i步,引入剔除变量对j单元素的得分Soe,自由度df以及Sig值,最为明显的元素即Sig最小最初引入到logistic模型,若min(Sig)不只一个,此中Score最大优先选择。得分公式为:60[

xi(yi y)]2Scorej= i1y(1 y)

60(xi x)2i1(3)利用以上公式,将数据输入SS上表够看,所有的Sg都是0,而卡方愈来愈大,说明愈来愈明显。16/23疾病诊疗模型(4)鉴别拟合成效。由Hosmer和Lemeshow查验的随机性表可察看到观察值与希望值靠近,说明模型拟合得比较理想。由上图“假如移去项则建模”的步骤1能够看出,移去Ca项时,会惹起的数值改正。只剩下常数项。在步骤2中,移去Fe项时,会惹起的数值改变。只剩下Ca和。步骤1和步骤2中,不论移除哪一项,改正的明显性都特别小,所以两项都不可以移除。由此,可得出一个新的ogistic回归模型:17/231疾病诊疗模型1f(p)g(p)ln( )977.9540.556x11f(p)

11.509x2即:f(p)=exp(g(p))1 exp(g()

exp(977.9540.556x=1exp(977.9540.556x1

11.509x2)11.509x2)同第一问中的logistic用法相同,当f( (0,)时,就诊属健康,为0;之,于病者记为1.利用第问数据考上述式f(p)。得出结果与问题一的结果相同,正确率为P=100%。问题四的求解利用问题二的方法,依据问题三得出的结论,利用Ca和Fe作为检测指标,求解未确诊的0名就诊人员。获得以下结果:表利用Ca和Fe作为指标的BP神经网络病例测定待查验 查验值 待查验 查验值 待查验 查验值 待查验 查验值1 11 21 312 12 22 323 13 23 334 14 24 345 15 25 356 16 26 367 17 27 378 18 28 389 19 29 3910 20 30 40由上表可看出,健康者为病例号10,19,20,22,23,25,26,27,28,29,30,31,32,34,18/23疾病诊疗模型33,36,37,38,39,4016,17,18,21,24,35

,共0人;生病者为病例号1,2,3,4,5,6,7,8,9,11,12,13,14,15,,共0人。表利用Ca和Fe作为指标的模型病例测定待查验查验值待查验查验值1 1 11 12 1 12 13 1 13 14 1 14 15 1 15 16 1 16 17 1 17 18 1 18 19 1 19 010 0 20 0

待查验查验值待查验查验值21 1 31 022 0 32 023 0 33 024 1 34 025 0 35 126 0 36 027 0 37 028 0 38 029 0 39 030 0 40 0由上表可看出,健康者为病例号10,19,20,22,23,25,26,27,28,29,30,31,32,34,33,36,37,38,39,4016,17,18,21,24,35

,共0人;生病者为病例号1,2,3,4,5,6,7,8,9,11,12,13,14,15,,共0人。问题五的求解模型和BP神经网络模型是以已确诊样本为基础成立的,经过查验后两个模型的正确率都是100%,而在问题二中对40名待诊者进行诊疗出现不一样结果,说明两个模型在成立过程中,有扰乱要素影响了模型的正确性,在问题三中挑选出主要影响元素后,再对相同的就诊者进行查验,出现的结果是完好一致的,说明选用与疾病没关的元素作为查验指标会影响模型的正确性。在问题中进一步个较准确的对患者进行诊疗。剖析问题二和问题四中出现的结果,说明在医学查验中,挑选主要要素不仅仅能够19/23疾病诊疗模型提升查验效率,更能够提升查验模型的正确率,防止误诊。六、模型评论模型的长处:1、Fisher鉴别模型的运用简单,在模型成立此后,直接利用指标值和线性鉴别函数就能够进行诊疗。2回归模型能够直接利用成立的回归方程进行诊疗,且拥有当的正确3、BP神经网络模型拥有较高的正确性,进行诊疗时,拥有相当的靠谱性。模型的弊端1、Fisher鉴别模型缺少正确率,比较简单出现误判的现象。2、BP神经网络模型在实质操作比较复杂,推行性相对弱。3、在成立模型过程中,利用所有样本数据进行建模,进行回代查验,缺少必定的客观性。六、模型改良成立模型过程中,因为数据样本量的限制,没有将数据分为训练组和查验组,这致使模型的成立缺少必定的客观性。为了提升模型的客观性和正确性,对数据进行采集,在样本量达到必定量的状况下将数据分为训练组和查验组,使模型更具客观性和正确性。一、参照文件

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论