肾炎诊断的数学模型_第1页
肾炎诊断的数学模型_第2页
肾炎诊断的数学模型_第3页
肾炎诊断的数学模型_第4页
肾炎诊断的数学模型_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精选优质文档-倾情为你奉上肾炎诊断的数学模型摘要本文解决的是肾炎的诊断的问题。人们到医院就诊时,其是否患肾炎通常要化验人体内各种元素的含量来协助医生的诊断。为解决此问题,我们建立了距离判别的数学模型。对于问题一:我们提出了欧式距离与马氏距离两种方法来判别就诊的是患者还是健康人。我们选取出表B.1中1-30号已确诊为肾炎病人的化验结果作为总体A, 31-60号已确诊为健康人的化验结果作为总体B。然后,我们根据表B.1的数据特征模拟出30组已确诊为肾炎病人的化验结果和30组已确诊为健康人的化验结果作为样品C,然后我们将样品C用欧式距离模型进行判别,得到的误判率为23.33%;用马氏距离模型判别,得

2、到的误判率为13.3%。为此,我们选用马氏距离法。为了使误判率降低,我们对模型进行改进,引入误判因子,此时的误判率降为3.33%。对于问题二:我们用改进了的马氏距离判别模型将判断表B.2的化验结果进行判别,得出如下结果:61626364656667686970患病患病正常患病患病患病正常正常患病正常71727374757677787980患病患病患病正常正常患病正常正常正常正常81828384858687888990正常正常患病正常患病正常正常正常正常正常对于问题三:为了确定影响人们患肾炎的关键或主要因素,我们选取出表B.1中1-30号已确诊为肾炎病人的化验结果按照元素种类划分总体,分别为A1

3、(Zn),A2(Cu),A3(Fe),A4(Ca),A5(Mg),A6(K),A7(Na),同理, 31-60号已确诊为健康人的化验结果划分总体为B1,B2,B3,B4,B5,B6,B7。然后,我们根据表B.1的数据特征模拟出30组已确诊为肾炎病人的化验结果和30组已确诊为健康人的化验结果划分为样本D1,D2,D3,D4,D5,D6,D7,然后根据我们建立的改进后的距离判别模型,用马氏距离法逐个算出由该元素带来的误判率。然后将相似结果的元素组合用马氏距离法与原数据进行计算比较,我们得出影响人们患肾炎的关键或主要元素为Fe,Ca,Mg,K。对于问题四:我们将自己确定的关键元素Fe,Ca,Mg,K

4、作为检验指标,再次根据建立后改进的距离判别的数学模型,用马氏距离方法将判断表B.2的化验结果进行判别,得出如下结果:61626364656667686970患病患病患病患病患病患病正常正常患病正常71727374757677787980患病患病患病正常正常患病正常正常患病正常81828384858687888990正常正常患病正常患病正常患病正常正常正常对于问题五:将问题二,四的结果进行比较我们得知发现,根据我们确定出来的关键元素Fe,Ca,Mg,K作为指标,我们从被诊断为健康人的数据中发现了3组患肾炎的,而原被诊断为患肾炎的数据数目没变,根据我们在诊断的过程中不会把患肾炎的诊断成健康人,这进

5、一步验证了我们选取的元素指标的正确性。关键词:肾炎诊断,马氏距离,距离判别1、问题重述人们到医院就诊都是一些很普遍的问题。在人们就诊前,通常是需要通过化验一些元素来确认。在诊断就诊人员是否患肾炎时,我们同样是对人体内各种元素含量进行化验,以其中的一些指标来协助医生的诊断。在本文中,我们考虑肾炎的诊断数学建模问题。在表B.1中,是确诊病例的化验结果。其中1-30号为已确诊为肾炎病人的化验结果,31-60为已确诊为健康人的化验结果。表B.2是就诊人员的化验结果。具体数据见附录(一)。本文需解决的问题有:问题一:根据表B.1中的数据,提出一种或多种简便的方法,对来就诊的人进行判别是属于患者或健康人,

6、并且还要检验我们提出方法的正确性。问题二:按照问题一提出的方法,判断表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。问题三:能否根据表B.1的数据特征,确定那些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标。问题四:根据问题三的结果,重复问题二的工作。问题五:对问题二和问题四的结果作进一步的分析。2、模型的假设与符号说明2.1模型的假设假设1:题目所给的数据是合理的,正确的;假设2:化验结果中的各种元素之间的相关性干扰比较小;假设3:模型检验的结果达90%以上的正确,我们认为模型正确;假设4:模拟生成的30个正常数据和30个患病数据全部符合样本要求;

7、2.2符号说明符号符号说明总体为k的协方差矩阵以表B.1中1-30号各种元素的均值对应的矩阵由矩阵中的第j个元素构成的矩阵以表B.1中31-60号各种元素的均值对应的矩阵由矩阵中的第j个元素构成的矩阵我们模拟的数据构成的矩阵模拟数据的第i行构成的矩阵由矩阵的第i行第j列的元素组成的矩阵D由马氏距离法得出的距离平方差值d由欧式距离法得出的距离平方差值表示样本y到总体均值为G的距离u误判因子,数值确定为4其中,;i=1,230 j=1,2,7 k=1时分别表示表B.1中1-30号已确诊为肾炎病人的化验结果;k=2时表示表B.1的31-60号已确诊为健康人的化验结果;k=3,4,5,6,7,8,9,

8、时,分别表示表B.1中1-30,31-60,号已确诊为健康人的化验结果以Zn,Cu,Fe,Ca,Mg,K,Na元素种类划分的数据3问题的分析此题研究的是一个肾炎的诊断的建模问题。当人们到医院就诊时,我们通常是要化验一些指标来协助医生的判断。诊断就诊人员是否患肾炎时也是如此,我们通常也要化验人体内各种元素含量。我们于是对题目给的数据,建立了距离判别的数学模型,根据模型,我们对病例进行判定,病例样本到两个总体,的距离分别为,如果,我们则说样本跟总体距离最近,即样本属于总体该类;如果,我们则说样本跟总体距离最近,即样本属于总体该类;然后通过判别出来的病例数据与原已确认的病例的数据进行比较,得出误判率

9、,将该误判率作为我们评价模型的指标,误判率越小,则说明我们建立的模型越优。针对问题一:根据表B.1的数据,我们提出了欧式距离和马氏距离两种判别方法。为了检验我们提出的方法的正确性,我们选取了选取出表B.1中1-30号已确诊为肾炎病人的化验结果作为总体A, 31-60号已确诊为健康人的化验结果作为总体B。然后,我们根据表B.1的数据特征模拟出30组已确诊为肾炎病人的化验结果和30组已确诊为健康人的化验结果作为样品C,分别用这两种方法来检验。对于欧式距离法,我们根据我们建立的距离判别的数学模型,用欧式距离马氏距离法,为了简化计算,我们求两个距离平方之差,当D(d)0时,我们则说与总体已确诊为健康人

10、的化验结果距离较近,属于健康人,当D0时,则说与总体已确诊为肾炎的化验结果距离较近,属于患有肾炎的。经计算比较得到两种方法的误判率。根据误判率,我们出距离判别模型。由结果可知,我们将选用马氏距离法进行判别。针对问题二:我们选用已确定的马氏距离法,对表B.2的数据逐个进行计算,用距离判别法逐个进行判别,得出结果。针对问题三:我们选取出表B.1中1-30号已确诊为肾炎病人的化验结果按照元素种类划分总体,分别为A1(Zn),A2(Cu),A3(Fe),A4(Ca),A5(Mg),A6(K),A7(Na),同理, 31-60号已确诊为健康人的化验结果划分总体为B1,B2,B3,B4,B5,B6,B7。

11、然后,我们根据表B.1的数据特征模拟出30组已确诊为肾炎病人的化验结果和30组已确诊为健康人的化验结果划分为样本D1,D2,D3,D4,D5,D6,D7,通过我们建立后改进的距离判别模型,用马氏距离法计算可得到各种元素在诊断病情时带来的误判率,然后我们再以总体A总体B的7种元素均值,并选取表B.1中病例号为1,2,4的作图。根据图形和误判率,我们得出可能为关键或主要因素的6组元素的组合。接着,我们对每个组合按照我们检验出的指标元素用改进后的距离模型可得到各种情况的误判个数和此时对应的误判组号。然后再根据马氏距离模型的差值D来判别指标。经计算,Fe,Ca,Mg,K为主要判别指标。针对问题四:根据

12、我们确定的Fe,Ca,Mg,K四种元素指标,用马氏距离法,再根据我们建立的距离判别模型得出结果。针对问题五:我们对于问题二和问题四得出的结果,我们得到,根据我们确定出来的关键元素Fe,Ca,Mg,K作为指标,我们从被诊断为健康人的数据中发现了3组患肾炎的,而原被诊断为患肾炎的数据数目没变,根据我们在诊断的过程中不会把患肾炎的诊断成健康人,这进一步验证了我们选取的元素指标的正确性。4、数据分析原则一:我们在判别的过程中不会将患病的诊断出没患病的,但我们可以把一些指标值不是太明显的健康人诊断为患病(类似于住院做进一步检查)。原则二: 非主要元素对主要元素的判断会产生影响(类似于非主要元素数值过大影

13、响判断)定义1:在马氏距离判别模型中的距离平方差值D接近0的附近为易误判区域。由题目所给的数据我们可计算得到:以表B.1中1-30号各种元素的均值对应的矩阵=( 143.10 12.3323.07 698.17113.34 201.13526.83 )以表B.1中31-60号各种元素的均值对应的矩阵:=( 186.6 21.92 62.01 2511.13 295.14 90.37 367.21 )其中:表示的是表B.1中1-30号已确诊为肾炎病人的化验结果的各项元素的均值;表示的是表B.1的31-60号已确诊为健康人的化验结果的各项元素的均值;经过比较我们可知,这两个总体的均值是有显著差异的

14、。在易误判区域内,我们引入了误判因子,使得我们能够更好的判别,再使得有患病可能的提前做好预防。得出误判因子u的具体流程如图所示:经计算,我们得出误判因子u=45问题一的解答5.1模型的建立根据题意,我们建立了欧式距离和马氏距离两个距离判别模型。对于欧式距离法,我们选取出表B.1中1-30号已确诊为肾炎病人的化验结果作为总体A, 31-60号已确诊为健康人的化验结果作为总体B。然后,我们根据表B.1的数据特征模拟出30组已确诊为肾炎病人的化验结果和30组已确诊为健康人的化验结果作为样品C,分别用这两种方法来检验。对于欧式距离法,我们根据我们建立的距离判别的数学模型,用欧式距离公式,分别求出样本C

15、到总体A已确诊为肾炎病人的化验结果矩阵和总体B已确诊为健康人的化验结果矩阵的距离。于是我们得到目标函数d=,对于马氏距离法,同理,为了简化计算,我们求两个马氏距离平方之差作为目标函数即为:D=-其中,= ,=综上所述:得到欧式距离法的模型为:d= -其中,得到的马氏距离法的模型为:D=-其中,= ,=5.2模型的求解将相应的数据分别代到上述模型中,分别判断差值。如果平方差值d(D),则我们说该样品属于健康人的总体,反之,属于患肾炎的总体。经计算,我们得到用欧式距离判别此时的误判率为23.33%;用马氏距离判别,得到此时的误判率13.33%。为此,我们选用马氏距离法。但是此时的误判率并不是很让人

16、满意,于是我们引入误判因子u=4,即在得到的差值D上加上误判因子u,重新用马式距离判别误判率为3.33%为此,我们选用改进后的马氏距离方法来判别就诊的是属于患者或健康人。5.3 结果分析用欧式距离判别,得到10组确诊为肾炎病人,此时的误判率为33.33%;用马氏距离判别,得到15组确诊为肾炎病人,此时的误判率0。加入误判因子u后马氏距离判别误判率为3.33%。此时误判率大大提高了,说明误判因子使诊断更精确。验证了我们的马氏距离判别模型的正确性。6 问题二的解答根据问题一提出的马氏距离判别模型,得到的马氏距离法的模型为D+u=-+u其中,= ,=此时,X为表B.2的需要判定的数据。根据D+u的值

17、来判别,当D+u时,我们则诊断它为健康人;当D+u0时,则诊断为肾炎患者。经过计算,我们得到如下结果,如图所示:61626364656667686970患病患病正常患病患病患病正常正常患病正常71727374757677787980患病患病患病正常正常患病正常正常正常正常81828384858687888990正常正常患病正常患病正常正常正常正常正常7.问题三的解答根据表B.1的特征,我们仍然是用改进了的马氏距离法距离判别模型。D+u=-+u其中, = , = K=3,4,5,9根据D+u的值来判别,当D+u时,我们则诊断患者该元素是健康人的,此时就会出现误判,反之,则诊断出该元素是患有肾炎的

18、。代入数值,经过计算得到,我们得出的误判率如表B.3所示:表B.3元素ZnCuFeCaMgKNa误判率36.7%63.3%63.3%13.3%26.7%23.3%40%由于此时的误判率太高,影响肾炎诊断的不是单一元素。我们取表B.1中1-30号已确诊为肾炎病人的化验结果中的1,2,4组结果,再对表B.1中1-30号已确诊为肾炎病人的化验结果和31-60号已确诊为健康人的化验结果对各种元素求取均值,然后,我们对这五组值画出图表如下所示:注:黄线分别表示健康人的各种元素的均值;红线表示肾炎病人的各种元素的均值;蓝线表示选取的样本的数据。横轴1、2、3、4、5、6、7分别表示Zn、Cu、Fe、Ca、

19、Mg、K、Na元素的指标通过上图,我们初步估计:对肾炎的诊断有影响的元素可能是后面5种Fe,Ca,Mg,K,Na中的几种元素,根据表B.3的结果,经过排列组合,我们得出了6种组合,根据各种情况确定的判别指标,再根据我们建立的马氏距离判别模型进行判别。于是,我们重新根据新的判别指标再取出表B.1中1-30号已确诊为肾炎病人的化验结果作为总体A, 31-60号已确诊为健康人的化验结果作为总体B。然后,我们根据表B.1的数据特征模拟出30组已确诊为肾炎病人的化验中结果和30组已确诊为健康人的化验的结果作为样品C,然后我们将样品C用马式距离判别模型对每种情况指标里的元素进行判别,D+u=-+u其中,

20、= , =根据D+u的值来判别,当D+u时,我们则诊断患者该元素是健康人的,此时就会出现误判,反之,则诊断出该元素是患有肾炎的。将我们计算得出的结果与并与有7种元素得出的判别结果和原已确认的结果进行比较,得出结果如下:组合All Ca,Mg,KCa,MgCa,Mg,K,NaCa,Mg,NaFe,Ca,Mg,KFe,Ca,Mg误判有病2111122对应病历号13 181818181813 1813 18误判个数0111100对应病历号13131313通过图表可知:Fe,Ca,Mg,K组合与Fe,Ca,Mg组合均与原判别结果相同,于是,我们再次对这两组用马氏距离判别模型对病历号为13,18的进行判

21、别,Fe,Ca,Mg,K组合得到差值分别为D1=0.4,D2=2.2;Fe,Ca,Mg组合得到差值分别D3=5,D4=10,而7种元素的组合得到的差值分别为D5=0.5和D6=2.5,经比较我们发现Fe,Ca,Mg,K组合更与七种元素的结论相符,为此,我们确定Fe,Ca,Mg,K四种元素是影响肾炎诊断的主要因素。结果分析:根据表B.1的数据特征,我们得出了将Fe,Ca,Mg,K作为化验的指标,同样的可以让误判率达到3.33%,进一步验证了我们的化验指标的正确性。8.问题四的解答根据我们确定的化验指标Fe,Ca,Mg,K,用马氏距离判别模型对表B.2中的30名就诊人员的化验结果进行判别,得到的马

22、氏距离法的模型为D+u=-+u其中,= ,=此时,X为只含指标元素的模拟数据构成的矩阵以表B.1中1-30号只含指标元素的均值对应的矩阵以表B.1中31-60号只含指标元素的均值对应的矩阵根据D+u的值来判别,当D+u时,我们则诊断患者该元素是健康人的,此时就会出现误判,当D+u0,则诊断出该元素是患有肾炎的。代入数据,经过计算比较,得出的结果如下所示:61626364656667686970患病患病患病患病患病患病正常正常患病正常71727374757677787980患病患病患病正常正常患病正常正常患病正常81828384858687888990正常正常患病正常患病正常患病正常正常正常9.

23、问题五的解答对问题二和问题四的结果中,我们可以看出,根据我们确定出来的关键元素Fe,Ca,Mg,K作为指标,我们在问题四的结果中发现了在问题二的结果中原被诊断为健康人的3组患肾炎的数据在问题四的结果中被判为患病,同样在问题四的结果中,在问题二的结果里被诊断为患肾炎的数据数目没变,根据我们定义的原则一我们在判别的过程中不会将患病的诊断出没患病的,但我们可以把一些指标值不是太明显的健康人诊断为患病(类似于住院做进一步检查),所以主要元素所诊断的结果符合问题二的结果,这进一步验证了我们选取定的主要元素组合是正确的。 10. 模型的评价,改进及推广10.1模型的评价优点:(1)根据我们确定的马式距离判

24、别模型,引入了误判因子,我们将误判率由13.33%降为3.33%;(2)在诊断是否患肾炎的过程中,减少了化验指标,节省了更多的资源;缺点;由于所给数据太少以致在统计数据时不是很准确,又由于计算机模拟带有一定的随机性,以致得到模型的误判率不是很让人满意10.2模型改进(1)查询更多的数据,以使得统计结果更正确,也可使计算机模拟更少的数据或不模拟以减少不确定性(2)应该建立元素之间的相关联系,使得模型更加完整。10.3模型推广我们建的模型不仅可用于肾炎的诊断问题,也可用于其它资源的诊断判别,还可用于诸如像试卷评价模型的其它类型的问题;其中最为关键的就是如何选取对问题中结论有影响的相关因素,同时在此

25、基础上如何降低模型的复杂度,使其具有通用性。参考文献1张尧庭、方开泰著:多元统计分析引论,科学出版社,北京,1982。 2丁士晟编著:多元分析方法及其应用,吉林人民出版社,长春,1981。3 Frank R.Giordano,Maurice D.Weir,William P.Fox 著. 数学建模(英文版,第三版). 北京,机械工业出版社4 F R Giordano,et.al . A First Course in Mathematical Modeling. Cole Publishing Company,19975 朱道元等编. 数学建模案例精选. 北京, 科学出版社,2003附录代码实

26、现:% a,b,c矩阵(a为有病数据,b为没病数据,c带测定数据)A=166 15.8 24.5 700 112 179 513;185 15.7 31.5 701 125 184 427;193 9.80 25.9 541 163 128 642;159 14.2 39.7 896 99.2 239 726;226 16.2 23.8 606 152 70.3 218;171 9.29 9.29 307 187 45.5 257;201 13.3 26.6 551 101 49.4 141;147 14.5 30.0 659 102 154 680;172 8.85 7.86 551 75.

27、7 98.4 318;156 11.5 32.5 639 107 103 552;132 15.9 17.7 578 92.4 1314 1372;182 11.3 11.3 767 111 264 672;186 9.26 37.1 958 233 73.0 347;162 8.23 27.1 625 108 62.4 465;150 6.63 21.0 627 140 179 639;159 10.7 11.7 612 190 98.5 390;117 16.1 7.04 988 95.5 136 572;181 10.1 4.04 1437 184 101 542;146 20.7 23

28、.8 1232 128 150 1092;42.3 10.3 9.70 629 93.7 439 888;28.2 12.4 53.1 370 44.1 454 852;154 13.8 53.3 621 105 160 723;179 12.2 17.9 1139 150 45.2 218;13.5 3.36 16.8 135 32.6 51.6 182;175 5.84 24.9 807 123 55.6 126;113 15.8 47.3 626 53.6 168 627;50.5 11.6 6.30 608 58.9 58.9 139;78.6 14.6 9.70 421 70.8 1

29、33 464;90.0 3.27 8.17 622 52.3 770 852;178 28.8 32.4 992 112 70.2 169; B=213 19.1 36.2 2220 249 40.0 168;170 13.9 29.8 1285 226 47.9 330;162 13.2 19.8 1521 166 36.2 133;203 13.0 90.8 1544 162 98.90 394;167 13.1 14.1 2278 212 46.3 134;164 12.9 18.6 2993 197 36.3 94.5;167 15.0 27.0 2056 260 64.6 237;1

30、58 14.4 37.0 1025 101 44.6 72.5;133 22.8 31.0 1633 401 180 899;156 135 322 6747 1090 228 810;169 8.00 308 1068 99.1 53.0 289;247 17.3 8.65 2554 241 77.9 373;166 8.10 62.8 1233 252 134 649;209 6.43 86.9 2157 288 74.0 219;182 6.49 61.7 3870 432 143 367;235 15.6 23.4 1806 166 68.8 188;173 19.1 17.0 249

31、7 295 65.8 287;151 19.7 64.2 2031 403 182 874;191 65.4 35.0 5361 392 137 688;223 24.4 86.0 3603 353 97.7 479;221 20.1 155 3172 368 150 739;217 25.0 28.2 2343 373 110 494;164 22.2 35.5 2212 281 153 549;173 8.99 36.0 1624 216 103 257;202 18.6 17.7 3785 225 31.0 67.3;182 17.3 24.8 3073 246 50.7 109;211

32、 24.0 17.0 3836 428 73.5 351;246 21.5 93.2 2112 354 71.7 195;164 16.1 38.0 2135 152 64.3 240;179 21.0 35.0 1560 226 47.9 330;C=58.2 5.42 29.7 323 138 179 513;106 1.87 40.5 542 177 184 427;152 0.80 12.5 1332 176 128 646;85.5 1.70 3.99 503 62.3 238 762.6;144 0.70 15.1 547 79.7 71.0 218.5;85.7 1.09 4.2

33、 790 170 45.8 257.9;144 0.30 9.11 417 552 49.5 141.5;170 4.16 9.32 943 260 155 680.8;176 0.57 27.3 318 133 99.4 318.8;192 7.06 32.9 1969 343 103 553;188 8.28 22.6 1208 231 1314 1372;153 5.87 34.8 328 163 264 672.5;143 2.84 15.7 265 123 73.0 347.5;213 19.1 36.2 2220 249 62.0 465.8;192 20.1 23.8 1606

34、156 40.0 168;171 10.5 30.5 672 145 47.0 330.5;162 13.2 19.8 1521 166 36.2 133;203 13.0 90.8 1544 162 98.9 394.5;164 20.1 28.9 1062 161 47.3 134.5;167 13.1 14.1 2278 212 36.5 96.5;164 12.9 18.6 2993 197 65.5 237.8;167 15.0 27.0 2056 260 44.8 72.0;158 14.4 37.0 1025 101 180 899.5;133 22.8 31.3 1633 40

35、1 228 289;169 8.0 30.8 1068 99.1 53.0 817;247 17.3 8.65 2554 241 77.5 373.5;185 3.90 31.3 1211 190 134 649.8;209 6.43 86.9 2157 288 74.0 219.8;182 6.49 61.7 3870 432 143 367.5;235 15.6 23.4 1806 166 68.9 188;%马氏判别算法(以X为中心Y的每一行到X中心的距离)function d = mahal(Y,X);rx,cx = size(X);ry,cy = size(Y);if cx = cy error(stats:mahal:InputSizeMismatch,. Requires the inputs to have the same number of columns.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论