版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、肾炎的诊断摘要医院就诊时通过一些化验指标来判断就诊人员是否患病的问题,本题是在已知确诊为肾炎患者和健康人的化验数据的前提下,寻找判别的方法并确定方法的准确性,最后对30名就诊人员的化验结果进行预测判定。我们在对问题分析的基础上,提出了如下模型进行问题一的求解。模型一:0-1模糊决策指标。以确诊为健康人的数据为训练样本,得出其均值与标准差,由此确定健康人体内各种元素的估计范围,对训练样本的每个数据进行对应范围确定的判断,得出健康人的平均指标系数为6.1,以相同的标准应用于患者数据,以患者的决策指标是否达到6.1作为我们检验该判断方法优劣的标准。经过编程检验,最终得出该方法的正确性为57%。模型二
2、:标准离差法确定权重系数。以确诊为健康人的数据为训练样本,得出各种元素的标准差,某种元素的标准差越大,表明该指标的变异程度越大,提供的信息量越多,其权重也越大,在基于该前提下,计算各元素的权重系数,确定正常人的健康综合值,以此权重系数作用于确诊的肾炎患者,可得出该模型的准确性为80%。模型三:判别分析法。以确诊为患者和健康人的各类前15组化验结果作为训练样本,利用SPSS软件进行判别分析,得出对应得Fisher函数,以判别分析法的原则进行回代,得出该模型的误判率为3%,以Fisher函数作为标准作用于剩余的确诊观测样本,得出该模型的正确性为83%。问题二的求解建立在模型二,三的基础上,判断为健
3、康人的序号见下表。模型二模型三健康人序号70,71,74,81,86,88,8962,63,66,67,70,77,80,81,82,86,88,89问题三:我们在判别分析法的基础上,为了实现减少化验指标的目的,采用逐步判别分析,建立模型四,以确诊类别的各20组数据作为训练样本,利用SPSS软件求解该逐步判别分析法的结果为取用化验指标为Cu,Fe,Ca,以该三项指标作为肾炎的主要影响因素。得出Fisher判别函数,训练样本误判率为20%,以余下观测样本检验其正确性为95%。问题四:在问题三中得出的逐步判别分析的函数式后,进行未知就诊人员的化验结果预测,得出的健康人序号为:63, 70, 74,
4、 78, 80, 81, 82, 86,87, 88,89, 90。问题五:通过对2,4的诊断结果进行进一步的分析得出:第63,70,80,81,82,86,88,89号病例健康,其余的均为患者。关键词:训练样本 指标 权重系数 判别分析法 逐步判别 1:问题的重述人们到医院就诊时,通常要化验一些指标来协助医生的诊断。诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。表B.1是确诊病例的化验结果,其中130号病例是已经确诊为肾炎病人的化验结果;3160号病例是已经确诊为健康人的结果。表B.2是就诊人员的化验结果。(表见附录1)我们的问题是:1. 根据表B.1中的数据,提出一种或多种简便的判
5、别方法,判别属于患者或健康人的方法,并检验你提出方法的正确性。2. 按照1提出的方法,判断表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。3. 能否根据表B.1的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标。4. 根据3的结果,重复2的工作。5. 对2和4的结果作进一步的分析。2:问题的分析人们到医院就诊时,通常需要化验一些指标来协助医生诊断。本题需要我们寻求的是,当就诊人员的化验结果出来后,我们如何根据化验结果来判断一个人是否患病,即提出对病患的判断标准。题目中分别给出了30个患病和30个健康人的化验结果供参考。通过对这些数据的
6、分析,我们得到:在患者的体内Zn,Cu,Fe,Ca,Mg五种元素的含量与正常人相比相对较低,而K,Na两种元素的含量相对较高。对于人体而言 ,无论何种物质均有一个正常的水平,它在人体内的含量无论是低于还是高于这一正常水平均是不正常的表现。很显然,当人患肾炎时会导致机体内Zn,Cu,Fe,Ca,Mg五种元素的含量降低,K,Na两种元素的含量升高。对于问题一,我们的思路如下:(1)首先通过对健康人的化验结果进行分析,来确定人体内这些元素的正常范围。以就诊人员对应该元素的含量是否超出范围来确定该项指标对于我们确定该就诊人员的健康水平的参考。(2)人体内某些部位患病时对整个机体的各项生理和生化功能的影
7、响程度是各不相同的,我们采用加权法。即Zn,Cu,Fe,Ca,Mg,K,Na七种元素在人体的健康综合指数中有着不同的权重系数。以标准离差法确定权重系数。随后,就可以确定健康人的健康综合指数范围,以此来判断就诊人员是否患病。(3)考虑到判断就诊人员是否患病即是对就诊人员进行分类,判别分析是研究事物分类的基本方法,我们采用判别分析法来解决这一问题。在第三问中:题目要求确定影响人们患肾炎的主要因素,以减少化验指标。想到与第一问(3)中相似的逐步分析法。对题目中给出的七种元素进行逐一分析,来确定它们的重要性。利用SPSS软件可完成整个分析过程,最后得到Fisher判别函数表达式,对其正确性进行检验。3
8、:模型的假设(1) 题目中所给的60例确诊病例的化验结果完全正确。(2) 肾炎对人体内某一元素的含量只产生一种影响(升高或降低)。(3) 各就诊人员的化验结果是独立同分布的。(4) 假设题目中所给样本只患肾炎或者是健康体,没有其他疾病的影响。(5) 假设是否患肾炎只与题目中所给的元素含量有关,与其他元素在人体内的含量没有关系。4:符号的说明:分别代表Zn,Cu,Fe,Ca,Mg,K,Na七种元素。:第方案的正确性。 :第种元素的权重。 :第个人的健康综合指标。 :第个人第种元素的化验结果。 :分别代表判别分析法中患病和正常的Fisher判别函数。:分别代表逐步分析法中患病和正常的Fisher判
9、别函数。:Fisher判别式的系数。 :训练样本的矩阵。:训练样本中各项观测指标的平均值。:训练样本的离差矩阵.5:模型的建立和求解5.1:问题一5.1.1:模型一5.1.1.1:模型的建立对题目中的数据进行分析,我们首先想到:就诊人员所化验的几种元素在人体内都有一个正常的范围,当它在人体内的含量超出这一范围就有可能是患病的症状。但是不可否认,当人处于某些特殊的状态或环境下时,机体内的某些元素的含量可能发生很大的变化甚至超出它的正常水平。根据常识,对于一个正常人,在这种情况下一般都只是引起少数的元素的含量发生变化,不会同时引起多种元素的含量发生变化。考虑到这一点我们建立如下的0-1模糊决策模型
10、,以流程图来说明:5.1.1.2:模型的求解在对题目中所给的健康人的化验结果进行分析后我们得出七种元素的均值和标准差如下表(1)所示:1234567平均值186.621.9622511.1295.190.4367.2标准差29.723.845.775.81271.6177.651.3244.2上限216.345.7137.83782.7472.7141.7611.4下限156.9-1.9-13.81239.5117.539.1123 表(1)在平均数加减标准差的范围内代表大概率事件,范围外代表小概率事件。基于该结果是对正常人的分析,我们认为元素的平均数加减标准差的范围即为元素在人体内正常的含量
11、范围。根据对题目中各种元素的折线(见附录)进行分析,发现:在患者的体内Zn,Cu,Fe,Ca,Mg五种元素的含量与正常人相比相对较低,而K,Na两种元素的含量相对较高。针对肾炎这一特殊的病例,我们了解到:人患肾炎时,会导致机体内某些蛋白质的合成减少,从而导致在由原料形成尿液的过程中机体对相应的金属元素的重吸收减少,导致其大量排出体外,进而在人体内的含量减少。因此我们认为,对于 Zn,Cu,Fe,Ca,Mg五种元素,只有当其含量低于正常范围的最小值时为患肾炎病的症状,高于最大值时不是肾炎的症状。再者,因为医院检查的7种金属元素均为人体所必需的元素,无论人们是否患病,它在人体中的含量均大于零,故对
12、于我们所求的第2,3两种元素的下限虽然小于零,但在确定它的范围时我们认为它大于零。在这里我们重新规范它的范围:元素1234567范围156.9,+0,+0,+1239.5,+117.5,+39.1,147.1123,611.4 表(2)之后,我们对题目中表B.1所给的数据进行重新定义:若该种元素的化验结果在表(1)所给的范围内则定义为1,否则为0。用Matlab编程(程序见附录)对确诊为健康的30个人化验结果进行处理,得到被确诊为健康的30个人总共有182个1,它们的平均水平为6.1个1,则我们认为:只要当一个人体内有三种元素的含量超过上面所给的正常范围则他患有肾炎。下面,用被医院确诊为肾炎患
13、者的130号病例的化验结果对上述方法进行检验。用运Matlab程序(程序见附录)。得到:第2,3,5,6,7,9,13,14,16,18,23,25,26共13个病例被诊断为健康人。在此,这些病例均被判断错误。则,这种方法的正确性为:5.1.2:模型二5.1.2.1:模型的建立根据题意可知,医院在判断一个人是否患肾炎是根据题目中所提到的7种金属元素在人体内的含量来判定的。根据实际情况我们不难知道,当人机体内发生某些病变时会导致人机体的生理和生化功能发生很大的变化,进而会引起人体内某些物质的含量发生变化。但是这些物质的含量的变化并没有一个相似的规律。故在本题中我们认为,化验的这些元素在的含量在医
14、生对就诊人员的最后判定中的重要性是不一样的,在此我们把这一重要性系数理解为权重。建立如下模型,以流程图来说明:5.1.2.2:模型的求解 与模型一相同,我们首先对题目中所给的健康人的化验结果进行分析,得出七种元素的均值和标准差如表(1)所示。之后,运用标准离差法确定各种元素的权重系数: 结果如下表(3)元素1234567权重系数0.05650.00530.01450.28450.04930.27340.3164 表(3)根据已经确定的权重,计算每个健康人的综合指数,表达式如下: 计算结果如下图(1): 图(1)右上图可知,我们所确定的健康人的综合指数范围为720,4810.8。接下来,用已经被
15、确诊为患者的30个人的化验结果对上述方案进行检验。得出这30个人的健康综合指数与健康人的健康综合指数如下图(2): 图(2)其中系列1代表的是病例号为3160的就诊人员,系列2代表病历号为130号的就诊人员。由图可知,在这30个人当中有6个人的健康综合指数超过720,则该方案的正确性为:5.1.3:模型三5.1.3.1:模型的建立根据题目的要求,我们建立判别分析模型,确定判别函数以判断就诊人员是否患病。首先,确定训练样本A,B;A中有s组数据,B组中有t组数据,观察指标有p个分别。将这些数据列成矩阵形式: 计算A,B中各个观察指标的平均值 列出A,B的离差矩阵: 用spss求解p元方程组:即可
16、得到Fisher判别函数:最后我们对判别函数进行检验确定判别函数是否有效。5.1.3.2:模型的求解我们选取题目中表B.1的115号确诊病例的化验结果为训练样本A,3145号确诊病例的化验结果为训练样本B。A,B中均有b=15组数据。训练样本的矩阵如下: 计算A,B中个观测值的平均值,计算结果如下表(4): 1234567A172.53312.0324.39647.07127.22209.53531.27B181.320.973.62249.4283.985.8334.8 表(4)列出A,B的离差矩阵: 用spss求解p元方程组,得出Fisher判别函数为 当就诊人员化验后,将化验结果分别代入
17、上式,若,则判断该就诊人员患病,否则正常。下面进行判别函数检验,结果如下表(5):分类结果b,cVAR00009预测组成员合计.001.00初始计数.00150151.0011415%.00100.0.0100.01.006.793.3100.0交叉验证a计数.00141151.0051015%.0093.36.7100.01.0033.366.7100.0表(5)分类结果表明:肾炎患者的样本有15人,用判别函数回代,与实际相符的15人,肾炎患者的判别准确率为100%,正常人的样本有15人,用判别函数回代,与实际相符的14人,错判为1人,准确率为93.3%。由此可以说明判别函数可信。 接下来我
18、们用已经确诊的另外30例病例的化验结果对上述方法进行检验。用运Matlab编程(程序见附录)求解。在此我们定义:若则为0,即就诊的人患病,若则为1,即就诊的人健康结果如下表(6): 病例号161718192021222324252627282930000000001001000病例号464748495051525354555657585960101111011111110 表(6)由上表可知,用上述方法判断时与医院给出的判定结果完全一致,患病的人依然患病,健康的人依然健康。即上述方法的正确性为:。5.2:问题二题目要求我们用1中提出的方法,对表B.2中的30个就诊人员的化验结果进行判定。经检验
19、,我们在1中提出的3种方法的正确率分别是57%,80%,100%。由于第1种方案的正确率太低,认为它不可被应用于实践。在此,我们用第2,3两种方法求解问题二。用第2种方法时:我们利用Matlab进行编程求解(程序见附录)。定义:当就诊人员的健康综合指数在健康人的综合指数范围720,4810.8内时为1,否则为0。判定结果如下表(7):病例号616263646566676869700000000001病例号7172737475767778798010010000001病例号818283848586878889901000010010 表(7)由上图可知:第70,71,74,81,86,88,89
20、号病例健康,其它的为患者。用第3种方法时:我们利用Matlab进行编程求解(程序见附录)。定义:若则为0,即就诊的人患病,若则为1。判定结果如下表(8)病例号616263646566676869700110011001病例号717273747576777879800000001001病例号818283848586878889900101010110 表(8)由上表可知:第62,63,66,67,70,77,80,81,82.,84,86,88,89号病例健康,其他的均为患者。5.3:问题三5.3.1:模型四5.3.1.1:模型的建立题目要求我们,分析表B.1中的数据确定哪些指标是影响人们患肾炎
21、的关键或主要因素,以便减少化验的指标,降低化验费用。为此我们建立逐步判别模型,确定具有判别效能的指标,建立判别函数,尽可能的使判别函数简洁,判别效果稳定。通过对每种元素在病人体内与在健康人体内含量的折线图(见附录)进行分析,得出Cu,Fe,Ca,Mg这四种元素在两者之间含量的差异比较明显。我们猜测,这四种元素是影响人们患肾炎的主要因素。在模型三的基础之上,我通过SPSS软件实现了对元素的逐步判别分析,不同于模型三的整体分析。5.3.1.2:模型的求解 选择病例号为110,3150的40个人的化验结果作为两个训练样本1,2。用运软件SPSS得出每个训练样本中每种元素的平均值和标准差如下(9):V
22、AR00008均值标准差1.00VAR00001161.665037.39606VAR0000212.41803.58623VAR0000321.106510.67252VAR00004730.2000259.28639VAR00005129.975041.81275VAR00006203.3750276.90113VAR00007572.6500295.656142.00VAR00001181.950030.23152VAR0000223.146029.09411VAR0000368.997587.87856VAR000042474.10001462.23138VAR00005299.255
23、0210.57537VAR0000692.800056.20299VAR00007384.2500263.63604表(9)通过操作,命令,计算机运行得出分析结果如下表(10):步骤Wilks 的 Lambda精确 F输入的统计量df1df2df3统计量df1df2Sig.1VAR00004.5791138.00027.580138.000.0002VAR00002.4342138.00024.086237.000.0003VAR00003.3833138.00019.345336.000.000表(10)由表我们可看出:计算机通过分析首先得出Ca在我们的化验项目中起着最至关重要的作,但是单从
24、Ca一项我们还是无法很准确的判断就诊人员是否患病。于是它接着分析依次得出Cu,Fe对肾炎病的判断中也起着不可或缺的作用。这与我们在前面的分析大致相同。由此我们得出Fisher分类函数系数如下表(11):分类函数系数VAR000081.002.00VAR00002.000-.177VAR00003.002.023VAR00004.001.005(常量)-.941-5.190 表(11) 则Fisher判别函数为: 下面我们利用Matlab编程,用训练样本对上述Fisher函数进行检验。在此定义:若则为1,即就诊的人患病,若则为2。判定结果如下表(12):病例号123456789101111111
25、111病例号111213141516171819201111111111病例号313233343536373839402112222112病例号414243444546474849502222222222 表(12)结果表明:肾炎患者的样本有20人,用判别函数回代,与实际相符的20人,肾炎患者的判别准确率为100%,正常人的样本有20人,用判别函数回代,与实际相符的16人,错判为4人,准确率为80%。由此可以说明判别函数可信。接着,我们用表B.1中除去训练样本之外的20组数据对上述方案进行检验,结果如下表(13):病例号212223242526272829301111111111病例号5152
26、53545556575859602222222221 表(13)与医院所诊断的结果相比较,由上表可知,在这种判定方案下仅有第60号病例判错,即这种方案的正确性为:5.4:问题四题目要求我们用3中提出的方法,对表B.2中的30个就诊人员的化验结果进行判定。用运Matlab程序求解。此处我依然定义:若则为1,即就诊的人患病,若则为2。判定结果如下表:(14)1病例号616263646566676869701121111112病例号717273747576777879801112111212病例号818283848586878889902211122222 表(14)由上表可知,在这种判定方案下第6
27、3,70,74,78,80,81,82,86,87,88,89,90号病例健康,其余的均为患者。 5.5:问题五 将2,4的判断结果整合成如下的表格,其中:0代表患病,1代表健康。 第2种方法第3种方法第4种方法求和610000620101630112640000650000660101670101680000690000701113711001720000730000741011750000760000770101780011790000800112811113820112830000840101850000861113870011881113891113900011对其进行横向求和,所得结
28、果即为被判定为健康人的次数。之前上述三种方案经过检验正确率分别为:80%,83%。95%,比较高,判定结果都具有一定的价值。因此我们认为,若一个人至少2次被诊断为健康人,则他为健康人,否则患病。表B.2中的30个病例的最后诊断结果为:63,70,80,81,82,86,88,89这8个人健康,其余的均为患者。6:模型的推广与评价在该肾炎的诊断问题中,我们对于问题一建立了三个不同的模型进行求解。模型的优点:模型一中我们以0-1模糊决策指标,避免了繁琐的数据计算过程,将所有的数据转化为我们判断该项指标是否合格的0,1。该标准的确定是以正常人的数据为训练样本,可作用于患者的判断指标,符合实际情况下的
29、医院的化验问题的判定。模型二中我们观察数据的离散性,采用标准离差法,建立各种元素的权重系数模型进行求解,仍以健康人的指标为标准,以标准离差的比例计算正常人的健康综合指数的值,以此权重系数作用于确诊患者的化验数据,其可行性较高,并且其准确率高达80%。模型三是在以多指标的判别分析法的基础上建立的,得到患者和健康人的标准,得到Fisher判别函数,其适用性较强,广泛用于各种多指标的评判中,且其正确性也较高。为了减少检查指标,我们建立逐步判别分析的模型,舍弃相关的不重要指标,利用SPSS软件实现了模型的快速求解,最终确定的检验指标为Cu,Fe,Ca,大大减少了化验指标,检验其准确性也较高。模型的缺点
30、:模型一中,我们以健康人的各项指标的估计范围作为我们的判断元素指标是否合格的参考,没有一定的绝对意义,因为其指标还会受其他因素的影响,单一的分离判断会有误差的产生,其准确性也不高。模型二中,我们以标准离差建立权重系数,考虑的是这些数据的相异程度大,虽然检验的结果较为可观,但是其对于预测的结果的正确性在第五题中实现,未能达到满意的程度。模型三中,我们的判别分析的结果较满意,但其交叉验证的准确率未能达到标准,考虑到不同的分析思路,我们用判别函数进行预测的实现准确度较好。模型四中,我们减少了化验指标,在数据相关性的判定中,只是考虑了单一的线性影响,未能对相关性程度较大的指标的影响深入讨论。对于问题的
31、预测存在不足。7:参考文献1:姜启源.数学模型 第二版.高等教育出版社.北京.1993年.2:许谦.确定模糊评价综合因素权重的一个方法【J】.大学数学,2005年.3:孙尚供.潘恩沛. 实用判别分析.北京,1990年.4:高惠璇.应用多元统计分析.北京.2008年.附录:表B.1 确诊病例的化验结果病例号ZnCuFeCaMgKNa116615.824.5700112179513218515.731.570112518442731939.8025.9541163128642415914.239.789699.2239726522616.223.860615270.321861719.299.29
32、30718745.5257720113.326.655110149.4141814714.530.065910215468091728.857.8655175.798.43181015611.532.56391071035521113215.917.757892.4131413721218211.311.3767111264672131869.2637.195823373.0347141628.2327.162510862.4465151506.6321.06271401796391615910.711.761219098.53901711716.17.0498895.513657218181
33、10.14.0414371841015421914620.723.8123212815010922042.310.39.7062993.74398882128.212.453.137044.14548522215413.853.36211051607232317912.217.9113915045.22182413.53.3616.813532.651.6182251755.8424.980712355.61262611315.847.362653.61686272750.511.66.3060858.958.91392878.614.69.7042170.81334642990.03.278
34、.1762252.37708523017828.832.499211270.21693121319.136.2222024940.01683217013.929.8128522647.93303316213.219.8152116636.21333420313.090.8154416298.903943516713.114.1227821246.31343616412.918.6299319736.394.53716715.027.0205626064.62373815814.437.0102510144.672.53913322.831.016334011808994015613532267
35、471090228810411698.00308106899.153.02894224717.38.65255424177.9373431668.1062.81233252134649442096.4386.9215728874.0219451826.4961.738704321433674623515.623.4180616668.81884717319.117.0249729565.82874815119.764.220314031828744919165.435.053613921376885022324.486.0360335397.74795122120.11553172368150
36、7395221725.028.223433731104945316422.235.52212281153549541738.9936.016242161032575520218.617.7378522531.067.35618217.324.8307324650.71095721124.017.0383642873.53515824621.593.2211235471.71955916416.138.0213515264.32406017921.035.0156022647.9330表B.2 就诊人员的化验结果病例号ZnCuFeCaMgKNa6158.25.4229.7323138179513621061.8740.55
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年安徽邮电职业技术学院高职单招高职单招英语2016-2024历年频考点试题含答案解析
- 2025至2030年中国PVC排球数据监测研究报告
- 2025年中国闭式循环水水热交换器市场调查研究报告
- 一年级数学计算题专项练习汇编
- 五年级数学(小数除法)计算题专项练习及答案汇编
- 二零二五版能源项目买卖合同英文翻译与环保合规4篇
- 2025年中国局域网市场调查研究报告
- 2025版图书版权购买与网络销售合作协议3篇
- 2025-2030全球干式和湿式喷砂机行业调研及趋势分析报告
- 2025至2031年中国桥式切石机行业投资前景及策略咨询研究报告
- 2024年中国医药研发蓝皮书
- 广东省佛山市 2023-2024学年五年级(上)期末数学试卷
- 台儿庄介绍课件
- 疥疮病人的护理
- 人工智能算法与实践-第16章 LSTM神经网络
- 17个岗位安全操作规程手册
- 2025年山东省济南市第一中学高三下学期期末统一考试物理试题含解析
- 中学安全办2024-2025学年工作计划
- 网络安全保障服务方案(网络安全运维、重保服务)
- 现代科学技术概论智慧树知到期末考试答案章节答案2024年成都师范学院
- 软件模块化设计与开发标准与规范
评论
0/150
提交评论