




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、尿常规检查中各项指标对患者健康状况的影响分析摘 要:本文对附件中患者所患疾病进行分类,通过患者尿常规各项指标的检测值与该指标的正常值范围进行比较,综合各项指标来判断该患者是否患有某种疾病,应用Excel ,MATLAB和SPSS软件判别哪些指标是影响患者健康状况的主要因素,由主要因素讨论得出尿常规检查结果对患者健康状况的影响。 对于问题一,我们筛选出所有的查体患者,利用Excel将各项检验结果与其正常值进行比较,得出其差值,然后通过统计处理差值来判断该查体患者是否患病,并结合超标指标的数量得出结果,从而评估“查体患者”健康状况。 对于问题二,首先我们将所有的疾病进行归类,针对每种疾病患者的检查
2、结果利用Excel统计处理求解,得出各项指标的权重,然后对所有疾病数据利用SPSS软件Z标准化,然后将每种病标准化后的数据在MATLAB中求出该疾病的取值范围,建立一个描述健康状况的函数定量模型。最后用SPSS软件的主成分分析法求出各影响指标在患病人员中的主要影响指标,将尿常规检查结果与主要影响指标联系,讨论得出对患者健康的影响。 对于问题三,我们以炎症患者为主要研究对象,利用Excel和MATLAB对其进行分析,得出超标指数,然后分析患病原因,最后给出合理的健康保健的建议。关键字:Excel MATLAB SPSS Z标准化 判别分析法 因素分析法 比较法 尿常规检查中各项指标对患
3、者健康状况的影响分析模型一、问题重述尿液是人体新陈代谢的产物,它在一定程度上能够反映身体器官的代谢正常与否,但是尿液中的成分众多,无法定性确切的疾病,如果能够依据尿检结果提前预测和诊断某些疾病,将对疾病的治疗起到关键的作用,从而改善人们的健康状况。现在有一份医院的尿常规检查数据,我们要对数据进行分析、比较,从而对“查体患者”的健康状况进行评估。然后需要建立一个数学模型来描述尿常规的检查结果与患者健康状况的关系,并针对主要影响因素描述尿常规检查结果对患者健康的影响。最后以炎症患者为主要的研究对象,给出一份健康保健的报告。二、模型假设与符号说明模型假设假设男女老少的体质一样,不考虑年龄和性别造成的
4、某些指标的偏移;不考虑由于检验机器不同而造成检验指标的范围波动;不考虑检验结果中不确定的疾病及数量稀少的疾病;假设患者无特殊体质,不会对实验结果造成影响;符号说明白细胞计数中性粒细胞绝对值红细胞计数淋巴细胞绝对值血红蛋白单核细胞绝对值红细胞平均体积嗜酸细胞绝对值平均红细胞HGB含量嗜碱细胞绝对值平均红细胞HGB浓度红细胞分布宽度(SD)血小板计数红细胞分布宽度(CV)血小板平均体积大血小板比率血小板体积分布宽度红细胞压积血小板压积查体患者1查体患者29中性粒细胞相对值n尿常规指标超标个数淋巴细胞相对值一个指标与其参考值之间的相对误差值单核细胞相对值B权重矩阵嗜酸细胞相对值A标准化后各项指标形成
5、的矩阵嗜碱细胞相对值X归一化处理后的数据Y健康函数值P各项超标指标所占的比重W各项指标的权重三、问题分析问题(1)的分析1)结合检查结果对附件中给出尿检结果进行数据的优化处理,筛选出查体患者的数量,在查找出正常人的各项指标的正常范围的前提下,将查体患者尿检的各项指标与其正常范围进行比较;2)因为一个健康人的各项指标一定是在一个正常的范围里面波动,一旦某项指标超出该项指标的正常范围,就有可能对应好几种疾病,所以为了更简单的归类,无论有多少项超标,只要超标一项,我们就将此定义为不健康,所以最终的健康状况评估结果只有2个,一个是健康,一个是不健康。3)将查体患者的各项指标与正常指标做比较,可以得出超
6、标指标的总个数,从而评估他的健康状况。3.2问题(2)的分析1)尿常规的检验结果中有附件当中所提供的24项指标,而判断它与患者健康状况的关系必然会涉及到这些指标与该指标正常范围的比较。就健康状况本身而言,这本身就是一个模糊的概念,除过通过判断各项指标是否都在正常范围内来说明该患者健康和不健康外,我们还需要进一步分析比较来划分不健康的程度,此时必然要建立一个具体的数学模型来评价,但是24项指标每项指标所表示的意义不同,无法统一衡量,为此我们需要进行指标变量的标准化处理。然后再继续求解相关量之间的函数关系。2)针对主要影响因素讨论问题的前提是在这24项指标中找出主要影响指标,将尿检结果与主要影响因
7、素联系后,通过讨论来确定影响是要通过该尿检结果来判断出疾病种类还是要说明患疾病的严重程度。检查结果的超标量多少与健康状况的程度如何,某一项指标对健康状况的影响程度如何,某一项指标的重要的程度等都是我们需要定性或者定量求解的问题。3.3问题(3)的分析1)把炎症患者归类统计后,对数据分析,观察他们各项指标的有无异常,有无共同点,找出共性或者相似点2)在筛选出炎症患者的基础上,将其对应的各项指标带入问题(2)得出的模型中,得出炎症患者的健康状况,结合所查资料,写出一份对应的健康保健报告。四、模型建立与求解4.1模型准备在建立一个描述尿常规的检查结果与患者健康状况的数学模型中,首先要进行的是对数据的
8、筛选处理,找出典型的病症,将其分类汇总。剔除那些发病率极低的病症,接下来再继续找出查体患者,并给患者进行编号,为问题一的模型建立做准备。然后在查找相关资料的基础上得出正常人的尿检结果的各项指标的正常范围。4.2问题(1)的模型建立与求解 4.2.1 数据处理首先我们对数据进行了筛选和编号,通过查阅相关资料整理出尿常规24项指标的参考值:指标白细胞计数红细胞计数血红蛋白红细胞平均体积平均红细胞HGB含量平均红细胞HGB浓度参考值4.0-10.0 109/L4.0-5.50 1012/L110.0-160.0 g/l83.9-99.1 fl27.0-31.0 pg320.0-360.0 g/l指标
9、血小板压积红细胞压积大血小板比率中性粒细胞相对值单核细胞相对值血小板体积分布宽度参考值0.11-0.2835.0-50.0 %13-43 %43-75 %3-8 109/L9-18.1指标血小板平均体积红细胞分布宽度(CV)红细胞分布宽度(SD)嗜酸细胞相对值嗜碱细胞相对值中性粒细胞绝对值参考值6.5-12.0 fL11.0-16.00 %37.00-54.00 Fl0.5-5.0 %0.00-1.50 %2.0-7.0 109/L指标淋巴细胞绝对值嗜酸细胞绝对值嗜碱细胞绝对值血小板计数淋巴细胞相对值单核细胞绝对值参考值0.80-4.00 109/L0.00-0.80 109/L0.00-0.
10、10 109/L100-300 109/L20-40 %0.10-1.00 109/L表4-2-1 各项指标参考值将查体患者的各项指标与正常人的各项指标作比较,得出每项指标的差值,比较看有无某个查体患者的各项指标的=0,若为0则说明该查体患者的各项指标都在正常的范围内,是健康的,若不为0则说明查体患者某项指标超出正常范围,是不健康的。4.2.2计算方法:在Excel中将指标进行由小到大排序,将在范围参考范围内的数据改为零,由的定义可知,的求解是:a.用参考范围的最小值减去小于参考范围的数值求出,b.用超过参考范围的数据减去参考值的最大值求解,即 a:超标数据=超标数据-max参考值 b:超标数
11、据=min参考值-超标数据以查体患者的白细胞计数为例,的=9.84,而的正常取值范围是4,10,所以=0;以此方法得出的-的所有,进而得出所有查体患者-的所有。将数据整理后得出的评估结果见下图:图4-2-1 数据超标图(查体患者源数据见附页)由图4-2-1和图4-2-可以得到查体患者4号、5号为健康,考虑到参考值的误差,若超标数值远远小于该参考值则视为为超标,即超标越小则越接近正常范围,则为健康,若超标值很大,则视为不健康。将各项指标参考值扩大5%,然后重新进行求值,将未超标的指标记为0,超标的记为1,可以得到下图: 由图可以得到健康“查体患者”有9位,编号分别为3号、4号、6号、117号、1
12、41号、146号和185号 不健康“查体患者”有20位,分别为10号、11号、13号、14号、16号、18号、21号、30号、32号、70号、77号、120号、125号、126号、177号、178号、183号、186号、191号、205号有查体患者中1号、4号、5号和17号身体健康,其余查体患者为不健康。4.3解法一:问题(2)的模型建立与求解模型24.3.1模型准备因为体检的结果有24项指标,即x1,x2,x3,x24,我们由问题1知将其分成健康和不健康2类,A代表健康,B代表不健康,yo有9组数据,y1有20种数据,我们把这些数据如下分类:A的数据(xa11,xa12,,xa124),(x
13、a21,xa22,xa224),(xa241,xa242,xa2424)B的数据(xb11,xb12,,xb124),(xb21,xb22,xb224),(xb241,xb242,xb2424)假定用Y=k1*x1+k2*x2+k24*x24作为判别函数,则组A的数值对应的判别值为;Ya1= k1*x1+k2*x2+k24*x24;Ya2= k1*x1+k2*x2+k24*x24;Ya9= k1*x1+k2*x2+k24*x24;组B对应的判别值为:Yb1= k1*x1+k2*x2+k24*x24;Yb2= k1*x1+k2*x2+k24*x24;Yb20= k1*x1+k2*x2+k24*x
14、24;又作Ya的平均值=Yb的平均值=即是组A 的判别值的代表,是组B 的判别值的代表4.3.2模型求解1)先将待见患者的原始数据写成矩阵形式,组A的数据矩阵组B的数据矩阵:矩阵w0和矩阵w1的列平均数分别是(,),(,)2)算各组数据的平均值 3)作新的矩阵A,B及两组的离差矩阵S1,S2S1=,S2=,S=S1+S2在matlab中解出S1结果的如下:然后解出s2的结果4)最优判别函数c1,c2,,c24为下述方程组的解=即=写出判别函数Y=C1*x1+C2*x2+C24*x24在matlab中具体求解如下图所示:Ci(i=1,2,24) =6.7669,-5.9103,-0.4025,-
15、0.9853,2.2414,-0.0122,-0.0130,0.1076,0.2173,8.7360,-0.0800,-0.0860,-0.0823,-0.5487,2.6334,-6.2210,-6.5237,-8.3215,1.3485,-47.2081,-0.0927,0.4105,-0.1507,2.01895)写出组A,组B的平均值的判别值;=c1*+c2*+c24*=c1*+c2*+c24*临界值为:y0=求出的临界值y0即为正常与否的判断标准>> y0=(8*c+20*d)/20y0 = 10.50154.4.解法二:问题(2)的模型建立与求解在问题(1)的基础上我们
16、对数据进行归类处理,并在Excel中求出每种类型疾病的指标平均值(数据见附录1)则可以求出24项指标在疾病中超标所占的比重,统计每项指标在所有疾病的超标次数,并求出总超标次数。计算权重公式为:权重=X指标超标的次数/指标超标次数综合 则可得到下表:X1X2X3X4X5X6X7X8X9X10X11X12N833882812956P(W)0.07840.02940.02940.07840.07840.01960.0780.00980.01960.08820.0490.0588X13X14X15X16X17X18X19X20X21X22X23X24N1421473010403P(W)0.13730.
17、01960.00980.03920.06860.029400.009800.039200.0294表4-3-1 各项指标的权重和比重建立一个评判模型的前提是各评价指标具有相同的单位量,即数据的归一化处理是首先需要解决的问题,我们在查阅相关资料后,决定采用Z标准化。Z标准化公式: X=(表示所有样本的平均值,表示所有样本数据的标准差)疾病minmaxAve肺炎-1.179228.708813.7648扁桃体炎-0.91091.08830.0887支气管炎-0.38480.97130.29325白血病-1.49254.676626.5923异位妊娠-0.38620.3737-0.00625出血-0
18、.80891.08740.13925ITP-0.63240.31-0.1612非霍奇金淋巴瘤-1.13612.02010.442腭裂-0.72460.92180.0986腹泻-1.30930.8274-0.24095过敏性紫癜-0.46720.79860.1657乳腺恶性肿瘤-0.88330.88720.00195肿瘤-0.97980.9113-0.03425月经失调-0.74750.5065-0.1205炎症-0.70061.02010.15975术后-0.47040.4513-0.00955皮肤病-0.55880.67410.05765消化不良-0.74951.38980.32015呼吸道
19、感染33.507184.283858.89545发热0.09252.54451.3185正常值-0.80390.6716-0.06615 表4-4-2 同单位转化表在SPSS下将所有数据都进行标准化处理可以得到下图:图4-4-1 SPSS对所有数据的标准化处理 (各项指标值的描述性统计资料见附录4)1在将患某类疾病的数据集中起来处理的时候,我们通过数据统计得出这类疾病的主要影响因素,由假设3知,我们对附件中的疾病处理后的数目是20。2通过因素分析法,找出各种影响指标在总的患病指标中所占的患病权重。3将每类疾病所对应的某项指标与该指标在步骤2中求出的患病权重相乘,得到该类疾病的健康函数值。将其和
20、excel相结合,对各类疾病进行分析处理,利用matlab算出各个矩阵所对应的值后,计算结果如下表所示:体检指标平均值标准偏差归一化处理后的各项指标值x18.1885.6775X1=(x1-C2)/D2x24.391.8596X2=(x2-C3)/D3x3123.4622.144X3=(x3-C4)/D4x486.1567.9881X4=(x4-C5)/D5x528.3932.8386X5=(x5-C6)/D6x6329.5212.339X6=(x6-C7)/D7x7250.55131.402X7=(x7-C8)/D8x89.9391.0517X8=(x8-C9)/D9x911.872.568
21、X9=(x9-C10)/D10x10.2575.11519X10=(x10-C11)/D11x1149.79020.3869X11=(x11-C12)/D12x1238.38719.1514X12=(x12-C13)/D13x139.5905.6709X13=(x13-C14)/D14x141.6241.6733X14=(x14-C15)/D15x15.6051.1070X15=(x15-C16)/D16x163.89332.77225X16=(x16-C17)/D17x173.23354.20341X17=(x17-C18)/D18x18.7240.52221X18=(x18-C19)/D1
22、9x19.1155.12874X19=(x19-C20)/D20x20.0302.02897X20=(x20-C21)/D21x2143.1097.1965X21=(x21-C22)/D22x2214.2082.1249X22=(x22-C23)/D23x2324.9118.0071X23=(x23-C24)/D24x2437.406.240X24=(x24-C25)/D25 表4-4-3 数据的归一化处理表就可以得出每类疾病它的健康函数值Y的范围,这样我们就建立了一个以健康函数值Y为评价指标的模型,即 Y=(,,,)×B以腹泻病为例,在MATLAB中,我们求出患腹泻病的2名患者24
23、项指标的每项平均值,将其做成一个1*24的矩阵A:A=8.754,4.58,120,20.8,26.35,326.5,9.85,11.95,0.385,15.45,68.05,13.35,2.55,0.6,1.265,6.153,1.045,0.225,0.045,50.15,17.9,24.8,36将权重做成一个24*1的矩阵B:B=0.0784,0.0294,0.0294,0.0784,0.0784,0.0196,0.078,0.0098,0.0196,0.0196,0.082,0.049,0.0588,0.1373,0.0196,0.0096,0.0392,0.686,0.0294,0,
24、0.009得出腹泻病的均值函数值C=A*B=68.6257MATLAB的编程如下:图4-3-2 程序计算但是考虑到某项疾病的函数值是在一个范围内波动,所以为了更好的分析数据,我们将该类疾病的最小值矩阵和最大值矩阵分别与其所对应的权重矩阵相乘,得到该类疾病的波动范围:Yi=Cmin,Cmax。可以根据化验结果得到其所对应的Y值,每类疾病都有其Y值范围,而每类指标也有其对应的浮动范围,正常人的Y值也在一个固定的范围内浮动,无论某种疾病或正常的Y都有其隶属区间,这样,我们只需要看求出的Y属于哪个区间,更接近哪种疾病的平均Y值线,这样,我们就能说明该化验结果趋近于某种疾病的可能程度更大。患某种某类型的
25、病的概率更大,这样我们得到如下的图表: 4-4-4 Y值范围表1.对尿检的24个指标进行主成分分析(1):指标选取原则本文所选取的数据来自附件中131个患病人数,(2)主成分分析法在spss中的具体操作步骤运用spss统计分析软件FACTOR过程对尿检131个例子的每个例子的24项指标进行主成分分析,具体操作步骤如下:1, AnalyzeData Reduction-Factor Analysis,弹出Factor Analysis对话框2, 把x1-x24选入Variables框3, Descriptives Conelation Matrix 框组中选中Cofficients。然后点击Co
26、ntinue,返回Factor Analysis 对话框4, 点击“OK”SPSS在调用Factor Analyze 过程进行分析时,spss会自动对原始数据进行标准化处理,所以在得到计算结果后的变量都是指经过标准化处理后的变量,但spss并不直接给出标准化后的数据,如需要得到标准化数据,则需调用Descriptives过程进行计算。从表3可知白细胞计数与中性粒细胞绝对值,单核细胞绝对值,淋巴细胞绝对值这几个指标存在着极其显著的关系,可见许多变量之间直接的相关性比较强,证明它们存在信息上的重叠。 主成分个数提取原则为主成分对应的特征值大于1的前m个主成分。特征值在某种程度上可以被看成是表示主成
27、分影响力度大小的指标,如果特征值小于1.,说明该成分的解释力度还不如直接引入一个原变量的平均解释力度大,因此一般可以用特征值大于1作为纳入标准。通过表4(方差分解主成分提取分析法)可知,提取8个主成分,即m=8,从表5(初始因子载荷矩阵)可知,红细胞计数,血红蛋白,血小板计数,血小板压积,红细胞压积在第一主成分上有较高载荷,说明第一主成分基本反映了这些指标的信息;血红蛋白,中性粒细胞相对值,中性粒细胞绝对值,红细胞压积这些指标在第二主成分上有较高载荷,说明第二主成分基本反映了这4个指标的信息,以此类推,所以我们决定用8个新的变量来代替原来的24个指标,所以这8个新的变量就是我们所求解的主要影响
28、因素。即将上一步求解的模型Y=(,,,)*B 转化成y=(,,,)*by值越大,说明作用的指标数越多,影响指标所占的比重越大,对患者健康的影响越大图3 相关系数矩阵图4方差分解主成分提取分析法判别分析首先要明确变量测量尺度及变量的类型和关系;因变量: 分组变量定性数据(体检的24个指标)。自变量: 判别变量定量数据(各类病的特征函数值)。 明确因变量后:我们需要明确我们分析的目的;确定分组变量与判别变量间的关系建立判别函数,找到自变量的最佳区分因变量的各个类别的线性组和。可以确定后验概率,计算每个个体落入各个类别的概率。确定哪些判别变量x1、x2、x3、xk对
29、区分类别差异的影响最大。考察各个类别在判别变量方面是否存在显著差异。确定判别变量是以什么形式影响因变量的,即D是 x1 x2 x3 xk 什么形式的函数。根据判别变量的值对个体进行分类。对分析的准确程度进行评价。我们利用spss软件采用Fisher判断,将数据处理后得到Fisher的线性区别函数。以疾病一为例,我们从图上可以得出x1500.179x21183.972x3-310.406x41513.498x5-3972.291x6446.129x718.603x81020.393x923.212x10-18673.131x1194.687x1289.468x1370.842x1533.324x
30、16-593.662x17-578.160x20-978.386x21-307.975x22884.208x23-79.743x24907.559(常數)-91085.873Y1=500.179*x1+1183.972*x2-10.406*x3+1513.498*x4-3972.291*x5+446.129*x6+18.603*x7+1020.393*x8+23.212*x9-18673.131*x10+94.687*x11+89.468*x12+70.842*x13+根据上表依次求出其余Y2,Y3,Y4,,Y20的函数表达式,这个即是各疾病对应的函数特征表达式。将每类疾病的患者尿检指标带进每
31、类病的函数表达式中,求出该类疾病y的最大值和最小值,这样,我们依次可以得出每类病的Y的取值范围。将一份尿检报告的24项尿检指标的结果与前面构建的权重矩阵B相结合,可以得出该尿检结果的Y值,根据该Y值判断它属于哪种疾病的取值范围,即该患者可能患某种疾病。在判断24项指标的主要成分上面,我们用各项指标的权重来衡量它的重要性,选出权重大的值所对应的指标,则就是它的主要影响因素。各项指标在统计分析后所占得比重如下图所示:各项指标的重要性如下图所示,我们将重要程度>8的指标作为主要影响因素,即主要影响因素是x10,x7,x5,x4,x1.所以在以后的尿检结果中要特别关注这5项指标超出范围的重要性4
32、.4问题(3)的模型建立与求解将炎症患者的数据分析得到炎症患者的指标超标个数表,如下表所示:表 4-4-1 炎症患者各项指标超标量患者年龄x1x2x3x4x5x6x7x8x9x10x11x1222343岁00000000000012811岁0003000000001745岁0.830.08000.900000.02714.9251岁0.770501.70000003581岁00000000000.24.97431岁00000.20000000756岁0.040000074000.0700.414069岁0001.62.20176000.18001133岁4.44000.90.100000002
33、45岁8.29002.6000000001696岁00000017000.08001613月0001.20.60226000.264.77.7372岁0.340.96013.24.4100.42.9384岁0000042000.0400.5401岁0002.91.7785000.1600474月000300282000.316.819.81822岁0.39007.91.10000068.82159岁1.331.59122.80000005.47.621625岁0000000000001574岁10.80000000009.312.21582岁000000000004.71812岁0000000
34、0000.13.312725岁0.20.22000080000.0502.26837岁000000000001.1555岁8.31002.80.10000024.332.3983岁00.11000079000.0900413岁00000059000.0700超标个数1152111031000111016患者年龄x13x14x15x16x17x18x19x20x21x22x23x2422343岁20000000000012811岁6.30.20000001.30001745岁0.2000.8600000000251岁3.5000.5800000000581岁0.90000.36000000074
35、31岁3.31.40000000000756岁00000.6000000014069岁2000000000001133岁0002.4100.08000000245岁0003.832.210.10000001696岁5.50.100000000001613月2.40000.480000000372岁4.6000.44000002.60384岁000000000000401岁1.600000000000474月2.60001.020000.30021822岁1.7000.6600000.30002159岁0002.120000000021625岁0000000000001574岁00010.600
36、.630000001582岁4.20.40000.040000001812岁4.70000000000012725岁0.5000000000006837岁0.10.10000000000555岁00009.240.47000000983岁1.800.900000.10001.1413岁7.500.2000000000超标个数1952865013102整理可得出下表:指标X1X2X3X4X5X6X7X8X9X10X11X12超标个数1152111031000111016P0.0780.0350.0140.0780.0710.0210.071000.0780.0710.114指标X13X14X15
37、X16X17X18X19X20X21X22X23X24超标个数1952865013102P0.1350.0350.0140.0570.0430.03500.0070.0210.00700.014 表4-4-1 炎症患者指标超标个数1.由图4-3-1可以得出对炎症患者影响大的指标有X1、X4、X5、X7、X10、X11、X12、X13、X16和X182.计算原始数据的炎症患者有70.3%是儿童。4.5以炎症患者为主要研究对象健康保健的报告导致患炎症的因素有白细胞计数、红细胞平均体积、平均红细胞HGB含量、血小板计数、血小板压积、中性粒细胞相对值、淋巴细胞相对值、单核细胞相对值、中性粒细胞绝对值、
38、单核细胞绝对值。 炎症在医学中包含着感染、物理化学、中毒、缺血和萎缩等因素,所以炎症患者不能盲目使用抗生素,应该去医院及时治疗,对症下药。微生物感染的结果是导致淋巴细胞绝相对值发生变化和白细胞数量增加,红细胞平均体积、血小板计数会偏高等;炎症患者应该注意饮食,忌生辣,平时讲究卫生,如果感觉到不舒服最好直接就医不要盲目吃药,注意自身保健。 在数据统计中我们可以看出,原始数据的炎症患者有70.3%是儿童,说明小孩子因为年龄小,抵抗力弱,在相同环境下,患炎症的可能性很高,所以妈妈们应该多留意孩子平时的异常状况,多运动,多通风,督促孩子讲卫生,爱清洁,养成良好的生活习惯,无论是大人还是小孩,一旦有异常
39、情况不要拖延,应该及时送往医院治疗。4.6问题(2)中的模型一的检验在众多的数据中,我们随便挑出一个患病患者的尿检结果并将其带入我们所作出的模型中去,求出Y值,并由某种病的Y值取值范围来判断求出的Y值是否合理,即是否在该种疾病所属的区域里,来判断模型准确与否。在呼吸道感染的疾病中里面任取一组数据将其输入构建的模型中得到Y=34.9查表可得该Y值处于呼吸道感染的区间,故我们判断该病人患的是呼吸道感染,由刚开始我们取数据时已经得知,该患者就是呼吸道感染,得出的模型与实际相符。4.7问题(2)中的模型二的检验模型二的函数判别值是:Y=c1*x1+c2*x2+c3*x3+c24*x24分为以下两种情况
40、:>y0时,若判别该对象属于组A,若y<y0,则判别该对象属于组B>y0时,若判别该对象属于组B,若y<y0,则判别该对象属于组A由一位慢性肝炎患者的尿检结果报告,将其代入matlab中有:因为>y0,且f>y0,所以该判别对象属于组B,所以他的健康状况为不健康,由此得出该模型正确。五、模型评价5.1模型优缺点5.1.1模型优点(1) 在问题(1) 中建立的模型是比较模型,用图表求解,清晰明了,简单快速,只需要知道有一项指标超出范围就可以从图上看出,(2)在问题2中建立的模型是一个能够具体将体检后的不同单位的各项指标归一化,定量描述,给出一个具体的值,比较有
41、说服力(3)问题2中的模型是在大数据统计的基础上,将人工的运算解放出来,对于类似的题目让人们用计算机求解的优越性,加深了对计算机应用的推广。(4)问题2建立的模型理论上是将问题具体化和更进一步的细化,这对许多模糊问题的评价都可以拿来借鉴。5.1.2模型缺点(1) 通过问题(1)中的模型求解出来的评价指标太过于简单,大多数去医院的人都或多或少的存在一些问题,基本都可以归为不健康;(2) 通过问题(2)中的模型求解出来的量实际上仍然在分析处理上需要先进行数据的归一化处理,比较繁琐。由于各种疾病的范围可能会互相覆盖,这在求解Y后会对后面的划分和判断Y趋近于某类疾病产生极大的干扰,5.2 模型比较在问
42、题(2)中我们提出了2种模型,但是结合具体结果分析可知,第一种模型虽然能够求出某类疾病的取值范围,但是这些范围有可能互相包含,这样就不能判断出到底该患者患的是什么病,不能明确的给出一个评价值。后一种模型能够舍弃具体求解疾病的种类限制,将患病结果分成健康和不健康,从而使得患者的评价结果有了和正常人的各项指标作比较的可能,对此,我们认为,模型2更清晰和准确,所以我们更倾向于模型2。5.2 模型改进在问题(1)中该模型在最后应该细化,比如加入以年龄为标准的参考量。分阶段使得评价结果更详细,更清楚。在问题(2)中该模型应该采用多元线性回归,这样求得的Y值将更具有说服力,而且针对模型中所出现的各项指标相互覆盖,也应该想办法解决,模型还有待提高。 参考文献1. 林海明,张文霖.主成分分析与因子分析的异同和SPSS软件兼与刘玉玫、卢纹岱等同志商榷J.统计研究.2005(03)2. 宋涛;唐德善.基于灰色数列预测和主成分分析的国债风险仿真模型J.统计与决策.2006(03)3. 徐雅静;汪远征.主成分分析应用方法的改进J.数学的实践与认识.2006(06)4. 谭逸萍.基于主成分分析法的公路客运量预测模型分析J.西部交通科技.2015(02)5. 徐阳阳;赵良庆;俞飞.基于主成分分析法的中部六省经济发展状况比较研究J.安徽农业大学学报(社会科学版).20
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025春季【高二】【蛇启新航 蜕变前行】开学第一课-文字稿
- 2025年合同会审单模板
- 二年级上册数学教案-第五单元第6课时回家路上 北师大版
- 五年级上册数学教案-2.1 《平行四边形的面积》 ︳西师大版
- 五年级下册数学教案 - 露在外面的面 北师大版
- 《长方体和正方体的体积》(教案)青岛版五年级下册数学
- 第6课 猫抓老鼠(教学设计)2023-2024学年五年级上册信息技术粤教版B版
- 部编版九年级上册古诗欣赏中考试题汇编(截至2023年)
- 《茅屋为秋风所破歌》历年中考古诗欣赏试题汇编(截至2024年)
- 2025年河南省鹤壁市单招职业倾向性测试题库完整
- 技术规范书柴油发电机组
- 青岛科技大学成人大专《工商企业管理实训报告》
- 低钾血症最新版本最新课件
- 兽医外科手术学与兽医外科学章节测试及答案
- 2023年陕西延长石油矿业有限责任公司招聘笔试题库及答案解析
- YY/T 1792-2021荧光免疫层析分析仪
- GB/T 39235-2020猪营养需要量
- GB/T 30799-2014食品用洗涤剂试验方法重金属的测定
- 染厂公司简介(4个范本)
- PPT用中国地图(可编辑)
- 基于德育的农村中小学校园欺凌现象的解决对策优秀获奖科研论文
评论
0/150
提交评论