已阅读5页,还剩19页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
目目 录录 一 问题重述 2 二 问题分析 2 三 模型假设 6 四 变量说明 6 五 模型的建立与求解 7 问题一 7 1 问题分析 7 2 模型建立 7 3 模型求解 11 问题二 12 1 问题求解 12 2 结果分析 13 问题三 13 1 问题分析 13 2 模型建立与求解 13 3 结果分析 15 问题四 15 1 问题求解 15 2 结果分析 16 问题五 16 六 模型分析与检验 18 七 模型的评价与推广 20 八 参考文献 20 附 21 一 问题重述一 问题重述 人们到医院就诊时 通常要化验一些指标来协助医生的诊断 诊断就诊人员 是否患肾炎时通常要化验人体内各种元素含量 表 B 1 是确诊病例的化验结果 其中 1 30 号病例是已经确诊为肾炎病人的化验结果 31 60 号病例是已经确 定为健康人的结果 表 B 2 是就诊人员的化验结果 我们的问题是 1 根据表 B 1 中的数据 提出一种或多种简便的判别方法 判别属于患者或 健康人的方法 并检验你提出方法的正确性 2 按照 1 提出的方法 判断表 B 2 中的 30 名就诊人员的化验结果进行判别 判定他 她 们是肾炎病人还是健康人 3 能否根据表 B 1 的数据特征 确定哪些指标是影响人们患肾炎的关键或主 要因素 以便减少化验的指标 4 根据 3 的结果 重复 2 的工作 5 对 2 和 4 的结果作进一步的分析 二 问题分析二 问题分析 对于这个问题 我们首先从宏观角度对题目所给的七组数据的统计特征入手进行 分析 从数据的规律与联系寻找突破口 建立模型 给出诊断判别的方法 对 1 60 号就诊者的 7 项化验指标的均值做出统计分布图如下 图图 2 1 患者与健康人体内患者与健康人体内 Zn 含量对比含量对比 从图中可明显看出 健康人体内 Zn 含量总体要稍低于患者体内的含量 图图 2 2 患者与健康人体内患者与健康人体内 Cu 含量对比含量对比 观察发现 大多数健康人体内 Cu 含量与患者体内的 Cu 含量其实相差不多 但患者中第 10 位体内的 Cu 元素含量明显超过了其他肾炎患者 这是不太正 常的 图图 2 3 患者与健康人体内患者与健康人体内 Fe 含量对比含量对比 从图中发现 健康人与患者体内的 Fe 含量也相差不大 但第 10 位与第 11 位患者体内的 Fe 元素含量又明显超过了其他肾炎患者与健康人 这也是不 太正常的 图图 2 4 患者与健康人体内患者与健康人体内 Ca 含量对比含量对比 从图中看出 人体内 Ca 元素含量明显高于其它元素 且患者体内的 Ca 元素 明显超过了健康人体中的含量 可作为区分患者与正常人的重要依据 第 10 位患者的 Ca 元素含量依旧居高不下 图图 2 5 患者与健康人体内患者与健康人体内 Mg 含量对比含量对比 观察发现 患者体内的 Mg 元素含量高于健康人 图图 2 6 患者与健康人体内患者与健康人体内 K 含量对比含量对比 从图中看出 人体内 K 元素含量与健康人相差不大 只有少数健康人体内的 K 元素含量高于患者的 但第 11 位健康人的 K 元素含量也超过了正常水平 图图 2 7 患者与健康人体内患者与健康人体内 Na 含量对比含量对比 从图中看出 患者体内 Na 元素含量整体略低于健康人 均值相差不大 综上 从所给样本数据看 患者与健康人的体内 7 项元素化验指标有各自的 明显的特征 有些元素如 Cu K 相差不大 有些元素如 Ca Mg 含量差异则很明 显 我们可以利用这些差异把健康人与患者看作两个母本 对待测患者进行判别 分析 另外 由于第 11 位健康人的 K 元素 第 10 位患者的 Cu 和 Ca 元素 第 11 位患者的 Ca 元素明显超过了大多数人的正常水平 为了确保样本空间数据的可 靠性与特征的明显性 我们将其从母本空间中剔除 这样 我们的样本空间 A 为健康人含 29 组数据 样本空间 B 为患者含 28 组数据 我们对这两个样本空间 建立模型 构造判别函数 并对待测者的身体健康状况予以分析 三三 模型假设 模型假设 1 题中所给的内容和数据都是真实可信的 2 除了表中列出的元素外 其他元素对是否会患肾炎的影响很小 3 没病的个体都是健康体 4 假设样品的估计平均值 协方差分别等于总体的平均值 协方差 四四 变量说明 变量说明 符符 号号 含含 义义 A 健康人组成总体 B 患者组成总体 u1 总体 A 的均值 1 u 总体 A 估计均值 u2 总体 B 的均值 2 u 总体 B 估计均值 Si 第 i 个总体的协方差阵 S 第 i 个总体的协方差阵估计值 d 样品到第 i 个总体的距离 G 两个总体间的离差 Q 两个总体内部的离差 I 组间离差与组内离差的比值 Ci 费希尔判别函数的系数 y 判别函数临界值 Wi 各指标对判别函数贡献权重 五五 模型的建立与求解 模型的建立与求解 问题一问题一 1 问题分析问题分析 该问要求我们提出判别一个人属于患者还是健康人的一种或多种方法 并 检验所提方法的确性 题目中表 1 中给出了已经确诊为肾炎病人和健康人的各 30 组数据 每一组数据都有七个数 分别代表了 Zn Cu Fe Ca Mg K Na 在每 个人体内的量 这就需要通过对 60 组 实为 57 组 数据的分析得出健康人和 肾炎患者体中这些元素量之差异 在寻找数据的差异时 我们想到的传统方法 就是求数据的方差和均值 而经判断 该问题属于判别问题 可以采用统计方 法中的判别分析法进行分析处理 题目中只有两类 病体和健康体 所以可 采用二类群体的判别方法 2 模型建立模型建立 我们采用二类群体判别中比较著名的 Mahalanobis 距离判别和 fisher 判 别两种方法 1 Mahalanobis 距离判别 首先考虑一种简单而直观的判别方法 Mahalanobis 距离判别 其基本 思想是根据两个母体样本计算出他们的均值向量和协方差阵 然后据此求取待 测样本 x 对两个母本的 Mahalanobis 距离 二者取差值 判断离哪个母体近似 设x y是从均值为 协方差阵为 的总体A中抽取的样本 则总体A内两点 x与y的Mahalanobis距离定义为 1 T d x yxyxy 1 定义样本x与A的Mahalanobis距离为 1 T d x Axx 2 在现实中 母体的均值向量和协方差阵由样本的均值向量和协方差阵来代 替 设 1 1 x 1 2 x 1 1n x 是来自母体A的 1 n 个样本 2 1 x 2 2 x 2 2n x 是来 自母体A的 2 n 个样本 则样本的均值与协方差为 1 1 1 2 i n ii ij j i xxi n 3 2 12 11 12 1 2 i n ij SS nn 4 1 1 2 i n iiiiT ijj j Sxxxxi 5 对于待测样本x 如果两个母体样本的协方差相同 由 22 dx Bdx A 得 到判别函数为 1 1 2 T xxxxx 6 其中 1 2 2 xx x 其判别准则是 0 0 Ax x Bx 7 如果两个母体样本协方差不同 即 1212 对于样本x判别函数定 义为 11 2 2 1 1 21 TT xxxxxxxxx 8 1 11 1 2 11 i n iiiiT jji i j ii xxxxS i nn 9 2 Fisher 判别法 其次考虑另外一种方法 Fisher 判别法 即按类内方差尽量小 类间方差 尽量大的准则来求判断函数 我们的目标是由样本的多个指标通过类似投影的方 式将它们投影到一个指标上来 结合成一个综合指标 即构造判别函数 10 这个函数中的 c1 c2 cp 满足的条件是使类内方差尽量小 而类间方差尽 量大 即 2 Gy Ay B 11 22 11 AB nn kk kk HyAy Ay By B 12 其中 1 1 1 A n jkj k xAxA n 13 1 2 1 B n jkj k x BxB n 14 1 p kjkj j yAc xA 1 p kjkj j y Bc xB 15 1 p jj j y Ac xA 16 1 p jj j y Bc x B 17 由于 G 为组间离差平方和 需尽量小 H 为样本内离差总平方和 需尽量大 于是定义 1 122 1 p ppjj j yc xc xc xc x 2 22 11 AB nn kk kk Gy Ay B I H yAy AyBy B 18 则满足条件的 c1 cp 应能使 I 达到最大 要使 I 达到最大 求其极值点对 I 关于 cj 求偏导数 即需 0 j I c 19 上式等价于 1 jj HG cIc 20 利用线性代数求解此方程得到 1 2 p c c C c L 1 D 21 其中 11121 21222 12 p p pppp LLL lLL LLL L 22 11 AB nn ijkiikjjkiikjj kk LxAx AxAxAxBx BxBx B 23 jjj dxAx B j 1 2 p 24 于是可以求出判别函数 25 进一步我们可以得到 1 p jj j y Bc x B 1 p jj j y Ac xA 26 1 122 1 p ppjj j yc xc xc xc x 于是我们可以得到一个用于判别 A B 类的临界值 y0 0 ABAB ABABAB n y An y Bnn yy Ay B nnnnnn 27 进一步可导出 0 1 p jj j yc x 25 于是我们得到的最终判别准则为 待判值与临界值 关系 当 当 y y0 归 A 组 归 B 组 yDM2 则归 B 类 否则归 于 A 类 这种判别函数的建立方法 并没有保证用于建立 A 的判别函数的样本 一定会被判为 A 类 而用于建立 B 的判别函数的样本一定会被判为 B 类 如图 中所示的 X 点 虽然属于母体 A 但 DM1 DM2 因此用生成的判别函数判断则会把 它判为 B 类 由此可见 判别函数对用于生成它的数据进行检验 结果也不一定能达到 100 的正确率 然而 我们可以通过计算这个正确率来检验判别函数的有效性 因为正确率越高 说明样本空间的大多数样本在等效中心分布的越紧促 也就是 A类与B类的数据通过这个判别函数越容易被区分开 于是可以推知正确率越高 与 A 类样本相似性强的数据越可能会被归为 A 类 而与 B 类样本相似性强的数 据越可能会被归为 B 类 即判别的有效性越强 从而达到了我们的目标 因此 我们认为把样本数据本身代入检验是一种有效的方法 七七 模型的评价与推广 模型的评价与推广 模型的通用性强 与实际生活紧密相关 对医生的判断有一定的指导意义 在第三问中寻找关键因素的方法比较简单易行 模型对就诊者判断的正确率没有达到 100 存在的误判在现实中是很危险 的 并且在第一问的模型中只考虑了各种元素对判断是否有肾炎的综合作用 并 没有考虑某一种元素单独对结果的影响 八八 参考文献 参考文献 1 薛毅 数学建模基础 北京工业大学出版社 2 张志勇 Matlab 7 0 从入门到精通 北京航空航天大学出版社 3 王桂松 概率论与数理统计 科学出版社 附附录录 马氏距离判别法 母体 A 健康人 样本均值向量 u A 143 1033333 12 33433333 23 06666667 698 1666667 113 3933333 201 1333333 526 8333333 母体 B 患者 样本均值向量 u B 188 3214286 18 3825 43 94107143 2411 392857 273 75 86 78928571 354 1892857 母体 A 数据 A 166 15 8 24 5 700 112 179 513 185 15 7 31 5 701 125 184 427 193 9 8 25 9 541 163 128 642 159 14 2 39 7 896 99 2 239 726 226 16 2 23 8 606 152 70 3 218 171 9 29 9 29 307 187 45 5 257 201 13 3 26 6 551 101 49 4 141 147 14 5 30 659 102 154 680 172 8 85 7 86 551 75 7 98 4 318 156 11 5 32 5 639 107 103 552 132 15 9 17 7 578 92 4 1314 1372 182 11 3 11 3 767 111 264 672 186 9 26 37 1 958 233 73 347 162 8 23 27 1 625 108 62 4 465 150 6 63 21 627 140 179 639 159 10 7 11 7 612 190 98 5 390 117 16 1 7 04 988 95 5 136 572 181 10 1 4 04 1437 184 101 542 146 20 7 23 8 1232 128 150 1092 42 3 10 3 9 7 629 93 7 439 888 28 2 12 4 53 1 370 44 1 454 852 154 13 8 53 3 621 105 160 723 179 12 2 17 9 1139 150 45 2 218 13 5 3 36 16 8 135 32 6 51 6 182 175 5 84 24 9 807 123 55 6 126 113 15 8 47 3 626 53 6 168 627 50 5 11 6 6 3 608 58 9 58 9 139 78 6 14 6 9 7 421 70 8 133 464 90 3 27 8 17 622 52 3 770 852 178 28 8 32 4 992 112 70 2 169 母体 B 数据 B 213 19 1 36 2 2220 249 40 168 170 13 9 29 8 1285 226 47 9 330 162 13 2 19 8 1521 166 36 2 133 203 13 90 8 1544 162 98 9 394 167 13 1 14 1 2278 212 46 3 134 164 12 9 18 6 2993 197 36 3 94 5 167 15 27 2056 260 64 6 237 158 14 4 37 1025 101 44 6 72 5 133 22 8 31 1633 401 180 899 247 17 3 8 65 2554 241 77 9 373 166 8 1 62 8 1233 252 134 649 209 6 43 86 9 2157 288 74 219 182 6 49 61 7 3870 432 143 367 235 15 6 23 4 1806 166 68 8 188 173 19 1 17 2497 295 65 8 287 151 19 7 64 2 2031 403 182 874 191 65 4 35 5361 392 137 688 223 24 4 86 3603 353 97 7 479 221 20 1 155 3172 368 150 739 217 25 28 2 2343 373 110 494 164 22 2 35 5 2212 281 153 549 173 8 99 36 1624 216 103 257 202 18 6 17 7 3785 225 31 67 3 182 17 3 24 8 3073 246 50 7 109 211 24 17 3836 428 73 5 351 246 21 5 93 2 2112 354 71 7 195 164 16 1 38 2135 152 64 3 240 179 21 35 1560 226 47 9 330 待测样本数据 C 58 2 5 42 29 7 323 138 179 513 106 1 87 40 5 542 177 184 427 152 0 8 12 5 1332 176 128 646 85 5 1 7 3 99 503 62 3 238 762 6 144 0 7 15 1 547 79 7 71 218 5 85 7 1 09 4 2 790 170 45 8 257 9 144 0 3 9 11 417 552 49 5 141 5 170 4 16 9 32 943 260 155 680 8 176 0 57 27 3 318 133 99 4 318 8 192 7 06 32 9 1969 343 103 553 188 8 28 22 6 1208 231 1314 1372 153 5 87 34 8 328 163 264 672 5 143 2 84 15 7 265 123 73 347 5 213 19 1 36 2 2220 249 62 465 8 192 20 1 23 8 1606 156 40 168 171 10 5 30 5 672 145 47 330 5 162 13 2 19 8 1521 166 36 2 133 203 13 90 8 1544 162 98 9 394 5 164 20 1 28 9 1062 161 47 3 134 5 167 13 1 14 1 2278 212 36 5 96 5 164 12 9 18 6 2993 197 65 5 237 8 167 15 27 2056 260 44 8 72 158 14 4 37 1025 101 180 899 5 133 22 8 31 3 1633 401 228 289 169 8 30 8 1068 99 1 53 817 247 17 3 8 65 2554 241 77 5 373 5 185 3 9 31 3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025届江苏省泰兴市西城中学高考冲刺英语模拟试题含解析
- 临时固农民工干活合同
- 合同收支管理
- 我有鼻子和耳朵课件
- 静脉血栓预防课件
- 《中国分区地理》课件
- 新生儿肠道病毒感染诊疗与预防专家共识解读课件
- 《次级代谢产物》课件
- 幼儿园清洁和消毒课件配课件
- 对加强作业设计方案和管理的思考作业的功能与设计方案相关理论教学课件
- 2024年医学专业(临床、医技)三基知识考试题库与答案
- 抑郁症知识宣传-课件
- 2024春期国开电大本科《当代中国政治制度》在线形考(形考任务一至四)试题及答案
- 科学的精神与方法智慧树知到期末考试答案2024年
- 2024年北京证券交易所全国股转公司招聘笔试参考题库附带答案详解
- 中国能源建设集团投资有限公司社会招聘考试试题及答案
- JTGT F20-2015 公路路面基层施工技术细则
- 疼痛科护理年度工作计划
- 云南省劳动合同书电子版
- 《美术策展方案》课件
- T-CTSS 75-2023 现制茶饮料 术语 分类 基本要求
评论
0/150
提交评论