下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、支持向量机方法在伤寒论方分类建模中的应用 11-05-17 14:42:00 编辑:studa20 作者:孙燕,臧传新,任廷革,李宇航【关键词】 支持向量机;分类;伤寒论支持向量机(Suport Vector Machine,SVM)方法是20世纪90年代出现的一
2、种新的分类方法,已初步表现出很多优于已有方法的性能。有人把SVM方法与其他16种已有的方法作了系统的比较,得出SVM方法最优的结论1。利用支持向量机方法训练得到的分类器具有很好的推广能力,即使训练样本很少,分类器的预测准确率也会很高。1 支持向量机方法 SVM分类器的基本原理是使用一个非线性变换,将不可分的空间映射到一个高维的线性可分的空间,并建立一个具有极小VC维数的分类器,该分类器仅由大量样本中的极少量支持向量确定,且具有最大的边界宽度。支持向量机算法的技巧在于不直接计算复杂的非线性变换,而是计算非线性变换的点积,即核函数,从而大大简化了计算
3、的过程。 因此,统计学习理论和SVM方法建立了一套较好的有限样本下机器学习的理论框架和通用方法,有严格的理论基础,其核心思想就是学习机器的复杂性要与有限的训练样本相适用,能较好地解决有限样本、非线性、高维数和局部极小点等实际问题,能建立稳定的预测准确率高的分类器,所以适用于分类模式识别。2 SVM方法在伤寒论方分类识别中的应用 自伤寒论问世以来,研究伤寒的著作有千余种,涉及七百余医家。尤其在明清时期,各医家在孙思邈“方证同条,比类相附”的启发下,运用归类编次的研究方法,从不同的角度充分揭示了伤寒论辨证论治的规律
4、,如按方类证、按法分类、按症类证、按因类证、分经审证等等8,大大丰富和发展了伤寒论的内容。 以上都是医家们人为的分类方法,现在我们利用模式识别的方法从不同的角度、不同的侧面、不同的层次对伤寒论方进行分类训练建模,来尝试对张仲景制方规律和辨证论治规律的机器学习建模,不仅可以用更便于现代人理解的形式再现仲景的思维模式,使中医学的继承和学习更加有效,还可以发现一些隐含的知识,供我们学习借鉴。2.1 数据采集 数据来源于刘渡舟主编的伤寒论校注,选择原文中带有方药的条文,将其转换为电子文档并进行预处理后,利用数据库技术导
5、入专门用于“解析”和“标引”的“中医方剂数据库”9。2.2 数据一致化处理 由于计算机难以识别不遵循一定模式的数据,不同的表达则认为是不同的知识,而中医学中对同一个药名、药物功效、方名、症状、证候等数据有多种不同的表述方式的现象非常普遍,因此需要对其进行一致化、规范化处理,去除大量数据的噪音影响,保证所得数据具有较好的可信度,所得的结果才能反映真实的规律。 数据预处理是利用“解析”和“标引”技术,对采集到的伤寒论方剂数据进行处理的过程。所谓“解析”,实质上就是将文献数据结构化、规范化的过程。我们在“中医方剂数据
6、库”对一个方剂解析后的字段可达171个,其中22个大项,149个子项。主要包括文献位置(书、卷、页、序)、方名、别名、主治病证、方剂组成、方剂功效、制剂工艺、剂型、服用方法、使用禁忌、加减用法、辅助疗法、反应与疗效、病机分析等。所谓“标引”,即中医学主题词标引,就是用给定的中医学主题词表中的词条,对解析好的数据内容冠以恰当的标识,从而使文献数据标准化、规范化,其目标是把文字媒体的信息解析后并分门别类的加以标识。这样的工作是在一种叫做“文献解析工作单”的电子表格上进行的,这是一项十分繁重的、专业性很强的的工作,但是很重要,因为信息解析是整个信息活动的基础,为在大型数据库上进行数据挖掘提供良好的土
7、壤。2.3 伤寒论方剂功效的宏观量化处理 SVM方法是完全基于数据的方法,为了与国际通行的软件兼容,笔者采用与SVMLight类似的数据文件格式10。因此必须对伤寒论方剂功效进行定性定量处理,这也是进行分类训练建模的基础条件。 经过一致化处理后,有关方剂的主要因子,诸如方剂的药物组成及其临床表现症状和体征等数据就可以导入“中医方剂分析系统”。通过利用近似推理技术实现了方剂有关因子的宏观量化,把定性的语言描述转化为定量的数字表达,提供量值变化的信息提示,可直观、动态地了解方剂组成变化的过程及其影响因素;同时使得每一个方剂因子之间具有了可比性,实现了定性定量的层次,这是目前任何方剂系统都无法做到的。 中医学中存在“异病同治”的问题,同一个方剂可以治疗不同的疾病和证候,但究竟是方剂的哪些药物功效在发挥作用,目前还没有办法确定。按照中医学的推理规律,一般认为针对不同的体质和病证,同一方剂就会有不同作用趋向,发挥不同的功效。因此笔者根据另一个客观存在的信息方剂治疗的患者的症状/体征,建立了功效-症状-证候关系库,实现了方剂针对具体情况下的证候重聚焦,同时也实现主证
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 系绳物体的浮力问题-2023年中考物理复习讲练(原卷版)
- 知识产权保护承诺书
- 美丽的颐和园导游词(33篇)
- 物流运输车辆租赁合同(35篇)
- 粗砂垫层试验段的施工方案及试验段总结
- 23.1 平均数与加权平均数 同步练习
- 天津市南开区2024-2025学年七年级上学期11月期中道德与法治试题(含答案)
- 2024年建筑电工(建筑特殊工种)考试试题题库
- 黑龙江省大庆市肇源县联盟学校2024-2025学年七年级上学期11月期中生物试题(含答案)
- 广东省广州市名校2025届高三上学期综合测试(一)语文试题(含答案)
- 浙江省宁波市镇海区蛟川书院2023-2024学年九年级上学期期中科学试卷
- 54设计和开发验证记录表
- 2023年新改版教科版四年级上册科学期中测试卷 (超全)
- 二上【教学】《我们不乱扔》
- 研发流程(EVT-DVT-PVT-MP)实用文档
- 《中国梦我的梦》课件
- 大数据与数学研究课件
- 药剂科运用PDCA循环减少门诊药房药品调剂差错PDCA成果汇报
- 中国电信知识普及100题
- 物品接收单模板(接受联、存根联)
- 16G362 钢筋混凝土结构预埋件
评论
0/150
提交评论