《国家科技部基础条件平台医药共享网中医药科学数据中心》项目(精)_第1页
《国家科技部基础条件平台医药共享网中医药科学数据中心》项目(精)_第2页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、国家科技部基础条件平台医药共享网中医药科学数据中心 项目组 2006 年中期工作总结 2006 年 8 月 9 日 各分中心完成任务情况: 1、中医药文献数据库: 中医药文献数据库的工作是跨年度的工作, 截止于 2006 年 6 月应全面完成 2005 年中医 药文献数据库的工作,并开展 2006 年中医药文献数据库工作。在本项工作中共有 6 个分中 心参加了这两年的工作,具体完成情况如下表: 2005 年文献数据库工作任务完成情况 单位 任务量 已完成 已审校 尚需完成 上海中医药大学 24000 17239 17043 6761 辽宁中医学院 5000 5140 5139 已超额 陕西中医

2、药研究院 10000 2816 2340 7184 江西中医药研究院 8000 7639 7636 361 广州中医药大学 3000 2876 212 124 2004 年欠 1074 南京中医药大学 5000 417 0 4583 55000( 56577) 36127 32370 20450 2006 年文献数据库工作任务完成情况 单位 任务量 已完成 已审校 尚需完成 上海中医药大学 20000 0 0 辽宁中医学院 5000 0 0 陕西中医药研究院 10000 0 0 江西咼等中医专科 8000 0 0 广州中医药大学 3000 0 0 南京中医药大学 5000 0 0 51000

3、0 0 存在问题: (1) 目前已到 2006 年 8 月,2005 年文献数据库尚有 20000 余篇未标引,时间紧任务急, 文献数据库的结库影响到其它几个数据库(临床疾病数据库、药理数据仓库、化学 数据库)后续工作的开展,希望各承担单位抓紧时间,尽可能早的完成。 (2) 目前 2006 年中医药文献数据库已有数据约 10000 篇,但标引工作尚未展开, 希望各 单位尽早开展此项工作。 2、 中医基础疾病数据库: 中医基础疾病数据库是 2005 年的工作,因各种原因在去年没有开展工作, 延迟至今, 目前共三家单位参加了本项工作,任务完成情况如下: 单位 任务量 已完成 已初审 已终审 总计

4、尚需完成 广州中医药大学 500 14 0 1 14 486 上海中医文献馆 500 38 14 6 38 462 南京中医药大学 1000 3 0 3 3 997 2000 55 14 10 55 1945 存在问题: 本项工作今年 4 月底才进行培训,程序 6 月初才正常的运转, 所以完成任务量不多, 请 各承担单位尽快完成数据的加工, 并及时进行初审,经保证总中心终审人员能够合理的安排 工作。建议数据加工人员和我部终审人员保证 msn时时连通,及时发现问题并随时通知加 工人员更正,确保数据质量。 上海: 1在治疗表中的病证名称一定要选择“病证名称”的下拉框,不要自己填写。 2治疗表中,同

5、一个疾病名称不同的证候,要相应的做一张治疗表,如一个疾病五个证 候,那么疾病要做五张治疗表,每个证候再做一张治疗表,以确保信息不丢失。目前大部分 数据没有依照这个规则进行加工,希望能重新审校数据,补充加工。 3病机表中,在病机名称中不要有“, ”要将原文中的病机描述进行信息提取,尽量简 练。一个病机内容填写一张病机表。例如:热毒郁阻肌肤 或毒邪侵入皮肤,再例如:原文 中“毒邪凝聚肌表,而致营卫不和,气血凝滞 ”,经络阻隔”那么就分别提取“毒邪 凝聚肌表” “营卫不和” “气血凝滞” “经络阻隔”分别做 4 张表,同时填写对应的病位,如 “毒邪凝聚肌表”的病位为肌表。 广州: 1. 治疗表中,同

6、一个疾病名称不同的证候,要相应的做一张治疗表,如一个疾病五个 证候,那么疾病要做五张治疗表,每个证候再做一张治疗表,以确保信息不丢失。目前大部 分数据没有依照这个规则进行加工,希望能重新审校数据,补充加工。 2治疗表中一定要仔细看原文来填写,有些多个病合在一个大类中说的,不要漏掉相关 治疗信息。如原文中“癣”包含多个疾病,包括“白秃疮” “鹅掌风” “脚湿气” “圆癣” “紫 白癜风”等。这几个疾病有共同的证型“风湿毒聚”和“湿热下注” ,同时,同一个药方也 是针对多个疾病的治疗,所以一定要仔细看原文,每一个疾病“白秃疮” “鹅掌风” “脚湿气” “圆癣”的证候信息表都要包括“风湿毒聚”和“湿

7、热下注”这两个共有证型在内,在治疗 信息表加工时,每个疾病都要填写一遍共有的证型对应的药方疗法。如:原文中提到:龙胆 泻肝汤治疗湿热下注型“鹅掌风” “脚湿气” “圆癣”等多个疾病,那么就要在这几个疾病的 治疗信息表中分别填写龙胆泻肝汤的内容。 南京: 从已完成的数据看基本上质量过关。 3、 中医临床疾病数据库: 中医临床疾病数据库是延续了三年的工作, 2005 年共 19 家单位工作量为 51700 篇, 2006 年共 19 家单位完成 60500 篇。任务完成情况如下:单位 已完成 已审校 已终审 图已传 共完成 05 任务量 05 年完成 06 任务量 06 年完成 福建中医学院 41

8、23 324 1 543 4448 4000 4369 6000 4448 广州中医药大学 237 1989 3 2104 2229 2000 2000 4000 229 河南中医学院(河南 1) 34 433 8 1572 475 500 475 5000 0 河南中医药研究院(河南 2) 18381 1223 69 18531 19673 15000 15000 15000 4673 黑龙江中医药大学 300 287 4 647 591 500 500 500 91 吉林中医药研究院 737 1496 6 2343 2239 3000 2239 0 0 辽宁中医学院 1 607 246 8

9、54 854 500 500 500 354 山西中医学院 979 5066 47 6158 6092 2000 2000 4000 4092 陕西中医药研究院 142 1700 10 2101 1852 2000 1852 1000 0 上海中医药大学 1992 9048 23 8 11063 10000 10000 5000 1063 重庆中医药研究院(重庆药) 297 220 14 907 531 500 500 500 31 重庆中医研究院(重庆医) 199 60 7 245 266 500 266 500 0 浙江中医药研究院 229 189 6 192 424 200 200 50

10、0 224 湖南中医药研究院 108 1325 4 1927 1437 1000 1000 1000 437 仲景国医学院 1950 1361 13 3412 3324 3000 3000 5000 324 河北医科大学中医学院 425 0 0 1326 425 1000 425 500 0 江西(05 年) 5107 762 7 8164 5876 10000 5876 0 0 江西中医药咼专(江西专) 0 0 0 1 0 0 0 6000 0 江西中医药研究院(江西研) 2 1 0 4 3 0 0 500 3 安徽中医学院 576 348 0 2295 924 0 0 5000 924 合

11、计 55700 (包 括福建传 染病专题) 50202 60500 16893 主要问题: (1) 没有查询辅助词表,对于文章中出现的指标名称等直接输入,不查询标准词表,所 加工的数据标准化差。如山西的疾病名称、仲景的味药名称等。 (2) 治疗表中表示克数的“ g”丢失,目前页面上剂量单位旁添加了快捷选项,其选 项默认状态为空,在添加单味药剂量时,连续进行第二味药剂量单位选择时就会出 “g”选不上的情况,可点选一下其他项(空白项最方便) ,然后再点 g 即可添加上。 发生本项问题比较多的单位如黑龙江。 (3) 诊疗信息表中的疗效标准格式错误,以起头,具体要求请详见加工手册,发生 格式错误的单位

12、如吉林。 (4) 半角状态的使用,原则上数字、英文大小写、分隔符均要求半角状态,目前存在使 用全角状态填写符号问题,如分隔符“ $”、“g”均填写成中文全角状态,错误单位 如重庆药。 (5) 数据加工信息丢失问题:证候是中医临床数据库比较重要的一个方面,要求加工数 据证候不能丢失,有些加工单位出现加工信息不全、证候丢失问题,只做了原疾病 名称表,未将证候相关信息进行加工,如重庆医、浙江,需将这部分数据重新加工。 (6) 症状信息要求拆分为最小单位,如咳嗽 $气喘$发热,不能加工成:咳嗽气喘 $发热, 本项错误比较多的单位如仲景。 (7) 诊疗表与疗效观察表检测内容不统一:疗效观察表里出现的指标

13、项目应该是诊疗表 中在治疗前进行了检测的,有变化的项目。加工时出现了诊表中诊断指标为空,而 疗效观察表中不为空。具体单位如浙江。 (8) 上传图片问题:上传的图片太小,字迹清晰度差,无法使用。具体单位如重庆医。 (9) 其他问题:出现指标分类、指标项目栏为空,而论断诊断仪器栏却有诸如 X 线等检 测机器。具体单位:安徽。 (10) 尚有部分单位图片基本未上传。 近期的改进: (1) 治疗表的复制问题:目前治疗表复制功能已在测试过程中,不久的将来即可使用。 (2) 单味药常用单位的默认为 g 功能已完成,该下拉框的默认项为空,下拉后可以选择 需要的单位,但重复添加单味药时,第二次选用直接点选上一

14、次点选过的单位,就会出 现选不上的情况,这时需要先点一下空白项或其他单位选项,再点选自己需要的。 (3) 炮制方法设立下拉菜单问题已完成, 该下拉框中放入的是较常见的炮制方法, 对于 大多数炮制方法还需要点选旁边的辅助词表。 (4) 针灸疗法与按摩疗法两张治疗表中已添加备注栏。 (5) 刷新后光标定位问题:目前已初步完成,测试成功后即可应用。 4、 中药化学数据库与中药药理数据库: 化学数据库与药理数据库目前只进行了 2005 年工作,2006 年工作尚未启动,原因 是 2005 年中医药文献期刊数据库尚未结库,化学库与药理库的数据还不能抽取出来。 2005 年化学数据库共有三家单位参加,药理

15、库有两家单位参加,完成任务情况如下: 化学数据库 2005 年任务完成情况 单位 任务量 完成量 审校量 图片量 备注 上海中医药 2200 1677 1677 1677 大学 重庆中药研 究所 800+99 1000 942 942 又增加了 99 江西中医药 高等专业学 校 800 754 754 754 合计 3899 3431 3373 3373 药理数据库 2005 年任务完成情况 单位 任务量 完成量 审校量 图片量 备注 江西中医药 高等专业学 校 3000+364 1873 1860 1873 又增加了 364 河南中医药 研究院 1000 1049 4 1049 合计 436

16、4 条 2922 1864 2922 存在问题: (1) 在线标准表使用问题: 化学数据库在线加工应选择标准表查询, 无标准词应及早通 知审校人员增加,不要随意填加非标准化的词,加大了终审人员的工作强度,数据库质 量难以保证。 (2) 图片:严格按照扫描上传图片要求,扫描图片不能只有半页,应全页扫描。 (3) 化学、药理数据库的工作量应除外应删除的数据, 数据量不够可通知刘岩老师进行 补充。 程序改进及需改进的: 1、 化学库编辑界面:二级表序号自动增加,网络室已完成,正在测试近期可用。 2、 化学库编辑界面:六张二级表 ,名称项$,自选拆分,网络室基本完成,待测试后可减少部 分工作强度。 3

17、、 化学库编辑界面:增加应删除、已审校的下拉框正在筹备解决。 5、中医药一体化语言系统: 2005 年工作 (1)中国中医药学术语集成系列丛书各分中心具体完成情况:见下表。整套书籍预期在 2006 年底前全部出版。 单位名称 专题名称与字数(不记空格) 目前进度 北京中医药大学 :基础理论:约 11,000 词条,580,336 字 已经出版 广州中医药大学 :治则治法: 约 5,000 词条,709,856 字 已经出版 上海中医药大学 中药: 约 18,000 词条,3,500,000 字 四校稿完成 福建中医药学院 :方剂 1 :约 20,000 词条,2,323,613 字 :即将出版

18、 陕西中医药研究院 方剂 2: 约 25,000 词条,2,707,205 字 即将出版 江西中医药研究院 :文献:约 16,000 词条,2,533,404 字 :二校稿完成 中医药一体化语言系统: 在各分中分数据加工人员的共同努力下预期完成了全年的数据加工任务和语义网络的搭建 任务: 1) 建立了中医药一体化语言系统的整体结构与原则;规范了术语加工标准与方法; 2) 建立了本系统的 16 个一级学科类目; 3) 建立了本系统语义网络: 126 种语义类型和 58 种语义关系;形成中医药概念词相互之间 语义关联关系 1,275, 205 种; 4) 完成了七个专题的结构设计及数据加工。共采集

19、词条术语 41.09 万条,完成了 108,553 条中医药术语概念词条的加工与编辑工作。生成数据: 144,948 条。 5) 河北医科大学:完成中医文献类数据: 4250 条; 6) 广州针灸学院:完成 针灸学数据:1421 条; 7) 江西中医药研究院:完成了中医文献类数据: 5889 条; 2006 的任务目前完成情况: (1)预期完成了语言系统和临床术语数据加工的培训任务; (2 )预期完成了语言系统和临床术语数据加工网络版的程序测试和数据导入任务; (3)各分中心数据加工任务完成情况: 见下表: 单位名称 任务总量(条) 完成量(条) 备注 上海中医药大学 5000 江西中医药咼等

20、专科学校 4000 广州中医药大学 3000 重新调整建立了治则治法类 目的结构 山西中医学院 2000 150 建立了食疗药膳类目的结构 河北医科大学 500 完成了去年 4250 条任务 陕西中医药研究院 500 建立了气功类目的结构 存在问题: 1 网络程序不稳定, 未有专职的软件人员对程序进行测试和跟踪服务。 对随时出现的小问 题不能随时解决。对程序的一些管理功能至今未能完全实现。 2 由于数据导入程序问题, 语言系统原有数据至今未导入, 影响了分中心数据的加工。 语 言系统进度缓慢,大部分承担单位没有开展工作,希望各分中心协调安排尽早开始工作。 6、中医临床标准术语加工工作: 临床术

21、语是今年的新工作, 4 月底培训后,给各单位分配了今年的任务,今年共有 10 家单位承接了临床术语的工作。 由于程序问题,6 月底开始正式加工。到 2006 年 8 月 14 日上午 9: 00 时,临床术语共 加工实例数据 8485 条。加工了部分的类树,由于程序的原因,类树加工数字暂时无法统计, 各单位加工情况详见下表: 单位 任务量 完成情况 完成实例 已加工的类树 福建中医学院 10000 7065 类树已加工 河北医科大学 1000 179 类树已部分加工 广州中医药大学 15000 132 类树已部分加工 北京中医药大学 10000 0 河南仲景医学院 10000 479 类树已部分加工 陕西中医药研究院 1000 42 类树已加工 河南中医研究院 50000 574 类树已部分加工 南京中医药大学 5000 吉林中医药大学 2000 上海中医药大学 15000 11 其中,北京中医药

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论