《国家科技部基础条件平台医药共享网中医药科学数据中心》项目(精)_第1页
《国家科技部基础条件平台医药共享网中医药科学数据中心》项目(精)_第2页
《国家科技部基础条件平台医药共享网中医药科学数据中心》项目(精)_第3页
《国家科技部基础条件平台医药共享网中医药科学数据中心》项目(精)_第4页
《国家科技部基础条件平台医药共享网中医药科学数据中心》项目(精)_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

国家科技部基础条件平台医药共享网中医药科学数据中心项目组2006年中期工作总结2006年8月9日一、 各分中心完成任务情况:1、 中医药文献数据库:中医药文献数据库的工作是跨年度的工作,截止于2006年6月应全面完成2005年中医药文献数据库的工作,并开展2006年中医药文献数据库工作。在本项工作中共有6个分中心参加了这两年的工作,具体完成情况如下表:2005年文献数据库工作任务完成情况单位任务量已完成已审校尚需完成上海中医药大学2400017239170436761辽宁中医学院500051405139已超额陕西中医药研究院10000281623407184江西中医药研究院800076397636361广州中医药大学300028762121242004年欠1074南京中医药大学50004170458355000(56577)3612732370204502006年文献数据库工作任务完成情况单位任务量已完成已审校尚需完成上海中医药大学2000000辽宁中医学院500000陕西中医药研究院1000000江西高等中医专科800000广州中医药大学300000南京中医药大学5000005100000存在问题:(1) 目前已到2006年8月,2005年文献数据库尚有20000余篇未标引,时间紧任务急,文献数据库的结库影响到其它几个数据库(临床疾病数据库、药理数据仓库、化学数据库)后续工作的开展,希望各承担单位抓紧时间,尽可能早的完成。(2) 目前2006年中医药文献数据库已有数据约10000篇,但标引工作尚未展开,希望各单位尽早开展此项工作。2、 中医基础疾病数据库:中医基础疾病数据库是2005年的工作,因各种原因在去年没有开展工作,延迟至今,目前共三家单位参加了本项工作,任务完成情况如下:单位任务量已完成已初审已终审总计尚需完成广州中医药大学500140114486上海中医文献馆5003814638462南京中医药大学100030339972000551410551945存在问题:本项工作今年4月底才进行培训,程序6月初才正常的运转,所以完成任务量不多,请各承担单位尽快完成数据的加工,并及时进行初审,经保证总中心终审人员能够合理的安排工作。建议数据加工人员和我部终审人员保证msn时时连通,及时发现问题并随时通知加工人员更正,确保数据质量。上海:1.在治疗表中的病证名称一定要选择“病证名称”的下拉框,不要自己填写。2.治疗表中,同一个疾病名称不同的证候,要相应的做一张治疗表,如一个疾病五个证候,那么疾病要做五张治疗表,每个证候再做一张治疗表,以确保信息不丢失。目前大部分数据没有依照这个规则进行加工,希望能重新审校数据,补充加工。3.病机表中,在病机名称中不要有“,”要将原文中的病机描述进行信息提取,尽量简练。一个病机内容填写一张病机表。例如:热毒郁阻肌肤 或 毒邪侵入皮肤,再例如:原文中“毒邪凝聚肌表,而致营卫不和,气血凝滞,经络阻隔”那么就分别提取“毒邪凝聚肌表”“营卫不和”“气血凝滞”“经络阻隔”分别做4张表,同时填写对应的病位,如“毒邪凝聚肌表”的病位为肌表。广州:1. 治疗表中,同一个疾病名称不同的证候,要相应的做一张治疗表,如一个疾病五个证候,那么疾病要做五张治疗表,每个证候再做一张治疗表,以确保信息不丢失。目前大部分数据没有依照这个规则进行加工,希望能重新审校数据,补充加工。2.治疗表中一定要仔细看原文来填写,有些多个病合在一个大类中说的,不要漏掉相关治疗信息。如原文中“癣”包含多个疾病,包括“白秃疮”“鹅掌风”“脚湿气”“圆癣”“紫白癜风”等。这几个疾病有共同的证型“风湿毒聚”和“湿热下注”,同时,同一个药方也是针对多个疾病的治疗,所以一定要仔细看原文,每一个疾病“白秃疮”“鹅掌风”“脚湿气”“圆癣”的证候信息表都要包括“风湿毒聚”和“湿热下注”这两个共有证型在内,在治疗信息表加工时,每个疾病都要填写一遍共有的证型对应的药方疗法。如:原文中提到:龙胆泻肝汤治疗湿热下注型“鹅掌风”“脚湿气”“圆癣”等多个疾病,那么就要在这几个疾病的治疗信息表中分别填写龙胆泻肝汤的内容。南京:从已完成的数据看基本上质量过关。3、 中医临床疾病数据库:中医临床疾病数据库是延续了三年的工作,2005年共19家单位工作量为51700篇,2006年共19家单位完成60500篇。任务完成情况如下:单位已完成已审校已终审图已传共完成05任务量05年完成06任务量06年完成福建中医学院4123324154344484000436960004448广州中医药大学2371989321042229200020004000229河南中医学院(河南1)344338157247550047550000河南中医药研究院(河南2)1838112236918531196731500015000150004673黑龙江中医药大学300287464759150050050091吉林中医药研究院73714966234322393000223900辽宁中医学院1607246854854500500500354山西中医学院979506647615860922000200040004092陕西中医药研究院142170010210118522000185210000上海中医药大学1992904823811063100001000050001063重庆中医药研究院(重庆药)2972201490753150050050031重庆中医研究院(重庆医)1996072452665002665000浙江中医药研究院2291896192424200200500224湖南中医药研究院1081325419271437100010001000437仲景国医学院195013611334123324300030005000324河北医科大学中医学院42500132642510004255000江西(05年)510776278164587610000587600江西中医药高专(江西专)000100060000江西中医药研究院(江西研)21043005003安徽中医学院57634802295924005000924合计55700(包括福建传染病专题)502026050016893主要问题:(1) 没有查询辅助词表,对于文章中出现的指标名称等直接输入,不查询标准词表,所加工的数据标准化差。如山西的疾病名称、仲景的味药名称等。(2) 治疗表中表示克数的“g”丢失,目前页面上剂量单位旁添加了快捷选项,其选项默认状态为空,在添加单味药剂量时,连续进行第二味药剂量单位选择时就会出“g”选不上的情况,可点选一下其他项(空白项最方便),然后再点g即可添加上。发生本项问题比较多的单位如黑龙江。(3) 诊疗信息表中的疗效标准格式错误,以起头,具体要求请详见加工手册,发生格式错误的单位如吉林。(4) 半角状态的使用,原则上数字、英文大小写、分隔符均要求半角状态,目前存在使用全角状态填写符号问题,如分隔符“$”、“g”均填写成中文全角状态,错误单位如重庆药。(5) 数据加工信息丢失问题:证候是中医临床数据库比较重要的一个方面,要求加工数据证候不能丢失,有些加工单位出现加工信息不全、证候丢失问题,只做了原疾病名称表,未将证候相关信息进行加工,如重庆医、浙江,需将这部分数据重新加工。(6) 症状信息要求拆分为最小单位,如咳嗽$气喘$发热,不能加工成:咳嗽气喘$发热,本项错误比较多的单位如仲景。(7) 诊疗表与疗效观察表检测内容不统一:疗效观察表里出现的指标项目应该是诊疗表中在治疗前进行了检测的,有变化的项目。加工时出现了诊表中诊断指标为空,而疗效观察表中不为空。具体单位如浙江。(8) 上传图片问题:上传的图片太小,字迹清晰度差,无法使用。具体单位如重庆医。(9) 其他问题:出现指标分类、指标项目栏为空,而论断诊断仪器栏却有诸如X线等检测机器。具体单位:安徽。(10) 尚有部分单位图片基本未上传。近期的改进:(1) 治疗表的复制问题:目前治疗表复制功能已在测试过程中,不久的将来即可使用。(2) 单味药常用单位的默认为g功能已完成,该下拉框的默认项为空,下拉后可以选择需要的单位,但重复添加单味药时,第二次选用直接点选上一次点选过的单位,就会出现选不上的情况,这时需要先点一下空白项或其他单位选项,再点选自己需要的。(3) 炮制方法设立下拉菜单问题已完成,该下拉框中放入的是较常见的炮制方法,对于大多数炮制方法还需要点选旁边的辅助词表。(4) 针灸疗法与按摩疗法两张治疗表中已添加备注栏。(5) 刷新后光标定位问题:目前已初步完成,测试成功后即可应用。4、 中药化学数据库与中药药理数据库:化学数据库与药理数据库目前只进行了2005年工作,2006年工作尚未启动,原因是2005年中医药文献期刊数据库尚未结库,化学库与药理库的数据还不能抽取出来。2005年化学数据库共有三家单位参加,药理库有两家单位参加,完成任务情况如下:化学数据库2005年任务完成情况单位任务量完成量审校量图片量备注上海中医药大学2200167716771677重庆中药研究所800+991000942942又增加了99江西中医药高等专业学校800754754754合计3899343133733373药理数据库2005年任务完成情况单位任务量完成量审校量图片量备注江西中医药高等专业学校3000+364187318601873又增加了364河南中医药研究院1000104941049合计4364条292218642922存在问题:(1) 在线标准表使用问题:化学数据库在线加工应选择标准表查询,无标准词应及早通知审校人员增加,不要随意填加非标准化的词,加大了终审人员的工作强度,数据库质量难以保证。(2) 图片:严格按照扫描上传图片要求,扫描图片不能只有半页,应全页扫描。(3) 化学、药理数据库的工作量应除外应删除的数据,数据量不够可通知刘岩老师进行补充。程序改进及需改进的:1、化学库编辑界面:二级表序号自动增加,网络室已完成,正在测试近期可用。2、化学库编辑界面:六张二级表,名称项$,自选拆分,网络室基本完成,待测试后可减少部分工作强度。3、化学库编辑界面:增加应删除、已审校的下拉框正在筹备解决。5、中医药一体化语言系统:2005年工作(1)中国中医药学术语集成系列丛书各分中心具体完成情况:见下表。整套书籍预期在2006年底前全部出版。单位名称专题名称与字数(不记空格)目前进度北京中医药大学基础理论:约11,000词条,580,336字已经出版广州中医药大学治则治法: 约 5,000词条,709,856字已经出版上海中医药大学中药: 约18,000词条,3,500,000字四校稿完成福建中医药学院方剂1 :约20,000词条,2,323,613字即将出版陕西中医药研究院方剂2: 约25,000词条,2,707,205字即将出版江西中医药研究院文献:约 16,000词条,2,533,404字二校稿完成(2)中医药一体化语言系统:在各分中分数据加工人员的共同努力下预期完成了全年的数据加工任务和语义网络的搭建任务:1)建立了中医药一体化语言系统的整体结构与原则;规范了术语加工标准与方法;2)建立了本系统的16个一级学科类目;3)建立了本系统语义网络:126种语义类型和58种语义关系;形成中医药概念词相互之间语义关联关系1,275,205种;4)完成了七个专题的结构设计及数据加工。共采集词条术语41.09万条,完成了108,553条中医药术语概念词条的加工与编辑工作。生成数据:144,948条。5)河北医科大学:完成中医文献类数据:4250条;6)广州针灸学院:完成针灸学数据:1421条;7)江西中医药研究院:完成了中医文献类数据:5889条;2006的任务目前完成情况:(1)预期完成了语言系统和临床术语数据加工的培训任务;(2)预期完成了语言系统和临床术语数据加工网络版的程序测试和数据导入任务;(3)各分中心数据加工任务完成情况:见下表:单位名称任务总量(条)完成量(条)备注上海中医药大学5000江西中医药高等专科学校4000广州中医药大学3000重新调整建立了治则治法类目的结构山西中医学院2000150建立了食疗药膳类目的结构河北医科大学500完成了去年4250条任务陕西中医药研究院500建立了气功类目的结构存在问题:1网络程序不稳定,未有专职的软件人员对程序进行测试和跟踪服务。对随时出现的小问题不能随时解决。对程序的一些管理功能至今未能完全实现。2由于数据导入程序问题,语言系统原有数据至今未导入,影响了分中心数据的加工。语言系统进度缓慢,大部分承担单位没有开展工作,希望各分中心协调安排尽早开始工作。6、中医临床标准术语加工工作:临床术语是今年的新工作, 4月底培训后,给各单位分配了今年的任务,今年共有10家单位承接了临床术语的工作。由于程序问题,6月底开始正式加工。到2006年8月14日上午9:00时,临床术语共加工实例数据8485条。 加工了部分的类树,由于程序的原因,类树加工数字暂时无法统计,各单位加工情况详见下表:单位任务量完成情况完成实例已加工的类树福建中医学院100007065类树已加工河北医科大学1000179类树已部分加工广州中医药大学15000132类树已部分加工北京中医药大学100000河南仲景医学院10000479类树已部分加工陕西中医药研究院100042类树已加工河南中医研究院50000574类树已部分加工南京中医药大学5000吉林中医药大学2000上海中医药大学1500011其中,北京中医药大学是由于语言系统的数据的问题,迟迟不能开始加工。 到目前为止,临床术语的完成情况不是太理想。主要是因为程

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论