从中医古籍数据库建设看中医古籍数字化_第1页
从中医古籍数据库建设看中医古籍数字化_第2页
从中医古籍数据库建设看中医古籍数字化_第3页
从中医古籍数据库建设看中医古籍数字化_第4页
从中医古籍数据库建设看中医古籍数字化_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、从中医古籍数据库建立看中医古籍数字化李兵,刘国正,符永驰,裘俭,张伟娜【关键词】中医古籍;数字化;古籍数据库中医古籍是中医药学传承和生长的载体,既具有紧张的学术代价,又具有相称的文物代价。最新出书的?中国中医古籍总目?共收录中医古籍13455种,根本上反响了当前我国中医古籍的存世和漫衍近况。如安在庇护的底子上更好地利用这些贵重的中医药资源是中医药研究职员的汗青任务。通过数字化处置惩罚,既实现了对中医古籍的永世保存,又可为便利、快捷、无损地开拓和利用这些名贵资源搭建起研究平台。中国中医科学院中医药信息研究所自2002年始,对馆藏中医文籍举行了数字化再生性庇护和利用研究,如今,已建成“中医药珍善本

2、古籍多媒体数据库、“中医药古籍资源数据库,实现了部门中医古籍的数字化庇护与利用。1“中医药古籍资源数据库建立1.1研究配景中医古籍是中华民族几千年来防病治病名贵履历的结晶,是中华民族的良好文化遗产。中医药古籍文献中所收载的理法方药、养生保健知识是取之不劲用之不竭的宝库,具有极高的有用代价。古籍属于不成再生的文化资源,比年来,只管我国加大了对付古籍的庇护力度,使古籍的保存情况得到改进,但随着汗青的推进,古籍照旧会悄无声气、不成制止地出现损毁,以致灭亡。中医古籍团体保存情况较差,各藏馆保存条件良莠不一,中医古籍庇护和传承令人担忧。鉴于此,用数字化本领对中医古籍举行处置惩罚,既可以使中医古籍的原图原

3、貌永世保存,又可以通过数据库和网络普及利用,制止阅读原书对古籍造成的损伤。因此,中医古籍数字化是中医古籍庇护和利用的抱负方法。中国中医科学院图书馆所藏中医古籍占存世中医古籍数目的一半以上,此中中医珍善本古籍就达2万余册。中国中医科学院中医药信息研究所利用该资源上风,构建了“中医药古籍资源数据库,现已收录1500种中医古籍的元数据信息和此中的850种中医古籍的原文图像,已经可以通过中医古籍阅览体系实现电子阅览,为中医古籍数字化庇护和利用开拓了途径。1.2“中医药古籍资源数据库建库流程按照中医古籍的年代、版本代价、文献代价、庇护品级等确定收录尺度,对破坏严峻的珍善本古籍优先举行数字化处置惩罚。思量

4、到对古籍的再生性庇护,我们以古籍原文图像作为重要数据泉源,部门古籍实现全文本化。由于图像要求的存储空间较大,我们接纳支持多媒体数据的rale9i数据库体系,并对体系布局举行优化,根本办理了运行速率题目。按照古籍文献的特点,按中医古籍的分类、题名、责任者、出书年代、出书者、版本项、版式、卷数、馆藏地、册本特性、保存状态、复制状态等举行著录,著录规矩拜见“我国数字图书馆尺度范例建立工程研究结果古籍元数据著录规矩(dls-s05-014),对收录古籍撰写提要,力图创立完备的古籍书目数据库。包罗古籍的扫描、质检、图像处置惩罚、文本录入等。为实现保存和利用双重目的,扫描时接纳全彩形式,300dpi,jp

5、eg格式保存,按页码挨次重定名,对扫描后图像的挨次、偏歪度、完备性、清楚度举行查抄,并举行纠偏、去污、裁边等处置惩罚。对部门古籍举行文本录入,实现图文比较。接纳自主开拓的古籍编纂器对文中有用的检索点举行抽取和xl格式标引,如病证方药的名称、索引信息、各级标题等,力图实现图像的全文检索,制止标引过繁或过简,影响检索结果。对标引后数据举行考核。将图像数据、元数据、标引数据、文本数据合成、入库,形成中医古籍电子书,公布到阅览体系后举行数据库测试,实现中医古籍的数字化庇护与利用。1.3接纳技能数据库接纳rale9i,数据搜刮接纳raletext技能。整个体系接纳基于java的eb应用技能,结合基于j2

6、ee的struts和实现数据长期化的hibernate框架的v方案形式,构建了高内聚、弱藕合、可维护和可扩展的中医古籍数字化体系1。2中医古籍数字化存在的停滞2.1中医古籍中生僻汉字的处置惩罚汉字从产生至今履历了漫长的演变历程,由此也产生了大量的繁简字、异体字、古今字、通假字等。中医古籍数字化历程中碰到的字体停滞有两个方面,一个是对字体的认知停滞,生僻汉字的正确录入必要很深的中医文献学功底,而对付一样平常的操纵职员很难办到;一个是技能停滞,unide字符集固然可以办理字库题目,但是很多软件不支持,常用的输入法和搜刮引擎不支持大字符集,很多生僻字仍不克不及准确表现和检索。用造字的要领费时费力,并

7、且很难共享和检索,生僻汉字的处置惩罚还是中医古籍数字化历程中的一大停滞。2.2天下古籍数字化尺度尚待创立如今,固然到场中医古籍数字化事情的单元较多,但险些都处于各自为战的状态,所接纳的途径多样,因此产生的数字化结果情势多样,倒霉于中医古籍数字化生长,也倒霉于中医古籍数字化资源共享。究其缘故原由,除了缺乏同一的和谐方案外,没有可参照的行业尺度也是此中紧张的缘故原由。2.3中医古籍数字化软件有待革新软件成效是否强盛对中医古籍数字化历程和结果具有直接影响,选择符合的软件可以起到事半功倍的结果。如今,可供选择的数字化加工体系很多,扫描和图像处置惩罚技能已较为成熟。而r软件对古籍中部门繁体字和不规矩用字

8、的识别结果很差,辅以人工校对那么必要大量的时间和人力,怎样进步r在古籍字符识别上的正确率是古籍数字化面对的一浩劫题;数据加工软件在批处置惩罚、大字符集、内容办理等方面存在缺陷;检索体系怎样按照中医古籍的特点进步检索速率和精准度也是值得进一步研究的题目。2.4古籍信息的精准检索快速、正确地检索到所必要的内容是古籍数字化应有的根本成效,也是评价其优劣的紧张指标。全文本的数字化古籍可以实现恣意字符的检索,但是数据正确度孝检索噪音大的题目尚待进一步办理;图像版可以包管信息的正确无误,但在全文检索上存在必然缺陷,通过对有用检索点的标引可以在必然程度上补充上述不敷,但仍不成制止地要遗漏某些信息。由于中医古

9、籍中并证、方、药的同名异义、异名同义征象普及存在,使内容的正确检索越发困难。怎样创立后控词表,实现关联检索也是中医古籍数字化面对的一个困难。2.5研究支持成效尚不美满研究支持成效是指可以或许提供有关古籍内容自己科学、正确的统计与计量信息,提供与古籍内容相干的参考数据、帮助东西,这些信息、数据或东西都是古籍内容的增值或增补2。中医古籍具有极高的研究代价,其研究支持成效应更强盛。除常用的中医古籍研究帮助东西外,还应具有差异版本和相干数据的链接。对并证、方、药的参考数据举行会聚,对生僻字举行注解,创立学术论坛等,都是研究支持成效的紧张构成部门,而如今的中医古籍数字化结果在此方面尚显薄弱。2.6深度开

10、拓不敷中医古籍数字化不该仅仅满意于对古籍的阅览和查询。古代中医药文献是一个知识宝库,在数字化的底子上开掘古籍中的名贵知识财产,实现知识创造和知识拓展,更好地为中医药奇迹的生长和人类康健办事是中医古籍数字化的最高目的。3中医古籍数字化建立的发起3.1图文关联是实现中医古籍数字化的较好方法图文关联是将古籍文献别离存储为图像、文本两种情势。图文关联是将文本对应放在与之相匹配的图像之下,并创立索引干系,实现图文比较。此种方法可以补充“图像在检索和内容编纂上的不敷,又可以校对“文本的正确性,使读者既能看到原书原貌的古籍文献,又可以快速正确地查到所必要的内容。尤其对付研究者,对原始版本信息和文本的正确性要

11、求更高,而通过图文比较便可很好地办理这一题目。3.2中医文献与盘算机专业职员的通力协作中医古籍数字化是古典文化与当代技能的结合,必要有醒目中医古籍整理、目次学和版本学知识的人才与把握盘算机网络知识和多媒体技能的专业职员通力协作。中医古籍数字化虽属新的古籍整理方法,但仍归于中医文献整理领域,离不开文献整理的知识。在整个历程中,中医知识不成或缺;同时,在数据处置惩罚、数据库方案、应用平台构建等方面都必要盘算机专业职员到场。中医文献专家的需求和发起能引导盘算机技能职员对整个体系的方案,进而改进中医古籍数字化体系的成效。上述两方面职员的深化互助是创立抱负中医古籍数字化形式的条件。3.3器重同一尺度的研

12、究和订定创立完备的中医古籍资源库必要全行业的互助。因此,有需要创立同一的尺度,包罗中医古籍的分类法、著录规矩、软件和数据库的利用、数字化加工尺度、加工和利用平台等。同一的尺度是实现中医古籍数字化资源共享的底子,也是促进中医古籍数字化建立历程的有力保障3。3.4同一方案,共建共享中医古籍数字化是对中华文化遗产的庇护和弘扬,具有猛烈的公益色彩。各单元必要在同一的和和谐向导下,创立一个团体的方案。团体方案应包罗数字化东西的内容,确定事情重点和互助分工,同时包罗相干尺度、范例的同一,而恰恰这两方面题目在如今的事情中较为突出4。办理了这两方面题目,就制止了重复建立和资源白费,才气实现共建共享。4结语中医古籍数字化是一项恒久的体系工程,必要中医药科研职员支付恒久的艰辛和积极。固然在建立历程中另有很多题目有待办理,但随着研究的深化,信息技能的飞速生长,中医古籍数据库建立和利用将出现辽阔的远景

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论