开放的XML参考文献管理系统.doc_第1页
开放的XML参考文献管理系统.doc_第2页
开放的XML参考文献管理系统.doc_第3页
开放的XML参考文献管理系统.doc_第4页
开放的XML参考文献管理系统.doc_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

xbms-一个开放的xml参考文献管理系统 摘要在研究团体中有一个管理良好的文献收集计划和高效的检索系统,是非常宝贵的。当前参考文献管理系统是有限的,也就是说他们是面向应用甚至文字处理机安置,如winbibdb latex和endnote为microsoft word 。因为文章作家也许要增加评论到参考文献,例如重要惯例或上下文联合相关词条,一个参考书目管理系统应该是可以灵活的应付足够参考文献的建筑和用法。 随着越来越多的出版者,要求他们自己的文章用xml格式出版,出与xml和互联网可及性特点,我们提出一个开放基于xml的参考文献管理系统(xbms)。使用xbms,作者能自由地组成与他喜爱的编辑的一篇文章,高效率地运用引证服务和自动地引起期望文件格式,例如pdf,tex,或者其他xml格式。有四个阶段 xbms工作流处理: 编辑阶段,确认阶段,同阶段联系在一起,和变革阶段。在本文中,两树语言和树自动机的xbms描述到模型操作自动文献协会。此外,我们也提出xbms的实施,目前流行的,如xml解析器, xerces和xslt处理器, xalan , 举一个例子,以证明其可行性。 1.导言 xml (可扩展标记语言1) ,从w3c的一个正式推荐,类似在它的硬件和软件的独立的html。它为描述使用一套标示惯例文本,并可以明确地表达语义文件中的内容。这些描述性标示,xml文件适用于电子处理和数据重用。不同的html , xml是可扩展的: 它不包含固定的套标注 。xml文件也许有被预定义的套句法,并且能正式地被确认。结果,xml赢得在学院,商务的声望,并且各种各样的组织和标注为网文件相应地越来越被定义和数据交换在网。目前,多数数据库管理系统已经操作了在xml的数据各种各样的应用的。那导致的其中一个重要事实xml的整体成功是“xml世界”在一个优选的方式实现很多已经已知的概念应付宽广的范围要求。 一系列的与xml相关的标准被开发了,例如xpath 2, xsl 3, dom 4,等。 xml成为互联网数据表示法的,越来越数据标准应用是与xml相关的。 在本文,我们是特别对xml格式化的文章出版物和参考感兴趣。 有一个管理良好的文献收集计划和高效的检索系统,那是非常宝贵的研究团体。特别是,连续成长信息源和随后在参考文献数据库的大小的增量成了参考文献管理一令人沮丧任务研究员必须面对。尽管重要性文献科学或技术文档,对解决文献管理的问题仍然没有得到发展。目前的解决方案是在感觉被限制,他们是面向应用的,甚至文字处理机被安置,如winbibdb 5 latex 和endnote 6 为microsoft word 。 目前, 大多数数据库管理系统已开办的数据以xml为各种各样的,以使文献管理更加容易, 多项公用设施已经制定,在过去数几十年来(例如,endnote 6 , procite 7 ,和biblioscape 8 ) 。几个基于网络的参考文献管理工具,如refworks 9 和znote 10 人还根据宽可及性发明了互联网。但是,作者通常编辑文章并且由欲他们是软件的参考文献数据库的参与者,不管新的参考文献提出管理软件。此外,作者可能想要增加评论到参考文献,如公式或背景与相关条目。 因此,文献管理系统应该让作者自由地撰写和组织他们的文献数据库,以及支持引文服务自动化。 在软件工程中可重用性是很重要的,这也是至关重要的文献参考。 目前,每位作者都有自己的办法管理书目。这将是一个沉重的负荷,以编写自己的文章格式,以满足指定格式。根据越来越多的出版者请求xml技术刊物,我们提出一个开放基于xml的参考文献管理系统(xbms ) ,允许作者高效率地组成与熟悉的编辑的自动一篇文章和变换对期望文件格式,例如pdf,tex和其他xml文件格式。本文的组织结构如下。在第2条中,我们描述整体流程xbms怎样运作。在第3节,数学模型系统报告。我们也将评价复杂的模型。在第4条中,我们说明基于xslt的 xbms的实施 。最后,结论是给出。2.xbms框架多数参考文献管理系统,让作者插入引用到文章产生名单上的文献在最后自动布局。 然而,这些系统是专门指定为专有文字处理软件等。举例来说,endnote, procite和biblioscape均热忱的为microsoft word (很少支持其他word 处理器) ,提到仅使用与unix troff , bibtex工程latex排版系统。 在大多数情况,作者编辑他们的文章使用自己喜爱编辑的工具,以及随后xml处理由伴生的软件完成。在本文xbms提供了灵活性为作者编辑,验证,并自动生成目录名单上。xbms工作流在图1 图1 xbms工作流流程完成一篇文章的xbms可分为4个阶段。每期进一步说明如下。 编辑阶段。第一步就是要建立和编辑文章经作者熟悉xml的感知编辑器, 如emacs和xmlspy 11 。新的参考文献词条被插入参考书目数据库的经同时编辑。在这里,我们假定所有xml文件是有效的,也就是所有文章具备相应的dtds,在xbms 。 验证阶段。解析是最基本的xml文档处理的操作。以后完成编辑工作中,解析器将采取xml的文章和文献数据库文件为验证目的。然后,它通过根生成翻译树以接替xml的处理器,例如在xbms的xslt处理器。 缔阶段。被援引的文献词条是选择的形式参考文献数据库和添附对结尾的在这个阶段的文章。许多xml相关标准,例如xslt的和xquery的,能执行这个最重要的作用 xbms. boyh xslt stylesheet和xquery文件在xml也被写 。他们通常为静态具体出版者,即作者编写多文章具有相同的xslt样式表或xquery的档案出于同样的出版商。必须要有高效率,我们可以编译出的xslt styledheet或xquery的档案作为dom树,所谓翻译树,以避免重复编辑。接收后,双方根源树和翻译树,xslt处理器可能处理变革和导致在其他xml的结果xml文件格式化或进一步处理的结果树。 转型阶段。如果我们要显示其他数据格式,如制作pdf或tex产品,我们然后需要翻译结果树入fo (浮动对象) 12 树和援引后端程序,以产生预期产品格式。3. xbms的数学模型3.1. xml文件的树模型 xml文件代表当树结构,内在结对应于确定的元素本文的结构,当叶节点和时属性提供内容。有时,如在案件typechecking ,我们只是对感兴趣一个文件的结构,而不是按实际价值属性或叶节点。在这种情况下,我们可以充分代表xml文件作为树木超过有限字母表。图2显示样本xml文件,图3显示其树表示法。introductiondetailed information about xmlcan be found on theweb . next, we focus on computation byquery automata.图2 art.xml文件。_图3。 树表示法 xml文件实例 图2。3.2 。定位与合并在xml的,但是,本文树的结点 不仅标记与它的元素类型,而且还同一套属性任务。举例来说, 引文元素是独特地辨认属性与价值“w3c04”的id属性。一 应付的可能性属性是由外部 谓语。为求统一,但是,我们跟随不同的做法类似陈述,因为在dsssl 13 。也就是说,属性的一个要素是有代表在文件树作为一种额外子树的元素。这一新表示法说明图4 。在此种陈述后,每元素的出现,正好有二个孩子,标记与 辅助标志#atts和#cont。 #atts 子树包含每项属性任务。 #cont结的孩子是内容元素。 为了设置所有元素在树的表示法文章档案,我们采用搜索算法赛事的背景下,由两连续运行的自动机森林第七章 14 。一般而言,参考书目命令必须是完全相同的文件有序的 元素。为了找出比赛在这中命令,前算法必须交换二个自动机的方向:第一遍历哪些参观结从右到左辨认所有语法的比赛的候选人; 任务第二遍历参观结左到右放弃的那些候选人不是比赛。每当找到元素,属性id的价值被存放对易变的x。 在早先段描述的算法是再初始化与易变的x和树参考文献数据库的表示法作为它输入。因为树自动机不可能检查是否bibitem id属性的价值 元素与x,它的价值是相同的对待这些样式作为一套外在谓语。在其他词,每个文本样式由一个电话审查一个外部过程。 图4。 延长的树表示法 一个xml文件在表2。每个子树的树代表性文献数据库,这是植根于一些匹配bibitem内容是重复的作为儿童树的产量树是根植于文献元素。注意,该命令的儿童的文献元素是相同的由于举要素条文件,因为该命令的河套是一样的文件,以便在文章中档案。最后,在建造该树文献清单,替代操作表演,以取代背带裤的元素文章档案所输出树植根于书目元素。4. implementation1和示范4.1 xslt作为变革语言 例如xml应用,在xbms,参考文献文件的考试和文章, xml文件的重建是必需的。即询问处理xml内容是必要。 即使xml的查询语言有不规范化, xslt似乎是候选人在片刻。 xsl是对xml的一个推荐延伸性stylesheet语言。 它的主要角色允许用户变换xml到html,因而显示xml文件介绍布局。xsl包含二个关键部件: xslt (xsl :变革)的变革和xslfo (xsl格式化对象)介绍目的。 xslt是一种基于xml的语言和使用xml路径语言变换xml文件的语言(xpath)和指定本文的一个特殊部分。 最近,各种各样的引伸增加了到xsl。最明显部分是可变物的加法并且参量通过在模板规则之间。这些增补一起使用的模式(如用于及早被定义的有限状态机的状态 xsl的版本 )做xsl一次强有力的询问语言15。其外, xml文件变革为自动参考文献的确是必要的世代,因此我们采取xslt作为我们的查询和改造语言。 4.2实施环境 要完成xbms的做法,我们需要首先解析文章xml文件, art.xml,参考文献数据库文件、bib.xml和xsl文件,bib.xsl如果需要,和激活翻译生产结果文件的处理器, pub.xml2。 anxml分析器, xerces,确认文章和修造来源树。来源树然后转移xslt处理器。我们采取一种开放式的软件, xalan ,从apache项目作为xslt的处理器。 xalan可以接受不同类型的输入源,如作为一个url ,一个xml流,一个dom树,样品分析事件, 或专有数据结构。没有解析是必要的当xslt的处理器接受一个dom树作为其输入源,因为一个dom树已经结果在一定的xml解析器。在另一方面,如果xslt的处理器接受一个xml文件作为它的输入消息人士透露,届时的xslt处理器将援引同伴解析器来解析投入与回报的根源该文件树到的xslt处理器。为示范用途,我们说明了一个xbms申请使用fedora核心2系统奔腾3.0 ghz的cpu和512 mb的memory.from apache项目作为我们的xml解析器和xslt 处理器。图5显示流通情况行动在一个xbms应用 图5 一个执行快照xbms 4.3编程的技巧xslt的变量是相似的变数其他编程语言与主要的例外,那就是他们可能只被分配一次,在时间,他们是申报。该要素是用来声明一个变量。变是全球性,如果它的宣布作为一个高层元素和地方,如果它的宣布一范本。有两种属性 , 即所需的名称属性,指明名称变和可选的选择属性它确定了价值的变数。也有两种方法确定的价值,一个变量:由专责属性或由内部嵌入的内容 。如果选择属性介绍, 不能包含任何内容。该可以用来存放一种结果复杂的表达,这是一再引用, 内容的一些节点,或一棵树片段。在我国实施,我们运用元两次:首先,存放的易变的name= 围嘴 select= “文件(bib.xml)”/元素xml分析器引起的来源树xerces从来源的文章文件art.xml。 其次,我们申请存放价值的元素 其中每一的id属性个援引元素。 然后,我们能进行树形检索元素“由援引”元素,和增加由元素。 xslt文件被解析,转型树引起。归根结底的树是通过xalan前xalan可以进行改造过程。一般来说,参考文献世代做法是固定的,因而我们可以保存在记忆的翻译树为效率。 改造树保存在记忆体以外在磁盘,部分原因在于把它从磁盘需要较长时间比重新编译的起源,这是主要是由于其增加的规模。我们可以再用树只要它仍然在内存中。这是很常见一台服务器的环境,必须使用同一个样式表多次变换文件。为了完成为此,编译样式表是必须严格唯读于执行时间,是允许使用在多重执行线程同时进行。 5 。结论知识是力量和参考文献数据库是知识线索。然而,连续成长信息源和随后在参考文献数据库的大小的增量做了参考书目管理一令人沮丧任务研究员必须面对,必须要面对。该xbms计算范式正在成为演化的xml与互联网计算模型,这将使发展文献管理系统更为容易。在这篇文章中,我们已经介绍了如何xbms 利用权力的xml技术提供了一个框架文献管理,其中作者可直接利用最喜爱的编辑撰写的文章, 有效地引用引文检索服务,并自动产生预期的文件格式如pdf格式,tex,或其它xml格式。从用户的角度来看,这样做可以避免需要有不同藏品的文字处理机,以及为需要管理参考文献参照。 几种改进在xbms可以完成。 as在编辑阶段,检查完整性和文献词条的重复在我们被忽略系统。 然而,多数共同的xml明白的编辑可容易地执行考试,不用伟大修改成交。 根据宽互联网,文章文件的可及性和参考文献数据库可能位于不同的机器(甚至不同的平台)在确认的阶段。 在其他词,我们也许设定servlet使用xslt(例如xalanjava 18)反应的处理器要求自动参考文献世代,和这个分布的特点在能被完成确认阶段。 我们也许也扩大联合阶段以做用途的额外xslt stylesheets xslt作为查寻元素的查询语言,这样作为类型,作者,标题,年等等。 终于,支持的统一的xml应用工作流 xbms将允许新的xml的发展应用例如引证分析,查寻日志和其他。参考文献1. w3c。 延伸性标注语言(xml)。 /xml2. xml道路语言。 /tr/xpath3. w3c。 延伸性stylesheet语言。 /style/xsl4. w3c。 文件对象模型

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论