(计算机软件与理论专业论文)基于mathml的公式检索系统的设计与实现.pdf_第1页
(计算机软件与理论专业论文)基于mathml的公式检索系统的设计与实现.pdf_第2页
(计算机软件与理论专业论文)基于mathml的公式检索系统的设计与实现.pdf_第3页
(计算机软件与理论专业论文)基于mathml的公式检索系统的设计与实现.pdf_第4页
(计算机软件与理论专业论文)基于mathml的公式检索系统的设计与实现.pdf_第5页
已阅读5页,还剩66页未读 继续免费阅读

(计算机软件与理论专业论文)基于mathml的公式检索系统的设计与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

at h e s i d e s i g na n di m p l e m e n t a t i o no f m a t h m l - - b a s e d f o r m u l as e a r c hs y s t e m b yl i ud o n g g e s u p e r v i s o r :a s s o c i a t ep r o f e s s o rl i u h u i l i n n o r t h e a s t e r nu n i v e r s i t y j u n e2 0 0 9 弘 叠一 i j 溢 谚 尹萼瓢,r卜 独 本人声明,所呈交的学位论文是在导师的指导下完成的。论文中 取得的研究成果除加以标注和致谢的地方外,不包含其他人己经发表 或撰写过的研究成果,也不包括本人为获得其他学位而使用过的材 料。与我一同工作的同志对本研究所做的任何贡献均己在论文中作了 明确的说明并表示谢意。 学位论文作者签名:吾】东目 日 期:2 9 。7 铲 学位论文版权使用授权书 本学位论文作者和指导教师完全了解东北大学有关保留、使用学 位论文的规定:即学校有权保留并向国家有关部门或机构送交论文的 复印件和磁盘,允许论文被查阅和借阅。本人同意东北大学可以将学 位论文的全部或部分内容编入有关数据库进行检索、交流。 作者和导师同意网上交流的时间为作者获得学位后: 半年叼一年口一年半口两年口 学位论文作者签名:截东啕导师签名:胡垮屯i 签字日期:训甲7 f签字日期:州。7 ,耳 ,okl-。博 ,以, 东北大学硕士学位论文摘要 基于m a t h m l 的公式检索系统的设计与实现 摘要 随着i n t e m e t 的快速发展,越来越多的人通过w 曲发布、获取和管理知识。数理公式 作为知识体系中的重要组成部分,在基于w e b 的网络教学、信息发布、学术交流等方面 , 起着非常重要的作用,在线检索数理公式已成为一种十分迫切的要求。然而在目前的 。w e b 环境下,由于数理公式自身的复杂性以及w e b 中h t m l 对各种数理符号特殊标记的 支持非常有限,数理公式的检索问题直困扰着用户。 本文设计并实现的数学公式检索系统解决了上述问题。系统使用j s p 技术开发前台 界面,o r a c l e 作为后台数据库,m a t h m l 数学标记语言作为数学公式的描述语言,通过设 计在线公式编辑模块,用户可以所见即所得的编辑数学公式,而公式在系统中存储为 m a t h m l 代码形式,因此可以通过代码的匹配实现数学公式的检索。为了避免因查询公 式的字母不同而影响查询效果,系统对输入的公式字母代码进行了预处理,保证了查询 的性能。 本文首先分析了当前网络搜索引擎的现状,对本文研究的目的和意义进行了阐述。 进而介绍了实现系统需使用到的相关技术,包括j s p 技术、o r a c l e 数据库、m a t h m l 语言 及公式编辑器w e b e q 等方面。接着,设计了一个公式检索系统,先给出了总体设计结构, 在此基础上,针对每个模块给出了具体设计的结构,并对数据库的设计进行了详细的描 述。根据设计的结构及工作流程,给出了系统各部分的具体实现方法及程序流程。测试 结果表明,系统运行良好,可以实现数学公式的在线输入,同时可以实现准确的检索, 达到了设计的目的。 关键词:公式检索系统;在线公式编辑;m a t h m l ;w e b e q 王 , d e s i g na n di m p l e m e n t a t i o no f m a t h m l - b a s e df o r m u l as e a r c h s y s t e m a bs t r a c t w i t ht h er a p i dd e v e l o p m e n to fi n t e r n e t ,m o r ea n dm o r ep e o p l ea r ep u b l i s h i n g ,r e c e w m g a n dm a n a g i n gk n o w l e d g ef r o mw e b a so n eo ft h em o s ti m p o r t a n te l e m e n ti nk n o w l e d g e s v s t e r n ,m a t hf o r m u l a si sp l a y i n ga ni m p o r t a n tr o l ei nw e b b a s e dr e m o t et e a c h i n g ,i n f o r m a t i o n p u b l i c a t i o na n da c a d e m i ce x c h a n g e o n l i n es e a r c ho fm a t h o rp h y s i c sf o r m u l a si sb e c o m i n g a nu r g e n tr e q u i r e m e n t h o w e v e r , i nc u r r e n ts i t u a t i o n ,t h ed i f f i c u l t yo fs e a r c h i n gf o r m u l a si s a l w a y su p s e t t i n g ,b e c a u s eo ft h ec o m p l e x i t yo fs o m ef o r m u l a sa n dt h ev e r yl i m i t e ds u p p o r t t o m a t ho rp h y s i c ss y m b o l si nh t m l t h em a t hf o r m u l aq u e r ys y s t e md e s i g n e di nt h i st h e s i ss o l v e st h ea b o v ep r o b l e m t h e s v s t e mu s e sj s pa su id e v e l o p m e n tl a n g u a g e ,o r a c l ea sb a c k g r o u n dd a t ab a s ea n dm a t h m l a st h ed e s c r i p t i o nl a n g u a g et om a t hf o r m u l a s t h ed e s i g no ft h e o n l i n e f o r m u l ae d i t i o n m o d u l ee n a b l e su s e r st oe d i tm a t hf o r m u l a sa tw i l l t h ef o r m u l a si nt h i ss y s t e ma r es t o r e da s m a t l l i l c o d e s ,f o rw h i c ht h eq u e r yt om a t hf o r m u l a sc a nb er e a l i z e db ym a t c h i n gm a t h m l c o d e s i nv i e wo ft h ed i f f e r e n tc h a r a c t e r si naf o r m u l a ,p r e p r o c e s s i n gi sc o n d u c t e dt ot h ec o d e o ft h ei n p u tc h a r a c t e r s ,w h i c he n s u r e sq u e r yp e r f o r m a n c e f i r s t t h i st h e s i sa n a l y s e st h ec u r r e n ts i t u a t i o no fw e bs e a r c he n g i n e s ,a n dt a l k sa b o u tt h e o b ie c t i v e sa n ds i g n i f i c a n c eo ft h i ss t u d y s e c o n d l y , i m p l e m e n t a t i o nr e l a t e dt e c h n i q u e s a r e i n t r o d u c e d s u c ha sj s p , o r a c l e ,m a t h m la n dw e b e qf o r m u l ae d i t o r t h i r d l yaf o r m u l as e a r c h s v s t e mi sd e s i g n e d ,i na d d i t i o nt o w h i c ht h eo v e r a l ls t r u c t u r e ,d e t a i l e df u n c t i o nm o d u l e d i a 2 r a m sf o re a c hm o d u l e ,a n dt h ed e s i g no fd a t a b a s ea r ed i s c u s s e d a c c o r d i n gt ot h ed e s i g n a n dw o r k n o w d e t a i l e di m p l e m e n t a t i o na n df l o wc h a r t sa r ep r o v i d e d t h et e s tr e s u l t s s h o w s t h a tt h es y s t e mw o r k sw e l l ,a n di sa b l et oi m p l e m e n to n l i n em a t hf o r m u l ai n p u t ;m o r e o v e r , p r e c i s es e a r c hi sa l s oa v a i l a b l et h a tm e e t s t h ed e s i g n e do b je c t i v e s k e yw o r d s :f o r m u l as e a r c hs y s t e m ;o n l i n ef o r m u l ae d i t i n g ;m a t h m l ;w e b e q i i i 厂 rtili时 东北大学硕士学位论文 独创性声明 摘要 a b s t r a c t 第l 章绪论 1 1 研究背景及现状 1 2 研究内容 1 3 论文的组织结构 第2 章关键技术研究 2 1j s p + o r a c l e 数据库 2 1 1j s p 技术 2 1 2o r a c l e 数据库7 2 2m a t h m l 语言8 2 2 1m a t h m l 的诞生和发展历史8 2 2 2m a t h m l 语言简介1 0 2 2 3m a t h m l 文档结构1 4 2 3 公式编辑器w e b e q 及文本编辑器f c k e d i t o r 1 6 2 4 本章小结1 8 第3 章系统设计l9 3 1 需求分析l9 3 2 用例分析2 0 3 3 总体架构设计2 1 3 4 详细设计2 2 3 4 1 系统运行平台f c k e i d t o r 2 3 3 4 2 在线编辑及显示模块2 3 3 4 3 预处理模块2 4 3 4 4 数据库2 5 3 4 5 查询模块2 6 3 4 6 搜索链接模块2 6 3 5 关键类设计2 7 3 6 本章小结3 0 i v 东北大学硕士学位论文目录 第4 章系统实现31 4 1 系统运行平台f c k e d i t o r 的配置3 1 4 2 在线编辑及显示模块的实现3 2 4 2 1 编辑部分的实现3 2 4 2 2 显示部分的实现3 5 4 3 预处理模块的实现3 9 4 4 查询模块的实现4 1 4 4 1 直接匹配4 l 4 4 2 部分精确匹配4 2 4 5 搜索链接模块的实现4 6 4 6 本章小结4 7 第5 章系统测试4 9 5 1 测试原则4 9 5 2 测试内容5 0 5 2 1 公式录入功能测试5 0 5 2 2 公式查 自j 功能测试51 5 3 本章小结5 2 第6 章结论5 3 6 1 论文总结5 3 6 2 进一步工作展望5 3 参考文献5 5 致谢5 9 东北大学硕士学位论文第1 章绪论 第1 章绪论 除了一些基本的诸如衣食住行的需求之外,人们对信息的要求也越来越高, 可以说信息的产生、传播、搜集与查询已经成为人类的一项基本活动。其实,自 从有人类开始,人们就已经开始了对信息的操作,从远古时期的结绳记事,到后 来的文字记载,直至今天的数字信息,每种信息的记录形式都为人们做了或多或 少的贡献,当人们需要得知一项自己不知道的知识的时候,这些信息就成了丰富 的资源,而如何利用这些资源有效地来为大家服务却一直是一项棘手而又重要的 问题。 考虑以文字为载体的信息,传统上有图书馆、相应的编目体系和专业人员帮 助,我们可以很快地找到所需的信息。随着计算机与信息技术的发展,在网络或 者电子设备上有了更加丰富的信息资源,那么为了实现对这些信息的检索,就有 了信息检索( i n f o r m a t i o nr e t r i e v a l ,i r ) 学科领域,例如关于图书或者文献的全 文检索系统。1 9 9 4 年左右,万维网( w o r l dw i d ew e b ,简记为w w w ) 出现, 它的开放性和其上信息广泛的可访问性极大地鼓舞了人们创作的积极性,然而它 的大规模发展以及用户对检索工具要求的增加也给信息检索领域带来了新的挑 战【1 1 。本文设计的系统,j 下是针对当前网络检索领域的拓展,实现了对网络数学 公式的检索。 1 1 研究背景及现状 随着互联网的迅猛发展,各种信息正以几何级数的方式增长,信息量的增多 使得用户很难得到自己所需要的信息。据c n n i c 统计,至1 j 2 0 0 4 年6 月已经有中文 w e b 站点将近6 0 6 6 0 0 个。为了从互联网上获得信息,用户通常使用搜索引擎这个 网络信息检索工具。 搜索引擎( s e a r c he n g i n e ) 是从1 9 9 5 年开始逐渐发展起来的技术。搜索引擎 以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理, 并为用户提供检索服务,从而起到信息导航的作用。搜索引擎提供的导航服务已 经成为互联网上非常重要的网络服务。因此,搜索引擎站点也被美誉为“网络门 户,【2 1 。 1 东北大学硕士学位论文第1 章绪论 然而在数学教育与学术交流中,常常需要使用大量的数学符号和公式,但是 由于目前w 曲技术对数学公式的输入和显示的支持非常有限,在w e b 中显示数学 公式大多采用图像方式。用户先借助m i c r o s o f te q u a t i o n 、m a t h t y p e 等公式编辑器 生成目标表达式,再将表达式保存为图像文件嵌入到w 曲中的适当位置【3 】。这种 图像方式解决了数学公式在网上的显示,但缺乏灵活性和扩展性,因为包含在图 像中的数学信息无法通过搜引擎进行查找。因而到目前为止,还没有一个可以实 现检索网络数学公式的搜索系统。 要解决上述问题,就需要一个可以在线输入数学公式进行查询的搜索系统。 但由于数理公式自身的复杂性以及目前w 曲中h t m l 对各种数理符号特殊标记 的支持的局限性,数理公式的在线输入、存储和检索问题将成为公式搜索系统必 须解决的问题。目前,w 曲上处理数学公式问题的方法主要有以下四种【4 】: ( 1 ) 图片法。w e b 发布者先通过m a t h t y p e 等客户端公式编辑器来编辑公式并 将其转换为图片( j p g 或j i f 格式) ,然后嵌入到h 州l 网页中,最后公式以图片 的形式在客户端的浏览器中显示。这种方式只能实现公式的显示,无法对其查询。 ( 2 ) 使用专用的数学公式的浏览器插件。有些公司为了配合本公司自己的教 学软件或教学网站,设计了专用的插件。访问者要观看数理公式,必须先要下载 这些专用的浏览器插件。这种方式的主要缺点有公式复用性差;软件独立性差。 ( 3 ) 使用l a t e x 。l a t e x 是一套基于习惯性书写思维的数学公式表示方法。一 些大的软件公司开发m 一些专用的l a t e x i 膏0 览器插件,通过这种方式。浏览器可 以直接观看嵌入在h t m l 中的公式符号。这种方式的优点是l a t e x 文档的操作简 洁,复用性好;缺点是l a t e x 不是一种标记语言,在网络应用和数据的格式化标 准化方面的扩展能力较差。 ( 4 ) 基于m a t h m l 的应用。m a t h m l 是w 3 c 组织制定的一套基于x m l 的数学 公式处理的标准。作为一种标记语言,m a t h m l 在设计之初就考虑到网络上的应 用和集成,其公式存储形式更利于所以m a t h m l 在w e b 上具有非常广泛的应用前 景。 分析比较以上四种方法可以发现,尽管前三种方法在某螳特定的情景下可以 解决数理公式的显示问题,但其在公式的在线输入和查询方面仍然存在较大的局 限性,在标准化方面也没有形成统一的标准。但作为x m l 的一种应用,m a t h m l - 2 东北大学硕士学位论文第1 章绪论 继承了x m l 的大部分优点,已成为i n t e m e t 上最重要的数学公式标准,具有广泛 的应用前景。本文提出的公式检索系统的设计与实现,正是以m a t h m l 为基础, 较好地解决了在线搜索数理公式的难题。 1 2 研究内容 本文根据当前网络发展状况,结合现有工具,依据所学知识,设计并实现了 一个“基于m a t h m l 的网络数学公式检索系统”。 系统界面设计采用j s p 技术,即在传统的网页h t m l 文件( * h t m ,* h t m l ) j j l ) , j a v a 程序片段( s c r i p t l e t ) 矛i j s p 标记( t a g ) ,就构成了j s p 网页( 木j s p ) 。 j s p 的脚本语言是j a 、,a 语言,因而可以利用公示编辑器w e b e q 的一些组件,同时 自行设计输入、显示类和对应的接口程序,以及数据库存储、代码解析、公式查 询等模块即可。 而当前网页设计中,最常使用的就是j s p + o r a c l e 组合,其技术成熟,性能稳 定,因而本系统使用o r a c l e 作为后台数据库。系统以公式编辑器f c k e d i t o r 作为运 行平台,提供公式编辑的接口。通过对网络公示编辑器w e b e q 的研究,自行设计 系统结构,将系统分成在线编辑及显示模块、预处理模块、查询模块、数据库及 链接帮助这五个模块。同时设计运行接口嵌入系统,并根据检索结果提供网络相 关链接。 1 3 论文的组织结构 本文通过对网络搜索引擎现状进行分析,设计并实现了一个“基于m a t h m l 的公式搜索系统”,具体内容章节安排如下: 论文第1 章分析了当前网络搜索引擎的现状,对本文研究的目的和意义进行 了阐述。 第2 章介绍了实现系统需使用到的相关技术,主要包括j s p 技术,o r a c l e 数据 库的知识,m a t h m l 数学表示语言,文本编辑器f c k e d i t o r 及公式编辑器w e b e q 等知 识。 第3 章设计了一个公式搜索系统,该章首先给出了总体设计结构,在此基础 上,针对每个模块给出了具体设计的结构以及工作流程的设计,并对数据库的设 3 东北大学硕士学位论文 第1 章绪论 计进行了详细的描述。 第4 章给出了系统各部分的具体实现方法,包括系统运行平f c k e d i t o r 的配 置,在线编辑及显示模块的实现,预处理模块的实现,查询算法的实现及搜索链 接模块的实现等。 第5 章进行了系统测试,对系统运行结果进行了分析。 第6 章对全文进行总结,指出了现有系统的一些不足之处,并提出了未来的 工作方向。 - 4 东北大学硕士学位论文第2 章关键技术研究 第2 章关键技术研究 随着计算机技术币l l m e m e t 的普及,w e b 已经成为人们发布、获取和管理信息 最重要的途径,它的迅速发展极大地促进了各学科领域内人们之间的交流和协 作。在数学教育与学术交流中,常常需要编辑大量的数学符号和公式,但是目前 w e b 技术对数学公式的输入和显示的支持非常有限。 过去在w e b 中显示数学公式大多采用图像方式。用户先借助m i c r o s o f te q u a t i o n 、m a t h t y p e 等公式编辑器生成目标表达式,再将表达式保存为图像文件嵌入 到w 曲中的适当位置。这种图像方式解决了数学公式在网上的显示,但缺乏灵活 性和扩展性,因为包含在图像中的数学信息不能被查询和重用。 本文使用j s p 作为界面开发工具,o r a c l e 作为后台数据库,利用m a t h m l ( m a t h e m a t i c a l m a r k u pl a n g u a g e ) 描述语言,通过w e b e q 在浏览器中建立数学公式, 自动获得m a t h m l 代码,解析m a t h m l 文档,并显示复杂数学公式。 综上,要实现一个公式检索系统,需要涉及多项技术。以下将对用到的主要 技术做出阐述。 2 1j s p + o r a c l e 数据库 2 1 1j s p 技术 j s p ( j a v as e r v e rp a g e s ) 是由s u nm i c r o s y s t e m s 公司倡导、许多公司参与一 起建立的一种动态网页技术标准5 1 。j s p 技术有点类似a s p 技术,它是在传统的 网页h t m l 文件( 乖h t m ,* h t m l ) 中插入j a v a 程序段( s c r i p t l e t ) 和j s p 标记( t a g ) , 从而形成j s p 文件( ,c 二i s p ) 。用j s p 开发的w 曲应用是跨平台的,即能在l i n u x 下运 行,也能在其他操作系统上运行。 j s p 技术使用j a v a 编程语言编写类x m l 的t a g s 署l s c r i p t l e t s ,来封装产生动念网 页的处理逻辑。网页还能通过t a g s 矛l s c r i p t l e t s 访问存在于服务端的资源的应用逻 辑。j s p 将网页逻辑与网页设计和显示分离,支持可重用的基于组件的设计,使 基于w e b 的应用程序的开发变得迅速和容易。 w 曲服务器在遇到访问j s p 网页的请求时,首先执行其中的程序段,然后将 5 东北大学硕士学位论文第2 章关键技术研究 执行结果连同j s p 文件中的h t m l 代码一起返回给客户。插入的j a v a 程序段可以 操作数据库、重新定向网页等,以实现建立动态网页所需要的功能。 j s p 与j a v as e r v l e t 一样,是在服务器端执行的,通常返回该客户端的就是一 个h t m l 文本,因此客户端只要有浏览器就能浏览。 j s p 的1 0 规范的最后版本是1 9 9 9 年9 月推出的,1 2 月又推出了1 1 规范。目前 较新的是j s p l 2 规范,j s p 2 0 规范的征求意见稿也已出台。 j s p 页面由h t m l 代码和嵌入其中的j a v a 代码所组成。服务器在页面被客户 端请求以后对这些j a v a 代码进行处理,然后将生成的h t m l 页面返回给客户端的 浏览器j a v as e r v l e t 是j s p 的技术基础而且大型的w e b 应用程序的开发需要j a v a s e r v l e t 和j s p 配合才能完成。j s p 具备 j a v a 技术的简单易用,完全的面向对象, 具有平台无关性且安全可靠,主要面向因特网的所有特点。其主要优点如下1 6 l : ( 1 ) 一次编译,多次、多处运行,代码的执行效率高 j s p 的脚本语言是j a v a 语言,因此它具有j a v a 语言的一切特性。同时,j s p 也支持现在大部分平台。当j s p 第一次被请求时,j s p 页面转换成s e r v l e t ,然后被 编译成c a l s s 文件,以后( 除非页面有改动或w 曲服务器被重新启动) 再有客户请 求该j s p 页面时,j s p 页面不被重新编译,而是直接执行已编译好的c l a s s 文件, 因此执行效率特别高。 ( 2 ) 组件的重用性 可重用的、跨平台的j a v a b e a n s 矛n e j b ( e n t e r p r i s ej a v a b e a n s ) 组件,为j s p 程序的开发提供方便,我们可以将复杂的处理程序( 如页面中需要显示的动态内 容及对数据库的操作) 放到组件中。可以多次使用这些组件,极大的减少了在j s p 页面中重写重复的代码。 ( 3 ) 将内容的生成和显示进行分离 使用j s p 技术,w e b 页面开发人员可以使用h t m l 或者x m l 标识来设计和格 式化最终页面。使用j s p 标识或者脚本来生成页面上的动态内容。生成动态内容 的语句一般被封装在j a v a b e a n 组件、e j b 组件或j s p 脚本段中。这样,页面的设计 人员和页面的编程人员可以同步进行。同时在客户端通过查看源文件,看不到j s p 标识的语句,更看不到j a v a b e a n 和e j b 组件,也可以保护源程序的代码。 - 6 一 东北大学硕士学位论文第2 章关键技术研究 2 1 2o r a c l e 数据库 o r a c l e 是以高级结构化查询语言( s q l ) 为基础的大型关系数据库,通俗地 讲它是用方便逻辑管理的语言操纵大量有规律数据的集合。是目前最流行的客户 朋艮务器( c l i e n t s e r v e r ) 体系结构的数据库之一【7 1 。主要有以下特剧8 】: ( 1 ) 对象关系模型 o r a c l e l 0 g 对于对象模型采取较为现实和谨慎的态度,使用了对象关系模 型,即在完全支持传统关系模型的基础上,为对象机制提供了有限的支持。 o r a c l e l 0 g 不仅能够处理传统的表结构信息,而且能够管理由c 抖,s m a l l t a l k 以及其它开发工具生成的多媒体数据类型,如文本,视频,图形,空间对向等。 这种做法允许现有软件开发产品与工具软件及o r a c l e l 0 g 应用软件共存,保护 了客户的投资。 ( 2 ) 数据库服务器系统的动态可伸缩性 o r a c l e l o g 引入了连接存储池( c o n n e c t i o np o l l i n g ) 和多路复用 ( m u l t i p l e x i n g ) 机制,提供了对大型对象的支持。当需要支持一些特殊数据类 型时,用户可以创建软件插件( c a t r i d g e ) 来实现。 o r a c l e l o g 采用了高级网络技术,提高共享池和连接管理器来提高系统的 可括性,容量可从几g b 至i j 几百t b 字节,可允许1 0 万用户同时并行访问,o r a c l e 的数据库中每个表可以容纳1 0 0 0 y u ,能满足目前数据库及数据仓库应用的需要。 o r a c l e 公司称,o r a c l e l o g 可以支持达5 1 2 p b 的数据量。但目前还未有 哪一家用户的数据库的数据量达到这个数量。 ( 3 ) 系统的可用性和易用性 o r a c l e l o g 提供了灵活多样的数据分区功能,一个分区可以是一个大型表, 也可以是索引易于管理的小块,可以根据数据的取值分区。有效地提高了系统操 作能力及数据可用性,减少i o 瓶颈。 o r a c l e l o g 还对并行处理进行了改进,在位图索引,查询,排序,连接和 一般索引扫描等操作引入并行处理,提高了单个查询的并行度。o r a c l e l o g 通 过并行服务器( p a r a l l e ls e r v e ro p t i o n ) 来提高系统的可用性。 ( 4 ) 系统的可管理性和数据安全功能 o r a c l e l 0 g 提供了自动备份和恢复功能,改进了对大规模和更加细化的分 7 一 东北大学硕士学位论文第2 章关键技术研究 布式操作系统的支持,如加强了s q l 操作复制的并行性。为了帮助客户有效地 管理整个数据库和应用系统,o r a c l e 还提供了企业管理系统( o r a c l e e n t e r p r i s em a n a g e r ) ,数据库管理员可以从一个集中控制台拖放式图形用户界面 管理o r a c l e 的系统环境。o r a c l e l 0 g 通过安全服务器中提供的安全服务,加 强了o r a c l ew e bs e r v e r 中原有的用户验证和用户管理。 ( 5 ) 面向网络计算 o r a c l e l 0 g i 在与j a 、,av m 及c o r b a o r b 集成后,将成为n c a ( 网络计算 机体结构) 的核心部件。n c a 是o r a c l e 关于分布式对象与网络计算机的战略规 划。o r a c l e l 0 g 对n c a 产生了巨大影响,简化了应用软件的化分,推动了瘦型 客户机及w e b 应用软件的发展。在o r a c l e l 0 gf o rn t 中还提共了新产品w e b 发布助理( w e bp u b l i s h i n ga s s i s t a n to r a c l e ) ,提供了一种在w o r dw i d ew e b 上发布数据库信息的简便,有效的方法。 ( 6 ) 对多平台的支持与开放性 网络结构往往含有多个平台,o r a c l e l 0 g 可以运行于目前所有主流平台 上,如s u ns o l a r i s e ,s e q u e n td y n i x p t x ,i n t e ln t ,h p _ u x ,d e c - l 肘i x ,i b m a i x 和s p 等。o r a c l e l 0 g 的异构服务为同其它数据源以及使用s q l 和 p l s q l 的服务进行通讯提供了必要的基础设施。o r a c l e l 0 g 继续至力于对开 放标准规范s q l 3 ,j d b c ,j s q l 弟i c o r b a 的支持。 j s p 技术+ o r a c l e 数据库是目前应用开发中最常见的组合,j s p 的最大优点是 跨平台支持,它可以运行在所有服务器系统上。有很多支持j s p 的服务器,比如 t o m c a t 、w e b s p h e r e $ 1w e b l o g i c 等。 同时,s u n 公司提供了免费的服务器软件支持。而大名鼎鼎的o r a c l e 数据库 则是目前世界上使用最为广泛的数据库系统,作为一个通用的数据库系统,它具 有完整的数据管理功能;作为一个关系数据库,它是一个完备关系的产品;作为 分布式数据库它实现了分布式处理功能。 2 2m a t h m l 语言 2 2 1m a t h m l 的诞生和发展历史 ( 1 ) m a t h m l l 钓诞生【9 1 8 东北大学 h t m l 是最早应用于网络信息传递的标志语言,也是目前w e b 上最普及的一 种网页制作通用语言。它侧重于主页表现形式,大大丰富了主页的视觉和听觉效 果,为推动信息和知识在网上交流发挥了不可取代的作用【10 1 。 可是,h t m l 有限支持数学表达式。例如,h t m l 的m a t h 标记只能表示一些 简单的数学表达式,h t m l 支持的字符集只是包含了很少的数学符号。与此同时, 目前w e b 上利用图形显示数学表达式的方法既很原始又不完备,因为包含在图形 之中的数学信息既不支持检索功能又难以重用到其它应用程序。 1 9 9 6 年,w 3 c 开始设计x m l 。x m l 既具有s g m l 的强大功能和可扩展性, 又具有h t m l 的简单性。受x m l 的启发,w 3 c 于1 9 9 7 年开始设计m a t h m l 。于是, m a t h m l 诞生了。 ( 2 ) m a t h m l l 拘发展历史【1 1 1 1 ) s g m l 1 9 6 9 年,m m 公司为解决公司内部大量文档的交换和存储,发明了通用标记 语言g m l ( g e n e r a l i z e dm a r k u pl a n g u a g e ) 。经过十几年的完善和改进,g m l 发 展成为s g m l ( s t a n d a r do e n e r a l i z e dm a r k u pl a n g u a g e ,标准通用标记语言os g m l 在1 9 8 6 年被国际标准化组织公布为国际标准i s o8 8 7 9 。它是一种可以定义其它标 志语言的元语言。目前,s g m l 多用于科技文献和政府办公文件中。 2 、h t m l 1 9 9 0 年,欧洲核子研究中心( c e r n ) 设计了h t m l 。它是s g m l 在网络上 的特殊应用,也是最早应用于网络信息传输的标志语言。它是免费和简单的,受 到广泛地支持。可是,h t m l 存在与生俱来的缺陷。例如,h t m l 不适应日益增 多的信息检索要求和文档要求,h t m l 无法描述矢量图形和科技符号,松散的 h t m l 语法要求使文档结构混乱而导致浏览器的设计越来越复杂。 3 、x m l 1 9 9 6 年,w 3 c 成立一个s g m l 专家小组,开始设计x m l 。w 3 c 于1 9 9 8 年2 月 批准了x m l 的1 0 版本。x m l 是s g m l 的简化版本。它集成s g m l 和h t m l 的优点, 具有易于编辑、便于管理、容易查询等优势。它是一种元语言,允许程序开发人 员根据它提供的规则,制定其它的标志语言。 4 、m a t h m l 9 东北大学硕士学位论文 第2 章关键技术研究 1 9 9 7 年,w 3 c 成立一个w 3 c 数学工作小组,开始设计m a t h m l 。w 3 c 首先于 1 9 9 7 年提出m a t h m l 的w g 内部版本,于1 9 9 8 年1 月6 同发布m a t h m l 规范草案,于 1 9 9 8 年4 月7 日发布m a t h m l l o 版本,于2 0 0 1 年2 月2 1 日发布m a t h m l 2 0 版本,于 2 0 0 7 年4 月2 7 日发布m a t h m l 3 0 版本。目前,m a t h m l 2 0 是推荐版本。 2 2 2m a t h m l 语言简介 , m a t h m l 用于描述数学公式的结构和内容,它的出现使数学公式不仅可以在 w e b 上建立与传输,而且可以在其它应用程序中实现再利用和转换,满足用户对 。 数学公式的各种处理需求【1 2 1 【1 3 】。 m a t h m l 提供两种描述数学公式的标记:一种是表示型标记( p r e s e n t a t i o n m a r k u p ) ,另一种是内容型标记( c o n t e n tm a r k u p ) 。这两种标记都可以完整地 描述任何一个数学公式,但是它们的侧重点不同:前者用束描述数学表达式的二 维布局结构,它更注重表达式的显示方式;后者描述用于计算和处理的数学信 息,它更关注表达式的内在含义。数学表达式的c o n t e n t 标记编码形式可能对应 多种p r e s e n t a t i o n 标记编码形式,表达式在w e b 浏览器中的具体显示形式由 m a t h m l 处理程序决定。p r e s e n t a t i o n 标i 己平l c o n t e n t 标记使得w 曲中的数学信息不 仅是机器能读的,而且是机器能理解的。二者可交叉使用形成混合编码,但不能 相互替代【14 1 。 m a t h m l 的表示标记共有3 1 个,并有5 0 种属性,用于数学符号的编码。其标 记和分类如下: ( 1 ) 表征元素 m 标识符 数字 操作符、边界或分隔符 文本p 空格 字符串 i f i - jm a t h m l 增加新的字符 ( 2 ) 一般的输出描述元素 将任意数目的子表达式水平的分成一组 1 0 东北大学硕士学位论文第2 章关键技术研究 由两个子表达式形成一个分数 形成个平方根 形成一个有特定指数的根式 风格改变 包含一个从预处理器传来的错误消息 调整内容周围的空格 m p h a n t o m 使子表达式不可见但是保留它的大小 m f e n c e d用一对边界围绕内容 m e n c l o s e用一个拉伸符包含内容 ( 3 ) 角标和极限描述元素 下标 上表 上下标 正下标 f 上标 正上下标 多个垂直排列的施加于一个基的上标和下标 ( 4 ) 表格和矩阵元素 表格或矩阵 表格或矩阵罩的一行 表格或矩阵里的一个单元 一组的对齐方式 一点的对齐方式 表格或矩阵里被标签的行 ( 5 ) 激活表达式 用来将一个动作捆绑到一个子表达式 用表示标记可以精确地控制一个表达式的外观,比如在浏览器中的显示或在 打印纸上的打印样式。m a t h m l 的表示标记元素主要是为了实现显示的目的来编 写数学内容的。由于表示标记本身并不很关注数学内容的结构和内容,它比内容 东北大学硕士学位论文第2 章关键技术研究 标记需要更少的元素。在数学表达式里面有很多数学符号,但它们往往都有一定 的布局规则,如排成一行,排成分数形式,排成矩阵等等。但是这些布局规则又 不是一个个孤立的存在的,它们往往都是相互嵌套,如一个数学表达式从整体上 看去是一个分式,但是分式的分子或分母中又含有根号、分式等。m a t h m l 的表 示标记编码就是根据数学表达式的这些布局规则,利用元素之间的嵌套来反映数 学内容的嵌套模式。m a t h m l 表示标记编码大多数是由嵌套布局元素组成的。例 如y = 甜2 + 如+ c 对应的m a t h m l 表示标记编码为: y = a x 2 + b x + c m

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论