




已阅读5页,还剩80页未读, 继续免费阅读
(计算机应用技术专业论文)基于识别的公式编辑器的研究和开发.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
西南交通大学硕士研究生学位论文第1 li 页 摘要 随着i n t e r n e t 的迅速发展,计算机和网络技术极大地促进了社会生产、 生活和学习等各个方面的发展。作为传播知识和技术主阵地的教育行业同样 也受到计算机和网络技术的巨大影响,课堂教学、实验教学和考试环节都大 量采用了计算机技术进行了改革。作业环节技术手段的改革则是最近几年发 展起来研究的一个新课题。目前有很多可以让学生在计算机上做题的软件, 但是计算机只能对选择题和判断题等客观题型自动进行批改,而理工科课程 的作业则大量使用计算题和证明题等主观题型,目前计算机自动识别和批改 计算题和证明题的技术还是一个空白。 理工科的计算题和证明题中含有大量的数学表达式,要想让计算机能够 自动处理计算题和证明题,就需要实现两个方面的功能。首先,系统必须为 老师设计作业题目和学生做作业提供一种输入和编辑数学表达式的功能;其 次,计算机要能够对老师布置的作业和学生的解答进行比较识别。现有的公 式编辑器像w o r d 和m a t h t y p e ,不满足上述的要求,主要由两个原因,一是 现有的公式编辑器主要是为了显示、排版和印刷工作而设计的,没有考虑识 别和批改的需要;二是现有公式编辑器的数据格式是保密的。因此,必须对 基于识别的公式编辑器进行研究和开发。 本文针对基于识别的公式编辑器的几个关键技术问题进行了研究,主要 工作如下: ( 1 ) 对数学表达式的结构形式和公式编辑器的操作功能进行了分析和研 究,提出了适合于识别和批改的数学表达式的数据结构。 ( 2 ) 运用d e l p h i6 0 对公式编辑器开发,实现了理工科课程中大部分数 学表达式正确输入和规范化显示。 ( 3 ) 为了兼顾输入便利和识别有效的双重目的,对公式编辑器输入和输 出的数学表达式进行语义理解和关系重构。 关键词:数据结构;公式编辑器;数学表达式;语义理解 西南交通大学硕士研究生学位论文第1 v 页 a b s t r a c t w i t ht h er a p i dd e v e l o p m e n to fi n t e r n e t ,c o m p u t e ra n dn e t w o r k t e c h n o l o g yh a v eb e e np r o m o t i n gt h es o c i a lp r o d u c t i o n ,l i v i n g ,l e a r n i n g a n ds oo n 缸也ep o s i t i o nt od i s s e m i n a t ek n o w l e d g ea n dt e c h n o l o g y , e d u c a t i o nh a sb e e n i m p a c t e dg r e a t l yb yc o m p u t e ra n dn e t w o r k t e c h n o l o g y r e c e n t l yi nt h i sf i e l d 也er e f o r m a t i o no ft h et e c h n i c a lm e a n s o fc h e c k i n ge x e r c i s ei san e w t o p i c a tp r e s e n t ,t h e r ea r em a n yk i n d so f e x e r c i s ec h e c k i n gs o f t w a r e ,w h i c hc a no n l yr e c o g n i z ea n dc o r r e c ts u c ha s m u l t i p l e - c h o i c eq u e s t i o n sa n dt r u eo rf a l s eq u e s t i o n sa u t o m a t i c a l l y , w h i l ei nm a n ys u b j e c t s ,c a l c u l a t i n gm a t h e m a t i c sq u e s t i o n sa n d p r o v i n g p r o b l e m sa r en e c e s s a r yp a r t , a n dp o s s e s st h el a r g ep r o p o r t i o ni n e x e r c i s e s a n dt h e r ei ss t i l lab l a n kt h a tt h ec o m p u t e rc a n ti d e n t i f ya n d c o r r e c t c a l c u l a t i n g m a t h e m a t i c s q u e s t i o n s a n d p r o v i n gp r o b l e m s a u t o m a t i c a l l ya tp r e s e n t i ns c i e n c ea n d e n g i n e e r i n gs u b j e c t ,c a l c u l a t i n gm a t h e m a t i c sq u e s t i o n s a n dp r o v i n gq u e s t i o n sm u s tu s ea1 0 to fm a t h e m a t i c a le x p r e s s i o n sw h i c h c o n v e yi t sm a t h e m a t i c a li d e o l o g yt ou s e r s , i ft h ec o m p u t e rc a nc h e c ka n d i d e n t i f y t h em a t h e m a t i c sq u e s t i o n sa n dp r o v i n gq u e s t i o n s ,t w of u n c t i o n s n e e dt ob ec o m p l e t e d f i r s to fa l l ,w h e nt e a c h e r sd e s i g nt h eh o m e w o r ka n d s t u d e n t sc o m p l e t et h ed e s i g n e dh o m e w o r k , t h es y s t e mm u s tp r o v i d e e q u a t i o ne d i t o rt oi n p u ta n de d i tm a t h e m a t i c se x p r e s s i o n s ;s e c o n d l y ,t h e c o m p u t e rc a nc o m p a r ea n di d e n t i f ya s s i g n e dt h eh o m e w o r kb yt e a c h e r s a n d c o m p l e t e dt h eh o m e w o r kb ys t u d e n t s t h ee x i s t i n gf o r m u l ae d i t o rl i k e w o r da n dm a t h t y p ed o n tm e e tt h er e q u i r e m e n t so ft h ea b o v e ,t h em a i n r e a s o n sa r ea sf o l l o w s :f i r s t ,t h ee x i s t i n ge q u a t i o ne d i t o ri st od i s p l a y , l a y o u ta n dp r i n tt l l em a t h e m a t i c se x p r e s s i o n s ;s e c o n d ,t h ed a t af o r m a to f t h ee x i s t i n ge q u a t i o ne d i t o ri sc o n f i d e n t i a l ;t h e r e f o r e ,i ti s n e c e s s a r yt o d e s i g na n dr e s e a r c hf o re q u a t i o ne d i t o rb a s e do nr e c o g n i t i o n t om e e tt h er e q u i r e m e n t sa b o v e ,t h em a i nc r e a t i v ea c h i e v e m e n t si n t h ep a p e ra r ea sf o l l o w s : ( 1 ) t h r o u g ht 1 1 ea n a l y s i sa n dr e s e a r c hf o r 也ef o r mo fs t r u c t u r eo f 也e m a t h e m a t i c se x p r e s s i o n sa n dt h eo p e r a t i o no fe q u a t i o ne d i t o r ,t h ep a p e r p r o v i d e s t h ed a t as t r u c t u r es u i t i n g f o r r e c o g n i z i n g a n dc h e c k i n g m a t h e m a t i c se x p r e s s i o n s ( 2 ) d e s i g na n dd e v e l o pe q u a t i o n e d i t o ra f t e ru s i n gd e l p h i6 0 , e q u a t i o ne d i t o rh a v ea c h i e v e di n p u tc o r r e c t l ya n dd i s p l a ys t a n d a r df o r m o s to fm a t h e m a t i c se x p r e s s i o n si ns c i e n c ea n de n g i n e e r i n gc o u r s e s ( 3 ) i no r d e rt oi n p u ta n di d e n t i f ye f f e c t i v e l y ,t h e m a t h e m a t i c s e x p r e s s i o n sb ye q u a t i o ne d i t o ri n p u t t i n ga n do u t p u t - r i n gn e e ds e m a n t i c u n d e r s t a n d i n g a n dr e l a t i o n sr e c o n s t r u c t i o n k e yw o r d s :d a t as t r u c t u r e ;e q u a t i o ne d i t o r ;m a t h e m a t i c a le x p r e s s i o n s ; s e m a n t i cu n d e r s t a n d i n g 西南交通大学硕士研究生学位论文第1 页 西南交通大学曲南父逋大字 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学 校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文 被查阅和借阅。本人授权西南交通大学可以将本论文的全部或部分内容 编入有关数据库进行检索,可以采用影印、缩印或扫描等复印手段保存 和汇编本学位论文。 本学位论文属于 l 。保密口,在年解密后适用本授权书; 2 不保密d 使用本授权书。 ( 请在以上方框内打“4 ) 学位论文作者签名:杏饶施 日期:珈呷、石、寥 特制磁言兹溉日期:叭尹侈善 西南交通大学硕士研究生学位论文第f i 页 西南交通大学学位论文创新性声明 本人郑重声明:所呈交的学位论文,是在导师指导下独立进行研究工作 所得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或 集体己经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体, 均己在文中作了明确的说明。本人完全意识到本声明的法律结果由本人承担。 本学位论文的主要创新点如下: ( 1 ) 基于作业识别和批改的特殊需求,对数学表达式的结构形式和特征 进行了分析和研究,建立了特别适合于识别和批改的数学表达式的数据结构, 与w o r d 和m a t h t y p e 系统的数据格式相比较,后者无法满足比较识别和作业 批改的需求,同时后者的数据格式更为繁杂,而对于规范的数学表达式而言, 本文所建立的数据结构更为简洁和灵活,节省了存储空间和分析数据的时间。 ( 2 ) 基于作业识别和批改的特殊要求,对作业系统公式编辑器的功能需 求进行了分析和研究,并运用d e l p h i6 0 对作业系统的公式编辑器进行了开 发,实现了理工科课程作业中大部分数学表达式的正确输入和规范化显示, 为理工科课程的作业技术改革打下了良好的技术基础。 ( 3 ) 为了兼顾输入便利和识别有效的双重目的,结合数学规范和默认约 定对公式编辑器生成的数学表达式进行语义理解和关系重构,从而将教师和 学生通过公式编辑器输入的字符串信息转换成了规范的数学表达式,为系统 后续的对数学表达式的识别和批改做好了前期准备工作。 李统舱 伽。9 、 西南交通大学硕士研究生学位论文第1 页 1 1 研究背景和意义 1 1 1 问题的提出 第1 章绪论 随着i n t e r n e t 的迅速发展,计算机和网络技术极大地促进了社会生产、 生活和学习各个领域快速发展。作为传播知识和技术主阵地,教育行业同样 也受到了计算机和网络技术的巨大影响,课堂教学、考试和实验等环节已经 大量使用计算机和网络。作业环节技术手段的改革则是最近几年发展起来的 一个新的研究课题。作业是一个教学环节【l 刊,学生做作业,教师改作业。在 作业环节学生独立运用所学的知识,分析、研究和解决具体的问题,从而使 知识得到巩固,并将所学知识转化成能力和技巧。学生作业中含有大量有关 学生学习状态和对各部分知识掌握情况的有用信息,教师通过批改作业,可 以起到检查课堂教学效果、调整和修改教学计划的作用。因此,作业还是一 个非常重要的教学环节。 传统的作业流程都是通过纸笔撰写和手工批改的方式来完成的,这种作 业方式存在以下一些问题: 第一,学生对作业敷衍了事,缺交、缺做和抄袭的现象十分严重。传统 的作业方式对作业的纪律控制不严,而且抄作业的成本太低,学生抄袭作业 非常方便。例如学生可以在课堂上利用上课时间非常方便的抄作业,这样一 方面没有达到老师布置作业的要求;另一方面影响了课堂教学的效果。 第二,学生不仔细阅读老师对作业批改的内容,并且不按照老师的要求 订正作业的错误。 第三,教师手工批改作业的工作量巨大。在理工科课程的作业中,存在 的大量的数学表达式推演和数字计算,详细地对其进行批改几乎不可能,因 此任课教师往往只能每一个题目打一个勾或叉,作业批改的数量和质量受到 了很大的影响。 第四,反馈时间长。由于老师批改的工作量大,完成批改工作所需的时 间长,一次作业往往需要几天或一周之后才能发还给学生,信息反馈的即时 性大大降低。 西南交通大学硕士研究生学位论文第2 页 显然,传统作业方式的缺点是由作业手段落后造成的,不对作业手段进 行改革,上述问题就无法得到解决。因此,利用计算机和网络对作业手段进 行改造就成为了一种趋势。目前对作业手段改造的软件已经有很多,主要是 利用计算机和网络对选择题、判断题等客观题目进行自动批改;但是对理工 科课程而言,作业中大量采用的是证明题和计算题等主观题,因此对计算题 和证明题的自动识别和批改就称为了作业手段改革的技术核心。 为了解决主观题的自动批改问题【7 】,作业系统必须提供两个方面的功能, 一是学生和老师能够利用输入和编辑数学表达式,因此这就需要设计一个操 作便捷的数学表达式的编辑器;另一方面当然就是计算机还必须能够识别和 批改学生输入的解答内容。 本文对基于识别的公式编辑器进行了研究和开发。 1 1 2 国内外研究现状 目前我们应用最多的公式编辑器是w o r d 中的公式编辑器和m a t h t y p e 。 w o r d 文字处理软件是大家再熟悉不过的,w o r d 里的公式编辑器应【8 1 0 】是使用 最广泛的一种数学公式编辑器。它的优势有目共睹:把所有公式做成可视化 按钮,输入时直接点击,通俗易懂。但它的缺点也是显而易见,输入公式时 要不断地寻找模板公式,很影响输入速度,而且输入的数学公式不能进行计 算。 m a t h t y p e l l l 1 4 】是w o r d 中公式编辑器的升级版本,在功能上不仅延续w o r d 原有的功能,还增添大小属性页工具栏,可以输入更多的模板公式。但它也 不具有特殊字符的键盘输入和表达式计算功能。 以上两种公式编辑器,对于证明题和计算题的自动批改和识别是不符合 要求的,主要表现在以下几个方面: 第一,目前存在的公式编辑器的数据格式是保密的,不便于系统对其进 行后期的分析和处理。 第二,目前存在的公式编辑器的主要是为了数学表达式的显示、排版和 印刷,没有考虑识别与批改特殊需求。 本公式编辑器是智能作业系统的一个控件,则目前国内以练习或者考试 形式出现的教育软件大致分为两类:一类是主要研究资源共享、在线提交作 业、作业管理,未对作业的自动批改技术进行研究的系统。如文献 1 5 研制 开发一个网上作业上传和批改系统,介绍一个基于w e b 远程教学的作业上传 西南交通大学硕士研究生学位论文第3 页 批改系统,改变以前只能通过f t p 服务器或e m a i l 提交或下载作业的情况, 在任何时间任何地方通过i n t e r n e t 访问教学服务器提交作业,进行批改和评 分。文献 1 6 研制开发的计算机辅助作业系统主要对作业进行管理。文献 1 7 研制开发基于局域网w e b 方式的作业管理系统,主要研究作业布置、作业提 交、作业批改和作业信息反馈等功能。另一类软件研究选择题和判断题等题 型的自动批改技术。文献 1 8 对网上作业包括选择题和填空题的自动批改进 行研究。文献 1 9 2 6 介绍的考试系统也都只能自动批阅判断题和选择题。 目前像理工科一类课程的证明题、计算题也需要自动批改和识别。 要想完成对证明题、计算题自动批改和识别,则需要一个公式编辑器作 为作业系统的技术支持。目前存在的公式编辑器软件很多,它们是否适合作 为作业系统的技术支持,则需要对它们进行了解和分析。目前存在的公式编 辑器软件除了上述介绍的w o r d 和m a t h t y p e 主要还有以下几个1 27 j : l a t e x 2 8 j 是当今世界上最流行和使用最为广泛的住t e x 宏集,由美国计 算机学家l e s li el a m p o r t 在2 0 世纪8 0 年代初期开发,他加进很多功能使得 使用者可以更方便的利用t e x 的强大功能,对于生成复杂表格和数学公式, 这一点表现得尤为突出。在数学科研领域中,大多数用户都是使用l a t e x 作 为数学公式的输入方式,并且市场上有大量支持l a t e x 的应用软件,但这些 标准和软件并没有和w e b 技术很好的集成在一起。l a t e x 是一套基于习惯性 书写思维的数学公式表示方法,如输,醚f r a e 4 ) 5 ”,编译后则显示4 5 ”, 而w e b 中的h t m l 却是一种良好结构的标记语言,这种区别给两种文档的集成 造成困难。目前,一些大的软件公司开发出一些专用的l a t e x 浏览器插件, 通过这种方式浏览器可以直接显示嵌入在h t m l 中的公式符号。很多专业的数 学网站( 如p r o b a b l i l i t ya b s t r a e ts e r v i e e ) 就使用这种方式来显示数学公 式。但是l a t e x 语言并不是一种标记语言,所以l a t e x 就失去很多标记语言 的优点,例如数据和显示的分离、不同数据的集成和系统的扩展性等等,这 亦导致l a t e x 在网络应用和数据格式标准化方面的扩展能力很差。 m a p l e 2 9 】是由加拿大k e i t hg e d d e s 和g a s t o ng o n n o t 教授1 9 8 0 年为科 研及教育而开发的数学软件。发展至今,己成为一个功能极其强大的数学软 件。不过对与公式的输入,m a p l e 就显得比较缺乏,输出结果虽为公式化, 但若是对输出结果进行编辑就无能为力。对于想设计出较完美的公式显示的 高级用户而言,这种软件也不是很理想。 由s t e p h e nw o l f r 锄【3 0 j 开发的m a t h e m a t i c a 是世界上唯一一个为技术计 西南交通大学硕士研究生学位论文第4 页 算而设计的完全整合环境。它对计算机在许多技术和其他领域得以广泛应用 产生深远的影响。在公式输入和编辑方面,m a t h e m a t i c a 也是把公式做成可 视化按钮,输入时直接点击,而且具备公式计算功能,但输入公式时也要不 断寻找模板公式,影响输入速度,而且也不具备特殊字符键盘输入的功能, 计算结果和表达式分两行显示,不便于继续输入文本,影响整体输入效果。 s c i e n t i f i c w o r k p l a c e 是一种集l a t e x 的基本功能和m a p l e 里可计算功 能于一体的多功能软件,它克服大部分软件中不可计算的缺点,使数学公式 的编辑更加完善,功能十分强大。但由于很多功能与w o r d 和m a t h t y p e 相比 很不直观,如不能很方便地输入分情况的左括号等,而且界面显得不美观, 普通用户不易接受。 m a t h m l 3 l 3 3 】是w 3 c 针对w e b 制定的数学公式标准,它支持在网页上显示 各类复杂的数学公式。随着m a t h m l 的不断完善,基于m a t h m l 的数学公式编 辑器将在w e b 上得到广泛的应用。其中包括w 3 c 组织的a m a y a ,它直接支持 数学公式的输入和显示,但无法和现在通用的浏览器集成;t e c h e x p l o r e r , 它不仅支持m a t h m l 的显示,还支持l a t e x 的显示。按照m a t h m l 编辑的数学 公式,在m o z i l l a 、f i r e f o x 、n a v i s a t o r 浏览器的最新版本上均可直接浏览, 在i e 浏览器中也只需安装m a t h p l a y e r 、t e e h e x p l o r e r 等特定的数学解析插 件来支持m a t h m l 的显示。我们既可以直接在h t m l 语言中嵌入符合其语法的 文本去实现数学公式,也可以通过第三方可视化编辑软件获得m a t h m l 代码, 然后再嵌入到h t m l 中去。目前广泛使用的公式编辑器有美国d e s i g n s c i e n c e 公司的w e b e q 和i b m 的i n t e g r em a t h m le q u a t i o ne d i t o r z e d 。 w e b e q 是一个基于m a t h m l 标准的j a v a 程序,能够支持浏览基于m a t h m l 的数 学公式,在其高级版本中还提供i n p u t c o n t r o l 插件,完全支持在网络上以“所 见即所得”的方式在线编辑数学公式。i n p u t c o n t r o l 插件可以集成在b b s 论 坛或聊天室等网络交互场所中。w e b e q 的缺点在于采用基于m a t h m l 的网络数 学公式编辑器的研究j a v a a p p l e t 技术实现公式显示的方式使得浏览器在显 示公式时会首先装载j a v a a p p l e t ,这样在一定程度上影响页面的显示速度。 根据对上述这些公式编辑器的特点可以看出,它们更不适合于证明题和 计算题的批改和识别,因此,基于识别的公式编辑器的研究还不成熟,对于 作业手段的改革的研究具有重要的意义。 西南交通大学硕士研究生学位论文第5 页 1 1 3 研究意义 研究基于识别的公式编辑器主要有以下几点意义: 第一,本公式编辑器不仅能够像w o r d 和m a t h t y p e 的公式编辑器显示、 排版和印刷的需求,而且能使公式编辑器输入的数学表达式参与公式的识别, 促进数学表达式的比较识别技术的发展。 第二,本公式编辑器的实现,是智能型远程作业系统的一个重要的技术 支撑,使作业系统不但能够对选择题、判断题进行自动批改,而且能够对计 算题自动进行识别和批改,从而使相关课程作业手段的改革真正成为了现实。 1 2 公式编辑器的设计要求 为了满足作业系统的技术要求,公式编辑器应该具备一下功能: ( 1 ) 教师和学生用户可以使用该公式编辑器非常便捷的输入作业中所需 要的数学表达式。 ( 2 ) 教师和学生用户可以使用该公式编辑器对已经输入的数学表达式进 行修改和编辑。 ( 3 ) 该公式编辑器必须按照规范的排版格式在屏幕上显示所输入的数学 表达式,输入和显示必须同步进行,达到“所见即所得”的效果。 ( 4 ) 对公式编辑器中传出的数学表达式的内容进行语义理解和关系重 构,为数学表达式的识别和批改打下基础。 ( 5 ) 将输入的数学表达式按照所设计的数据格式保存并输出。 ( 6 ) 以控件的方式来设计公式编辑器模块,以便于在学生系统和工具系 统中调用。 1 3 本文主要工作和章节的主要介绍 1 3 1 本文主要工作 本文主要完成了基于识别的公式编辑器的设计与开发。主要工作主要包 括以下几个方面: 首先,数据结构以及特殊结构的处理策略,再者,具体完成公式编辑器 的开发,完成公式编辑器的显示、排版和打印功能,最后,根据识别的需要 西南交通大学硕士研究生学位论文第6 页 对从公式编辑器传出的数学表达式进行特殊的处理来完成计算机识别的需 要。其实现过程都是利用d e l p h i 语言进行实现的。 ( 1 ) 本文对数学表达式的内容、形式和结构特点进行了分析和研究,提 出了基于识别的数学表达式的数据描述方法,在此基础上设计了两种数据格 式,一种是存储在内存中的数据格式,用于系统的输入和分析过程;另一种 是存储在数据库中的数据格式,用于保存已输入的数学表达式。 ( 2 ) 按照所定义的公式编辑器的功能需求,利用d e l p h i6 0 对公式编 辑器进行了设计与开发。包括: 系统对键盘和鼠标等外部设备的相应, 普通字符的键盘输入和编辑, 特殊字符( 含希腊字母) 的菜单输入和编辑, 特殊结构的创建和输入, 输入光标的切换和移动等, 数学表达式内容和格式信息进行保存和输出。 ( 3 ) 数学表达式的语义理解和关系重构。首先分析了数学表达式语义理 解的必要性;其次根据特殊结构的边界特征进行分类,将特殊结构分为了双 边界、左边界和右边界三种结构;然后根据数学规范和默认约定,提出了处 理左边界和有边界结构加法原则和乘法原则等关系重构算法;最后对数学表 达式关系重构程序进行了开发。 1 3 2 各章节论述方式简介 本文共分为五章: 第一章:介绍公式编辑器的研究背景和意义,以及设计该公式编辑器的 现实意义。 第二章:分析公式编辑的数学表达式的特点,根据特点进行定义其数据 结构,一个是内存中的数据结构形式,另一个是数据库中的结构形式。以及 介绍公式编辑器中的特殊结构的处理。 第三章:公式编辑器对外设的响应。设计的公式编辑器的操作主要是对 键盘、鼠标和显示器这三种外设的响应的过程。通过键盘的操作可以输入数 学表达式所需的普通字符;通过鼠标的操作可以输入结构模板和希腊字符; 最后把这两种操作组成的数学表达式通过显示器显示给用户。 第四章:位置的确定与计算。利用本公式编辑器输入和编辑的数学表达 西南交通大学硕士研究生学位论文第7 页 式,在排版和规范的显示上要满足用户的需求,字符之间或字符与结构模板 之间距离不能太大也不能太小,否则都不能是一个完整的数学表达式,文中 也给出两种情况的后果,它们之间的距离要通过计算得到的。 第五章:数学表达式的语义理解:把数学表达式根据边界结构分成三种 结构,根据各个结构的不同特点采用不同的法则,消除数学表达式在理解上 的二义性,完成识别前的预处理。 最后总结本论文,并且提出展望。 1 4 本章小结 本章主要介绍本文研究背景、意义及国内外研究情况。通过对公式编辑 器的设计的国内外文献的查阅可知,目前的作业和考试批改软件只能对选择 题、判断题等题目进行自动批改,还不能对计算题和证明题进行自动批改。 而计算题和证明题的自动批改对减轻教师作业批改工作量、提高教学质量等 都有重要意义,因而设计一个与之相匹配的公式编辑器具有现实的意义。 西南交通大学硕士研究生学位论文第8 页 第2 章数学表达式的数据描述 公式编辑器是输入和编辑数学表达式的窗口,设计一个具有良好用户界 面、使用方便快捷的公式编辑器对于作业系统而言是相当重要的。在设计公 式编辑器时,需要了解公式编辑器数据的特征和数据结榭洲,只有把它们搞 清楚,才有可能完成公式编辑器完备的需求分析。 2 1 数学表达式的特征 公式编辑器输入和编辑的数学表达式不同于普通的文本,除了内容之外, 还携带有大量的格式信息,具体而言有以下几个方面特征【3 5 3 7 】: 2 1 1 数学表达式的符号特征 数学表达式中所使用的符号共分为两大类: ( 1 ) 单字节字符 这类字符主要包括英文字母的大小写、阿拉伯数字、各种数学运算符号 和关系符号等等。这些字符在计算机内存中只占有一个字节,并且可以从键 盘上输入。 ( 2 ) 双字节字符 包含所有的希腊字母、汉字,以及一些特殊的运算符号和关系符号,例 如、上和等。这些字符在计算机内存中占有两个字节,可以从键盘 上输入汉字,也可以从公式编辑器菜单中选择。 2 1 2 数学表达式的字型特征 数学表达式的字型特征是指数学表达式中字符的字体、字号和颜色等方 面的信息。 ( 1 ) 数学表达式中字符的字体 数学表达式中的字体主要指正体和斜体两种不同的字型特征。在规范的 数学表达式的排版格式中,数字、汉字、运算符、函数名、数学运算方法、 关系符、和度量单位等信息均采用正体来显示,例如,1 2 0 m m 2 ,s i n 3 0 。、 2 x a b c 和出等,其中衄是长度单位“毫米9 1 1 9s i n 是正弦函数名,表示 三角形,出中的d 表示对变量x 微分运算。在数学表达式中斜体主要用来表 西南交通大学硕士研究生学位论文第9 页 示变量,例如上面a x a b c 中的么、曰和c 分别表示三角形的三个顶点,出中 的z 表示一个变量。 ( 2 ) 数学表达式的字号 数学表达式中常常通过字号大小的变化来表达不同的数学含义。例如, 数学表达式砰,其中变量,与下标刀和指数2 不仅输入位置不同,而且字 号大小也不一样,变量刀和常量2 的字号比变量f 字体的字号小。类似的现 象还出现在根式的根指数与被开方式、积分的上下限与被积表达式等之间。 当数学表达式中的运算关系出现嵌套的时候,字符的字号也会出现变化, 例如普通分数分子和分母的字号都应该采用正常的大字号,但是如果分数出 现在上下标中,那么分子和分母的字号都要下调一级。 同种运算关系自行嵌套的时候,有的需要调整字号来加以区分,例如上 下标中嵌套有上下标,那么第二级上下标应该比第一级上下标再调小一级; 当然也有的则不需要调整字号的大小,例如分子或分母上嵌套有分数时所有 的字符一般都采用相同的字号。 ( 3 ) 数学表达式的颜色 按照规范的排版格式,在数学表达式中变量字母显示为斜体,度量单位 中的字母显示为正体,例如l = 2 0 m 。在作业系统中,变量字母和度量单位中 的字母的处理方法是不同的,变量字母之间可以具有数学运算关系,而度量 单位中的字母可以含有单位的换算关系,为了让学生用户和教师在输入数学 表达时对变量字母和度量单位中的字母有更为清晰的判断,本公式编辑器将 度量单位中的字母显示为蓝色,使其与普通变量之间有更为明确的区分。 2 1 3 数学表达式中字符之间的合成特征 一个字符可以表达一个数学含义,但是有时一个数学含义需要多个字符 的合成来共同表达一个数学含义,例如c 、0 、s 是三个字符连在一起来表示 数学表达式中余弦函数名。数学符号是否可以合成以及合成的方式主要取决 于以下的因素: ( 1 ) 数学符号是合成符合还是简单符号,所谓简单符号就是一个普通的 字符就能表达一个数学含义,例如一个普通的变量和单个数字等等。所谓合 成符号必须和其它符号一起合成一个数学表达式共同表达一个数学思想的具 体的含义,例如比较运算符中 ,只有这个运算符号不能表达一个数学思想, 西南交通大学硕士研究生学位论文第1o 页 而a b 这样就能明确表达一个数学思想,说明变量a 比变量b 大。 ( 2 ) 符号间的位置关系和字体大小。例如数字2 和6 ,都可以单独表示 一个整数,但是它们连在一起时,根据位置关系和字体大致可以有以下几种 情况: 2 6 6 2 2 6 6 2 其中两个数字的位置不同,但字体大小一致,所以表示一个常数。而 是两个数字的位置不同,字体大小也不相同,固表示的不一样的计算。 ( 3 ) 英文字母相邻时要考虑它们是否能合成某个数学函数,例如三角函数、 对数、双曲函数等等。 ( 4 ) 度量单位。例如a i m 代表度量单位中的毫米,而不是两个变量的乘 积。 合成的数学表达式确定对于数学表达式的识别起到关键的作用,例如, 如果把相邻的三个变量c ,o ,s 没有处理成三角函数,而是普通的变量,对 于整个识别的结果肯定是错误的,所以处理好数学符号的合成问题是至关重 要的。 2 1 。4 数学表达式中的黑体字符 很多学科都用黑体字符表示向量, 编辑器必须提供黑体变量的输入方法, 例如速度v 和加速度a 等,因此公式 而其它的字符一般都用普通的字体。 2 1 5 数学表达式的位置特征 通过字符内容的位置编排表示特殊的数学思想【3 8 1 。就数学表达式的排列 方式而言,它主要分为水平排列和异型排列两种方式。 ( 1 ) 水平排列方式 水平排列方式是指输出定位点的y 坐标不发生变化、而沿水平方 向输入的排列方式。例如,数学表达式a + 2 a + l 的输出定位点的y 坐标 在输出时不发生变化,只是沿着x 坐标发生变化。 ( 2 ) 异型排列方式 异型排列方式主要是指输出字符定位点的y 坐标与x 坐标都发生变 ,2 化的排列方式。例如,数学表达式的排列方式就属于异型排列方式, 西南交通大学硕士研究生学位论文第11 页 整体上是个分式,分子口:与分母b 输出字符定位点的y 坐标是不同的, 同时指数2 和下标x 输出字符定位点的y 坐标也是不同的。 其实异型排列方式又可以看成是由若干个在不同y 坐标上输出的水平排 ar d 仅+ 1 ) 出 列方式组成的,例如数学表达式虹二一可以看成由四个不同y 坐标上 工+ 6 输出的水平排列方式组成的,其中么和积分中的被积表达式( 计1 ) 出输出定位 点的y 坐标是相同的,上限一d 输出定位点的y 坐标是相同的,下限a + b 输 出定位点的y 坐标是相同的,分母什6 输出定位点的y 坐标是相同的,而这 四个y 坐标又互不相同。 数学表达式在显示是用图形的方式来表示,类似于树的结构,有时也成 为数学表达式的显示树结构,例如数学表达式口b c - i - 旦兰兰! ,它的显示树形 3 结构图,如图2 1 所示: 田 口口口口口口 口口口口e 三三三三三刍 口 图2 - 1 数学表达式显示结构图 通过这种图形的方式更能清楚的表达其数学表达式在编辑窗口中的排列 方式,以及每个字符每个结构的对齐方式都很清晰。 2 1 6 数学表达式的图形特征 数学表达式含有图形的部分,例如分数通过分数线将分子和分母区隔开 来,开方运算用根号将被开方式根指数区隔开来,代值用竖线、范数用双竖 线与前后的内容区隔开来,矩阵和行列式等等也都包含了图形的部分。因此 西南交通大学硕士研究生学位论文第12 页 公式编辑器中除了要显示字符之外,还必须绘制图形,这些图形的位置、长 短和大小随着输入内容的变化而变化。 2 2 数学表达式中的特殊结构模板 特殊结构在数学表达式中是一个非常重要的部分【3 9 1 ,主要用来采纳和表 达一些特殊的关联信息,也是遵循面向对象的思想原则,把常用的数学表达 式的形式做成特殊的结构模板,供用户方便快捷的使用,这也在计算机的自 动识别中起到举足轻重的作用。特殊结构模板一共分为以下几类: 一般特殊结构模板:包括分式、根式等等。 积分结构模板:包括单重积分、双重积分等等。 集合结构模板:包括极限和求和等。 导数结构模板:包括各种结构模板。 复杂结构模板:包括分段函数、矩阵、行列式。 向量结构模板:包括箭头向量和黑体向量等等。 特殊结构模板处理中主要分为两类,一类用来表示异型排列方式,另一 类用来表达特殊的数理逻辑关系。 2 2 1 特殊结构表达异型排列方式 异型排列方式主要是指输出字符定位点的y 坐标与x 坐标都发生变化的 排列方式。但是特殊结构中的异性排列方式又有以下两个显著的特点 ( 1 ) 不同异型排列方式 在不同异型排列方式中,经过归纳又可细分为以下几种情况: 子参数的个数不同,子参数位置不同 像分式和单重积分这两种特殊结构模板,两者的参数的个数是不同的, 分式有分子和分母两个参数,而单重积分有上限、下限和被积表达式三个参 数,再者各个参数的y 坐标也是不同的,分式中的分子和分母与单重积分中 的上限、下限和被积表达式的y 坐标互不相同。 子参数个数相同,子参数位置不同 像分式和根式这两种特殊结构模板,分式有分子和分母两个参数,根式 有被开方数和次幂两个参数,虽然都具有相同的参数,但是每个参数的位置 却不相同,因而所属参数的y 坐标也是不同的。 西南交通大学硕士研究生学位论文第13 页 ( 2 ) 相同异型排列方式 所谓相同异型排列方式是指特殊结构中不但子参数的个数相同,而且子 参数的位置也是相同的。例如,特殊结构中单撇导数、双撇导数、三撇导数, 它们之间不论在参数的个数和参数的y 坐标是相同的,所以在处理它们时候 作为同一类来处理即可。 通过上面对异型特殊结构的分析可知,在对特殊结构表达异型排列方式 上,应该两手准备,一方面把不同的异型排列方式分开单独处理,另一方面 把相同的异型排列方式放在一块处理。 2 2 2 特殊结构表达特殊的数理逻辑关系 在数学表达式中含有很多特殊的数理逻辑关烈4 们,利用公式编辑器进行 输入和排版时必须对其进行特殊的处理,以避免产生二义性。 一些数学表达式中,字符的顺序并不影响其数学表达式在计算机自动识 别的正确性,但是有些数学表达式中的字符的顺序必须是确定的,不能改变 的。例如a x a b c 与a a c b 或a b c a 都是等效的,其中彳、b 、c 三个顶点字 母的输入顺序不影响其结果的正确性。z a b c 还可以写成z c b a ,但是写成 l c a b 或_ b a c 肯定是错误的。常用的一介导数可以用y 7 来表示,也可以用 多表示,还可以用y ( 1 表示,为简化识别程序的设计,在识别前,系统自动将 它们统一转化成y ( 1 ) 。上述的这些具体的例子都是数学表达式中需要处理的 数理逻辑关系。 2 。3 数学表达式的数据存储结构 以上介绍了数学表达式的特征和特殊结构模板的作用的功能,显而易见, 每个数学表达式包含了大量的信息,这些信息除了数字、变量符号、运算符 号和关系符号等数学表达式的内容之外,还包括了大量的格式信息,如字体、 字号、颜色和图形属性等等,如果数学表达式的这些信息都单独保存的话就 需要大量的属性参数,耗费大量存储空间。本公式编辑器采用特殊的数据结 构来代替属性参数,一方面保证了公式信息的规范化和一致化,同时节省了 存储空间和分析运算的时间。根据本公式编辑器在作业系统中的应用需求, 数据结构共分为两种:一种是内存中的数据结构( 公式编辑窗口、学生编辑 窗口、教师编辑窗口中的数学表达式) ,另一种是保存在数据库中的数据结构。 西南交通大学硕士研究生学位论文第1 4 页 2 3 1 内存中的数据结构描述 内存中的数学表达式之间是采用双向链表的结构进行存储的,结构表示 如下: f o m u s t r u c = r e c o r d p r i s t r u c :p f o m u s t r u c ; 前一个结构 n e x t s t r u c :p f o m u s t r u c ;n 后一个结构 s p o i n t :t p o i n t ; 起点坐标 e p o i n t :t p o i m ; 结束点坐标 p a r e n t s t m :p f o m u s t r u c ; 父结构 s u b s t r u :p f o m u s t r u c ; 子结构 f o n t s i z e :i n t e g e r ; 字体大小 c h i l d t y p e :b e l o t y p e ; 子节点类型 s h x b c l a s s :s t r u c l a s s t y p e ;各种结构类型 f m s t r u t y p 各种结构的描述 简单说明每个部分的具体含义 p r i s
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 幼儿园游戏课程
- 服装简笔画课件
- 贵州省毕节市梁才学校2025届下学期高三生物试题第三次调研考试试卷含解析
- 江西农业工程职业学院《数据分析》2023-2024学年第一学期期末试卷
- 江西服装学院《弹性力学与有限元分析》2023-2024学年第二学期期末试卷
- 湖南铁路科技职业技术学院《应用统计学与软件操作》2023-2024学年第二学期期末试卷
- 湖北省罗田一中2025年高三高考物理试题系列模拟卷(3)含解析
- 上海市崇明县2024-2025学年高三5月模拟(三模)英语试题文试题含解析
- PICC皮肤过敏个案护理
- 人教PEP版英语五年级下册教学课件Unit 5 Part A 第一课时
- 食品原料学学习通超星期末考试答案章节答案2024年
- 预算绩效评价管理机构入围投标文件(技术方案)
- 睾丸扭转术后护理查房
- 守望(2022年湖北十堰中考语文试卷记叙文阅读题及答案)
- GB 30254-2024高压三相笼型异步电动机能效限定值及能效等级
- 2024至2030年中国紫外光吸收剂行业市场发展现状及潜力分析研究报告
- 重大事故隐患判定标准与相关事故案例培训课件
- 健身房财务管理概述
- (正式版)CB∕T 4548-2024 船舶行业企业相关方安全管理要求
- 拖欠租金起诉状模板范文
- 品管圈(QCC)降低ICU护士床头交接班缺陷率
评论
0/150
提交评论