




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、硕士学位论文数学公式语音规范MathAL及其与MathML智能化转换研究中文摘要随着社会经济的迅猛发展,信息无障碍研究也越来越受到关注。自2000年 八国首脑会议的举行,信息无障碍概念首次在国际上被提出。随着2004年国内 “首届信息无障碍论坛”成功举办,信息无障碍的宣传进入了新的阶段,如何让 残障人士平等得获取网络信息成为了社会研究的主要课题。21世纪是一个教育信息化的时代,网络教学也逐渐深入到这些特殊人群的 教育中,尤其是针对于视障人士如何更好、更方便的学习,国内外相关组织也展 开了一些研究。然而数学公式本身具有复杂、灵活、多变的特点,在学习数学的 过程中,视障人士变得异常困难。传统的触摸
2、盲文点阵形式教材,在一定程度上 并不能满足这些人群更好得学习数学的目的,因此采用由语音技术和Web数学相 结合而形成数学公式语音的方式进行学习,是很有必要,且具有实用性的。数学公式语音是基于语音技术和Web数学这两种研究的。近年来,以XML 为标准的数学置标语言MathML在Web数学公式的显示、编辑的研究工作上取得 了不错的进展,是本文研究Web数学公式与语音技术结合的基础。提到数学公式 的语音,最终的结果希望通过语音软件能够正确得读出数学公式。但国内数学以 及语音技术领域中,数学公式的语音读法规范还处于空白。因此,在本文中,通过对数学公式汉语语音读法规律、特征及如何消除歧义 等问题展开研究
3、,来制定一种无歧义且通用性较强的数学公式语音规范MathAL (Mathematical Audio Language)0在本文制定MathAL,提出了三种读法规则, 分别为傻瓜式读法、智能式读法和半智能式读法,对三种读法分别进行论述和分 析,并在此基础上进行了用户使用规范测试,最后在傻瓜式读法规范下,实现数 学公式MathML Presentation到语音文本TTS的转换。关键字:MathML, MathAL, TTSTHE RESEARCH OF MathAL ANDINTELLIGENT CONVERSION FROM MathMLAbstractWith the rapid deve
4、lopment of social economy, information accessibility study also received more and more attention. Since the summit held in 2000, the concept of information accessibility is put forward for the first time. With the 2004 domestic The first barrier-free information forum held successfully, accessible i
5、nformation publicity moved into a new stage, how to let people with disabilities have equal access web information has become the main issue of social studies.21 century is an era of education information, network teaching also gradually get into these special crowd education, especially for people
6、with visual how to better and more convenient learning, the domestic and foreign relevant organization also launched some research. However because of the mathematical formula with complex, flexible, and itself changeable characteristics, in the process of learning mathematics, their study become mo
7、re difficult. To some extent the traditional touch braille textbooks dot matrix form cant meet these people to better learning mathematics, so it is very necessary to the combine Web mathematics with speech technology.The mathematical formula speech is based on both the speech technology and Web mat
8、hematics. In recent years, as the display, editor of the research of mathematical markup language based on XML standard in Web mathematicai formula has made the good progress, this paper is to study the mathematical formula and voice Web technology in combination with foundation. The mathematical fo
9、rmula speech, the final results is that through voice software can correctly to read out the mathematical formula. But in domestic mathematics and voice technology areas, the mathematical formula voice pronunciation standard is still in the blank.Therefore, in this paper, through the research of Mat
10、hematical formula Chinese phonetic pronunciation rules, characteristics and how to eliminate the ambiguity, to constitute an unambiguous and widely used Mathematical formulas speech standard MathAL (Mathematical Audio Language). For MathAL formulated, this paper puts forward three pronunciation rule
11、s, respectively, MathALs, MathAL,and MathALB.The three pronunciations are described and analyzed, and based on the user use standard test,and the last based on MathALs,realize the conversion from mathematical formula MathML Presentation to speech text TTS.Key words: MathML, MathAL, TTS TOC o 1-5 h z
12、 中文摘要I HYPERLINK l bookmark33 o Current Document h AbstractII目 录3 HYPERLINK l bookmark49 o Current Document h 第一章绪论1 HYPERLINK l bookmark52 o Current Document h 1.1课题的研究背景1L 1. 1信息无障碍11.1.2信息无障碍技术发展现状 1 HYPERLINK l bookmark55 o Current Document h 1.2国内外研究现状2 HYPERLINK l bookmark58 o Current Document
13、 h 1.3研究内容及意义4 HYPERLINK l bookmark66 o Current Document h 1.4论文框架5 HYPERLINK l bookmark69 o Current Document h 第二章知识背景介绍6 HYPERLINK l bookmark72 o Current Document h 1数学公式与计算机表达6 HYPERLINK l bookmark83 o Current Document h 2 TTS 技术8 HYPERLINK l bookmark89 o Current Document h 3数学公式表示复杂度的计算9 HYPERLI
14、NK l bookmark92 o Current Document h 2.4 XSI 11 HYPERLINK l bookmark95 o Current Document h 第三章总体介绍13 HYPERLINK l bookmark98 o Current Document h 1概述131. 1 规范131.2 转换14 HYPERLINK l bookmark101 o Current Document h 3.2数学公式读法歧义性的存在和产生原因16 HYPERLINK l bookmark130 o Current Document h 3.3数学符号193. 3.1数学符
15、号的分类193. 3. 2数学符号之间的关系203. 3.3本文研究符号范围20 HYPERLINK l bookmark137 o Current Document h 3.4数学运算符的优先级23 HYPERLINK l bookmark141 o Current Document h 第四章 傻瓜式读法MathAI?25 HYPERLINK l bookmark144 o Current Document h 1傻瓜式读法规则26 HYPERLINK l bookmark147 o Current Document h 4.2傻瓜式读法规则实验测试364.2. 1 实验一364.2.2
16、实验二37 HYPERLINK l bookmark153 o Current Document h 第五章 智能式读法MathALz和半智能式读法MathALB40 HYPERLINK l bookmark156 o Current Document h 1智能式读法405.1.1智能式读法规则40 HYPERLINK l bookmark159 o Current Document h 5.2半智能式读法432. 1半智能式读法原理445.2.2半智能式读法规则47 HYPERLINK l bookmark167 o Current Document h 第六章 数学公式MathML到语音
17、文本的转化49 HYPERLINK l bookmark170 o Current Document h i MathML 简介491. 1 MathML的基本构成 496. 1.2 Presentation MathML 50 HYPERLINK l bookmark179 o Current Document h 6.2堪于傻瓜式读法MathALs的转换研究516. 2. 1 Presentation MathML 与 TTS 文本的映射关系516.2.2转换思路54 HYPERLINK l bookmark191 o Current Document h 第七章结论和进一步工作57 HY
18、PERLINK l bookmark194 o Current Document h 1论文总结57 HYPERLINK l bookmark197 o Current Document h 2进一步工作57 HYPERLINK l bookmark200 o Current Document h 参考文献58附录60 HYPERLINK l bookmark229 o Current Document h 在学期间的研究成果63致谢 64第一章绪论1.1课题的研究背景1.L1信息无障碍近年来,随着社会的经济、科技水平的飞速发展,人类社会步入了信息化时 代。在日常生活当中,计算机和因特网已经深
19、入到人们的生活、工作、学习当中。 依托于网络构建的信息共享和服务,为人们的信息交流和传播带来了极大的便利。 然而对于那些特殊的人群,如存在肢体障碍、视力障碍、听力障碍等的人群,并 不能和正常人一样获取或者共享网络资源。这样如何保证弱势群体机会均等的获 取信息是社会各界都应该给与关注的。2000年,在八国首脑会议上,各国首脑异口同声就数字鸿沟问题引出了信 息无障碍的概念,其理念就是强调网络信息时代中信息无障碍与社会设施无障碍 对于弱势群体具有同等重要的意义川。尤其要关注的是老年人和残障人士对信息 无障碍的需求。自2004年,由中国残疾人联合会、中国互联网协会和中国残疾 人福利基金会共同举办的“首
20、届信息无障碍论坛以来,信息无障碍就逐步发展 起来。在对信息无障碍宣传过程中,有学者就曾提出了“信息无障碍是残障人士 贫困人口等弱势群体的基本发展权”的观点,这也表现了信息无障碍的宗旨是 实现人人信息平等,以此保证不同的人群在不同的条件下都能无障碍地获得信息, 从而有机会进行交流。那么对于残障人士这样一个群体,是社会所不容忽视的, 因而应该更加关注、关爱这些弱势群体。信息无障碍是保障残障人士共享信息文明的重要手段,是消除数字鸿沟,实 现信息共享的重要工程。“十一五”国家科技支撑计划重点项目“中国残疾人信 息无障碍关键技术支撑体系及示范应用”依据国家中长期科学和技术发展规划 纲要(2006-202
21、0年)和中国残疾人事业“十一五”发展纲要的任务要求设 置,经费预算达1.5亿元,此外中国残疾人联合会在残疾人康复领域“十二五” 科技战略研究报告中也已将残疾人信息无障碍作为其重要内容。1.1.2信息无障碍技术发展现状近年来,我国对于残疾人的无障碍关怀在设施无障碍方面取得了重大进展, 但在信息无障碍领域与发达国家相比差距较大。政府己意识到信息无障碍的重要 性和必要性。中国残联信息中心将部署信息无障碍技术,打造中国残联及33个 省级残联机构的网站成为网络信息无障碍的窗口。目前,在国内信息无障碍理念的实践有三种形式,第一种是信息无障碍行业 标准的制定,第二种是信息无障碍技术的开发,第三种是信息无障碍
22、产品的研发 囹。信息无障碍是人类文明进步的体现,而标准化则可以推进全社会信息无障碍 环境的不断完善,是解决目前信息无障碍问题的首要环节。标准化不但是信息无 障碍立法的技术基础,而且还可以指导信息无障碍产品的自行研发和设计。另外, 标准比可以解决网络和业务互联问题,并协调终端与使用者的相互关系。这对于 统一信息渠道,完善信息获取手段方面都起到了巨大作用,使得在硬件方面产生 的信息鸿沟可以得到弥补。有关信息无障碍的技术主要有涉及视觉、听觉、认知、肢体、混合和通用这 几种辅助技术问。主要的信息无障碍产品有:屏幕放大器、屏幕阅读器以及盲人 专用输入输出装置。屏幕放大器是一种放大屏幕显示内容的软件,这种
23、软件主要 适用于弱视人群,该软件的功能是可以部分或全部的(可以选择放大倍数)放大屏 幕,以便弱视人阅读网页。屏幕阅读器,又称读屏装置,这一软件的功能是将屏 幕显示的内容用语音读出来,以便用户通过声音了解网页内容,这种软件主要适 用于盲人和弱视人群,也适用于正常人。具有代表性的屏幕阅读器,有Freedom Scientific 公司研制的 JAWS forWindows 以及 GW Micro 公司研制的 Windows Eyes和Alva Access Group公司研制的OutSPOKEN也都具有良好的读屏功能。 盲人专用输入输出装置是专门为盲人设计的方便盲人使用的装置,如盲人键盘, 这种键
24、盘带有盲文,盲人使用的时候可以清楚地知道所触摸的按键的内容。1.2国内外研究现状在信息化时代,信息无障碍的研究受到了越来越多的关注,构建信息无障碍 的社会环境是残障人士共享信息文明的重要手段,对于视障者来说,语音技术是 实现信息无障碍的重要途径。数学,作为自然科学的基础,数学信息广泛存在于 各种文献资料中,在科学研究中起着非常重要的作用,同时在日常生活中也离不 开数学。可是对于视障者来说,由于数学公式的结构具有特殊性、灵活性以及复 杂性等特点,使得他们学习数学十分困难。在日常的数学学习中,视障者采取传 统的触摸方式收效并不佳,而通过计算机来获取数学信息也更加困难,因此针对 盲人数学开展语音可访
25、问性的研究非常必要。数学公式语音是语音技术与Web数学交叉研究的领域。目前的语音技术基本 上都是基于文本的,而对以二维存储的数学公式无法进行语音合成。用听觉来学 习是视障者学习数学的主要手段。近年来,基于Web的数学研究成为计算机数学 领域研究的热点。MathML的制定以及应用,使得Web数学的研究有了可靠的研 究基础,在其基础上开展了数学公式的显示、编辑等一系列研究;MathML是以 X.ML来描述数学公式的。MathML的出现使得数学公式语音成为可能。在数学公式语音方面,Design Science公司研发的MathPlayer软件,是支持 IE浏览器的一个免费的插件,用来显示网页上的Ma
26、thML格式的数学公式,可 以动态的显示网页中数学公式的字体属性,如字体大小、字体颜色等。在显示数 学公式的基础上还增加了公式英语发音功能;MathPlayer支持的数学公式源语音 是MathML Presentation格式,支持语音生成功能,可以无缝得和辅助性产品相 结合,如 JAWS, Window-Eyes, and Read&Write 7 等圆。Metroplex Voice Computing公司研发的数学语音识别软件MathTalk /Scientific Notebook (MT/SN),可以识别英语的数学公式语音;它的研究最初 想法是如何向盲人表达数学代数的内容,它表达的数
27、学公式是LaTeX格式9。1994年由T.V. Raman研发的ASTER软件,用于阅读LaTeX格式的数序 公式,它不是一个屏幕阅读器,而是一个文档预览,输出的是音频。ASTER能准 确得显示文档结构,比如数学公式被看成树形结构,获取数学公式节点的过程是 从父节点到孩子节点,从一个兄弟节点到另-个兄弟节点。不同于MathTalk的 是,ASTER旨在应用于教育领域最顶端而不是只是在学校供学生使用3】。加州大学Berkeley分校在数学公式语音上也开展了相关的理论研究,它是 基于英语的数学公式的读法,对数学公式的英文读法做了详细阐述E】。除上述研究的项目和成果外,还有一些机构、团体对数学公式语
28、音作了深入 的研究,并取得了一定的成果,如MathSpeak四、MathGenie13k TechRead【风、 TalkMaths回、LAMBDA1161. AudioMath17L 如表 1-1 所示:表1-1数学公式与数学语音的相互转换研究项H或成果数学表达式源语言机构或人物MathSpeakMathMLAbraham NemethMathGenieMathMLArthur KarshmerTechReadLaTeX to Braille or speechFitzpatrickTalkMathsExport to Latex or MathMLKingston University续表
29、1-1数学公式与数学语音的相互转换研究项目或成果数学表达式源语言机构或人物LAMBDAContent MathMLEuropean UnionAudioMathMathML葡蜀牙波尔图大学总体来说这些研究项目均处于探索实验阶段,并没有形成成熟的理论。因此 这些数学公式语音的研究并不完善,比如存在着读法歧义、读法过于机械不符合 日常习惯等问题。同时,这些研究目前针对的只是数学公式的英文读法。由于不 同语言对数学公式的读法是不同的,数学公式的外文读法与中文读法存在很大的 差别,所以目前尚未发现针对数学公式的汉语读法的研究。因此展开对数学公式 汉语语言规范的研究是有必要的。在我国,盲人信息无障碍的研
30、究已经取得的一定的研究成果,出现了一些读 屏软件、盲人计算机系统、盲人打印机等。但是这些研究主要针对计算机中的文 本信息进行处理,数学公式是二维的结构化信息,具有数学领域特殊的结构,这 些文本读音的研究成果无法直接应用于数学公式及符号的处理。在数学信息盲人 可访问方法方面,尚未读到相关学术文献,也尚未发现开展相关研究。1.3研究内容及意义本文研究的主要内容如下:首先将通过对数学公式传统读法规律、特征及如何消除歧义等问题展开研究, 提出并起草一个通用的数学公式汉语语音规范MathAL (Mathematical Audio Language),以此来规定数学符号、数学公式及相关的数学内容的规范读
31、法;本 文还将通过在盲人和明眼人中进行实验检测该规范的合理性和实用性,并对规范 改进与完善。其次,本文在规范基础上将完成从数学公式MathML Presentation形式向语 音文本TTS转换的工作。本文研究的主要意义如下:通用的数学公式汉语语音规范MathAL的产生将填补国内数学公式语音 规范研究的一个空白,为信息无障碍标准的制定提供一定的参考价值。数学公式语音可以应用于盲人的学习,减少盲人和视力正常人的沟通障 碍。对盲人数学教育有很大的帮助和促进作用,盲人借助语音可以更好的学习数 学。3)为信息无障碍技术产品的开发,尤其是数学教学系列产品的出现提供一 定的理论技术基础。4)数学公式语音研
32、究能使基于文本的语音软件功能更完善,可以大大提高 语音在科学合作交流上的作用以及效果,提高交流的效率和质量。5)有利于推进网络数学教学向前发展,实现网络中数学信息共享和交流, 促进教育信息化。1.4论文框架本文采用的研究思路为“提出问题分析问题解决问题”,本文首先 对信息无障碍理念进行概述,引出本文的制定数学公式汉语语言读法MathAL的 必要性和重要性;接下来,阐述如何制定规范所存在,然后逐步展开研究;最后 提出三种读法方案,并依次进行说明,并完成数学公式代码到语音文本的转换工 作。本文的结构共分为六章,具体研究内容如下:第一章, 绪论部分,主要介绍课题研究的背景、国内外研究现状、研究内 容
33、以及意义,并简要介绍本文的研究思路。第二章,背景知识,这一章简述了数学公式在网络中的几种主要的表达方 式,有关数学符号的分类和相互之间的联系。同时分析了数学公式读法存在歧义 性的原因,并在解决问题之前提出了数学运算符优先级的概念。第三章,论文主体介绍,介绍了论文的主体思想,论文研究的数学公式符号范围,并给出了数学运算符的优先级顺序。第四章,傻瓜式读法,这一章主要是提出一种最无歧义性但却最繁琐的读 法,即傻瓜式读法。并对这种读法的实验测试进行了相关的分析。第五章,具体讲了智能式读法和半智能式读法。智能式读法是基于停顿的 一种读法,它主要应用于明眼人在看到数学公式的同时使用,而半智能式读法是 基于
34、运算符优先级和数学公式表示复杂度算法的一种读法规范。第六章, 基于傻瓜式读法规范,完成MathML Presentation到语音文本 的TTS转换。第七章,论文结论和进一步工作。第二章知识背景介绍2.1数学公式与计算机表达数学是一门古老而充满生命力的学科。数学从早期研究数量、结构、空间以 及变化等概念,到现今致力于科学、工程、医学和经济学等领域,数学几乎是无 处不在,它的可用性和高价值特点无疑使得它成为一种推动社会发展的一门学科。 而在这门学科中,数学表达式的出现是与数学相伴而生。在网络技术迅猛发展的当下,如何在Web中更好地显示数学公式成为众多学 者研究的热点。目前Web中数学公式的显示方
35、式有如下儿种:1)图片显示至今Web中使用最多的还是以图片格式显示的数学公式。具体操作是事先使 用数学公式编辑器编辑所需要的数学公式并生成JPG或GIF格式的图片,然后在 HTML语言中使用img标签来在网页中嵌入数学公式的图片,从而实现在网页上 显示数学公式。使用这种方法显示来数学公式,具有操作简单易行的优点,但同时它也具有 不可修改性的缺点。也就是说新的数学公式要显示之前必须要重新编辑成图片方 能显示在网页,并且图片在显示过程中,数学公式过多导致文件变大的话,将影 响网络传输速度和网页的显示速度。2)插件显示Web中很多涉及数序公式显示或者编辑工作的网站都提供数学公式编辑的插 件,当用户需
36、要浏览该网站上的数学公式,就必须下载当前网站推荐的山网站专 门设计的插件,安装后才能进行数学公式的显示和编辑工作。显然,使用插件来显示数学公式,具有很大的局限性。首先不同的网站提供 的是本网站专有插件,不同的数学公式编辑插件语法结构都不太一样,或者或有 很大的区别,用户要使用它,必须学习并熟悉不同网站所提供的不同插件的语法 结构,使用特点等,方能较好得运用到数学公式的编辑、修改工作。而且,用户 在使用前,必须花费一定的时间来安装这些插件。3)PDF显示Adobe公司设计的PDF文件格式具有跨平台性,且支持多媒体集成的信息出 版和发布。在网络信息发布的支持上,集成度和安全可靠性都较高。所以利用
37、PDF文件在Web上表达数学公式也不失为一种好的方法。但是使用这种方法表达 数学公式的形式具有一下的缺点:PDF文档不能和Web环境很好的整合。在浏览PDF文档的时候,当前文 档占用了整个浏览器窗口,不能和其他的Web组件如HTML标记或图像整合。PDF显示的数学公式,不能进行复制粘贴,更不能编辑修改,极大得降 低了数学公式的可复用性。OpenMathOpenMath是显示数学公式的一个标准,它是基于XML的一种数学公式描述 语言。OpenMath在表达数学公式的时候,主要侧重于数学公式的语义表达,而 不是数学公式的视觉显示。OpenMalh作为这个标准,它允许计算机程序与数学 公式对象之间的
38、交互,将数学公式存入数据库中以及将数学公式在Web中发布。 它能实现学对象在不同的计算机软件系统之间进行交换,在不同的环境中使用剪 切粘贴功能,它还能用于数学公式的验证,但是OpenMath自身没有显示机制, 只能借助于别的格式或者其他软件来显示。LaTeX提起Latex,首先要介绍由著名的计算机科学家Donald E. Knuth开放的TeX 排版系统,TeX自身提供了一套功能强大的且十分灵活的排版语言。它被公认为 是最好的数学公式排版系统。在二十世纪八十年代初期,美国计算机学家Leslie Lamport在TeX排版系统的基础上,开发了 LaTeX格式。LaTeX是时下最流行和 使用最为广
39、泛的TEX宏集。但是复杂的命令导致掌握TeX/LaTeX是一个漫长而且 艰难的过程。MathMLMathML,即数学置标语言Mathematical Markup Language,是由国际联 标准组织W3C制定的一种基于XML标准的数学标记语言,用于书写数学符号和 公式的置标语言,它的出现是为了解决Web技术中应用数学表达式的问题, 为计算机之间的数学信息交换提供了基本标准。是目前最Internet上最重要的 数学公式描述标准,具有广泛的应用前景和发展空间。MathML的最早的规范草案公布于1998年1月6号,同年4月7日W3C(World Wide Web Consortium)发布了 M
40、athML 1. 0 的版本。2001 年 2 月 21 R MathML2. 0 正式诞生。2010年10月21号,MathML 3. 0版本也应运而生。MathML可以被看作是“最古老的XML语言之一,MathML完全依照XML的定 义规范,几乎可以表示所有类型的数学公式。MathML的设计目标:开发一种可 以在所有地方使用的数学标识,所有数学符号及其含义都被编码,并且该编码适 用于各个数学层次;方便与其他数学格式之间的相互转换;提供可扩展性;能够 让应用软件清晰、简单地产生;能够为所有的读者提供数学信息和概念,为复杂的公式的表示和打印问题提供帮助支持;冗长表达式的高效遍历;刻画数学表达
41、式的结构和内容;为软件间的数学公式输入输出交互提供协议支持。MathML的应用领域:MathML既可以用来对数学符号进行编码,同时也可以 对数学公式进行编码,它有30多个标签用来描述抽象的标记结构,150多个标 签可以毫无歧义地确定数学表达式;MathML可用于编码应用程序中的数学内容, 在计算机代数系统、语音合成等领域有重要作用;它通常用于表示数学公式,以 及教育领域、科学论文、行业规范和法规等的内容,使这些内容在网络中能够方 便的使用和重用;在浏览器、出版业和办公软件中都具有重要作用。2.2 TTS技术.TTS,全称为Text-To-Speech,即“从文本到语音”,又称文语转换技术, 实
42、现的是通过计算机将文字形式的信息转换成自然语音,并通过声卡等多媒体设 备将声音输出。这种技术在人机交互、资讯、通信、家电等领域都有着广泛的应 用。例如,在人机交互方面,为了使人机交流界面更为友好,可通过与语音技术 相结合的方式,实现人机的语音交流。在盲人学习当中,可以结合语音技术,方 便有效的完成教育学习的目的的】。Text-To-Speech的实现过程如图2-1所示。程度将要读出 的内容以纯文 本的形式输出把文本转换成 音素和韵律符F1声K将数字声音转 换成声音信号,并 由扬声器播放出来应用程序 语音合成引擎 声长扬声器 _ w 盘图2-1 lfext-Tb-Speech的实现过程TTS的核
43、心是如何进行语音合成,这个过程应含有三个模块,分别为文本分 析、韵律控制和语音合成。其系统结构如图2-2所示:图2-2 TTS核心系统结构文本分析是指将文本中内容处理成计算机能处理的内部参数,然后送给韵律 控制模块,将其进一步处理并生成相应的信息。在文本分析过程中,通过文本不 同位置上的标点符号,可以确定发音时的语气变换以及停顿和停顿长短。停顿是 指语句或者词语之间的声音上的间歇,表现在言语表达中的词语之间,句子之间 以及段落之间的停歇与顿断,它同样是消除歧义的一种方法,是构成语调的语音 成素之一网。韵律,是指人们在自然语流中使用语调、节奏以及重音等方式来表达说话时 的情感或者意向。韵律控制模
44、块是指通过建立有效韵律模型而生成具体的韵律参 数,为语音合成做准备。合成模块是根据得到的语音文本内容和韵律参数,采用一定的语音合成技术, 利用声学模块合成出语音。2.3数学公式表示复杂度的计算在论文基于Web的数学公式输入及可访问性关键问题研究中,作者提 出了数学公式的表示复杂度的概念,指出数学公式表示复杂度是指数学公式的表 现形式的复杂程度。而影响数学公式的表示复杂度的因素可分为两大方面,一方 面是构成数学公式树形结构的符号元素(数字、变量、运算符、符号常量、变量), 符号的类型与内容不同,表示复杂度也不同。例如数字23和数字232323,后者 的复杂度要比前者的大。另一方面是数学公式符号元
45、素的组合规则,不同的组合 规律也影响表示复杂度。比如树形结构的不同层次或者不同组合都会导致数学公 式复杂度的不同问。数学公式表示复杂度的核心是将一个数学公式E最大限度的分解成粒度足够小的可存储的对象。然后根据影响数学公式表示复杂度的符号和组合规则的不 同,计算复杂度。在实际的算法中,首先将数学公式E中的数学符号和E的树 形结构组合规律转换成二进制形式,将其二进制的长度设为数学公式E的表示复 杂度的值。在具体计算表示复杂度的时候,数学公式树形结构的所有叶子结点要 根据结点符号类型的不同采用不同的二进制编码方式表示。其次,对树形结构的 组合规则,先要将树形结构中的所有的结点从上到下、从左到右依次使
46、用无类型 变量V、V2、Vn量代,然后将皆代后的树使用Lambda演算来表示,并转换 为Binary Lambda演算,这时的二进制位数则为数学公式E的表示笈杂度。因此给出数学公式表示复杂度的计算公式如下:nCr(E) = Length(E入)+2 Length (Pj) i=l其中,E表示一数学公式,Ex为数学公式E使用无类型结构 表示后的二进 制Lamda演算表达式。Pi代表的是数字(整数、小数和分数)、变量或者符号常 量,Pi为数学公式E的节点对象。下面给出数学公式表示复杂度的具体计算步骤,分为五步进行:步骤一:将给定的数学公式E转换成个树形结构,根据节点的类型把所有 的叶子节点表示为不
47、同的二进制编码。其中结点的类型依据数学公式中不同的种 类的符号分为四类:整数、小数、分数、变量和符号常量。下面分别说明这四种 不同类型节点的具体长度计算方法:整数整数数位的多少会影响数学公式的表示复杂度的大小。比如整数342534 的表现复杂度要比整数12的表现复杂度要大。而撩数的二进制长度, 采用它实际的二进制长度。这里,假设I为整数,那么I的表述复杂度&(/)为:C(D= 屈2。)+?岩(2-1)小数山于小数的数字长度决定了小数的表示复杂度,所以在计算小数的表示 复杂度之前,需要将小数写成规定的标准形式。一个小数D的标准形式 就是小数点在左边。即D = D,xlOt,其中OV|D|YL设D
48、为小数的 小数点后面的数字,那么小数D的表述复杂度G(D)为:(Llog2(D,) + log2(0J + 1, t 0(2-2)Cr(D) = log2(D)J + 1, = 0(!Jog2(D) + log2(ld)J + 2, t 以表示代数中的某个数列第13个元素,也可以表示矩 阵的-行三列的元素。6)如(a, b)可以表示一个点,也可以表示一个区间。7)如数学公式AE2 AB2+BE2, AE、AB、BE可表示线段的长度也 可表示字母相乘。8)如数学公式AB,既可以表示A与B相乘的积的绝对值,也可以 表示线段AB的氐度。9)如数序公式f*g,由于字母f,g,h是常用来表示函数的符号,
49、所 以有时候它们代表的是函数,有时候代表的是一个字母变量。第四类(记为AQ,是指结构模糊1)如sinxy,它到底是指(sinx)*y还是指sin(xy),公式本身在写法 上就存在着意义不清楚的问题,读出来肯定也是存在歧义的。2)如tanx/y0它可以理解为(tanx)/y,也可理解为tan(x/y)。3)如sinx-Ti/3。它理解为 sin(x-Ti/3)或者(sinx) ir/3。4)如 sinxlnxo 可理解为 sin(xlnx)或者是(sinx)*(lnx)。上述总结的数学公式的四类歧义性中,在第一、二类中,表明完整读取数学 公式的内容和明确读出运算符的作用范围,对消除数学公式歧义性
50、具有重要性。 第三类,一符多义,是由于数学领域的不同而导致的,也就是说,要根据具体的 应用环境而分析。通常情况下,A】、AL A*,我们会直接认为它表示的是矩阵 领域中的。而y结构的,当作一阶导数。式子第四类,结构模糊,是由于数学公 式中没有明确规定各个运算符的优先级,运算符的结合性和运算顺序,所以导致 了一个式子对于多种理解。3.3数学符号数学符号是数学科学中专门使用的一-种特殊的符号,它是一种形象高度浓缩、 含义高度概括。它是产生于数学概念、演算、公式、命题、推理和逻辑关系等整 个数学过程中。正如美国数学家J. w. Yong在数序教学中写道:“数学内容是 运用包含着大量符号的数学语音来表
51、述的”,所以作为数学的特殊文字数学 符号,在如何更好的理解数学这个学科发挥着不可替代的作用。在本文中,为了 更好的研究数学公式的读法规则,首先对数学符号的分类以及数学符号之间的关 系作简要介绍。3.3.1数学符号的分类数学公式是山一系列数学符号按照数学学科的规范约定组成的字符串,它 通常表达一定的数理逻辑关系和运算方法。在数学公式中,数学符号是表达数学思维的一种专用的特殊语言文字。在数 学教学过程中,为了实现既定的数学教学目标,数学符号在数学中应该注意发挥 它的效能。所以接下来,我们将依据数学符号的主要作用来对数学符号分类,通 常将数学符号划分为如下五大类:第一类,元素符号,即表示数的字母或者
52、表示特殊意义的符号。表示数字。如1,2, 3,;表示数字或变量的字母。如a, b, c , d,,x, y, z,等26个字母以及24个希腊字母。表示常数或常量的字母。如e, i,表述几何图形的字母和符号。如三角形三边用a, b, c,它的对应角用A, B, C表示等。(在本文中我们暂且不考虑几何内容出现的数学符号)。第二类,运算符号。表示按照某种规定进行运算的符号。如“ + ”(加号)、 “一”(减号)、“乂” (乘号)、“十”(除号);“:(比号);“厂”(根 号)、log,ln,lg(对数符号);sin, *,(三角函数符号);(和式符号);f(x)(函 数符合);1 im (极限符号)
53、;O (交集符合);J (导数、微分、积分符号)等。第三类,关系符号。表示数(式)之间的关系符号,如=(等号),、 (大 于、小于号);伍(属于),u (包含于),竺(全等号), (相似号)等。第四类,约定符号。约定某符号表示某个特定的形式或特定的含义。如 (根的判别式号),8 (无穷);第五类:性质符合与辅助符号。表示数量的性质符号,如+ (正号),-(负 号)、Ia| (绝对值号)、R (实数集合号)、N (自然数集号)。辅助符号,如括号 ()、等。3.3.2数学符号之间的关系王确理解数学公式中各个符号之间的关系以及意义,是正确且无歧义得读 出数学公式的前提条件。那么接下来,我们来分析数学
54、公式中的数学符号之间的关系,分为两类:1)显式关系显示关系就是指数学符号之间的关系直接可以由运算符、关系符以及逻辑运 算符等明确表示出来,主要是依赖于数学运算符的优先级顺序。例如,数学公式a + bc,通过式子中的运算符和关系符的优先级,就可得 知式子的表达的是a与b的和大于c。2)隐式关系所谓隐式关系是指数学公式中的数学符号之间的关系是要通过空间位置关 系隐式的表达数学公式的含义。例如,数学公式def,虽然没有运算符,但是它表示的是d乘以e乘以f。前 提是我们只是用单一符号表示变量,即排除def整体为一个变量,隐含了乘法运 算。例如,数学公式3ab,虽然没有运算符,可是该数学公式表达的是:3
55、乘以 a乘以b,隐含了乘法运算。例如,数字表达式234,它表达的是234是一个数字常量,其中2、3、4之 间不是相乘的关系,这是十进制表达,每位位的数值乘以该位对应的权值之和就 是该数值。即:2*100+3*10+4*1=2341例如,带分数2土,表示的是2+土的结果,隐含了加法运算。2鉴于数学公式中数学符号之间有如上的关系,那么在下文中数学公式的读法 中,应该对隐含乘和显示乘的读法区分对待。3.3.3本文研究符号范围由于数学学科是研究数量、结构、空间基础与哲学的一门复杂学科,数学学 科本身包含多各分支,数学符号在不同分支下含有不同的符号。本文中,研究的 数学符号来自于初等数学、高等数学以及高
56、等代数中线性代数这些内容。我们根 据符号使用的范围不同,划分为集合论、数理逻辑、线性代数以及高等数学(包 含初等数学符号)四种。下面列出了常用的数学符号如表3-1、表3-2、表3-3,表3-4o (注:本文 讨论的数学符号以及运算不包括儿何内容)表3T集合论中的符号序号符k含义16 G属于、不属于2C 包合于、不包含于32聿包含、不包含4U并5n交6AnAi7Uum8例如:AB=(x|x AAxG B9c补集 CuA=(x|x6 U Ax A 10XAXB=(a,b) | x | x A A x B 11特殊大写字母N非负整数集IF整数集N* N+Z整数集Q有理数集R实数集C复数集J无理数集合
57、12CCUA A的补集13A&排列14C备组合15函数 Card(A)求集合A中的元素表3-2数理逻辑符号序符号含义1A合取联接符2V析取联接符号37否定符弓4蔡涵符IJPtQ, P蕴涵Q5等价联接词PQ , P等价于Q6V异或联结词7=推到符号8一等价符号91或非连接词10?与非连接词113m存I 3不存12VV任意,针时所有13e对称差 AB = (A-B)U(B-A)14AA的绝对补集表3-3线性代数符号类型符号含义1AB矩阵A与矩阵B的积2A+B矩阵A与矩阵B的和3AB矩阵A与矩阵B的差4A=B矩阵A等于矩阵B5E, 1单位知阵6A-】方阵A的逆7AtA的转置矩阵8A,矩阵A的伴随矩阵
58、9detA方阵A的行列式10trA方阵A的迹11IIAII短阵A的范数(模)12=ASB,矩阵A等价于矩阵B13|A|矩阵A的行列式14A=B矩阵A等价于矩阵B表3-4高等数学符号(包含初等数学符号)序号符含义1()、】、 、括2一、+负亏、正号3%、百分号、4!阶乘5Mn幕运算指数运算6f(x)、函数7f(x)导数8X、十、乘/除比号9sinx arcsinx三角函数、反三角函数10lim极限11E求和12n连乘公式13log对数14积分15也 dx微分16f】(xo,yo)偏导数17+、一加/减18、=、R、 、片、生、=关系运算符3.4数学运算符的优先级在日常的数学运算过程中,通常会默认
59、得使用一定的运算顺序来完成数学式 子的运算。如式子a-bxc,通常会默认先计算乘法bxc,得出一个结果为d , 然后再计算加法运算a+d,最后得出运算结果。这样采用的是先算乘法后算加 法的运算顺序。比如式子一般运算顺序是先算括号里面的b-c, 然后算除法,最后才算法加法。在后学教学中存在一些约定成俗的运算规则以及 顺序,也就是数学运算符自身有一定的优先级顺序,所以要有一定的运算顺序才 能进行正确的计算。在研究如何制定数学公式的汉语语音读法规范之前,首先对数学公式读法产 生歧义性的原因进行了分析,发现多数情况下,会认为“G减去b除以Wild”是 表达式a-2 + d读法,认为“b乘以c减d”是表
60、达式bxc-d而不是bx(c-d),C这是因为数学学习者的潜意识中都约定乘法的优先级要高于减法。再比如式子中+ -c含有的运算,应该先算4 +。的加法运算,然后才算除法运算即b,这样就违背的约定成俗的运算顺序,那么在读这个数学公式的时候,会 b读成“3加4加a除以b减c”,显然这样就很有歧义。原因就是按照约定的运算 顺序应该先算除法,而后算加法。而这个式子的运算顺序显然打破了之前的约定 顺序。因此,如果数学公式的运算顺序本身是遵循约定成俗的运算顺序,那么在 读出来的时候,就没有歧义,反倒是那些违背、打破约定成俗的运算顺序的数学 公式在读出来时,变得有歧义性。那么,根据数学运算的优先顺序将数序运
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 胶合板生产安全与职业健康考核试卷
- 电机在云计算数据中心的应用考核试卷
- 企业法律法规与政策环境考核试卷
- 2025合同丢失证明模板
- 2025风力发电站专业运维服务合同
- 肇庆市实验中学高二上学期期中考试化学(文)试题
- 2025届安徽省合肥市高三下学期期中考试四校联合调研历史试题(含答案)
- 酒店抵押合同书简单模板二零二五年
- 展位合作合同书协议书范例
- 社交媒体营销合同书二零二五年
- 南通2025年江苏如皋市部分事业单位招聘78人笔试历年参考题库附带答案详解
- 2024年云南民族大学附属中学西山分校在职骨干教师招聘笔试真题
- 中层干部因私出国境请假审批表
- 潍柴发动机WD615系列分解图册
- 碎石、砂出厂合格证
- 泵站水锤计算书
- 中国城市规划设计研究院交通评估收费标准
- 配件来源及报价明细表
- IQC供应商品质管理看板
- 钢结构安装专项方案(电梯井)
- 他励直流电动机制动课程设计0430崔善泽(DOC)
评论
0/150
提交评论