第二组《勒曼谈机器翻译》_第1页
第二组《勒曼谈机器翻译》_第2页
第二组《勒曼谈机器翻译》_第3页
第二组《勒曼谈机器翻译》_第4页
第二组《勒曼谈机器翻译》_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、外外1212级级11 11班班李李佩佩 12040211341204021134赵思赵思雨雨 12040211301204021130从从勒曼谈机器翻译勒曼谈机器翻译出发谈机器翻译出发谈机器翻译 机器翻译的概念 机器翻译的发展道路 机器翻译方法简介 机器翻译存在的问题 关于机器翻译的几点思考目录目录(一)概念理解(一)概念理解机器翻译(machine translation),又称为自动翻译,是利用计算机把一种自然源语言转变为另一种自然目标语言的过程,一般指自然语言之间句子和全文的翻译。机器翻译的概念机器翻译的概念很久以来,人们就梦想着有朝一日,能造出一种设备,清除人类交流过程中的“语言障碍”

2、 ,使得使用不同语言的人能自由地相互交流。在当代信息社会,语言障碍问题更加突出。大量的政府文件、商业以及科技资料都需要在短时期内得到翻译,互联网的问世更是扩大了翻译需求。机器翻译应运而生。(二)产生(二)产生(四)工作原理(四)工作原理机器翻译的原理简单地说就是让机器模拟人的翻译过程。 -中国的机器翻译中国的机器翻译 在存储器中存储机器词典和机器与法 查词典 选择所需要意义 明确各个词间的关系 组成译文(三)可实现性(三)可实现性机器翻译之可能实现,还在于语言的可译性和翻译工作的可模拟性。 -中国的机器翻译中国的机器翻译 一种语言有许多句子可以很容易地作为整个单位译成另一种语言。 -勒曼谈机器

3、翻译勒曼谈机器翻译机器翻译的概念机器翻译的概念?机器翻译是语言学、数学、计算机技术、自动化等科学部门共同研究的对象。 -中国的机器翻译中国的机器翻译(三)(三)涉及领域涉及领域提供词典和语法则研制便于翻译的计算机解决外部设备问题语言学工作者自动化工作者将材料代码化和程序化机器翻译的概念机器翻译的概念数学工作者计算机工作者机器翻译的发展道路机器翻译的发展道路1954 年,美国乔治敦大学在 IBM 公司协同下, 用 IBM-701计算机首次完成了英俄机器翻译试验,拉开机器翻译研究的序幕。1964年,美国科学院成立了语言自动处理咨询委员会。1966年11月,该委员会公布了一个题为语言与机器的报告,建

4、议停止对机器翻译项目的资金支持。国与国之间的语言障碍显得更为严重,传统的人工作业方式已经远远不能满足需求。计算机科学、语言学研究的发展,从技术层面推动了机器翻译研究的复苏,机器翻译项目又开始发展起来人们对于机器翻译的需求空前增长,机器翻译迎来了一个新的发展机遇,国际性的关于机器翻译研究的会议频繁召开。在市场需求的推动下,商用机器翻译系统迈入了实用化阶段,走进了市场,来到了用户面前。机器翻译的发展道路机器翻译的发展道路勒曼谈机器翻译机器翻译设想 语言模式和理论 程序编制机器翻译方法分类基于规则的机器翻译基于统计的机器翻译 基于实例的机器翻译机器翻译的方法简介机器翻译的方法简介勒曼谈机器翻译勒曼谈

5、机器翻译语言的语法和词典是能够规范得十分完善是计算机能够利用它们。一、机器翻译设想语言学家必须精确地规定计算机所遵循的程序和它处理的语言材料的程序必须制定一种语言模式和理论所 涉 及语 言 的语法所 涉 及语 言 的词典勒曼谈机器翻译勒曼谈机器翻译二、语言的模式和理论语言的主要困难也许就是以一系列不同平面或层次形式出现的语言结构,语言学家常把这种结构称作层次结构。例例1. 逐词译法源语言(德语)目标语(英语)Diese kurze gemeinsame berlegung ist eine Art Experient mit uns selbst gewesen.This short join

6、t reflection has been a kind of experiment with ourselves.Has a kind of joint experiment with ourselves been.(逐词译法)例例2.勒曼谈机器翻译勒曼谈机器翻译/s/与/z/在语言不同部分的作用1)在语音系统中2)在语法系统中zip/s/z/sip price /s/ prize /z/可数名词复数: dogs /z/ cats /s/ 第三人称单数: He takes /s/ Bus No.4 to school. He buys /z/ a single new shirt each

7、month./s/和和/z/是不同的是不同的项目项目/s/和和/z/在某些情况在某些情况下是等值的下是等值的语言的不语言的不同部分中同部分中同一项的同一项的作用是有作用是有差别的差别的例例3.勒曼谈机器翻译勒曼谈机器翻译动词go的意义2)Hes going tomorrow.3)Hes going steady.1)Hes going to town.He is being in love.走,离开为了简单的说明意义上的差别,可以比照语音层次和语法层次,设置语义层次和语法层次。勒曼谈机器翻译勒曼谈机器翻译美国德克萨斯大学语言研究中心的分析系统和程序编制系统,就是把语言看做层次体系的。词汇层次语

8、义层次句法层次处理语言的单词把形式单位聚合在一起把单词彼此加以联系例例4.美国德克萨斯大学语言研究中心三、程序编制勒曼谈机器翻译勒曼谈机器翻译装置一装置二装置四装置三处理计算机所提出的要求(接收器)处理要加工的语言材料处理计算机所产生和存储的语言把对材料的分析与第二种语言所期望的分析相匹配听 进 语 言材料同语言知识相匹配程序的两个目的:程序的两个目的:1)对材料按词汇、句法和语义)对材料按词汇、句法和语义等不同层次加以分析等不同层次加以分析 2)把这种分析通第二种语)把这种分析通第二种语言所期望的分析相匹配言所期望的分析相匹配目目的的一一目的二目的二勒曼谈机器翻译勒曼谈机器翻译小结小结勒曼谈

9、机器翻译一文谈到了机器翻译的可实现性及其在文学作品翻译方面的局限性。文章用简洁生动的语言介绍了机器翻译的设想依据、机器翻译对语言的要求、程序的编制等问题。但文章对机器翻译方法的分类和技术处理等具体问题的介绍仍有不足之处。机器翻译方法分类机器翻译方法分类基于规则的方法(SBMT)基于实例的方法(EBMT)基于规则的方法()基于语料库方法()机器翻译的方法(Machine Translation/MT)机器翻译方法分类机器翻译方法分类基 于 规 则 的机器翻 译方 法 把 翻 译 过程 看 作 是 一 个在 语 言 学知 识引导 下 的 符 号 变换 过程。这 种 方 法要 求 把 有 关 源 语

10、言 和目 标 语 言 的 知 识 以 计 算 机 可 以 操 作 (“看 懂”)的 形 式 表 示 出 来。机器翻译与语言研究机器翻译与语言研究一、基 于 规 则 的方 法 基于规则的机器翻译方法,主要是依靠语言学家总结归纳的语言翻译规则库,对源语言的句子进行语法、句法和词法词性分析,然后按照相应的语法规则进行判断和推导,最后生成等价的目标语言语句,得出翻译结果。 基于实例机器翻译方法的分析与探究基于实例机器翻译方法的分析与探究(一)概念理解(一)概念理解机器翻译方法分类机器翻译方法分类(二二)翻译过程)翻译过程机器翻译方法分类机器翻译方法分类源语言的分析转换目标语的生成(三三)实例分析)实例

11、分析)源 语 言 的 词 法 分 析)源语言词串的句法分析分析)源 语 言 到 目 标 语 言的句 法 结构转换)目 标 语 言 结 构 的 调 整)源语 言 文 本 单 词 的 译 词 选 择)目 标 语 言 词串的 生 成以把以把“她把一束花放在桌上。她把一束花放在桌上。”译为英语为例译为英语为例分分析析转转换换生生成成机器翻译方法分类机器翻译方法分类)源 语 言 的 词 法 分 析这 一 阶 段 利 用源 语言 词 汇 层 面 的 知 识,识 别 出 源 语言 文 本字 符 串中 的 单 词, 并 从 词 典中获 得 每 个 单词 的 句 法语义 知 识,以 备 在 后 续 处 理 中使

12、 用。她把一束花放在桌上。她把一束花放在桌上。 fw代代词词介介词词数数词词量量词词名名词词动动词词介介词词名名词词性性语语系系方方位位词词标标点点符符号号机器翻译方法分类机器翻译方法分类)源语言词串的句法分析分析为得到 句 法 结 构 以 及 跟 结 构 相 关 的 特征结 构,这 一 阶 段 的 处 理 需 要 运 用 句 法层面 的 知 识,指 明 了 短 语的 组 成 关 系。她把一束花放在桌上。她把一束花放在桌上。 fw 机器翻译方法分类机器翻译方法分类)源 语 言 到 目 标 语 言的句 法 结构转换结构转换 主要 利 用 源 语 言结构 和 目 标 语 言结构 之 间的对应 关

13、系 进 行,通 过 一 组 转换 规 则 的指导把源 语 言 的 句 法 树转 换成 目 标语 言 的 句 法 树。机器翻译方法分类机器翻译方法分类)目 标 语 言 结 构 的 调 整通常经过结构转换得到的句法结构还保留着源语言结构的诸多痕迹,尚需根据目标语言的句法知识对该结构进行调整源语言源语言目标语目标语机器翻译方法分类机器翻译方法分类(三三)RBMT的优点和缺点的优点和缺点1. 规则的主观性强,规则的一致性难以保障; 2.知识获取难、工作量大;3.不利于系统扩充,尤其对非规范的特殊语言现象缺乏新理论和新方法相应的处理能力。 1. 不同语种在语法上的相似依存度很低、处理能力较强;2. 具有

14、对知识表达的抽象程度高、代表性强的特点;3.对文法结构具有很强的保持能力; 机器翻译方法分类机器翻译方法分类S S二、基 于 统计的方 法 (一)概念理解(一)概念理解 SBMT是一种间接地使用语料库的机器翻译方法,将语料库作为获取翻译规则信息的依据,通过相关概率的计算,使用纯数学的方法对待译文本进行“翻译”(转换) 。 -基于实例英汉翻译系统研究与实现基于实例英汉翻译系统研究与实现 思想萌芽Weaver发表的以翻译为题的备忘录中就提出:“当我阅读一篇用俄语写的文章的时候,我可以说,这篇文章实际上是用英语写的,只不过它是用另外一种奇怪的符号编了码而已,当我在阅读时,我是在进行解码。”机器翻译方

15、法分类机器翻译方法分类S基于统计的机器翻译方法无需人工编写规则,直接从语料库中学知识,并将这些知识应用到句子的翻译中。-基于双语句法短语的统计机器翻译研究基于双语句法短语的统计机器翻译研究(二二)SBMT分类分类基于统计的机器翻译方法大体上分为以下三类基于平行概率语法的统计机器翻译方法基于信源信道模型的统计机器翻译方法基于最大嫡的统计机器翻译方法机器翻译方法分类机器翻译方法分类基本思想是把机器翻译看成是一个信息传输的过程,用一种信源信道模型对机器翻译进行解释。(二二)基于信源信道模型的统计机器翻译方法基于信源信道模型的统计机器翻译方法S噪声信道T源语言源语言目标语言目标语言输入输入输出输出机器

16、翻译方法分类机器翻译方法分类S(三)(三)SBMT的优点和缺点的优点和缺点1. 资源丰富, 易于实现;2.良好的统计翻译模型能够融合更多的句法结构和语义 、语法信息; 3.统计机器翻译的翻译性能可通过大规模语料训练进行 改善。 1. 系统运行消耗的资源巨大,需要大规模双语平行语料库进行训练学习,语料的选择和处理工程量也很巨大。机器翻译方法分类机器翻译方法分类E二、基 于 实例的方 法 思想萌芽长尾真指出:“人类在翻译一个简单句子的时候,并不会作深层次的语法分析,而是首先将源语句适当地分为若干短语片段然后再把这些短语翻译成目标语言,最后把翻译好的短语片段恰当地组合成为一个句子。而对每一个短语片段

17、则是用相应的例子作为参考,通过类推原则进行翻译的。”模仿人类模仿人类翻译外语过程中的基本模式翻译外语过程中的基本模式将源语句分解为短语片段并在一个实例库的基础上对其进行匹配确定这些短语片段所对应的目标语言的短语片将翻译好的目标语言的短语片段进行适当重组,构成一个完整的目标语言句子(一)概念理解(一)概念理解机器翻译方法分类机器翻译方法分类E(二二)基本原理)基本原理EBMT在译文转换时,从实例库中搜索出一个与输入句最相似的例句,并仿照实例库中例句的翻译方式进行输入句的翻译。源语言S最相似句S模拟S的译语T构成S的译语T一种语言中的任何一个句子都有可能是另外一种语言中某个句子的译文,只不过可能性

18、大小不同,而取可能性最大的那个译文应该是风险最小的。 基于语义语言机器翻译系统的若干问题的研究基于语义语言机器翻译系统的若干问题的研究机器翻译方法分类机器翻译方法分类E(三三)EBMT的优点和缺点的优点和缺点1.相似度计算困难;2.大规模获取语言知识的代价非常大,对于词法、语法和语义规则的概括难以全面。1、不需要编写规则;2、系统容易维护;3、容易产生高质量译文;4、需要的相关语言知识少。机器翻译方法分类小结机器翻译方法分类小结小结小结基于规则和基于语料库的机器翻译方法优缺点各异,使用不同方法研制的机器翻译系统的性能表现也不尽相同, 对译文质量的保障程度深浅不一,翻译精度也还不尽如人意。如何通过规则和语料库方法的有机结合,实现相互取长补短的新理论和新方法,是机器翻译研究人员普遍关注的研究热点。 翻译质量还还不够高语种的支持还不够多 翻译的结果还不够可信 翻译的系统还不够方便机器翻译存在的问题机器翻译存在的问题机器翻译与语言研究机器翻译与人类翻译机器翻译对外语学习的影响机器翻译的市场化关于机器翻译的几点思考关于机器翻译的几点思考在资本力量的推动下,机器翻译系统不断从实验室走向市场。然而国内先后出现多个英汉/汉英机器翻译系统,但大部分都是昙花一下,个别勉强支撑下来的系统也没有得到用户的较高评价, 用户的忠诚度也很低

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论