第二组《勒曼谈机器翻译》外12.11李佩赵思雨_第1页
第二组《勒曼谈机器翻译》外12.11李佩赵思雨_第2页
第二组《勒曼谈机器翻译》外12.11李佩赵思雨_第3页
第二组《勒曼谈机器翻译》外12.11李佩赵思雨_第4页
第二组《勒曼谈机器翻译》外12.11李佩赵思雨_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、外外1212级级11 11班班李佩李佩 12040211341204021134赵思雨赵思雨 12040211301204021130从从勒曼谈机器翻译勒曼谈机器翻译出发谈机器翻译出发谈机器翻译 机器翻译的概念 机器翻译的发展道路 机器翻译方法简介 机器翻译存在的问题 关于机器翻译的几点思考目录目录(一)概念理解(一)概念理解机器翻译(machine translation),又称为自动翻译,是利用计算机把一种自然源语言转变为另一种自然语言的过程,一般指自然语言之间句子和全文的翻译。机器翻译的概念机器翻译的概念自然语言处理机器翻译计算机语言学自然语言理解分支(四)工作原理(四)工作原理机器翻译

2、的原理简单地说就是让机器模拟人的翻译过程。 -中国的机器翻译中国的机器翻译 在存储器中存储机器词典和机器语法 查词典 选择所需要意义 明确各个词间的关系 组成译文(三)可实现性(三)可实现性机器翻译之可能实现,还在于语言的可译性和翻译工作的可模拟性。 -中国的机器翻译中国的机器翻译 一种语言有许多句子可以很容易地作为整个单位译成另一种语言。 -勒曼谈机器翻译勒曼谈机器翻译机器翻译的概念机器翻译的概念机器翻译是语言学、数学、计算机技术、自动化等科学部门共同研究的对象。 -中国的机器翻译中国的机器翻译(五)涉及领域(五)涉及领域提供词典和语法规则研制便于翻译的计算机解决外部设备问题语言学工作者自动

3、化工作者将材料代码化和程序化机器翻译的概念机器翻译的概念数学工作者计算机工作者研究价值(六)研究价值(六)研究价值机器翻译的概念机器翻译的概念不同国家的人无论是面对面交流,还是通过互联网交流,都需要机器翻译的帮助。国际会议时产生大量的多语言文本,要人工逐一翻译这些文本既费时又费力,使用机器翻译则可以减少人量的人力资本消耗,使翻译工作省时省力。从学术角度看,机器翻译也是一个非常有意义的研究课题。机器翻译的研究具有重大的社会意义和经济价值。机器翻译的研究具有重大的社会意义和经济价值。产生产生很久以来,人们就梦想着有朝一日,能造出一种设备,清除人类交流过程中的“语言障碍” ,使得使用不同语言的人能自

4、由地相互交流。在当代信息社会,语言障碍问题更加突出。大量的政府文件、商业以及科技资料都需要在短时期内得到翻译,互联网的问世更是扩大了翻译需求。机器翻译应运而生。机器翻译的发展道路机器翻译的发展道路1954 年,美国乔治敦大学在 IBM 公司协同下, 用 IBM-701计算机首次完成了英俄机器翻译试验,拉开机器翻译研究的序幕。1964年,美国科学院成立了语言自动处理咨询委员会。1966年11月,该委员会公布了一个题为语言与机器的报告,建议停止对机器翻译项目的资金支持。国与国之间的语言障碍显得更为严重,传统的人工作业方式已经远远不能满足需求。计算机科学、语言学研究的发展,从技术层面推动了机器翻译研

5、究的复苏,机器翻译项目又开始发展起来。人们对于机器翻译的需求空前增长,机器翻译迎来了一个新的发展机遇,国际性的关于机器翻译研究的会议频繁召开。在市场需求的推动下,商用机器翻译系统迈入了实用化阶段,走进了市场,来到了用户面前。机器翻译的发展道路机器翻译的发展道路勒曼谈机器翻译机器翻译设想 语言模式和理论 程序编制机器翻译方法分类基于规则的机器翻译基于统计的机器翻译 基于实例的机器翻译机器翻译的方法简介机器翻译的方法简介勒曼勒曼(Winfred . Lehman): 美国德克萨斯州奥斯丁市德克萨斯大学语言学主任,美国德克萨斯州奥斯丁市德克萨斯大学语言学主任,兼政府主办的机器翻译和发展语言学计算机系

6、统研究计兼政府主办的机器翻译和发展语言学计算机系统研究计划的主要审查人。在他谈机器翻译的文章发表后,在近划的主要审查人。在他谈机器翻译的文章发表后,在近十多年来,机器翻译的理论虽有进展,但本文仍不失为十多年来,机器翻译的理论虽有进展,但本文仍不失为重要的参考资料之一。重要的参考资料之一。勒曼谈机器翻译勒曼谈机器翻译勒曼谈机器翻译勒曼谈机器翻译语言的语法和词典是能够规范得十分完善使计算机能够利用它们的。一、机器翻译设想语言学家必须精确地规定计算机所遵循的程序和它处理的语言材料的程序必须制定一种语言模式和理论所 涉 及语 言 的语法所 涉 及语 言 的词典勒曼谈机器翻译勒曼谈机器翻译二、语言的模式

7、和理论语言的主要困难也许就是以一系列不同平面或层次形式出现的语言结构,语言学家常把这种结构称作层次结构。例例1. 逐词译法源语言(德语)目标语(英语)Diese kurze gemeinsame berlegung ist eine Art Experient mit uns selbst gewesen.This short joint reflection has been a kind of experiment with ourselves.This short joint reflection has a kind of joint experiment with ourselves

8、 been. (逐词译法)例例2.勒曼谈机器翻译勒曼谈机器翻译/s/与/z/在语言不同部分的作用1)在语音系统中2)在语法系统中zip/s/z/sip price /s/ prize /z/可数名词复数: dogs /z/ cats /s/ 第三人称单数: He takes /s/ Bus No.4 to school. He buys /z/ a single new shirt each month./s/和和/z/是不同的是不同的项目项目/s/和和/z/在某些情况在某些情况下是等值的下是等值的语言的不语言的不同部分中同部分中同一项的同一项的作用是有作用是有差别的差别的例例3.勒曼谈机器翻

9、译勒曼谈机器翻译动词go的意义2)Hes going tomorrow.3)Hes going steady.1)Hes going to town.He is being in love.走,离开走,离开为了简单的说明意义上的差别,可以比照语音层次为了简单的说明意义上的差别,可以比照语音层次和语法层次,设置语义层次和语法层次。和语法层次,设置语义层次和语法层次。勒曼谈机器翻译勒曼谈机器翻译美国德克萨斯大学语言研究中心的分析系统和程序编制系统,就是把语言看做层次体系的。词汇层次语义层次句法层次处理语言的单词把形式单位聚合在一起把单词彼此加以联系例例4.美国德克萨斯大学语言研究中心三、程序编制勒

10、曼谈机器翻译勒曼谈机器翻译装置一装置二装置四装置三处理计算机所提出的要求(接收器)处理要加工的语言材料处理计算机所产生和存储的语言把对材料的分析与第二种语言所期望的分析相匹配听 进 语 言材料同语言知识相匹配程序的两个目的:程序的两个目的: 1)对材料按词汇、句法和语义)对材料按词汇、句法和语义等不同层次加以分析等不同层次加以分析 2)把这种分析通第二种语言)把这种分析通第二种语言所期望的分析相匹配所期望的分析相匹配目目的的一一目的二目的二勒曼谈机器翻译勒曼谈机器翻译小结小结勒曼谈机器翻译一文谈到了机器翻译的可实现性及其在文学作品翻译方面的局限性。文章用简洁生动的语言介绍了机器翻译的设想依据、

11、机器翻译对语言的要求、程序的编制等问题。但文章对机器翻译方法的分类和技术处理等具体问题的介绍仍有不足之处。机器翻译方法分类机器翻译方法分类基于统计的基于统计的方法方法(SBMT)基于实例的基于实例的方法方法(EBMT)基于规则的基于规则的方法方法()()基于语料库基于语料库方法方法()()机器翻译的方法机器翻译的方法(Machine Translation/MT)机器翻译方法分类机器翻译方法分类基 于 规 则 的机器翻 译方 法 把 翻 译 过程 看 作 是 一 个在 语 言 学知 识引导 下 的 符 号 变换 过程。 机器翻译与语言研究机器翻译与语言研究一、基 于 规 则 的方 法 基于规则

12、的机器翻译方法,主要是依靠语言学家总结归纳的语言翻译规则库,对源语言的句子进行语法、句法和词法词性分析,然后按照相应的语法规则进行判断和推导,最后生成等价的目标语言语句,得出翻译结果。 基于实例机器翻译方法的分析与探究基于实例机器翻译方法的分析与探究(一)概念理解(一)概念理解机器翻译方法分类机器翻译方法分类(二)翻译过程(二)翻译过程机器翻译方法分类机器翻译方法分类源语言的分析转换目标语的生成(三)实例分析(三)实例分析)源 语 言 的 词 法 分 析)源语言词串的句法分析)源 语 言 到 目 标 语 言的句 法 结构转换)目 标 语 言 结 构 的 调 整)源语 言 文 本 单 词 的 译

13、 词 选 择)目 标 语 言 词串的 生 成以把以把“她把一束花放在桌上。她把一束花放在桌上。”译为英语为例译为英语为例分分析析转转换换生生成成机器翻译方法分类机器翻译方法分类)源 语 言 的 词 法 分 析这 一 阶 段 利 用源 语言 词 汇 层 面 的 知 识,识 别 出 源 语言 文 本字 符 串中 的 单 词, 并 从 词 典中获 得 每 个 单词 的 句 法语义 知 识,以 备 在 后 续 处 理 中使 用。她把一束花放在桌上。她把一束花放在桌上。 fw代代词词介介词词数数词词量量词词名名词词动动词词介介词词名名词词性性语语系系方方位位词词标标点点符符号号机器翻译方法分类机器翻译方

14、法分类)源语言词串的句法分析为得到 句 法 结 构 以 及 跟 结 构 相 关 的 特征结 构,这 一 阶 段 的 处 理 需 要 运 用 句 法层面 的 知 识,指 明 短 语的 组 成 关 系。她把一束花放在桌上。她把一束花放在桌上。 fw 机器翻译方法分类机器翻译方法分类)源 语 言 到 目 标 语 言的句 法 结构转换结构转换 主要 利 用 源 语 言结构 和 目 标 语 言结构 之 间的对应 关 系 进 行,通 过 一 组 转换 规 则 的指导把源 语 言 的 句 法 树转 换成 目 标语 言 的 句 法 树。机器翻译方法分类机器翻译方法分类)目 标 语 言 结 构 的 调 整通常经

15、过结构转换得到的句法结构还保留着源语言结构的诸多痕迹,尚需根据目标语言的句法知识对该结构进行调整。源语言源语言目标语目标语5)源语言文本单词的译词选择译词选择主要利用两种语言之间的词汇对译知识进行如何选择正确的译词不仅要依赖于双语对照词典,同时还要综合考虑该单词的上下文语境。机器翻译方法分类机器翻译方法分类她她 放放 一一 束束 花花 上上 桌桌 。She put a bunch flower on table .她她 放放 一一 束束 花花 上上 桌桌 。She put a bunch flower on table .6)目标语言词串的生成利用得到的目标语言句法结构以及经过译词选择得到的目

16、标词语生成目标语言词串.机器翻译方法分类机器翻译方法分类sofs机器翻译方法分类机器翻译方法分类(三)(三)RBMT的优点和缺点的优点和缺点1. 规则的主观性强,规则的一致性难以保障; 2.知识获取难、工作量大;3.不利于系统扩充,尤其对非规范的特殊语言现象缺乏相应的处理能力。 1. 不同语种在语法上的依存度很低、处理能力较强;2. 具有对知识表达的抽象程度高、代表性强的特点;3.对文法结构具有很强的保持能力。 机器翻译方法分类机器翻译方法分类S S二、基 于 统计的方 法 (一)概念理解(一)概念理解 SBMT是一种间接地使用语料库的机器翻译方法,将语料库作为获取翻译规则信息的依据,通过相关

17、概率的计算,使用纯数学的方法对待译文本进行“翻译”(转换) 。 -基于实例英汉翻译系统研究与实现基于实例英汉翻译系统研究与实现 思想萌芽Weaver发表的以翻译为题的备忘录中就提出:“当我阅读一篇用俄语写的文章的时候,我可以说,这篇文章实际上是用英语写的,只不过它是用另外一种奇怪的符号编了码而已,当我在阅读时,我是在进行解码。”机器翻译方法分类机器翻译方法分类S(二)(二)SBMT分类分类基于统计的机器翻译方法大体上分为以下三类基于平行概率语法的统计机器翻译方法基于信源信道模型的统计机器翻译方法基于最大熵的统计机器翻译方法一种语言中的任何一个句子都有可能是另外一种语言中某个句子的译文,只不过可

18、能性大小不同,而取可能性最大的那个译文应该是风险最小的。 基于语义语言机器翻译系统的若干问题的研究基于语义语言机器翻译系统的若干问题的研究机器翻译方法分类机器翻译方法分类基本思想是把机器翻译看成是一个信息传输的过程,用一种信源信道模型对机器翻译进行解释。(二)基于信源信道模型的统计机器翻译方法(二)基于信源信道模型的统计机器翻译方法S噪声信道T源语言源语言目标语言目标语言输入输入输出输出机器翻译方法分类机器翻译方法分类S(三)(三)SBMT的优点和缺点的优点和缺点1. 资源丰富, 易于实现;2.良好的统计翻译模型能够融合更多的句法结构和语义 、语法信息; 3.统计机器翻译的翻译性能可通过大规模

19、语料训练进行改善。 1. 系统运行消耗的资源巨大,需要大规模双语平行语料库进行训练学习,语料的选择和处理工程量也很巨大。2.有些词出现频率低、用法不常见,统计模型就无法准确判断词义和词的位置。机器翻译方法分类机器翻译方法分类E二、基 于 实例的方 法 思想萌芽长尾真指出:“人类在翻译一个简单句子的时候,并不会作深层次的语法分析,而是首先将源语句适当地分为若干短语片段然后再把这些短语翻译成目标语言,最后把翻译好的短语片段恰当地组合成为一个句子。而对每一个短语片段则是用相应的例子作为参考,通过类推原则进行翻译的。”模仿人类翻译外语过程中的基本模式模仿人类翻译外语过程中的基本模式将源语句分解为短语片

20、段并在一个实例库的基础上对其进行匹配确定这些短语片段所对应的目标语言的短语片段将翻译好的目标语言的短语片段进行适当重组,构成一个完整的目标语言句子(一)概念理解(一)概念理解匹配匹配对齐对齐重组重组机器翻译方法分类机器翻译方法分类E(二)基本原理(二)基本原理EBMT在译文转换时,从实例库中搜索出一个与输入句最相似的例句,并仿照实例库中例句的翻译方式进行输入句的翻译。源语言S最相似句S模拟S的译语T构成S的译语T例例 将“We are studying Chinese.” 译成中文源语言SWe are studying Chinese.最相似句SWe are studying English.

21、我们正在学习英语。We are researching Chinese.我们正在研究汉语。模拟S的译语T构成S的译语T我们正在学习汉语。机器翻译方法分类机器翻译方法分类E(三)(三)EBMT的优点和缺点的优点和缺点1.相似度计算困难;2.大规模获取语言知识的代价非常大,对于词法、语法和语义规则的概括难以全面。1、不需要编写规则;2、系统容易维护;3、容易产生高质量译文;4、需要的相关语言知识少。3.覆盖率低4.存在匹配错误和对齐问题机器翻译方法分类小结机器翻译方法分类小结小结小结基于规则和基于语料库的机器翻译方法优缺点各异,使用不同方法研制的机器翻译系统的性能表现也不尽相同, 对译文质量的保障

22、程度深浅不一,翻译精度也还不尽如人意。如何通过规则和语料库方法的有机结合,实现相互取长补短的新理论和新方法,是机器翻译研究人员普遍关注的研究热点。(一(一) 回顾回顾 一般机器翻译的方法一般机器翻译的方法语言学原理机器自动识别语法调动存储的词库自动对应翻译机器翻译结果文本因语法、词汇、句法发生变化或不规则,出现错误在所难免机器翻译存在的问题机器翻译存在的问题 翻译质量还还不够高(二(二)机器翻译存在问题机器翻译存在问题机器翻译存在的问题机器翻译存在的问题1.误差难免例例1.大话西游中:“给我一个杀你的理由, ”先状语后置Give me a reason to kill you ,first.Give me a reason to kill you ,first.机译机译结果:结果: 翻译的结果还不够可信正确正确结果:结果:Firstly , give me a reason to kill you.Firstly , give me a reason to kill you.翻译的系统还不够方便语种的支持还不够多例例2.“最是那一低头的温柔,恰似一朵水莲花不胜凉风的娇羞。”-徐志摩徐志摩The most is the head of tenderness

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论