版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
外12级11班李佩1204021134赵思雨1204021130从《勒曼谈机器翻译》出发谈机器翻译机器翻译的概念机器翻译的发展道路
机器翻译方法简介
机器翻译存在的问题关于机器翻译的几点思考目录(一)概念理解机器翻译(machinetranslation),又称为自动翻译,是利用计算机把一种自然源语言转变为另一种自然目标语言的过程,一般指自然语言之间句子和全文的翻译。机器翻译的概念·很久以来,人们就梦想着有朝一日,能造出一种设备,清除人类交流过程中的“语言障碍”,使得使用不同语言的人能自由地相互交流。·在当代信息社会,语言障碍问题更加突出。大量的政府文件、商业以及科技资料都需要在短时期内得到翻译,互联网的问世更是扩大了翻译需求。机器翻译应运而生。(二)产生(四)工作原理机器翻译的原理简单地说就是让机器模拟人的翻译过程。
----《中国的机器翻译》在存储器中存储机器词典和机器与法查词典选择所需要意义明确各个词间的关系组成译文翻译时翻译前(三)可实现性·机器翻译之可能实现,还在于语言的可译性和翻译工作的可模拟性。
----《中国的机器翻译》·一种语言有许多句子可以很容易地作为整个单位译成另一种语言。----《勒曼谈机器翻译》机器翻译的概念???机器翻译是语言学、数学、计算机技术、自动化等科学部门共同研究的对象。----《中国的机器翻译》(三)涉及领域提供词典和语法则研制便于翻译的计算机解决外部设备问题语言学工作者自动化工作者将材料代码化和程序化机器翻译的概念数学工作者计算机工作者机器翻译的发展道路开创期(1947-1964)受挫期(1964-1975)恢复期(1975-1989)新时期(1990至今)发展道路1954年,美国乔治敦大学在IBM公司协同下,用IBM-701计算机首次完成了英俄机器翻译试验,拉开机器翻译研究的序幕。·1964年,美国科学院成立了语言自动处理咨询委员会。·1966年11月,该委员会公布了一个题为《语言与机器》的报告,建议停止对机器翻译项目的资金支持。开创期(1947-1964)受挫期(1964-1975)恢复期(1975-1989)新时期(1990至今)发展道路·国与国之间的语言障碍显得更为严重,传统的人工作业方式已经远远不能满足需求。·计算机科学、语言学研究的发展,从技术层面推动了机器翻译研究的复苏,机器翻译项目又开始发展起来·人们对于机器翻译的需求空前增长,机器翻译迎来了一个新的发展机遇,国际性的关于机器翻译研究的会议频繁召开。·在市场需求的推动下,商用机器翻译系统迈入了实用化阶段,走进了市场,来到了用户面前。机器翻译的发展道路《勒曼谈机器翻译》机器翻译设想语言模式和理论程序编制机器翻译方法分类基于规则的机器翻译基于统计的机器翻译基于实例的机器翻译机器翻译的方法简介《勒曼谈机器翻译》语言的语法和词典是能够规范得十分完善是计算机能够利用它们。一、机器翻译设想语言学家必须精确地规定计算机所遵循的程序和它处理的语言材料的程序必须制定一种语言模式和理论所涉及语言的语法所涉及语言的词典《勒曼谈机器翻译》二、语言的模式和理论语言的主要困难也许就是以一系列不同平面或层次形式出现的语言结构,语言学家常把这种结构称作层次结构。例1.逐词译法源语言(德语)目标语(英语)DiesekurzegemeinsameüberlegungisteineArtExperientmitunsselbstgewesen.Thisshortjointreflectionhasbeenakindofexperimentwithourselves.Hasakindofjointexperimentwithourselvesbeen.(逐词译法)例2.《勒曼谈机器翻译》/s/与/z/在语言不同部分的作用1)在语音系统中2)在语法系统中zip/s//z/sipprice/s/prize/z/可数名词复数:dogs/z/cats/s/第三人称单数:Hetakes/s/BusNo.4toschool.
Hebuys/z/asinglenewshirteachmonth./s/和/z/是不同的项目/s/和/z/在某些情况下是等值的语言的不同部分中同一项的作用是有差别的例3.《勒曼谈机器翻译》动词go的意义2)He’sgoingtomorrow.3)He’sgoingsteady.1)He’sgoingtotown.Heisbeinginlove.走,离开为了简单的说明意义上的差别,可以比照语音层次和语法层次,设置语义层次和语法层次。《勒曼谈机器翻译》美国德克萨斯大学语言研究中心的分析系统和程序编制系统,就是把语言看做层次体系的。词汇层次语义层次句法层次处理语言的单词把形式单位聚合在一起把单词彼此加以联系例4.美国德克萨斯大学语言研究中心三、程序编制《勒曼谈机器翻译》装置一装置二装置四装置三处理计算机所提出的要求(接收器)处理要加工的语言材料处理计算机所产生和存储的语言把对材料的分析与第二种语言所期望的分析相匹配听进语言材料同语言知识相匹配程序的两个目的:1)对材料按词汇、句法和语义等不同层次加以分析2)把这种分析通第二种语言所期望的分析相匹配目的一目的二《勒曼谈机器翻译》小结·《勒曼谈机器翻译》一文谈到了机器翻译的可实现性及其在文学作品翻译方面的局限性。·文章用简洁生动的语言介绍了机器翻译的设想依据、机器翻译对语言的要求、程序的编制等问题。·但文章对机器翻译方法的分类和技术处理等具体问题的介绍仍有不足之处。机器翻译方法分类基于规则的方法(SBMT)基于实例的方法(EBMT)基于规则的方法(RBMT)基于语料库方法(CBMT)机器翻译的方法(MachineTranslation/MT)机器翻译方法分类--RBMT·基于规则的机器翻译方法把翻译过程看作是一个在语言学知识引导下的符号变换过程。这种方法要求把有关源语言和目标语言的知识以计算机可以操作(“看懂”)的形式表示出来。--《机器翻译与语言研究》一、基于规则的方法·基于规则的机器翻译方法,主要是依靠语言学家总结归纳的语言翻译规则库,对源语言的句子进行语法、句法和词法词性分析,然后按照相应的语法规则进行判断和推导,最后生成等价的目标语言语句,得出翻译结果。--《基于实例机器翻译方法_EBMT_的分析与探究》(一)概念理解机器翻译方法分类(二)RBMT翻译过程机器翻译方法分类--RBMT源语言的分析转换目标语的生成(三)实例分析1)源语言的词法分析2)源语言词串的句法分析分析3)源语言到目标语言的句法结构转换4)目标语言结构的调整5)源语言文本单词的译词选择6)目标语言词串的生成以把“她把一束花放在桌上。”译为英语为例分析转换生成机器翻译方法分类--RBMT1)源语言的词法分析这一阶段利用源语言词汇层面的知识,识别出源语言文本字符串中的单词,并从词典中获得每个单词的句法语义知识,以备在后续处理中使用。她把一束花放在桌上。rpmqnvpngfw代词介词数词量词名词动词介词名词性语系方位词标点符号机器翻译方法分类--RBMT2)源语言词串的句法分析分析为得到句法结构以及跟结构相关的特征结构,这一阶段的处理需要运用句法层面的知识,指明了短语的组成关系。她把一束花放在桌上。rpmqnvpngfwspvpppnpmpnpppvpnpdjzj机器翻译方法分类--RBMT3)源语言到目标语言的句法结构转换结构转换主要利用源语言结构和目标语言结构之间的对应关系进行,通过一组转换规则的指导把源语言的句法树转换成目标语言的句法树。源语言目标语机器翻译方法分类--RBMT4)目标语言结构的调整通常经过结构转换得到的句法结构还保留着源语言结构的诸多痕迹,尚需根据目标语言的句法知识对该结构进行调整源语言目标语机器翻译方法分类--RBMT(三)RBMT的优点和缺点1.规则的主观性强,规则的一致性难以保障;2.知识获取难、工作量大;3.不利于系统扩充,尤其对非规范的特殊语言现象缺乏新理论和新方法相应的处理能力。1.不同语种在语法上的相似依存度很低、处理能力较强;2.具有对知识表达的抽象程度高、代表性强的特点;3.对文法结构具有很强的保持能力;
机器翻译方法分类--SBMT二、基于统计的方法(一)概念理解·SBMT是一种间接地使用语料库的机器翻译方法,将语料库作为获取翻译规则信息的依据,通过相关概率的计算,使用纯数学的方法对待译文本进行“翻译”(转换)。
----《基于实例英汉翻译系统研究与实现》·思想萌芽——Weaver发表的以《翻译》为题的备忘录中就提出:“当我阅读一篇用俄语写的文章的时候,我可以说,这篇文章实际上是用英语写的,只不过它是用另外一种奇怪的符号编了码而已,当我在阅读时,我是在进行解码。”机器翻译方法分类--SBMT·基于统计的机器翻译方法无需人工编写规则,直接从语料库中学知识,并将这些知识应用到句子的翻译中。--《基于双语句法短语的统计机器翻译研究》(二)SBMT分类基于统计的机器翻译方法大体上分为以下三类基于平行概率语法的统计机器翻译方法基于信源信道模型的统计机器翻译方法基于最大嫡的统计机器翻译方法机器翻译方法分类--RBMT基本思想是——把机器翻译看成是一个信息传输的过程,用一种信源信道模型对机器翻译进行解释。(二)基于信源信道模型的统计机器翻译方法S噪声信道T源语言目标语言输入输出机器翻译方法分类--SBMT(三)SBMT的优点和缺点1.资源丰富,易于实现;2.良好的统计翻译模型能够融合更多的句法结构和语义、语法信息;3.统计机器翻译的翻译性能可通过大规模语料训练进行改善。1.系统运行消耗的资源巨大,需要大规模双语平行语料库进行训练学习,语料的选择和处理工程量也很巨大。机器翻译方法分类--EBMT二、基于实例的方法·思想萌芽——长尾真指出:“人类在翻译一个简单句子的时候,并不会作深层次的语法分析,而是首先将源语句适当地分为若干短语片段然后再把这些短语翻译成目标语言,最后把翻译好的短语片段恰当地组合成为一个句子。而对每一个短语片段则是用相应的例子作为参考,通过类推原则进行翻译的。”模仿人类翻译外语过程中的基本模式将源语句分解为短语片段并在一个实例库的基础上对其进行匹配确定这些短语片段所对应的目标语言的短语片将翻译好的目标语言的短语片段进行适当重组,构成一个完整的目标语言句子(一)概念理解机器翻译方法分类--EBMT(二)基本原理·EBMT在译文转换时,从实例库中搜索出一个与输入句最相似的例句,并仿照实例库中例句的翻译方式进行输入句的翻译。源语言S最相似句S’模拟S’的译语T’构成S的译语T·一种语言中的任何一个句子都有可能是另外一种语言中某个句子的译文,只不过可能性大小不同,而取可能性最大的那个译文应该是风险最小的。——《基于语义语言机器翻译系统的若干问题的研究》机器翻译方法分类--EBMT(三)EBMT的优点和缺点1.相似度计算困难;2.大规模获取语言知识的代价非常大,对于词法、语法和语义规则的概括难以全面。1、不需要编写规则;2、系统容易维护;3、容易产生高质量译文;4、需要的相关语言知识少。机器翻译方法分类--小结小结·基于规则和基于语料库的机器翻译方法优缺点各异,使用不同方法研制的机器翻译系统的性能表现也不尽相同,对译文质量的保障程度深浅不一,翻译精度也还不尽如人意。·如何
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024农村建房承包工不包料合同
- 《REL微机保护》课件
- 2024互联网网站制作合同书
- 妇产科一般分娩护理查房
- 《急性阑尾炎实训》课件
- 2024水运工程施工监理合同范本试行
- 2024代理记账合同样本
- 2024某工程劳务分包合同
- 2024电设备合同能源管理合同范本
- 2024赠与合同样书
- 中外政治思想史-形成性测试四-国开(HB)-参考资料
- 沟通技巧与商务礼仪
- 18 奇妙的建筑 (教案)岭南版美术三年级上册
- 小学三通两平台汇报
- 防火巡查记录表防火检查记录表
- “校园周边环境安全隐患”自检自查(排查)记录表
- 高二上学期日语阅读四篇自测
- 大学生职业生涯规划成长赛道 (第二稿)
- JB T 6464-2006额定电压1kV(Um=1.2kV)到35kV行业标准
- 呼吸科健康宣教
- 人体身体成分健康分析报告
评论
0/150
提交评论