版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Computer-AssistedTranslationTranslationMemoryToolsMachineTranslationTheCorpus-BasedApproachTranslationMemory(翻译记忆)NotMachineTranslation(MT)Esselink:“Atechnologythatenablestheusertostoretranslatedphrasesorsentencesinaspecialdatabaseforlocalre-useorshareduseoveranetwork.TMsystemsworkbymatchingtermsandsentencesinthedatabasewiththoseinthesourcetext.Ifamatchisfound,thesystemproposestheready-madetranslationinthetargetlanguage.”技术原理:用户利用已有的原文和译文,建立起一个或多个翻译记忆库(TranslationMemory),在翻译过程中,系统将自动搜索翻译记忆库中相同或相似的翻译资源(如句子、段落),给出参考译文,使用户避免无谓的重复劳动,只需专注于新内容的翻译。翻译记忆库同时在后台不断学习和自动储存新的译文,变得越来越“聪明”,效率越来越高。几乎所有翻译记忆厂家都会告诉用户:有了TM,你永远不必对同一句话翻译两遍!翻译记忆优缺点:翻译质量有保证随着使用时间匹配成功率逐步提高特别适用于重复率高的文本翻译,例如公司的产品说明书的新版本翻译与语言无关,适用于各种语言对缺点是匹配成功率不高,特别是刚开始使用时CurrentexamplesofTMtoolsSDLTradosStudio2009/2011/2014Wordfast(Classic/Pro)TransitNXTDVXOmegaTMemoQ
AcrossMultiTrans
SDLTradosStudio
SDL
Trados是世界上最流行的计算机辅助翻译(CAT)软件,在全球拥有13万多客户,全球500强企业有超过90%的公司都在使用SDLTrados来为日常的本地化翻译工作服务,SDLTrados为他们克服了在不同国家地区的文化、语言障碍,从而为他们的全球化铺平了发展道路。
用户:微软、Cisco、Intel、HP、Compaq、DELL、Oracle、SAP、宏碁(Acer)、德国大众、上海大众、西门子、朗讯、北方电讯、Wal-Mart(沃尔玛)、联合国、欧盟、国际货币基金组织、雅虎、新浪、深圳华为、深圳中兴、上海贝尔阿尔卡特、广州石化等。MachineTranslation国内市场上的翻译软件(四大类):全文翻译(专业翻译):雅信CAT2.5
在线翻译:火云译客、金山快译.net2001、华建的“翻译网上通”
汉化软件:东方快车3000
电子词典:金山词霸.net2001
金山快译:我过去一直有三辆汽车。我无法在我的小车库中使他们保持所有的。我停车了在我的房子周围的某处。但是我昨天偷一辆汽车。东方快车:我过去常有3辆汽车。我都不能把他们放在我的小车库。在我的房子附近我停车了某地。但是我把了一辆汽车昨天被偷窃。例:
Iusedtohavethreecars.Icouldn’tkeepthemallinmysmallgarage.Iparkedsomewherearoundmyhouse,butIhadacarstolenyesterday.例:Hewasintheseventhheavenlastnight.金山快译:他昨晚是在第七天堂方面;东方快车:昨晚他在第7天堂;参考译文:昨晚他欣喜若狂。
Yourbrainhastwoparts:theleftandtheright.Yourleftbrainhasnothingright,andyourrightbrainhasnothingleft。
你的大脑有两部分:左边的和好的。左脑有什么权利,你的右脑有一无所有
你的大脑有两部分:左和右。你的左脑没有正确的,你的右脑没剩下什么东西。(白痴,脑残,胸无点墨)MT限制:人名翻译习语翻译文学作品翻译成语典故的翻译存在语义歧义时人名:金庸LouisCha—JinYong
彭定康——Patten(ChristopherFrancispattern)LarryPage(拉里·佩奇)——佩奇习语:海誓山盟-eternal
asolemnpledgeoflovetocarrycoaltoNewcastle
运煤到纽卡斯尔祸起萧墙(Troublebreaksoutathome)Harris别狗咬吕洞宾,不识好人心。MT:Thedogbitelvdongbindoesnotknowgoodhearts.
HT:Don'tbitethehandthatfeedsyou.成语典故:文学作品:明月几时有,把酒问青天MT:Whenthemoonis,wineaskbluesky.HT:Whenwillthemoonbeclearandbright?Withacupofwineinmyhand,Iaskthebluesky.Shesailedintotheroom.有道:她顺利地进了房间。参考:她仪态万方的走进了房间。歧义:他说:“她这个人真有意思(funny)”。她说:“他这个人怪有意思的(funny)”。于是人们以为他们有了意思(wish),并让他向她意思意思(express)。他火了:“我根本没有那个意思(thought)”!她也生气了:“你们这么说是什么意思(intention)”?事后有人说:“真有意思(funny)”。也有人说:“真没意思(nonsense)
”。语料库(Corpora)的定义按照一定的原则组织在一起的真实的自然语言数据(包括书面语和口语)的集合,主要用于研究自然语言的规律,特别是统计语言学模型的训练以及相关系统的评价和评测。一个由大量在真实环境中使用的语言信息所集成的专供研究使用的资料库。Corpus-basedsystem
基于语料库的机器翻译系统概念:不同于基于规则的机译系统由词典和语法规则库构成翻译知识库,基于语料库的机译系统是以语料库的应用为核心,由经过划分并具有标注的语料库构成知识库,以统计规律为主。分类:
(1)基于统计(Statistics-based)的机器翻译
(2)基于实例(Example-based)的机器翻译基于统计(Statistics-based)的机器翻译统计机器翻译的基本思想是通过对大量的平行语料进行统计分析,构建统计翻译模型,进而使用此模型进行翻译。通俗地说,源语到目的语的翻译是一个概率统计问题,任何一个目的语句子都有可能是任何一个源语句的译文,只是概率不同,机器翻译的任务就是找到概率最大的句子。具体方法是将翻译看做对原文通过模型转换为译文的解码过程。
1、模型问题:就是为机器翻译建立概率模型,也就是要定义源语到目的语的翻译概率的计算方法。
2、训练问题:利用语料库来得到这个模型的所有参数。
3、解码问题:在已知模型和参数的基础上,对于任何一个输入的源语言句子,去查找概率最大的译文我是一个学生Iamastudent词语对齐实例源短语表短语组合表例句:Wedochickenright.1.我们做鸡是对的。2.我们做鸡正点耶。3.我们就是做鸡的,我们有做鸡的权利。4.我们只做鸡的右半边。5.我们可以做鸡,对吧?6.我们行使了鸡的权利。7.我们只做右边的鸡。8.我们让鸡向右看齐。9.我们只做正版的鸡!10.只有朝右才是好鸡。11.我们有鸡的权利!12.只有我们可以做鸡!13.我们“正在”做鸡好不好?14.向右看,有鸡。15.我们让鸡变右撇子。16.我们一定要把鸡打成右派!17.我们做的是“右派”的鸡!(麦当劳做的是“左派”的鸡!)18.我们只做右撇子鸡!19.我们干鸡的右边。20.我们把鸡搞正!(原来是歪的)21.我们“躲”在鸡的右怀里。22.我们做鸡,怎么啦?23.鸡的左边留给麦当劳干。24.我们知道怎么做鸡。25.我们知道如何做“鸡”。26.鸡做得对!27.你知道我们正在做鸡。28.我们只做正点的鸡!29我们烹鸡的方式最正确。/我们是烹鸡专家。应用:Google的在线翻译已为人熟知,其背后的技术即为基于统计的机器翻译方法,基本运行原理是通过搜索大量的双语网页内容,将其作为语料库,然后由计算机自动选取最为常见的词与词的对应关系,最后给出翻译结果。此外,Bing翻译和百度翻译等优缺点:翻译质量的高低主要取决于概率模型的好坏和语料库的覆盖能力。基于实例(Example-based)机器翻译提出:最早是由日本的机器翻译专家长尾真1981年提出的。基本思想:在已经收集的双语实例库中找出与待翻译部分最相似的翻译实例,再对实例的译文通过替换,删除或增加等一系列变形操作,实现翻译。基于实例的机器翻译系统主要由两个数据库(实例库和同义词库)以及两个模式(检索模式和调整模式)组成。
实例库(双语语料库)同义词库(语义词库、词典词库)↙↘↙↘待翻译句子→相似实例检索→重组与调整→翻译结果待翻译句子:Fathergoestobedat11intheevening.相似句子:Mothergetsupat6inthemorning.
母亲早上六点起床。重组调整:父亲晚上11点上床。我给玛丽一支笔——IgaveMaryapen.我给汤姆一本书——Ig
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 文件传输课程设计源代码
- 《基于三苯胺和蒽的高效荧光材料的激发态性质及光电特性研究》
- 《悬疑影展创办的可能性研究》
- 幼儿园社会食物课程设计
- 《吉林国文医院员工激励体系优化研究》
- 《吉林省普惠金融发展的减贫效应评价研究》
- 幼儿牙齿涂氟课程设计
- 《整体叶盘振动式抛磨流场的离散元仿真研究》
- 《当代“新工笔”人物画艺术创作研究》
- 《兴化市西门历史街区微更新设计研究》
- 工业制造企业战略规划
- 辽宁省工程咨询集团有限责任公司 笔试 题库
- 2023年某公司新建标准厂房工程技术标
- 2024年面向社会公开招聘警务辅助人员报名信息表
- 小学2024年秋季学生1530安全教育记录表(全学期)
- 2025年全国高考体育单招考试模拟政治试卷试题(含答案)
- 期末测试卷(试题)-2024-2025学年人教PEP版(2024)英语三年级上册
- 2024年中国气象局气象宣传与科普中心招聘历年高频考题难、易错点模拟试题(共500题)附带答案详解
- 完美着装智慧树知到期末考试答案2024年
- GA 1811.1-2022传媒设施反恐怖防范要求第1部分:媒体机构
- 曼昆《经济学原理》(微观经济学分册)第8版 全部答案
评论
0/150
提交评论