计算机辅助翻译概述 xg_第1页
计算机辅助翻译概述 xg_第2页
计算机辅助翻译概述 xg_第3页
计算机辅助翻译概述 xg_第4页
计算机辅助翻译概述 xg_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、计算机辅助翻译概述 第一页,共二十六页。第二页,共二十六页。第三页,共二十六页。语言服务人才技能语言基础交流沟通行业知识项目经验职业道德IT技术现代语言效劳人才素质需求第四页,共二十六页。过硬的英中文表达、转换能力信息技术根底知识熟练利用多种网络检索技术来获取信息和知识熟练掌握各类辅助翻译/电子工具熟练根本的翻译规那么和流程知识广博,并且精通某一行业领域的知识能够承受工作压力,按照客户要求及工程方案控制工程进度和质量团队协作精神贯穿整个翻译工作流程,翻译、编辑、校对、工程、测试等恪守职业道德,敬业态度、忠诚、责任心、细心、保密 平安新一代语言效劳人才素养要求第五页,共二十六页。第六页,共二十六

2、页。1.信息技术支持2.协同翻译模式3.标准工程管理4.市场需求导向文本处理、机器翻译、翻译记忆、术语库、语料库、百科全书、在线词典、搜索引擎、专业资料等协同翻译、角色分工、资源共享角色分工、行业标准关注市场需求、实用文体、专业翻译我们的教学与现实的差距?第七页,共二十六页。HT Human TranslationCAT Computer-aided Translation MT Machine Translation几个术语第八页,共二十六页。IT:自动化程度划分人机结合,各得其所Hutchins & Somers, 1992参见短片:认识不同的翻译软件 什么是CAT第九页,共二十六页。参见

3、 冯志伟?机器翻译研究?2004.中国对外翻译出版公司制造一种机器,让使用不同语言的人无障碍地自由交流,一直是人类的一个梦想。MT早于计算机(1629,笛卡尔)机器翻译的研究始于上世纪四十年代。机器翻译(Machine Translation):利用计算机及其软件把一种语言(自动)翻译成为另外一种语言的技术。MT:开展历程第十页,共二十六页。MT:开展历程1933-1954, 初创阶段1949年,Warren Weaver提倡MT研究翻译的过程可用解密过程(decoding)来类比1954-1966,开展阶段Georgetown+IBM 第一个俄英翻译实验1966-1976低潮难以跨越的 “语

4、义障碍(semantic barrier),机器翻译很困难,这个结论来之不易ALPAC(自动语言处理参谋委员会,Automatic Language Processing Advisory Committee)报告1976-复苏第十一页,共二十六页。机器翻译研究的开展历程70年代,机器翻译研究开始复苏TAUM-METEO系统获得成功欧共体启用SYSTRAN系统人工智能、知识工程进展的影响。80年代,机器翻译研究呈繁荣局面,系统产品出现日本实施五国合作的ODA方案欧盟实施Eurotra方案多个公司推出了MT产品机器翻译方法的进展90年代,平台. 难以提高,新方法出现1999. 统计MT突破机器翻

5、译方法的多样化第十二页,共二十六页。机器翻译的理论根底或类型:Rule/StatisticsWhenever I fire a linguist, our system performance improves 1988Some of my Best Friends are Linguists. 2004 Frederick JelinekJulian Sinclair Smith Professor, Department of Electrical and Computer EngineeringJohns Hopkins University Yorick Wilks Professor

6、 of Artificial IntelligeceDepartment of Computer ScienceUniversity of SheffieldStone soup第十三页,共二十六页。MT是语言学问题词序I have enjoyed hearing about your experience in Africa.多义词 spririt介词The fish was bought by the cook/river. 连词and 问题It is necessary to study the history and grammar of Chinese language.参见刘涌泉

7、1997I saw a girl with a telescope in the bank.第十四页,共二十六页。理性主义的规那么-智能法直接转换 transfer中间语言interlingua经验主义的语料统计法统计机器翻译 statistical MT基于实例的机器翻译Example-based MT词典+规那么语料+统计Give me enough parallel data, and you can have translation system for any two languages in a matter of hours. Franz Joseph Och Stone sou

8、p “统计+规那么英汉机器翻译测试大纲 (俞士汶)机器翻译的根本类型第十五页,共二十六页。基于实例的机器翻译Example Based Machine Translation(EBMT) 1984年由日本著名机器翻译专家长尾真提出 背景建立在转换根底上的机器翻译系统,在差异较大语言对间进行互译时,效果不好人在翻译时不做深层次语言学分析人在学外语的时候,首先要作大量的对照记忆,在遇到新的句子时,会和记忆中的句子类比建立基于类比思想的机器翻译第十六页,共二十六页。基于实例的机器翻译根本思想主要知识库是双语对照的实例库当需要翻译一个新句 子时,通过检索的方法在实例库中寻找和该句类似的翻译实例。新句子

9、的翻译可通过模拟最类似的实例的译文的方式获得。第十七页,共二十六页。基于实例的机器翻译EBMT的优点系统维护容易* 系统中知识以翻译实例和义类词典等形式存在,可以很容 易的利用增加实例和词汇的方式扩充系统。容易产生高质量的译文* 尤其是利用了较大的翻译实例或和实例精确匹配时更是如 此。可防止进行深层次的语言学分析第十八页,共二十六页。基于实例的机器翻译EBMT的关键问题 大规模的双语语料库 双语对齐问题* 语篇、句子、短语和词汇等各种级别 建立合理的相似度准那么 高效的实例检索机制 译文生成翻译记忆技术和基于模板的翻译技术第十九页,共二十六页。基于统计的机器翻译Statistic-Based

10、Machine Translation(SBMT) 50年代初曾有提及,遭到以Chomsky为代表的语言学家的反对90年代初,统计翻译技术复苏 统计技术在语音识别领域获得成功 目前计算机性能已能胜任密集型计算 目前也有大量联机双语电子文本第二十页,共二十六页。不能完全指望机器翻译词典词库广泛性:收录够不够词条描写性:框架适宜不适宜词典适应性:加载不同属性词典规那么规那么广度与精度规那么冲突的解决数据是否有足够多的语料是否有较好的算法Will you marry me新造词是否有对应译法? 不折腾嫁给我/娶我mouse第二十一页,共二十六页。关于CAT全自动高质量翻译FAHQT不行,CAT呢计算

11、机辅助翻译的主体是谁?计算机辅助翻译的主体是人。相比照较容易,很实用。人机结合,各得其所机器储存、记忆能力人工智能核心:翻译记忆(相似性的评判标准)适用于标准、重复性高的文本.Eg. Office 2003 Office 2007 Documents尽可能大而全的语料、尽可能好而快的算法.第二十二页,共二十六页。狭义与广义翻译技术翻译技术表达为一组翻译工具,是假设干软件工具的集合。计算机辅助翻译CAT关注的是“如何应用计算机软件,最大限度地实现翻译流程的自动化,提高人工翻译的效率,保证人工翻译的质量,并能够管理翻译流程第二十三页,共二十六页。CAT,范围较广,但凡有助于翻译的IT工具上传下载:

12、 Email /FTP/ Portal虚拟系统:登陆客户方系统翻译杀毒防毒: kaspersky, 360;网络收藏夹:资源分类和整理即时交流: MSN, Skype、QQ系统管理: 分割、压缩(WinZip、WinRar)文档分类管理多媒体工具:Open Subtitle Translator辅助写作工具: Arbortext排版工具:处理不同格式资料备份与同步:输入法:手写阅读浏览 PDF文本处理工具: Word、UltraEdit、EditPlus,文字处理常用的快捷键文字识别 OCR文档处理工具(文档转换): SnagItSpell checkerGrammar checkerDictionary搜索工具Full-text search google电子词典Concordancer (语料库)Bitexts第二十四页,共二十六页。第二十五页,共二十六页

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论