




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
。例如:心宽体胖。机器翻译:laughandfat.人工翻译:laughandgrowfat.举例展示的机器翻译缺少了对体胖的准确解释。机器翻译只能使用基于目标语言和源语言之间的形式和文字含义或浅层含义的文字翻译,这使得无法复现源语言文本中成语的语用含义。机器翻译还有一个避无可避的难点,那就是多义词的选择,中文有一些词汇是具有一词多义的,例如文字“听”,既有作为动作倾听的意思,也有作为量词,一听啤酒的意思。机器人翻译理论认为,在机器人翻译中,人类的语言可以作为“地基”。对齐语料是实现机器翻译的关键。之所以能够顺利地完成这一任务,主要有以下几个方面:基于对齐语料库,计算机对汉英汉英语料进行了全面的研究。同时,在英汉两种语言对齐的人工译文中,也会影响到机器翻译的品质。对一种原语的全面了解,是一切高品质翻译的前提,因为它不具备与人一样的文化和逻辑思维的力量,人类的思维也理所当然不被机器所理解,这也正是机器翻译难以出现高质量译文的原因。这时,必须要有人类的帮助。后期润色和编辑是人类介入机器翻译的主要形式。翻译后编辑仅意味着编辑和处理由机器翻译生成的翻译,从而使不符合目标语言规范的文本变得更真实,“更干净”,更流畅,更美观,并且方便人类理解和接受。正是由于以上种种原因,汉英辅助翻译系统才有研究意义,通过机器翻译和人工翻译的互补来促进翻译的发展。国内外研究现状根据机器人翻译中所蕴含的哲学理念,可以将其归纳成理性与实证两大类型。两大学说各自发展出了各自的机器人翻译理论,即以规则为基础的机器人翻译与以语料库为基础的机器人翻译。从人工翻译的观点来看,基于规则的方法提倡用电脑程序编写译文,并采用电脑程序来完成。因为过于依靠人的体验和认知,所以它的普适性并不高,只适用于特定的专业。根据能否直接使用的数据,可以将基于语料库的方式划分为EBMT和以计算机为基础的计算机翻译(SBMT)。第一个概念是1984年口本研究者长尾真提出来的,它的中心理念是通过使用匹配事例进行检索和参考,因而受语料库的庞大程度的制约,IBM的Brown等人于1990年推出的,它的设计理念是通过语料库来直接提取,并且还可以从语料库中提取出一些没有的译文,这样就可以帮助统计模型进行推理和融会贯通。计算机统计是一种比较完善的翻译方式,包括词汇的翻译模式、短语的翻译模式、层级的短语和句法的翻译模式。统计机器翻译具有良好的一般功能,同时也解决了传统的检索过程中遇到的困难,曾一度成为谷歌、百度等企业的网络翻译的关键技术。本文的主要研究内容该系统设计过程中利用Python,MySql,Qtdesigner等主要软件开发技术对汉英辅助翻译系统进行设计,实现对文本的在线翻译。汉英辅助翻译系统的设计汉英辅助翻译系统的需求分析汉英辅助翻译系统要求能做到能够判断输入文本的语言种类,并且能够翻译常见文本,无论是单行文本,还是批量文本,都能做到基本表达到原文本的完整内容。词库管理,汉英辅助翻译系统要求有3张表,一张生词表,用于管理生词,这段要求有单词,单词的含义与备注。一张短语表,字段要求有短语,短语的含义,与备注。一张喜欢的句子表格。字段要求有句子,含义,备注。各张表关系图如图2-1,图2-2,图2-3所示。图2-1生词表E-R图图2-2短语表E-R图图2-3句子表E-R图与此同时,汉译英辅助翻译系统要求尽量做到轻量级,界面简单。学习使用成本低,运行配置简单,低配电脑也能流畅运行。汉英辅助翻译系统的设计汉英辅助翻译系统分为两部分设计。第1部分是翻译功能模块。第2部分是词库管理功能模块。翻译部分,为了轻量便捷的考虑,这一部分的功能需求,决定使用API实现。文本输入和结果输出都采用槽函数实现。词库管理模块选择MySQL数据库,在数据库中创建3张表,并通过数据库可视化软件Navicat来实现对数据库中各种表格的操作,实现连接。汉英辅助翻译系统的界面设计由QTdesigner来设计,并为每个控件设置槽函数来实现对按钮的功能。汉英辅助系统的活动图如图2-4所示。图2-4汉英翻译辅助系统活动图汉英辅助翻译系统将设计两个类,一个为UI界面设计,另一个为界面按钮槽函数的功能实现,UML类图如图2-5所示。图2-5汉英翻译辅助系统类图汉英辅助翻译系统程序的总体流程图如图2-6所示。图2-6汉英翻译辅助系统流程图汉英辅助翻译系统各功能模块汉英辅助翻译系统的翻译功能API选择:翻译模块的实现由API实现功能,再设置输入文本和输出结果显示,如今机器翻译十分发达,在API上的选择有很多,谷歌翻译作为国内外享誉最盛的翻译软件,是第一选择,根据查询的文献,经过仔细研究,我发现谷歌翻译的翻译规则是基于语法规则。它的工作本质是通过结合统计再结合多于语种行语料库的平行语料库,创建大数据分析,去解析各种语言之间的内在规律。由训练好的模型来决定翻译的结果。因特网技术发展迅速。这让谷歌在网络上的数据越来越多,它的特点也越来越突出:海量数据库,不但海量,还包括文字、图片和语音。虽然谷歌翻译的技术已经十分发达。但也面临着许多问题。统计机器翻译都有的不足:翻译的结果不确定。一些文档翻译的结果恰到好处。但有一些参与的结果却不尽人不同题材的文本翻译效果同样不确定。例如政治新闻比体育新闻更好翻译。这些问题。全球的翻译技术都没能很好的解决。由于以上原因,不能仅仅因为谷歌翻译名气大便选择它,更需要详尽数据的支撑。由第二章2.4小节常见app翻译对比分析和图2.11到图2.29可得出结论,腾讯翻译君的翻译结果最符合期待,只有腾讯翻译君的翻译结果做到了基本语意的正确翻译,例如活着感到快乐世界就属于你这句话的汉英互译都做到了完整的对应,且在多义词的选择上符合最优选择,例如四海依旧清平中清平的含义最接近clam,其他翻译软件的选择多是clean和clear,这两个单词的意思更接近于干净,清澈,清晰,而且其他软件还没有将依旧翻译过来。根据在腾讯云官方网站查询得知,在此基础上,基于大量的双语语料库的自动学习,使其能够完成从原始语篇到目的语篇的自动化转换。经过仔细且慎重的考虑,最终选用了腾讯云机器翻译的API。汉英辅助翻译系统词库管理模块UI界面设计为一个Tabwidget,其内包含三个展示页面,每个页面由tablewidger和四个按钮组成。每个页面的按钮都有对应的槽函数。生词表对应的四个按钮函数btn_nwod_show,该函数用于查询生词表并将生词表中数据展示在TableWidget_nword之中;btn_nword_add,该函数用于添加数据到TableWidget_nword,btn_nwod_del,用于从TableWidget_nword中删除数据,btn_nword_modiefy,用于修改数据,UI框架图如图2-7所示。图2-7词库管理UI框架图数据库设计MySql数据库名字是test,其中设置了三张表如图2-8所示。图2-8数据库结构生词表结构如表2-1所示。短语表结构如表2-2所示。喜欢的句子表结构如表2-3所示。表2-1生词表结构名类型长度是否非空WordVachar255是MeaningVachar255是RemarksVachar255否表2-2短语表结构名类型长度是否非空PhraseVachar255是MeaningVachar255是RemarksVachar255否表2-3喜欢的句子表结构名类型长度是否非空SentenceVachar255是MeaningVachar255是RemarksVachar255否汉英辅助翻译系统的实现UI界面的实现UI界面如图3-1所示。图3-1汉英辅助翻译系统UI界面实现主要功能描述:设置主界面的UI,两个标签,两个文本输入输出框,一个TabWidget中设置三个页面,在每个页面设置了四个按钮,一个TableWidget。翻译功能的实现汉译英效果如图3-2示。英译汉翻译效果如图3-3示。图3-2汉英辅助翻译系统汉译英实现图3-3汉英辅助翻译系统英译汉实现主要功能描述:进行语种识别,返回信息。(2)代码二:主要功能描述:得到语种识别的结果,设置汉英互译的参数,根据输出结果来确定调用机器翻译的参数,最后将得到的结果返回第二个文本框。词库管理功能的实现查询数据库生词表的效果实现如图3-4所示。增加数据库生词表数据的效果实现如图3-5示。删除数据库生词表数据的效果实现如图3-6所示。修改数据库生词表数据的效果实现如图3-7所示。图3-4查询生词表实现主要特点:设定sql声明,运行,并在TableWidget中循环输出。图3-5增加数据生词表实现主要功能描述:获取已经选中行,将其中的数据添加到数据库。图3-6删除数据生词表实现主要功能描述:获取选中行第一列数据,依靠该数据作为MySql执行语句的参数,从数据库中删除数据并在列表中刷新显示。图3-7修改数据生词表实现主要功能描述:获取选中行行数,然后从表格中获取第一列数据,将其作为参数来执行MySql执行语句,同步修改数据库中数据。系统测试系统功能测试目前软件工程中测试分为3种:单元测试、白盒测试和黑盒测试。白盒测试是测试程序里的代码,通过输入数据,让程序走不同的分支流程,看是否达到想要的结果数据,进而加以修正,而不使用用户界面进行程序流程测试;黑盒测试不必通过检查程序的源代码或者很清楚地了解该软件的源代码程序具体是怎样设计的,只需要测试程序界面的流程功能。本章就列举两个白盒测试的例子,第一个是平台的验证绑定邮箱功能,描述本平台的测试过程,打开在线辅助翻译平台首页,点击登录按钮,进入登录页面,点击我的头像,我的账号。根据输入不同数据,来看是否测试用例能否满足需求,如表4-1所示:以下是对捆绑消息的测试案例的说明:1.在“绑定邮箱”上单击该选项;请输入信箱号码,验证代码单击“确认”键;输入一个相同的信箱号码,并按下确认密码;请键入非信箱的格式,并按下确认密码。如表格4-1所描述的那样,捆绑信箱测试:表4-1验证绑定邮箱用例测试用例编号测试内容测试步骤预期结果T001界面完整性测试打开在线辅助翻译平台首页,点击登录按钮,进入登录页面,点击我的头像,我的账号页面元素完整,各功能按钮处于可操作状态T002正确性输入验证输入正确邮箱的邮箱号,验证码点击“确认'按钮弹框提示绑定成功T003重复邮箱验证输入重复的邮箱号,点击获取验证码提示邮箱已被使用T004非邮箱验证输入非邮箱格式,点击获取验证码提示请点击登录按钮T005判空验证没用输入任何数据,直接点击验证按钮系统提示用户请输入邮箱信息特性模块二,即时登记,确认伺服器端即时登记的能力。首先,开启联机助手在第一个翻译的页面上,单击“免费”的登记键,马上就可以登记了。请输入一个合法的信箱/移动电话号码、口令、验证代码,选择必需选项,然后单击“注册”键;请单击「取得验证密码」键;输入一个正确和有效的验证代码,然后单击“确定”。使用表格4-2来显示即时登记的测试。表4-2立即注册测试用例测试用例编号测试内容测试步骤预期结果rooi界面完整性测试输入正确合法的邮箱/手机号,密码,验证码,勾选必选框,点击“注册”按钮。页面跳转,邮箱/手机号验证roo2功能性输入验证点击“获取验证码”按钮。手机会有短信提示roo3功能性测试输入正确且有效的验证码,点击“确定”按钮。弹框提示绑定成功测试结果其中,每个模块的功能都是大同小异的,我们选择了一个具有典型意义的模块,对其进行了功能和性能的检测。服务程序使用了CentorOS操作系统、tomcatweb服务器、mysql数据库存储器、elasticsearch群集搜索引擎、客户机应用Win7操作系统,FirexfoxFirexfox,用户可以在电讯中使用TCP/IP协议进行连接,所有的功能组件运行良好,数据传输准确率高。
结束语对汉英辅助翻译系统的设计,让我充分的感受到了机器翻译的魅力。基本实现了对翻译本文的汉译英和英译汉,能够对输入文本的语种进行识别。词库管理在设计UI界面的时候也遇到了一些问题,选择实现词库管理的时候,有考虑到做多界面还是但界面跳转页面的问题,但处于系统轻量级且便捷性要求的考虑,最终选择了单界面多页面的选择,使用了TableWidget。而MySql数据库和程序的连接也十分成功,对数据库的操作基本的增删查改通过槽函数链接按钮也实现了。通过对汉英辅助翻译系统的测试,实现了人工翻译和机器翻译的互补,人工翻译可以为机器翻译润色和修改,机器翻译又为人工翻译节省了大量的工作量,而且由于机器翻译的工作原理是基于语料库,人工翻译又反过来为机器翻译做出了贡献,达到了为其润色的效果。
致谢在本次论文设计过程中,老师对该论文从选题,构思到最后定稿的各个环节给予细心指引与教导,使我得以最终完成毕业论文设计。在学习中,老师严谨的治学态度、丰富渊博的知识、敏锐的学术思维、精益求精的工作态度以及侮人不倦的师者风范是我终生学习的楷模,导师们的高深精湛的造诣与严谨求实的治学精神,将永远激励着我。其次,还要感谢我的父母,他们给予我无微不至的关怀与支持,给予我充分的物质保障和精神鼓励,支持我完成学业,增强面对生活和挫折的勇气与信心。最后,还要感谢我的同学,衷心感谢他们给予我工作和学习中的支持、信任与帮助,我将永远铭记于心。
参考文献[1]李毓丽,黄泽楷.基于Fields-Mapping的教师档案管理系统设计[J].电脑知识与技[1]张菊玲.基于特征提取算法
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025“阴阳合同”的处理原则
- 2025翡翠首饰买卖合同模板
- 2025国际石油工程建设项目合同(中英文对照)
- 2025食品采购合同
- 2025关于软件升级的服务合同范本
- 2025实习生合同协议书
- 2025保险公司担保合同样本2
- 2025年商业地产租赁合同
- 2025年增亮膜项目合作计划书
- 2025年地质勘查专用设备项目建议书
- 期中模拟卷(新疆专用)-2024-2025学年八年级英语下学期核心素养素质调研模拟练习试题(考试版)A4
- 甲状旁腺切除术后的护理措施
- 2024慢性鼻窦炎诊断和治疗指南解读课件
- (T8联考)2025届高三部分重点中学3月联合测评生物试卷(含答案详解)河北版
- 员工入职申请表(完整版)
- T-GDEIIA 56-2024 垂直起降低空航空器起降场基础设施配置技术要求
- 整本书阅读《林海雪原》【知识精研】六年级语文下册 (统编版五四制2024)
- 9《我的战友邱少云》说课稿-2024-2025学年六年级语文上册统编版
- 亚朵酒店前台培训
- 大学假期安全主题班会课件
- 创业培训讲师手册
评论
0/150
提交评论