信息检索以及互联网在翻译中的使用(以Google为例)_第1页
信息检索以及互联网在翻译中的使用(以Google为例)_第2页
信息检索以及互联网在翻译中的使用(以Google为例)_第3页
信息检索以及互联网在翻译中的使用(以Google为例)_第4页
信息检索以及互联网在翻译中的使用(以Google为例)_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息检索以及互联网在翻译中的使用(以Google为例)授课人:电话:电子邮件:QQ:授课时间:2010年9月-2011年1月周二下午授课地点:2407教室单位:外国语学院网络基础知识随着计算机应用的深入,特别是家用计算机越来越普及,一方面希望众多用户能共享信息资源,另一方面也希望各计算机之间能互相传递信息进行通信。个人计算机的硬件和软件配置一般都比较低,其功能也有限,因此,要求大型与巨型计算机的硬件和软件资源,以及它们所管理的信息资源应该为众多的微型计算机所共享,以便充分利用这些资源。基于这些原因,促使计算机向网络化发展,将分散的计算机连接成网,组成计算机网络。计算机网络:是现代通信技术与计算机技术相结合的产物。所谓计算机网络,就是把分布在不同地理区域的计算机与专门的外部设备用通信线路互联成一个规模大、功能强的网络系统,从而使众多的计算机可以方便地互相传递信息,共享硬件、软件、数据信息等资源。通俗来说,网络就是通过电缆、电话线、或无线通讯等互联的计算机的集合。网络的功能:通过网络,您可以和其他连到网络上的用户一起共享网络资源,如磁盘上的文件及打印机、调制解调器等,也可以和他们互相交换数据信息。网络基础知识

网络的分类:按计算机连网的区域大小,我们可以把网络分为局域网(LAN,LocalAreaNetwork)和广域网(WAN,WideAreaNetwork)。局域网(LAN)是指在一个较小地理范围内的各种计算机网络设备互联在一起的通信网络,可以包含一个或多个子网,通常局限在几千米的范围之内。如在一个房间、一座大楼,或是在一个校园内的网络就称为局域网,广域网(WAN)连接地理范围较大,常常是一个国家或是一个洲。其目的是为了让分布较远的各局域网互联。我们平常讲的Internet就是最大最典型的广域网。

什么是网络协议:那么,网络上的计算机之间又是如何交换信息的呢?就象我们说话用某种语言一样,在网络上的各台计算机之间也有一种语言,这就是网络协议,不同的计算机之间必须使用相同的网络协议才能进行通信。当然了,网络协议也有很多种,具体选择哪一种协议则要看情况而定。Internet上的计算机使用的是TCP/IP协议。网络基础知识什么是Internet:到Internet海洋去冲浪,如今已成为一种时尚。每当我们拿起一张报纸、一本杂志或者打开收音机、电视机的时候,都可能听到一个词:Internet。而每每谈到Internet,必然离不开WWW、环球网、信息高速公路之类的时髦词儿,人们不禁要问,Internet是什么?从广义上讲,Internet是遍布全球的联络各个计算机平台的总网络,是成千上万信息资源的总称;从本质上讲,Internet是一个使世界上不同类型的计算机能交换各类数据的通信媒介。从Internet提供的资源及对人类的作用这方面来理解,Internet是建立在高灵活性的通信技术之上的一个已硕果累累,正迅猛发展的全球数字化数据库。网络基础知识Internet的诞生:与很多人的想象相反,Internet并非某一完美计划的结果,Internet的创始人也绝不会想到它能发展成目前的规模和影响。在Internet面世之初,没有人能想到它会进入千家万户,也没有人能想到它的商业用途。从某种意义上,Internet可以说是美苏冷战的产物。在美国,20世纪60年代是一个很特殊的时代。60年代初,古巴核导弹危机发生,美国和原苏联之间的冷战状态随之升温,核毁灭的威胁成了人们日常生活的话题。在美国对古巴封锁的同时,越南战争爆发,许多第三世界国家发生政治危机。由于美国联邦经费的刺激和公众恐惧心理的影响,"实验室冷战"也开始了。人们认为,能否保持科学技术上的领先地位,将决定战争的胜负。而科学技术的进步依赖于电脑领域的发展。到了60年代末,每一个主要的联邦基金研究中心,包括纯商业性组织、大学,都有了由美国新兴电脑工业提供的最新技术装备的电脑设备。电脑中心互联以共享数据的思想得到了迅速发展。网络基础知识美国国防部认为,如果仅有一个集中的军事指挥中心,万一这个中心被原苏联的核武器摧毁,全国的军事指挥将处于瘫痪状态,其后果将不堪设想,因此有必要设计这样一个分散的指挥系统──它由一个个分散的指挥点组成,当部分指挥点被摧毁后其它点仍能正常工作,而这些分散的点又能通过某种形式的通讯网取得联系。1969年,美国国防部高级研究计划管理局(ARPA--AdvancedResearchProjectsAgency)开始建立一个命名为ARPAnet的网络,把美国的几个军事及研究用电脑主机联接起来。当初,ARPAnet只联结4台主机,从军事要求上是置于美国国防部高级机密的保护之下,从技术上它还不具备向外推广的条件。1983年,ARPA和美国国防部通信局研制成功了用于异构网络的TCP/IP协议,美国加利福尼亚伯克莱分校把该协议作为其BSDUNIX的一部分,使得该协议得以在社会上流行起来,从而诞生了真正的Internet。网络基础知识1986年,美国国家科学基金会(NationalScienceFoundation,NSF)利用ARPAnet发展出来的TCP/IP的通讯协议,在5个科研教育服务超级电脑中心的基础上建立了NSFnet广域网。由于美国国家科学基金会的鼓励和资助,很多大学、政府资助的研究机构甚至私营的研究机构纷纷把自己的局域网并入NSFnet中。那时,ARPAnet

的军用部分已脱离母网,建立自己的网络--Milnet。ARPAnet--网络之父,逐步被NSFnet所替代。到1990年,ARPAnet已退出了历史舞台。如今,NSFnet已成为Internet的重要骨干网之一。1989年,由CERN开发成功WWW,为Internet实现广域超媒体信息截取/检索奠定了基础。到了90年代初期,Internet事实上已成为一个“网中网”──各个子网分别负责自己的架设和运作费用,而这些子网又通过NSFnet互联起来。由于NSFnet是由政府出资,因此,当时Internet最大的老板还是美国政府,只不过在一定程度上加入了一些私人小老板。Internet在80年代的扩张不单带来量的改变,同时亦带来质的某些改变。由于多种学术团体、企业研究机构,甚至个人用户的进入,Internet的使用者不再限于电脑专业人员。新的使用者发觉,加入Internet除了可共享NSFnet的巨型机外,还能进行相互间的通讯,而这种相互间的通讯对他们来讲更有吸引力。于是,他们逐步把Internet当作一种交流与通信的工具,而不仅仅是共享NSFnet巨型机的运算能力。网络基础知识在90年代以前,Internet的使用一直仅限于研究与学术领域。商业性机构进入Internet一直受到这样或那样的法规或传统问题的困扰。事实上,象美国国家科学基金会等曾经出资建造Internet的政府机构对Internet上的商业活动并不感兴趣。1991年,美国的三家公司分别经营着自己的CERFnet、PSInet及Alternet

网络,可以在一定程度上向客户提供Internet联网服务。他们组成了"商用Internet协会"(CIEA),宣布用户可以把它们的Internet子网用于任何的商业用途。Internet商业化服务提供商的出现,使工商企业终于可以堂堂正正地进入Internet。商业机构一踏入Internet这一陌生的世界就发现了它在通讯、资料检索、客户服务等方面的巨大潜力。于是,其势一发不可收拾。世界各地无数的企业及个人纷纷涌入Internet,带来Internet发展史上一个新的飞跃。Internet目前已经联系着超过160个国家和地区、4万多个子网、500多万台电脑主机,直接的用户超过4000万,成为世界上信息资源最丰富的电脑公共网络。Internet被认为是未来全球信息高速公路的雏形。关于GoogleGoogle()由两个斯坦福大学博士生LarryPage与SergeyBrin于1998年9月发明,GoogleInc.于1999年创立。2000年7月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎。98年至今,Google已经获得30多项业界大奖。1、Google的使用:Google的设置点击“搜索设置”后可以设置“搜索语言、界面语言、显示的结果数量、结果窗口,等”若想显示一些禁止的网页,则需要将“搜索语言”设置为中文繁体或英语,然后在“安全筛选”下拉菜单中选择“关闭”或“中度筛选”。如搜索“裸聊”。基本常识:拼音汉字转换例如:搜索“shang

wutong”,Google能自动提示“您是不是要找:商务通”。如果您点击“商务通”,Google将以“商务通”作为关键词进行搜索。对于拼音和中文混和关键词,系统也能做有效转换。对于拼音“lü”,“lüe”,“nü”或“nüe”,您可输入“lv”,“lve”,“nv”或“nve”。如果拼音中没有空格,例如“shangwutong”,Google也会做相应处理,但是在多个拼音中加空格能提高转换准确率和速度。由于汉语的多音字和方言众多,常用发音与实际发音常常有出入,更不用说拼音输入中可能出现的错误了。Google的拼音汉字转换系统能支持模糊拼音搜索,为用户提示最符合的中文关键词,具有容错和改正的功能。例如:搜索“wanluo

xing

wen”,Google会提示“您是不是要找:万罗兴文万络行文网络新闻”,其中“网(wang)络新(xin)闻”是系统参考了可能会有的拼音错误后自动转换的。点击其中任一提示,Google将以其作为关键词进行搜索。基本常识:错别字改正Google的错别字改正软件系统会对输入的关键词进行自动扫描,检查有没有错别字。如果发现用其他字词搜索可能会有更好的结果,它能提供相应提示来帮助纠正可能有的错别字。例如,搜索“互连网”,Google会自动提示“您是不是要找:互联网”。如果您点击“互联网”,Google将以“互联网”作为关键词进行搜索。因为Google的错别字改正软件系统是建立在互联网上所能找到的所有词条之上,它能够提示常用人名及地名的最常见的书写方式,这是一般的错别字改正软件所不及的。Google初级搜索1、搜索结果要求包含一个关键词。如:搜索“skopostheorie”操作:skopostheorie2、搜索结果要求包含两个及两个以上关键词。如:搜索“norms”、“Toury”操作:normsToury若需要两个关键词连在一起出现,则需使用引号。如:搜索“culturalturn”操作:“culturalturn”注:以前大多数搜索引擎在搜索两个或两个以上关键词时需要使用“+”表示逻辑“与”,现在直接在两个(多个)关键词之间使用空格即可。Google初级搜索3、搜索结果要求不包含某些特定信息。Google用减号“-”表示逻辑“非”操作。如搜索所有包含“polysystem”而不含“Toury”的网页操作:polysystem-Toury注意:在减号“-”与后一个关键词之间不能有空格,否则将被Google视为逻辑“与”操作,从而导致中间的减号“-”被忽略。4、搜索结果至少包含多个关键字中的任意一个。Google用大写的“OR”表示逻辑“或”操作。如:搜索包含“Vermeer”或“Nord”或者两者均有的网页操作:VermeerORNord

注意:小写的“or”在查询的时候将被忽略,这样上述的操作实际上变成了一次“与”查询。Google初级搜索5、“+”、“-”和“OR”的混合查询。混合查询涉及到逻辑操作符的顺序问题。一般而言,搜索引擎按照从左往右的顺序读取操作符号。如果只涉及“与”操作和“非”操作,则不会产生顺序问题,搜索结果数量和关键词顺序无关。不过,具体搜索的结果顺序会视关键词的顺序而定。单纯的“或”操作也是同样的道理。但是,如果“或”查询和其他两种查询混合在一起,问题则较复杂。如:搜索“所有关于Vermeer或者Nord,但是没有Dutch相关信息的网页”。操作:VermeerORNord

-Dutch注意:“或”操作的前后两个关键词必须至少有一个是“与”查询,否则搜索引擎将无法完成搜索。(该处存疑)如:操作:-VermeerORNord-Dutch操作:-VermeerOR-Nord操作:-VermeerORNordGoogle初级搜索6、用“+”和“-”减少冗余信息。通常情况下,用一个关键词查询会得到很多与查询目的不相关的冗余信息。我们总是希望搜索结果的第一个条目中就包含所需要的信息。“+”和“-”很多时候能起到缩小搜索结果范围,提高查询结果命中率的作用。如:查阅天龙八部具体是哪八部分析:如果光用“天龙八部”做关键词,搜索结果有5,090,000条(2010年11月27日零时零三分查询),而且排前列的主要与金庸的小说《天龙八部》相关,很难找到所需要的资讯。可以用两个方法减少无关结果:(1)如果你知道八部中的某一部,比如阿修罗,则增加“阿修罗”关键词。输入“天龙八部阿修罗”,得到的搜索结果只有112,000条(2010年11月27日零时零五分查询),可以很快找到全部八部书籍。(2)如果你不知道八部中的任何一部,但知道这与佛教相关,可以排除与金庸小说相关的记录。输入“天龙八部佛教-金庸”,得到的查询结果为145,000条(2010年11月27日零时零六分查询),可以迅速找到所需信息。Google辅助搜索1、通配符问题:很多搜索引擎支持通配符号,如“*”代表一连串字符,“?”代表单个字符等。Google不支持通配符,只能做精确查询,关键词中的“*”或者“?”会被忽略。2、关键词的字母大小写:Google对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。3、搜索整个句子:Google的关键词可以是词组(中间没有空格),也可以是句子(中间有空格),但是用句子做关键词必须加英文引号。如:搜索包含“ShallICompareTheeToASummer’sDay?”字串的页面

操作:“ShallICompareTheeToASummer’sDay?”注意:需要加引号,句末的问号被忽略。

Google辅助搜索4、搜索引擎忽略的字符和词汇:Google对一些网络上出现频率极高的英文单词(如“i”、“com”、“www”等)以及一些符号(如“*”、“.”等)做忽略处理。(现在已有所改进)如:搜索关于第一次世界大战的信息操作:“worldwarI”结果:“i”使用过于频繁,没有被列入搜索范围。5、强制搜索:如果要对忽略的关键词进行强制搜索,则需要在该关键词前加上明文的“+”号。如:搜索包含WhoamI?的网页如果用“”whoami?“”,“Who”、“I”、“?”会被省略掉,搜索将只用“am”作关键词,所以应该用强制搜索。操作:+who+am+i注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键词,加强制也不行。(现在已有所改进)

Google进阶搜索1、对搜索的网站进行限制:“site”表示搜索结果局限于某个具体网站或者网站频道,如“”、“”;或者是某个域名,如“”、“com”等等。如果是要排除某网站或者域名范围内的页面,只需用“-网站/域名”。如:搜索新浪文教频道中关于鲁迅的信息操作:鲁迅site:注意:site后的冒号为英文字符,而且冒号后不能有空格,否则“site:”将被作为一个搜索的关键词。此外,网站域名不能有“http”以及“www”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。诸如“金庸site:/1/”的语法是错误的。Google进阶搜索查询某一类文件(往往带有同一扩展名):“filetype:”这个特色查询功能非常强大,可以做很多事情。最重要的文档搜索是PDF搜索。PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。当然还可以检索其他文档,如:swf、doc、ppt、xls等。如:搜索关于ecommerce的PDF文档操作:ecommercefiletype:pdf搜索PDF文档还可以用“inurl:”语法。比如上例,也可以用“inurl:pdfecommerce”。注意:上述查询均是对PDF内文的检索,“ecommerce”这个关键词是包含在PDF文档中的。此外,查找PDF格式的学术文件还可以使用“搜索关键词pii”的方法。Google进阶搜索:图片查询“filetype”的另一个用处是图片搜索。如:查找关于本拉登的JPG图片操作:BinLadenfiletype:jpg

Google进阶搜索:地图查寻使用Google查寻城市地图或具体地址,您只需要在捜索框直接键入城市名或地址后加上“地图”即可,或直接输入具体地址。下面是一些查寻示例:北京地图广州市越秀区流花路Google进阶搜索:天气查询用Google查询中国城市地区的天气和天气预报,只需输入一个关键词(“天气”,“tq”或“TQ”任选其一)和您要查询的城市地区名称即可。Google返回的网站链接会带给您最新的当地天气状况和天气预报。例如,要查找上海地区的天气状况,可以输入:

Google进阶搜索:定义[很实用]要查看字词或词组的定义,只需键入“define”,接着键入一个空格,然后键入您需要其定义的词。如果Google在网络上找到了该字词或词组的定义,则会检索该信息并在搜索结果的顶部显示它们。Google进阶搜索:网页快照[很好用,有价值]

Google在访问网站时,会将看过的网页复制一份网页快照,以备在找不到原来的网页时使用。单击“网页快照”时,您将看到Google将该网页编入索引时的页面。Google依据这些快照来分析网页是否符合您的需求。在显示网页快照时,其顶部有一个标题,用来提醒您这不是实际的网页。符合搜索条件的词语在网页快照上突出显示,便于您快速查找所需的相关资料。尚未编入索引的网站没有“网页快照”,另外,如果网站的所有者要求Google删除其快照,这些网站也没有“网页快照”。Google进阶搜索搜索的关键词包含在网页标题中:“intitle”和“allintitle”的用法类似于上面的inurl和allinurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。网页标题就是HTML标记语言title中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此只查询标题栏通常也可以找到高相关率的专题页面。如:查找日本明星藤原纪香的照片集。操作:intitle:藤原纪香写真

Google的使用:用Google突破收费网站略(详见“用Google突破收费网站.txt”)此外,该文仅供参考,有些功能不能使用。2、互联网在翻译中的使用:破译疑难英文单词:中英文字典(最单纯)Google给中英文单词互译带来了极大的方便。您只需输入一个关键词(“翻译”,“fy”和“FY”任选其一)和要查的中(英)文单词,Google会直接显示您要查的单词的英文(或中文)翻译。例如,要查找apple(或苹果)的中(英)文翻译,只需在搜索字段中输入:2、互联网在翻译中的使用:破译疑难英文单词

主要方法:引诱法即用一个“诱导词”引出有中英文对照的网页。“诱导词”一般应该应为目标语词,而且应该是与查询词直接相关。如要查“无级调速”的英译,那么诱导词应该是个英语单词。根据经验,这个词的英译中应该带个“速度”,故输入“无级调速speed”,会出现一大堆带有“无级调速”和它的多种对应英译“steplessspeedvariation”“steplessspeedregulation”等词组。“引诱法”的成败及效率高低取决于“诱导词”的选择。如果对目标语译词很迷茫???比如要译一个菜单名:“金钱肚”找一个目标语相关词,即在一个包含“金钱肚”英译的网页里,极有可能同时出现的一个词,比如,menu。当然,诱导词未必一定是目标语。查中文英译时也可用中文引诱词,如“英文名称”(输入“第七届中国国际食品和饮料展览会

英文名称”,会查到:“第七届中国国际食品和饮料展览会

英文名称:SIALCHINA”)。相似的此类引诱词还有:“英文”、“中英对照”、“英语”等等。但这种引诱词成功率很低,可作为备用手段。查找官方网站比如查某个单位的英文名:现在大部分上规模的单位都有官方网站,所以直达其网站就是最好的办法,在Google中输入:allintitle:

"中国酒类商业协会"注:allintitle是Google的查询功能词,意思是“以下关键词出现在title中”。按照网站设计的通用准则,单位名称一般都会出现在单位官方网站的title中。(前面已经介绍)试对试对作用,即用尝试法寻找某种英语表达方式和采用“翻译统计学”原理检验某种译法是否妥当或地道。如要翻译“相对水平120°-170°范围内无级调节”。

“无级调节”是“steplessadjustment”,“水平”是“thehorizontal”,“度”是“degrees”,但不知这个“相对水平……度”怎么表达最恰当。再具体点,就是中间这个介词选什么好定不下来。输入“degreesthehorizontal”site:.us。Google一下,就看到以下类似表达:atanangleof60degreesabovethehorizontal;atanangleof20degreesfromthehorizontal;inthezonefromfifteendegreesbelowthehorizontal。据此判断,选择“fromthehorizontal.”是本例最佳译法。充

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论