Web as corpus短学期讲座2012年(keys)_第1页
Web as corpus短学期讲座2012年(keys)_第2页
Web as corpus短学期讲座2012年(keys)_第3页
Web as corpus短学期讲座2012年(keys)_第4页
Web as corpus短学期讲座2012年(keys)_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Webascorpus网络语料库贺文照2012年7月IGreatpotentialofWebasCorpus网络语料的巨大潜力从一道选择题开始:网友提问(2009-04-0314:08:46)梧桐树下(553575272)

各位C友请帮忙看看Asmyexamsarecomingnextweek,I’lltakeadvantageoftheweekendto_____onsomereading.

Acatchup

Bclearup

Cmakeup

Dpickup

Whatwouldyoudo?

我的方法

1.设计google检索表达式:

“takeadvantageof**to*upon*reading”

2结果请见:"takeadvantageof**to*upon*reading"II.Whywebascorpus?Whatiscorpus?Asimpledefinition:Collectionoftexts.简答说文本集合就叫做语料库。Webpagesaremainlycollectionoftexts,sowebcanberegardedasakindofcorpus.语言的用法往往遵循“有很多其它人(nativespeaker)这么用,我也可以这么用”Whatdoesacorpuscontain?Conventionalusageofalanguage.语料库中蕴含了一种语言的习惯用法Howtoaccessastructureinacorpus?如何从语料库中查找一个特定的结构呢?Throughacomputer-basedtool.Sogooglecanberegardedasthatkindoftoolforsearchingacertainlanguagestructurefromtheweb.只有通过计算机工具来实现。google本来是一个信息搜索工具,我们将它作为从网络上获取特定语言结构的搜索工具。SearchforcollocationofEnglishwords通过google检索英语词项的搭配。搭配是外语学习中一个非常重要的内容。比如上面例中的Asmyexamsarecomingnextweek,I’lltakeadvantageoftheweekendto_____onsomereading.

Acatchup

Bclearup

Cmakeup

Dpickup

常量[takeadvantageof]变量[theweekend变量都用*代替]常量[to]变量[*]常量[up]常量[on]some常量[reading].

在google中整个当作一个短语(phraseasagoogleoperator)来搜索,用*替换所有变量,用半角双引号括起来:"takeadvantageof**to*upon*reading"

作为短语搜索和不作为短语搜索的区别比如Englishgrammar和"thegrammarofEnglish"

是“biggervariance”还是“largervariance”?统计学中的“更大的方差”是”interestedon”还是”interestedin”“interestedto”?请比较各自的频率优势,一般频率高者为首选Manytranslatorshavemadestudiesontheidiomstranslation.

conductedstudiesSiterestrictsearch限定网络语料来源。Whydoweneedsiterestrictsearch?网络资源千差万别,质量良莠不齐。site:限定搜索某个特定网站如:ChinesetwitterSite:edu限定某一类网站:请比较校训的说法schoolmetto和universitymetto美国大学网站上的用法;比较中国大学网站上的用法:schoolmetto和universitymettoIII.PartialParallelTextsofEnglishandChinese英汉局部对应语料1.汉英词汇对照表...动迁户householdstoberelocated.·东突"恐怖分子EastTurkistanterrorist.·豆腐渣"工程jerry-builtproject.·渡假外交holiday-makingdiplomacy.2.汉语文本中的英语夹注他认为教学活动(padagogicaction)是一种运用符号暴力(symbolicviolence)进行教学沟通的过程,孩子的学业成绩如何,主要看这个沟通过程的效果如何,而决定沟通效果的主要是受业者与沟通过程相关联的社会特征和学业特征(文化资本)。所有教育过程的特殊产品是造成与孩子在家庭中获得的文化习念(habitus)相区隔的、由主文化之任意专横(culturalarbitrary)所支配的新习念。网络英汉混合双语语料覆盖面作一个大致的分类。1)专业术语,有心理学,法律,教育,语言学等多方面的专业词汇。如,心理分析(psycho-analysis),潜意识(Sub-Conscious),程序法(procedurelaw),侵权责任(rightinfringementresponsibility),以学生为中心(student-centred),宽银幕版(WideScreen),纳米技术(NanoTechnology),音位(phoneme),机器翻译(machinetranslation),语料库(corpus)等;2)汉语时尚新词英译,如,跨世纪人才(thecross-centurytalent),下岗职工(Laid-offWorkers),打白条(issueIOU),擦边球(edgeball,touchball),小康社会(well-offsociety),下岗工人(laidoffworkers),以德治国(togovernthecountrywithmoral)等等;3)新引进的文化内容,如电影名称,游戏,计算机产品、技术等外来名称。如,ColorsOfTheWind《风中奇缘》(电影),AClockworkOrange发条橙(电影),FinalFantasyIII《最终幻想III》(游戏),Bowling(保龄),Stream(流媒体),BroadBand(宽带),ScreenShot(屏幕抓取程序),Scanner(扫描仪),Digitalsignatureandidentityauthentication(数字签名与身份认证技术研究)。4)外来专有名词,包括地名和人名等。中途岛(MidwayIslands),欧盟(EuropeanUnion),独联体(CommonwealthofIndependentStates),贝多芬(Beethoven),尼克松(Nixson),贝克汉姆(DavidBeckham),迈克·尔.杰克逊(MichaelJackson)。)“ProliferationSecurityInitiative”是一个什么样的机构,还是组织?其中有一个security,常用词义为“安全”,就用<ProliferationSecurityInitiative安全>进行搜索,结果为“防扩散安全倡议”。八荣八耻,使用<八荣八耻eight>和谐社会,使用<和谐社会harmonious>总结FurtherReading语料库空间/hwz/

GoogleasaToolforAcademicWriting/~efs/google/index.htm

局部对应英汉网络语料及其辅助翻译功能/trans_studies/jubu_duiying_yuliao.htm

二、google用于辅助英语学习

1)利用google庞大的英语网页数据,很多人这样用,我们也可以这样用:词汇,语法,搭配

2)注意语料来源,解决之道,针对特定网站的检索

/hwz/readblog.asp?id=11.uk/live/index.jsp结语。1网络语料库对于英语学习具有巨大的潜力。2使用网络搜索一般难以直接查到答案,需要查询者仔细分析,甚至需要一定的鉴别能力。3需要注意网络语料库的质量,搜搜需要区别来源练习1用google来完成一下练习,并且制定结果必须来源于NewYorkTimes()Medicalresearchhasshownthatthewidespreaduseofcigarettescontributes________thei

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论