第八届学术矿业汇报人员_第1页
第八届学术矿业汇报人员_第2页
第八届学术矿业汇报人员_第3页
第八届学术矿业汇报人员_第4页
第八届学术矿业汇报人员_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于语料库的同义词real、true和actual的用法研究郑莉娜导师:黄莹博士目录数据统计与讨论4引言1研究现状2研究设计3结语5引言由于同义词在语言中的特殊性,它是一个常见而又复杂的语言现象。近年来,语料库的发展为同义词的研究提供了新的途径,因此本文尝试利用现代美国英语语料库(COCA)作为数据资料,本文研究了一组3个同义词的内部语义结构。通过重点研究他们的分布模式,尤其是他们所修饰的典型名词类型,本文研究发现了这一组同义词的细微的用法区别,并对他们的语域进行了描述。

研究现状基于语料库的对语言的描述被证明比传统的非语料库描述更准确,能提供更多信息。近些年,越来越多的学者选择用语料库来研究同义词。他们的研究很大程度上都是建立在这样一个理论上的,这个方法源于Firth和他的追随者Halliday,Sinclair,他们一起将词汇研究提高到了语言学的高度并且在19世纪5、60年代,将对搭配的研究作为开启词汇语义学的钥匙,Firth(1957)认为:“单词的整体意义总是随语境而变的,而且我们通过这个单词的所共同出现的词来了解一个单词。研究现状Churchetall对askfor,request,demand的基于语料库的同义词词汇替换研究取得了基本相同的结论:词汇的“文本替换性”是他们语义相似的指向Hanks1996年利用大不列颠国家语料库分析了urge,incite,bother,abandon几个词,研究是建立在这些动词的语义和搭配模式之上的,以及运用频率分析。

研究现状在Hanks的研究之后,Divjak&Gries一起研究了另一组俄语同义词(verbsoftrying)通过研究,他们仔细分析了动词的形态句法,句法以及语义分布模式。他利用层次聚类分析(hierarchicalagglomerativeclusterexplorationprocedure),他们将分析结果做成了表格和系统树图,让我们能客观的区分同义词的细微差别。

研究现状尽管现在基于语料库研究大多数是针对动词的,最近也有一些对形容词的研究。Gries&Otani研究了英语的一组同义词big,great,large和它们的反义词little,small,tiny。首先他们在“国际英语语料库的英国部”检索了这6个形容词,然后将数据输入电子制表软件,并标记一些特征,例如句法特征和语义特征(该形容词修饰的名词时是抽象的还是具体的);接着他们用软件“RscriptBP1.0来分析数据,得到了每个形容词的分布特征。最后他们用“层次聚类分析”比较这些形容词的分布模式,之后用系统树状图来表明同义词/反义词的语义和用法模式。需要注意的是,尽管他们的目标相似——都是区分词汇的分布模式,他们的方法或者过程有些区别。实际上,在研究不同的词汇内部意义时,由于同义词与同义词之间有差别,而每一组同义词与每一组同义词之间又有差别,使用不同的方法研究才有意义。一个研究者需要在仔细分析所要研究的同义词的特点之后,选择具体使用什么方法和过程。 以上综述说明基于语料库的对同义形容词的搭配进行研究是研究同义词的有效方法,这符合本研究的目的。还有一个原因,目前该方法大多用来研究同义动词,进一步验证该方法在研究形容词的有效性是十分必要的。 因此,本文采用基于语料库(COCA)的方法对同义词real、true和actual进行研究,试图发现这3个形容词的用法区别和语域区别。研究设计本文通过对TheCorpusOfContemporaryAmericanEnglish(COCA)语料库的检索,统计出real、true和actual在COCA不同语域中的词频差异,分析real、true和actual右侧的第一个名词搭配信息及相应数据,通过分析检索出的搭配特点,并用SPSS16.0进行统计分析,归纳real、true和actual三词在不同的语域及搭配关系的异同。研究问题real,true和actual三个同义词非常常用,很多语言学习者很难分清他们的区别。

Oxford词典对这三个词的定义是:[10]

Real:actuallyexistingorhappeningandnotimaginedorpretended.True:connectedwithfactsratherthanthingsthathavebeeninventedorguessed.Actual:usedtoemphasizesththatisrealorexistsinfact.Oxford词典对这三个词的解释都包含了“真的”意思。但是它们的意义是否完全相同呢?我们很难根据字典的定义来区分。本研究要探讨下列相关问题:

1)real,true和actual所搭配的典型名词是否相?

2)real,true和actual所使用的语域是否有区别?数据统计与讨论——所搭配的典型名词为了更好地理解这3个形容词的用法模式,首先需要知道它们的总体频率分布。因为这3个形容词中real和true还可以用作副词和名词等,为了分析每个形容词作为形容词使用时的频率,在COCA语料库搜索引擎中使用了“显示词性”这一功能,结果如表1。realtrueactual1427479055024285表1尽管频率分布表很重要,但是这个表并没有告诉我们关于每个形容词的意义和特殊用法模式的信息。因此作者在仔细查阅了词典的基础上,发现了都暗含着这一中心意义即“真的,不是想象的”的这一意义。但是它们又有一些区别,例如:real强调真实性,特别指表里的同一性或一致性;actual强调存在的事实,忠于现实的事实,是对不存在的,假设的,抽象的或猜想推测的事而言的;true说明或含有与现实或实际相符合的意思,表示某一标准、规范或典型。(例如,英汉辞海,1987)这些同义词中心意义的不同会引起语义和用法差别,尤其是他们通常所修饰的名词种类的不同。本文接下来研究形容词所修饰的名词种类。为了确定这些形容词修饰什么样的名词,作者在COCA中对这些形容词所修饰的名词进行了两类检索: 频率(形容词修饰频率最高的名词)以及互信息值(Mutualinformationscore—MI)。互信息由Church和Hanks引进,进行词汇的语料库分析。主要原理:将观测到的单词x与单词y在一起的几率与观测到的x,y单独的几率相比。若MI值约等于0,则表明两者不能搭配;若MI值大于或等于3,则表示两者经常共同出现——可以搭配。频率检索和互信息值可以相互补充,使我们更好地找出形容词所修饰的典型名词。因为频率检索重视总体频次高的词,而忽略那些总体频次低却惯常与形容词搭配的词。因此频次检索列表里通常会包括一些搭配不紧密但频次很高的“典型名词”。MI可以克服这一点,但同时自身却有缺点,因为MI重视那些总体频次低但搭配性强的词。因此为了确保通过MI计量出来的频次高的名词具有代表性,作者除去了那些频次小于100的形容词的共现名词。其中actual除外,因为这个词的总体频次较少。因此,把actual的频次定为50,其中频次大于100的有12个,频次在50~100的有33个。至此,我们确定了每个形容词的前十位名词。(如表2)表2RealTrueActualByfrequencyByMIScoreByfrequencyByMIScoreByfrequencyByMIScoreEstate13457Estate11.48Story1047Believers11.41Practice183Occasions7.56Problem1982Housewives8.96Nature460Believer11.19Performance164Implemen-tation6.87Danger552Madrid7.65Believers364Grit10.69Behavior155Facts6.26Challenge516Wages7.32Meaning275Self7.94Size147Practice6.08Possibility479Danger6.96Believer267Colors7.43Events122Size6.03Threat457Possibility6.39Self225Meaning7.38Event86Behavior5.96Wages261Threat6.12Identity201Story7.22Facts68Performance5.95Killer152Problem6.05Colors173Feelings7.19Occasions58Events5.89Housewives125Killer5.95Feelings173Nature7.11Implemen-tation56Event5.64Madrid116Challenge5.94Grit133Identity7.04Classroom54Classroom5.57

从表2,我们发现这三个词所修饰的典型名词个数的排序为real>true>actual,与表1中所列举的这三个形容词的总个数排序一致,这也从侧面反映了这30个形容词的所搭配的名词很有代表性。 为了进一步通过这些形容词所修饰的名词来区分这3个同义词的语义的用法区别,作者把名词分成了3个范畴,1抽象名词(例如:challenge,threat等);2具体名词(例如:believer,story等);3双重性名词(例如:Madrid)。(如表3)表3RealTrueActual抽象名词567具体名词431双重性名词112通过表格可以发现,real,true以及actual这三个词都主要修饰抽象名词和具体名词。通过这个表格我们并不能发现什么,因为这三个词都主要修饰抽象名词,其次是具体名词,但是这并不能表明这三个词不修饰物质名词和集合名词等,由于我们列举的单词是频次和互信息值都较高的名词,并没有包含所有的词。为了确定这几个词在词汇搭配上是否有显著区别,我们检索了这30个词的频次,每个形容词的总的频次,以及每个类的名词的频次。(如表4)抽象名词具体名词双重性名词Real16891T654A552ATrue1415A1678T225TActual728A54A311T作者进行了卡方检验并分析了每一个单元频次。一个单元的频次如果显著高于预期值,则记为“type”即T;如果显著低于预期值,则记为“antitype”即A;如果区别是可预测的,则不论高或低,都记为“ns”。结果显示real,true,actual在这三类名词的分布特征有显著差异。(X2(df=4)=8169.764,p=0.001<0.01)从表中我们可以看出,抽象名词的数目显著的高,其中real是唯一的type,而其他两个都是安替type。在修饰具体名词时,true是唯一的type,另外两个都是antitype。在修饰双重性名词时,只有real是唯一的antitype,而其他两个都是type。也就是说real主要修饰抽象名词,而修饰具体名词主要是true,true和actual主要修饰双重性名词。另外,我们还可以注意到true主要修饰具体名词和双重性名词。文体区别词汇的文体区别对第二外语学习者也是非常重要的。我们知道第二外语学习者有时不能在相应的场合或情境下用正确的词,要么在正式场合用非正式语体的词,或者相反。因此,确定这几个词的文体区别对于第二外语学习者是有很大意义的。而且,文体区别也是同义词的一个重要的语义区别。因此,作者在COCA中对这几个词在五个语域(小说,报纸,杂志,学术写作,口语)进行了检索。表5口语小说杂志报纸学术写作real38916T26897T29474T28859T18601Atrue25689T17864T18099A12412A16486Tactual3956A2366A4417A2735A10811T我们对此进行卡方检验,结果显示这三个词在这五个不同的语域有显著差别。(X2(df=8=15725.820,p=0.001<0.01)从表格中我们可以看出,actual在学术写作语域是type,而在其他四个语域是antitype,而且在其他四个语域的数目相比real和true也非常少,因此相对来说是最正规的;而real只有在学术写作语域是antitype,在其他四个语域中都是type,而且real无论是与自己相比,还是和true与actual相比,它在口语、小说、杂志和报纸这四个领域的数目都是最多的,因此相对来说是最不正规的;而true处于中间,在口语及学术写作语域都是type,用的较为广泛。总体来说,在口语和和小说中使用较多的是real和true,而在杂志和报纸中的使用频次依次是real,true和actual。因此我们可以对这三个词从正式到不正式进行排序,即actual>true>real。结语本研究使用语料库的方法,对real,true和actual三个同义词进行分析,我们可以看出real、true和actual在搭配名词以及适用语域等方面都存在差异。首先,MI值和频次都兼顾的情况下,这三个同义词右侧搭配的典型名词不同。抽象名词主要由real修饰,而具体名词主要由true修饰,双重性名词主要被true和actual修饰。其次,对五个语域的分析显示,real,true和actual在不同语域的使用情况有显著差别。每一个词在一个语域的出现频次与该词在其他语域的对比显示,actual在学术写作领域用的较广,而real用的较少。无论是各个词在口语领域的频次对比,还是real在各个语域频次的对比,都显示real在口语中用的较多。这表明同义词的实际使用的过程中是存在语域优先情况的。总之,使用语料库可以帮助学者对同义词的语境及搭配等用法进行科学有效的研究,提供更加有力的条件,帮助学习者掌握真正的使用方法。参考文献[1]Church,K.W.,Gale,W.,Hanks,P.,Hindle,R.&Moon,R.“Lexicalsubstitutability”.InB.T.S.Atkins&A.Zampolli(Eds.),ComputationalApproachestotheLexicon.Oxford:OxfordUniversityPress,1994,153–177.[2]Divjak,D.“Waysofintending:Delineatingandstructuringnearsynonyms”.InS.Th.Gries&A.Stefanowitsch(Eds.),CorporainCognitiveLinguistics:Corpus-basedApproachestoSyntaxandLexis.Berlin/NewYork:MoutondeGruyter,2006,19-56.[3]Divj

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论