美国当代英语语料库(COCA)使用介绍_第1页
美国当代英语语料库(COCA)使用介绍_第2页
美国当代英语语料库(COCA)使用介绍_第3页
美国当代英语语料库(COCA)使用介绍_第4页
美国当代英语语料库(COCA)使用介绍_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2021/3/141美国当代英语语料库(COCA)使用说明2021/3/1422021/3/143一、COCA语料库简介 COCA简介 COCA:美国当代英语语料库(Corpus of Contemporary American English)是由美国杨伯翰大学(Brigham Young University)的Mark Davies 教授开发的美国最新当代英语语料库,是当今世界上最大的英语平衡语料库。2021/3/144COCA语料库简介 COCA美国当代英语语料库涵盖美国这一时期的口语(spoken)、小说(fiction)、流行杂志(pop magzine)、报纸(newspaper

2、)和学术期刊(academic)五大类型的语料库,并且在这五个类型方面基本呈均匀平衡分布。 网址:COCA简介2021/3/145选择学习COCA的原因 1. COCA免费且在线方便。 2. 规模大(4.5亿,1990-2012)、速度快(一般几秒)、词性标注易于理解。 3.时效性强每年至少更新两次,并且每年新增2000万词汇。2021/3/146COCA界面简介主要包括三大功能区: 显示及查询条件界定区,包括:显示方式区,字串查询区,语料库分类区,查询结果排列方式区。 查询结果数据显示区 例句显示区2021/3/147 COCA界面简介2021/3/148 COCA界面简介 显示方式区: 1

3、.LIST列表显示 2.CHART图表显示,可以显示在各语料库类型中的使用频率和各时间段内的使用情况。 3.KWICKey word in context,上下文关键词显示 4.COMPARE单词比较显示,比较两个不同词或短语的搭配情况。2021/3/149 COCA界面简介2021/3/1410 COCA界面简介 字串查询区: 、WORDS:输入字符串。 、COLLOCATES:上下文限定。 、POS LIST:词性列表2021/3/1411 COCA界面简介2021/3/1412COCA界面简介 语料库分类区(五大类型语料库共包括42个子语料库)。 功能:此区可以对查询的字符串限定语料类型

4、(Genre)和时段(Year) ,并且可以明确到查询某一个子语料库,时段也可以查询任何一年的某个字词的使用情况。2021/3/1413COCA界面简介 语料库分类区(五大类型语料库共包括42个子语料库)。2021/3/1414COCA界面简介 语料库分类区(五大类型语料库共包括42个子语料库)。2021/3/1415二、COCA主要搜索功能 2.1 搜索搜索words、phrases、lemmas(单(单词的所有形式)、词的所有形式)、wildcards(通配符)和(通配符)和其他更加复杂的字词。其他更加复杂的字词。 例1. 输入单词“mysterious” (图2.1.1-1):得到相关结

5、果(图2.1.1-2):在各子库中的频率,每百万词使用的频率。 若对图2中的相应条块进行点击,那么就可以看到KWIC,如图2.1.1-3 (以点Fiction的条块为例):2021/3/1416图2.1.1-12021/3/1417图2.1.1-2使用CHART显示2021/3/1418图2.1.1-3 例句显示区例句显示区使用的是KWIC显示2021/3/1419KWIC显示方式2021/3/1420 蓝色名词 紫色动词 绿色形容词 棕色副词 灰色代词 黄色介词KWIC显示方式2021/3/1421COCA主要搜索功能 例2. 输入词组输入词组“white+名词名词” (图2.1.2-1),

6、得到的结果都是white后面跟的名词短语 (图2.1.2-2),检索表达式为:white n*。图2.1.2-12021/3/1422图2.1.2-2 White+名词的短语规则规则:输入名词的话用正表达式输入名词的话用正表达式: nn*;动词动词: v*; 形容词形容词: j*; 副词副词: r*;代词代词:p*;连词连词:c*2021/3/1423POS LIST 词性列表2021/3/1424p noun.ALL=名词p noun.SG=单数名词p noun.PL=复数名词p noun.CMN=普通名词p noun.+PROP=专有名词p noun.-PROP=非专有名词POS LIST

7、 2021/3/1425POS LIST p verb base=动词原形p verb.INF=动词不定式p verb MODAL=情态动词p verb 3SG=动词第三人称单数p verb ED=过去式p verb EN=过去分词p verb ING=现在分词p verb.LEX=lexical verb实意动词p verb.BE=系动词p verb.DO=dop verb.HAVE=have2021/3/1426p pron.INDF 不定代词p pron.PERS 人称代词p pron.WH 疑问代词p pron.REFL 反身代词p adj.CMP 形容词比较级 (comparativ

8、e)p adj.SPRL 形容词最高级 (superlative)p adv.particle 副词小品词p adv.WH 疑问副词POS LIST2021/3/1427p det.GEN 类指限定词p det.POS 物主限定词p num.CARD 基数词p num.ORD 序数词p conj.CRD 并列连词p conj.SUB 从属连词p Interj. 叹词p PUNC 标点POS LIST2021/3/1428词性列表的使用 1)查询多义词特定的词性 2)某个词前或者后面特定词性的若干搭配词,如confidence前的形容词 3)词性附码放置的位置WORDS或 COLLOCATES处

9、2021/3/1429 例3.输入通配符输入通配符(wildcards),如分别输入un*ly和r?n*,结果如图。COCA主要功能(一)? 代替一个字母* 代替任意数量字母2021/3/1430EXAMPLE 32021/3/1431EXAMPLE 32021/3/1432 例4.输入输入lemmaslemmas(即一个单词的单复数单复数、时态时态等所有形式),若要得到sing这个单词的所有形式,可以如下图所示。 COCA主要搜索功能2021/3/1433规则:若要得到某个单词的所有单复数和时态形式,那么就要在输入时,在这个单词外加 。EXAMPLE 42021/3/1434形容词early

10、的原形,比较级和最高级三种形式一次性检索出来检索EXAMPLE 42021/3/1435 例5.输入某种词性且部分带有某些字母的命令输入某种词性且部分带有某些字母的命令,如要得到以un-开头、-ed结尾的所有形容词的所有形式(见图2.1.5-1)和得到动词+任何词+ground的所有词组(见图2.1.5-2):规则:若要得到某种词性且词中带有部分带有某些字母的形式时,如要得到以un-开头、-ed结尾的所有形容词的所有形式,那么输入: un*ed.j*;若要得到动词+任何词+ground的所有词组,那么输入: v*ground即可。前者用来研究词汇,后者用来查询特定词性的搭配。COCA主要功能(

11、一)2021/3/1436图2.1.5-1 2021/3/1437图2.1.5-2 动词+任何词+ground的所有词组2021/3/1438 2.2 搜索搭配词和出现的频率搜索搭配词和出现的频率 如“thick后跟的名词” (图2.2-1)COCA主要搜索功能(二)2021/3/1439图2.2-1 规则规则:在collocates里输入n* 后选择4,表示在thick4后面(4跨距范围内)出现的任何名词2021/3/1440 如:跟在 “smile前面的形容词” (图2.2-2)规则:在words里输入: smile.n*,表示作为名词的smile; 在collocates里输入: aj*

12、表示其前后出现形容词的语境。COCA主要功能(二)2021/3/1441Confidence前使用的形容词 图2.2-32021/3/1442 2.3 搜索在子语料库内搜索在子语料库内(或之间或之间)出现的频率出现的频率(或比较或比较)(不同语域中的用法不同语域中的用法) 如在Fiction和Newspaper子语料库中passionate后面可以跟任何名词的词及频率,分别如两图(2.3-1和2.3-2)。COCA主要功能(三)2021/3/1443图2.3-1 图2.3-2 2021/3/1444 但是也可以之间对两者子语料库中它们出现频率的对比,操作:分别选择section 1&2,如下图

13、(图2.3-3): COCA主要功能(三)2021/3/1445 2.4 进行语义倾向比较进行语义倾向比较 2.4.1 比较近义词 如:近义形容词hot和warm后面所跟名词的区别(如图2.4.1):COCA主要功能(四)2021/3/1446图2.4.1 规则:在words的方格里分别输入hot和warm,再在collocates方框里输入nn*,表示后面所跟任何名词。当然也可以比较在某个子语料库中出现的频率比较。 2021/3/14472021/3/14482021/3/1449 2.4.2 比较反义词 如:woman和man前面所跟的形容词的区别(如图2.4.2)图2.4.2 规则:在w

14、ords的方格里分别输入woman和man,再在collocates方框里输入j*,选在左3,表示前面3个跨距内所有的形容词。当然也可以比较在某个子语料库中出现的频率比较。2021/3/1450 2.4.3 搜索近义词搜索近义词 如:搜索beautiful的所有近义词(如图2.4.3-1)规则:在words的方格里输入=beautiful,表示和beautiful语义相近的所有形容词。2021/3/1451 再如:搜索动词clean的所有近义词,如下图:图2.4.3-2 2021/3/1452Question Application和increase能否作主谓搭配?2021/3/1453查询结果2021/3/1454筛选出筛选出“应用应用”和和“增加增加”作主谓搭配的例句作主谓搭配的例句 The annual application of fertilizers has increased by 5.48% on average since 1980, and that of pesticide In ten Member States, average application of nitrogen increased almost 40

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论