AntConc地详细使用说明书_第1页
AntConc地详细使用说明书_第2页
AntConc地详细使用说明书_第3页
AntConc地详细使用说明书_第4页
AntConc地详细使用说明书_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实用文案标准antconc3.2.0 的使用说明11. 提取语境共现1.1 设置检索项(1)单项检索a)点击 file下拉菜单中的“ open files” ,选择要打开的语料(如果想打开整个文件夹,可以选择 open directory) ;b)在“search term”一栏键入要检索的词项,如go;c)在“search window size ” 一栏设置每一共现行出现的词数;d)点击,开始检索。检索结果如图 1.1 所示:图 1.1 单项检索结果(2)多项检索设置多项检索除了检索单个词项以外, antconc还具有检索多个词项的功能,检索方法为在检索项间键入“ | ”符号。例:要检索动

2、词 go 的各种时态形式,可在“search term”中输入 go|went|gone|goes 设置语境词检索为了限制语境共现的检索, 可以设定一个语境词在检索项周边一定的语境范围内出现。例:如要研究 a of 这一类词组,可通过antconc 提取所有的词项,检索方法如下:a)在“search term”一栏键入 a;b)点击“ search term ”旁的,进入“ advanced search”界面,如图 1.2 所示。点击 “use context words and horizons ” , 然后在“context words ” 一栏键入 of , 点击。 如要重新设置语境词

3、, 可先点击清除原来语境词, 后重复以上操作。 另外,还需设定语境词距离检索项的1此说明书由华南师范大学外文学院2007 研究生张杏娟编写,导师何安平订正和补充。其中限定范围的检索方法由香港城市大学d.lee 博士提供,仅此致谢。图 1.2 advanced search界面实用文案标准位置,如本研究中, of 在 a 的右二位置,所以“ content horizon”确定为,最后点击;c)回到语境共现的界面后,点击,开始检索。结果可提取a lot of, a bit of 等词块。设置多字语检索在研究中,如需检索多个词项,除了使用“”以外,也可使用以下方法,尤其适合检索项数目较多的情况。例

4、:研究感官动词watch, sound, feel, hear, smell a)在 txt文本中键入所有要检索的词项,可多达250个词。然后为该文本起名保存。需注意:键入的词项需以列的形式排列。如:feel feels felt b)点击 search term 旁的,选择“ use search term(s) from list below” 。点击,在保存以上新建的文本的盘符路径点击文本名,然后点击;c)回到语境共现的界面后,点击,开始检索。(3)类别检索使用通配符检索符号意义检索项检索结果* 零个或多个字符book* 提取所有以 book 打头的词,如 book、books、book

5、ing 、bookshop 等*book 提取所有以 book 结尾的词,如 book、notebook等*book* 可以同时提取包括以上两类词+ 零个或一个字符book+ 提取所有以 book 打头的词,但之后有零个或一个字母,如 book、books?任意一个字符?ough 提取所有以字母组合ough 结尾的,但之前有一个字母的词,如cough、rough 等 零个或一个词thinkof 提取所有含有的词组,如 think of、think highly of等实用文案标准# 任意一个词look# 提取所有与 look 的搭配,如 look after 、 look at 等附码检索因研

6、究需要,有些语料经过整理加工并附加上各种符号标记,称为“附码语料库”。如附有词性标注的lobtag 和附有错误类型标记的clec 等。检索时只需键入某个标记符号便可提取带附有该标码的所有词。例:提取 lobtag 语料库中所有的名词,只需键入*_nn (nn为名词标码,关于其他词性的详细标记,请参阅何安平,2004, 语料库语言学与英语教学一书的附录113页。(4)在指定范围内检索a) 在 concordance 的检索界面上选择 regex (regular expression),键入 .* 为检索项便可提取语料库中所有在起止符号“ ”和“ ”之间的所有文字内容,其他符号照似类推。b) 在

7、concordance的 检 索 界 面 上 选 择 regex (regular expression), 键 入.*write.* 为检索项便可提取语料库中所有在起止符号“ ” 和“ ”之内的“write ”的语境共现行,其他词项照似类推。键入的检索项计较大小写,但是可以用通配符*。1.2 分析检索结果(1)观察频数、分布频数即该检索项出现的次数,可在“concordance hits ”一栏中获得。点击,查看检索项在语料文本中的分布状况。(2)凸显周边语境词为了具体某个教学等目的,可通过凸显检索项周边的某些词汇。方法是选择“ kwic sort ” , r1 和 l1分别代表检索项右方和

8、左方的第一个词,一次可设置三列凸现词,均按字母顺序排列。检索结果如图 1.3 所示。如想使凸显内容的颜色一致, 可通过设置下拉菜单中的“ color settings ”改变颜色。另外,若要凸显的部分不是一个词,而是单词中的字母,可选择下拉菜单中的“concordance”选项中的“ sort by characters instead of words” ,如图 1.4 所示。图 1.4 tool preferences下拉菜单界面实用文案标准图 1.3 凸显周边语境词检索结果(3)提取搭配词表通过点击主界面中的,可获得检索项的搭配词表,同时可以设置搭配词的位置、出现的最少次数与词表的排列方

9、式。例:观察 look 右一的搭配词a)点击主界面中的;b)在“search term”一栏键入 look ;c)设置搭配词的位置,如;d)点击,开始检索,检索结果如图1.5 所示。e)点击“ sort by freq” 可根据不同的需要设定搭配词表的排列方式,如按频数排,按拼写字母排等等。实用文案标准图 1.5 提取搭配词表检索结果(4)提取搭配短语另外, 也可以使用这一工具来提取搭配词块,且可设置检索项在词块中的位置。例:检索以 ask 开头的搭配词块a)点击主界面中的;b)在“search term”一栏键入 ask;c)设置检索项的位置,如选择 “on the left” ;d)设置搭

10、配词块的长度,如min.size:3, max.size:3;e)点击,开始检索,检索结果如图 1.6 所示,所有的 ask 被列在词块的左边。(5)隐藏、分类和删除“隐藏”是指把检索结果中的检索项挖空, 可用于教学或测试。 具体操作方法如下:a)在“search term”一栏键入要检索的词项,如look ;b)点击, 选择 “concordance” , 再选择 “hide search term in kwic display ” ,最后点击;c)点击,开始检索。检索结果如下: you always do your own homework? do you * for help when

11、 you think it necessary? do you help 图 1.6 提取搭配短语检索结果实用文案标准2. 提取词频表2.1 单字和 n字语词频表单字词频表 是指目标语料库的单词表, 且词频表的检索结果是以每个词的形式及其频数排列。方法如下:a)选择要生成单字词频的目标语料库;b)进入界面,设置词频表排列排序方式,如“sort by freq” ;也可以设置为按词头的或者词尾的拼写字母顺序排列。c)点击,开始检索,检索结果如图2.1 所示。图 2.1 单字词频表检索结果n字语词频表 是指目标语料库的多字语频数表。例如,检索句子“this is a pen”的 2 字语词频表结果

12、为:“this is ” 、 “is a” 、 “a pen” 。n字语词频表的提取方法如下:a)选择要生成单字词频的目标语料库;b)进入界面,后点击;c)设置 n字语词频表的长度,如d)选择词表的排序方式,如“sort by freq” ;e)点击,开始检索,检索结果如图2.2 所示。实用文案标准图 2.2 n 字语词频表检索结果2.2 词项重组 - 词簇化( lemmatizing )词簇化是将同一词性的某个词的所有曲折变化形式作削尾处理,并归为一个词簇来计算频数。其好处是可以简约词频表并且引起对构词法的关注。对词频表进行词簇化的方法如下:在界面生成词频表之后, 拉下 tool prefe

13、rence 菜单, 选择 lemma list options, 点击 open 和 load , 上传 lemma1文档 (可在本网站下载) 点击 apply (如图 2. 3 所示) 。词簇化的部分结果见图2.4. 图 2. 3 设置词簇化界面实用文案标准图 2.4 词频表被词簇化后的结果(部分) 。图中 1142 例 a 和 133 例 an 被归为同一个词簇a 共 1275 例。3. 提取关键词表关键词表是指两个语料库的词频表相比,其中一个明显地高频于另一个的那部分词项表。前一个称目标语料库;后一个称参照语语料库,通常规模要大一些,以此来凸现目标语料库的一些特别高频词以浮现该语料库的主题或内容特色。3.1 凸显目标语料库中显著性高频于对照语料库的词项具体操作方法如下:a)点击 file下拉菜单中的“ open files” ,选择要对比的目标语料的语料(如果对比整个文件夹,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论