版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、语料库语言学术语汇编(V2.0)Last updated 2015-07-31 by 许家金Aboutness所言之事Absolute frequency绝对频数Alignment (of parallel texts)(平行或对应)语料的对齐Alphanumeric字母数字构成的Annotate标注(动词)、赋码Annotated text/corpus标注文本/语料库、赋码文本/语料库Annotation标注(名词)、赋码Annotation scheme标注方案、赋码方案ANSI/American National Standards Institute美国国家标准学会ASCII/Ame
2、rican Standard Code for Information Exchange美国信息交换标准码Associates (of keywords)(主题词的)联想词AWL/academic word list学术词表Balanced corpus平衡语料库Base list/baselist底表、基础词表Bigram二元组、二元序列、二元结构Bi-text/bitext双语合璧文本、双语合并文本、双语分行对齐文本(一句源语一句目标语对齐后的文本)Bi-hapax两次词、二次词Bilingual corpus双语语料库Bootcamp debate/discourse/discussio
3、n(新手)训练营大辩论/话语/大探讨CA/Contrastive Analysis对比分析Case-sensitive/case sensitivity大小写敏感、区分大小写Category-based approach基于类(范畴)的方法Chi-square test/2 卡方检验Chunk词块CIA/Contrastive Interlanguage Analysis中介语对比分析CLAWS/Constituent Likelihood Automatic Word-tagging SystemCLAWS词性赋码系统Clean text policy干净文本原则Cluster词丛、词簇Co
4、lligation类联接、类连接、类联结Collocate n./v.搭配词;搭配Collocability搭配强度、搭配力Collocation搭配、词语搭配Collocational strength搭配强度Collocational framework/frame搭配框架Collocational profile搭配概貌Collocational network搭配网络Comparable corpora类比语料库、可比语料库Computational Linguistics计算语言学ConcGram/concgram框合结构、同现词列Concord索引(行)(简略形式)Concorda
5、nce (line)索引(行)Concordance plot(索引)词图Concordancer索引工具Concordancing索引分析Context语境、上下文Context word语境词Contextual prosody语境韵律Contingency table连列表、联列表、列连表、列联表Co-occurrence/Co-occurring共现、同现Corpus Linguistics语料库语言学Corpus, pl. corpora语料库Corpus-based基于语料库的Corpus-based translation studies语料库译学、基于语料库的翻译研究、语料库翻
6、译学、基于语料库的译学研究Corpus-driven语料库驱动的Corpus-informed语料库指导下的、参考了语料库的Corpus size库容Corpus stylistics语料库文体学Co-select/co-selection/co-selectiveness共选(机制)Co-text共文Data mining数据挖掘DDL/Data Driven Learning数据驱动学习Dependency(句法)依存关系Dice coefficientDice系数Disambiguation消歧Diachronic corpus历时语料库Discourse话语、语篇Discourse p
7、rosody话语韵律Documentation说明文档、文检报告EAGLES/Expert Advisory Groups on Language Engineering StandardsEAGLES文本规格Effect size效应量Empirical linguistics实证语言学Empiricism经验主义Encoding/Text encoding/Character encoding字符编码Error-tagging错误标注、错误赋码Explicitation显化Extended unit of meaning扩展意义单位File-based search/concordanci
8、ng批量检索Firthian (linguistics)弗斯(语言学)、弗斯学派的(语言学)Fishers exact test费舍尔精确检验Formulaic sequence程式化序列、套语Frequency频数、频率Frequency list词频表General (purpose) corpus通用语料库Genre语体、体裁Grammatical patterning语法型式Granularity颗粒度Hapax legomenon/hapax (pl. hapax legomena/hapaxes)一次词Header/Text head文本头、头文件Hidden Markov mod
9、el (HMM)隐马尔科夫模型、隐马模型Historical corpus历时语料库HowNet知网ICTCLAS中科院汉语分词系统Idiom principle习语原则、成语原则Idiomaticity习语性、地道程度Implicitation隐化Index/indexing(建)索引In-line annotation文内标注、行内标注Interlanguage中介语Inter-coder agreement/reliability标注者间一致性/信度Introspection/introspective内省(式)(的)Intuition直觉Key keywords关键主题词Keyness
10、主题性、关键性Keywords主题词KWIC/Key Word in Context语境共现(方式)、语境中的关键词KWIC sort语境共现排序、索引行排序Learner corpus学习者语料库Lemma, pl. lemmata/lemmas原形词、词目Lemmatization词形还原Lemmatizer词形还原工具Lexical bundle词束Lexical density词汇密度Lexical frequency profile词频概貌Lexical grammar词汇语法Lexical item词项、词语项目Lexical patterning词语型式、词汇型式Lexical
11、priming词汇触发理论、词汇启动理论Lexical profile词汇分布概貌Lexical richness词汇丰富度Lexico-grammar词汇语法Lexis词语、词项Log-likelihood ratio对数似然比、对数似然率Longitudinal/developmental corpus跟踪语料库、发展语料库、历时语料库Machine-readable(可)机读的Machine translation机器翻译Manual annotation手工标注、人工标注Markup/mark-up标记MDA (Multi-dimensional analysis/approach)多
12、维分析、多维度分析法Meaning by collocation搭配辨义Metadata元信息MF/MD approach/multi-feature/multi-dimensional analysis多特征/多维度分析法Misuse误用Monitor corpus(动态)监察语料库Monolingual corpus单语语料库Multilingual corpus多语语料库Multimodal corpus多模态语料库MWU/multiword unit多词单位MWE/multiword expression多词表达MI/mutual information互信息、互现信息N-gramN元
13、组、N元序列、N元结构、N元词、多词序列Neo-Firth (school)新弗斯学派Neo-Firthian新弗斯学派的NLP/Natural Language Processing自然语言处理Node (word)节点(词)Normalization标准化、(翻译)规范化Normalized frequency标准化频率、归一频率Observed corpus观察语料库Ontology知识本体、本体Open-choice principle开放选择原则Orthographic正字层面的、字面的Orthography正字法Overuse过多使用、超用、使用过度、过度使用Paradigmati
14、c纵聚合(关系)的Parallel corpus平行语料库、对应语料库Parole linguistics言语语言学Parsed corpus句法标注的语料库、树库Parser句法分析器Parsing句法标注、句法分析Pattern/patterning型式、模式Pattern grammar型式语法Pattern matching模式匹配Pedagogic corpus教学语料库Phraseology短语学、短语Phraseological unit/sequence短语单位/序列Phraseological profile短语概貌Plain text纯文本POSgram赋码序列、码串POS
15、 sequence赋码序列、码串POS tagging/Part-of-Speech tagging词性赋码、词性标注、词性附码POS tagger词性赋码器、词性赋码工具Prefab预制语块Probabilistic(基于)概率的、概率性的、盖然的Probabilistic grammar概率语法、概率性语法、盖然语法Probability概率Query查询、检索Range分布(范围)、跨度Rationalism理性主义Raw frequency原始频数、生频数Raw text/corpus生文本/生语料Reference corpus参照语料库Regex/RE/RegExp/regular
16、 expressions正则表达式、正则式Register语域Register variation语域变异Relative frequency相对频率Representative/representativeness代表性(的)Representivity代表性Rule-based基于规则的S-universals源语型翻译共性(特征)Sample n./v.样本;取样、采样、抽样Sampling取样、采样、抽样Sampling frame取样框架、取样方案Sampling strategy取样方案Sanitization净化Search term检索项Search word检索词Segmen
17、tation切分、分词Semantic association语义联想Semantic preference语义倾向、语义趋向Semantic prosody语义韵Sentence alignment句对齐、句级对齐SGML/Standard Generalized Markup Language标准通用标记语言Simplification简化Sketch Engine文擎Skipgram跨词序列、跨词结构Span跨距Specialized corpus专用语料库、专门用途语料库、专题语料库Standardized type/token ratio标准化型次比、标准化类符/形符比、标准化类/形
18、比Standardized TTR/STTR标准化型次比、标准化类符/形符比、标准化类/形比Stand-off annotation分离式标注Stochastic随机的Stop list停用词表、过滤词表Stop word停用词、过滤词Synchronic corpus共时语料库Syntagmatic横组合(关系)的T scoreT值T-universals目标语型翻译共性(特征)Tag赋码、标记Tagger赋码器、赋码工具、标注工具Tagging赋码、标注Tag sequence赋码序列、码串Tagset赋码集、码集Tertium comparationis对比基础、对比中立项、对比中间项T
19、ext文本Text type文体、文类Text category文体、文类Text mining文本挖掘TEI/Text Encoding InitiativeTEI文本编码计划The Lexical Approach词汇中心教学法The Lexical Syllabus词汇大纲Token形符、词次Token definition/word definition形符界定、单词界定Tokenization分词Tokenizer分词工具Transcription转写Translation memory翻译记忆(库)Translation norms翻译规范Translation universal
20、s/Universal features of translation翻译共性、翻译普遍特征Translational corpus翻译(文本)语料库、译语语料库Translationese翻译腔、翻译体Treebank树库Trigram三元组、三元序列、三元结构T-scoreT值Type类符、词种、词型TTR型次比、类符/形符比、类/形比Type/token ratio型次比、类符/形符比、类/形比Underuse少用、使用不足Unicode通用码Unicodify按通用码编码、转换为通用码Unit of meaning意义单位WaC/Web as Corpus网络语料库Wildcard通配
21、符Word alignment词级对齐、词对齐Word form词形Word family词族Word list词表WordNet词网Word sketch词语素描Word type词种、词型WSD/Word-sense disambiguation词义消歧XML/Extensible Markup Language可扩展标记语言Zipfs Law/Zipfian Law齐夫定律、齐普夫定律Z scoreZ值常用语料库ACEAustralian Corpus of EnglishANCAmerican National CorpusARCHERA Representative Corpus o
22、f Historical English RegistersBASEBritish Academic Spoken English CorpusBAWEBritish Academic Written English CorpusBNCBritish National CorpusBoEBank of EnglishBrownBrown CorpusCANCODECambridge and Nottingham Corpus of Discourse in EnglishCECChina English CorpusCEMCorpus for English MajorsCHILDESChil
23、d Language Data Exchange SystemCICCambridge International CorpusCLECChinese Learners English CorpusCLOB2009 Brown family corpus of British EnglishCOBUILDCollins Birmingham University International Language DatabaseCOCAThe Corpus of Contemporary American EnglishCOHACorpus of Historical American Engli
24、shCOLSECCollege Learners Spoken English CorpusCOLTBergen Corpus of London Teenage LanguageCrown2009 Brown family corpus of American EnglishFLOBFreiburg-LOB Corpus of British EnglishFROWNFreiburg-Brown Corpus of American EnglishGloWbEGlobal Web-Based EnglishHelsinki Diachronic corpusDiachronic part o
25、f the Helsinki Corpus of English TextsHKCSEHong Kong Corpus of Spoken EnglishICCIInternational Corpus of Crosslinguistic InterlanguageICEInternational Corpus of EnglishICE-GBInternational Corpus of English: Great BritainICLEInternational Corpus of Learner EnglishICNALEThe International Corpus Network of Asian Learners of EnglishJEFLLJapanese EFL Learner CorpusLCMCLancaster Corpus Mandarin ChineseLINDSEILouvain International Database of Spoken English InterlanguageLIVACLinguistic Variations in Chinese Spe
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年全包式家居装修合同:打造梦想家园
- 2024年公司整体并购合同
- 2024南京房产中介服务合同
- 2024年工业自动化设备招标需求
- 2024年工程合作意向协议(建筑行业专用)
- 2024年司机配驾汽车租赁合同全新范本
- 2024年二手住房购买合同示例
- 2023年山东大学第二医院北院区技师岗位招聘考试真题
- 2024年劳动合同的薪资福利及工作内容
- 2023年合肥市食品药品安全检验检测中心招聘考试真题
- 中国国电集团公司设备检修管理暂行办法
- DCS系统结构及各部分功能简介
- 竖井井架安装安全技术措施
- 无缝线路铺设与养护维修方法
- 高分子物理教案(Word)
- 新苏教版五年级上册科学全册教学课件(2022年春整理)
- 小学体育水平一《走与游戏》教学设计
- 秋日私语(完整精确版)克莱德曼(原版)钢琴双手简谱 钢琴谱
- 盐酸安全知识培训
- 万盛关于成立医疗设备公司组建方案(参考模板)
- 中波广播发送系统概述
评论
0/150
提交评论