HSK动态语料库代码说明_第1页
HSK动态语料库代码说明_第2页
HSK动态语料库代码说明_第3页
HSK动态语料库代码说明_第4页
HSK动态语料库代码说明_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本文格式为Word版,下载可任意编辑——HSK动态语料库代码说明“HSK动态作文语料库〞语料标注及代码说明

“HSK动态作文语料库〞从字、词、句、篇、标点符号等角度,对所收入的作文语料中存在的外国人使用汉语的中介语偏误进行全面标注。

1、字处理(包括标点符号)

[C]:错字标记,用于标示考生写的不成字的字。用[C]代表错字,在[C]前填写正确的字。例如:地球[C](“球〞是错字)、这[C]。

[B]:别字标记,用于标示把甲字写成乙字的状况。别字包括同音的、不同音而只是形似的、既不同音也不形似但成字的等等。把别字移至[B]中B的后面,并在[B]前填写正确的字。例如:提[B题]高、考虑[B虎]。

[L]:漏字标记,用于标示作文中应有而没有的字。用[L]表示漏掉的字,并在[L]前填写所漏掉的字。例如:

悔恨[L],表示“悔〞在原文中是漏掉的字。农[L]药,表示“农〞在原文中是漏掉的字。

[D]:多字标记,用于标示作文中不应出现而出现的字。把多余的字移至[D]中D的后面。例如:我的[D的],表示括号中的“的〞是多余的字(原文中写了两个“的〞)。

[F]:繁体字标记,用于标示繁体字。把繁体字移至[F]中F的后面,并在[F]前填写简体字。例如:记忆[F憶]、单{F單}纯、养{F養}分{F份}。注意:

1)繁体字标记标示的是使用正确的繁体字,假使该繁体字同时又是别字,则先标繁体字标记,再标别字标记。例如:质朴[F樸[B僕]]。

2)繁体字写错了,标为:后[F後[C]]。

[Y]:异体字标记,用于标示异体字。把异体字移至[Y]中Y的后面,并在[Y]前填写简体字。

例如:偏[Y徧]、沉[Y沈]。

[P]:拼音字标记,用于标示以汉语拼音代替汉字的状况。把拼音字移至[P]中P的后面,并在[P]前填写简体字。例如:缘[Pyúan]分、保护[Phù]。

[#]:无法识别的字的标记,用于标示无法识别的字。每个不可识别的字用一个[#]表示。例如:更[#][#]保存自己的生命,……

[BC]:错误标点标记,用于标示使用错误的标点符号。把错误标点移至[BC]中BC的后面,并在[BC]前填写正确的标点符号。例如:勤奋、[BC,]刻苦的精神。

[BQ]:空缺标点标记,用于标示应用标点符号而未用的状况。把[BQ]插入空缺标点之处,并在[BQ]中BQ的后面填写所缺的标点符号。

例如:周边的环境很恬静[BQ,]生活也十分平凡。

[BD]:多余标点标记,用于标示不应用标点符号而用了的状况。把多余的标点移至[BD]中BD的后面。例如:我家周边的[BD,]美丽风景。

2、词处理:(包括成语)

{CC}:错词标记,用于标示错误的词和成语。包括4种状况:1)把词的构成成分写错顺序的。

把写错的词移至{CC}中CC的后面,并在{CC}前填写正确的词。例如:首先{CC先首}、众所周知{CC众所知周}。

2)该用甲词而用乙词的。这种状况类似别字,但属于用词层面上的错误。

标示方法同上。例如:

虽然现在还没有实现{CC实践},……

它在{CC对}价格方面有点贵,所以没得到广大消费者的支持{CC持支}。3)生造词。指考生自造的、或某些外语中可能有而汉语中不存在的词。

例如:

农作物{CC农产物/农物}、农产品{CC农作品}

……但长期来看造成环境污染,破坏自然生态{CC目态},……

绿色食品的好处在于吃这些食品后在身体里没有农药的残留量{CC潜留量}。4)词语搭配错误。包括词性、音节等方面的搭配错误。例如:

最好的方法是两个都保持{CC走去}平衡。我也回{CC1回去}沈阳。

吃这种东西会{CC1可以}得{CC1得到}病{CC1疾病}。

{CLH}:离合词错误标记,用于标示各种和离合词相关的错误。标在有错误的离合词的后边,表示前边的离合词用法有误。例如:

……我快要毕业{CLH}大学{CQ了}。虽然这么[L]多年都没见面{CLH}过,……

……我对哈尔滨{CJ-zy很}感兴趣。有观光{CLH}哈尔滨的宿愿。

{W}:外文词标记,用于标示以外文词代替汉语词的状况。把外文词移至{W}中W的后面,并在{W}前填写相应的汉语词。在W和外文词之间填写汉语词的字数。例如:

非洲{W2Africa}、爵士乐{W3jazz}。……教我工作的方法{W2ABC}。

{CQ}:缺词标记,用于标示作文中应有而没有的词。在缺词之处加此标记,并在{CQ}中CQ的后面填写所缺的词。例如:

这就{CQ要}由有关部门和政策管理制度来控制。

……有的农民{CQ在}不使用化肥和农药的情[B精]况下[BD,]养农作物,……

{CD}:多词标记,用于标示作文中不应有而有的词。把多余的词移至{CD}中CD的后面。例如:

……然后肯德基的收入有所增加{CD了}。

中国政府应当采取良好的措施来管理农业{CD方面},……但我觉得{CD依照}上面所写的方法是现在好多人或国家用的方法。

词处理中需要注意以下问题:

1)因介词、方位词等的缺少或多余造成的结构不完整,助词的错用、多用、漏用,词性误用等,均视为词的错误。例如:

随着社会{CQ的}发展,人们{CQ对}吃的东西很重视。在这个过程{CQ中}……

特别是非洲{CD的话},问题很大的。

2)结构助词“的〞、“地〞、“得〞混用:按错词处理。例如:

依照人们的要求不用化肥和农药的话,产量会大大地{CC的}下降。我认为当你很饿的时候,什么东西都吃得{CC的}下。

孩子们饿得{CC地}大哭小叫,……

3)该用汉语数字而用阿拉伯数字的,一律按错词处理。例如:

那应当怎样解决呢?所以我想出了一{CC1}个方法,少用化肥和农药。

把“十五〞写成了“一五〞,应把“一五〞整体按错词处理,而不能仅仅把“一〞处理为别字。

4)错词、多词、成分赘余的一个标注符号中可以包括两个或两个以上的词。例如:

我想任何人{CC每一个}都不要有浪费食品的习惯,……(每/一/个)没有{CC2重视做未经}污染的食品就是绿色食品。(重视/做/未/经)

5)原文字数和改后字数不一致的,须在括号中CC之后且紧靠CC处加一个阿拉伯数字,说明改后的字数。例如:

战[Pzhan]争中最困难的人是没有力气的孩子和老人{CC5老弱子}。

所以我认为首先农民可以使用自然肥料{CC4化肥},代替化肥来种植农作物……

6)不明白或无法理解的词用{CY}标示,表示“存疑〞,标在该词的后面。例如:

虽然这么[L]多年都没见面{CLH}过,但我和他们的忆惯{CY},是忘不了的。

3、句处理:

{CJ}:病句标记,用于标示错误的句子。一般标在有错误的句子之后、该句标点之前,并用小写汉语拼音字母简要标明病句的错误类型。例如:

他把那本书看{CJba}。

我认为我们先尽量地[B的]产出农作物给他们,先给他们不挨饿{CJjy}。假使有人批评这是太奢靡{CJxw},……句子错误类型代码:{CJba}:把字句错误{CJbei}:被字句错误{CJbi}:比字句错误{CJl}:连字句错误{CJy}:有字句错误{CJs}:是字句错误{CJsd}:“是……的〞句错误{CJcx}:存现句错误{CJjy}:兼语句错误{CJld}:连动句错误

{CJshb}:双宾语句错误{CJxw}:形容词谓语句错误

{CJ-}:句子成分残缺错误标记,用于标示由于成分残缺造成的病句。在短横后边标明所缺成分的名称,该名称用小写代码表示;在小写代码之后填写所缺的具体词语。标在成分残缺之处。例如:

为了增加{CC满足}粮食,{CJ-zhuy人们}使用了化肥和农药,这样产量就会大大提高。这样的活动{CJ-sy开展}以来,肯德基的垃[B拉]圾[C]总量大大降低。……那两种{CC个}东西就简单伤害人类的{CJ-dy健康}系统。从具体{CJ-zxy状况}来看,……

{CJ+}:句子成分多余错误标记,用于标示由于成分多余(赘余)造成的病句。后边用小写代码标明多余成分的名称,并把所多余的具体词语移至该名称的后面。标在成分多余之处。例如:

这是我们{CJ+dy做人}的责任。

而且研究{CJ+buy下去}产量能提高的方法。而且{CJ+zy正在}还死去好多人。

句子成分采用层次分析法的观点,共8种:{CJ-/+zhuy}:主语残缺或多余{CJ-/+wy}:谓语残缺或多余{CJ-/+sy}:述语残缺或多余{CJ-/+by}:宾语残缺或多余{CJ-/+buy}:补语残缺或多余{CJ-/+dy}:定语残缺或多余{CJ-/+zy}:状语残缺或多余{CJ-/+zxy}:中心语残缺或多余

{CJX}:语序错误标记,用于标示由于语序错误造成的病句。标在语序错误的词语的后边。假使是相邻的两个成分语序

错误,依照自然顺序,把{CJX}标在前一个成分的后边。例如:

大多数{CJX}这些人生活{CC2活}在很不好的地方,……可是这两个问题同时{CJX}要解决十分不简单,……现在每个人很重视健康,受欢迎{CJX}绿色食品。

{CJZR}:句式杂糅错误标记,用于标示把两种不同句式、两种不同说法混在一起的病句。标在句子末尾,标点之前。例如:

这个问题不可能一两年解决的问题{CJZR}。

现在,全世界流行是绿色食品{CJZR}。每次吃对身体有害于健康的东西{CJZR}。

由于,人们的必生存之一中最重要的是饮食{CJZR},……

{CJcd}:重叠错误标记,用于标示句中词语的重叠错误,包括重叠方式上的错误,也包括不该用而用重叠,或该用而不用重叠的状况。标在出现重叠错误的词语之后。例如:

而对生产者来说,尽量不用化肥和农药,在出货之前,进[C]行洗洗{CJcd}。还有我们{CQ应}对绿色食品研究研究{CJcd}。

{CJgd}:固定格式错误标记,用于标示固定格式搭配上的错误。例如:

“一……就……〞缺少“一〞或者“就〞。

现代社会应当认“保护自己,尊重其他人〞为口号{CJgd}!

{WWJ}:未完句标记,用于标示没写完的半截子的句子。标在未完成句的末尾处。例如:

只是全球{WWJ}

最终国家政府不考虑经济问题、积{WWJ}

不知道什么时候会普及起来,但是我认为这还是不是个{WWJ}

{CJ?}:句处理存疑标志,用于标示错误类型不明白的、或错误类型标注很不便利的、或句义不明且有语法错误的的病句。标在存疑病句之后、该句标点之前。例如:

地球上,有的地方还在“饥饿〞来艰苦{CJ?}。

还要想每个人的健康是帮助饥饿人的方法越来多健康的人会越来多帮饥饿的人{CJ?}。

把化肥可以取代{CC代取}用草、剩饭做的自然肥料{CJ?},把农药也可以取代{CC代取}喜欢吃害虫的动物{CJ?}。

4、篇章处理:(包括复句)

{CP}:篇章错误标记,用于标示篇章错误。大括号的前半和后半分别表示有错误的篇章的起点和终点,在起点处标CP,

在终点处标P。即:{CP……,……。……,……。P}

所谓篇章错误,主要指句子和句子之间在衔接方面的错误。最典型的状况是每个单句都正确,但作为一个整体来看则句子相互之间缺乏联系,不能构成一个紧凑、自然、流畅的成段表达。而产生这种状况的原因,可能是语义方面的,也可能是连接方式方面的。例如:

{CP我们经过了漫长的历史,一些没有用的人死于历史中,挨饿其实是可以战胜的。P}(前后句意义上无关)

{CP吸烟对孩子们{CJ-sy有}不好的影响,这一观念他会不会知道呢?所以我早就不理他了。P}

(用了表示因果关系的连词,但句子之间并不存在因果关系)

{CP目前,随着人们生活水平{CQ的}提高,{CJ-zhuy人们}{CD就}对饮食品很重视。就{CJX}{CQ用}未经污染的农产品加工的食品叫做“绿色食品〞。P}(前后句之间缺少过渡句)

{CP我以前看报纸的时候,有一篇关于农药的文章。他说,一般的食品,譬如说,米,蔬菜、水果等{CD的}东西,好好儿洗一下就行了,不用担[B但]心。P}(“他〞指称不明,使两句之间失去联系)

5、其他相关问题说明:

1)标注的顺序优先原则:从大到小,即:篇——〉句——〉词——〉字。

篇章错误中含有句、词、字错误的,错句中包含词、字错误的,词中包含字的错误的,均应依照从大到小的顺序依次处理,分别标注。

对同一个错误,能按篇章错误处理的即按篇章错误处理,否则按句式错误处理,其次按句子成分错误处理,再次按词的错误处理,最终按字的错误处理。

从句式的角度看,把字句缺“把〞、被字句缺“被〞、有字句缺“有〞、是字句缺“是〞、“是……的〞句缺“的〞等,均按特别句式错误处理,而不按成分残缺或缺词处理。换句话说,有些错误虽然可以按句子成分错误或错词处理,但假使是涉及某种特别句式的问题,则一般优先按句式错误处理。

从词的角度看,句中所缺之词假使涉及某种句式,则标为错句;虽然不涉及句式,但可以充当某种句子成分,则应按成分残缺处理;与句式、成分都无关的才按缺词处理。例如:

假使我的祖国{CC母国}是西方的先进国的话,我选“绿色食品〞。{CP假使我不是西方先进国的人,而且缺少粮食国家的人的话[BQ,]不选“绿色食品〞[BQ。]P}

(复句中关联词语的使用错误按篇章错误处理,而不视为错词或别字)我对这个问题以下几个观点{CJy}。

(该句应为有字句,所以按错句处理,而不按缺述语或缺词处理)对于非洲来说{CC来看},这是还不够{CJxw}。

(汉语中形谓句无需用“是〞,所以按错句处理,而不按多述语或多词处理)我认为这种{CD的}现象,……在好多人身上{CJ-zy都}会有的。(“都〞可以做状语,所以按成分残缺处理,而不按缺词处理)从{CC对}现在的状况来说,让大家去吃

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论