《现代汉语词典》第3版书语词整词标注的多音节词头辨析_第1页
《现代汉语词典》第3版书语词整词标注的多音节词头辨析_第2页
《现代汉语词典》第3版书语词整词标注的多音节词头辨析_第3页
《现代汉语词典》第3版书语词整词标注的多音节词头辨析_第4页
《现代汉语词典》第3版书语词整词标注的多音节词头辨析_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《现代汉语词典》第3版书语词整词标注的多音节词头辨析

一、“标书词”的使用范围和由来书法这个词经常出现在现代汉语中,具有优雅、正式和庄严的色彩。《现代汉语词典》(1996年版;下同;以下简称《现汉》)用“<书>”对这类词作了标示,“凡例”的说明是:“一般条目中,标<书>的表示书面上的文言词语。”如:“学子:<书>学生:莘莘(shenshen)~(很多学生)。”“嘉许:<书>夸奖;赞许:品学兼优,深得师长~。”“凡例”显示标“<书>”的词具有两个特点:一是它的使用范围是书面语,即口语中一般不会用到。二是它的来源是文言词语。为了在行文时加以区分,本文用“书语词”表示一般意义的书面用词语,用标“书”词指《现汉》中作了“<书>”标示的词。对词的语体色彩进行标示,是《现汉》的一个重要创举。它还对另两类词语也作了语体色彩标示,“标<方>的表示方言”,“标<古>的表示古代的用法”。这些标示对加强语言分析和理解的准确性,对提高人们使用语言的水平都是有积极作用的。《现汉》的标“书”词有5570条,占全书词目的近十分之一,这个比例是相当大的。那么这数量众多的标“书”词是些什么样的词?它们表达了怎样的意思?传递着怎样的语言交际信息?在汉语词汇体系中居于什么样的地位?这都是值得探讨的问题。值得进一步探讨的是,标“书”词与标了“<古>”的词如何区分?《现汉》的释义中还存在着“旧词语”,用来表示那些正在逐步退出现代汉语使用的词语;还有指称古代事物的词语,即历史词。标“书”词与它们之间又有着怎样的关系?相互之间如何区分?这些都是很值得探讨的问题。最终,当然也就可以回答“标书词”是不是都是“书语词”的问题。这种探讨不仅跟词汇学有关,而且进入了词典编纂学的范围。在词汇学上它将能帮助我们认识汉语词汇系统的内部成分及其关系,在词典学上将有助于词典编纂水平的提高,有助于提高使用者正确运用词语的水平。二、义项标注与整词标注《现汉》共有标“书”词5570条。现在先来看看这些标“书”词的构成。根据“<书>”标注的词目单位的大小,可分出义项标示与整词标示两类。义项标示的有901条,如“稗”:“(1)稗子。(2)<书>比喻微小、琐碎的:~史。”;整词标示的有4669条,如“陂塘:<书>水塘。”二者分别占16%与84%,后者占了5/6。在整词标示部分又可根据所标示的词目性质,分出“词”、“词素”、“异体字”、“交叉类”四类。下面略加分析:1.单音节词的数量标示对象为“词”,即这个词目具有独立使用的能力。共有3632条,其中单音节词1090条;多音节词2542条,包括出现在单字词目的释义部分中的194条。腤<书>烹煮(鱼、肉)。哀荣<书>指死后的荣誉。2.这个词的风格霭<书>云气:烟~、暮~。芸芸<书>形容众多:万物~|~众生。3.异体词<书>同“鞍”。桮<书>同“杯”。4.标“书”词的语体风格<书>(1)宠爱:~爱|~昵。(2)受宠爱:~臣|~妾。(3)受宠爱的人。按:该例是整词标示,其中义项(1)(2)是词素义,义项(3)是词义。<书>(1)同‘呃’(e)。(2)形容鸟鸣声。按:该例是整词标示,其中义项(1)是异体字,义项(2)是词义。把上面的分类用表格显示,可概括为下表:数据显示,《现汉》中标“书”词的内容是相当繁芜的。1.从标示对象单位的大小来看,它除了标示出整词外,还标示出了义项。标示义项的出现表明标“书”的工作做得相当细微,深入到了对各个词义的分辨。2.从标示的对象性质来看,既有词,还有词素,还有字。字与“词”、“词素”是很不一样的,像“鞌”与“鞍”,“鞌”更雅致或更古朴,可它们的意思与读音都是一样的,只是写法和传递的色彩不一样。可见,《现汉》对标“书”词的认定是完全从语体风格上来作出判断的。值得注意的是,标示对象中“词”与“词素”的差别。“词”是一个独立的使用单位,它的标示,是对它整体的书语词身份与用法的确认。而“词素”的标示则有着不完全一样的功能。当这个“词素”是书面语性质的,但与它共同构词的其他词素是否属于书语词则不定,它所构成的复合性整词是否也必定属于书语词呢?如“霭”是带书语词意味的词素,“烟”、“暮”两个词素不是,构成的“烟霭”、“暮霭”属书语词。可也有不是这样的。如“蕴”是标“书”词,“蕴:<书>(1)包含;蓄积;~藏。(2)事理深奥的地方:底~。”“藏”、“底”不是。构成的“蕴藏”不是书语词,如“蕴藏:蓄积而未显露或未发掘:大沙漠下面~着丰富的石油资源|他们心中~着极大的爱国热情”;而“底蕴”属书语词,如“底蕴:<书>详细的内容;内情:不知其中~”。应该说大多数词素的书语词色彩会影响到整词的色彩。由此亦可见,标词素是一个较为简洁的方法,在理解上也容易抓到关键。3.在对“词”的标示中,根据音节的长短,又可分出单音词与多音词两类。单音词有1090例,多音词有2542例。从上面的统计中,可看到标“书”词的范围相当宽,涉及的对象也相当复杂。这样的处理隐约显示《现汉》似乎并不太介意标“书”是否完全是针对“词”来作出的判断,尽管“书语词”本来是应该对“词”的语体色彩的一种专有属性的分类,而“词素”,特别是“字”并不属于“词”的范围。在这里映透着人们仍习惯于对汉语最小单位——字的认同。标“书”词的判断也就成了对汉语的基础语言单位的一种色彩、语境、风格的选择与认定。这种色彩、语境或曰是风格就是较为典雅,较为僻用,较富文气,而这正是古语词与历史词所同时具有的。那么它们之间有着怎样的关系?这正是诱使我们作进一步探讨的动力之一。由于标“书”词的对象过于复杂,在对“书语词”作进一步判断、甄别,特别是在了解书语词的通用程度、适用语境时,为了做到可操作性,提高分析的准确程度,下面作了筛选,只选用“整词标示”部分而没有选用“词义标示”部分,同时为了更好地纯化,选取的又是“整词标示”中的多音节词,共2348例。这里用的为什么不是2542例,是因为排除了只出现在单字释义中的那194例。因此,下面分析所使用的2348例标“书”词,也就具有了“整词”、“多音节词”、“独立词”等特点。三、词频不统一“凡例”的说明显示出标“书”词具有使用范围是书面语与来源是文言词语的两个特点。这两个特点其实都掩盖不了书语词的另一种很重要的,即断代的共时属性,现实性与通用性应该是书语词所应具有的基本特性。书语词必定会在现实语言生活中呈现一定的使用频率。因此,通过词频调查,我们将能对标“书”词的“现实性”与“通用性”程度有所了解。本文用词频调查的语料是现当代文学作品,共7000万字,涵盖了现当代文学265位作家的343部长篇和3829篇短篇作品,包括小说、剧本、讲义、散文、杂文、诗歌等题材。之所以只选取文学作品而没有选用新闻语料,因为文学作品是书语词最适合出现的语境。我们也将它放在10亿字的新闻语料(人民日报)中作过检索,词频明显低于文学作品,这也从一个侧面说明现在的选择是对的。先从语料中检索出2348条标“书”词的词频,经过人工初步干预,排除因分词错误、同形异义导致的假频,作了简单的频率统计,下表是统计结果:上表中值得关注的是“百分比”栏,其解读如下:被调查的词中10%的词频只有1次或1次以下;20%的词频在1—3次之间;30%的词频在3—7之间;17次是一个分界线,表明低于或高于它的各占一半。以上数据清楚反映了这样一个事实:低频词数量多,频次低;高频词数量少,频次高。有两组数据都有力地支持着这一事实。第一组数据是“平均数”与“中位数”的明显差距。平均数是52.12,中位数是17,说明是少数词的高频率把平均数拉上去了。第二组数据是“百分比”的分布。从低往高处算起,在等距的百分比中,愈是在低位的百分比频距愈小,10%到20%,相差是2,从20%到30%,相差是4,从30%到40%,相差也是4。而在高位的百分比中,频率的数距明显增大。从70%到80%,相差20,从80%到90%,相差55,而90%至最高数(限数),相差4887。将所查得的词频按四分位数来切分,可将第一个25%算低频区,第4个25%算高频区,中间的50%算中频区。低频区的词频在1—4次之间,有词语576条。高频区的词频在50次以上,有词语562条。中频区的词频则在5—49次之间,约1210条,占总数的一半。下面对各个频度的词做个简单分析。1.以具体的任务指的低频词中无一次出现者204条,如:骈阗、膺选、喧豗、萱堂、儇佻、谱牒、酦醅、勖励、讯步、诮呵、牙侩、崖略、皮傅、狉獉、狉狉、披怀,等。出现1次者,如:谐戏、重趼、奥博、佻薄、刑辱、俦类、商兑、佻巧、弋获、驰骛、驰目、欣忭、颓放、瀼瀼、穰穰、荏弱、蜷局、潭府、岁杪,等。出现2次者,如:践诺、枭将、参错、阆苑、悠谬、廓张、并骨、弇陋、笃志、魁元、怏然、津梁、诧愕、杳渺、█测、伶俜、荫翳、炳蔚、沮遏,等。出现3次者,如:厕足、赅括、仓禀、湔洗、剿袭、鹣鲽、俎上肉、蔼蔼、谙练、听讼、倜然、讹夺、傥荡、探胜、陂塘、佛戾、岁除、笔受、拂煦,等。我们之所以将这些低频词按出现的频次细细缕列,是因为这样可以清楚地告诉我们这些词已经很难与当代词语联系起来了。它们已经基本丧失了“当代性”与“通用性”。除极少数以外,大部分应该说已经退出了现代汉语的使用范围。2.高频词的使用频率中频词的频次范围在5—49之间,下面来看看频次为30的词,共25条。它们是:恢恢、逋逃、不韪、粲然、昌言、芳邻、父执、赴敌、率尔、强颜、漪澜、秉烛、鸿儒、宅第、噍类、阑干、离析、受业、挞伐、怃然、宵旰、修明、羞赧、延揽、苟同。中频词都有一定的语言使用频率在支撑着它们,人们对它们有一定的熟悉度。这种熟悉程度与语言使用者的文化水平有密切关系,这是符合书语词特点的。3.“书”词的使用情况高频词的词频数在50以上,共有562条。居于中位的是词频为100次的高频词。词频数在99~103次之间的有16个词:陵寝、人杰、归田、何谓、进谗、倍道、子虚、教化、更始、恻隐、羁█、艳羡、行囊、不才、旧家、手谕。通过上面对三个频度的例词分析,我们已经可以清楚地感受到低频、中频、高频三类标“书”词在现实语料中的使用情况。至少可以说,500余条的低频词已基本丧失了生存能力。中频词、高频词则得到了相当数量语言事实的支持。为什么在标“书”词内部,词与词之间的“现实性”与“通用性”差异会如此之大?可能有这样两方面的原因:第一个原因可能是语料不当,或过于生僻,以致它们难以出现,或过新过俗,不属它们的生存环境。但从对语料的构成分析来看,这个原因基本上可以排除。因为这些语料的作者既有较早的鲁迅、老舍、曹禺、叶圣陶、茅盾、林语堂、巴金、冰心,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论