版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、汉语释义元语言的结构、词义、数量特征厦门大学 苏新春.释义元语言的结构特征释词在结构上总的要求是结构单位尽量小些,使之使用起来更具灵活的搭配组合能力。 通过词与词的灵活组合使元语言的表意功能得到几何式的扩张。在提取元词集时要处理好以下几个问题:1词素义与词义之间呈叠加式关系的复合词,特别是并列式、偏正式的复合结构能分 则分。在词的结构单位与词义载量之间有一层这样的关系,词的结构越复杂,词义的含量越丰富,词的适用范围也就越小。这实际上就是内涵与外延的关系,内涵越丰富,外延越小。任 何语言要素通过一次次的组合,形成一个个大大小小不等的语言层次。其实这并不单单是个纯结构形式,或纯语言物质上的问题,而
2、是直接与语言的表达功能紧密相关。因为每一个大小不等的语言要素不仅是它们的结构外壳不同,而且在这个外壳的内部,所存在的语义状态也大不相同。正因为这点,也就造成了它们在意义表达功能上的巨大差异。而“词”所要研 究的就是它的意义与形式的不可分。如果分开后意义发生了变化,就说明它具有不可分性; 如果分开后意义没有出现变化,就说明它具有充当“词”的必要性。这种情况最容易发生在并列式、偏正式组合的复合性词语中。当词义与词素义的关系不是化合式,而是叠加式时, 它并没有获得新义,也没有获得在词汇群中独特的指称性,反而给自己在指称能力和使用范围上增加了诸多限制。像这样的词语在意义的组合上就属于可分可合型。这样的
3、词语就应以拆分的形式来入选元词集。女口:阿婆:尊称老年妇女。 在“尊称”这样的结构中,后面的部分显然是作为一 个完整的指称实体的,是作为一个概念来出现的,如果把“老年妇女”作为一个词语单位也是可以的。这样做符合词汇学上对“词”定义的要求,即指一个概念,充当一个最小的句子 成分,指称一个客观事物。但仅此要求对释义元语言来说就还不够。因为它是“老年”“妇女”两个构词单位意义的简单相加,并没有出现新的转化词义。而且它们各自都有很强的组合能力。如“妇女”在现汉的释义中就出现了 “中年妇女”“中老年妇女” “年轻妇女”“古代妇女” “已婚妇女” “外国妇女” “贫苦妇女” “贵族妇女” “妇女病” “妇
4、女节” “农家 妇女”等许多组合形式;如“老年”则有“老年男子”“老年人” “中年或老年的女仆”“老年男女” “老年时代”。类似的就应以“老年”与“妇女”两个结构被选。看起来在这里是一 个拆成了两个,可这两个却可以组合成许多个,换来了整体组合功能的大大增强,其效果是明显的。那么,为什么在具体的言语运用中,总会出现大量复合性比较强、结构比较大的“词结构”呢?这里其实是有言语成分与语言成分的差异在起作用。在言语作品中,人们所指往往使用了比较复杂的结构来描绘一个比较具体的对象,这种习惯在社会成员中是普遍存在的, 因此,复杂的结构合称出现的频率也就比较高。这就是一般语言使用者往往把专家们眼下的词组当作
5、一个词来看的原因。本文续接汉语释义元语言的功能特征与风格特征,见本刊2004年第5期。本研究获教育部人文社会科学研究2003年度博士点基金项目(03JB740006)、国家语委“十五”科研课题( YB105-13A )资助。特致 谢忱。 胡明扬说“词语”,载语言文字应用1999年第3期。而语言学家除了合用的频率高低外,还看重它们的理据如何,意义的结合程度如何,故重其分慎其合。而对释义元语言研究来说,它对“词”的认定不仅仅是看它表意的完整性、运用的独立性,还更多了一层,就是看重它表意的意核性、搭配的 灵活性与组合的高效性。 只有符合这些特点的才是释义元语言首先要考虑收录的对象,也只有这样,所提取
6、出来的元词语才能形成精炼、高效的释词系统,也才有可能满足元语言的有限性”要求。当然,在尽量以短结构、小单位的形式入选释义元词时,不应妨碍词义的完整性。它应该保证释词具有词的意义完整性与结构统一性的特征。词作为一个最小的、不可分割的整体,主要表现为它必须表示一个独立而完整的意义。这个意义是特定的,表示着某种特定的事物或现象,所以一般情况下,都不能把词的意义看成为它组成成分的简单相加。因此,词也不能再被分割, 否则,这个词就会失去原有的意义而不再存在了,或者因改变了原来的意义而变成了另外的词。3下面就以颜色词的划分来看看这一原则的运用。释词中有许多颜色方面的词语,光后面有“色”的词就有近百个。“色
7、”字与前面的词结合有这样几种情况:与单音节颜色词的结合;与表颜色的物名词的结合;与表示颜色程度的形容词结合;与指明颜色部分的物名词结 合;与表性质词的结合,及与动词等的结合。如:A类是单音颜色词加“色”字表示颜色种类的,如:白色、彩色、赤色、褐色、黑色、红色、蓝色、绿色、黄色、灰色、紫色B类是指物词加“色”字形容颜色种类的,如:花色、金色、玫瑰色、米色、桃色、血色、银色、肤色、橙色、棕色、茶色、橄榄色、栗色、土色、藕色、货色、锖色C类是描绘性词语加“色”字表示颜色程度的,如:深色、浅色、单色、各色、粉色D类是表名物词加“色”字表示名物性质的,如:姿色、山色、脸色、面色、眼色、夜色、音色、天色、
8、女色、气色、声色、酒色、E类是表性质词加“色”字表示颜色性质的,如:怒色、神色、美色、喜色、保护色、本色、特色、F类是支配性词语加“色”字,“色”作为实体出现的,如:好色、变色、补色、退色、褪色、脱色、无色、染色、润色、着色、上色、有色、出色G类是名词与“色”字,表示颜色种类的,如:成色、五色、原色、杂色、基色H类是颜色复合词。如:赤褐色、赤铜色、粉白色、金黄色、米黄色、黄褐色、灰白色、 银白色、茶褐色以上颜色词的词义与词素义之间的关系都很清楚。 从可拆性来看,只有A、H类可分离, A类可以用“红” “黄”“绿”等单音节的颜色词来替代,而其它都是不可拆的。H类拆分后意义变异并不大。可其它的词语
9、却不行了,尽管它们内部的理据清楚,复合词强,但拆开后表颜色的意义就会出现很大的变化。 作为释义元语言来说,不可能都将它们选取,只能保留 一些表示基本色的词语,而将其它割爱了。在需要对颜色进行细致描绘时, 只能用描绘性的 语句而不是单一、独立、细致具体的颜色词。补充式、动宾式结构的复合结构能分则分与上面所遵循的原理一样,释义元语言研究对那些补充式、动宾式的复合性结构也应是能分则分的原则,即使是凝固程度相当高的,如果是结构的拆分不影响到意义的表达,也应是慎言其合的。下面来分析几组例。“住”是一个高频词释词。经用分词软件处理后,它在释词中一共以48种结构形式出现了。单音字算一种,复音节47种。在下面
10、这样的复音结构中表示的是 “居住” “停止”“关 闭”义,它们肯定属实词:居住、暂住、住持、住处、住地、住房、住户、住家、住宿、住所、住院、住宅、住宅 区、住址/不住、住手/住口、住嘴葛本仪现代汉语词汇学,山东人民岀版社,2001年。第32页而在下面这些复音词结构中,都是用在动词后面充当补语,表示牢固、稳当义,停顿、静止义,跟得(或不)连用,表示力量够得上(或够不上)义:保住、撑住、挡住、顶住、堵住、记住、截住、揪住、捆住、拦住、蒙住、拴住、围住、 稳住、握住、咬住、遮住、止住、抓住、捉住、留住、愣住、保不住、备不住、背不住、对 不住、禁不住、禁得住、经得住分词软件把它们作为一个单位来处理,显
11、然把它们是看成了词。在人们的语言使用习惯中它们确实也是结合得非常紧的。像上面所举的“住”字双音词人们一般不会单独地只说前面的 动词“保”“撑” “挡” “顶” “堵” “记” “截” “揪”等的。可“住”还单独出现了 261次。除了大都是作为主要动词外,还在下面这些动词后出现过:压、粘、抵、缠、系、缝、屏、钩、插、卡、扣、别、闭、逮、把、拉、包、塞、捏、盖、停、夹、吊、拢、捧、掐、支、包、关、扶、勒、绊、擒、牵、拖、托、忍、裹、阻、套、搭、挂、绑、收、迷、兜、糊、系、守、扭、绕、哽、按、勾、定、提、束、架、罩、埋、捂、噎、钳、逮约束、遮掩、抑制、把握、抵抗、控制、遮蔽、固定、掌握、束缚、保存。
12、“保住” “撑住”与“压住” “粘住”有何不同?为什么前者是切为一个单位,后者切为两个 单位?它们的功能、作用、结合对象等,都十分相近,可却有了两种不同的处理方法。这显 然是不恰当的。如果说某某动词与后面的“住”结合得十分紧,非它不说,倒也罢。其实又 并非如此。如“围住”出现了五次,都是划成了一个单位,可“围成”有25次,却被划成两个单位。当然这可以说,“围成”往往后面还要带表示结果的成分,可是与和它相邻词语进行对比后,发现后面带不带别的成分并不能成为必须这样或必须那样的理由。显然,承袭这样的分词结果只会带来分歧。这也不符合释义元语言对释词的词汇结构最小化的要求。“住”作为一个动词后补性性质,
13、能与它结合的动词是那么多,合起来作为一 个单位,就与原来的单音动词分而立之,成了两个。所以,尽管它们的结合相当密切,如果 分开后并不妨碍词义的理解,就都应分开来处理。这样只要把“住”在实词义外的作动词补充义的半虚化义独立出来自成一类,就可以关照到一大批动词了。对动宾式结构,分与合之间也是较难处理的一类,软件的切分中属可议者就有不少。女口:守门、收费、受罚、受累、受冷、打鼓、图利、贪财、输电、输血、松手、签名、掌权、致 病、握手、伐木、发话、换车,如:出租汽车:供人临时雇用的汽车,多按时间或里程收费。也叫出租车。免费:免缴费用;不收费:像这里把“守门” “收费”都作为一个单位来划分,将会大大增加
14、词语的数量。对动宾结构关系的处理,仍应遵循从紧的原则,即意义未发生转移、变化时,结构的划分宜分不宜合。像下面这些词合起来成为一个单位还是有成词理据的:失信、生根、打雷、 烧酒、作乱、变色、筹款、插嘴、讲学、含笑、赶集。当然,即使是在同样具有成词理据的 情况下,只要意义没有发生大的变异,对释义元词来说,都要依照从紧的原则来处理。词缀的分与合汉语中还有许多词缀成分,或是位于前面,“第、阿、化、所、非、超、无、非、反、可、手”,或是位于后面,“家、头、性、子、者、儿、式”。有的词缀跟词干结合得特别紧, 影响着词义与语法属性,这样的结构是密不可分的。而有的词缀与词干的结合比较松,分开后不影响词的意义和
15、语法属性,这样的结构就宜把词干与词缀分开。第一类,宜合不分的。以“化”字为例。这是一个动词性的后缀, 含有变化、演变的动态意思。它大都放在动词性词素后面,强化了它的动作义。也能放在形容词性与名词性词素后,使之词素化,并获得了动词的意义与功能。如消化、熔化、融化、分化、转化、进化、简化、孵化、退化、焚化、教化、裂化、驯化、 催化、合作化、软化、腐化、硬化、净化、绿化、美化、形象化、氟化、复杂化、恶化、典型化、淡化、 丑化、同化、简单化氧化、磁化、炭化、风化、液化、硫化、工业化、钙化、表面化、公式化、乳化、社会 化、羽化、皂化、神化、煤化、氯化、欧化、理化、具体化、人格化、碱化、集体化、机械 化、
16、水化、规格化、民主化第二类,宜分不合的。以“者”字为例。在分词软件的处理结果中,“者”字作词尾的词 50个,它们是:爱好者、编者、长者、倡导者、初学者、第三者、读者、独裁者、二者、发明者、革命 者、工作者、后者、患者、或者、记者、精神胜利者、劳动者、两者、流氓无产者、旁观者、 前者、强者、侵略者、弱者、三者、射击者、生产者、胜利者、使者、始作俑者、手工业者、 受事者、死者、所有者、听者、统治者、先驱者、先行者、消费者、小生产者、小手工业者、 新闻记者、行者、学者、业余爱好者、优胜者、游民无产者、著者、作者出现总次数505次,次数最高的前 5词是:死者81、或者68、统治者48、作者37、患者3
17、7。从释义元语言看来,这么多的“者”字词显然不符合其收词标准的。因为除了频率外, 它最关心的还是元词必须具有在词义指代功能上的不可替代性。像“爱好者”、“长者”、“编者”、“读者”这些都是属于词素义的简单相加型,而“第三者”这样词义与词素义之间有明 显距离的很少。在释词的自动切分中,“者”被单独切分出来的还有 196次,如果把“者”字与它前面 的词语合称的话也就与上面例举的“者字词”无异,就会出现如“存款者”“放款者” “应试者”“犯罪者” “杀人者” “创造者” “违法者” “歌唱者” “获奖者” “住宿者” “领导者” “当 局者”“追随者” “迫害者” “施事者” “主宰者” “工商业者
18、” “修理者”之类的词语。这些与 上面作为一个结构出现的“射击者”“发明者” “旁观者” “手工业者” “业余爱好者”其实无甚区别。其实,即使是用一般的标准来衡量,“者”字结构在作为词来认定时也要从严。在现汉的词目中,以“者”字作词尾的词有25个:笔者、编者、第三者、读者、患者、或者、记者、来者、劳动者、老者、流氓无产者、 始作俑者、使者、侍者、无产者、先行者、小生产者、小手工业者、行者、学者、游民无产 者、再者、长者、著者、作者从这些例词可以看到这样几个特点:“者”字前的单字的多,多字节的少;“者”与前面的结构结合得非常紧密,即使是多字节的,它们结合后的稳定性也极强, 如“劳动者” “无产者
19、” “先行者” “始作俑者”。大多数多字节的者字结构,如果将它们拆开 的话,“者”字前面的结构几乎不会单独说到,如“无产”“流氓/无产” “游民/无产”由于“者”字极强的构词能力,由于“者”字结构内部大都属于意义叠加式的组合,像“者”字的构词成分如果将它们专门作为一类构词素在释义元语言中保留它们的地位,这里将它们笼统称之为“虚化的构词成分”。学术界对它们的看法不尽统一将会有助于释义元词在有限词数的范围内增大它的容量与有效性。数量词的分用数词与量词之间的结合, 无论是在软件分词中, 还是在人们的习惯中, 往往会有许多被 人们看作是一个词单位的。在现汉的 61万个释词中,带“一”的词有 5341个
20、,占总词 量的0.9%。除去重复者仍有278个,占总词种数的约7%,除了 “一定”“一边” “一般”“同 一”“一道” “一齐” “一概” “一心” “一旦”等具有词的理据外,像“第一” “一亿” “一种”“一百万” “一片” “一天” “一方” “一点” “一端” “一些” “一面” “一代” “一侧” “一月” “一角” “一手” “一伙” “一说” “一条” “一度” “一口”,这样都是应该分而居之的。兼类词的简化处理汉语的兼类词是普遍存在的。愈是基本的词,愈是单音节词,愈是多义词,一词多类的现象愈是普遍。这方面我们曾作过一些专题调查,苏新春,同形词与词的意义范围,载辞书研究,2000年
21、第3期发现即使是像现汉这样刻意划分词的不同语法功能的词典,其中相混的也不在少数。不是不想分,而是处理起来实在太棘手。而对释义元语言研究来说,对此的简化处理,并不是因为它难,而是作为基本词、元词的要求,它最看重的是词的指称对象与搭配组合能力,所以把表意功能放在了第一位。如“使用、经过、区别、产生、规定”等都能在几种功能之间自如地变换,正是这种普遍使用的多种语 法功能与相互之间灵活转换的特性,才更好地符合了释义元语言的要求。这时再按在其他场合可能适用的词的语法功能单一的要求来看待释义元词,显然是有损于释义元语言的性质与作用的。通过以上五方面的分析, 就会发现在它们综合影响下的最终结果,就是释义元词
22、在结构上表现出来的词核化。它们是在汉语词汇系统中起最重要表意作用的那部分词,词的长度普遍较短,并包括少数几个有极强构词能力的非自由词素。二释义元语言的词义特征在词义的面貌与性质上,释义元语言也会表现出自己的特点。1 通用性的特点通用性指的就是它必须是属于当代语言中使用面最广,人们大众所熟知的词语。首先它必须是真实语言,或说是自然语言的一部分。 这与认知元语言是有着根本不同的。 认知元语言,或哲学元语言,所使用的语言符号是形式语言中的抽象成分,它的数量可以是仅为有限的,但它已经不属于自然语言,只是一种构拟成分。因此,它也存在于专业领域, 存在于行家里手。其次它应该是尽量为更多的人所使用、所熟悉,
23、明白通晓,流行范围最广的词语,而不是与此相反的地域词、行业词,或偏雅或偏俗的词。如“大拇指”太俗,“大拇哥”太偏,通用的应是“食指”。再次是它应属中性词,不应带有更多的色彩,特别是感情色彩、时代色彩。通用性是释义元语言最重要的一个特点。自古以来,凡是很好地承担了释义任务的大体上也都具有通用的特点。 在释义语言的所有使用场合,无论是定义式的描述性释义,还是同等对释式的同义词释义,通用性都是释义词语应具有的基本特征。对以上论述,下面的例子是一个很好的印证:释词中有“保佑” “占卜” “占”三个词,可以都归之于词林中的“ HI迷信活动”。 经查验,“占”是多义词,在释词中出现了76次,基本上不作“算
24、卦”用。“保佑”出现了11次,解释的词语是“庇荫、庇佑、祷告、呵护、护佑、还愿、吉人天相、祭祀、谢天谢 地、荫庇、佑”。“占卜”出现了 32次,解释的词语是:“卜2、蔡2、卦、珓、课3、签2、 蓍、栻、筮、占、贞2、繇、八卦、卜辞、卜筮、龟甲、龟鉴、吉卜赛人、甲骨文、灵童、 六壬、起课、签筒、未卜先知、问卜、星术、熏沐、阴阳、阴阳生、转世”等。32的数字是一个比较高的使用次数,累积覆盖频率也排在73.678%处,单从频率来看,它似乎成为释义元词是无庸置疑的。但之所以仍提出来讨论,原因就是释义元语言的释义对象是一般性的 语文词语还是比较偏难的词语或专门的专科语词,是满足一般语言学习者的认知需求还
25、是要达到专门的解读目的。 说到这里,应该指出的之所以要对释词作如此认真的甄别,就是因为它完全来自于现汉,而现汉收录了相当高比例的百科词语,对相当多的百科词语所 作的解释也过于专业。 因此,在提取释义元语言时, 对释义对象与释义深度是必须做出认真 考虑的两个关键问题。2 高频的特点高频指的是使用频率高, 在所有的释义活动中经常使用到的词语。这是释义元语言的自然状态与属性,也是释义元词的筛选标准。本研究所进行的释义元语言研究是一个实证性很 强的工作,即它依据的材料首先是真实的文本,而不是理论上虚构。初步分析后,可以发现释词的数量非常可观,有数万条之多,那么哪些是释义元词,值得提取、保留,最直观的感
26、 觉就是那些出现频率高的词。这是最直观的一条标准。高频性与通用性有互为表里的关系, 但各自的侧重点又不同。 高频是指其在已有的释义语言中出现次数多,通用是指其在最一般的、通常的语言环境中会普遍使用到。频率的鉴别是在对数万条释词进行第一步筛选时所作用的方法。3.义域宽广的特点义域宽广指的就是释词的意义要比同类其它词语的意义范围要大,义域要广。这也是由释义功能决定的,特别是在同义式的对等释义中更是如此。笔者曾做过一个调查,发现说文解字所有的单字对释词,都表现出了 “广义性”的特点。见论古汉语基本词汇的广义性,广州师范学院学报,1987年第1期。如何确定古汉语基本词汇的广 义性,广州师范学院学报,1
27、990年第1期。现在看来,基本词汇与释义元语言在这一基本特征上是相通的。义域宽广的词意义覆盖面大,词义内涵要少,这样才能在释义时更好地承担起解释的功能。使用义素分析法来进行分析,一般情况下,广义词的义素显得相对要少,狭义词的义素相对要多。现汉在释义时常使用到的“多指”,其实就是在对广义释词进行限定性的说明。另一个还经常见到的就是直接把上位词用作释义,如释某某山谓之为“山名”,释某某水谓之为“水名”即此。对广义词能起到鉴别作用的还有一个 很好的材料,就是它们在义类词典中往往是充当“主题词”“类名词”的词。4 组合性强的特点兀语言不可能太多,太多就不构成其为语言核心的“兀”。兀语言作为一级语言单位
28、来说,不可能太大。组合单位一大,也就意味着意义要素多,意义要素多,也就必然带来使用 范围变小变窄。因此,元语言必然是一些“元素”性很强的词核性的基本词。但它们又不能 是一些孤立性的语言个体,除了一些封闭性的词类和一些具有特殊功能的词语外,元语言还应包括有足够语义覆盖面的各个词类中的常用词与基本词。要求它们具有良好的组合性,能充分利用自身的特点,以成为复合构词,及组词成句的基本成分。 在构词范围,就是能灵活地组成更多的合成词,在成句范围,就是能和更多的词语成分形成搭配关系,在语用范围, 就是能适用于更多样的语言环境。三释义元语言的数量特征释义元语言的确定数量不能太多,必须限定在一定的数量范围之内。有限量是元语言形成的一个外部特征,又是它内在素质要求的体现。只有“有限”,才能具有“元”语言的资格,才能更好地体现元语言的表意功能。元语言的价值本来不仅仅是表现在数量有限上,它应是语言中最有表意功能的那部分核心词汇成分的体现。对这样的语言成分,不能用简单的数量与功能之间的比差关系来衡量。它们的数量虽小,但却能完成语言表达交
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 20136-2025内燃机电站通用试验方法
- GB 10631-2025烟花爆竹安全与质量
- 2026年广东省农业科学院作物研究所招聘科研助理人员备考题库及1套完整答案详解
- 2026年宁波市江北区国有资本投资控股有限公司人员招聘备考题库完整参考答案详解
- 2026年佛山市三水区三水中学引进高层次人才备考题库及一套答案详解
- 2025-2026学年厦门市翔安区逸夫小学公开招聘非在编合同教师备考题库及答案详解1套
- 2026年岱山县青少年宫公开招聘编外人员备考题库完整答案详解
- 2026年中建六局总承包工程有限公司招聘备考题库及1套参考答案详解
- 2026年厦门市嘉禾学校编外教师招聘备考题库及完整答案详解一套
- 2026年三亚大小洞天发展有限公司招聘经理备考题库及1套完整答案详解
- 建设单位项目安全生产保证体系
- 2026期末家长会:初三备战没有不辛苦的 教学课件
- 真空乳化设备维护与清洁操作手册
- 2025贵州铜仁市“千名英才·智汇铜仁”本地引才413人参考笔试题库及答案解析
- 2026年内蒙古商贸职业学院单招职业技能测试题库及参考答案详解一套
- 退赃后赔偿协议书
- 法律基础(西南政法大学)学习通测试及答案
- 信息通信信息化系统管理员操作规范竞赛考核试卷含答案
- DIP支付模式下骨科临床路径优化策略
- 高中生心理健康问题分析及干预策略
- 中学语文美育教育论文
评论
0/150
提交评论