质的标准和量的依据_第1页
质的标准和量的依据_第2页
质的标准和量的依据_第3页
质的标准和量的依据_第4页
质的标准和量的依据_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

质的标准和量的根据论文关键词语文词典收词质的标准量的根据论文摘要文章从词与短语、新词与旧词、语文词与百科词、语言义与言语义四个方面讨论汉语语文词典的收词问题,认为语文词典收词应该把质的标准和量的根据结合起来,既要做到收词标准明确,执行标准严格,标准具有可操作性,又要兼顾词条的总量控制以及量的平衡和量的统计、力避收词增义的主观随意性。2022年3月至6月,笔者有时机参加了?现代汉语标准词典?(李行健主编,外语教学与研究出版社、语文出版社,2022。以下简称?标准?)的审订修改工作,负责t、两个字母的全部词条。在审阅过程中产生了一些想法。在查阅?现代汉语词典?(商务印书馆,2022。以下简称?现汉?)的过程中,也有一些感触。下面即以这两部词典为据,讨论语文词典收词的假设干问题。一、词与短语词典,顾名思义,应当只收词和功能与词相当的固定短语。但由于受语文辞书收词立目传统习惯的影响,目前汉语语文辞书往往字、词典功能不明,词典往往兼具字典的功能。笔者曾主张区分两者功能,让它们各司其职。无论词典以什么样的单位立目,词无疑是诃典的主体。因此,对词确实定乃是关键。?标准?和?现汉?都不同程度地存在收词标准不严、失之过宽的情况,?标准?尤甚,主要表现为收了不少短语或叫“短语词〞。例如,“挨(áī)〞字头下,?标准?收录“挨板子、挨呲儿、挨打、挨刀、挨斗、挨黑枪、挨闷棍、挨蒙、挨批、挨日子、挨时间、挨宰、挨整、挨揍〞14条,?现汉?收录“挨板子、挨批、挨宰、挨整〞4条。?标准?14条注有引申义或比喻义的有“挨板子、挨打、挨刀、挨黑枪、挨闷棍〞5条,?现汉?4条注有比喻义的有“挨板子、挨宰〞2条。下面是两词典对以上没有转义的词的释义:挨眦儿口受批评;受训斥。(?标准?)挨斗遭受批判斗争。(?标准?)挨蒙遭受欺骗。(?标准?)挨批遭受批评或批判。(?标准?)挨批受到批评或批判。(?现汉?)挨日子困难痛苦地度时日。(?标准?)按时间无所事事,苦等时间过去。(?标准?)挨整遭受打击迫害。(?标准?)挨整受到打击迫害。(?现汉?)挨揍挨打。(?标准?)“挨(áī)〞,两词典都收录“遭受;忍受〞、“困难地度过(岁月)〞、“拖延〞三个义项。?标准?对语素和词都标注词性,?现汉?只有词才标注词性,因此,?现汉?标注词性的单位可以认为是词。根据?现汉?的词性标注和举例,“挨(áī)〞的三个义项都可以独立成词,“呲儿〞(申斥;斥责)、“斗〞(斗争)、“蒙〞(欺骗)、“批〞(批判;批评)、“日子〞、“时间〞、“整〞(使吃苦头)、“揍〞(打)都可以独立成词,两部词典都有解释。也就是说,整体意义等于成分意义的加合,而且每个成分都可以独立成词。因此没有理由作为词收录。假如这样收词的话,“挨鞭子、挨棍子、挨冻、挨饿、挨骂、挨训〞都可以收,那么词典就会变得臃肿不堪。即使注有转义的几条也有商榷的余地。比方“挨打〞,?标准?的解释是“遭受殴打;比喻遭受批评或处分〞。?现汉?未收。这个比喻义到底是否凝固成了词义?再如“挨宰〞,两部词典都收了“宰〞的比喻义“比喻向买东西或承受效劳的人索取高价〞,都注了动词,那么“挨宰〞就可以通过成分义相加得出。因此,“挨宰〞是不是词也要打个问号。还有,?标准?收了“鹅蛋〞、“鸭蛋〞(认为有转义,如“今天考数学,吃了个鸭蛋〞),不收“鸡蛋、鸟蛋、龟蛋〞;收了“岸边〞,不收“河边、水边、地边、路边〞;收了“猜着、猜中〞,不收“猜对、猜透〞。?现汉?均不收。这里涉及汉语中词和短语的划界这个老大难问题。关于汉语词确实定,笔者曾有阐述,此处不赘。词典应从严掌握收词标准。王同亿所编词典受到批评,收词不严是很重要的一个原因。我们认为,假如一个片段同时符合以下条件,就不宜收作词条:(1)各成分都可以独立成词;(2)组合义等于成分义的加合,没有引申、比喻等整体义;(3)各成分的意义词典都有解释。二、新词与旧词毫无疑问,词典应该及时增补反映社会变化的新词和新义。例如,?现汉?收录了“欧元〞,?标准?收录了“欧共体、欧盟、欧元〞,笔者认为有增补的必要。再如,在“垃圾〞条下,?现汉?增补了“比喻失去价值的或有不良作用的事物〞的义项,举了“垃圾邮件、去除社会垃圾〞的例子。?标准?也增补了类似的比喻义。这种增补就很有必要。但增补的词条却有商榷的余地。?标准?收了“垃圾电站、垃圾股、垃圾邮件、垃圾债券〞4条,?现汉?只收“垃圾股、垃圾邮件〞2条。?现汉?和?标准?都收了“水电站〞,即“利崩水力发电的设施〞,与此相类,“垃圾电站〞是“利用垃圾发电的设施〞,而不是“废弃无用的电站〞的意思,照顾到系统性,可收。但“垃圾股、垃圾邮件、垃圾债券〞中的“垃圾〞用的都是比喻义,“像垃圾一样的东西〞的意思,两部词典都有解释,而不是整个词语有比喻义,我们认为没有必要增补。我们用百度搜索引擎搜索阅读了一下网页,就发现有“垃圾短信、垃圾网页、垃圾文件、垃圾食品〞等许多说法,为什么这些词语不收?新词和新义随时都会出现,哪些该收,哪些不收,应该有个标准。笔者认为,对拟收新词,一要看是不是符合上面讲的收词标准,二要考虑使用度(通用面+使用频率),应以语料统计数据作支撑。不能看“新〞就收,以防止滥收。跟新词相对的是旧词。旧词是产生时间较长的词。根据在现代语文生活中的使用频率,大致可以分为三类:一是仍在频繁使用的词,如“人、我、看、大、很〞等这些根本词,可称为“传承词〞。二是只在一些语体或特殊场合里使用的词,又分为文言词和历史词。文言词如“兹、此、故(因此)、其、之〞等,形成庄重、典雅的风格;历史词如“朕、太监、妃子〞等,在描绘历史事件时要用到。三是现代已经不再使用的词,如“印(我)、汝(你)〞,可称为“古语词〞。对前两类,现代汉语词典收录一些常用的是必要的。对第三类,我们认为没有必要收录。因为我们编纂的是“现代汉语〞词典,应立足于现代汉语这个共时平面。但?标准??现汉?都不约而同地收了“颖等古语词。究其原因,可能有两个方面:一是编者可能觉得工具书应满足查考的需要,为方便读者,酌收一些古语词。二是由长期以来字典、词典不分的传统造成的。假如不收这些古语词,有些字在词典里就没有了,如“颖便是。词典编纂者内心里还是觉得多收些字为好。笔者认为,这两点考虑都是没有必要的。不同词典的功能不同,要查这些字(或词),找古汉语字典(或词典)便是。一旦收了这些词,就会引发其他问题,比方哪些该收,哪些不收,用何标准。比方收了“印(我)〞,同属于上古第一人称代词的“我、吾、余、予、朕、台〞都得收录并给予解释,但?现汉?和?标准?对“台〞的第一人称代词用法都没有解释。假如都一一交代,那么又侵吞了古汉语词典的领地。这在理论上和理论上都是不可取的。另外,在?现汉?中出现“而今安在〞这样的例句,就像在现代社会里突然见到一个古人一样别扭。因此,编纂现代汉语词典,还需要站稳“现代〞脚跟,在现代口语和书面语里都不用的词不应该收录。三、语文词与百科词语文词典收词自然以一般的语文词语为主。人类知识是个庞杂的系统,语文词语与百科词语(含专科词语)并没有截然的分界限。基于词典的工具性,语文词典适量地收录百科词语是必要的,但应有所控制。如何把握这个“度〞,是个需要认真讨论的问题。目前的语文辞书对百科词语并没有明确的收录标准。我们比拟了一下?现汉?和?标准?字母a下的条目,?现汉?共列字头、词目526条,?标准?共565条。两词典均收的百科词语是:阿昌族、阿斗、阿q、阿拉伯人、阿拉伯数字、阿片、锕、埃(长度单位)、锿、癌、艾滋并砹、爱克斯射线、爱神、瑷珲(爱辉)、安(安培的简称)、安瓿、安乐死、安理睬、安培、安息日、抚慰赛、桉、氨、氨基、氨基酸、氨气、氨水、铵、按揭、胺、暗尝暗射地图、暗物质、暗转、盎司、凹版、凹面镜、凹透镜、奥林匹克运动会、奥运村、奥运会、澳抗。(计43条)?现汉?收而?标准?不收的百科词语是:阿尔茨海默并阿尔法粒子、阿尔法射线、阿伏伽德罗常量、阿是穴、埃博拉出血热、艾叶豹、艾鼬、爱斯基摩人、馒尼、平安玻璃、盎格鲁撒克逊人、澳门币。(计13条)?标准?收而?现汉?不收的百科词语是:阿凡提、阿米巴、阿摩尼亚、阿司匹林、阿托品、埃博拉、爱鸟周、安哥拉兔、平安填埋、桉油、鞍鼻、奥林匹克精神、奥赛、奥申委、奥斯卡金像奖、奥委会、奥校、澳币、澳洲。(计19条)以上所列个别词目是否属于百科词语还可讨论,但不影响大局。?现汉?共收百科词语56条,占总词条(含字头)数的约10.65%,?标准?共收百科词语62条,占总词条(含字头)数的约10.97%,都在非常之一强。两词典a字母下所收百科词语合计75条,一样的约占57%,不同的约占43%。通过抽样调查,可以得到这样的认识:不同词典对百科词语的收录差异很大,没有明确的标准。表如今:(1)收词差异率较高;(2)同一词语词形却不同,如?现汉?是“埃博拉出血热〞,?标准?是“埃博拉〞,?现汉?是“澳门币〞,?标准?是“澳币〞;(3)收词带有一定的随意性,比方?现汉?收了不太常见的“阿尔茨海默脖,却不收常用西药“阿司匹林〞,?标准?收了“阿拉伯人〞,却不收“爱斯基摩人、盎格鲁撒克逊人〞,如此等等。我们认为,语文词典对百科词语的收录,一要进展总量控制。语文词典毕竟不是百科词典,百科词语在数量上只能占少数。一部中型语文词典,百科词语控制在多大比例比拟适宜,目前的研究还不充分。?现汉))1996年修订版“语文类词条占72%,哲学社会科学占11%,科技占17%〞。这个比例是否适宜,还可以讨论。二要制订收词标准。哪些该收,哪些不该收,应该明确。三要进展语言使用度调查。为了防止收词的主观随意性,应该统计百科词语的使用度,包括通用度和使用频率两个方面,选取那些使用度高的百科词语,不能仅凭个人语感取舍。四、语言义与言语义与收词亲密相关的是收义。词语既有稳固的意义,可以脱离详细语境而为言语集团所共同理解,也有临时产生的意义,需要借助一定的语境才能获知。前者是语言义,后者是言语义。词典收的是语言义,还没有凝固为语言义的词义暂不收录。例如“腿子〞,?现代汉语词典?(1996)的释义是:①(方腿:~发软。②狗腿子。?现汉?的释义是:口狗腿子。?标准?的释义是:①口腿部:他的~很细,跑得很快。②狗腿子。三部词典没有一部举出“腿子〞单用时当“狗腿子〞讲的实例,只有在跟“狗〞结合时才有此义,也就是说,“腿子〞的“狗腿子〞义只是在“狗腿子〞这个语境里的言语义,不宜收录,可把“狗腿子〞作为整体收录(?现汉??标准?皆收)。附带说一下,“腿子〞是“腿〞的方言说法。,所以?现汉?未列此义。未被普通话吸收的方言词,注方比注(口准确,“方言〞与“口语〞并不等同。?现汉?2022年版对1996年版在这方面的修改不一定都非常妥帖。再如,?标准?对“替班〞、“替补〞、“替工〞三词的释义分别是:替班团代替别人上班:他今天请假,我来~。名替班的人:他是~。替补动交换填补:由你~三号队员。固交换别人填补空缺的人:充当~。替工动代替别人做工:姐姐有病,妹妹去~。名代替别人做工的人:他是临时去当~的。?现汉?三词皆收,但只有“替工〞注了名词用法。先看实际语言用例(2022年9月8日笔者用ggle搜索,只取前两个阿页的局部内容),(1)今天开场就要连上七天了,因为同事要年休,而我就要替班。(2)“明天下班时,你提早在店里替一会儿班,效果就出来了。〞老婆强压,局长只好魁强为之。第二天下班,吴局长果然站在小店里打起了替班。(3)本人22岁,开挖掘机两年半多,开过大中小多种机型,专门帮人替班……(4)这个中心还提供替班司机调度效劳。……(12)掘金替补赴意大利淘金,前六号新秀竟难在联盟立足……(13)……而董方卓那么在三轮联赛后,在曼联队锋线伤兵众多的情况下历史上第一次进入替补席。(14)然而即便是这样,近四场比赛只获得了两次替补上场时机,岑登心中总有些觉得不爽。(15)……当替补时显然比他今天首发要表现得好一点。(16)成品汽油的“替补品〞——复合元铅汽油横空入世。(17)勇士队急缺替补…………(30)小s待产,?康熙?再找替工,蔡康永首选张小燕。(31)仲裁委认为,无论崔某属于何种性质的员工,只要有为a公司工作的事实存在,a公司就应依法与其签订劳动合同,并为其缴纳各种社会保险,临时替工并不能成为公司免除此项义务的理由。(32)明天要去当一天的替工,朋友外出进货,临时拉我去充当打工老板。根据对用例的初步调查,“替班〞还未开展出指人的意义,即使有,也是临时性用法,不能作为词典收录的根据;“替补〞的情况复杂一些,例(12)、(15)、(17)都可以理解成指人的名词,只有根据更大范围的语料统计才能确定,但至少可以认为“替补〞的名词用法正在开展之中;“替工〞的名词用法已很确定。根据上面分析,?现汉?只为“替工〞注名词义是稳妥的,?标准?为“替班〞注

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论