汉语词汇统计研究述评_第1页
汉语词汇统计研究述评_第2页
汉语词汇统计研究述评_第3页
汉语词汇统计研究述评_第4页
汉语词汇统计研究述评_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

汉语词汇统计研究述评一、本文概述本文旨在对汉语词汇统计研究进行全面的梳理和述评,探究汉语词汇统计的历史沿革、现状与发展趋势。通过对前人研究的总结与反思,揭示汉语词汇统计研究的重要价值,以期对汉语词汇学、语言学及应用语言学等领域的研究提供有益的参考和启示。本文将从汉语词汇统计的定义、方法、应用领域等方面展开论述,以期全面展示汉语词汇统计研究的丰富成果和广阔前景。本文还将探讨汉语词汇统计研究面临的挑战与问题,并提出相应的建议与展望,以期推动汉语词汇统计研究的深入发展。二、汉语词汇统计研究的基本理论和方法汉语词汇统计研究,作为语言学与数据科学的交叉领域,涉及一系列基本理论和方法。在理论上,词汇统计研究以语言学的词汇理论为基础,运用统计学的方法对词汇进行量化分析,从而揭示词汇的使用规律、发展趋势和社会文化背景。在方法上,汉语词汇统计研究主要依赖于大规模语料库的建设和分析。语料库是词汇统计的基础,其规模和多样性直接影响统计结果的准确性和可靠性。通过语料库,研究者可以获取词汇的出现频次、使用语境、搭配关系等信息,进而进行深入的统计分析。常用的词汇统计方法包括词频统计、词长统计、词类统计等。词频统计通过计算词汇在语料库中出现的次数,揭示词汇的使用频率和活跃程度。词长统计则关注词汇的音节数量或字数,揭示汉语词汇在长度上的分布特点。词类统计则根据词汇的语法功能进行分类,分析各类词汇的使用比例和变化趋势。词汇统计研究还常采用共现分析、关联规则挖掘等数据挖掘技术,以揭示词汇之间的关联关系和语义网络。这些方法可以帮助研究者深入理解词汇的使用规律,揭示词汇背后的语义信息和文化内涵。汉语词汇统计研究的基本理论和方法涵盖了语言学、统计学和数据科学等多个领域的知识和技术。随着语料库规模的扩大和数据分析技术的不断进步,汉语词汇统计研究将在揭示词汇使用规律、推动语言学理论发展以及服务语言教学和语言规划等方面发挥越来越重要的作用。三、汉语词汇统计研究的主要内容和成果汉语词汇统计研究,作为语言学的一个重要分支,主要致力于对汉语词汇进行全面、系统的统计和分析,以揭示汉语词汇的构成、演变及其使用规律。这一研究领域涵盖了多个方面,包括词汇的数量统计、词汇的分类研究、词汇的历时演变、词汇的地域分布等。在过去的几十年里,汉语词汇统计研究取得了丰硕的成果,为汉语语言学的发展做出了重要贡献。在词汇数量统计方面,研究者们通过对大量语料库的统计和分析,得出了汉语词汇的总量和各类词汇的分布情况。这些统计数据不仅为我们提供了汉语词汇的宏观认识,也为汉语词汇的教学和研究提供了重要参考。在词汇分类研究方面,研究者们根据不同的标准和方法对汉语词汇进行了分类,如按照词性、语义、音节等进行分类。这些分类研究不仅有助于我们深入了解汉语词汇的内部结构,也为我们提供了更加精细的词汇分析方法。在词汇的历时演变方面,研究者们通过对不同历史时期的语料库进行对比分析,揭示了汉语词汇在历史长河中的演变轨迹和规律。这些研究成果不仅有助于我们了解汉语词汇的历史背景和发展脉络,也为汉语词汇的规范化和标准化提供了重要依据。在词汇的地域分布方面,研究者们通过对不同地域的语料库进行统计和分析,揭示了汉语词汇在不同地域的使用情况和特点。这些研究成果不仅有助于我们了解汉语词汇的地域性差异,也为汉语方言的研究和汉语国际推广提供了重要支持。汉语词汇统计研究在词汇数量统计、词汇分类研究、词汇历时演变和词汇地域分布等方面取得了丰硕的成果。这些成果不仅深化了我们对汉语词汇的认识和理解,也为汉语语言学的发展提供了重要支撑。未来,随着语料库的不断扩大和统计分析方法的不断创新,汉语词汇统计研究将有望取得更加丰硕的成果。四、汉语词汇统计研究的应用和前景汉语词汇统计研究不仅在语言学领域有着重要的学术价值,同时在实际应用中也有着广泛的用途和广阔的前景。随着信息技术的快速发展,词汇统计研究逐渐应用于自然语言处理、机器翻译、信息检索、词典编纂等多个领域,为技术的发展提供了重要的数据支持和理论依据。在自然语言处理领域,汉语词汇统计研究有助于构建更加准确和高效的词汇分析模型,提升文本分类、情感分析、语义角色标注等任务的性能。通过词汇的统计信息,我们可以更好地理解语言的内在规律和特征,为自然语言处理技术的发展提供坚实的理论基础。在机器翻译领域,词汇统计研究有助于提升翻译质量和效率。通过对源语言和目标语言词汇的统计分析,可以构建更加准确的翻译模型,提高翻译的准确性和流畅性。同时,词汇统计研究还可以为机器翻译中的词汇对齐、词义消歧等任务提供有力的支持。在信息检索领域,汉语词汇统计研究有助于优化搜索引擎的性能。通过对用户查询词汇的统计分析,可以更加准确地理解用户的搜索意图,提高搜索结果的准确性和相关性。词汇统计研究还可以为搜索引擎的自动摘要、智能推荐等功能提供有益的信息。在词典编纂方面,汉语词汇统计研究为词典的编纂提供了丰富的数据和理论支持。通过对词汇的统计分析,可以更加全面地了解词汇的使用频率、语义特征等信息,为词典的词条选择、释义编写、例句选择等工作提供科学的依据。展望未来,汉语词汇统计研究将在更多领域发挥重要作用。随着大数据和技术的不断发展,我们可以利用更加丰富的词汇数据和先进的算法模型,深入研究词汇的统计特征和内在规律,为自然语言处理、机器翻译、信息检索等技术的发展提供更加有力的支持。词汇统计研究还可以为语言教育、文化传播等领域提供有益的信息和启示,推动语言学的深入发展和广泛应用。五、汉语词汇统计研究的挑战和对策尽管汉语词汇统计研究在过去的几十年里取得了显著的进展,但仍面临着许多挑战。这些挑战主要来自于语言本身的复杂性、数据资源的限制、以及技术方法的局限。汉语作为一种形态丰富的语言,其词汇的数量和变化速度都非常大,这为词汇统计带来了极大的困难。汉语中存在大量的同音词、多义词和一词多义现象,这些都增加了词汇理解和分类的难度。数据资源的限制也是汉语词汇统计研究面临的一大挑战。目前,虽然有一些大规模的语料库可供使用,但这些语料库的质量和覆盖范围仍有待提高。同时,对于一些特定领域或特定人群的词汇使用情况,数据资源更是匮乏。技术方法的局限也是汉语词汇统计研究需要面对的问题。现有的词汇统计方法大多基于传统的统计学原理,难以处理大规模、高维度的数据。同时,对于词汇的语义理解和分类,也需要更加先进的人工智能和自然语言处理技术。为了应对这些挑战,我们需要采取一系列对策。可以加强语料库的建设和质量控制,提高数据资源的丰富性和准确性。可以探索新的技术方法,如深度学习、自然语言处理等,以更好地处理大规模、高维度的数据。还可以加强跨学科合作,引入其他领域的知识和方法,为汉语词汇统计研究提供新的思路和视角。汉语词汇统计研究面临着多方面的挑战,但只要我们不断探索和创新,就一定能够找到有效的对策,推动汉语词汇统计研究的发展。六、结论汉语词汇统计研究历经数十年的发展,已经从简单的词频统计逐步深入到词汇使用的社会、文化和心理层面。通过大规模语料库的构建和先进计算技术的运用,研究者们不仅揭示了汉语词汇的基本面貌,还深入探讨了词汇变迁与社会发展的紧密联系。回顾历史,我们可以看到汉语词汇统计研究经历了从定性到定量、从描述到解释的转变。这一转变不仅提高了词汇研究的科学性,也为语言学、社会学、文化学等多学科的交叉研究提供了新的视角和方法。然而,汉语词汇统计研究仍面临一些挑战。如何更加精准地界定词汇边界、如何有效处理语料库中的噪声数据、如何结合传统语言学知识与现代计算技术等问题,仍是未来研究需要深入探讨的方向。展望未来,随着大数据技术的快速发展和语料库规模的不断扩大,汉语词汇统计研究有望取得更为显著的成果。我们期待这一领域的研究者们在继续深化现有研究的基础上,能够开拓新的研究领域,推动汉语词汇统计研究走向更加广阔的天地。参考资料:汉语里词的总汇,即所有的词的集合体,其中也包括性质和作用相当于词的固定词组,如成语。汉语的某个历史断代、某个地域方言或社会方言(如行业语)的词语的集合体也使用词汇这个名称,如先秦词汇、广州话词汇、水手词汇;某种特殊类别或某种作品的词语的集合体也可称为词汇,如口语词汇、《红楼梦》词汇。在线新华字典现已经收录20959个汉字、52万个词语。汉族的语言。构成汉藏语族的一个分支,其口语形式差别很大,但有共同的以形象符号直接体现词意而与发音不相联系的书面体系。主要方言分北方话、吴语、湘语、赣语、客家话、闽北语、闽南话和粤语等。又称语汇,是一种语言里所有的(或特定范围的)词和固定短语的总和。也指某一范围内所使用的词的总和。例如汉语词汇、英语词汇或一般词汇、基本词汇、文言词汇、方言词汇等;还可以指某一个人或某一作品所用的词和固定短语的总和,如“老舍的词汇”、“《鲁迅全集》的词汇”等等。词汇是词的集合体,词汇和词的关系是集体与个体的关系,好比树林和树的关系。在线新华字典现已经收录20959个汉字、52万个词语。①汉语语素绝大部分是单音节的,单独使用时就是词,不单独使用时就是构词成分。如:“光”和“明”既是两个语素,又是两个词,二者合起来是一个词。②构词法与句法基本一致,这主要由于汉语缺乏形态变化,词根复合是新词产生的主要方法,因此很多复音词是由古代单音词构成的词组发展而来的,如妻子、困乏等。③汉语复音节词绝大部分是合成词,但有一部分是双音单纯词,主要表现为叠音词和联绵词。叠音词是同一个字重叠而成,如关关、交交、习习、所所等;联绵词大多数是由具备双声或叠韵关系的两个字构成的,如:逍遥、徘徊、望洋、萧瑟、流离、倜傥等。叠音词和联绵词有一个共同的特点:词中的单字不表示任何意义,只起记录音节的作用,重叠或两个字合起来后的两个音节表示具体词义。④汉语中的外来词,如雪茄(cigar)、康拜因(combine)、加仑(gallon)等,属于音译外来词。汉语中的外来词主要有两种情况:纯粹音译,就像上面所举的例子;半译音半译义,如:哀的美敦书(uleimatum)、吉普车(jeep)、啤酒(beer)等。⑤汉语词汇的双音节化趋势:单音节词常常扩充为双音节,多音节词语往往被压缩成双音节,如:车—车子,鸟—飞鸟,月—月亮,窗—窗户,高级中学—高中,电视大学—电大,对外贸易—外贸,挖掘潜力—挖潜等。⑥汉语中有大量四字成语,就其语言结构单位说,多属于词组,就其造句功能说,相当于一个词。任何一种语言的词汇都永远处于不断变化状态,汉语词汇将随着中国社会物质文明和精神文明的发展而不断发展和丰富。词汇由词组成,词由语素构成。汉语的语素绝大部分是单音节的。它们不单用的时候是构词成分,单用的时候就是词。由于许多单音节语素能独立成词而语素和语素又能相当自由地复合成词,这就使汉语构词具有很大的灵活性。用复合法构成的词,人们容易理解和接受。因此汉语在历史发展中就能方便自如地创造新词,以表示不断出现的新概念,满足社会对于语言的要求。例如“生”、“产”两个语素,它们既能单独成词,又能相互组成复合词“生产”、“产生”;同时还能个别地跟其他单音节语素组成一系列复合词,包括许多新词在内。例如:生活、生存、生物、生理、生态,发生、滋生、派生、寄生、卫生;产业、产品、产量、产值,出产、资产、特产、包产。汉语缺乏形态变化,语音-形态学构词法仅存上古遗迹,如:入(-p)/内(-d)、立(-p)/位(-d)、执(-p)/贽(-d)、接(-p)/际(-d)、结(-t)/髻(-d)、锲(-t)/契(-d)、脱(-t)/蜕(-d)、列(-t)/例(-d);汉语又缺少地道的前缀和后缀,词缀附加法在构词上不占重要地位。汉语里应用最广的构词法是词根复合法,即依照句法关系由词根组成复合词的方法,这种构词法跟由词结合为词组的造句法基本上是一致的。比如,汉语词组的主要结构类型为“偏正”、“并列”、“述宾”、“述补”、“主谓”,而复合词的构成格式也同样是这5种。因此,汉语里常有词组转化为词的现象(如“国家”、“衣裳”),而一个双音组合是词还是词组有时难以确定(如“打仗”、“吵架”)。汉语词汇的基本构件是单音节语素。这个特点表现在书写形式上就是“一字一义”,即每个字代表一个成词的或不成词的语素,不代表语素的字是例外。就汉语固有词而言,这些例外主要见于“叠音字”和“联绵字”。叠音字和联绵字都是双音的单纯词,其中每个字只代表一个音节。叠音字由两个相同的字组成,多数是形容词和象声词,如:盈盈、楚楚、孜孜、喋喋、熊熊、习习、喃喃、啾啾。联绵字大多由两个具有双声、叠韵关系的字组成,多数是形容词,也有一些指具体事物的名词,如:参差、踌躇、忸怩、陆离、玲珑、伶俐、拮据、倜傥、磊落、仿佛、鸳鸯、孑孓、蟾蜍、辘轳(以上双声),伶仃、混沌、酩酊、迷离、腼腆、依稀、潺湲、玫瑰、螳螂、蜻蜓、碌碡(以上叠韵)。古代汉语里有不少叠音字和联绵字,近现代汉语沿用了一些,也新创了一些。跟其他许多语言一样,汉语词汇以民族固有词作为主体,也适当吸收外语词来丰富自己。但汉语的词大多数是字各有义的,字不表义的音译外来词在说汉语的人的心理上较难接受,因而纯粹音译词在汉语词汇里所占的比重很小,通用的为数更少。一时一地曾经流行的某些音译词也往往逐渐为自创的词所取代。如:扑落(plug,插头)、水汀(steam,暖气)、麦克风(microphone,扩音器)、盘尼西林(penicillin,青霉素)。汉语里比较通行的吸收外语词的方式是:①译音加类名,如:卡车(car)、啤酒(beer)、芭蕾舞(ballet)、高尔夫球(golf);②半译音半译义,如:霓虹灯(neonlamp)、摩托车(motor-cycle);③仿译,即用汉语语素对译原词的组成部分,如:篮球(basket-ball)、马力(horse-power)、汽船(steamboat)、机关枪(machinegun)。最后一种义译法尤其常用。汉语词汇的发展倾向于把单音节扩充为双音节,把多音节压缩为双音节。把单音节扩充为双音节的方式是在单音节的前面或后面加上一个成分,如:发/头发、唇/嘴唇、雀/麻雀、鹊/喜鹊、鲤/鲤鱼、韭/韭菜、鼻/鼻子、指/指头,或者把两个意义相近或有关的单音节合起来用,如:皮肤、牙齿、墙壁、窗户、云彩、月亮。把三音节压缩为双音节的方式是省去其中一个音节,如:落花生/花生、山茶花/茶花、机关枪/机枪、潜水艇/潜艇、生地黄/生地、川贝母/川贝。把四个以上音节压缩为双音节的多见于某些词组的简称,如:初级中学/初中、化学肥料/化肥、华侨事务/侨务、对外贸易/外贸、文化教育/文教、政治法律/政法、彩色电视机/彩电、科学技术委员会/科委、高等学校入学考试/高考、苏维埃社会主义共和国联盟/苏联。汉语词汇里包含大量成语。汉语成语的特点是绝大部分是四个字,而且正如汉语复合词多由两个语素并列构成,四字成语的内部成分也大多两两并列。这是汉语骈偶性的一种表现。四字成语结构紧凑,语法功能相当于一个实词。它们具有特殊的修辞作用,应用十分广泛。例如:铜墙铁壁、凤毛麟角、粗枝大叶、落花流水、来龙去脉、油腔滑调、东鳞西爪、狼吞虎咽、轻描淡写、胡思乱想、里应外合、半斤八两、一干二净、五花八门、千方百计、开宗明义、顶天立地、兴风作浪、设身处地、发号施令、捕风捉影、咬牙切齿、改头换面、惊心动魄、开诚布公、标新立异、驾轻就熟、好高骛远、避重就轻、挂一漏万、风平浪静、海阔天空、水深火热、兵荒马乱、心平气和、筋疲力尽、眉飞色舞、目瞪口呆、貌合神离、身败名裂、德高望重、人微言轻、夜长梦多、凶多吉少、尔虞我诈。斯大林在《马克思主义和语言学问题》里指出:“语言是随着社会的产生和发展而产生和发展的。”“语言的词汇对于各种变化最敏感,它处在几乎不断变化的状态中。”“工业和农业的不断发展,商业和运输业的不断发展,技术和科学的不断发展,都要求语言用工作需要的新词新语来充实它的词汇。”汉语词汇正是这样随着中国社会的发展而发展,经过漫长的历程,达到非常丰富的境地。主要的趋势是:新词不断产生,构词法逐渐完备,双音节化倾向越来越显明。以下分4个时期略述大概。现在能看到的反映汉语词汇最早状况的文献是殷代甲骨卜辞。从中已经认识的甲骨文字有1000个左右。从这些文字可以看出许多属于基本词汇之列的词当时已经出现。就词性看,它们绝大多数是实词,其中名词最多,动词次之,形容词很少。就语义内容看,它们包括的范围颇广,涉及自然现象、生产劳动、物质文化、社会关系、日常生活、意识形态等方面。以一部分名词为例,如关于自然界的名称:天、日、月、星、风、云、雨、雪、雾、雹、虹、山、阜、丘、陵、陆、岩、岳、河、川、泉、州、沚、涧、谷、土、石、水、火;季节和时间的名称:年、岁、春、秋、时、旬、今、昔、翌、晨、旦、朝、昃、昏、暮、夕;动植物的名称:马、牛、羊、豕、豚、彘、犬、兔、兕、象、狼、狐、虎、鹿、麋、牝、牡、鱼、龟、蛇、鸟、雏、雀、雉、鸡、虫、蠋、螽、木、林、杞、栗、杏、桑、竹、禾、粟、稷、麦、秫、穈;人体和器官的名称:人、身、首、面、眉、目、耳、鼻、口、舌、齿、肘、趾、心、腹、骨;生产和生活资料的名称:田、畴、圃、囿、宫、室、宅、寝、门、户、仓、廪、窌、牢、圂、井、舟、车、舆、刀、斧、斤、耒、犁、弓、矢、网、罗、毕、阱、鼎、鬲、尊、俎、卣、斝、簠、甗、皿、盘、壶、爵、米、羹、酒、鬯、丝、帛、衣、裘、巾、带、旂、橐、玉、贝、角、磬、鼓;人伦和身分的名称:祖、妣、父、母、兄、弟、妻、妇、嫔、妾、子、侄、孙、宾、臣、宰、民、奴、俘、奚、众、工、畯、君、王、侯、伯、尹、卿、巫、史;天干地支的名称:甲、乙、丙、丁、戊、己、庚、辛、壬、癸,子、丑、寅、卯、辰、巳、午、未、申、酉、戌、亥。甲骨卜辞里双音组合很少,但在传世今文《尚书》的《商书》里却为数较多,构成格式主要是偏正式和并列式。如:天命、天时、王庭、少师、冲人、百姓、师长、邦伯、众庶、谗言、神祇、奸宄、法度、心腹、田亩、津涯、老成、笃敬、先后、远迩、安定、震动、颠越、攘窃、殄灭。其中有一些已经可以看作复合词。特别是春秋战国时期,社会变化较大较快,诸如生产力的提高、经济基础的变动、政治制度的演进、学术文化的进步,都促使汉语词汇迅速发展,主要表现为新词大量产生和双音节化倾向渐趋明显。古代汉语词汇的基本规模在这个时期初步形成。这个时期实词中的各类名词、动词和形容词都大为增加。以反映物质文化的一部分词为例,如农作物的名称:谷、稙、稺、穜、稑、秬、秠、芑、粱、穄、麻;田地和耕作的名称:畎、町、畦、畔、畛、畹、菑、畲、垦、耕、稼、种、获、穮、耘、耔;衣着的名称:裳、衮、祎、袗、襦、袍、袢、褐、襁、襟、衽、袂、冠、冕、屦、舄;乐器的名称:琴、瑟、笙、竽、箫、管、簧、壎、篪、钟、镛、鼗、柷、敔。在反映上层建筑方面,出现了许多关于政治、职官、礼制、军事和刑法的词;关于伦理道德的词陆续增多,如:孝、弟(悌)、德、忠、信、仁、义、知(智)、勇、廉、耻。其他词类也有比较充分的发展。诸如指示代词、人称代词和疑问代词,表示时间、范围、程度、方式、状态和语气的副词,表示并列、承接、转折、选择、因果、假设和让步的连词,以及各类介词、语气词和叹词,大都具备。后世书面语里的一套“文言虚字”这时已经基本形成。这个时期又出现了许多双音单纯词(叠音字、联绵字)和大量复合词。前者多见于《诗经》、《楚辞》等韵文作品,如:夭夭、菁菁、冉冉、嫋嫋、喈喈、坎坎、萧萧、飒飒、黾勉、邂逅、栗烈、窈窕、婆娑、缤纷、缱绻、滂沱;后者普遍见于各类典籍,如:角弓、金罍、羔羊、鲂鱼、旭日、寝衣、蛾眉、云梯、良人、赤子、玄鸟、白茅、二毛、三星、四海、五谷、九有、万舞、处士、征夫、支解、草创、燕居、伫立、宫室、道路、丘陵、声音、朋友、宾客、爪牙、干戈、社稷、缧绁、爵禄、婚姻、奔走、征伐、扶持、教诲、修饰、束缚、恐惧、离别、变化、瞻望、纯粹、悠远、劬劳、枯槁、恭敬。复合构词法在周秦时代的广泛应用为此后汉语创造新词以适应社会生活的需要开辟了广阔的途径。在这个长时期里,随着社会经济的进步、文化学术的发达和中外交通的兴盛,汉语词汇相应地发生了些变化。主要的情况是:新词继续产生,书面语和口语词汇的差异变大,双音词的构成格式多样化。这个时期产生的新词里还不乏单音词,以魏晋以后出现的为例,如:店、滩、觅、趁、透、蓦、硬、摊、㧐、噇、怕、闹、帖、剩、懒、瞎、爷、娘、哥、侬、这。但双音词为数更多,特别是表示抽象概念的词大为增加,如:情形、意义、操行、神气、风采、情绪、性质、威信、权力、本领、举止、异同、界限、比喻、考验、揣度、商量、通融、醒悟、差异、均等、错乱、繁华、安稳、光荣、敏捷、冷淡、质朴、公正、风流、仔细、透彻。同时双音虚词也陆续增多,如:往往、常常、每每、渐渐、一再、一向、向来、当即、立地、登时、随时、毕竟、终归、从来、元本、一齐、非常、极其、公然、果然、必定、未必、千万、互相(以上副词)、如若、若或、如其、倘若、假使、设使、虽则、无论、不问、除非、因为、所以、因而、不但、不唯、宁可(以上连词)。这都是汉语词汇进一步充实的明显标志。就构词法看,这个时期产生的双音词以偏正式和并列式复合词为主,但述宾式和述补式也已出现,如:努力、注意、知心、拼命、下手、障泥、隔壁、临时、吃苦、矫正、制服、说合。魏晋以后出现了一些类词缀成分,如前加的“阿”、“老”,后加的“子”、“儿”、“头”,从而构成一批附加式双音词。例如:阿大、阿阿母、阿谁,老鼠、老鸦、老兄、老姊、老奴、老伧,兔子、鹞子、燕子、蚁子、果子、竹子、刀子、亭子、艇子、袋子、巾子、冠子、帽子、鞋子、眼子、面子、合子、拂子、托子,婆儿、猪儿、狗儿、猫儿、雀儿、鱼儿、花儿、衫儿,阶头、䦆头、膝头、舌头、骨头、手头、心头、地头、日头、东头、前头。六朝时代的一些文献已经或多或少透露这方面的消息。到了晚唐五代,禅宗语录(如《六祖坛经》、《祖堂集》)和通俗文学作品(如敦煌变文)比较充分地反映出当时口语的面貌,其中出现了大量的不见于“正统文言”的词语,是研究近代汉语前期词汇发展的重要资料。西汉以后,由于国际交往的频繁,汉语从古印度语言吸收了跟佛教有关的外来词,如:般若、菩提、南无、伽佗、羯磨、比丘等。其中一部分应用较广,进入了汉语的一般词汇。有一些复音节的词因常用而省缩为单音,如:僧伽(sa凚gha)/僧、魔罗(m╣ra)/魔、塔婆(thūpa)/塔、劫波(kalpa)/劫、忏摩(k▄ama),而这些单音词又可以作为语素造出许多复合词,如:高僧、僧徒、恶魔、魔鬼、宝塔、浩劫、劫数、钵盂、衣钵。宋代以后中国社会经济继续进步,农副业、手工业、商业和贸易都有较大发展,学术和文艺(包括自然科学和通俗文学)也颇为发达。跟经济、文化的进展相适应,汉语词汇里出现了许多变化和创新。主要表现为:反映生产、生活和学艺的新词大为增多;口语词更为丰富并大量进入白话文学作品;在新产生的词里双音词占明显优势,三音词也有所增加。在反映生产和生活方面,由于宋代工商业和都市生活繁荣,有关作坊、市场、商行、店铺的词语空前增多。例如:木作、竹作、油作、砖瓦作、裁缝作、碾玉作,米市、肉市、花市、金银市,鱼行、菜行、果行、麻布行、骨董行,面店、酒店、茶店、馄饨店,针铺、漆铺、药铺、绒线铺。同时各种日用消费品的名目也大为增加。以食品中的面、糕、饼、糖为例,如:三鲜面、鸡丝面、炒鳝面、笋竦面,糍糕、蜜糕、豆糕、玉屑糕、镜面糕、重阳糕,烧饼、炊饼、月饼、荷叶饼、菊花饼、芙蓉饼,姜糖、麻糖、乳糖、乌梅糖、鼓儿糖、五色糖。由于农业生产的进步,有关作物品种的词语明显加多。以稻米名称为例,宋代就已有几十种,如:早稻、旱稻、赤稻、小香稻、杜糯、蛮糯、糯米、粳米、红米、黄米、黄籼米、箭子米、黄芒、上秆、冬舂、早占城。又如关于蚕桑业的词语,在宋元时代也已积累得十分丰富,如:桑几、桑笼、桑网、蚕宅、蚕屋、蚕箔、蚕槌、蚕椽、蚕架、茧瓮、茧笼、火仓、抬炉、热釜、冷盆、丝籰、绵矩、络车、缲车、絮车、纬车、经架、捻绵轴。宋代自然科学和应用技术(如天算、律历、土木建筑、农田水利)进步较大,有不少发明创造和专门著述,元明时代又从近东伊斯兰世界传入一些科技知识和观测仪器。与此相应,汉语里出现了一批新词。到了明末清初,欧洲来华耶稣会士和中国知识分子合作,译述了许多西方科技书籍(包括数学、天文、历法、乐律、舆地、水利、机械制造等),从而汉语里又增添了一批近代科技术语,如:天顶、日球、月球、地球、经度、纬度、仪器、远镜、测算、测量、算术、几何、界说、推论、比例、对数、象限、割圜、直角、椭圆、平面、面积、体积、容积等边、多边、三角、八线、机器、射线、透视。自宋代迄明初,由于对外贸易发达,汉语里出现了一些从阿拉伯语、马来语等语言吸收的外来词,大部分是域外特殊物产的名称,如:俎蜡(长颈鹿)、花福禄(斑马)、马哈兽(大羚羊)、金颜香、笃耨香、打麻儿香、祖母绿、火不思、沙糊、考黎(海蚆)、腽肭脐。但通行开来的只有一小部分。这个时期是汉语口语词汇大发展并源源进入语体文学的时期。从南宋到清代,各种体裁的白话作品(如南戏、诸宫调、杂剧、平话、小说)与日俱增,较为完全地显示出近代汉语各个发展阶段的词汇面貌。从宋元话本和明清小说所反映的当代口语状况可以清楚看到汉语词汇一步一步接近它的现状的历史进程。从1840年鸦片战争以来,中国社会经历急剧的变革,政治上、经济上和文化上的新事物、新概念层出不穷。社会生活和人们思想的巨大深刻的变化推动着汉语词汇迅速发展,不断创新。从1898年戊戌变法到1949年中华人民共和国建立前50年间,汉语里增加了许多新词,其中绝大部分是双音词,小部分是三音词,也有少数三个音节以上的词。词汇增补的主要来源是:①自创新词。例如:总统、国会、法院、公司、火车、轮船、飞机、炸弹、水泥、纸烟、罐头、电影、钢琴、邮票、执照、拍卖、汇兑、民工、机车、壁报、剧本、金笔、胶卷、部门、机构、集体、骨干、阶段、功能、因素、总结、精简、显微镜、收音机、消炎片、降落伞、羽毛球、游击队、儿童节、意识形态、唯物史观。②吸收印欧语词。例如:沙发(sofa)、扑克(poker)、咖啡(coffee)、可可(cocoa)、苏打(soda)、吐司(toast)、绷带(bandage)、引擎(engine)、逻辑(logic)、摩登(modern)、维他命(vitamin)、模特儿(model)、托拉斯(trust)、布尔乔亚(bourgeois)、歇斯底里(hysteria)、卡片(card)、雪茄烟(cigar)、法兰绒(flannel)、吉普车(jeep)、蜜月(honeymoon)、超人(╇bermensch)、下意识(subconsciou-s)、闪电战(Blitzkrieg)、时代精神(Zeitgeist)、黑客(hacker)。中华人民共和国建立以来,社会政治状况变更之大之快为历史上前所未有,诸如社会主义制度的建立、马列主义的传播、经济建设的开展、文化教育的普及、科学技术的进步、国际往来的频繁、人民生活水平的提高和精神风貌的改变,无不促使汉语词汇发生种种变化。这些变化表现在各个方面,例如:①政治、哲学用语大普及,有的成了常用词。如:政策、策略、方针、口号、阶级、成分、党派、民主、协商、谈判、立场、观点、思想、意识、理论、实践、现象、本质、抽象、具体、主观、客观、相对、绝对、量变、质变、感性、理性、对立面。②科技、卫生用语大发展,有的进入了一般词汇。如:宏观、微观、塑料、磁带、电脑、软件、频道、激光、扫描、遥控、缩微、复印、录像、半导体、显像管、溃疡、血栓、发炎、休克、抗体、疫苗、镜检、输液、造影、免疫、气功、理疗、抗菌素、心电图。③不少词语的意义或用法有了新的扩展。如:“革命”可指在共产党领导下从事任何有益于国家人民的工作;“斗争”可指用体力或脑力来解决问题或克服困难;“同志”可指人民群众的任何一员;“群众”可指人民中每一个人,又为“领导”或“党团员”的对称;“集体”可指每一个人所在的若干人组成的总和,又为“全民”或“个体”的对称;“单位”可指机关、团体,或属于一个机关、团体的各部门;“叔叔”可指跟自己父母同辈的任何男子;“态度”可指一个人对任何事情的看法和采取的行动;“精神”可指重要文件或高级领导人讲话的要点。①复合词仍以偏正式和并列式为主,如:工地、车间、能源、侨胞、国格、新秀、普查、扩建、赊销、空投、筛选、项目、环节、效益、拼搏、离休。但述宾式、述补式和主谓式也有发展,特别是述宾式出现较多,如:供电、分洪、截流、脱粒、投料、待业、夺魁、投标、合资、创汇、挂钩、牵头、保健、务虚、碰硬。②一些构词成分词缀化,由此构成的附加式复音词逐渐增多。以带后加的“性”、“化”、“员”、“家”的词为例,如:计划性、技术性、趣味性、知识性、全民性、综合性、可行性、主观能动性,绿化、老化、大众化、绝对化、一元化、年轻化、专业化、制度化,炊事员、饲养员、邮递员、售货员、驾驶员、理论家、实干家、改革家、美食家、社会活动家。③简称不断出现,不少简称因常用而转化为词。如:统一战线/统战、武装警察/武警、化学纤维/化纤、民用航空/民航、电视大学/电大、体格检查/体检、空气调节/空调、展览销售/展销、旅行游览/旅游、表示态度/表态、节约能源/节能、失去控制/失控、少年先锋队/少先队、奥林匹克运动会/奥运会。改革开放的三十余年来,中国社会取得了长足的巨大进步,语言中便产生出大量的新词语来反映新事物、新风貌,如“爆棚、复读、家教、军嫂、另类、特首、体彩、外企、知本家、自驾游、公众人物、观光农业、远程教育”等。当然也会有腐朽思想沉渣泛,语言中也同样会出现一些词语对其加以反映,如“二奶、人蛇、色狼、血头、一夜情、暗箱操作”。现在,全球化、信息化的飞速发展已彻底改变了人们的生活方式、交往方式、思维方式以及语言方式,其中最为典型的是青少年中的“新新人类”、“e一代”。如果说网络传播的快捷性加速了新词汇的发展,那么就是网络交互的隐蔽性滋生了新词汇的胚芽。在全世界文化趋同的趋势下,其中不甘平庸的“新新人类”们为了凸显自己独特的个性而追求标新立异与众不同或是出于吸引他人注意的心理,于是就对我们的规范字大动手脚,并在网络上大肆传播。另一类人,则是出于保护自己隐私的原因,就即兴发明了一种作为相互之间身份辨别的符号,如同学之间聊天用的符号。还有一类人则是在聊天的过程中出于简单便捷的目的而使用这些已被大家所熟知并认同的新词汇。“这种由于语言的历史积淀,语言间的接触影响,语言要素创新时的冲动,语言使用者和语言使用场合的千差万别等因素的影响,语言实在不容易纯洁。但是语言生活应当健康,也有可能健康。”这是一个多元文化现象,因而多元文化思潮或许可为我们科学看待和妥善处理这个问题提供一种新的视角。新词汇“入侵”了传统的媒体。“PK”(英文单词或词组的缩写,目前常指PlayerKill,网语词汇之一,意为两人对决)一词,要是五年前出现在大众媒介上,所有受众都会感到云遮雾罩,不知所云。可是,随着2005年湖南卫视“超级女声”节目风靡各地,其中一个叫“PK”的环节,使“PK”一词在大众传媒上频频出现,并逐渐演变成包括单挑、搞掂、末位淘汰等多重延伸意义的新词。如果加上诸如“秀”“歇菜”“粉丝”“雷人”等层出不穷的网络语言,对社会新闻进行归类提炼的“被就业”“口头捐”“钓鱼执法”等新词,可以说,新词汇“入侵”新闻报道已成不争的事实。这给广大新闻工作者出了一道难题:如何以客观、科学的态度,对其作出合乎理性的取舍。对这些建立在动态语言系统之上、以网络为主要载体的新词汇,其甄别和适用范围,国家语委和《国家通用语言文字法》并未作出专门规定。但作为一种客观存在的语言现象,不少专家学者对此做过深入探讨和研究。目前新闻业内人员对新闻报道中使用新词汇孰是孰非也尚无定论,但多数意见是:那些具有典型性、便捷性、形象性、诙谐性、不可替代性,较符合语言发展规律、规范,并符合社会需求的新词汇,才有可能被认可、吸收到主流语言体系中,才能供新闻报道筛选采用,反之,就只能是短期小范围流传,也会被大众传媒摒弃。摒弃不良新词汇。新词语就是这样随着社会发展的要求,一波一波地出现在我们的语言生活中。正是由于词汇的这种生命律动,才使得我们的语言在与社会的因应中获得吐故纳新的发展。从有文字记载以来,汉语词汇经过3000多年的历史进程,发展到现在已是面目全新,无比丰富。随着中国社会主义物质文明和精神文明建设的前进,汉语词汇将越加丰富。两汉之际,佛教传入中国,许多佛教典籍也陆续被翻译成汉语。而让你想不到的是,时至今日,很多我们日常生活中朗朗上口的词语也都来自佛教用语。梵语“Ksana”的音译。佛典中“刹那”指“时之极微者”,即非常短的时间。“刹那无常”、“刹那生灭”、“刹那三世”等也是佛教用语。现在人们还常用“一刹那”、“刹那间”等词。佛教宣称释迦牟尼能显现出各种各样的形象,向不同的人讲说佛法,是为现身说法。后来指以亲身经历为例证,对人进行解说或劝导。现身的意思已经由显现人身变为亲身经历。很难想象,该词原是佛教头陀(dhata)的别称。所谓抖擞,就是僧人修持的一种苦行。修苦行的僧人,能断除对饮食、衣服、住处等贪着烦恼,就像去掉衣服上的灰尘一样。挂碍即牵挂。原为佛教用语,指内心没有任何牵挂。玄奘所译的《般若波罗密多心经》中有:“心无挂碍:无挂碍故,无有恐怖,远离颠倒梦想。”据说释迦牟尼佛坐在菩提树下入定的时候,魔王波旬率领众魔千方百计地来捣乱、搔扰。佛陀不为所动并降服众魔,魔王只好率领群魔退去。与魔王的斗争,事实上就是与“自我”、与“心”的斗争。战胜自我,这是全世界最难的事,而佛陀做到了。彻底的觉悟,达到“不生不灭”的地步,属于大菩萨的境界。现在连我们凡人也可以使用这个词了。唐代大历年间,禅僧元览在竹上题诗:“大海从鱼跃,长空任鸟飞。”表达了禅宗自由自在的广阔胸襟和活泼的禅机。后改变为“海阔凭鱼跃,天空任鸟飞。”今日之果是当初之因的延续。众生在尝到苦果之后才“悔不当初”,而菩萨深明“因果”之理,终无懊悔。故曰:“众生畏果,菩萨畏因。”指色、声、香、味、触、法六尘。因六尘是心的所缘,能染污心性,故称尘缘。即“老婆心”之略,源出禅门。有些禅师诲人不倦,絮絮叨叨,犹如老婆子饶舌,丛林中称为“老婆心”、“老婆禅”。今演为“苦口婆心”。我们现在形容时光短暂常用“弹指一挥间”这个比喻。“弹指”是佛教中的一个时间量词,出自于印度梵语。《僧只律》上解释说:“二十念为一瞬,二十瞬名一弹指,二十弹指名一罗预,二十罗预名一须臾,一日一夜有三十须臾。”另外,“弹指”也是捻弹手指做声的动作,它原本是印度的一种风俗,用以表示欢喜、赞叹、警告、许诺、觉悟、召唤、敬礼、诅咒等。我们现在用来形容光线暗。其实,它本是佛教用语,出于《续灯录》卷七:“伸手不见掌。”这句禅语的意思是:悟道的人见一切事物,不加以主观的虚妄分别与憎爱,因为一切事物在本质上是平等不二的。“Tuhao土豪”有望携手“Dama大妈”以单词形式收录进《牛津英语词典》,这则消息引起了广泛的讨论和关注。据相关数据统计,目前《牛津英语词典》中有二百余个包含中文渊源的词汇。事实上,在日常生活中,许多汉语借词已经在英语词汇系统中占据了一席之地,成为其不可或缺的组成部分。“ganbu(干部)、guanxi(关系)等词多年以前就正式进入了《牛津英语词典》;tofu(豆腐)、Pekingduck(北京烤鸭)、chowmein(炒面)已进入了外国人的日常生活用语;cheng-guan(城管)、dia(嗲)等词也在英语中产生了一定影响。”南开大学汉语言文化学院的冉启斌副教授介绍说。实际上,英语中各类汉语借词不断涌现。代表中国历史文化的词语,如:Confucius(孔子)、Laozi(老子)、Tao(道/道教)、TaoTeChing(《道德经》)、fengshui(风水)、Mandarin(官话)……这些词语已经进入到英语的日常词汇中。文体娱乐方面:“kongfu(功夫)、TaiChi(太极)”等词更是随着中国功夫电影的传播而广为人知。政治经济方面:“lianghui(两会)”一词,是由美国有线电视新闻网(CNN)最早带头使用,渐渐地,这个词逐渐成为了各大国际媒体的通用词汇;我国的货币单位jiao(角)和yuan(元)也已被收入英语词典,有趣的是,yuan这个词在英语中又经历了词义范围扩大的过程,现在,yuan还可以用来泛指钱(money)。其实,汉语词语进入英语词汇系统,或多或少地都需要经过一定的改造。改造方式有音译、意译、音意合译和音译加词缀。例如,汉语拼音“太空”(taikong)和希腊词“nautēs”(航行者)组成英语单词taikonaut(太空人),主要用来指中国航天员,现已收录牛津词典中。而最先由海外华人创造的中式英语“longtimenosee”(好久不见),采用了直译的方式,如今这个词已经成了英美国家里不少人打招呼的常用语。同时,汉语词汇进入权威英语词典也需要经过一定的审核。“所有词语被收录于词典之中时,都要考虑它的通用程度和使用频率。”牛津大学出版社双语词典项目经理朱莉·克里曼在接受采访时表示,将外来词加入词典的时候,通常要考虑多种因素。“形象化地说,就是要看母语为英语的人能否十分自然地去使用这些词汇,‘外来语’的感觉是否在逐渐弱化。如果一个词被媒体广泛使用,而不仅仅是出现在某篇报道之中,我们肯定会考虑收录它。另外,将汉语词汇纳入英语词典时,还需要考虑这些词语的直观程度,像‘guanxi(关系)’、‘hukou(户口)’这样的词语在我们看来就挺直观的。”如今,越来越多的汉语流行词汇有望被收录在英语词典之中。像maotai(茅台)、Pekingopera(京剧)……这些词语在母语为汉语的群体中有着相当的影响力,那么,它们“出口”后,在英语中也能有那么大的影响力吗?这还有待进一步的观察。总部设在美国得克萨斯州的“全球语言监督机构”发布报告称,自1994年以来加入英语的新词汇中,“中文借用词”数量独占鳌头,以5%-20%的比例超过任何其他语言来源。该机构主席帕亚克表示:“令人惊讶的是,由于中国经济增长的影响,中文对国际英语的冲击比英语国家还大。”华中师范大学语言与语言教育研究中心姚双云教授认为,产生这一现象主要有3个原因。第一,英语开放度高,包容性强,借词庞杂;第二,科学技术的迅猛发展和文化交流的日益频繁,必然推动各种语言间的词语借用;第三,汉语国际地位日益提高,对英语的影响力日益增强,这也是最重要的一点。归根到底,汉语词汇的大量“出口”,其深层原因是中国在全球影响力的提升和关注度的提高。中山大学周海中教授认为,以汉语为来源的英语词语是汉英两种语言接触的必然产物,也是中西文化融合的必然结果;随着中华民族与英语民族的交流交往日益频繁,来自汉语的英语词语及表达方式必然会越来越多。目前,国内的汉语言学界对于来自英语或其他语言的借词研究颇多,而对于汉语词汇的输出现象研究较少。近年来,国人中文母语意识的提升,席卷全球的“汉语热”,网络上来自中国的各种新闻热点,都在提醒着我们,应该开始更多地关注和探讨汉语词汇输出这个文化现象了。汉语构词法研究是汉语语言学中的一个重要领域,旨在探讨汉语词汇的构成规律和原理。本文将对汉语构词法的研究历史、类型与特点、应用场景、思考与展望以及结论进行述评。在汉语构词法研究的历史演变中,古汉语构词法的研究对其产生了深远影响。在古代,由于书写材料的限制,人们往往采用单音节词表达思想,这在《诗经》等古籍中得到了体现。随着时间的推移,双音节词逐渐取代单音节词成为现代汉语的主要表达方式。因此,现代汉语构词法的研究需要考虑音节和语素之间的关系。现代汉语构词法的主要类型包括合成词、派生词和缩略语。合成词是由两个或多个语素组成的词,如“人民”由“人”和“民”两个语素合成。派生词是由词根和词缀组成的词,如“老虎”中的“老”和“虎”是词根,“-er”是词缀。缩略语则是将多音节词简化为双音节词或短语,如“北京大学”简称为“北大”。汉语构词法在语言学习、文学创作、媒体传播等领域具有广泛的应用。在语言学习中,掌握构词法有助于更好地理解词汇的构成和含义,提高学习效率。在文学创作中,运用构词法可以创新词汇,丰富作品的表现力。在媒体传播中,恰当使用构词法可以提高传播效果,如网络流行语“网红”就是通过缩略语的方式构成的,引起了广泛的。对汉语构词法的研究应考虑以下几个方面。深入研究古汉语构词法对现代汉语构词法的影响,探究两者的内在。现代汉语构词法的地域性和时代性特点,分析不同地区和时代的构词法差异及其原因。再次,加强对汉语构词法的教育和学习,提高人们的词汇掌握能力和语言运用水平。密切汉语构词法在新技术环境下的应用和发展趋势,探究其在、机器翻译等领域的作用。汉语构词法研究是一项重要的语言学任务,对于探究汉语词汇构成规律、提高语言学习效率、丰富文学创作表现力以及优化媒体传播效果具有重要意义。然而,目前汉语构词法研究还存在诸多不足之处,如对古汉语构词法与现代汉语构词法之间的关系研究不够深入,对不同地区和时代的构词法特点不够等。因此,我们需要进一步深入研究和探索,完善汉语构词法研究的理论体系和应用实践,以适应时代发展的需要。随着计算机技术的发展和大数据时代的到来,汉语词汇统计研究越来越受到。这种研究方法对于语言学、计算机科学、数据挖掘等领域都具有重要意义。本文将对汉语词汇统计研究的现状、方法、成果和展望进行综述。近年来,汉语词汇统计研究取得了长足进展。研究者们通过对大规模语料库的统计分析,发现了许多传统语言学研究难以揭示的规律和现象。例如,通过统计研究发现现代汉语中动词的使用频率高于名词,这反映了汉语表达中动作描写较事物描写更常见。研究者们还发现了一些常用的高频词,如“的”、“是”等,这些词在汉语表达中起到了不可或缺的作用。语料库驱动的方法:通过建立

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论