(完整word版)现代汉语常用词表_第1页
(完整word版)现代汉语常用词表_第2页
(完整word版)现代汉语常用词表_第3页
(完整word版)现代汉语常用词表_第4页
(完整word版)现代汉语常用词表_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

(完整word版)现代汉语常用词表(完整word版)现代汉语常用词表(完整word版)现代汉语常用词表现代汉语常用词表(草案)现代汉语常用词表(草案)

1.范围本规范(草案)提出了现当代社会生活中比较稳定的、使用频率较高的汉语普通话常用词语56008个,形成《现代汉语常用词表》,给出了词语的词形。本规范(草案)可供中小学语文教学、扫盲教育、汉语教育、中文信息处理和辞书编纂等方面参考、采用。2.术语和定义2.1常用词现代汉语普通话范畴中使用频率高、适用范围广的词语。2.2词形本规范(草案)指词语的书写形式。2.3词频在一定数量的语料中同一个词语出现的频度,一般用词语的出现次数或覆盖率来表示。本规范(草案)指词语的出现次数。2.4频级同一语料调查范围中词频数相同的为一个频级。本词表频级统计分两步:第一步形成不同类型语料库的频级,即原始频级。第二步形成总语料的频级,就是将几个原始频级之和再除以不同类型语料库的数目。3.研制原则3.1词和语兼顾原则本规范(草案)的词语收录,以单音节词和双音节词为主。同时,根据语言使用的实际情况,也收录一些常用的缩略语、成语、惯用语等熟语,以及表达整体概念名称的其他固定短语。3.2系统性和实用性兼顾原则本规范(草案)的词语收录,既注意词语的系统性,又注意词语在语用中的实用性。如以表示季节为根词的一些词,全部收录它的加缀词“初春”“初冬”“初秋”“初夏”,但对于“‘晚’+季节”的词语,只收录“晚春”“晚秋”,未收录“晚冬”“晚夏”;对于“‘残’+季节”的词语,只收录“残冬”未收录“残春”“残秋”“残夏”。4.《现代汉语常用词表》(草案)说明4.1本表研制过程中,收集词语同国家语委“现代汉语通用语料库”核心语料库、厦门大学的新词语语料库、《现代汉语规范词典》、《现代汉语词典》、《新华词典》等所收词语进行了比对,并查验了该词在人民网《人民日报》报系网页以及Google网简体中文网页、百度网等常用网页上的使用情况。4.2本表用来检测词频的语料库有:国家语委“现代汉语通用语料库”中经分词标注的4500万字语料、《人民日报》2001年~2005年约1.35亿字的分词标注语料和厦门大学的现当代文学作品语料库约7000万字的语料。总共2.5亿字。4.3本表共收录常用词语56008个,包括单音节词3181个,双音节词语40351个,三音节词语6459个,四音节词语5855个,五音节和五音节以上词语162个。表内条目按频级升序排列,频级相同的按汉语拼音音序排列。4.4本规范(草案)提供了《现代汉语常用词表》的音序索引,按汉语拼音音序排列,同音的条目按笔画数由少到多排列。其中,词语的读音只供检索使用,不代表词语的读音规范。频序号词语1的2是3在4一5不6有7这8个9上10也11他12人13就14对15说16我17要18到19大20我们21多22把23来24等25年26两27从28而29能30又31他们频序号词语32以33时34没有35会36之37但38三39被40很41下42自己43后44中国45并46使47向48已49出50用51新52所53里54给55她56更57次58最59于60可以61可62去频序号词语63由64问题65小66工作67让68其69你70这个71生活72起73这样74天75它76高77做78家79已经80再81或82才83前84走85这些86一些87却88二89条90位91起来92各93成频序号词语94什么95元96现在97社会98比99同100四101关系102名103想104如105第一106因为107该108开始109许多110内111时间112人们113今天114国家115本116点117思想118至119此120一定121如果122副123无124张125同时126需要127月128则频序号词语129重要130为了131日132老133就是134作135五136人民137事138认为139成为140像141北京142历史143水144方面145情况146而且147党148学生149每150这里151但是152孩子153可能154发生155必须156只有157外158要求159全160发现161进行162特别163因频序号词语164岁165得到166件167文化168分169便170同志171发展172即173日本174总175因此176对于177领导178带179既180时候181钱182自183政府184吃185非186决定187进188还是189受190国191应该192近193美194政治195话196公司197干部198出现频序号词语199开200一切201研究202认识203写204十分205十206站207之间208问209希望210快211虽然212相(xiānɡ)213美国214知道215讲216大家217学校218组织219见220由于221正在222法223表示224一样225活动226如何227教育228书229据230城市231道232艺术频序号词语233经济234以及235部236影响237太238其中239学240先生241完全242连243主要244继续245头246革命247之后248参加249能够250住251上海252经过253非常254低255甚至256听257先258一直259学习260仍261办262所以263代表264变265最后266一起267万频序号词语268所有269那么270心271越272较273办法274路275有些276未277通过278找279按280拿281解决282一般283另284经285半286强287或者288时代289手290作品291不断292以后293关于294青年295各种296真297其他298农民299那些300余301段302有的频序号词语303买304根本305县306作者307者308请309叫310感到311怎么312任何313六314表现315反316存在317然而318准备319送320约321比较322书记323爱324单位325群众326应当327王328早329女330门331个人332座333全国334意义335花336条件337环境频序号词语338了解339搞340力量341不仅342目前343经验344产生345真正346回347队348有关349字350会议351生命352今年353努力354靠355八356市357类358共359意见360死361民族362块363只要364文学365成功366变化367句368管369你们370指371地区372方频序号词语373和(hé)374项375注意376当然377达378面379坐380家庭381原因382进入383病384介绍385下来386事情387方式388首389计划390人类391报告392世纪393方法394入395信396化397步398生399声400图401电话402能力403片404作用405台406如此(略)附录《现代汉语常用词表(草案)》音序索引词语汉语拼音频序号阿爸ābà18137阿昌族āchānɡzú50849阿斗ādǒu42632阿飞āfēi48603阿富汗āfùhàn3461阿訇āhōnɡ34432阿拉伯数字ālābóshùzì35937阿拉伯语ālābóyǔ30476阿妈āmā16220阿门āmén47913阿QāQ20845阿司匹林āsīpǐlín40294阿嚏ātì54643阿姨āyí6842啊(ā)ā16090啊呀āyā15418啊哟āyāo23908啊(á)á28693啊(ǎ)ǎ18287啊(à)à5514啊(ɑ)ɑ1175哎āi5497哎呀āiyā8456哎哟āiyāo11815哀兵必胜āibīnɡ-bìshènɡ53102哀愁āichóu25684哀悼āidào8091哀告āiɡào36418哀歌āiɡē40509哀号āiháo29605哀嚎āiháo45194哀叫āijiào35031哀哭āikū41402哀怜āilián35032哀鸣āimínɡ28081哀戚āiqī46661哀泣āiqì44322哀求āiqiú11984哀伤āishānɡ19763哀思āisī23975哀叹āitàn26507哀恸āitònɡ46377哀痛āitònɡ27828哀婉āiwǎn32720哀怨āiyuàn23209哀乐āiyuè20602埃āi6336埃及āijí3121挨(āi)āi4736挨边儿āibiānr53583挨次āicì40951挨个儿āiɡèr42370挨户āihù17735挨肩儿āijiānr46979挨近āijìn26596唉(āi)āi7474唉声叹气āishēnɡ-tànqì24870唉呀āiyā25872挨(ái)ái4436挨饿ái'è16362挨批áipī34907挨整áizhěnɡ37482挨揍áizòu36941皑皑ái'ái28598癌ái10793癌变áibiàn35321癌细胞áixìbāo19156癌症áizhènɡ6730癌肿áizhǒnɡ44071嗳ǎi9372矮ǎi5267矮墩墩ǎidūndūn53103矮胖ǎipànɡ27829矮小ǎixiǎo16293矮子ǎizi22440艾ài9226艾蒿àihāo36593艾窝窝àiwōwo55566艾滋病àizībìnɡ3427唉(ài)ài4115爱ài323爱不释手àibùshìshǒu24929爱财如命àicái-rúmìnɡ54115爱称àichēnɡ46662爱答不理àidābùlǐ52602爱戴àidài11712爱尔兰ài'ěrlán6977爱抚àifǔ19330爱国àiɡuó2338爱国主义àiɡuózhǔyì3990爱好àihào5492爱河àihé36942爱护àihù5862爱将àijiànɡ34908爱克斯光àikèsīɡuānɡ55082爱怜àilián23303爱恋àiliàn22255爱美àiměi21216爱面子àimiànzi31481爱莫能助àimònénɡzhù31595爱慕àimù18550爱女àinǚ29712爱情àiqínɡ2005爱人àiren5519爱神àishén30357爱屋及乌àiwū-jíwū47287爱惜àixī14976爱心àixīn4350爱憎àizēnɡ24550爱憎分明àizēnɡ-fēnmínɡ33081隘口àikǒu39452碍ài10576碍口àikǒu54644碍难àinán48993碍事àishì24816碍手碍脚àishǒu-àijiǎo45495碍眼àiyǎn43825暧昧àimèi17148安ān1651安步当车ānbù-dànɡchē53104安插ānchā27587安抵āndǐ45796安定āndìnɡ4956安度āndù27830安顿āndùn15085安放ānfànɡ15202安分ānfèn19045安分守己ānfèn-shǒujǐ30358安抚ānfǔ16334安好ānhǎo36594安徽ānhuī3002安家ānjiā21467安检ānjiǎn20603安静ānjìnɡ5113安居ānjū15923安居工程ānjūɡōnɡchénɡ28340安居乐业ānjū-lèyè10051安康ānkānɡ12674安乐ānlè19724安乐死ānlèsǐ38044安乐窝ānlèwō37483安乐椅ānlèyǐ44323安理会ānlǐhuì4752安谧ānmì36770安眠ānmián32861安眠药ānmiányào21184安民告示ānmínɡàoshì45797安宁ānnínɡ6724安排ānpái613安培ānpéi22659安贫乐道ānpín-lèdào46980安琪儿ānqí'ér38213安寝ānqǐn44324安全ānquán709安全带ānquándài19797安全岛ānquándǎo48994安全阀ānquánfá48251安全感ānquánɡǎn11863安全帽ānquánmào30135安全门ānquánmén42371安全套ānquántào23630安全系数ānquánxìshù29177安然ānrán11659安如磐石ānrúpánshí55849安如泰山ānrútàishān55083安设ānshè42847安身ānshēn27022安身立命ānshēn-lìmìnɡ27259安神ānshén34572安生ānshenɡ22441安适ānshì31376安睡ānshuì28897安泰āntài39037安土重迁āntǔ-zhònɡqiān53584安危ānwēi10168安慰ānwèi3875安稳ānwěn14568安息ānxī18762安闲ānxián25466安详ānxiánɡ12330安享ānxiǎnɡ33609安歇ānxiē38045安心ānxīn4180安养ānyǎnɡ54116安逸ānyì18491安营ānyínɡ36943安营扎寨ānyínɡ-zhāzhài27510安于ānyú24930安葬ānzànɡ17219安之若素ānzhī-ruòsù43360安置ānzhì2645安装ānzhuānɡ3200桉树ānshù32345氨ān11115氨基酸ānjīsuān15442氨气ānqì41641氨水ānshuǐ34573庵ān12110庵堂āntánɡ46088谙练ānliàn55567谙熟ānshú36771鹌鹑ānchún29290鞍马ānmǎ26027鞍马劳顿ānmǎ-láodùn48604鞍前马后ānqián-mǎhòu44325鞍子ānzi38627俺ǎn2677埯ǎn51701岸àn4679岸然ànrán50468按àn279按兵不动ànbīnɡ-bùdònɡ27023按部就班ànbù-jiùbān25179按键ànjiàn32346按揭ànjiē23054按理ànlǐ30787按例ànlì48995按脉ànmài52135按摩ànmó10229按捺ànnà25943按钮ànniǔ18863按期ànqī12723按时ànshí5677按说ànshuō19355按图索骥àntú-suǒjì39235按压ànyā37125按语ànyǔ34909按照ànzhào634案àn1109案板ànbǎn28985案牍àndú48605案发ànfā13946案犯ànfàn20151案件ànjiàn1461案卷ànjuàn23156案例ànlì7184案情ànqínɡ11301案头àntóu18138案由ànyóu36095案值ànzhí13209案子ànzi6523暗àn2609(略)《现代汉语常用词表(草案)》研制报告一研制背景为给语文应用和有关政策的制定提供科学的词汇依据,积极服务于汉语规范化、推广普通话,积极服务于中小学语文教学、扫盲教育、汉语教育、中文信息处理和辞书编纂等工作,1998年7月国家语言文字工作委员会批准立项,成立《现代汉语通用词表》研制课题组。该词表作为国家已经公布的《现代汉语通用字表》等的配套规范,是我国语言文字规范化、语文教育和研究方面的基本建设项目。研制工作自1998年7月启动,于2001年年底完成并通过了专家鉴定。鉴于5年来汉语词语发展变化很大,研究和统计手段又有很大提高,为把词表研制工作做得更加扎实完善,课题组希望对原词表进行修订。2005年6月教育部语信司决定在原词表的基础上进行修订,此项工作由原课题组和新立项的《现代汉语通用词量与分级》课题组合作进行,共同研制一个常用词表。根据5年来语言发展变化的情况和对词条增删调整,按新的统计处理方法确定其常用度并以此重新排序,使之能更真实地反映我国现代汉语词汇系统的概貌。这次修订工作进行了一年半,主要是对词语作了较大规模的增删调整,并根据词频调查结果确定了使用频级。修订的主体工作于2007年1月完成,之后又根据有关专家和部门的意见陆续作了增补和修改。二研制过程(一)初稿的形成本词表初稿的研制工作,主要包含下列几方面的内容:(1)搜集有关文献资料,研究前人制订各种词表的经验和教训;(2)比较现有的、在社会上影响较大的辞书的词目,并研究它们的取舍标准;(3)进行社会调查,了解群众使用汉语词汇的具体情况;(4)在把《现代汉语规范词典》开编时的词目和其他10多本词典、词表进行对比后进行增删的基础上,用山西大学和清华大学计算机中心所储存的语料进行词汇覆盖率的检验。对条目的增删,除了利用计算机之外,还进行了人工干预,逐条审核。通过以上工作,形成了总词目为61000多个的“词表”。2000年2月26日在北京经专家鉴定通过。鉴定委员有陆俭明、陈章太、曹先擢、常宝儒、刘庆隆、林杏光和苏培成,由苏培成主持。(二)词表的修订2005年春天,为了加快词表研制工作的进度和提高质量,在教育部语言文字信息管理司的组织下,研制组联合苏新春主持的“现代汉语通用词量与分级”课题组对原词表作了修订并再次进行词频统计工作。将“词表”同国家语委研制的“通用语料库”的核心语料库所收词语进行比对。核心语料库约有15万多个词语,除去专有名词、行业词语、人名、地名等以外,语文类词语约10万个。将“词表”同这10万个词语进行逐一比对,按照常用词表既定的收录原则逐条筛选。在审慎分析各词语在通用语料库中词频的基础上,考察社会语文生活中的实际使用情况,经过人工干预增选出约4000多个词语。将“词表”同《现代汉语规范词典》、《现代汉语词典》(第5版)、《新华词典》等所收词语进一步比对。排除其中的方言词语、专有名词、行业词语以及现代语文生活中存活率或使用率明显偏低的文言词语,再按照常用词表既定的收录原则进行审核,增补了500多个词语。将“词表”同新词语语料库所收新词语进行比对。利用厦门大学研制的新词语语料库,按照课题组既定的收录原则进行筛选,经现代汉语通用语料库检测,增补了1000余个词语。至此,“词表”的词语收录总数扩展到了66000多个。对“词表”词语进行综合审读,必要时查验了该词在人民网《人民日报》报系网页以及Google网简体中文网页、百度网等常用网页上的使用情况,作了再次调整(主要是删除尚不具备本表所界定的“常用”规格的词语),另外也考虑到作为常用性词表的词,不宜象一般词典那样因语音或语法的细小差异而将词目作过细的区分。后来在送专家和有关部门审读中,又根据审读意见陆续作了调整和删减。最终形成的《现代汉语常用词表》,收录词语共56008个。[1]包括单音节词3181个,双音节词语40351个,三音节词语6459个,四音节词语5855个,五音节和五音节以上词语162个。调查所有词语的使用频次。用来检测词频的语料库有三种:第一种是国家语委主持研制的“通用语料库”中经分词标注的4500万字语料。第二种是《人民日报》2001年~2005年约1.35亿字的分词标注语料。第三种是厦门大学研制的现当代文学作品语料库,约7000万字的语料。总共2.5亿字。以上三种语料均作有分词与标注,从中获得词频数据。对以下两种情况作了人工检测。第一种是分词后在该语料中没有出现的词语。做法是将被检词放到未作分词标注的原始语料中以查检字符串的方式调出所有用例进行人工甄别,从而避免原始语料中有词却因软件分词而消失了。在查检时对数量大的语例则用随机抽样的方法抽检。第二种是同形词。对同形异义词在实际语例中进行人工干预,区分意义,分别统计词频。三研制原则和方法(一)收词原则本词表所称的“常用词”是指以汉语为母语的中等文化程度的人,在社会语文生活中经常见到和使用的现代汉语普通话词语。本词表要求给现当代社会语文生活中通用的、稳定性较强、使用频率较高的汉语普通话词语划出一个范围,作为现代汉语词汇系统的基干部分,从而为语言应用和有关语言文字政策的制订提供科学的词汇依据。在研制中,既注重了书面词语的收集,也兼顾了常用口语词语的考察,还适当收了一些在现代社会大众传媒中时有出现,跟语文生活有所关联的行业性、历史性词语。至于更专业些的词语将另行研制,作为《现代汉语常用词表》的附表。本词表以收录单音节词和双音节词为主。同时,根据语言交际实际也收录一些使用频率明显较高的缩略语、成语、惯用语等熟语,以及表达整体概念名称的其他固定短语。1.鉴于汉语词语本身在缩略、扩展、拆用,以及跟别的词语组合成新的固定语等方面的灵活性和复杂情况,本词表的词语筛选还贯彻了以下规则:(1)对于带有词根性质的词语(如“群众化”“群众性”中的“群众”)和它们的扩展词形、组合短语,从词语构成的能产性考虑,优先收录带有词根性质的词语,对它们的扩展词形或组合短语,根据实际使用频度和规范状况等有选择地收录,原则上双音节者适当从宽,三音节及其以上者适度从严。(2)对于简缩词语或简称和它们的原形词语,根据实际使用频度和规范状况等做出不同的选择。如:“安理会”“安全理事会”“联合国安全理事会”,收录“安理会”,而不再收录“安全理事会”和“联合国安全理事会”;“福利彩票”和“福彩”,收录“福利彩票”,而不收录“福彩”。(3)可以拆用的四字以上的固定语(多是八字熟语),原则上收录其完整式,而不分别收录拆用式。如:收录“种瓜得瓜,种豆得豆”,不分别收录“种瓜得瓜”和“种豆得豆”。(4)经常出现的双音节结构,如果其中一个组成语素在现代汉语中基本不单用,则把该结构视为词加以收录,如“乌云、李子、鲫鱼、松树”等;如果该结构中有一个成分的意义已经虚化,也视为词加以收录,如“达到、酿成、成为、致以、觉得”等。2.鉴于本词表的研制目的和使用价值,对于确实存活在社会语文生活中、但较为特殊的几类词语,采用以下处理办法:(1)人名。原则上不予收录,但有比喻、借代等引申意义的,适当收录其中稳定而高频的。如“阿Q”“诸葛亮”等。(2)地名。原则上不予收录,但收录使用频率相对较高的我国各省(及其省会)、自治区(及其首府)、直辖市名称,以及它们常用的别称或简称。(3)国名。只收录我国周边国家以及在社会语文生活中出现频率明显较高的一些国家和城市的名称。(4)我国各历史朝代名称。只收录历史上影响较大、在现当代社会语文生活中出现频率明显较高的朝代名称。(5)党、国家、社会团体和企事业各机构的名称,以及这些机构的领导职务的名称。原则上不予收录,但在现当代社会语文生活中明显稳定而高频的“支部”、有着明确比喻意义的“班长”等,则予以收录。本词表的词语收录,既注意词语的系统性,又注意词语在语用中的实用性。如以表示季节为根词的一些词,全部收录它的加缀词“初春”“初冬”“初秋”“初夏”,但对于“晚+季节”的词语,只收录“晚春”“晚秋”未收录“晚冬”“晚夏”;对于“残+季节”的词语,只收录“残冬”未收录“残春”“残秋”“残夏”。总之,在词语收录的具体操作中,尽量处理好词语的系统性和词语的常用性的相互关系,特别注意词频的高低,一切从语言使用实际出发。本词表的词语收录,既充分尊重社会语文生活的客观实际,又严格控制不符合规范以及格调低俗的词语,切实起到促进社会语文生活向着规范、文明方向发展的积极作用。本词表所收录的词语,在用字上基本涵盖了《现代汉语常用字表》中的全部汉字,不超出《现代汉语通用字表》的范围。凡是独立成词的字,列出单音节词;不能独立成词的字,收录于复音词中。单音节词条中包括了某些只作常用姓氏的字,如“邓”。(二)根据“词频频级排序法”确定词语的使用频度顺序本词表确定词语的使用频度顺序使用的是“词频频级排序法”。由于词语的来源面比较宽,各种语料都有自己的覆盖面与构成特点,词表中的词语不能在每种语料中都得到全部显现。同一个词语在不同语料库中的频次也可能相差较大,因而不同语料库中的具体频次之间缺乏严格的可比性。用频级统计则能较客观地显示每个词语的使用情况。频级排序法就是同一语料库中所有词语按频次数的多少进行的一种排序方法。相同频次的为一个频级。频级统计分两步施行。第一步形成不同类型语料的频级。检测语料有“通用语料库”、“人民日报”、“文学作品”三种,这样每一个词语就有了三个不同的原始频级。第二步形成总语料的频级,就是将每个词语的三种语料的频级之和除以三。总语料的频级共有2969级,1级为最高,2969级为最低。同一频级的词语最多有1781条,最少的只有1条词语。相同频级的词语,根据总频次的多少由高到低排序,相同频次的根据读音按字母升序排列。四研制的内容本词表包括“频级序号”“词语”等内容。“频级序号”是根据“频级统计法”排序,其

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论