下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、国内外隐喻知识库建设综述 摘 要:就国外的几个隐喻知识库,包括Master Metaphor List、Sense?frame、MetaBank、Metalude、Hamburg Metaphor Database、ATT?Meta以及国内的隐喻句库的建设进行综述,并对上述隐喻知识库作了简单评述。最后提出了一种建立面向计算的大规模汉语隐喻知识库构建的设想。?关键词:隐喻; 知识库; 自然语言理解?中图分类号:TP391 文献标志码:A 文章编号:1001-3695(2008)09-2561-05?Introduction of metaphor c
2、orpus?ZHANG Xiaojun1,2a,QU Weiguang2b,3?(1.School of Foreign Language, Shaanxi Normal University, Xian 710062, China;2a.School of Art & Literature, b.School of Mathematics & Computer, Nanjing Normal University, Nanjing 210097, China;3.Institute of Computational Linguistics, Peking University
3、, Beijing 100081, China)?Abstract:This paper introduced and reviewed six foreign language databases,it included Master Metaphor List,Sense?frame,MetaBank,Metalude,Hamburg Metaphor Database,ATT?Meta and one Chinese metaphor database. Finally, it designed a large?scale Chinese metaphor knowledge datab
4、ase oriented to computation.?Key words:metaphor; knowledge database; natural language understanding0 引言 ?隐喻理解的计算模型离不开隐喻知识库。这是由隐喻的认知性决定的。隐喻涉及本体概念与喻体概念之间的对比,因此隐喻计算模型的前提是要求系统具有概念描述和推理能力1。随着自然语言理解从字面义(literal meaning)到非字面义(non?literal meaning)研究的转变,隐喻作为非字面义的典型,越来越受到计算语言学家、认知语言学家和心理学家的重视,隐喻计算也成为自然语言处理的一个
5、热点问题。国内对隐喻计算的研究越来越深入,主要集中在对隐喻计算的模型方法的介绍和研究上2,3,但对隐喻知识库建设的讨论不够深刻。目前,应用于隐喻计算的模型方法主要有以下四种:?a)基于优先语义的方法。这种方法认为理解隐喻义的方法不同于理解正常字面义的方法,突出语义知识的描写而不强调隐喻知识在隐喻理解中的应用。当句子中字面意义出现冲突(即选择限制发生冲突)时,就需要进行隐喻处理。比较有代表性的系统有Fass4提出的可以处理隐喻、转喻、字面义反常表达的隐喻理解模型Met5系统。?b)基于知识表示的方法。与基于优先语义的方法不同,该方法强调隐喻知识的表示以及隐喻知识在隐喻理解中的作用。其包括隐喻突显
6、理论5,6和基于实例的模型,如Martin7设计的用来解释常规隐喻和识别新生隐喻的MIDAS系统,以及人工神经网络模型,如Veale8的Sapper模型。?c)基于类比推理和逻辑推理的方法。隐喻的理解需要人们运用常识进行推理,因此,许多学者采用逻辑方法进行隐喻的机器理解。典型模型包括Stainhart9提出的隐喻的结构理论和隐喻逻辑论、Gentner等人10,11的结构映射引擎SME、Holyoak等人12的ACME隐喻分析模型。?d)基于语料库统计机器学习的方法。随着语料库语言学的发展,利用统计方法处理语言信息得到了广泛的关注,出现了许多基于统计学习方法的隐喻识别模型,如Kintsch等人1
7、3,14的基于潜在语义分析方法的模型,以及Mason15,16提出的基于语料库的隐喻句抽取引擎CorMet。?从上面的计算模型来看,隐喻表达往往涉及到概念的推理关系,因此隐喻表达的识别、解释、提取往往需要富含隐喻理解信息的隐喻知识库的支撑。具有代表性的国外隐喻库有Master Metaphor List、Sense?frame、MetaBank、Metalude、Hamburg Metaphor Database、ATT?Meta。国内的隐喻库建设起步较晚,目前公布的只有厦门大学的汉语隐喻标注句库。?1 国外隐喻知识库建设综述?1.1 Master Metaphor List(MML)?MML
8、(详见/lakoff/)是加利福尼亚大学Berkeley分校George Lakoff等人搜集的英语常规隐喻表达的一个在线知识库;他们从出版的隐喻文献、加利福尼亚大学Berkeley分校的学生写作及研究生论坛中收集隐喻用例,手工编辑而成。后来由George Lakoff等人完成了第二版。该知识库包含了隐喻映射和每个隐喻的隐喻实现,并在互联网上公布。数据库中的隐喻分为event structure(事件结构)、mental events(心理事件)、emotions(情感)和other(其他)四个范畴,共涉及词条69条;每个词条又分为不同层级的隐
9、喻类别,共约200多个不同层级的隐喻类别。每种隐喻的类别都包含了各种隐喻方式的源域(source domains)和目标域(target domains)的描述及隐喻例句;每一类隐喻都有一个简要分析。MML依照专家们的直觉分成不同的概念隐喻类别,不去考虑这些隐喻是否已经词汇化。?例如,在词条“force”下“Force is a substance contained in affecting causes”隐喻类别示例如下:?Force is a substance contained in affecting causes? Put more force into your punches
10、.? He said some forceful words.? His punches carry a lot of force.? Each sentence contained the force of an order.? His punches have a lot of force.? Her death hit us all forcefully.? Her death hit us with a lot of force.? The force of the blow knocked me over.? The force adde
11、d to the swing was enough to send the ball over the fence?Related metaphors:related to Causes are Forces?Source domain:sustance,contents,container,hitting?Target domain:force?Note:? The amount of force determines the degree of change in the affected party? Either the force or the causal?container ca
12、n cause the effect.? Force is placed in the container by the person who wants the change in the affected part? Force is the ability to cause?示例给出了该类别的九个相关例句,有对该类别的简要分析(note),指出了隐喻的源域为“sustance, contents, container, hitting”,目标域为“force”,而且还给出了与词类别相关的隐喻类别“Related metaphors: related to Causes are Force
13、s”。?MML第一版完成于1989年,第二版完成于1991年。很快,这200多个隐喻类就成为各类形式化的、为隐喻计算服务的隐喻知识库建设的主要资源。?1.2 Sense-rame?Sense-rame是一个词例化的语义知识库,共包含500条词条。Dan Fass根据Wilks的优先语义学理论的优先中断思想提出了修正语义学的方法,在一个统一的语义框架内对转喻(metonymy)、隐喻和词义异常使用进行解释,并给出了实现程序Met5。Sense?frame就是为该程序的实现而建设的词例化隐喻知识库。在该知识库中,每个词义框架包含arcs和 node两部分。Arcs部分包含了该词条类属条目(一个词条
14、和它的意义描述),语义框架所有的arcs构成了词语深层结构化的语义网络;node部分包含了被定义的语义框架的差异。?名词“animal”在Sense?frame中的描述如下:?sf(animal1,? arcs, supertype,organism1,?node0,?biology1,animal1,? composition1,flesh1,? it1,drink1,drink1,? it1,eat1,food1).?其中:supertype,organism1是一个语义网络体系;node0表示该词条是一个名词;biology1,animal和composition1,flesh1为该词条
15、的语义优先特征; it1,drink1,drink1和it1,eat1,food1为该词条的句法组合模式;it1指该词条,即animal1在 it1,drink1,drink1中能够被it1代替,在it1,eat1,food1中也能够被it1代替。该句法组合模式在 Sense?frame中被称为cell。?形容词“yellow”在Sense?frame中的描述如下:?sf(yellow1,?arcs, superproperty,coloured1,? property,yellow1? node1,? preference,?bounds1,bounded1,? composition1,p
16、hysical1,? extent1, not1,zero_dimensional1? animacy1,nonliving1? assertion,? color1,yellow1).?其中:superproperty,coloured1和property,yellow1是一个语义网络体系;node1表示该词条是一个形容词/副词;preference部分为该词条的语义优先特征;assertion部分为该词条在命题中的断言。?动词“eat”在Sense?frame中的描述如下:?sf(eat1,?arcs,supertype,ingest1,expend1? node2,?agent,pref
17、erence,animal1? object,preference,food1)?其中:supertype,ingest1,expend1是一个语义网络体系;node2表示该词条是一个动词;agent,preference,animal1和object,preference,food1为该词条的语义优先特征。?利用上述对名词、动词和形容词/副词的不同形式化描述,Fass用程序Met5实现了对隐喻理解的模型解释。例如对“car drinks gasoline”,Met5系统就是利用如下知识表示实现的:?sfdrink1,?arcs,?supertypeingest1,expend1.?node2,?agent,?preference.animal1?object,?preference.drink1?sfanimal1,sfcar1,?arcs,arcs,?supertype,organism1,supertype.motor_veh
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2030年中国教学用柜项目可行性研究报告
- 风险预警模型构建
- 2024-2030年中国抗菌砧板市场营销趋势与销售效益预测报告
- 2024-2030年中国户外广告行业管理模式及投资规划研究报告
- 自动机哲学观念分析
- 2024-2030年中国废弃电器电子产品回收处理市场竞争格局及投资策略研究报告
- 2024-2030年中国平行进口汽车行业前景调研及发展策略分析报告
- 2024-2030年中国屏蔽功率电感器行业运营状况与盈利前景预测报告
- 2024-2030年中国小微互联网金融行业商业模式前瞻及未来发展策略分析报告
- 行业竞争热点追踪
- 读后续写人与动物-天使狗狗的守护讲义 高三英语作文复习写作专项
- 课件大班科学活动《有趣的影子》
- 监控施工方案四篇
- 紫金矿业污染事件商业伦理分析
- 2023年口腔医学期末复习-牙周病学(口腔医学)考试历年真题精华集选附答案
- 中小学教师教育教学水平能力测试成绩单
- 互联网医院整体方案介绍-PPT
- 4.2.1指数函数的概念 课件(共21张PPT)
- 婴幼儿盥洗照料(婴幼儿回应性照护课件)
- 《化学与生活》课程标准
- 浙江台州三门县委政法委员会下属事业单位选聘工作人员笔试题库含答案解析
评论
0/150
提交评论