框架网络与语义句法联系的表征_第1页
框架网络与语义句法联系的表征_第2页
框架网络与语义句法联系的表征_第3页
框架网络与语义句法联系的表征_第4页
框架网络与语义句法联系的表征_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

框架网络与语义句法联系的表征第1页,课件共48页,创作于2023年2月主要内容一背景(格语法、框架语义学)二框架网络的目的

三框架网络的用途四核心依从图(副产品)第2页,课件共48页,创作于2023年2月Fillmore其人其成果格语法:1968。所谓的格语法并不是语法,而是一种语义模式,它旨在描述小句内部语义结构及其和句法的关系。1971模式一共有9个格。9个格按主语选择等级排序为:施事格(Agent)、体验格(Experiencer)、工具格(Instrument)、宾格(Object)、原格(Source)、终格(Goal)、位置格(Location)、时间格(Time)和受益格(Benefactive)。格可以有命题格(propositionalcase)和情态格(modalcase)之分.命题是小句的语义核心;情态表示小句的归向、时间、方式等。命题格组成命题,是命题不可缺少的成分。情态格对小句语义来说是任意的。第3页,课件共48页,创作于2023年2月关于框架语义学1.框架语义学是用来理解及描写词语和语法结构的意义的。2.语义框架提供词语的意义在语言中存在以及在话语中使用的背景和动因。3.框架语义学的中心思想是词的意义的描述必须与语义框架相联系。4.框架语义学假设,词语可以通过它所在的语言结构,选择和突出基本的语义框架的某些方面或某些实例,而这是以一定的方式(按照一定的原则)进行的。第4页,课件共48页,创作于2023年2月“偷”与“抢”原理:按照认知语义学的观点,动词的词义不仅包括能跟几个语义角色和什么种类的语义角色相联系,而且包括相关语义角色的“凸现”(prominence)情况。从认知上讲,凸现的事物是容易引起人注意的事物,也是容易记忆、容易提取、容易作心理处理的事物。对偷抢事件来说,遭偷抢的人所受的损害越大也就越凸现;被偷抢的物越多越贵重也就越凸现。“偷”和“抢”虽然都跟一个施事、一个受事、一个夺事相联系,但是语义角色的凸现情形有差别:一般情形下,对“偷”而言,偷窃者和失窃物是凸现角色,遭偷者相对是非凸现角色;而对“抢”而言,抢劫者和遭抢者是凸现角色,抢劫物相对是非凸现角色。第5页,课件共48页,创作于2023年2月“偷”[偷窃者遭偷者失窃物]“抢”[抢劫者

遭抢者抢劫物]这种区别首先是我们生活经验的一部分。我们的经验是:虽然都是受害者,遭抢者所受的损害要比遭偷者来得大。因此法律上抢劫罪比偷窃罪严重。遇到偷窃事件,失窃物是注意的中心:一个人在公共汽车上被偷了钱包,人们首先问他丢了多少钱。而遇到抢劫事件,遭抢者是注意的中心。当听到一个学生在学校附近遭劫,听到这个消息后首先关心的是这个学生有没有受到伤害,而不是被抢去多少钱。第6页,课件共48页,创作于2023年2月下面再看一个例子:商业交易框架TheCommercialTransactionFrame商业交易框架涉及的概念包括“possession”(领有),“changeofpossession”(给予,取得/收到),交易,钱。基本框架元素包括Money,Goods,Buyer,Seller。外围术语还包括,Price,时间特征,Change(找钱,即在偿付与价格之间的差),等等。还有一些进一步可以阐述的术语,比如商品的真正主人和钱的真正主人,以及他们跟参与交易协议的参加者之间的差别。第7页,课件共48页,创作于2023年2月根据上述概念的结构化组织,我们可以创建对一系列词语的意义、用法和语法结构的对比描述。比如:buy,sell,pay,spend,cost,charge,price,change,debt,credit,owe,merchant,clerk,broker,shop,merchandise,等等。通过混合商业交易框架跟其他框架,可以使文本不断丰富。这样可以描述诸如tip,bribe(贿赂),fee(酬金),honorarium(酬金),taxes(税费),tuition(学费),以及其他许多许多词语。为了以框架语义术语刻画跟商业交易有关的一类词语的性质,我们可以在我们的描述中提到Money,而不需要详细描述钱币,钱币经济的社会制度,参与交易的人之间的合同的性质等等类似事物。就我们的目的而言,我们仅需要假设,用户已经知道,钱是什么,以及是干什么用的;换句话说,我们可以把它看作是“局部基本的”(localprimitive),在系统内无须解释。第8页,课件共48页,创作于2023年2月二框架网络的目的1.能够服务于自然语言处理的词汇资源应该至少包括以下一些类型:

(1)每一个词元(lexicalunit)的意义的表征(从纸质词典中来)(定义模式的规则使获取词汇的其它类型的信息成为可能)(2)词元间联系的不同类型(同类词词典、通过共享词干把词元间的形态联系建立起来)(3)一个词与其它语言单元组合构成短语和句子的能力的信息(核心项与依从项之间的句法联系)(4)与某个词相关的语义信息,这个信息可以用来解释包含这个词的短语的意义。(唤起语义信息arrest,即语义综合的线索)第9页,课件共48页,创作于2023年2月二框架网络的目的基于语料库,根据框架语义学的理论,建立提供有关英语词项(lexicalitem)的语义和句法信息的计算机词典。第10页,课件共48页,创作于2023年2月第11页,课件共48页,创作于2023年2月三框架网络的用途任务明确:(1)描述给定词元所隶属的概念结构或者框架;(2)从语料库中抽取包含某个词的句子,并从中挑选能够例示我们所要分析的具有某种给定意义的词元的例子;(3)通过把与框架相关的标签指派到包含词元的句子中的短语上,使挑选的句子得到注释;(4)准备最终的注释总结报告,简明显示每个词元在组合上的可能性;这些被称作“配价描述”。第12页,课件共48页,创作于2023年2月框架网络与“复仇(Revenge)”框架相关的词包括:avenge(复仇),avenger(复仇者),getback(at)(实行报复),get_even(with)(和……算帐),retaliate(报仇),retribution(报应),revenge(报仇,名词),revenge(报仇,动词),以及vengeance(报仇)。“复仇(Revenge)”必须与为了回应某个不应该的遭受而施加的某种惩罚相关。一个“复仇者(avenger)”对一个“冒犯者(offender)”施加某种“惩罚(punishment)”,以回应冒犯者早期所做的坏事,即某种“伤害(injury)”。

第13页,课件共48页,创作于2023年2月请看下列包含“Revenge(复仇)”框架词元的做了标注的例句:1.[Ethelavenger]eventuallygoteven[withMildredoffender][fortheinsulttoEthel'sfamilyinjury][Ethel复仇者]最终报仇[向Mildred冒犯者][为了侮辱对Ethel的家伤害]Ethel最终向侮辱她家的Mildred报了仇。第14页,课件共48页,创作于2023年2月2.Whyhadn't[heavenger]soughttoavenge[hischildinjuredparty]?

为什么还没有[他复仇者]试图为……报仇[他的孩子被伤害方]?

他为什么还没有试图为他的孩子报仇?4.TheOldBaileywastold[heavenger]wasdesperatelyinloveandwantedtogetback[atthewomanoffender]["forendingtheirrelationship"injury]

那个老Bailey据说[他复仇者]是绝望地在爱中并且想复仇[向那个女人冒犯者][“因为结束他们的关系”伤害]

据说,那个老Bailey在恋爱中绝望,并且想向那个结束他们恋爱关系的女人复仇。第15页,课件共48页,创作于2023年2月注释结果我们研究已注释了的句子以及这些句子的配价模式的主要工具是两个自动生成的以网络为基础的报告,它们可以从公共网页上获得。这两个工具被称作词元注释报告(AnnotationbyLexUnitReport)和词条报告(LexicalEntryReport)。图1是“复仇(Revenge)”框架中词元avenge的注释报告,它展示了一个给定词元的所有已注释的句子。该报告的上部是此框架中所有框架元素的列表,被称为框架元素表(FrameElementTable)。尽管该报告复制得不太清楚,但是已注释的句子中的框架元素与框架元素表中框架元素的颜色相同,显得很突出。

第16页,课件共48页,创作于2023年2月第17页,课件共48页,创作于2023年2月词条报告以两个表格的形式总结框架元素的句法实现以及词元的配价模式。图2是词元avenge

的句法实现表,它展示了所有核心框架元素、被注释的例子的数目以及它们的句法实现。第18页,课件共48页,创作于2023年2月第19页,课件共48页,创作于2023年2月图3是词元avenge的第二张词条报告表,它例示了一个给定词元的配价可能性情况。

第20页,课件共48页,创作于2023年2月第21页,课件共48页,创作于2023年2月框架之间的关系最为简单的联系是“继承(Inheritance)”。在较概括的框架与较具体的框架这二者的继承关系中,母框架的所有特征在子框架中都会有所体现。大多数表示纯粹继承关系的例子都是词汇方面的细节框架,对它们的细化程度比通常的做法要高,如:“遗赠”(bequeathing)是“给予”(giving)的子类,“说闲话”(gossiping)是“说话”(speaking)的子类,“昂首阔步”(swaggering)是“走”(walking)的子类。它们当中的“子”概念都是相应“母”概念意义的一个细节体现。第22页,课件共48页,创作于2023年2月四核心依从图目的:当一个词项内嵌在一个其组成部分被周围的成分隔开或者扩充的复杂句中时,要想识别这个词项的组成成分中的核心经常是困难的。这时我们定义了一种标志方法,这种方法可以通过那些无关成分看到实质。这就是“核心依从图”。

第23页,课件共48页,创作于2023年2月随着机器在学习识别框架和框架元素方面的进步,从粗文本中抽取核心依从图有一天会成为可能。动因:第一个是纯粹的语言学方面的,与人们感兴趣的搭配有关。核心依从图可以看作是语料库中“词汇-句法”搭配的表征,即:文本中彼此处于语法结构当中的词元之间的(句法)联系。第二个原因是,通过抽取句子中最凸现的核心依从图,能够发现其所在篇章段落的语义线索。第24页,课件共48页,创作于2023年2月1.推导简单的核心依从图

Death:“Trumandied“(杜鲁门死了)第25页,课件共48页,创作于2023年2月

Ingestion:"Thepuppydrankthemilk"第26页,课件共48页,创作于2023年2月Showing:"Theprofessordemonstratedtheprooftotheclass"第27页,课件共48页,创作于2023年2月Commerce_buy:Thecompany'spurchaseofitsownstockcameasasurprise"第28页,课件共48页,创作于2023年2月Similarity:"Carvingchiselsaresimilartocarpentrychisels"第29页,课件共48页,创作于2023年2月2.包含缺位填充的核心依从图

Ingestion:"Everybodysuspectedthepuppyofhavingdrunkthemilk"第30页,课件共48页,创作于2023年2月Suspicion:"Everybodysuspectedthepuppyofhavingdrunkthemilk"第31页,课件共48页,创作于2023年2月Killing:"Themantriedtokillmyfather"第32页,课件共48页,创作于2023年2月Attempt:"Themantriedtokillmyfather"第33页,课件共48页,创作于2023年2月

Hiring:"theteam’sdesiretosigntheplayer"第34页,课件共48页,创作于2023年2月Desiring:"theteam’sdesiretosigntheplayer"第35页,课件共48页,创作于2023年2月

Becoming_aware:"Theinvestigatorsfoundthepuppydead"第36页,课件共48页,创作于2023年2月Dead_or_alive:"Theinvestigatorsfoundthepuppydead"第37页,课件共48页,创作于2023年2月3.支撑动词

Desiring:"Theteamhasthedesiretosigntheplayer"第38页,课件共48页,创作于2023年2月Appreciation:"Theaudiencegavethespeakerastandingovation"第39页,课件共48页,创作于2023年2月4.零形式框架元素

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论