自然语言处理-第9章 句法和语义的关系_第1页
自然语言处理-第9章 句法和语义的关系_第2页
自然语言处理-第9章 句法和语义的关系_第3页
自然语言处理-第9章 句法和语义的关系_第4页
自然语言处理-第9章 句法和语义的关系_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Chapter 9 句法和语义的关系句法和语义的关系 2000.04 这一章将讨论联系句子的逻辑形式和句法结构的方法。 这使得在剖析句子过程中,可以的到它的逻辑形式,这种方法我们称之为 (semantic interpretation); 另外,有一种方法允许我们由一个特定的逻辑形式产生相应的句子结构树,即 (semantic realization)。 为了完整的联系句法和语义,就需要每一个成分都有其合适的意思表达式。成分的意思和子成分的意思之间的关系可以在带有特征的文法中指定,因为每一个句法规则都有其相应的语义理解规则,这种方法常称为 rule-by-rule方式 的语义理解。9.7 由逻

2、辑形式产生句子9.1 语义理解和合成性9.2 一个用于语义理解的简单文法 字典9.3 介词短语和动词短语9.4 词条化的语义理解和语义角色9.5 简单问题的处理9.6 用特征合一的语义理解End 考查语言中的一些基本结构,在剖析一小段英语过程中建立一个文法来产生每一个成分的逻辑形式,在这两节中所用的逻辑形式是命题-变量的结构。 讨论语义合成的观点并引入演算演算(lambda calculus)作为建立合成理论的工具。 如何用语义角色来产生逻辑形式,并主要讨论建立分级字典的必要性,因为用它可以减少确定词条意思的工作量。 讨论语义理解中如何处理简单的问题 。 讲述形成逻辑形式的另一种方法,它将利用

3、附加特征,从而比表达方法更具有选择性,这样允许我们表达可逆的文法。 讨论语义实现,阐述对于给出逻辑形式和可逆文法,如何产生相应的句子。 在语义理解过程中,我们有一个重要的假定:语义的合合成过程成过程(compositional process)。这就意味着一个成分的意思可以由它的子成分的意思单独地推导出。合成理论有一些很吸引人的性质,尤其理解可以随着子短语的理解而增加,例如句法中的上下文无关文法就是关于句法的合成理论,只需将规则应用于子成分的类型,不用考虑它们的内部结构,如规则:S NP VP,不管NP的特定形式,通过简单的加入一个NP规则:NP PRO,这样一个新类型的句子就产生了,即具有一

4、个代词处于可接受的位置的任何句子,这个吸引人的性质正是我们进行语义理解所需要的。 语言的合成性常根据严格的标准来定义,一个子成分的意思将在其它子成分的意思映射到新成分的过程中起作用,而在合成方法中,要求常大大放宽,只要按一个成分,一个成分的意思逐渐增加即可。 这将是我们用合成理论所会碰到的难题之一。围绕这个问题,可以引入无范围的逻辑形式(the unscoped logical form)。如果我们定义语义理解的目标是产生一个无范围的逻辑形式,则上个句子将表达成:(LOVES l1 (NAME j1 “Jill”) )它更加接近句子的句法结构。 例例1一个典型的问题是带有量词的句子: Jill

5、 loves every dog. 这个句子的句法结构只是将词聚集在一起组成短语:(Jill) (loves (every dog) 但这个句子的无歧义的逻辑形式若用谓词-变量的形式(predicate-argument form)描述,则为:(EVERY d :(DOG1 d) (LOVES1 l1 (NAME j1 “Jill”) d) 合成模型倾向于使文法更容易扩展和维持。但建立一个语义理解的合成理论看似容易,但做起来难:首先,句子的句法结构和逻辑形式的结构之间存在结构的不一致。例如:短语every dog是动词短语 loves every dog的一个子成分,然而它的语义理解广义的量化

6、短语(EVERY d :(DOG1 d) 看起来象是把动词短语的意思作为它的一部分;更糟糕的是好象把every dog的理解分裂开了:将量词结构和变量从谓词中分离出来。结果是很难看出every dog孤立地代表什么意思及如何用它来构造整个句子的意思。这表明对于每条狗 d 都有一个由 Jill loving d 的事件l1。在这当中,逻辑形式的各个部分和句法分析中的成分之间就不是简单的一一对应关系。 它的意思是 Jack died,这种理解似乎与动词 kick 以及 bucket 毫无关系。这样的句子的意思就不象是由子成分的意思构造出来,处理这种情况的一种方法是允许将语义意思赋予整个短语,而不是

7、根据语义合成。我们原来就假设基本单元是单词(或词素),习惯用语的表达则建议将其推广,使得一个完整的短语可以有一个基本的(即不用推导的)意思。这样动词短语 kick the bucket 有着类似于动词 die 的基本意思。在合成意思不能应用于理解习惯用语时,通过观察特定的句法意译来匹配这些句子。 例如:表示被动的句子The bucket was kicked by Jack,就不能解释成 Jack died。 对于合成理论的另外一个挑战是习惯用语。 例2 你可以说Jack kicked the bucket。 解决这个问题的另一种方法是对习惯用语中出现的单词引入新的意义。例如,kick 将有一

8、个意思 DIE1,它的宾语的子词类是 BUCKET1 类型。虽然习惯用语是语言中一个非常有趣而且很重要的方面,但在接下去的几章中,我们将没有讨论它。为了达到本书的目的,你可以假设基本意思总是和单词联系在一起。 有趣的是,这个句子是有歧义的,它有一个由每个词的意思所构造的意思:(KICK1 k1 (NAME j1 “Jack”) 而另一个由词Jack和短语kick the bucket的基本意思所构造的意思:(DIE1 d1 (NAME j1 “Jack”) 如果语义理解的过程是合成,那么你必须能够赋予任何的句法成分一个相应的语义结构。比如:你必须能够赋予每一个动词短语一些固定的意思形式,使它能

9、够用于含有VP子成分的规则。 考虑最简单的情况,动词短语只包含一个不及物动词,如句子 Jack laughed。一种方法是动词短语 laughed 的意思是作为一个一元谓词 ( (a unary predicatea unary predicate),这对任何对象的 laughed(过去形式)动作来说是为真。这种方法能一般化吗?也就是说,每个动词短语VP都有一个意思,即是作为一个一元谓词吗?考虑句子 Jack kissed Sue。它的逻辑形式是:KISS1 k1 (NAME j1 “Jack”) (NAME s1 “Sue”) 动词短语 kiss Sue 的意思是什么?它作为一元谓词,对任意

10、对象作了kissed Sue 的动作来说都是为真的吗? 但是,到目前为止我们仍无法表达这样复杂的一元谓词。BOX 9.1 演算演算 (lambda calculus) 和和变换变换( (lambda reduction)lambda reduction)演算的式子包含一个等价的断言: = 这个系统中最关键的公理是 ( x Px )a) = Px/a其中Px是包含x的任意式子,在式子Px/a中,用a替代所有的x。我们定义两种操作:变换变换(lambda reduction) lambda reduction) 提取提取(lambda abstraction) lambda abstraction

11、) 演算将可以用来表达上面的例子,尤其表达式 (x (KISS k1 x(NAME s1 “Sue”) 是带一个变量的谓词,你可以将 x 看作变量,而且这个谓词对任意的对象 O 来说都是为真的,这样在表达式的最终结果中子成分 O 对 x 来说是一个正确的命题。象其他谓词,你可以由表达式和变量构造一个命题。在逻辑形式语言,下面这个命题:(x (KISS1 k1 x (NAME s1 “Sue”) (NAME j1 “Jack”) 我们通常说的最终表达式是通过表达式 (x (KISS1 x (NAME s1 “Sue”)应用于变量 (NAME j1 “Jack”)而获得的,这个操作称为 变换变换

12、(lambda reduction )(lambda reduction )。 当且仅当 (NEME j1 “Jack”) 满足谓词 (x(KISS k1 x(NAMEs1 “Sue”)时,这个命题为真。 而当且仅当 (KISS1 k1 (NAME j1 “Jack”) (NAME s1 “Sue”)为真,上述定义的命题为真。 我们已经不得不引入新的概念如表达式。你可以试图放去这种方法,而建立其他方式的语义理解,然而,当处理更大的文法或更复杂的情况时,合成理论将更吸引人。 例3 用这种方式,动词短语可以容易地连接,即使他们具有不同的句法结构,象句子:Sue laughs and opens t

13、he door. 这个句子含有两个VP:laughs和opens the door。 它们可以合并成为一个复杂的一元谓词,即(a (&LAUGHS1 l2 a) (OPENS1 o2 a ) 它在句子someone who both laughs and open the door.中作一元的谓词是为真的。 这是动词短语的正确形式,它可以和其它成分 (如其它VP) 连接,比如可以应用于作主语的NP,其逻辑形式为 (NAME s1 “Sue”) ,从而形成一个原始的句子: (& (LAUGHS1 l2 (NAME s1 “Sue”) (OPENS1 o2 (NAME s1 “Su

14、e”) ) 前者是在句子 someone who laughs. 中作一元谓词是为真的,即 (a (LAUGHS1 l2 a); 后者在句子 someone who opens the door. 中作一元谓词是为真的,即(a (OPENS1 o2 a )。 考虑其它例子:介词短语修饰的名词短语可以有很多方法处理,例如对于名词短语 The man in the store 中的介词短语 in the store,我们可以有一个不独立的意思。一种特定的技巧可先寻找修饰的位置,然后合起来理解。但这种技巧在理解句子 The man is in the store.或The man was thoug

15、ht to be in the store.时是无助的。如果介词短语有一个独立的意思,如一元谓词:(o (IN-LOC1 o ) 它作为名词短语的修饰语(增加一个新的限制)以及作为句子的谓语一样,很容易理解。 名词短语The man in the store的逻辑形式是:THE m1 (MAN1 m1) (IN-LOC1 m1 ) 而句子The man is in the store.的逻辑结构则为IN-LOC1 ) 这是两个简单的例子,如果你采纳语义合成的话,那么还会产生许多其他推广。 通常,每个主要的句法短语都对应着特定的语义结构: VPs和PPs 映射为一元的谓词 (可能是不能用表达式建

16、立的复杂的表达式); 句子映射到命题; NPs则映射到术语; 小的词类映射到表达式,在表达式中定义它们在大的词类中的作用。 既然在相同的句法中的每个成分映射到同种的语义结构,这可以按一定的格式处理,例如:你可以不知道VP的特定结构,只要它的意思是一个一元谓词,你就可以用它来建立包含它的更大的成分。 这一部分将构造一个简单文法和字典来说明:在剖析时如何利用特征建立逻辑形式。为了使例子简单化,我们所要的逻辑形式先不用主题角色表示(the thematic role representation) ,而是采用上一节的来表示,这使得所有带相同子类型结构的动词可以以相同的方法处理。在9.4节再讨论确定主

17、题角色的框架是如何生成。 对于每一条词条和文法规则,我们需要增加一个SEM特征,例如:规则(S SEM (?semvp ?semnp) (NP SEM ?semnp) (VP SEM ?semvp) 在给了带有SEM (NAME m1 “Mary”) 的NP子成分和带有SEM (a (SEE1 e8 a (NEME j1 “Jack”)的VP子成分时,考虑这条规则是什么? 新成分S的SEM特征是简单的表达式: ( (a (SEES e8 a (NAME j1 “Jack”) (NAME m1 “Mary”) ) 用变换简化后:(SEES1 e8 (NAME m1 “Mary”) (NAME j

18、1 “Jack”) 它正是我们所希望得到的句子。 图9.1 给出了当每个成分带有SEM特征时句子的剖析过程。S SEM (SEES1 e8 (NAME m1 “Mary”) (NAME j1 “Jack”) NPSEM (NAME m1“Mary”) VP SEM ( a (SEES1 e8 a NAME j1“Jack”)V SEM SEES1NP SEM (NAME m1 “Jack”)图9.1 带有SEM特征的一棵剖析树Exit 在字典中,我们用SEM特征来描述各个单词的可能意思,因为有不同的一元谓词, 故通常一个词的不同子类型有着不同词意。图9.2给了一个简单的字典。 a (art A

19、GR 3s SEM INDEF1)can (aux SUBCAT base SEM CAN1)decide (v SEM DECIDES1 VFORM base SUBCAT _none)decide (v SEM DECIDES_ON1 VFORM base SUBCAT _pp:on)fish (n SEM FISH1 AGR 3s)fish (n SEM (PLUR FISH1) AGR 3p)图9.2 一个带SEM特征的词典 (详见Page 269) 一个词的不同 SEM 形式取决于它的句法特征,这就需要有不同的词条。例如:动词decide有两个词条:一是 SUBCAT 为 _none

20、 的情况;另一个是 SUBCAT为 _pp:on;单词fish也有两个词条,因为它的SEM特征取决它是单数还是复数。 (VP VAR ?v SEM ( a2 (?semv ?v a2) (V_none SEM ?semv) (VP VAR ?v SEM ( a3 (?semv ?v a3 ?semnp ) (V_np SEM ?semv) (NP SEM ?semnp) 规则2、3则处理及物和不及物动词并形成合适的VP解释。它们都带有SEM特征 (?semv) 从而构造了一个一元谓词,这个谓词能够应用于主语。代表动词时态的变量包含三部分:一个事件变量 an event variable (存储

21、于VAR特征中)、代表主语的变量以及其它子类型成分变量。 对于文法9.3,它能接受很简单的句子和动词短语并建立其逻辑形式,注意到我们又引入一个附加于SEM特征的新特征:VER。它存贮着与成分相对应的语段变量(the discourse variable),它对后面处理一定形式的修饰语特别有用。当由单词构造词条成分时,VER特征将由剖析器自动生成,通过把VER当作主特征来沿剖析树传递,它保证了语段变量的唯一。 (S SEM (?semvp ?semnp) (NP SEM ?semnp) (VP SEM ?semvp) Exit (NP WH- VAR ?v SEM (PRO ?v ?sempro

22、) (PRO SEM ?sempro) 给定代词的形态 (?sempro) 后,规则4则为代词构造一个带合适的SEM特征 ; (NP VAR ?v SEM (NAME ?v ?semname) (NAME SEM ?semname) 规则5对合适的names做同样的变换; (NP VAR ?v SEM ) (ART SEM ?semart) (CNP SEM ?semcnp)规则6定义一个未量化的表达式,它包含量词 ?semart,语段变量 ?v 和一个命题(可以将一元谓词 ?semcnp 应用于语段变量来获得)。例如:假设语段变量 ?v 为m1,名词短语the man将绑定 the 的SEM

23、特征 (即操作THE)和 man 的SEM特征(即MAN1),从而得到表达式; (CNP SEM ?semn) (N SEM ?semn) 规则7建立一个关于单个N的简单CNP,因为普通名词的SEM特征已经是一元谓词,故其值就是CNP的SEM特征。 为了处理SEM特征,关于词型推导的词条规则就需要修改,如将一个带有SEM特征的单数名词转换成复数,就要增加复数操作:(N AGR 3p SEM (PLUR?semn) (N AGR 3s IRREG-PL SEM ?semn) +S 我们可以用一个相似的技巧:对于现在时和过去时,插入一个无时态操作。修改后的词型规则如文法9.4所示,这些规则和文法4

24、.5的初始规则相同,只增加了SEM特征 (详见Page 269): 文法 4.5 文法 9.4 在处理语义理解时,只需修改标准的图表剖析方法中的两个地方: 当一条词条规则能使用时,将VER特征赋予一个新的语段变量。 无论何时建立一个成分,都用所有可能的变换来简化SEM特征。 经过这两个变化,现有的剖析器可以剖析并形成逻辑形式。考虑句子:Jill saw the dog.它的剖析过程如图9.5所示。 这一节总的介绍基本的语义理解过程,并引入两个新的特征和两处小的扩展。在剖析过程中由文法建立其逻辑形式,这种技术可以用于本书讨论的任何基于图表剖析方法。图9.5 首先,考虑处理助动词的规则:(VP S

25、EM (a1 (?semaux (?semvp a1) (AUX SUBCAT ?v SEM ?semaux) (VP VFORM ?v SEM ?semvp) 这样有助于观察这种类型的SEM式子:通过将表示主语的变量移动 (“lifting”)到 CAN1 操作之后。以动词短语的理解 (x (LAUGHS1 e3 x)开始,建立一个新的包含CAN1操作的式子,而在式子的外部仍为主语保留变量。注意到:象所有的VPs,新的SEM特征是一个一元谓词,可以将它应用于主语,因此,助动词规则就可以递归地分析更复杂的助动词系列。 在这条规则为新的VP在合适位置插入一个情态动词,如果?semaux是情态动词

26、 (如CAN1);?semvp为表达式 (x (LAUGHS1 e3 x),根据助动词规则,动词短语can laugh的SEM特征是(a1 (CAN1 ( x (LAUGHS1 e3 x)a1),它可以简化为 (a1 (CAN1 (LAUGHS1 e3 a1)。 上一节已引入我们在语义理解时所需要的东西,而这只引入简单的理解技术而已。这一节将举一些例子:利用文法规则来处理一些更复杂的情况,更详细的讨论对动词短语和介词短语的理解。 我们先考虑作修饰语的情况,此时PP的SEM特征是一元谓词,它将应用于最终修饰的成分。这样下面的规则是用于建立PP修饰语:(PP SEM ( y (?semp y ?s

27、emnp) (P SEM ?semp)(NP SEM ?semnp) 如介词短语in the corner,如果P的SEM特征是IN-LOC1,NP的SEM特征是。这样PP的SEM特征将是一元谓词:(y (IN-LOC1 y ) 为了分析介词短语,我们要认识到介词短语在句子中可以起两种不同的语义作用:一个是PP作为名词短语或动词短语的修饰语,另一个是作为主词的子类型,介词充当一个位置变量的标志而不是一个独立的谓词。 现在你可以理解名词短语the man in the corner了,连接PP修饰语的规则为: (CNP SEM (n1 (&(?semcnp n1) (?sempp n1)

28、 ( (CNP SEM ?semcnp) (PP SEM ?sempp) 连接一个限定词 (如the),利用规则6,将形成SEM特征(如THE m2 (z (&(MAN1 z)(IN1 z)m2)它可以简化为THE m2(&(MAN1 m2) (IN1 m2) 如果CNP:man的SEM特征是一元谓词MAN1,介词短语in the corner的SEM特征是( y (IN1 y ),则新的CNP的SEM特征为 ( n1 (&(MAN1 n1) ( y (IN1 y)n1) 其中子表达式( y (INI y)n1)可以简化为(IN1 n1),这样整个表达式变成:( n1(

29、&(MAN1 n1) (IN1 n1) 这个一元谓词对“any man who is in the corner”为真,这正是我们希望的意思。 PPs也可以修饰动词短语,如cry in the corner 和 Jill can cry in the corner。 PP修饰语的句法规则是VP VP PP 问题是如果我们将这个VP子成分的一元谓词应用于主语,其中PP修饰语的一元谓词则应用于语段变量,这样将不能得到正确的答案。而是,应由PP构造的SEM应用于语段变量。也就是说,合适的规则是:(VP VAR ?v SEM (x (& (?semvp x) (?sempp ?v) (

30、VP VAR ?v SEM ?semvp) (PP SEM ?sempp)利用这条规则剖析动词短语cry in the corner的剖析树如图9.6所示。 你可以跟修饰名词短语的方式一样,处理PP的SEM特征式子,但这儿有更复杂的情况:要考虑希望的动作。如动词短语的子成分cry的逻辑形式:( x (CRIES1 e1 x) 介词短语PP的逻辑形式如上面所示,整个VP:cry in the corner的逻辑形式为( a (&(CRIES1 e1 a) (IN-LOC1 e1)(VP SEM ( x (& (CRIES e1 x) (IN-LOC1 e1) VAR e1 (V

31、SEM ( x (& (CRIES e1 x) VAR e1PP SEM (y (IN-LOC1 y ) P SEM IN-LOC1ART SEM THEN SEM CORNER1VAR c1NP SEM VAR c1cryinthecorner图9.6 带VAR特征的PP (作VPs的修饰语) 介词短语也可以在动词短语中充当子类型成分,这种情况必须另外考虑。动词短语将决定如何理解介词短语,例如:单独的介词短语on a couch可以描述物体或事件的所处的位置,但是动词decide,它可以描述决定了什么事情。两者连接后情况就不同了,如句子Jill decided on the couc

32、h,它是个有歧义的句子: Jill made a decision while she was on a couch. Jill made a decision about a couch. 其中第一个句子将on the couch看作是作状语的介词短语;而第二个句子的语义理解等式又是什么呢?其合适的句法规则是:VP V_pp:on NP PPon最终VP的逻辑形式为:( s (DECIDES-ON1 d1 s ) 注意在这种情况下,词on将没有语义贡献。对于这两种不同类型的介词短语,在很多系统中子类型PPs将被区别对待,我们引入一个新的二值特征PRED,+ 表示介词短语被理解为一个谓词,而

33、则表示作为变量。加入PRED后,如文法9.7的第8和第9条规则所示。8. (PP PRED+ SEM ( x (?semp x ?semnp) (P SEM ?semp) (NP SEM ?semnp)9. (PP PRED PFORM ?pf SEM ?semnp ) (P ROOTS ?pf) (NP SEM ?semnp)10.10.(VP VAR ?v SEM ( ag1 (& (?semvp ag1) (?sempp ?v) (VP SEM ?semvp) (PP PRED+ SEM ?sempp)11.11.(VP VAR ?v SEM ( ag2 (& (?sem

34、vp ag2) (?sempp ?v) (VP_np_pp:on SEM ?semvp) (PP PRED PFORM on SEM ?sempp)12.12.(VP SEM ( a1 (?semaux (?semvp a1) (AUX SUBCAT ?v SEM ?semaux) (VP VPFORM ?v SEM ?semvp)13. (CNP SEM ( n1 (& (?semcnp n1) (?sempp n1) (CNP SEM ?semcnp) (PP PRED+ SEM ?sempp)文法9.7 用于处理动词短语中的PPsVP SEM a (DECIDES-ON1 e1)

35、 V SEM DECIDES-ON VAR e1PP SEM PFORM on P SEM ON-LOC1NP SEM decideona couch图9.8.1 动词短语 decide on a couch的剖析树(一)VP SEM ( a (& (DECIDES e1 a) (ON-LOC1 e1) VAR e1 V SEM ( y (DECIDES e1 y) VAR e1PP SEM x (ON-LOC1 x ) P SEM ON-LOC1NP SEM decideona couch图9.8.2 动词短语 decide on a couch的剖析树(二)V SEM DECIDE

36、S1 VAR e1 到现在为止,词条的语义形式只包括每个词的各种意思,所有的复杂的语义理解可以在文法规则中编码。因为这是个合理的策略,许多研究者采用了不同的方法,在这些方法中,如果词条编码比较复杂,文法就会比较简单。在文法规则的复杂性和词条的复杂性之间存在一种矛盾。 考虑动词decide,作为不及物动词DECIDES1,它的SEM特征只是简单地为DECIDES1,文法9.3的规则2建立表达式 (y (DECIDES1 e1 y),一个可供选择的方法定义SEM特征为 (y (DECIDES1 e1 y),然后规则2中的SEM式子就是用动词的SEM特征值; 而在及物动词时,表达式为 (o (y (

37、DECIDES-ON1 e1 y o)。按照前面的方法,在规则3中,将这个谓词用于对象的SEM就可以获得合适的SEM特征值。 为了处理这两种情况,我们需要为每个词条加入一个新的特征ROLES,这样就有如下的文法规则:(VP VAR ?v SEM (a (?semv ?vAGENT aTHEME ?semnp) (V ROLES AG-THEME SEM ?semv) (NP SEM ?semnp)(VP VAR ?v SEM (a (?semv ?vINSTR aTHEME ?semnp) (V ROLES INSTR-THEME SEM ?semv) (NP SEM ?semnp) 这样我们

38、需要为动词可能充当的所有角色加入上述的附加规则。 举个例子,考虑如何确定一个文法,用它产生基于主题角色(thematic role)的逻辑形式。先考虑如果字典中只存储单个词的意思,那将会出现什么情况呢?前面用的文法只用一条规则可以覆盖所有的及物动词,新的文法则需根据及物动词所充当的主题角色来分类,每一种情况一条规则。例如动词see和eat,这两个都有及物动词的形式,此时,主语充当AGENT角色,宾语充当THEME角色。另一个方面,动词break,它的主语充当INSTR角色,宾语充当THEME角色,象在句子The hammer broke the window.中就是这样。 显然,这种方法很笨重

39、,因为它要在字典中加入主题角色的信息 (用 ROLES特征),它可以简化成只在字典中为那些合适的形式进行编码,例如,如果词条为:see: (V VAR ?v SEM (o (a (SEES1 ?v AGENT aTHEME ?o)break: (V VAR ?v SEM (o (a (BREAKS1 ?v INSTR aTHEME ?o)这样一个简单的文法规则如下:(VP SEM (?semv ?semnp)(V SEM ?semv) (NP SEM ?semnp)它将覆盖所有的情况。 考虑动词短语see the book,其中see的SEM特征和上面一样,the book的SEM为,那么VP

40、的SEM特征为:( o (a (SEES1 b1 AGENT aTHEME ?o) 用变换可以简化为(a (SEES1 b1 AGENT aTHEME ) 对于动词短语break the book,我们可以用上面的break的SEM特征和the book的SEM特征,利用同样的规则产生简化的逻辑形式:(a (BREAKS1 b1 INSTR aTHEME ) 在制作字典时所碰到的问题是有很多单词,即使词条很简单,确定一个字典也是很困难的。就是只为最普通的意思规定语义理解规则,这样的工作也是很烦人的,因为对于动词的每一个补充结构都要有不同的语义理解规则。例4 如果每个动词都要这样重复,那将是个很

41、大的负担。幸运的是,我们可以利用英语中动词的一些普遍的规律性,例如,英语中有一大类动词,包括大部分及物动词,它们都用相同的语义理解规则:其SUBCAT为_np的形式。这种类型的动词,如give,take,see,find,paint等等,实际上都描述某种动作。 在分级的顶部是抽象的动词意思,它定义一般动词类,如抽象类 INTRANS-CAT定义一类的动词,它允许SUBCAT为 _none并且有语义理解规则: s (?PREDN *AGENT s). 其中?PREDN是一个由动词决定的谓词名,除了它还须确定外,这条规则已明确地描述不及物动词(如run,laugh,sit等等)的语义理解。 分级字

42、典分级字典 (hierarchical lexicon)的思想是简练地获得动词的共同性质,用这种方法来组织动词的意思。这要依靠继承 (inheritance)这项技术,单词的意思得到继承或在分级中获得抽象类的性质,例如一个很有用的分级词条可以基于动词的SUBCAT和SEM性质。 另外一个共同的形式是简单的及物动词,包括上面所列的动词,这种形式,TRANS-ACT则有一个SUBCAT为_np和一个SEM为o a (?PREDN *AGENT aTHEME o)。 我们可以为所有的具有共同形式的动词定义相似的类,然后建立分级结构,使动词的意思和它所能带的形式相关联。图9.9所示的分级词条为四种不同

43、的动词意思编码。它和下面没有分级的词条等价:run (作不及物动词,RUN1) (SUBCAT _none SEM a(RUN1 *AGENT a)run (作及物动词,OP1) (SUBCAT _np SEM o a (OP1 *AGENT aTHEME o)图 9.9donate (允许及物和带“to”的形式) (SUBCAT _np SEM o a (DONATE1 *AGENT aTHEME o) (SUBCAT _np_pp:to SEM o r a (DONATE1 *AGENT a THEME o TO-POSS r)当然,还有:give (先前讨论的所有形式)(SUBCAT _

44、np SEM o a (GIVE1 *AGENT aTHEME o)(SUBCAT _np_pp:to SEM o r a (GIVE1 *AGENT aTHEME oTO-POSS r) (SUBCAT _np_np SEM r o a (GIVE1 *AGENT aTHEME oTO-POSS r) 你也可以通过增加另一个特征SUP,这个特征将抽象类型的列表作为它的值,这个列表是成分继承的性质,然后编写一个程序来查找这个分级词条,从中寻找所有相关的特征值。这样动词give的词条可能象:give:(VROOT give PREDN GIVES1 SUP (BITRANS-TO-ACT TRA

45、NS-ACT) 到现在为止,我们所建立的文法只能处理简单的陈述语句,为了处理其它类型的句子,我们需要扩展文法,增加规则来理解Wh-引导的条件句、倒装句以及处理Wh-引导的疑问句所需要的缺口传播缺口传播 (gap propagation)。 你所需做的只是先用SEM特征扩展第5章中的S规则。 这儿可能要对SEM特征和GAP特征之间的如何相互影响作一下解释。 现在为了能够进行语义理解,我们在 gap 特征中增加 SEM 特征,使它成为 S 结构的一部分,当找到缺口时,可以利用它。修改后的规则变为:(S INV SEM (WH-query ?sems)(NP WH Q AGR ?a SEM ?sem

46、np) (S INV + SEM ?sems GAP (NP AGR ?a SEM ?semnp) 回忆一下,为了处理疑问句,当时我们引入规则:(S INV ) (NP WH Q AGR ?a) (S INV + GAP (NP AGR ?a)文法9.10 给出了处理这种类型的问题所需要的规则。14. (S INV SEM (WH-query ?sems) (NP WH Q AGR ?a SEM ?semnp) (S INV + SEM ?sems GAP (NP AGR ?a SEM ?semnp)15. (S INV + GAP ?g SEM (?semaux (?semvp ?semnp

47、) (AUX AGR ?a SUBCAT ?s SEM ?semaux)(NP AGR ?a GAP ?g SEM ?sempp)(VP VFORM ?s GAP ?g SEM ?semvp)16. (NP WH Q VAR ?v SEM ) (PRO WH Q SEM ?sempro)文法9.10 处理简单的Wh-问句的规则 相应地,Wh-引导的单词的词条也要增加SEM特征,例如:单词who的词条将变为 (PRO WH Q R SEM WHO1 AGR 3s 3p) 其中谓词 WHO1 对任何符合这个问题答案的对象为真,包括人以及其它可能的活动物体。ExitS2 SEM (WH-QUERY(

48、SEES1 (NAME j1 “Jill”) (WH p1 WHO1) Who(NP1 SEM S1 GAP SEM ( (SEES1 (NAME j1 “Jill”) ?semnp) didJillVP1 GAP SEM ( ag (SEES1 ag ?semnp) GAP1 SEMV1 SEM SEES1see 为了说明SEM和GAP特征如何相互影响,我们可以看图9.11,Exit这个成分可以作为规则14的开始,这样我们需要下面的成分来完成规则:(S INV + GAP (NP AGR 3s SEM ) SEM ?sems)文法9.10(VP VFORM base GAP(NP AGR 3

49、s SEM ) SEM ?semvp) 这是一个带有NP缺口的VP,将文法9.3中的规则3应用于及物动词see,GAP特征用于填充这个缺口,变量?semnp为。 这样新的VP的SEM特征为:(a3 (SEES1 s1 a3 ) 初始的单词who的SEM特征刚好和句子中的合适的位置相匹配,这样剖析就能够完成。 文法9.10图9.11(VP VFORM baseGAP(NP AGR 3s SEM )SEM ?semvp) 这种将在GAP中增加SEM特征的技巧可以推广,用它可以处理第5章所讨论的所有类型的疑问句。 疑问句也可以以介词短语开头,如 In which box did you put th

50、e book?Where did you put the book?When did he disappear? 对这些问题的语义理解依赖于 PPs是作为动词的子类型还是作VP的修饰语,许多这种问题可以象规则14那样处理(规则14用于处理NP),即:(S INV SEM (WH-query ?sems) (PP WH Q PRED ?p PTYPE ?pt SEM ?sempp) (S INV+ SEM ?sems GAP(PP PRED ?p PTYPE ?pt SEM ?sempp) 为了正确地处理Wh-引导的条件句(如where),需要增加下面的规则:(PP PRED ?pd PTYPE

51、 ?pt SEM ?sem) (PP-WRD PRED ?pd PTYPE ?pt SEM ?sem) 作为Wh-型条件句的引导词where,将有两个词条,每一个PRED值各一个:(PP-WRD PTYPE LOC MOT PRED VAR ?v SEM )(PP PRED + VAR ?v SEM (x (AT-LOC x ) 这些规则可以扩展现存的文法以便许多这样的问题可以得到回答。 图9.12显示了问句Where did Jill go?的部分剖析树。 注意到要处理以 +PRED 介词短语开头的疑问句依赖于第5章提到的缺口传播问题的解决。具体地讲,如果规则VP VP PP按通常的情况,只

52、是使GAP成为VP子成分的一部分,我们称之为非词头(the nonlexical head)。这样我们好象无法创建 一个PP缺口来修饰动词短语,这本来也是一个句法问题,但它的解决将推迟到语义理解的时候。图9.12 到现在为止,我们已用表达式和变换来进行语义理解,它提供一个好的框架来解释以及好的技巧来进行语义理解。 然而,很多系统不是明确的使用表达式,也不直接用特征值和变量来进行语义理解,而基本的思想是引入新的特征,作为变量所处位置,而这个位置原来是用变换所填充。 举个例子,将用下面的规则替代9.3中的规则1:(S SEM (?semvp ?semnp) (NP SEM ?semnp) (VP

53、SEM ?semvp) 这样,我们要引入新的特征SUBJ,上面的规则将变成:(S SEM ?semvp) (NP SEM ?semnp) (VP SUBJ ?semnp SEM ?semvp) 主语的SEM特征被加入到VP成分作为SUBJ特征,相应的VP的SEM式子也在适当位置插入主语。 文法9.3中的规则3的新版本将变为:(VP VAR ?v SUBJ ?semsubj SEM (?semv ?v ?semsubj ?semnp)(V_none SEM ?semv) (NP SEM ?semnp)文法9.3 如图9.13所示,利用这些规则建立句子Jill saw the dog.的SEM特征

54、。与用文法9.3的分析 (图9.5)相比较,不同表现在对VP的处理,在这儿SEM特征是带有主语带有主语的完整命题,而在以前SEM特征是一个表达式表达式,在形成S时,这个表达式才应用于主语。图9.13图9.5 这种方法的一个优点是:我们不需要引入特定的技巧来处理语义理解,特别是,不需要变换的步骤,通过特征合一就能完成所要做的事情; 文法9.3用这种技术修改后就变成文法9.14。文法9.14文法9.3 另一个重要的优点是以这种方式确定的文法具有可逆性,因此也可以用它们产生句子,这将在下一节中讨论。 然而,并不是所有的表达式都可以用这种技术来消除,例如处理并列主语 (如 Sue and Sam sa

55、w Jack.)时,动词短语的意思理解仍需用表达式。因为如果利用SUBJ的变量将主语被插入到VP中,那么变量就需要用Sue和Sam的 SEMs特征来合一,而这种方法不能做到。JillsawthedogS4 SEM ( s1 (NAME j1 “Jill”) NP1 SEM (NAME j1 “Jill”) VP SUBJ (NAME j1 “Jill”) SEM ( s1 (NAME j1 “Jill”) ) VAR s1NP3 SEM VAR ev1CNP1 SEM (DOG1 d1) VAR d1图9.13 句子Jill saw the dog的剖析树(用SUBJ特征)Exit(S SEM

56、 ?semvp) (NP SEM ?semnp) (VP SUBJ ?semsubj SEM ?semvp) (VP VAR ?v SUBJ ?semsubj SEM (?semv ?v ?semsubj) (V_none SEM ?semv)(VP VAR ?v SUBJ ?semsubj SEM(?semv ?v ?semsubj ?semnp ) (V_np SEM ?semv) (NP SEM ?semnp)(NP VAR ?v SEM (PRO ?v ?sempro) (PRO SEM ?sempro)(NP VAR ?v SEM (NAME?v ?semname) (NAME SE

57、M ?semname)(NP VAR ?v SEM ) (ART SEM ?semart) (CNP SEM ?semcnp) (CNP VAR ?v SEM (?semn ?v) (N SEM ?semn)文法9.14 一个带SEM特征的简单文法Exit 9.7文法9.3(S SEM (?semvp ?semnp) (NP SEM ?semnp) (VP SEM ?semvp) (VP VAR ?v SEM ( a2 (?semv ?v a2) (V_none SEM ?semv)(VP VAR ?v SEM ( a3 (?semv ?v a3 ?semnp ) (V_np SEM ?sem

58、v) (NP SEM ?semnp) (NP WH- VAR ?v SEM (PRO ?v ?sempro) (PRO SEM ?sempro) (NP VAR ?v SEM (NAME ?v ?semname) (NAME SEM ?semname) (NP VAR ?v SEM ) (ART SEM ?semart) (CNP SEM ?semcnp) (CNP SEM ?semn ) (N SEM ?semn)Exit文法9.3 一个带SEM特征的简单文法文法9.14 事实上,文法9.3不具有可逆性,因为它用了变换。 注:变换也有一个可逆操作,我们称之为提取(lambda abstrac

59、tion),用它可以寻找匹配。 凭直觉知道,如果你有一个可用于剖析的文法,那么它应该能够反过来,用它来产生句子,即给出一个成分的SEM特征集,这样的句子产生器将利用文法把这个成分分解成一系列的有合适意义的词条成分。然而并不是所有的文法都具有可逆性。 文法9.3不具有可逆性。 假设你要产生一个句子,它的意思是:( s1 (NAME j1 “Jill”) ) 文法9.3只有一条S规则,如果你想将规则1中的SEM值和这个逻辑形式合一的话,那么就会失败:规则1中形式 (?semvp ?semnp)可以和由一个一元谓词和一个变量组成的任意命题相匹配,但所确定的逻辑形式中的代词带有三个变量。 问题是已经用

60、变换改变了初始的逻辑形式,这个逻辑形式的原形为: (a ( s1 a ) (NAME j1 “Jill”) 但是问题仍存在,这儿有三个可能的提取:(e (PAST SEES1 e (NAME j1 “Jill”) )(a (PAST SEES1 s1 a )(o (PAST SEES1 s1 (NAME j1 “Jill”) o) 在规则1中没有指出哪一条是正确的,但只有第2条可以提供正确的句子。 另一方面,象文法9.14那样利用特征的方法是具有可逆性的。 因为它保持了如何构造逻辑形式的所必需的信息。 在很多方法中,剖析和实现是很类似的过程,两者都可以看作是建立句法树:一个剖析器是从单词开始,试图寻找一棵树来说明它们,从而决定句子的逻辑形式;而一个实现器刚好相反。 这个分析建议我们可以修改标准的剖析

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论