第11章自然语言理解课件_第1页
第11章自然语言理解课件_第2页
第11章自然语言理解课件_第3页
第11章自然语言理解课件_第4页
第11章自然语言理解课件_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第11章自然语言理解11.1简单句理解11.2复合句理解11.3转换文法和转换网络1谢谢观赏2019-8-28第11章自然语言理解11.1简单句理解1谢谢11.1.1理解的实现过程

10.1.1理解的实现过程要理解一个语句,需建立起一个和该简单句相对应的机内表达。而要建立机内表达,需要做以下两方面的工作:

(1)理解语句中的每一个词。

(2)以这些词为基础组成一个可以表达整个语句意义的结构。2谢谢观赏2019-8-2811.1.1理解的实现过程10.1.1理解的实现过程

第一项工作看起来很容易,似乎只是查一下字典就可以解决。而实际上由于许多单词有不止一种含义,因而只由单词本身不能确定其在句中的确切含义,需要通过语法分析,并根据上下文关系才能最终确定,例如,单词diamond有“菱形”、“棒球场”和“钻石”三种意思,在语句JohnsawSusan’sdiamondshimmeringfromacrosstheroom.中,由于“shimmering”的出现,则显然“diamond”是“钻石”的含义,因为“菱形”和“棒球场”都不会闪光。再如在语句

I’llmeetyouatthediamond.3谢谢观赏2019-8-28第一项工作看起来很容易,似乎只是查一下字典就可以解中,由于“at”后面需要一个时间或地点名词作为它的宾语,显然这里的“diamond”是“棒球场”的含义,而不能是其他含义。第二项也是一个比较困难的工作。因为要以这些单词为基础来构成表示一个句子意义的结构,需要依赖各种信息源,其中包括所用语言的知识、语句所涉及领域的知识以及有关该语言使用者应共同遵守的习惯用法的知识。由于这个解释过程涉及到许多事情,因而常常将这项工作分成以下三个部分来进行:

4谢谢观赏2019-8-28中,由于“at”后面需要一个时间或地点名词作为它的宾语,(1)语法分析。将单词之间的线性次序变换成一个显示单词如何与其他单词相关联的结构。语法分析确定语句是否合乎语法,因为一个不合语法的语句就更难理解。

(2)语义分析。各种意义被赋予由语法分析程序所建立的结构,即在语法结构和任务领域内对象之间进行映射变换。

(3)语用分析。

为确定真正含义,对表达的结构重新加以解释。

5谢谢观赏2019-8-28(1)语法分析。将单词之间的线性次序变换成一个显示11.1.2语法分析要进行语法分析,必须首先给出该语言的文法规则,以便为语法分析提供一个准则和依据。对于自然语言人们已提出了许多种文法,例如,乔姆斯基(Chomsky)提出的上下文无关文法就是一种常用的文法。一个语言的文法一般用一组文法规则(称为产生式或重写规则)以及非终结符与终结符来定义和描述。例如,下面就是一个英语子集的上下文无关文法:

6谢谢观赏2019-8-2811.1.2语法分析6谢谢观赏2019-8-2811.1.2语法分析

要进行语法分析,必须首先给出该语言的文法规则,以便为语法分析提供一个准则和依据。对于自然语言人们已提出了许多种文法,例如,乔姆斯基(Chomsky)提出的上下文无关文法就是一种常用的文法。一个语言的文法一般用一组文法规则(称为产生式或重写规则)以及非终结符与终结符来定义和描述。

例如,下面就是一个英语子集的上下文无关文法:

7谢谢观赏2019-8-2811.1.2语法分析7谢谢观赏2019-8-28〈sentence〉∷=〈noun

phrase〉〈verb

phrase〉〈noun

phrase〉∷=〈determiner〉〈noun〉〈verb

phrase〉∷=〈verb〉〈noun

phrase〉|〈verb〉〈determiner〉∷=the|a|an

〈noun〉∷=man|student|apple|computer

〈verb〉∷=eats|operats

这个文法有6条文法规则,它们是用BNF范式表示的。其中带尖括号的项为非终结符,第一个非终结符称为起始符,不带尖括号的项为终结符,符号“∷=”的意思是“定义为”,符号“|”是“或者”的意思,而不带“|”的项之间是“与”关系。符号“∷=”也可以用箭头“→”表示。

8谢谢观赏2019-8-28〈sentence〉∷=〈nounphrase〉〈verb

有了文法规则,对于一个给定的句子,就可以进行语法分析,即根据文法规则来判断其是否合乎语法。可以看出,上面的文法规则实际是非终结符的分解、变换规则。分解、变换从起始符开始,到终结符结束。所以,全体文法规则就构成一棵如图11-1所示的与或树,我们称其为文法树。所以,对一个语句进行语法分析的过程也就是在这个与或树上搜索解树的过程。可以看出,搜索解树可以自顶向下进行,也可以自底向上进行。自顶向下搜索就是从起始符sentence出发,推导所给的句子;自底向上搜索就是从所给的句子出发,推导起始符sentence。

9谢谢观赏2019-8-28有了文法规则,对于一个给定的句子,就可以进行语法分图

11-1文法树

10谢谢观赏2019-8-28图11-1文法树10谢谢观赏2019-8-28例11.1下面是一个基于上述文法的语法分析程序。它采用自顶向下搜索。

sentence(X):append(Y,Z,X),noun_phrase(Y),verb_phrase(Z).

noun_phrase(X):append(Y,Z,X),determiner(Y),noun(Z).

verb_phrase(X):append(Y,Z,X),verb(Y),noun_phrase(Z).

verb_phrase(X):verb(X).

determiner([the]).

noun([H|_]):member(H,[man,student,apple,banana,computer]).

verb([H|_]):member(H,[eats,study,programming,operats]).append([],L,L).

append([H|T],L,[H|L2]):

append(T,L,L2).

member(X,[X|_]).

member(X,[_|T]):

member(X,T).11谢谢观赏2019-8-28例11.1下面是一个基于上述文法的语法分析程序。它采这个程序是先把所给的句子以符号表的形式约束给谓词sentence的变量X,然后对其进行分解和变换。如果最终分解、变换的结果与语言的文法树相符,则证明所给的句子语法正确;

否则语法错误。

例如,对于句子

thestudentoperatsthecomputer要用该程序进行语法分析,则应给出询问:

?-sentence([the,student,operats,the,computer]).这时,系统则回答:

yes

分析这个句子所产生的解树如图11-2所示。这个解树称为该句子的语法分析树。

12谢谢观赏2019-8-28这个程序是先把所给的句子以符号表的形式约束给谓词sent图

11-2语法分析树

13谢谢观赏2019-8-28图11-2语法分析树13谢谢观赏2019-8-28需指出的是,这个程序虽然易于理解,但运行效率较低。因为在用append谓词对句子进行分解时一般要进行多次回溯。

为此,我们把这个程序修改为如下形式:

sentence(X,Y):noun_phrase(X,Z),verb_phrase(Z,Y).

noun_phrase(X,Y):determiner(X,Z),noun(Z,Y).

verb_phrase(X,Y):verb(X,Z),noun_phrase(Z,Y).

verb_phrase(X,Y):verb(X,Y).

determiner([the|T],T).

noun([H|T],T):member(H,[man,student,apple,computer]).verb([H|T],T):member(H,[eats,operats]).14谢谢观赏2019-8-28需指出的是,这个程序虽然易于理解,但运行效率较低。这个程序的每个谓词有两个参量,它们都是符号表。对于一个给定的句子,后一个表是前一个表的余表。语法分析时,把所给的句子以符号表的形式约束给sentence的第一个变量X,第二个变量约束为空表。如

?-sentence([the,student,operats,the,computer],[]).则系统仍然回答:

yes

这个程序虽然难读,但它的运行效率较高。语法分析可判断一个句子的语法结构是否正确,但不能判断一个句子是否有意义。例如把上面询问中的例句改为?-sentence([the,computer,operats,the,student],[]).系统则仍然回答:yes。对于诸如此类的问题,语义分析则可解决。

15谢谢观赏2019-8-28这个程序的每个谓词有两个参量,它们都是符号表。对于一个11.1.3语义分析语义分析就是要识别一个语句所表达的意思。语义分析的方法很多,如运用格文法、语义文法等。语义文法是进行语义分析的一种简单方法。所谓语义文法,就是在传统的短语结构文法的基础上,将名词短语、动词短语等不含语义信息的纯语法类别,用所讨论领域的专门类别来代替。

例如,下面就是一个语义文法的例子:

16谢谢观赏2019-8-2811.1.3语义分析16谢谢观赏2019-8-28S→PRESENTtheATTRIBUTEofSHIP

PRESENT→whatis|canyoutellme

ATTRIBUTE→length|class

SHIP→theSHIPNAME|CLASSNAMEclassship

SHIPNAME→Huanghe|Changjiang

CLASSNAME→carrier|submarine这是一个舰船管理数据库系统自然语言接口的语义文法片段。

17谢谢观赏2019-8-28S→PRESENTtheATTRIBUTEofSHI

可以看出,语义文法的重写规则与上下文无关文法的形式是类似的。但这里没有出现像名词短语和动词短语等语法类别,而是用了PRESENT、ATTRIBUTE、SHIP等专门领域中的类别。对于语义文法的分析方法,可以使用与上下文无关文法相类似的方法。利用上面给出的语义文法,可以从语义上识别如下的语句:

WhatistheclassoftheChangjiang?

CanyoutellmethelengthoftheHuanghe?

语义文法可以排除无意义的句子。

当然,它只能适应于严格限制的应用领域。

18谢谢观赏2019-8-28可以看出,语义文法的重写规则与上下文无关文法的形式是类11.2

简单句的理解不涉及句与句之间的关系,它的理解过程首先是赋单词以意义,然后再给整个语句赋予一种结构。而一组语句的理解,无论它是一个文章选段,还是对话节录,句子之间都有相互关系。所以,复合句的理解,就不仅要分析各个简单句,而且要找出句子之间的关系。这些关系的发现,对于理解起着十分重要的作用。句子之间的关系包括以下几种:

(1)相同的事物,例如:“小华有个计算器,小刘想用它。”单词“它”和“计算器”指的是同一物体。

19谢谢观赏2019-8-2811.2复合句理解简单句的理解不涉及句与句之(2)事物的一部分,例如:“小林穿上她刚买的大衣,发现掉了一个扣子。”“扣子”指的是“刚买的大衣”的一部分。(3)行动的一部分,例如:“王宏去北京出差,他乘早班飞机动身。”乘飞机应看成是出差的一部分。(4)与行动有关的事物,例如:“李明准备骑车去上学,但他骑上车子时,发现车胎没气了。”

李明的自行车应理解为是与他骑车去上学这一行动有关的事物。

20谢谢观赏2019-8-28(2)事物的一部分,例如:20谢谢观赏2019-8-2

(5)因果关系,例如:“今天下雨,所以不能上早操。”下雨应理解为是不能上操的原因。

(6)计划次序,例如:“小张准备结婚,他决定再找一份工作干。”小张对工作感兴趣,应理解为是由于他要结婚,而结婚需要钱而引起的。21谢谢观赏2019-8-28(5)因果关系,例如:21谢谢观赏2019-8-2要能做到理解这些复杂的关系,必须具有相当广泛领域的知识才行,也就是要依赖于大型的知识库,而且知识库的组织形式对能否正确理解这些关系,起着很重要的作用。特别对于较大的知识库,应考虑如何将问题的“焦点”集中在知识库的相关部分。例如,对于下面的一段话:“接着,把虎钳固定到工作台上。螺栓就放在小塑料袋中。”显然,第二句中的螺栓就是第一句中用来固定虎钳的螺栓。所以,如果在理解第一句时,就把需用的螺栓置于“焦点”之中,则全句的理解就容易了。因此,需要表示出与“固定”有关的知识,以便当见到“固定”时,能方便地提取出来。22谢谢观赏2019-8-28要能做到理解这些复杂的关系,必须具有相当广泛领域的知识对于描述与行为有关的复合语句,也可采用目标结构的方法帮助理解。即对于常见的一些行为目标,事先制定出其行动规划,这样,当语句所描述的情节中的某些信息省略时,可以调用这些规划,通过推导找到问题的答案。例如对于下面的文章片段:“小王有点饿。他便向行人打听餐馆在哪里。”如果有这样的行动规划:打听地址→去餐馆→吃饭→不饿则就不难理解第二个句子了。

23谢谢观赏2019-8-28对于描述与行为有关的复合语句,也可采用目标结构的方法帮11.3

转换文法和转换网络

11.3.1转换文法人们对自然语言句子的结构进行研究,发现同一个意思往往有许多不同的表示形式(说法)。例如语句:

Maryreadmeastory.

Maryreadastorytome.

24谢谢观赏2019-8-2811.3转换文法和转换网络11.3.1转换文法24谢说法虽然不同,但意思实际是完全一样的。再如主动句和被动句也是常用的两种不同的表示形式。于是,人们就提出了语句的深层结构和表层结构的概念。认为一个句子可以有多个不同的表层结构,但其深层结构都是相同的。鉴于这样的认识,转换文法(transformationalgrammar)便应运而生。

25谢谢观赏2019-8-28说法虽然不同,但意思实际是完全一样的。再如主动句和被动转换文法就是可把句子的一种结构转换为另一种结构的文法。转换文法是由基础和转换两部分组成。基础部分是一个上下文无关文法,它产生句子的深层结构表示;转换部分是一个转换规则(重写规则)集,它负责句子结构的转换。转换文法的工作过程是:先用上下文无关文法建立相应句子的深层结构,然后再应用转换规则将深层结构转换为符合人们习惯的表层结构。图11-3给出了一条把主动句转换为被动句的转换规则。

26谢谢观赏2019-8-28转换文法就是可把句子的一种结构转换为另一种结构的文法。转图

11-3转换规则

27谢谢观赏2019-8-28图11-3转换规则27谢谢观赏2019-8-28转换又可分为被动转换、分割转换、疑问转换等等,运用这些转换,转换文法可以将一个句子转换为多种不同的表达形式。例如,对于下面这个简单的主动句:

Johnatethebanana.

运用被动转换,得到:

ThebananawaseatenbyJohn.

运用分割转换,得到:

ItwasJohnwhoatethebanana.

先进行被动转换,再进行分割转换,得到:

ItwasthebananathatwaseatenbyJohn.28谢谢观赏2019-8-28转换又可分为被动转换、分割转换、疑问转换等等,运用这些运用疑问转换,得到:

DidJohneatthebanana?

转换也可以将语句的表层结构逆转换为其深层结构。这样,我们可以将一组不同形式的相关语句,通过一个转换序列而映射为一个单一的句子。例如把上述各种其他形式的语句转换为一个主动句。这显然对于自然语言理解和机器翻译有重要作用。

29谢谢观赏2019-8-28运用疑问转换,得到:29谢谢观赏2019-8-2811.3.2转换网络转换网络(TransitionNetwork)全称为状态转换网络。它是一种由节点和有向边(弧)组成的有向图。其中节点代表状态,有向弧代表从一个状态到另一个状态的转换。一个转换网络中一般有一个起始节点

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论