




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、会计学1自然语言理解人工智能自然语言理解人工智能(rn n zh nn)原理及其应原理及其应第一页,共17页。28.1 语言语言(yyn)及其理解的基及其理解的基本概念本概念 自然语言是音义自然语言是音义(yny)结合的词汇和语法体系。词汇是语言的基本单位,它在语法的支配下结合的词汇和语法体系。词汇是语言的基本单位,它在语法的支配下可构成有意义和可理解的句子,句子再按一定的形式构成篇章等。其结构如图可构成有意义和可理解的句子,句子再按一定的形式构成篇章等。其结构如图8.1所示:所示: 语言(yyn)词汇语法词熟语词法句法词素构形法构词法词组构造法造句法 词汇词汇是语言的基本单位。是语言的基本单
2、位。熟语熟语是指一些词的固定组合,如汉语中的成语。词又由词素构成是指一些词的固定组合,如汉语中的成语。词又由词素构成,词素词素是构成词的最小有意义的单位。如是构成词的最小有意义的单位。如“学生学生”是由是由“学学”和和“生生”这两个词素构成这两个词素构成的。的。 语法语法是语言的组织规律。是语言的组织规律。词法词法是用词素或熟语构成词的规则,可分为构形法和构是用词素或熟语构成词的规则,可分为构形法和构词法。词法。构形法构形法是指单数复数等。是指单数复数等。造句法造句法是用词和词组构造句子的规则。是用词和词组构造句子的规则。 语言词汇语法词熟语词法词素句法构形法构词法词组构造法语言词汇语法词熟语
3、词法词素造句法句法构形法构词法词组构造法语言词汇语法词熟语词法词素第1页/共17页第二页,共17页。3 其主要任务是要找出词汇的各个其主要任务是要找出词汇的各个(gg)词素,从中获得语言学信息,并确词素,从中获得语言学信息,并确定单词的词义。以英语为例,其词法分析的基本算法如下:定单词的词义。以英语为例,其词法分析的基本算法如下: repeat look for word in dictionary if not found then modify the word until word is found or no further modification possible其中,其中,wor
4、d是一个变量,其初始值就是当前词。是一个变量,其初始值就是当前词。 例例8.1 用上述算法分析用上述算法分析catches。 解:其分析过程如下:解:其分析过程如下: catches 词典中查不到词典中查不到 catche 修改修改1:去掉:去掉s catch 修改修改2:去掉:去掉e 可以看出,在修改可以看出,在修改2时就查到了时就查到了catch。当然,这只是一个很简单的例子,。当然,这只是一个很简单的例子,完整的词法分析还应该包括复合词的切分等。完整的词法分析还应该包括复合词的切分等。 8.2 词法词法(cf)分析分析第2页/共17页第三页,共17页。48.3 句法分析句法分析 句法分析
5、是对句子和短语的结构进行分析,其最大单位是一个句子。分析的目句法分析是对句子和短语的结构进行分析,其最大单位是一个句子。分析的目的是要找出词、短语等的相互关系,以及他们在句子中的作用等,并用一种层次的是要找出词、短语等的相互关系,以及他们在句子中的作用等,并用一种层次结构加以结构加以(jiy)表达。这种层次结构可以是句子的成分关系、,也可以是语法功表达。这种层次结构可以是句子的成分关系、,也可以是语法功能关系。能关系。8.3.1 句法句法(jf)规则的表示方法规则的表示方法8.3.2 自顶向下与自底向上分析自顶向下与自底向上分析第3页/共17页第四页,共17页。58.3.1 句法句法(jf)规
6、则的表示方法规则的表示方法句子结构的表示句子结构的表示 一个句子是由各种不同的句子成分组成的。这些成分可以是单词、词组或从句一个句子是由各种不同的句子成分组成的。这些成分可以是单词、词组或从句。句子成分还可以按其作用分为主语、谓语、宾语、宾语补语、定语、状语、表。句子成分还可以按其作用分为主语、谓语、宾语、宾语补语、定语、状语、表语等。这种关系可用一棵树来表示,如对句子:语等。这种关系可用一棵树来表示,如对句子: He wrote a book可用图可用图8.2所示的树形结构来表示所示的树形结构来表示 一个句子又是由若干个词类构成一个句子又是由若干个词类构成(guchng)的,如名词、动词、代
7、词、形容词等的,如名词、动词、代词、形容词等。若从句子的词类来考虑,一个句子也可用一棵树来表示,这种树称为句子的分。若从句子的词类来考虑,一个句子也可用一棵树来表示,这种树称为句子的分析树,如图析树,如图8.3所示。所示。句子句子主语主语谓语谓语动词动词宾语宾语Hewroteabook句子句子代词代词动词短语动词短语动词动词名词短语名词短语Hewroteabook第4页/共17页第五页,共17页。6 上下文无关文法上下文无关文法(Context-free Grammars)是乔姆斯基提出的一种对自然语言语是乔姆斯基提出的一种对自然语言语法知识进行形式化描述的方法法知识进行形式化描述的方法(fn
8、gf)。在这种文法中,语法知识是用重写规则表。在这种文法中,语法知识是用重写规则表示的。作为例子,下面给出了一个英语的很小的子集(图示的。作为例子,下面给出了一个英语的很小的子集(图8.4)。)。 语句语句 句子句子 终标符终标符 句子句子 名词短语名词短语 动词短语动词短语 动词短语动词短语 动词动词 名词短语名词短语 名词短语名词短语 冠词冠词 名词名词 名词短语名词短语 专用名词专用名词 冠词冠词 the 名词名词 professor 动词动词 wrote 名词名词 book 动词动词 trains 专用名词专用名词 Jack 终标符终标符 . . 这就是一个英语子集的上下文无关文法这就
9、是一个英语子集的上下文无关文法 在该文法中,在该文法中,“语句语句”是一个特殊的非终极符,称为起始符。是一个特殊的非终极符,称为起始符。8.3.1 句法句法(jf)规则的表示方规则的表示方法法上下文无关文法上下文无关文法(1/2)第5页/共17页第六页,共17页。78.3.1 句法规则的表示方法句法规则的表示方法上下文无关上下文无关(wgun)文法文法(2/2) 例例8.2 利用利用(lyng)上述上下文无关文法,给出如下语句的分析树。上述上下文无关文法,给出如下语句的分析树。 The professor trains Jack.语句语句(yj)句子句子终标符终标符动词短语动词短语名词短语名词
10、短语Theprofessor.trains冠词冠词名词名词动词动词专用名词专用名词名词短语名词短语Jack解:解:如图如图8.5第6页/共17页第七页,共17页。88.3.1 句法规则句法规则(guz)的表示方的表示方法法变换文法变换文法(1/2) 上下文无关文法反映的仅是一个句子本身的层次结构上下文无关文法反映的仅是一个句子本身的层次结构(jigu)和生成过程,和生成过程,而自然语言是上下文有关的。为此,乔姆斯基又提出了变换文法而自然语言是上下文有关的。为此,乔姆斯基又提出了变换文法(Transformational Grammar)。该文法认为,句子的结构。该文法认为,句子的结构(jigu
11、)有深层和表有深层和表层两个层次。例如:层两个层次。例如: She read me a story 和和 She read a story to me的表层结构的表层结构(jigu)不一样,但它们的深层结构不一样,但它们的深层结构(jigu)则是一样的。再如,则是一样的。再如,主动句和被动句也只是表层结构主动句和被动句也只是表层结构(jigu)不同,其深层结构不同,其深层结构(jigu)则是相同则是相同的。的。 在变换文法中,句子深层结构在变换文法中,句子深层结构(jigu)和表层结构和表层结构(jigu)之间的变换是通之间的变换是通过变换规则实现的,如图过变换规则实现的,如图8.6给出了一条
12、把主动句变换为被动句的变换规则。给出了一条把主动句变换为被动句的变换规则。 句子句子(j zi)介词短语介词短语1句子句子名词短语名词短语1动词短语动词短语动词动词名词短语名词短语2名词短语名词短语2动词被动语态动词被动语态动词动词介词介词动词的过去分词动词的过去分词名词短语名词短语1句子句子介词短语介词短语句子句子名词短语名词短语1动词短语动词短语动词动词名词短语名词短语2名词短语名词短语2动词被动语态动词被动语态第7页/共17页第八页,共17页。98.3.1 句法规则的表示方法句法规则的表示方法(fngf)变换文法变换文法(2/2)助动词助动词介词介词(jic)动词动词(dngc)的过去分
13、词的过去分词名词短语名词短语1句子句子介词短语介词短语句子句子名词短语名词短语1动词短语动词短语动词动词名词短语名词短语2名词短语名词短语2动词被动语态动词被动语态冠词冠词名词名词专用名词专用名词上下文无上下文无关文法关文法变换规则变换规则冠词冠词名词名词TheprofessorJacktrainsJack专用名词专用名词istrainedbytheprofessorprofessor 例例8.3 利用变换文法,将前述主动句变为被动句。利用变换文法,将前述主动句变为被动句。 解:解:其变换过程是:先从非终极符其变换过程是:先从非终极符“句子句子”开始产生一个主动句:开始产生一个主动句: The
14、 professor trains Jack然后再应用图然后再应用图8.6所示的变换规则把它变为被动句所示的变换规则把它变为被动句(图图8.6) : Jack is trained by the professor动词动词冠词冠词名词名词Theprofessor名词短语名词短语2专用名词专用名词trains动词动词冠词冠词名词名词TheprofessorJack名词短语名词短语2专用名词专用名词trains动词动词冠词冠词名词名词Theprofessor第8页/共17页第九页,共17页。108.3.2 自顶向下与自底向上分析自顶向下与自底向上分析(fnx)自顶向下分析自顶向下分析(fnx)法法
15、 自顶向下分析,是指从起始符开始应用文法规则,一层一层地向下产生分析树的各个分支,直至生成与输入语句相匹配的完整的句子结构为止自顶向下分析,是指从起始符开始应用文法规则,一层一层地向下产生分析树的各个分支,直至生成与输入语句相匹配的完整的句子结构为止(wizh)。 例如,图例如,图8-4所示的上下文无关文法,采用自顶向下分析方法对语句:所示的上下文无关文法,采用自顶向下分析方法对语句: The professor trains Jack .进行分析的过程是:进行分析的过程是: 首先从起始符首先从起始符“语句语句”开始,正向运用规则:开始,正向运用规则: 语句语句 句子句子 终标符终标符把分析树
16、的根节点把分析树的根节点“语句语句”替换为它的两个子节点替换为它的两个子节点“句子句子”和和“终标符终标符”。 然后再对新生成的节点然后再对新生成的节点“句子句子”使用规则:使用规则: 句子句子 名词短语名词短语 动词短语动词短语将其替换为两个子节点将其替换为两个子节点“名词短语名词短语”与与“动词短语动词短语”。 对于对于“名词短语名词短语”,有两条规则可用,若按规则的排列顺序,则选用,有两条规则可用,若按规则的排列顺序,则选用 名词短语名词短语 冠词冠词 名词名词将将“名词短语名词短语”被替换为被替换为“冠词冠词”和和“名词名词”,生成两个新节点。对,生成两个新节点。对“冠词冠词”使用规则
17、:使用规则: 冠词冠词 The对名词使用规则:对名词使用规则: 名词名词 professor 以此进行以此进行,得到如图,得到如图8.8所示的自顶向下的分析树(略)。所示的自顶向下的分析树(略)。第9页/共17页第十页,共17页。118.3.2 自顶向下与自底向上分析自顶向下与自底向上分析(fnx)自底向上分析自底向上分析(fnx)法法 自底向上分析,是以输入语句的单词为基础,首先按重写规则的箭头指向,反自底向上分析,是以输入语句的单词为基础,首先按重写规则的箭头指向,反方向使用那些最具体的重写规则,把单词归并成较大的结构成分,如短语等,然方向使用那些最具体的重写规则,把单词归并成较大的结构成
18、分,如短语等,然后对这些成分继续逆向使用规则,直到分析树的根节点为止。后对这些成分继续逆向使用规则,直到分析树的根节点为止。 仍以语句仍以语句 The professor trains Jack为例,逆向使用图为例,逆向使用图8.4中的那些具体规则后,可得到图中的那些具体规则后,可得到图8.9所示的所示的 部分部分(b fen)分析分析树。树。 继续逆向使用规则,一步步归并,直到根节点继续逆向使用规则,一步步归并,直到根节点“语句语句”为止,最后即可生成如图为止,最后即可生成如图8.5所示的完整的分析树。所示的完整的分析树。 自顶向下分析方法与自底向上分析方法虽然思路清晰,但分析效率不高。为了
19、自顶向下分析方法与自底向上分析方法虽然思路清晰,但分析效率不高。为了提高分析效率,可采用自顶向下与自底向上相结合的分析方法。提高分析效率,可采用自顶向下与自底向上相结合的分析方法。Jack名词名词(mng c)短语短语专用名词专用名词trains动词动词冠词冠词名词名词Theprofessor终标符终标符.第10页/共17页第十一页,共17页。128.4 句义分析句义分析(fnx) 语义分析就是要识别一句话所表达的实际意义。即弄清楚语义分析就是要识别一句话所表达的实际意义。即弄清楚“干什么了干什么了”,“谁干的谁干的”,“这个行这个行为的原因和结果为的原因和结果(ji gu)是什么是什么”以及
20、以及“这个行为发生的时间、地点及其所用的工具或方法这个行为发生的时间、地点及其所用的工具或方法”等等。 原因是语法分析,仅是在句法范围内根据词性信息来分析自然语言中句子的文法结构的。原因是语法分析,仅是在句法范围内根据词性信息来分析自然语言中句子的文法结构的。由于它没有考虑句子本身的含义,也就不能排除像由于它没有考虑句子本身的含义,也就不能排除像 The paper received the professor这种在语法结构上正确,但实际意义上错误的句子。这种在语法结构上正确,但实际意义上错误的句子。 目前,用于语义分析的技术比较多,本节仅简单介绍语义文法和格文法。目前,用于语义分析的技术比较
21、多,本节仅简单介绍语义文法和格文法。 8.4.1 语义文法语义文法(wnf) 8.4.2 格文法格文法(wnf)第11页/共17页第十二页,共17页。138.4.1 语义文法语义文法(wnf) 语义文法是在上下文无关文法的基础上,将语义文法是在上下文无关文法的基础上,将“名词短语名词短语”、“动词短语动词短语”、“名词名词”等这些等这些不含有语义信息的纯语法类别,用所讨论领域的专门信息,像不含有语义信息的纯语法类别,用所讨论领域的专门信息,像“山山”、“水水”、“动物动物”、等、等这些具有很强语义约束的语义类别来代替。利用语义文法进行语义分析,就可以排除像这些具有很强语义约束的语义类别来代替。
22、利用语义文法进行语义分析,就可以排除像“论文收到教授论文收到教授”这类无意义的句子。这类无意义的句子。 例如,下面是一个关于舰船信息的语义文法的例子:例如,下面是一个关于舰船信息的语义文法的例子: S PRESENT the ATTRIBUTE of SHIP PRESENT what is | can you tell me ATTRIBUTE length | class SHIP the SHIPNAME | CLASSNAME class ship SHIPNAME Huanghe | Changjiang CLASSNAME carrier | submarine 在上述重写规则中,
23、用大写英文字母的单词表示非终极符,小写英文字母表示终极符在上述重写规则中,用大写英文字母的单词表示非终极符,小写英文字母表示终极符,竖线表示,竖线表示“或或”的意思。的意思。 利用上述语义文法进行语义分析,可以从语义上识别利用上述语义文法进行语义分析,可以从语义上识别(shbi)以下的输入:以下的输入: what is the length of the Huanghe? Can you tell me the class of the Changjiang?第12页/共17页第十三页,共17页。148.4.2 格文法格文法(wnf)格和格框架格和格框架(1/3) 格文法是以句子的中心动词为主
24、导,并用格来表示格文法是以句子的中心动词为主导,并用格来表示(biosh)其它成分与此其它成分与此中心动词之间的语义关系的一种描述方法。中心动词之间的语义关系的一种描述方法。 “格格”这个词来源于传统语法,但它与传统语法中的格有着本质不同。在传这个词来源于传统语法,但它与传统语法中的格有着本质不同。在传统语法中,格仅表示统语法中,格仅表示(biosh)一个词或短语再句子中的功能,如主格、宾格一个词或短语再句子中的功能,如主格、宾格、等,反映的也只是词尾的变化规则,故称为表层格。在格文法中,格表示、等,反映的也只是词尾的变化规则,故称为表层格。在格文法中,格表示(biosh)的是语义方面的关系,
25、反映的是句子中所包含的思想、观念等,故的是语义方面的关系,反映的是句子中所包含的思想、观念等,故称为深层格。称为深层格。 “格格”是一个一般的概念,相对于中心动词的不同语义关系,格可以分为许是一个一般的概念,相对于中心动词的不同语义关系,格可以分为许多种。例如,在句子多种。例如,在句子 John gave the book to Sally中,相对于中心动词中,相对于中心动词gave, John是这个行为的发出者,称为动作格;是这个行为的发出者,称为动作格; the book是行为作用的对象,称为受动格;是行为作用的对象,称为受动格; Sally是行为作用对象所到达的目标,称为目标格。是行为作
26、用对象所到达的目标,称为目标格。 第13页/共17页第十四页,共17页。158.4.2 格文法格文法(wnf)格和格框架格和格框架(2/3) 一套正确的深层格究竟应包括多少个格,以及这些格的明确含义是什么,目一套正确的深层格究竟应包括多少个格,以及这些格的明确含义是什么,目前尚无定论。前尚无定论。 下面给出一个描述行为的句子,它所涉及的深层格主要有:下面给出一个描述行为的句子,它所涉及的深层格主要有: Agent(施事),(施事), 动作主格,指行为的施动者;动作主格,指行为的施动者; Object(受事),受动者格,指行为作用的对象;(受事),受动者格,指行为作用的对象; Co-Agent(共施事),帮助者格,指行为施动者的合作者;(共施事),帮助者格,指行为施动者的合作者; Instrument(工具),工具格,指施事者或共施事者实现行为中所使用的对(工具),工具格,指施事者或共施事者
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 洪水风险评估与应急管理机制-全面剖析
- 创业教育体系优化-全面剖析
- 足球运动对老年人身体功能的改善论文
- 2025年建筑施工安全知识竞赛试卷(2025版)
- 商务英语中的语言自然语言处理研究论文
- 2025-2030全球及中国汽车多轮驱动装置行业市场现状供需分析及市场深度研究发展前景及规划可行性分析研究报告
- 2025-2030全球及中国无线局域网控制器行业市场现状供需分析及市场深度研究发展前景及规划可行性分析研究报告
- 2025-2030全球及中国射频加热干燥机行业市场现状供需分析及市场深度研究发展前景及规划可行性分析研究报告
- 2025-2030全球及中国企业会计软件行业市场现状供需分析及市场深度研究发展前景及规划可行性分析研究报告
- 2025-2030全球及中国专门威胁分析和保护(STAP)行业市场现状供需分析及市场深度研究发展前景及规划可行性分析研究报告
- 广州2025年广东广州海珠区新港街道第一批雇员招聘5人笔试历年参考题库附带答案详解
- 受限空间安全培训
- 2025届江苏省苏锡常镇四市高三下学期教学情况调(一)(一模)英语+答案
- 专题13 热学计算题(解析版)-2025年高考物理二轮热点题型归纳与变式演练(新高考用)
- (二模)苏北七市2025届高三第二次调研测试语文试卷(含答案)
- 商业地产租赁及运营管理手册
- 2025年(广东省协会 )房屋安全检测鉴定技术培训-机考历年真题考前冲刺题
- 上海海洋大学《微生物学》2023-2024学年第二学期期末试卷
- 儿童发展问题的咨询与辅导-案例1-5-国开-参考资料
- 安全生产法律法规汇编(2025版)
- 基于语音信号去噪处理的FIR滤波器设计
评论
0/150
提交评论