




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
语义分析Python自然语言处理第七章CONTENT目录
01词义消歧02词义角色标注03深层语义推理课前回顾基于规则的词义消歧基于统计的词义消歧基于实例的词义消歧基于词典的词义消歧词义角色标注02格语法基于统计机器学习技术的语义角色标注词义角色标注定义:浅层语义分析技术,以句子为单位,分析句子的“谓词-论元”结构。其理论基础来源于Fillmore(1968)年提出的格语法,不对句子所包含的语义信息进行深入分析。任务:是以句子的谓词为中心,研究句子中各成分与谓词之间的关系,并且用语义角色来描述他们之间的关系。语义角色标注就是要针对句子中的(核心)谓词来确定其他论元以及其他论元的角色。格语法格语法(casegrammar)是美国语言学家查尔斯·菲尔墨(CharlesJ.Fillmore)于1960年代末对转换语法进行修正而提出的一种语法分析理论。
其继承了转换语法关于深层结构经过转换得到表层结构的基本假设,但在格语法中深层结构表现为中心动词与一组名词短语。这些名词短语与动词间存在语义关系,被称为“深层格”。格语法菲尔墨认为深层格与表层格不同:深层格是所有语言共有的,只是转换规则的不同导致了表层结构中表现的不同。但对语言中有多少格并没有定论,可根据需要来确定。菲尔墨建议使用九个格,分别为施事格、感受格、对象格、工具格、来源格、目的格、场所格、时间格、路径格。格语法例:例如使用格语法分析“Thestudentsolvedproblemswithacalculatorintheclassroomthismorning”(这个学生今天上午在教室用计算器解决问题)solve(解决)为中心动词thestudent(学生)为施事格(选用格)problems(问题)为受事格(必备格)withacalculator(计算器)为工具格(选用格)intheclassroom(教室)为场所格。(选用格)thismorning(上午)为时间格。(选用格)动词必须具有的格叫作必备格,可有可无的格叫作选用格。选用格可以提供更多的信息,没有选用格,也不会破坏句子的完整性。格语法格的中心是动词,动词可以通过格关系的基本式和扩展式来描述。基本式是必备格组成的框架及其所变换的句式。扩展式则是选用格及其格位的描述。例如,动词“打”的描述为:用手或者器具撞击物体,其意义格框架为:格框架=施事(任务)+受事(物体)他的必备格有两个:施事格和受事格。则其基本式、扩展式如下所示:词义角色标注02格语法基于统计机器学习技术的语义角色标注基于统计机器学习技术的语义角色标注基于统计机器学习技术的语义角色标注通常情况下可以划分为剪枝、识别、分类和后处理4个步骤。其中:剪枝:剔除大部分的不可能作为语义角色的标注单元,经过剪枝之后,可以在很大程度上减少待识别实例的数目,提高系统的运行效率。识别:对标注单元进行判断,如果实例为语义角色则保留该标注单元,可以减少进入分类判别的实例数目,加快处理的速度。分类:进一步区分单元是属于哪一类语义角色。后处理:根据语义角色之间的一些固有的约束进行后处理。固有约束一般是指一个谓语动词不能有重复的核心语义角色,而且语义角色也不能存在相互重叠或嵌套等情况。基于统计机器学习技术的语义角色标注在语义角色标注的4个步骤中,识别和分类两个步骤尤为重要。通常可以把角色标注看成分类问题。基于规则的方法来解决分类问题,需要构建规模比较庞大的知识库,随着知识库的扩大随之产生了各种矛盾和冲突的规则。机器学习的方法适用性较好。比如,Pradhan等人使用支持向量机进行语义角色标注、Carreras等人使用感知器方法进行语义标注,并且比支持向量机更快。另外AdaBoost算法、最大熵模型、决策树模型以及随机森林算法都先后用于语义角色标注。基于统计机器学习技术的语义角色标注影响语义角色标注系统性的主要因素是使用的特征,而不是机器学习的模型。所以,想要获得更好的性能,则需要更加精细的划分特征。目前,由Gildea等人使用的语言学特征被当作各个语义角色标注系统的基本特征使用,如下3点:1句法成分相关特征2谓词相关特征3谓语动词-句法成分关系特征基于统计机器学习技术的语义角色标注1.句法成分相关特征010203短语类型句法成分核心词句法成分核心词的词性基于统计机器学习技术的语义角色标注2.谓词相关特征01020304谓语动词原型语态子类框架谓语动词的词性基于统计机器学习技术的语义角色标注
3.谓语动词-句法成分关系特征(1)句法树中,从句法成分到谓语动词之间的句法路径。(2)句法成分和谓语动词之间的位置关系。在Gildea等人的语言学特征基础之上,人们又
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 嵌入式设备调试方法试题及答案
- 网络云计算技术测验题及答案
- 数据库开发中的协作工具与资源管理试题及答案
- 行政组织理论中的协同效应分析试题及答案
- 公路工程考试面临的知识更新挑战试题及答案
- 突破2025年软件测试工程师考试难度试题及答案
- 行政组织考试的系统化试题及答案
- 行政组织考试的备考指南试题及答案
- 专项公路工程复习试题及答案
- 整体把握的信息系统监理师考试试题及答案
- 中职英语1 基础模块 Unit 3 shopping
- 广东省广州三校2023-2024学年高二下学期期末考试+政治试卷(含答案)
- 《男性困境:他们内心的创伤、恐惧与愤怒》记录
- 胃癌晚期护理查房
- 药政与药品生产质量管理智慧树知到答案2024年青岛科技大学
- 《动量定理》参考课件 04
- 借名贷款协议书范文范本
- 人教版高中数学A版 必修第1册《第二章 一元二次函数、方程和不等式》大单元整体教学设计
- 职校招生宣传课件
- 固体料仓计算表格
- 台球室用工合同范本
评论
0/150
提交评论