汉语词汇情态语义分析与标注-精选课件_第1页
汉语词汇情态语义分析与标注-精选课件_第2页
汉语词汇情态语义分析与标注-精选课件_第3页
汉语词汇情态语义分析与标注-精选课件_第4页
汉语词汇情态语义分析与标注-精选课件_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、汉语词汇情态语义的分析与标注The Analysis and Annotation of Modality Semantics for Chinese Words张申 贾珈 王晓慧 蔡莲红清华大学计算机系人机语音交互实验室大纲引言情态语义与言语表达情态语义描述方法语义特征分析维度评价词汇情态语义分析与标注情态词汇语料库词汇情态语义聚类小结与展望人机语音交互中的情态表达1情态语义与言语表达什么是情态?雷雨剧本(节选)情态描述词姑甲(和蔼地)请进来吧。和蔼老人(关心地)她现在还好么?关心姑甲(怜悯地)那还是那样。怜悯老人(沉静地)我想也是不容易治的。沉静姑甲

2、(矜怜地)您先坐一坐,暖和一下,再看她吧。矜怜言语交流语义表达+情态表达情态 (Modality)“说话人对句子所表达命题(proposition)或命题所描写的情境(situation)的观点(opinion)或态度(attitude)”。(Lyons, 1977)“说话人对句子表示的命题的真值或事件的现实性状态表达的主观态度 ”。 (彭利贞, 2019)“说话人的主观态度与观点在语法上的表现” (Palmer, 1986) “句子的语义的限制成分 ”(Quirk, 1985) “语言表达的一种语义类型” (Bybee, 2019) “指句子的时态、语态等,代表与说话者有关的主观信息(包括信

3、念、观点、情绪、态度、观察角度、意图等) ” (尹一瓴, 2019)情态与语义情态辅助语义表达情态是一个语义范畴命题 + 情态 = 语义 (Fillmore,1968)语义中蕴含的情态信息心理活动、态度意图、行为能愿、感知评价情态的表达方式语言表达:情态词汇、短语从句、句式句型、语气韵律非语言表达:语音语调、表情动作、身体姿态问题的提出智能人机口语对话准确理解用户的自然语言,给出正确的回答通过多模态手段表达言语的情态成分,从而贴切地传递语义信息关键问题如何描述语义中的情态成分?如何量化情态语义特征?如何实现情态语义的表达?2情态语义描述语义特征分析 (Componential Analysis

4、)语义特征 (semantic feature)本质:义位构成成分, 反映了人脑对义位的认知理解目的:通过分解义位,对语义进行理解和分类情态语义特征传统分类:感情色彩、语体风格情态子系统:情感、意志、评价 (俞永梅,2019)心理维度评价认知心理学情态是典型的认知机制关注于情态在言语沟通中的认知属性维度感知评价范畴观:独立的范畴类别维度观:基本维度和两极性情感计算:维度模型(P-A-D)情态语义的描述语义特征面向语义的聚合分类描述语义的共性和差异维度属性面向情态理解和表达描述情态的认知属性存在的问题相同的语义范畴可能包含不同的情态属性(褒贬、正负)不同的语义范畴可能包含相同的情态属性(确信、激

5、活)面向自然语言理解、人机口语对话等应用,如何对情态进行有效地描述、量化乃至建立计算模型?提出一种情态语义属性的维度描述方法,将情态语义特征转换为情态属性维度。在语义理解分析的基础上,挖掘情态的认知属性。情态语义维度开放的情态语义维度集合情绪感知态度意图认知判断行为能愿心理活动3汉语情态词汇标注及分析现有语义词典同义词词林现代汉语语义分类词典基于概念分类,建立自上而下的语义分类体系知网描述概念之间的关系,以及概念的属性之间的关系“情感分析用词语集” (正负情感/评价、主张、程度)北大CCL 现代汉语语义词典描述词语参与语言活动时表现出来的分布共性和分布差异基于“分类+属性描述”的方式建立语义分

6、类树存在的问题面向语义分类语义分类为主,属性描述为辅分类树语义网(语义空间?)语义特征有限侧重实体语义,较少关注情态语义多采用二元偶分对立,较少采用连续量化建立面向情态语义表达的情态词汇库,采用维度描述的方法建立情态语义空间,实现对情态语义的量化描述和计算表达。情态词汇语料库情态词汇选择心理形容词 + 心理动词 + 情态副词468个情态词语, 15个大类, 46个同义组双字词 96.8%,单字词 3.2%语料库义项释义 + 义项用例 + 同义组情态语义标注系统在线语义维度标注系统*多用户在多语义维度上的标注结果五点语义描述量表极端负性、典型负性、中性、典型正性、极端正性*系统演示: dict9

7、.org 或 /Demo/SemDict/标注系统词语义项释义义项用例标注维度已有标注结果均值标注量度及说明标注结果分析5名大学生,468个情态词汇,1,464人次标注,3.13人次/词维度标注频度统计愉悦度、激活度标注最为频繁标注区间统计词汇选择相对均衡,非极端语义词较多情态语义维度空间语义维度标注频度统计不同的语义子类对应了不同的维度子空间*表中数据为同义词组中采用该维度进行标注的词汇比例(30%)基于语义维度的词汇聚类实验目的语义维度能否作为情态语义的量化指标?语义维度能否反映词汇间的语义关联和差异?实验数据情态词汇语义向量:W =w1,w2,w7

8、t 距离度量:语义向量的余弦角度选取词汇数目最多7个语义子类,共计135个词语实验过程K-means聚类: K = 7 (多次实验,取平均性能居中的结果)聚类正确率:原始子类(Cj)在聚类类别(Ki)中所占的比例聚类混淆矩阵平均聚类正确率 74.1%与传统的同义组划分具有较好一致性聚类性能较好的子类悲伤、着急、欢乐存在混淆的子类安定 (愉悦、确信)畅快 (欢乐、痛快)判断 (奇怪、确信)4小结与展望面向人机语音交互的情态表达人机交互中的情态表达智能化:准确理解和表达语义信息人性化:言语动作自然生动语义脸像(Semantic Face)能够辅助说话人表达情态语义信息的脸像动作言语文本情态语义维度参数脸像动作参数“对语言的情态义研究很不够,对人们理解语义和语言翻译,特别是对人机对话来讲是一个障碍” (俞永梅, 2019)语义脸像生成虚拟说话人的情态表达标注文本“疲惫的一天,还要等40分钟的公车回家”愉悦度= -1激活度 = -1关注度 = -1小结面向说话人言语情态的表达,对汉语词汇情态语义进行分析

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论