网购情感客服机器人研究_第1页
网购情感客服机器人研究_第2页
网购情感客服机器人研究_第3页
网购情感客服机器人研究_第4页
网购情感客服机器人研究_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、网购情感客服机器人研究引言随着近年来即时通信和电子商务的蓬勃发展,网上购物被越来越多 人接受并显示出巨大的市场需求,而网店的人工客服却承受着越来越大 的工作量和压力。由于人工智能、深度学习1、自然语言处理在近几年 取得的突破性进展,用机器人逐步取代人工客服的优势逐渐变得明显且 可行起来。目前己有一些客服机器人实例,但主要是根据对话内容的关 键字与知识库中的知识匹配实现问题的回复,极少涉及对客户情感的研 究,但服务态度对客服来说往往是关键的一项。本文提出的情感机器人就是在这种背景下应运而生的,它具有较好 的扩充性及学习能力,能通过各种渠道如与用户的交流对话、专业知识 导入、网络知识挖掘、知识库共

2、享等方式自主学习,实现知识框架自适 应调整,从根本上改变商家低效耗时的人工培训成本问题,实现常用问 题的自动高效回复,同时引入情感对话模型,尝试解决人机对话中的语 境问题,为客户提供一个高效、人性化的客服环境。1、系统体系结构系统基于aiml框架,机器人的知识库由aiml类文件构成,为了 满足中文对话的需求,在机器人的解析器中引入中文分词2模块,并在 由aiml框架和lucene分词构成的基本框架上尝试了以情感词典和关 键情感统计分析为核心技术的情感对话模型。本文的系统流程图(如图重要模块分析:(1) 中文分词模块:可以在流程图中看到系统有三处需要用到中 文分词,分别是将知识文件分词后以词语为

3、节点构建知识库的内存知识 树、对用户输入语句进行分词以及将预输出模板做分词处理后交给情感 统计分析模块。(2) aiml知识文件:aiml是扩展自xml的人工智能标记语言, 知识使用各类标签进行标记存储,重要且常用的标签包括:<template>/<pattern>/<topic>/<that>/<srai>/<set>/<get>/<random>/< starxconditi on>/vthin k>?(3) aiml内存知识树:内存知识树是知识文件进行分词后以词语 作为节点进

4、行存储的知识集合。逻辑结构为树,树的每个子节点代表一 个中文单词或一个通配符,组织时根据单词在模式中出现的位置插入到 树的节点中以最高效地利用内存空间,树的叶子节点包含一个template 属性,template是对模式的冋答。内存知识树由知识推理引擎负责构建 并在知识引擎匹配模板时作为输入。(4)aiml推理引擎:推理引擎的工作主要有两部分,一部分是构 建内存知识树,另一部分就是将查询推理树与内存知识树的信息进行匹 配,找到相应的模板预输出。一个完整的处理流程大致包含四个步骤, 分別是初始化,问句规范化处理,问句查询推理以及模板处理3。(5)情感词典:情感词典存储词汇的情感化信息,主要由人工

5、对 初始收集的语料进行情感信息标注并录入存储系统,形成情感词典。情 感词典中的每一词语主要包含三方面信息:情感分类信息、情感强度信 息、同义词汇信息。它是情感统计分析处理逻辑和同义词处理逻辑的数 据来源。(6)情感统计分析:情感统计分析是情感对话的核心模块,以情 感词典为支撑,负责对接收的词汇进行统计,将出现频率最高的情感分 类词汇作为上下文语境存储。同时它也对预输出模板做同样的统计工 作,并将情感分类信息输出给语境匹配判定逻辑。(7)语境匹配判定逻辑:它负责判定预输出模板中的情感是否与 上下文语境相匹配,若匹配,则直接输出。否则交给同义词处理模块进 行后续处理。(8)同义词处理:对于语境和预

6、输出模板情感分类不匹配的情况, 同义词处理模块将抽取情感词典中的同义信息,将模板中与语境不符的 词汇替换为相符的同义词汇,即情感变化,并将最终的结果输出给用户。2、aiml框架aiml是机器人的核心。它是一个扩展自xml的人工智能标记语 言,在处理对话过程中不同于传统的语义规则构建与分析,而是简单的 匹配上下文,这种无需事先确定专业领域语义规则的模式为知识库的构 建提供了非常大的自由空间。由于客服机器人的应用领域非常广,普适 性强,知识库的构建往往需要大量非专业人士的配合,aiml符合人类 思维表达模式的特性使其在自然语言处理领域有特殊的优势,从某种程 度上看,它更接近于人类语言理解的本质。此

7、客服机器人知识库的整体逻辑框架分为两大类:一类为系统预先 定义的机器人常用语句对话类文件,或称为模板;第二类为由用户自行 定义或导入的专业领域类文件。基于对网购交际语篇的语类结构研究4,将其中得到的语类结构作 为模板构建基础: (g)(.s7)aj(sl).swa5c,a5alm k'(a i)公式一逼类給构模版其中:g=greeing, si=sale initiation, sr=sale request, sc=sale complianee, se=sale enquiry, s=sale, p=purchase, pc=purchase closure, f=finish,

8、“()”表示可选择性,表示可调换位置'”表示 可调换位置的范围;“”表示可重复的程度相同c我们将aiml模板中 的各基本类文件定义为上述的各语类,由此进行扩充。aiml知识库的主要来源途径主要有:初始专业知识分类导入,同 行业知识库云共享,对话经验学习(扩展aiml的targeting技术),网 络知识挖掘。为提高targeting技术的灵活性,提供gui界面供系统管理员操作, 系统将提供所有可能新增的知识,由管理员确定是否加入到内存知识树 中。targeting技术为aiml自主学习以及自适应调整知识框架上提供 了技术保障,使机器人能在和用户的对话交流过程中不断累积知识,减 轻了管理

9、员对知识库更新管理的负担。3、中文分词中文分词器作用于aiml解析器的两个阶段:第一阶段在aiml搭 建graphmaster知识树之前将读出的知识模式(即aiml类文件)进行 分词处理,将分出的词语作为节点进行存储,并交给解析器的下一模块, 最终形成以中文词语为最小单位的内存知识树。第二阶段在接收用户问 句并做标准化处理之后,分词器将对问句进行分词,构建出对应的查询 推理树后再到graphmaster中进行问句匹配。得到匹配的输出。中文分词算法目前的解决思路大致可以归为三大类:基于字符串匹 配的词典分词算法、理解分词算法、统计分词算法5。由于客服机器人 处理的是网络聊天口语信息,其特点是:灵

10、活多变,未登录词的更新频 率高,不合法语义、语法使用频繁。综合考虑算法的技术成熟度和适用 范围,本文使用以统计分词为核心的分词算法,并应用隐马尔科夫模型。 在hmm (隐马尔科夫)分词方法中,状态序列为词性、词类、语义角 色等,观察序列为输入的词串6。分词器的具体实现继承自lucene开源全文检索工具包中的smartchinese analyzer分词器7。此分词器源于中科院的ictclas中文分 词系统,并且采用隐马尔科夫模型,在处理对话语料时有较好的分词效 果。但由于分词器将要作用的领域不仅仅包含通用词汇,多数情况下, 需要处理大量的专业词汇,且词汇库需要经常更新。所以本文在实现客 服机器

11、人的分词器中,添加了扩展词汇库的类,使用户能自定义词汇库, 并对词汇库进行增删改查等操作。4、情感对话当前研发的客服机器人以回答常见问题为多,很少能与用户做情感 层面上的交流,而服务态度在交流过程中是至关重要的一个因素。鉴于 此,本文构建了一个情感分析模型,模型基于情感词典,使用关键词统 计的方法对用户输入的语句进行情感分析,在对当前语境做出判断后, 将预输出语句做情感化处理,匹配客户情感,以达到提高机器人智能化 的效果。4.1情感词典的构建情感词典是情感词汇高度组织的集合。构建一个合理高效的情感词 典,是后续进行情感分析的重要基石。其中词汇的描绘与存储是关键技 术。本文借鉴词汇本体构建技术8

12、对存储的情感词汇进行描述。通过一 个三元组进行描述:lexicon=(b, r, e)公式二情感词汇本体结构其中b表示词汇的基本信息,r代表词汇间的同义关系,e代表词 汇的情感信息。情感信息是词汇描述中最关键的部分,其构建基于情感 认知中的维度论,本文将情感信息通过情感分类、强度和极性三个维度 进行描述。其中,情感分类基于中国传统的七情划分,用数字标号表示。 强度分为九级,表示包含该情感的强度大小。极性取值包括褒义、贬义、 中性三类。语料的来源以网购中客服与商家对话为主体,但为了训练语料库对 情感信息的理解能力,辅以各类包含丰富情感的文本载体如诗歌散文类 文本。语料信息的处理可分为两步。第一步

13、对原始语料进行自动筛选,主 要是从各词典中根据词汇释义进行自动归类。第二步人工对初加工语料 进行情感信息标注,并录入最终存储系统。4.2情感分析在情感词典的基础上,机器人每次接收到用户输入的对话语句并做 分词处理后,都首先将结果交给情感分析模块,对其中包含的各类词汇 做情感统计分析,计算得出出现频率最高的一类情感,将此作为上下文 语境。aiml解析器在得到匹配模板后,并不直接输出,情感分析模块 将对模板做同样的情感分析计算,检查预输岀的模板情感是否与上下文 语境相符,若相符将直接输出,否则根据情感字典中的同义信息,把模 板中的情感词汇替换为情感分类与上下文语境相匹配的同义词汇,再输 出给用户。

14、5、总结本文是在基于aiml、中文分词、情感对话模型的框架上搭建的情 感客服机器人,其屮由aiml和屮文分词构建的基础框架模型已经较为 成熟,有很多成功应用的实例,如招生咨询机器人、图书馆问答检索机 器人?。但总的来说,基于aiml的中文知识库建设还处在起步阶段, 仅有少数领域的知识库,而且知识库之间难以共享与融合,本文构建的 情感客服机器人的知识库大部分由人工录入,效率偏低,这也是目前大 多数基于aiml的中文知识库构建普遍存在的问题。作者认为增强共享 是解决的一条途径,但更为关键的是找到aiml知识库搭建的普适性规 则或模式方能从根本解决知识库搭建的种种难题。另外,由于中文与英 文在语法、

15、语义上的巨大差别,aiml标签的扩展对屮文对话来说是有 重要意义的,若能从逻辑上证明aiml标签具有对自然语言表达的完备 性将在很大程度上促进知识库搭建朝着统一、高效的方向前进。情感对 话是本文为解决对话语境提出的模型,以情感词典为支撑,情感分析为 核心处理逻辑。其中的情感分析主要是检查输出模板是否与用户提供的 语境相匹配,对模板进行同义词替换以匹配上下文语境,但仅以同义词 替换作为匹配语境的解决方案是明显不足的,且容易岀现矛盾和语句不 连贯的现象。这些都值得我们做深一步的研究。参考文献:1 张思琦,张文兰,李宝国外近十年深度学习的研究现状与发展趋势基于引文分析及共词矩阵的知识图谱分析j 远程教育杂志,2016,35(2):64-72.2 丁洁基于lucene的中文分词系统设计与实现j自动化与仪器 仪表,2016(5):208-210.3 夏天,樊孝忠,刘林al

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论