电力行业客户管理技术-文本分类技术和决策树的投诉解决方法_第1页
电力行业客户管理技术-文本分类技术和决策树的投诉解决方法_第2页
电力行业客户管理技术-文本分类技术和决策树的投诉解决方法_第3页
电力行业客户管理技术-文本分类技术和决策树的投诉解决方法_第4页
电力行业客户管理技术-文本分类技术和决策树的投诉解决方法_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

[全]电力行业客户管理技术-文本分类技术和决策树的投诉解决方法随着电力体制改革的深入推进和社会经济的快速发展,企业和居民对电力服务的要求越来越高,电力市场的营销和服务竞争面临新格局,迫切的需要改变传统的工作模式,树立市场化服务意识,适应市场格局变化,而提升服务水平、减少客户投诉、赢得客户信任,是当前供电企业迫切解决的问题。95598客服系统作为直接面向客户,与客户沟通交流的渠道,而存储话务数据的数据库管理系统拥有海量的客户数据,该部分客户数据主要分为结构化数据和非结构化数据两部分。目前,针对从结构化数据提取的客户诉求信息的利用程度远远不够,同时对工单中来电内容的非结构化文本数据也没有经过系统的分析,难以根据客户的历史来电信息对客户的未来投诉实现事前预测。问题拆分从数据库管理系统获取用户信息,包括用户档案信息和客服工单信息,并促使用户历史事件发生确定预判周期及用于预判的特征数据集;确定预判群体范围;本发明可以在用户来电时,准确地判别用户的投诉窗口倾向程度,为设计策略库和手术不同的安抚和引导策略提供参考,利用从结构化数据提取的客户诉求信息,同时对工单中来电的非结构化文本数据进行系统分析,根据客户的历史来电信息对客户的未来投诉实现事前预测,可以减少客户投诉问题,企业减少的良好社会形象。问题解决1.一种基于文本分类技术和决策树的投诉倾向判断方法,其特征在于,包括下述步骤:步骤1,从数据库管理系统获取用户信息,包括用户档案信息和客服工单信息,并据此建立用户历史来电情况表;步骤1.1,确定获取用户信息的时间窗;步骤1.2,确定预判周期及用于预判的特征数据集;步骤1.3,确定预判群体范围;步骤1.4,确定所需的原数据字段,所述原数据字段包括用户编号、业务类别代码、工单来源代码、来电内容、接通时间和挂机时间;步骤2,将用户历史来电情况表输入分析计算平台并进行数据预处理,得到模型数据集;步骤2.1,根据原数据字段构造所需变量;步骤2.2,数据质量检查;步骤2.3,数据清洗,所述数据清洗包括异常值处理和缺失值处理,并输出数据质量良好的历史来电情况表;步骤2.4,训练集计算;步骤2.5,数据变换,将连续型变量转换为离散型数据;步骤3,制定越级分类规则对全量训练集的用户进行投诉倾向判断;所述越级分类规则为:其中TYPE为用户类别,为1时表示越级投诉群体,为0时表示非越级投诉群体;步骤4,基于历史来电数据,根据越级分类规则对用户进行类别区分,将用户分为越级投诉倾向群体和非越级投诉倾向群体两大类,其中,越级投诉倾向群体为12398、12345历史来电行为客户群体;非越级投诉群体为历史来电行为特征未通过12398和12345来电的群体;步骤5,针对所述越级投诉倾向群体,在下一个预判周期内的类别标记为“投诉高倾向”,同时得到非越级投诉数据集;步骤5.1,根据客服工单信息表中工单来源代码,判断用户来电历史途径是否为12398或12345;SUM(CASEWHENGDLYDM='06'THEN1ELSE0END)SUM(CASEWHENGDLYDMIN('07','08','13')THEN1ELSE0END)其中“GDLYDM”表示“工单来源代码”,“06”表示12398来电;“07”、“08”、“13”均表示12345来电;步骤6,制定文本分类规则对所述步骤5中获得的非越级投诉数据集进行投诉倾向判断;步骤7,运用文本分类进行识别、匹配,识别来电内容包含特殊字眼的用户群体;步骤7.1,剔除非文字信息;步骤7.2,剔除停用词;步骤7.3,文本切分词;步骤7.4,构建情感词典;步骤7.5,词匹配,根据构建的情感词典,使用词语文本匹配的方法找出来电内容包含特殊字眼的客户群体;步骤8,针对来电内容包含特殊字眼群体,则该类群体在下一个预判周期内的类别标记为“投诉高倾向”,同时得到非越级投诉、历史工单无特殊字眼的数据集;步骤9,根据所述步骤8中获得的非越级投诉、历史工单无特殊字眼的数据集,制定决策树分类规则,对非越级投诉、历史工单无特殊字眼的用户进行投诉倾向判断;步骤10,进行特征选择,在特征选择后的训练集上执行决策树算法,确定投诉倾向预测模型,输出投诉风险标签;步骤10.1,所述特征选择可分为业务类别特征、电话拨打行为特征、回访特征和回复特征四大维度;所述业务类别特征,是指用户历史不同业务办理类型的来电情况,包括故障报修次数、咨询次数、举报次数、建议次数、意见次数和投诉次数六个类型;所述电话拨打行为特征,是指用户历史来电的拨打行为,为来电拨打时长;所述回访特征,是指用户来电后工单处理情况回访结果,包括回访不满意次数和是否存在回访投诉两个类型;所述回复特征,是指用户对于工单处理的回复结果,为客户回复满意度;客户回复满意度能够反应客户本次电话事件的问题解决程度,直接关系到客户投诉倾向的程度,客户回复满意度包括回复不满意次数、回复满意次数和回复非常满意次数;步骤10.2,构造决策树,对各特征值的取值范围作定义;利用ID3算法构造决策树,选择公式进行给定样本所需的期望信息计算;其中,I为给定样本的期望值,S是s个数据样本的集合,即S指的是一个数据集合,其中包含s个数据样本,假定类标号属性具有m个不同值,定义m个不同类Ci(i=1,2,3,…,m),设Si是类Ci的样本数,Pi是任意样本属于Ci的概率,用Si,s来估计;根据以下公式计算熵值:其中,E(A)为各个特征的熵值,Sij是子集Sj中类Ci的样本数;最后计算各个特征的信息增益,由期望信息和熵值可以得到相应的信息增益值;对于在分支上将获得的信息增益可以由以下公式得到:Gain(A)=I(S1,S2,…

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论