中文网络客户评论可信度研究课件_第1页
中文网络客户评论可信度研究课件_第2页
中文网络客户评论可信度研究课件_第3页
中文网络客户评论可信度研究课件_第4页
中文网络客户评论可信度研究课件_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文网络客户评论可信度研究郝玫,杨晓媛北京科技大学东凌经济管理学院论文框架研究背景文献综述模型框架总结与反思第一部分研究背景

网络时代的到来,促使网上购物日益盛行,但与传统购物相比,网上购物的风险依然很大。

海量评论信息加剧辨识可靠信息的困难程度,阅读评论时,消费者往往面临两个问题:一是推测商品或服务的特点,二是识别评论者的诚信态度和意图。因此,快速地从大量客户评论中获取可信度高的评论是本研究的实际意义所在。

客户评论对消费者决策的制定起着至关重要的作用,不仅影响消费者对产品的选择,还在一定程度上影响其对网购平台的选择。论文思路影响评论可信的多种指标数据预调整和文本挖掘,对评论可信度影响指标进行量化计算结合模糊层次分析法构建可信度排序模型对纷繁复杂的评论信息进行重新排序获取高可信度评论帮助消费者做出更理性的购物决策为电商网络平台的评论管理提供全面有效的甄别和排序方法第二部分文献综述

(1)评论可信度的影响指标本文将评论可信度定义为电子商务平台上客户评论的真实可靠程度,能够为消费者提供准确有效的商品认知,辅助其理性决策。 Liu等认为对消费者购买决策有用的商品评论取决于三个指标——评论者的经验,评论的写作风格和评论的时效。 Mudambi等通过对亚马逊网站上1587条评论的实例研究发现,评论深度、评论极性和商品类型会对评论有用性产生影响。

李志宇将评论效用指标分为已量化指标和评论语义特征,其中已量化指标为评论长度、评论时效性、评论者信誉和评论得票数,评论语义特征体现为产品属性特征词和情感特征词。(2)评论挖掘技术 Popescu等将评论挖掘分解为4个子任务:产品特征识别、基于产品特征的评论观点识别、评论观点的极性及强度判断、基于评论强度进行观点排序。 Hu等使用关联挖掘技术从客户评论中挖掘产品特征,识别观点句,判断每个观点句是积极或消极,最后给出基于客户观点表达的产品特征汇总结果。第三部分模型框架客户评论可信度排序方法1.影响评论可信度的关键指标评论者等级评论时效性“有用性投票”评论长度产品属性特征词情感平衡性(3)“有用性投票”处理对有用性投票的处理,借鉴了国外相关研究中的方法。Zhang选取总投票数超过10的评论作为样本,通过比值法处理有用性投票数与总投票数之间的关系,以此衡量评论有用性。结合研究实际,为了保证算法的健壮性,将无有用性投票或总投票数低于5的评论的该指标值设为0,分配给获得较多投票数的评论更高权重,有用性指标值的计算公式为:(4)评论内容挖掘采用NLPIR汉语分词系统,通过中文分词、词性标注、关键词统计等功能对客户评论信息进行挖掘。①产品属性词库构建过程:1)从亚马逊网站中提取待研究产品的具体型号、品牌等基本信息,作为关键词在中关村在线平台上进行检索,找到同样的产品,查看其详细参数及客户评论;2)提取产品的详细参数信息,用NLPIR进行分词、词性标注,保留所有名词、名词性短语和动词,作为产品固有特征词集合,定义为F13)提取所有评论内容,导入分词系统,在分词和词性标注的基础上,系统自动统计词频并按照词频降序排序,词频较高的词作为候选词,得到客户评论中的产品特征词集合F2;4)合并两个集合得到产品属性特征词集合F=F1∪F2,删除与产品不相关或重复出现的词,构造出产品属性词库。②产品属性特征词匹配将评论内容导入分词系统,进行自动分词处理。对于每条评论,将分词结果逐词与产品属性词库中的特征词进行匹配,若匹配成功,则该评论的产品属性特征词个数增加1。统计匹配成功的词汇总数,作为评论的产品属性特征词指标值。③情感词典构建及特征词匹配以知网(HowNet)发布的“中文情感分析用词语集”为基础构造情感词典,包含正面词语4566个、负面词语4370个。将分词后的评论逐词与正负情感词库进行匹配,统计匹配成功的正面情感词数和负面情感词数,二者的比值作为衡量评论正负情感平衡性的指标,如公式所示:实际应用中,若Balance>1,则采用Balance的倒数(1/Balance)表示情感平衡性。Balance的值越接近1,说明评论内容的正负情感越平衡。(5)评论长度从评论长度角度分析,衡量可信度应重点考虑评论的有效长度,即内容中真正有用的信息量,这和能反映内容真实性的属性词与情感词有一定关联。因此本文通过评论中包含的属性词和情感词总数与评论总长度的比值来测度有效长度。同时为了减弱某些评论因总长度过大而对实验结果造成的偏差,运用对数方法弱化分母的取值差异,计算公式如下:Na是属性特征词个数,Ns是情感特征词个数,Nt是评论总长度。(2)确定指标权重通过问卷调查法,被调查者依据自身网购经验对指标进行两两比较打分,以矩阵形式表达各指标相对于评论可信度的重要性。采用0、0.5、1标度法确定因素值。将优先关系矩阵改造为模糊一致矩阵。①对优先关系矩阵(模糊互补判断矩阵)分别按行、按列求和,即:②再按公式进行数学变换:根据模糊一致矩阵计算各指标ai对评论可信度的重要性权值wi,计算公式如下:为提高排序结果的分辨率,α取值为α=(n–1)/2。至此,影响评论可信度的各指标权重W=(w1,w2,…,w6)得以确定。实证分析1.数据采集和预调整选取亚马逊网站上“HUAWEI华为AscendP6联通3G手机WCDMA/GSM(阿尔卑斯白)”作为实证分析的对象,截至2014年5月9日上午8:50,提取该商品全部评论共计1446条。以VisualStudio为程序开发平台,用C#编程语言实现指标的提取和预调整。对评论的“最佳评论者排名”进行分组,转化为“评论者等级”。计算各指标权重为W=(0.163,0.172,0.195,0.142,0.178,0.15)。根据上述公式,将每条评论的6项指标数值分别与对应权重进行加权计算,得出评论的可信度总分。例如,本文采集到样本的第一条评论各项指标经过无量纲处理后的数值为S=(1.87,0.45,1.45,1.04,2.13,0.72),则可信度总分为:同理,计算出所有样本评论的可信度总分,按照总分高低实现评论排序。3.结果对比分析亚马逊网站上给出的评论排序集是“按照最有用的评论排序”,重点关注每条评论的有用性投票数及总投票数,而本文的研究侧重于按照评论的可信度排序。限于篇幅,选取亚马逊网站排序的前三条评论与可信度模型排序的前三条评论的各项指标进行对比。具体对比两表中的第一行,即原始排序第一的评论和可信度模型排序第一的评论,可以发现,前者虽然评论者等级与有用性投票两项指标值高,但相比于后者,其他4项指标值均较低,尤其是产品属性特征词和情感平衡性两项指标值相差较大,应用到本文的排序模型中,可信度总分低,排名下降。证实了原始“按最有用的评论排序”方法的不足,反映出“有用性投票”对评论可信度重要但不是唯一因素。而本模型中排名第一的评论由于各项指标值都较为可观,因此可信度总分高,排名靠前。第四部分总结目的针对中文网络客户评论,给出一种评论可信度排序模型,辅助消费者决策。方法构建评论可信度指标体系,借助VisualStudio程序开发平台对指

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论