基于用户评论信息的网商信用度影响因素研究_第1页
基于用户评论信息的网商信用度影响因素研究_第2页
基于用户评论信息的网商信用度影响因素研究_第3页
基于用户评论信息的网商信用度影响因素研究_第4页
基于用户评论信息的网商信用度影响因素研究_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于用户评论信息的网商信用度影响因 素研究刘甲学冯畅黑龙江大学信息资源管理研究中心黑龙江大学信息ann管理学院摘要:【目的/意义】从用户评论信息岀发,研究了网商信用度影响因素,为网商改善 自身服务提供了参考建议,并期望促进电商平台的健康发展。【方法/过程】利 用情感分析与数据挖掘相结合的方法进行相应的实证研究。【结果/结论】研究 结论表明:一级影响因素商品信用是其屮影响最为显著的因素,二级影响因素商 品质量是影响网商信用度的决定因素,而后依次是售后服务等10个因素。关键词:用户评论;网商信用度;数据挖掘;影响因素;作者简介:刘甲学(1978-),男,山东人,博士,副教授,主要从事信息技术 与信

2、息系统研究.收稿日期:2017-06-07基金:黑龙江大学研究牛创新科研项目(yjscx2016-051hlju)research on influencing factors of ecommerce merchant credit degreebased on user reviewsliu jia-xue feng changresearch center of information resourcemanagement , heilongjiang university; school ofinformdtion management, heilongjianguniversity;

3、abstract:【purpose/significancel this paper studies the factors that influence the credibility of ecommerce merchant based on the user reviews, and provides suggestions for the ecommerce merchant to improve their services, and expects to promote the heal thy development of electronic commerce.method/

4、process this paper uses emotion analysis and data mining method to do the empirical research. result/conclusion the conclusion of the study shows that he commodity credit of the primary influencing factors is the most significant factor, the product quality of the secondary influential factors is th

5、e deci sive factor, and the fol lowing are the after-sales service and other 10 factors.keyword:user reviews; the credit degree of ecommerce merchant; data mining; inf1uential factor;received: 2017-06-071引言随着电子商务的飞速发展,用户对网上购物的需求推动了电商平台的崛起。然而, 由于网络中交易的虚拟性使得买家与卖家之间缺乏信任并存在风险,以及现有 电商平台信用等级评价制度存在诸多缺陷,导致网

6、商的信用缺失与欺诈行为日 益严重,网商的信用问题成为制约电子商务发展的瓶颈。同时伴随着网络购物人 数的不断增加,产生了大量的用户评论信息。对于互联网上的用户而言,在线用 户评论是重要的信息来源,是用户对所购买的商品的优缺点、性能、价值、满意 度等方面从自我体验或自我感知角度对产品特征的优劣做出表达与反映。这种评 论信息能够准确地印证网商的宣传、承诺与实际交易行为是否相符,且为用户积 极主动地表达,具有一定的真实性。其屮用户评论信息屮隐含的热点和评论主题 体现了用户的购买状态和关注的焦点,而这些往往衡量用户对网商信用度是否 满意的主要因素指标。因此,用户评论信息作为一种信任口碑传递的纽带,在一

7、定程度上能够有效地反映出网商信用度的影响因素。本文拟采用数据挖掘技术对用户评论进行处理,试图探索岀对网商信用度影响 最显著的因素及确定各影响因素的重要程度,以帮助网商提高其信用的透明度 和诚信度,并对网商的发展及其竞争力的提升起到积极的作用。2数据来源与影响因素的选取木文在网商信用度影响因素指标选取上严格遵循科学性和规范性原则及精炼性 和系统性原则,通过对数据进行预处理,利用lda模型挖掘网商信用度影响因 素的指标,构建影响因素指标体系。表1用户评论潜在主题挖掘(部分)下载原表2.1数据来源与清洗本文以抽样的方式,使用数据采集器八爪鱼对京东商城、淘宝网、天猫、当当、 国美在线、苏宁易购、凡客诚

8、品、蘑菇街、1号丿占、折800等10个主要的电商 平台进行评论采集,采集的商品种类涉及服饰、家用电器、家具、家纺、家居、 配饰、美妆、图书、鞋、帽、包、食品、数码产品、手机配件等十余种门类。采 集吋间为2014年5月1日至2017年5月1日。共采得133 648条评论信息。经 过对原始数据的去重、清洗、分词共得到118 712条有效数据。2. 2网商信用度影响因素的选取为准确把握用户评论所描述和反映的网商信用度,本文应用lda主题挖掘模型, 利用r语言对所采集的用户评论进行主题挖掘,在gibbs抽样时,设定先验参数 a =50/k, p=0. 1,迭代次数为1000次。其中主题个数k采用统计语

9、言模型中常 目的评价标准困惑度来选取,即k二50。运行程序得到部分主体分布,如表1所 示。表2网商信用度影响因素指标体系下载原表表2网商信用度影响因素指标体系下载原表通过对lda模型算出的隐含主题进行筛选、归纳、分析,确定4个一级影响因素 和13个二级影响因素,构建网商信用影响因素指标体系,如表2所示。2. 3构建属性词表与有效评论的抽取依据已挖掘出的用户评论潜在主题(表1),并对电商平台评论内容进行提炼, 建立能够对应网商信用度影响因素的属性词表(表3) o将建立的属性词表与经过分析处理的评论中的属性词进行逐条查找匹配,保留 属性词查找匹配成功的评论。统计属性词的类别和个数,保留属性词的所属

10、类别 大于3的评论,其余评论删除,经过抽取后共得到有效实验数据2507条。2. 4用户评论的转化与赋值采用国际打分制1-5分,设定基础分值为3分,最高分值为5分,最低分值为1 分,建立量化公式:(1) total score二basis score+positive scoredegree of emotional (2) total score二basis score+inversedict score*positive socredegree of emotional (3) total score二basis score+negative scorcwcgrcc of emoti on

11、al 其屮,total score 表示总分数,basis score 表 示基础分数,positive score表示正向情感权值,negative score表示负向情 感权值,inversedict score表示否定词权值,degree of emotional表示情感 程度权值。表3属性词表下载原表表4情感词典与权值表下载原表依据所建立的情感词典与权值表(表4)和量化公式计算岀每个二级影响因素 的分值,然后将一级影响因素所对应的每个二级影响因素的分值进行相加求和 取平均值,得到一级影响因素的分值,即数据源表。3实证研究本文选用sql server 2008 bt平台中ssas里集成的

12、决策树方法与贝叶斯方法创 建挖掘模型,验证模型的准确性,并分析其结果,从而实现对网商信用度的一 级影响因素和二级影响因素的评价。3. 1 一级影响因素的挖掘(1) 挖掘模型的创建。使用量化得到的数据源表建立access数据集,并将该数据集导入microsoft sql memagement studioo 在 business intclligcncc dcvclopmcnt studio 屮,建 立analysis services项目。设置"microsoft决策树”为该数据挖掘的主耍算 法,设定30%的数据作为测试数据集,完成数据挖掘模型的构建。(2) 模型的准确性评价。模型验

13、证对于数据挖掘项目而言,是必不可少的关键阶段。本文通过分类矩阵和 挖掘提升图对决策树模型的准确性进行验证。表5决策树模型的分类矩阵下载原表图1决策树数据模型挖掘提升图下载原图 选取752个事例对挖掘模型进行测试,经过测试后,以分类矩阵的形式展示其 测试结果,如表5所示。从表屮可以发现准确率为:(673+54) /752二97%,说明 该模型是准确可靠的。如图1所示。如果提升图中依据测试数据集里可预测列的已知值来绘制提升图, 挖掘模型所演示的提升量越多,则说明模型越有效。图2决策树模型挖掘图例下载原图从图1中可见,该模型对应的提升曲线与随机预测曲线相比有较大的提升,并 与理想模型曲线相当接近,且

14、从挖掘图例(图2)可观察到分数为1.00,所以 此模型性能非常好,准确度很高。(3)决策树模型结果与分析。挖掘模型决策树的树形图如图3所示。而从根节点到叶节点所走的过程其实就是 一条规则。图3决策树模型的树形图下载原图模型树状展开共有4个层级,抽取其中重要规则如下:商品信用2. 780,模型预测为用户对网商信用度是不满意的。商品信用二2.780 and3. 040 and品牌信用=3. 250,模型预测为用户对网商信 用度是满意的。商品信用=2. 780 and3. 040 and 品牌信用=2. 550and=3. 250 and 物流信 用二3. 400,模型预测为用户对网商信用度是满意的

15、。商品信用=2. 780 and3. 040 and 品牌信用=2. 550and=3. 250 and 物流信用 =3. 400,模型预测为用户对网商信用度是不满意的。商品信用=3. 040 and物流信用二3 and服务信用3,模型预测为用户对网商信 用度是不满意的。商品信用二3. 040 and物流信用二3 and服务信用二3,模型预测为用户对网商信 用度是满意的。商品信用=3. 040 emd物流信用3,模型预测为用户对网商信用度是不满意的。图4决策树模型依赖关系网络下载原图根据决策树的树形图和决策树最强依赖关系图(图4),可以发现商品信用、物 流信用、服务信用、品牌信用和是对网商信用

16、度影响显著的因素。其中商品信用 和满意度的关系最为紧密,即最为关键的影响因素。3.2二级影响因素的挖掘仃)模型的准确性评价。将创建好的贝叶斯分类模型进行模型训练,评价其准确性。整体正确率为:预测 正确个数/总个数二(676+57) /752二97%,整体错误率为:预测错误个数/总个数 =19/752=3%,说明此模型较为可靠,且生成模型线较z随机预测模型线有很大 提升,并趋向理想模型线,所以该模型的预测能力很好,具有很高的准确率。(2)贝叶斯模型结果与分析。挖掘模型查看器窗口的依赖网络选项卡显示了各属性之间的依赖关系。从贝叶斯 模型的最强依赖关系网络中(如图5)可见商品质量是依赖关系最强的属性

17、, 即该属性就能很明显地预测、反映用户对网商的信用度是否满意。商品真伪,图 片与实物的吻合度在图中没有显示,也就是说这两个属性为依赖关系较弱的属 性,即对预测属性的影响效果不明显。利用bi的贝叶斯模型得依赖关系网络,并見能得到网商信用度二级影响依赖关 系权重,发现商品质量最高,售后服务、送货速度、电商平台品牌信用、配送准 确度、发货及时度、商品品牌信用、在线客服服务、商品及包装完好度、商品价 格、商品外观次之,按照得到的权重次序,结果如表6所示。表6网商信用度影响因素权重次序下载原表4结语电商的不断普及,使其在人们生活中的地位越来越重要。如何利用用户在电商平 台上浏览、购物、评论所产生的海量的

18、、碎片化的数据,深度挖掘用户评论屮潜 在的经济价值,为网商提供准确有用的信息,以做出可靠的决策,将具有重要 的意义。木文将用户评论中的关注点与焦点,即评论潜在的主题高频特征词作为网商信 用度影响因素的指标,扩大了其选取方法的范围,使整体指标体系得到优化。通 过对用户评论的采集、过滤、加工和转换实现,从而由“链接型”数据对彖的数 据挖掘转变成“属性-值”的数据挖掘。运用r语言和sql server2008bl平台对 网商信用度影响因素进行了挖掘与分析,并利用分类矩阵与挖掘提升图对挖掘 结果做出准确性评价。最后通过挖掘模型的依赖网络关系对影响因素的权重次序 进行排序,以改善单个专家进行属性判断、评

19、价时的主观性和片面性,避免结果 失真,为网商信用度影响因素的评价提供了较为科学的、准确的研究方法。参考文献1 yingtao xu, ying zhang. a online credit evaluation method based on ahp and spaj. commun nonlinear sci numer simulat, 2009, (14) :3031-3036.2 马文博,陈占明基于多元性回归分析的淘宝卖家信用等级可信度评价一一 以航模配件商品为例j现代情报,2015, (8) : 172-177.3 daniel s. kostyra, jochen reiner, martin natter, danielklapper.decomposing the effects of online customer reviews on brand, price, and product attributes j. intern. j. of research in market ing, 2016, (33) : 11-26.4 吉顺权,周毅产品用户评

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论