Excel电商数据分析与应用 课件 11.4.1评价词频分析11.4.2评价情感分析_第1页
Excel电商数据分析与应用 课件 11.4.1评价词频分析11.4.2评价情感分析_第2页
Excel电商数据分析与应用 课件 11.4.1评价词频分析11.4.2评价情感分析_第3页
Excel电商数据分析与应用 课件 11.4.1评价词频分析11.4.2评价情感分析_第4页
Excel电商数据分析与应用 课件 11.4.1评价词频分析11.4.2评价情感分析_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

消费者运营分析11.4.1评价词频分析&11.4.2评价情感分析1评价词频分析2CONTENTS评价情感分析评价词频分析PARTONE评价词频分析词频分析是文本分析的基础,基于词频可以了解大量文本信息的内容,既可以分析自己的商品也可以分析竞品。接口说明如下。通过基于机器学习算法分词的开源接口,可查阅接口的相关说明。接口:/get.php?source=¶m1=¶m2=。接口参数如下。“Source=”:要分词的文本。“Param1=”:返回分词结果的概率,最小为0,最大为1。“Param2=”:是否为调试模式,调试模式可以看到分词结果的概率。0为非调试模式,1为调试模式。例1:/get.php?source=清华大学是好学校¶m1=0¶m2=1。返回:清华:0.604942清华大学:1华大:0.068537大学:0.937618好学:0.730473好学校:0.699564学校:0.833307例2:/get.php?source=清华大学是好学校¶m1=0.8¶m2=1。返回:清华大学:1大学:0.949906学校:0.936925例3:/get.php?source=清华大学是好学校¶m1=0¶m2=0返回:清华清华大学华大大学好学学校评价词频分析图11-78评价词频分析例4:图11-78所示为采集某竞品的消费者评价数据,分析评价的词频。数据采集路径:【淘宝商品】-【评价详情页】。解:选中数据,如图11-79所示,在【数据】选项卡中单击【自表格/区域】选项,将评价导入PowerQuery编辑器。图11-79图11-80图11-81如图11-80所示,在PowerQuery编辑器中筛选数据,搜索“此用户”,将无效的评价“此用户没有填写评价。”过滤掉。如图11-81所示,在【添加列】选项卡中,单击【自定义列】功能键。评价词频分析图11-82图11-83评价词频分析如图11-83所示,键入公式“Csv.Document(Web.Contents("/get.php?source="&Uri.EscapeDataString([评价])&"¶m1=0.8¶m2=0"))”。M函数说明:Web.Contents:是以二进制文件的格式下载网页。Csv.Document:是将二进制文件转换成Csv格式的表格。由于是访问互联网数据需要设置隐私级别,为了方便练习,如图11-82所示,可直接勾选【忽略此文件的隐私级别检查……】,老版本没有这个选项,选择公共权限。获取数据后,如图11-84所示,勾选【展开】和【Column1】字段,展开后将字段“Column1”重命名为“分词”。展开后,按照图11-85所示内容,筛选掉空白行。图11-84图11-85消费者复购率计算与分析图11-86图11-87消费者复购率计算与分析如图11-86所示,在【开始】选项卡中单击【分组依据】选项。如图11-87所示,基于分词进行分组。图11-88图11-89消费者复购率计算与分析如图11-88所示,单击【开始】选项卡中【关闭并上载】选项,将数据关闭并上载到Excel工作表中。如图11-89所示,对“计数”进行排序,可以观察到买家对这款产品的评价关键词,通过观察可以发现买家对这款产品满意的占比较大,因此这款产品的效果不错。评价情感分析PARTTWO评价情感分析评价情感分析是判断文本的情感得分,正面得分越高表示买家对产品或服务越满意,负面得分越高表示消费者对产品或服务越不满意。情感分析同样需要使用API接口实现,没有纯免费的接口,可使用商业接口的免费调用次数。商业接口可以在API集市申请,本例使用/的接口,每天可调用500次。接口地址:/sentiment/analysis。调用方式:Post。图11-90图11-91例5:图11-90所示是评价数据,使用接口分析评价情感得分。数据采集路径:【淘宝商品】-【评价详情页】。选中数据,如图11-91所示,在【数据】选项卡中单击【自表格/区域】选项,将评价导入PowerQuery编辑器。评价情感分析图11-92图11-93由于接口的次数限制,在PowerQuery编辑器中进行数据筛选,只保留前5条,每次只消耗5次API调用次数。如图11-92所示,在PowerQuery编辑器【开始】选项卡中,单击【保留行】中的【保留最前面几行】选项,指定保留5行。如图11-93所示,在【添加列】选项卡中,单击【自定义列】选项。评价情感分析如图11-94所示,键入函数:“Json.Document(Web.Contents("/sentiment/analysis",[Headers=[#"X-Token"="UGlLtDcd.16189.rHC5FhNFHzqU"],Content=Text.ToBinary("["""&[评价]&"""]")]))”。图11-94图11-95由于访问互联网数据需要设置隐私级别,为了方便练习,如图11-95所示,可直接勾选【忽略此文件的隐私级别检查……】,如果没有这个选项,选择公共权限即可。评价情感分析“Json.Document(Web.Contents("/sentiment/analysis",[Headers=[#"X-Token"="UGlLtDcd.16189.rHC5FhNFHzqU"],Content=Text.ToBinary("["""&[评价]&"""]")]))”函数说明:Json.Document:是将二进制文件以Json格式解析成表格。Web.Contents:是以二进制文件的格式下载网页。由于是Post方法,需要添加表头和请求正文,格式为:Web.Contents(网址,表头,正文)。表头的格式:[Headers=[#"表头1"="参数",#"表头2"="参数",……]]。本例由于只有一个必要表头参数,因此格式为:[Headers=[#"X-Token"="API密钥"]],其中“#”具有声明参数字段的作用,在“X-Token”前加上“#”,表示这是个参数字段。正文的格式:Content=Text.ToBinary("请求正文")。本例接口要求请求正文是一个字典格式的文本,因此格式为:Content=Text.ToBinary("["""&[评价内容]&"""]")。其中每一对双引号中的两个连续的双引号起到转义的作用,表示一个双引号,“&”是连接两端文本的胶水符号,如果文本是“清华大学是一所好学校”,括号中的文本内容为:["清华大学是一所好学校"],导入公式写法为:"["""&"清华大学是一所好学校"&"""]"。评价情感分析图11-96图11-97如图11-96所示,展开List,单击“自定义”右侧的双向箭头,选择【扩展到新行】选项,展开后还是List的内容,这是因为接口返回的数据结构属于特例。如图11-97所示,再次单击“自定义”右侧的双向箭头,选择【提取值】选项。评价情感分析如图11-98所示,提取值后会“自定义”列中每行有两个数字,逗号前是正面得分,逗号后是负面得分。选中“自定义”列(情感得分),如图11-99所示,【开始】选项卡中单击【拆分列】-【

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论