《数据可视化技术》 课件 03 分析电影评论评分_第1页
《数据可视化技术》 课件 03 分析电影评论评分_第2页
《数据可视化技术》 课件 03 分析电影评论评分_第3页
《数据可视化技术》 课件 03 分析电影评论评分_第4页
《数据可视化技术》 课件 03 分析电影评论评分_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

单元3分析电影评论评分项目介绍项目一:影评数据分析与可视化本项目从某电影网站采集了电影《流浪地球》的部分评论数据,包括城市、影评内容、评分、评论时间、评论点赞数等,根据采集的数据对电影评论的数量、点赞数和评分三个方面进行分析,完成数据分析可视化,给对科幻电影感兴趣的观影者、电影投资者提供一些参考。01准备活动点名、复习本次课学习内容、学习目标介绍学习内容任务三分析电影评论评分本任务从评论评分与城市名称、评分等级三个方面来分析电影评论评分。通过绘制面积图、折线图和词云图对电影评论评分情况进行分布分析、对比分析,以便全面挖掘该电影的口碑、观影热度、观众对电影的理解等信息,为观众提供观影参考任务分解:子任务1评论评分与城市的关系分析(面积图)子任务2评论评分好评与差评的关键信息分析(词云图)学习目标1、知识(1)掌握matplotlib面积图的绘制方法(2)掌握jieba分词

(3)掌握pandas统计词频的方法

(4)掌握matplotlib词云的绘制方法2、技能(1)能使用jieba分词处理文本(2)能使用matplotlib子库plotlib根据数据绘制面积图和词云图3、素养(1)严谨认真、代码规范;(2)数据安全、爱国精神;(3)信息检索能力02发展活动任务分析、任务资讯、任务实施子任务1评论评分与城市的关系分析(面积图)任务分析:本任务需要使用Pandas从CommentInfo.csv文件中读取数据,根据评论评分字段scores和城市名称字段citys数据统计出不同评分及对应城市的评论数量。根据统计出的不同评分及对应城市的评论数量,取出前五名城市的数据,使用Matplotlib绘制折线图和面积图,要求横轴为评分,纵轴为评论数量,显示不同评分、不同城市的评论数据变化趋势。1.面积图任务资讯面积图对轴和线之间的区域着色,不仅能够强调峰和谷,还能够强调高点和低点的持续时间。高点持续时间越长,线下面积越大。pyplot模块可以使用fill_between()函数和stackplot()函数绘制面积图。fill_between()函数语法格式如下:1.面积图任务资讯stackplot()函数语法格式如下1.面积图任务资讯示例:显示A类产品2022年和2021年季度销售情况,通过fill_between()函数绘制面积图,代码如下:以上代码设置alpha为0.5(半透明),同时绘制了两条折线图,能显示出面积图的上边缘,运行结果如图1-3-2所示1.面积图任务资讯示例::显示A类产品2022年和2021年季度销售情况,通过stackplot()函数绘制堆叠面积图,代码如下:以上代码绘制了一个堆叠面积图,堆叠面积图有两个颜色的面积,分别对应2022年和2021年的销售情况,运行结果如图1-3-3所示。任务实施步骤:步骤1:初始工作。导入相关包,Pandas从CommentInfo.csv文件中读取电影评论数据,设置Matplotlib绘图常用参数值。步骤2:统计不同评分各城市的评分数量。根据处理评分字段scores和城市名称字段citys数据,统计不同评分及对应城市的评分数量,取出评论数量最多的五个城市的数据用于绘图步骤3:绘制折线图和面积图。绘制5条折线图和5个面积图,横轴为评分,纵轴为评论数量,显示不同评分、不同城市的评论数据变化趋势。子任务2评论评分好评与差评的关键信息分析任务分析:本任务需要使用Pandas从CommentInfo.csv文件中读取数据,根据评论评分字段scores,按照好评差评标准进行分类。对分类的数据做jieba分词后使用WordCloud()绘制好评和差评留言的词云图,显示好评和差评关键字信息。1.词云图任务资讯词云图,也叫文字云,即对输入的一段文字计算词汇出现的频率(词频),然后根据词频集中显示高频词,简洁、直观、高效。词云图使人们可以快速感知最突出的文字,迅速抓住重点,了解主旨。制作词云图的方法有很多,可以借助第三方网站的在线词云图工具,也可以基于Python。这里使用WordCloud制作词云图,制作流程如下:1)准备一段文字。2)使用jieba分词。3)准备停用词。4)WordCloud生成词云图示例:简单分词,代码如下:1.词云图任务资讯示例:制作朱自清《春》的词云图1.词云图任务资讯修改示例:制作朱自清《春》的词云图任务实施步骤:步骤1:初始工作。导入相关包,设置Matplotlib绘图常用参数值。步骤2:准备停用词。定义stop_words()函数,读取提供的停用词文件数据,按需求定义停用词。步骤3:定义函数douban_word_cloud(data_after,title),绘制词云图,参数data_after表示生成词云图的文本数据,参数title表示生成词云图的标题步骤4:定义主函数run(),从文件CommentInfo.csv读取数据,根据评判标准(评分大于等于30的为好评,评分小于30的为差评)把电影评论分为好评和差评,再分别调用步骤3定义的函数douban_word_cloud(data_after,title),绘制词云图

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论