《数据可视化技术》 课件 01 分析电影评论数量、02 分析电影评论点赞数_第1页
《数据可视化技术》 课件 01 分析电影评论数量、02 分析电影评论点赞数_第2页
《数据可视化技术》 课件 01 分析电影评论数量、02 分析电影评论点赞数_第3页
《数据可视化技术》 课件 01 分析电影评论数量、02 分析电影评论点赞数_第4页
《数据可视化技术》 课件 01 分析电影评论数量、02 分析电影评论点赞数_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《数据可视化技术》课程介绍课程模块和项目序号模块名称项目名称学时1Matplotlib数据可视化豆瓣电影数据分析与Matplotlib可视化162Echarts数据可视化电商销售数据Echarts可视化363Flask+Echarts数据可视化高校招生就业数据分析与可视化招聘数据分析与可视化44合

计96课程介绍课程目标主要面向数据可视化工程师岗位,通过学习Python、Matplotlib、Flask、Echarts和Web前端技术,将爬取或采集下来的数据进行存储、处理和分析,并以各种图表的形式进行呈现和展示。重点使用Python进行数据分析、Matplotlib和Flask+Echarts进行可视化展现,形成图表,并利用Web页面展示出来。课程介绍课程考核平时成绩(60%)+期末考试(40%)平时成绩:学习考勤(10%)、综合素养(10%)、平时训练任务(40%)期末考试:上机技能测试阶段测试(综合能力)项目介绍本次课开始学习项目一:影评数据分析与可视化本项目从某电影网站采集了电影《流浪地球》的部分评论数据,包括城市、影评内容、评分、评论时间、评论点赞数等,根据采集的数据对电影评论的数量、点赞数和评分三个方面进行分析,完成数据分析可视化,给对科幻电影感兴趣的观影者、电影投资者提供一些参考。单元1分析电影评论数量01准备活动点名、复习本次课学习内容、学习目标介绍学习内容任务一分析电影评论数量本任务从评论日期、评论者所在城市和星级评分三个方面来分析电影评论数量。通过绘制折线图、柱状图和饼图,对电影评论数量的情况进行对比分析,这有利于全面挖掘该电影的口碑、观影热度、观众对电影的理解等信息,为观众提供观影参考。子任务1影评数量随日期变化的情况分析(折线图)任务分解:子任务2影评数量最多的十个城市情况分析(柱形图)子任务3评分星级数量占比情况分析(饼图)学习目标1、知识(1)理解数据分析以及数据分析流程(2)掌握pandas库的基本操作、数据处理基本的选取、统计等函数(3)掌握matplotlib库绘制图形的基本方法,以及折线图、柱状图、饼图绘制方法2、技能(1)能使用pandas库读取文本数据,按照任务要求处理数据(2)能使用matplotlib子库plotlib根据数据绘制折线图、柱状图、饼图3、素养(1)分析问题的能力;(2)团队沟通能力;(3)培养团队合作意识。02发展活动任务分析、任务资讯、任务实施子任务1:影评数量随日期变化的情况分析任务分析:根据评论时间字段times提取日期(只提取年月日)数据并统计出各日期的评论数量,绘制折线图,显示评论数量随日期的变化情况。1.Matplotlib概述任务资讯Matplotlib是一款用于数据可视化的Python软件包,支持跨平台运行,它能让使用3项目1影评数据分析与可视化者很轻松地将数据图形化,并且提供多样化的输出格式,可以绘制线图、散点图、等高线图、条形图、柱状图、3D图形,甚至图形动画等。常用的数据可视化图表有直方图、柱状图、折线图、散点图、饼图等,如图1-1-1所示。2.Matplotlib下载与安装任务资讯3.pyplot绘图流程任务资讯第1步:导入模块。第2步:准备数据。第3步:画布子图。第4步:绘制图形。第5步:添加标签。第6步:保存显示。4.折线图任务资讯折线图是以折线的上升或下降来表示统计数量增减变化的统计图,它可以直观地反映数据的变化趋势。pyplot模块中plot()函数一般用于绘制线条,包括折线和直线。示例:任务实施步骤:步骤1:初始工作。导入相关包,Pandas从CommentInfo.csv文件中读取电影评论数据,设置Matplotlib绘图的常用参数值.步骤2:统计各日期的评论数量。提取评论时间的日期信息,并统计各日期电影评论数量。步骤3:绘制折线图。使用Matplotlib绘制折线图,横轴为日期,纵轴为日期所对应的电影评论数量,显示各日期的评论数量以及变化趋势。子任务2影评数量最多的十个城市情况分析任务分析:本任务需要使用Pandas从CommentInfo.csv文件中读取数据,统计各城市评论数量。根据所统计各城市评论数量,使用Matplotlib绘制柱状图,要求横轴为城市,纵轴为城市对应的电影评论数量,显示评论数量最多的十个城市的情况。1.柱形图任务资讯柱状图是一种用矩形柱来表示数据分类的图表,柱状图可以垂直绘制,也可以水平绘制(水平绘制叫条形图)。柱状图显示了不同类别之间的比较关系,它由一系列高度不等的纵向条纹表示数据分布的情况。图表的水平轴x表示被比较的类别,垂直轴Y则表示具体的类别值。pyplot模块中的bar()函数用于绘制柱状图,barh()函数用于绘制条形图。示例:显示2022年不同种类(A、B、C、D)的销售数量,通过bar()函数绘制柱状图,代码如下:任务实施步骤:步骤1:初始工作。导入相关包,Pandas从CommentInfo.csv文件中读取电影评论数据,设置Matplotlib绘图常用参数值。步骤2:统计并取出评论数量最多的十个城市步骤3:绘制柱状图。横轴为城市,纵轴为城市对应的电影评论数量,显示评论数量最多的十个城市子任务3评分星级数量占比情况分析任务分析:本任务需要使用Pandas从CommentInfo.csv文件中读取数据,从评论评分字段scores统计各评分的评论数量。根据统计出的各评分星级数量,使用Matplotlib绘制饼图,显示各星级评分的占比情况。1.饼图任务资讯饼图用来显示一个数据系列,具体来说,饼图显示一个数据系列中各项目占项目总和的百分比。饼图可以清楚地反映部分与部分、部分与整体之间的比例关系,能直观地显示每组数据相对于总数的大小和占比情况。pyplot模块中的pie()函数用以绘制饼状图,语法格式如下1.饼图任务资讯pyplot模块中的pie()函数用以绘制饼状图,语法格式如下示例:显示2022年不同种类(A、B、C、D)的销售数量的占比情况,通过pie()函数绘制饼图,代码如下任务实施步骤:步骤1:初始工作。导入相关包,Pandas从CommentInfo.csv文件中读取电影评论数据,设置Matplotlib绘图的常用参数值步骤2:统计各评分的评论数量。步骤3:绘制饼图,显示各评分的占比情况03整合活动总结、知识点梳理学习总结布置作业:进一步完善任务。完成拓展题【拓展】分析点赞数最多的十个评论与星级关系拓展任务单元2分析电影评论点赞数项目介绍项目一:影评数据分析与可视化本项目从某电影网站采集了电影《流浪地球》的部分评论数据,包括城市、影评内容、评分、评论时间、评论点赞数等,根据采集的数据对电影评论的数量、点赞数和评分三个方面进行分析,完成数据分析可视化,给对科幻电影感兴趣的观影者、电影投资者提供一些参考。01准备活动点名、复习本次课学习内容、学习目标介绍学习内容任务一分析电影评论点赞数本任务从评论点赞数分布、评论点赞数对应星级、点赞数日期三个方面来分析电影评论点赞数。通过绘制直方图、箱形图、散点图和折线图对电影评论点赞数情况进行分布分析、对比分析,以便全面了解该电影的口碑、观影热度、观众对电影的理解等信息,为观众提供观影参考。子任务1根据评论点赞数字段votes绘制直方图,显示评论点赞数分布情况任务分解:子任务2根据评论点赞数字段votes和评分字段scores绘制箱形图,显示评论点赞数星级分布情况。子任务3根据评论日期字段times和点赞数字段votes绘制散点图和折线图,显示评论点赞数、评论数量随日期变化情况学习目标1、知识(1)复习pandas库的基本操作、数据处理基本的选取、统计等函数(3)掌握matplotlib库绘制图形的基本方法,以及直方图、箱型图、散点图绘制方法2、技能(1)能使用pandas库读取文本数据,按照任务要求处理数据(2)能使用matplotlib子库plotlib根据数据绘制直方图、箱型图、散点图3、素养(1)分析问题的能力;(2)团队沟通能力;(3)培养团队合作意识。02发展活动任务分析、任务资讯、任务实施子任务1评论点赞数分布情况分析(直方图)任务分析:本任务需要使用Pandas从CommentInfo.csv文件中读取数据,根据评论点赞数字段votes,使用Matplotlib绘制两个直方图,显示评论点赞数分析情况。第一个直方图要求横轴为点赞数区间,其范围为评论点赞数最小值至最大值之间;纵轴为评论点赞数。第二个直方图要求横轴为点赞数区间,范围为0~5000,纵轴为评论点赞数。1.子图任务资讯一个画布上默认有一个子图,Matplotlib图像组成如图1-2-1所示。可以将Figure对象理解为画布;Axes对象表示坐标轴区域,可以认为是子图,也是真正绘图的区域。可以创建多个画布,也可以在一个画布上添加多个子图。Figure对象允许划分多个绘图区域,每个区域都是一个Axes对象,每个Axes对象都拥有自己的坐标系,即子图。Figure对象与Axes对象之间的关系如图1-2-2所示。1.子图任务资讯(1)创建和添加单个子图:subplot()函数和add_subplot()方法示例:规划两个子图,并创建或添加两个子图,按照水平排列。2.直方图任务资讯直方图用一系列高度不等的纵向线段来表示数据分布的情况。直方图的横轴表示数据类型,纵轴表示分布情况。直方图用于概率分布,它显示了一组数值序列在给定数值范围内出现的概率;柱状图则用于展示各个类别的频数。pyplot模块中的hist()函数用以绘制直方图,语法格式如下2.直方图任务资讯示例:显示A类产品不同价格区间的销售数量,通过hist()函数绘制直方图,代码如下以上代码通过hist()函数绘制直方图,直方图显示了8个条柱,颜色为绿色,运行结果如图1-2-11所示任务实施步骤:步骤1:初始工作。导入相关包,Pandas从CommentInfo.csv文件中读取电影评论数据,设置Matplotlib绘图常用参数值。步骤2:获取所有评论点赞数以及最大、最小点赞数。步骤3:绘制直方图。通过子图绘制了两个垂直排列的直方图。子任务2评论点赞数对应星级分析任务分析:在子任务1的基础上分析评论点赞数大于5000的评论的星级情况。本任务需要使用Pandas从CommentInfo.csv文件中读取数据,从评论点赞数字段votes获取大于等于5000的评论点赞数和评分数据,根据评论点赞数和评分数据,使用Matplotlib绘制箱形图,显示评论点赞数对应星级分布情况。1.箱型

图任务资讯箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用于显示一组数据分散情况的统计图,因形状如箱子而得名。它能显示出一组数据的最大值、最小值、中位数以及上下四分位数,主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。在箱形图中,从上四分位数到下四分位数绘制一个盒子,然后用一条垂直触须(形象地称为“盒须”)穿过盒子的中间。上垂线延伸至上边缘(最大值),下垂线延伸至下边缘(最小值)。箱形图结构如图1-2-12所示。图1-2-12中标示了每条线所表示的含义,主要包含6个数据节点。一组数据按从大到小排列,分别计算出上边缘、上四分位数(Q3)、中位数、下四分位数(Q1)、下边缘,以及异常值1.箱型

图任务资讯pyplot模块中的boxplot()函数用以绘制箱形图,语法格式如下:示例:A产品2022年和2021年销售价格情况分析,通过boxplot()函数绘制箱形图,代码如下以上代码绘制了箱形图,分别表示A产品2022年和2021年产品销售价格分布情况,运行结果如图1-2-13所示。任务实施步骤:步骤1:初始工作。导入相关包,Pandas从CommentInfo.csv文件中读取电影评论数据,设置Matplotlib绘图常用参数值步骤2:获取评论点赞数大于等于5000的评论评分和点赞数。步骤3:绘制箱形图。按星级分别绘制五个箱形图,显示评论点赞数对应星级的分布情况。子任务3评论点赞数、评论数量随日期变化的情况分析任务分析:本任务需要使用Pandas从CommentInfo.csv文件中读取数据,处理times字段提取日期信息,并按日期排序,对处理后的数据使用Matplotlib绘制散点图,再按日期统计发布的评论数量并绘制折线图。散点图和折线图要求共横轴,横轴为日期,左边纵轴为电影评论点赞数,右边纵轴为评论数量,从而显示评论点赞数、评论数量随日期变化的情况。1.散点图任务资讯散点图用于在水平轴和垂直轴上绘制数据点,用点表示变量之间的关系。它可以展现因变量随自变量变化的趋势,用于观察变量之间的关系。pyplot模块中的scatter()函数用于绘制散点图。语法格式如下常用参数含义如下:x,y:长度相同的数组,也就是我们即将绘制散点图的输入数据。这两个参数是必选的。s:点的大小,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论