《数据可视化技术》 课件 04 Matplotlib综合运用_第1页
《数据可视化技术》 课件 04 Matplotlib综合运用_第2页
《数据可视化技术》 课件 04 Matplotlib综合运用_第3页
《数据可视化技术》 课件 04 Matplotlib综合运用_第4页
《数据可视化技术》 课件 04 Matplotlib综合运用_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《数据可视化技术》课题04Matplotlib综合运用前言本次课完成第一次单元测试:自选项目数据分析及可视化,各位同学将准备好的课题,完成数据爬虫,自选角度完成数据可视化。01准备活动点名、复习本次课学习内容、学习目标介绍学习内容任务:

自选项目数据分析及Matplotlib可视化

访问“湖南机电新闻”网站,完成数据爬取、处理分析和可视化学习目标1、知识(1)掌握爬虫流程和方法(2)掌握pandas库的基本操作、数据处理基本的选取、统计等函数(3)掌握matplotlib库绘制图形的基本方法,以及基本图的绘制方法2、技能(1)能爬取非结构网页(2)能使用beautifulsoup、、lxml(xpath)、re等库从爬取的网页中提取有用的数据

(3)能使用pandas库读取文本数据,按照任务要求处理数据(4)能使用matplotlib子库plotlib根据数据绘制基本图3、素养(1)严谨认真、代码规范;(2)数据安全、爱国精神;(3)信息检索能力02发展活动任务分析、任务资讯、任务实施任务实施1、教师讲解

本次课为第一次单元测试,各同学自选课题,完成数据爬取,分析,并自选角度完成数据可视化。2、明确任务(1)各同学自选课题,爬取数据(2)使用matplotlib完成自选角度的4个基本图(折线图、柱形图、饼图和词云)。(3)对展示的图进行分析,写出结论任务实施访问“湖南机电新闻”网站,完成数据爬取、处理分析和可视化:/about/xue-yuan-xin-wen-list-0.htm1、数据采集访问/about/xue-yuan-xin-wen-list-0.htm,使用Python采集学校新闻所有的新闻数据(要求至少采集50页新闻数据),根据新闻详细地址采集新闻的发布部门信息,信息包括:新闻标题、发布时间、新闻详细地址三列信息,相关信息采集下来后,保存为文件名“机电学校新闻.csv”任务实施2、数据处理和分析使用Python的pandas读取“机电学校新闻.csv”文件,完成如下数据处理和分析操作:对数据进行清洗,把“发布时间”的年月日分别提取出来,单列成三列“年”、“月”、“日”,保存新闻标题、年、月、日四列数据到“机电学校新闻_发布年月日.csv”文件。任务实施3、数据可视化根据题目需求使用Python读取“机电学校新闻_发布年月日.csv”csv文件中的数据,完成如下操作:(1)使用折线图展示学校新闻2020年12月每日发布数量。(2)使用折线图展示学校新闻2020年每月发布的数量。03整合活动总结、知识点梳理学习总结通过本次课的练习,同学们对数据爬取、数据分析到数据可视化整个流程更有体会。同时更进一步熟练选择各种matplotlib的基本图完成各类数据的展示。布置作业:进一步完善任务。寻找一个新闻网站爬取分析数据(1)爬取数据(2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论