大学计算机基础及应用(Python篇)课件:数据可视化_第1页
大学计算机基础及应用(Python篇)课件:数据可视化_第2页
大学计算机基础及应用(Python篇)课件:数据可视化_第3页
大学计算机基础及应用(Python篇)课件:数据可视化_第4页
大学计算机基础及应用(Python篇)课件:数据可视化_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据可视化

学习目标1、数据可视化简介2、数据可视化中的图形绘制3、基于Python词云应用1、数据可视化简介数据可视化领域的起源可以追溯到二十世纪50年代计算机图形学的早期。人们使用计算机创建图形图表,可视化提取出来的数据,将数据的各种属性和变量呈现出来。随着计算机硬件的发展,人们创建更复杂规模更大的数字模型,发展了数据采集设备和数据保存设备。同理也需要更高级的计算机图形学技术及方法来创建这些规模庞大的数据集。随着数据可视化平台的拓展,应用领域的增加,表现形式的不断变化,以及增加了诸如实时动态效果、用户交互使用等,数据可视化像所有新兴概念一样边界不断扩大。15.2数据可视化中的图形绘制可视化视图分为

4类:比较:比较数据间各类别的关系,或者是它们随着时间的变化趋势,比如折线图;联系:查看两个或两个以上变量之间的关系,比如散点图;构成:每个部分占整体的百分比,或者是随着时间的百分比变化,比如饼图;分布:关注单个变量,或者多个变量的分布情况,比如直方图。按照变量的个数可以把可视化视图划分为单变量分析和多变量分析。单变量分析指的是一次只关注一个变量。多变量分析可以让你在一张图上可以查看两个以上变量的关系,从而分析出来这两个变量之间是否存在某种联系。可视化的视图可以说是分门别类,多种多样,常用的10种视图,这些视图包括:散点图、折线图、直方图、条形图、箱线图、饼图、热力图、蜘蛛图、词云图等,15.2.1 散点图绘制15.2.2 折线图绘制15.2.3 条形图绘制15.2.4 饼图绘制15.2.5 热力图绘制15.2.6 词云图绘制15.2.7 直方图绘制15.2.8 三维图绘制15.3基于Python词云分析政府工作报告关键词15.3.1数据准备十三届全国人大三次会议作了政府工作报告。这份政府工作报告仅有10500字左右,,体现了“实干为要”的理念。作为当代大学生,应该多了解国家政治,关心国家时事。那么,这份政府工作报告突出强调了哪些关键词呢?我们其实可以基于Python技术进行词频分析和词云制作!具体数据来源可以在政务网下载或者爬虫获取,读者可自行操作。15.3.2词云图绘制代码importmatplotlib.pyplotasplt#绘图库importjiebafromwordcloudimportWordCloud#读入文本数据fp=open(r'D:\爬虫下载\2020年政府工作报告.txt','r',encoding='utf-8')content=fp.read()#print(content)#分词words=jieba.lcut(content)#词频分析操作data={}forwordinwords:iflen(word)>1:ifwordindata:data[word]+=1else:data[word]=1#print(data)15.3.3可视化结论从词云图中可以看出,发展一词频率最大,这也正是体现了发展是我们党执政兴国的第一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论