高一【信息技术(人教中图版)】数据可视化之词云(第二十六课时)-课件_第1页
高一【信息技术(人教中图版)】数据可视化之词云(第二十六课时)-课件_第2页
高一【信息技术(人教中图版)】数据可视化之词云(第二十六课时)-课件_第3页
高一【信息技术(人教中图版)】数据可视化之词云(第二十六课时)-课件_第4页
高一【信息技术(人教中图版)】数据可视化之词云(第二十六课时)-课件_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据可视化之词云(第二十六课时)年级:高一学科:信息技术(人教/中图版)主讲人:

学校:复习:数据可视化之图表AQI历年平均值年份AQI平均值201411020151122016102201787201882201971202068问题:文本数据如何可视化?北京空气污染调查报告

北京市预警中心、北京市空气重污染应急指挥部办公室11月26日发布了“空气重污染蓝色预警”称,受不利扩散条件影响,北京空气质量已达“5级重度污染”水平,建议公众做好健康防护,减少户外运动等。这也是北京今年(2016年)入冬以来第二次发布空气重污染预警。

于是,北京的空气质量以及对人体健康影响再度引发公众的热议。

空气中微生物和重金属会致病吗?

对拉森团队的研究成果,北京市卫计委表示,细菌的耐药性和致病性是完全不同的概念,耐药性的增加不意味着致病性的增强。..............................................................................................文本可视化的方式:词云词云应用举例国际互联网大会词云图时代背景:大数据时代奥地利科学家维克托·迈尔-舍恩伯格是最早洞见大数据时代发展趋势的数据科学家之一,2012年他在《大数据时代》中前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维方式。时代背景:大数据时代根据国际互联网数据中心预测:2025年全球每年产生的数据将达到175ZB。如果把175ZB全部存在DVD光盘中,那么DVD叠加起来的高度可以绕地球222圈。现实问题:数据量大幅度增加数据挖掘数据挖掘是指从大量的数据中通过算法获取隐藏于其中信息的过程。数据挖掘通过统计学、机器学习、专家系统和模式识别等诸多方法来实现上述目标。文本数据挖掘数据挖掘的一个分支,叫做文本数据挖掘,顾名思义,文本数据挖掘,就是从文本中进行数据挖掘,以快速获得文本中的重要信息。文本可视化最常用的方法就是词云。文本数据挖掘的主要步骤:文本获取、文本处理、文本可视化词云的概念你发现了词云的哪些特点?词云的概念特点:图片词汇颜色大小词云是一种可视化描绘词语出现在文本数据中的频率的方式。词云的概念客户满意度文本词云客户满意度1、词汇区分(分词)2、统计词频3、图形显示词云的制作步骤鸡蛋牛奶面包豆浆油条鸡蛋鸡蛋牛奶包子鸡蛋牛奶面包体验词云:人工制作词云早餐统计单:鸡蛋牛奶面包豆浆油条包子体验词云:人工制作词云步骤一:词汇区分鸡蛋牛奶面包豆浆油条鸡蛋鸡蛋牛奶包子鸡蛋牛奶面包体验词云:人工制作词云步骤二:词频统计食物名称出现频率鸡蛋4牛奶3面包2豆浆1油条1包子1鸡蛋牛奶面包豆浆油条鸡蛋鸡蛋牛奶包子鸡蛋牛奶面包体验词云:人工制作词云步骤三:绘制图形鸡蛋牛奶面包豆浆油条鸡蛋鸡蛋牛奶包子鸡蛋牛奶面包活动一:人工制作词云请大家暂停视频,按照前面的操作步骤,人工制作早餐食物的词云图,把制作的词云图拍照或者截图粘贴在任务单中。鸡蛋牛奶面包豆浆油条鸡蛋鸡蛋牛奶包子鸡蛋牛奶面包早餐统计单:任务单在线制作词云在线制作词云步骤一:打开网站打开浏览器并在地址栏输入网址https:///create在线制作词云步骤2:导入文本点击“WORDS”菜单下方的“import”

按钮。在线制作词云步骤2:导入文本在弹出的对话框中输入文本。然后点击“importwords”按钮在线制作词云步骤2:导入文本系统自动显示分词结果和词频统计。在线制作词云步骤2:导入文本点击右侧的“Options”按钮,设置文字重复次数。在线制作词云步骤2:导入文本在弹出的对话框中的“Repeat”选项中选择“None”。在线制作词云步骤3:选择图形:点击“SHAPES”菜单,选择一个词云的图形,选中的图形背景显示为蓝色。在线制作词云步骤4:导入字体打开“FONTS”菜单,然后点击下方的“Addfont”按钮添加字体。在线制作词云步骤4:导入字体在对话框中定位到素材文件夹中的宋体字体文件“SimSun.ttf”。添加完成后,该字体会出现在系统的字体列表中,点击选中该字体。选中后背景为蓝色。在线制作词云步骤5:生成词云图点击上方红色的“Visualize”按钮,即可生成词云图。活动二:在线实现词云活动任务:素材文件夹中的“kongqi.txt”文档内容为《北京空气污染调查报告》,请应用此文档在wordart网站在线生成词云,将生成的词云图截图并填写活动任务单。任务单Python语言实现词云Python语言实现词云工具包介绍:jieba,中文分词工具包。根据汉字之间的关联概率形成分词结果。wordcloud,词云生成工具包。可以图形化的展示文本文字及其出现的频率。imageio,image类型图片工具包。提供image类型图片相关操作工具。Python语言实现词云右图为某招聘网站的招聘信息文档截图,制作这个的词云图以快速了解应聘所需的关键技术。任务介绍:Python语言实现词云文本文件(必备)字体文件(可选)图像文件(可选)程序文件(参考)材料准备:Python语言实现词云运行命令行工具:AnacondaPrompt在窗口依次输入以下命令:pipinstallimageiopipinstalljiebapipinstallwordcloud步骤1:安装工具包步骤2:运行Spyder软件。Python语言实现词云步骤3:编辑代码。Python语言实现词云在左侧编辑区输入程序代码(详细代码在后文)详细代码-1#1、导入需要用到的库fromimageioimportimreadimportmatplotlib.pyplotaspltfromwordcloudimportWordCloudimportjieba#2、读取文本并分词text=open(“zhaopin.txt","rb").read()text_jieba="".join(jieba.cut(text))bg_pic=imread(“back.png")代码对应解释导入imageio工具包导入matplotlib工具包导入wordcloud工具包导入jieba工具包读取文档区分词汇加空格读取图片文件详细代码-2#3、配置词云参数,生成词云wc=WordCloud(font_path="simsun.ttf",

background_color="white",max_words=200,mask=bg_pic,max_font_size=100

)wc.generate(text_jieba)代码对应解释定义词云对象读取字体文件设置背景颜色设置最大词汇数量设置词云应用图片设置最大字体尺寸用文本生成词云对象详细代码-3#4、生成图片并显示plt.figure()plt.imshow(wc)plt.axis("off")plt.show()wc.to_file("map.jpg")代码对应解释生成图形实例实现词云图形绘制关闭坐标轴显示词云图形生成词云图片文件步骤4:运行程序。Python语言实现词云在右侧的Console面板中会显示生成的词云图片。活动三:Python语言实现词云活动任务:“zhaopin.txt”文档内容为某招聘网站的招聘信息,请使用Python语言生成此文档的词云图,将生成的词云图截图,从图中找出五个关键

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论