下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
4.2《大数据处理数据可视化之词云》教材分析本节课是浙教版《数据与计算》必修一第四章第二节大数据处理中《文本数据处理》的内容。本节主要介绍了文本处理的相关内容,包含文本处理的一般过程以及文本数据分析与应用。本节要求学生通过典型案例应用实例,了解数据采集、分析和可视化表达的基本方法,并能根据任务需求,选用恰当的软件工具或平台处理数据。针对教学目标,本节课采用最近热点问题《政府工作报告》展开,对该文本内容进行可视化处理。考虑到学生已经熟练掌握Python基本编程知识,具备相应的编程能力,对于创新性内容比较感兴趣,设计了词云制作这一实践活动。课程标准和教学目标本节课项目:《基于政府工作报告的可视化处理》课程标准:1.4通过典型的应用实例,了解数据采集、分析和可视化表达的基本方法。1.5根据任务需求,选用恰当的软件工具或平台处理数据。教材内容第四章文本数据处理教学目标1.了解文本数据处理的目的、应用、一般过程和方法。2.了解文件读取文本数据的方法以及中文分词常见的方法。3.掌握数据词云的概念、历史,了解制作词云的基本步骤。指向的核心素养1.信息意识:能够在体验与探究过程中自主获取有效信息,并勇于展示与分享。2.计算思维:能够对给定的任务进行需求分析,抽象问题的本质,设计相应的算法,用程序设计语言实现相关算法。教学环境多媒体网络教室、Python3.8编程环境(wordcloud、jieba、numpy库已安装)教学重难点文本数据的获取文本数据的分词用python制作可视化词云教学过程教学环节教学过程设计意图回顾总结回顾在前几课中学习的关于数据可视化处理的案例,总结对于EXCEL表格形式的数据常用的可视化方法。总结出这些数据共同特征是数值类型。对之前的学习内容进行归纳与总结,再一次明确可视化处理的作用能够高效、快速、清晰、准确的把握数据中包含的信息,为项目的引入做好铺垫问题导入2023年3月5日第十四届全国人民代表大会上国务院总理李克强同志所作的政府工作报告的字数达到了18915,如何快速获取该报告中所包含的信息呢?对于文本数据的处理,最常用的处理方式是词云。展示生活中有关词云的图片。引入项目,明确本堂课的主要任务,同时向学生展示词云的图片,一方面激发学生学习兴趣,另一方面让学生对词云有一个形象直观的认识体验与探究一四行代码制作一个词云。让学生打开python编辑器,自主输入以下四行代码。Importwordcloudw=wordcloud.WordCloud()w.generate("hello,word,input,print")w.to_file("词云1.png")运行后,在python的根目录底下查看生成的词云图片通过实践一:学生可以亲身体验与感受用python制作词云的过程,同时,在制作的过程中可以引发学生对于如何制作词云的思考,为后续的展示与交流做好铺垫。展示与交流学生展示用python编码制作的词云效果。教师讲解用python制作词云的一般过程与方法:引入词云库;生成词云对象;导入文本内容;生成词云图片。师生探讨制作出的词云的感受,引出实践二要体验与探究的内容,继续美化词云。学生展示编码后的结果,对在编码过程中出现的问题进行总结。师生交流引出实践二体验与探究的内容。体验与探究二修改wordcloud()参数内容,美化词云。ImportnumpyasnpFromPILimportImageImportwordcloudmask=np.array(Image.open("alice_mask.png"))txt="Alice,漂亮、温柔、贴心、有爱心、友善、大方、热情、开朗、活泼、能歌善舞"w=wordcloud.WordCloud(#修改背景颜色#修改字体#修改蒙版#修改字体颜色#修改重复#修改尺寸#修改轮廓颜色和宽度)w.generate(txt)w.to_file("词云2.png")技术支持:WordCloud()各个参数使用案例如下:background_color="white",repeat=True,font_path="STXINWEI.TTF",mask=mask,contour_width=2,contour_color="pink"通过实践三:让学生自主去探索解决问题的方法,锻炼其利用编程设计语言实现算法的能力。代码采用开放式形式,对于重要需要掌握的内容进行补全,其他代码可以在基础上进行修改,一方面可以锻炼学生的创新能力,另一方面培养学生的自主学习能力展示与交流学生展示美化后的词云效果。对于编码过程出现的问题进行总结。总结实践一和实践二生成词云的数据有何特点。回归课程最开始提出的问题,如何读取该文本内容并进行分词呢?讲解文件读取数据的方式。利用jieba()库进行分词的方法。提出实践三自主与探究的内容与要求通过展示与交流,引发学生自主思考。层层递进式的提问,让学生更加明确目标,找到解决问题的方法。体验与探究三修改补充project3.py,完成《政府工作报告》词云制作FromwordcloudimportWordCloudImportnumpyasnpFromPILimportImageimportosimportjiebaf=open()#打开文件txt=#读取文件ss=#jieba分词补全代码mask=np.array(Image.open("ChinaMap.png"))wcd=WordCloud(background_color="white",repeat=True,font_path="STXIHEI.TTF",colormap="Reds",mask=mask,contour_width=8,contour_color="red")wcd.generate(ss)wcd.to_file("词云3.png")展示与交流学生展示对政府工作报告文本可视化处理后的结果。对于词云进行包含的信息进行解读。与学生交流“词云”的概念。通过前边三个实践操作,学生对于词云有了一定的认识,通过交流的方式,培养学生在自主实践中获取信息的能力。总结归纳播放微视频《大数据处理数据可视化之词云》。展示了词云产生的背景、词云的概念、作用。总结归纳文本处理的一般过程。了解词云的专业性概念,让学生掌握专业性语言,形成信息技术专业素养。课上练习师生共做课上练习,检验学习效果通过课上练习,查看学生的掌握情况。《大数据处理数据可视化之词云》课后反思《大数据处理数据可视化之词云》这节课围绕《基于政府工作报告的可视化处理》这一项目进行展开,设计了从简到难的三个实践项目,让学生在动手实践过程中不断明确问题,抽象建模、设计出解决问题的算法,并利用程序设计语言实现,解决问题。本节课学生参与度高、积极动手实践、对代码进行大胆,勇于展示与分享。在自主学习过程中不断获取信息,生成对词云的认识
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 全新高速公路建设与维护管理合同(2024版)3篇
- 二零二四年度房产项目绿化合同(2024版)3篇
- 全新短视频内容创作版权合同(2024版)
- 研学旅行活动手册
- 职业规划可行性分析报告
- 玉林师范学院《钢琴律》2023-2024学年第一学期期末试卷
- 盾构机安全管理
- 配电网工程施工项目经理理论考核试题
- 2024-2025学年八年级物理声现象中考复习题
- 数控加工技术培训资料
- 2024年中国塑料婴儿浴盆市场调查研究报告
- 9.2 提高防护能力 课件-2024-2025学年统编版道德与法治七年级上册
- 公司基金会合作协议书范本
- DB12T 1339-2024 城镇社区公共服务设施规划设计指南
- 心理学原理(中文版)
- 科技金融发展的新质生产力生成效应与机制研究
- T-NMRJ 015-2024 水资源论证区域评估技术导则
- 2024国家开放大学《财务管理》形考1-4答案
- 水处理用反渗透膜过滤器产品商业计划书
- 人教部编版(五四制)语文六年级上册 18 小站(1) 课件
- 11282社会学概论(本)纸考2023.12
评论
0/150
提交评论