版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章数据处理和可视化表达课题数据处理和可视化表达课时4课时教材分析本章是必修一第五章的内容,随着移动互联网和物联网的飞速发展,人类社会产生的数据以惊人的速度增长,海量的数据几乎包含了一切形式的数据。本章要让同学认识到大数据及其特征,认识大数据对人们日常生活的影响,了解数据采集、分析和可视化表达的基本方法;学会选用恰当的软件工具或平台处理数据,分析报告;学会利用python的扩展库来解决会考题,理解对数据保护的意义。学情分析在第五章当中学生已经对python语言已经有了基本的了解,在本章的学习党中除了了解大数据还要学习python的扩展库。在本章节的学习当中要注重培养学生学习的主动性,培养学生自主学习的意识。让学生学会选择恰当的学习工具进行学习,建构知识,培养技能,发展思维。促进信息技术学科核心素养达成,完成项目学习目标。教学目标1.能够理解大数据的4V特征并能举出例子。2.了解数据采集,分析和可视化表达的基本方法。3.了解python的第三方库的基础知识,学会利用第三方库来做题。4.促进信息技术学科核心素养达成,完成学习目标。重点与难点重点:大数据的4V特征,可视化表达的基本方法,python的扩展库。难点:python的扩展库。教学方法讲授法、任务驱动法、小组合作法、自主探究法课前准备多媒体课件、教学视频,随堂练习教学设计导入让学生进行思考你在网站购物时是否出现过类似的事情:当你在搜索一件物品的时候,购物网站就会给你进行类似商品的推荐和广告的投放。从此例子来引入本章内容的学习。授新课任务一:认识大数据的概念和特征让同学自行阅读课本P101-P102来了解大数据的概念和特征,阅读完成之后学生进行总结,教师加以补充,在上新课之前所举的购物网站的例子就是应用的大数据。让学生4人为小组讨论一下在日常生活中还有哪些应用了大数据?例如移动支付、网约车、高德地图等。任务二:观看视频总结大数据对日常生活的影响让学生们观看视频《大数据时代,我们无处可逃》然后以小组为单位讨论一下大数据时代对日常生活的影响。正面影响方便支付2.方便出行3.方便购物和产品推荐4.方便看病和诊病负面影响个人信息泄露2.信息伤害与诈骗任务三:阅读课本了解数据采集的方法和工具让学生自行阅读课本P104-P109了解数据采集的方法和工具以及数据的存储和保护,阅读完成之后学生进行总结。任务四:学习python网络采集程序使用的扩展库(一)导入模块的方法import模块名as别名例如:importnumpyasnpfrom模块名import功能名as别名例如:frommatplotlibimportpyplotasplt扩展库1.NumPy:是Python语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。2.SciPy:是一个算法库和工具包3.Matplotlib:是一个2D绘图库,可以生成绘图、直方图、条形图、散点图。4.NumPy常与SciPy和Matplotlib一起使用知识点:函数描述Plt.title()设置图像的标题plt.xlable()设置x轴的名称Plt.ylable()设置y轴的名称plt.show()显示图像Plt.plot(x,y)绘制线性图Plt.scatter(x,y)绘制散点图Plt.pie(x,y)绘制饼图Plt.bar(x,y)绘制柱形图5.pandas库:Pandas库主要用于快速简单的数据操作,聚合和可视化呈现。库中有两个主要的数据结构,一维数组(Series)和二维数组(DataFrame)结构。(1)Series:一维数组DataFrame:二维的表格型数据结构series求和sum(),求平均值mean()DataFrame的行列求和,求平均值知识点:Pandas.DataFrame.sum()返回所有列的和Pandas.DataFrame.sum(axis=1)返回所有行的和扩展:Random生成随机数的函数库知识点:random.random()返回随机生成的一个实数Random.randint(a,b)生成一个[a,b]之间的整数Random.Shuffle()打乱排序任务五:观看视频了解数据的分析数据的分析一般包括特征探索,关联分析,聚类分类,建立模型和模型评价。1、数据的特征探索:对数据进行预处理,发现和处理缺失值、异常数据、绘制直方图、求最大值、最小值、极差2、关联分析:发现大量数据集中的关联性或相关性,从而描述了一个事物中某些属性同时出现的规律和模式。3、聚类分析:依据研究对象(样品或指标)的特征,对其进行分类的方法,减少研究对象的数目。任务六:阅读课本了解数据的可视化表达的方式,观看视频了解什么是词云图词云图是目前常用的关键词可视化数据的表达方式,词云图通常使用文字的大小和颜色来表示关键词出现的频次。用python编程进行词云图的制作的顺序为:导入文本,分词,特征提取,数据分析,保存词云图总结由学生进行总结,教师进行补充课堂练习1.手机导航应用能够实时推荐最快路线,主要体现了大数据的()特征A数据体量巨大B数据类型多C数据变化速度快D价值密度低2.2020年11月1日,正式开始第七次全国人口普查,普查信息除了普查员登记获取之外,还可以通过小程序自主填报。后者的数据采集方式是()A实验数据采集B传感器采集C网络爬虫D系统录入我们在用python进行数据分析的时候,经常会用到pandas库中的DataFrame,这是类似于()的数据结构。A一维表格B二维表格C三维表格D四维表格在用python编程对数据进行分析的时候,代码pandas.DataFrame.sum()执行的操作是()A返回所有列的和B返回所有行的和C返回所有数据中的最大值D返回所有数中最小值利用python程序绘制y=2的x次方(y=2^x)函数图像,则下列程序第五行应该填写的代码是()1Importmatplotlib.pyplotasplt2Importnumpyasnp3x=np.linspace(0,10,50)4Y=2**x56Plt.show()Aplt.plot(x,y)Bplt.plot(y,x)Cplt.bar(x,y)Dplt.boxplot(x,y)吴老师利用python编写一个程序画出一个一元一次方程的函数图,程序如下所示:1importnumpyasnp2frommatplotlibimportpyplotasplt3x=np.arange(1,10)4y=2*x*x+6*x-125plt.title(“y=2*x*x+6*x-12”)6plt.xlable(“x”)7plt.ylable(“y”)8plt,plot(x,y)9plt.show()请问程序第5行语句的作用是:()请问程序第8行语句的作用是:()如果将第8行plt.plot(x,y)语句改为plt.bar(x,y),则程序执行结果变为绘制()图。利用python编程处理数据的时候,常常会用到pandas库,其中一维数据结构是series1importrandom2s=pandas.Series([4,6,7])
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五版承包工地食堂餐厨垃圾处理合同模板3篇
- 2024蔬菜加工产品销售合作协议3篇
- 2024年股权转让合同标的及属性详细描述
- 2024年版物业托管服务协议版B版
- 二零二五版离婚协议书起草与审核合同2篇
- 2024版房屋赠与合同协议书大全
- 天津中德应用技术大学《教育技术与传播》2023-2024学年第一学期期末试卷
- 二零二五版家政服务+家庭健康促进合同3篇
- 太原幼儿师范高等专科学校《西医外科学医学免疫学与病原生物学》2023-2024学年第一学期期末试卷
- 二零二五年特殊用途变压器安装与性能测试合同2篇
- 2024年国家级森林公园资源承包经营合同范本3篇
- 对口升学《计算机应用基础》复习资料总汇(含答案)
- 《浸没式液冷冷却液选型要求》
- 迪士尼乐园总体规划
- 2024年江苏省苏州市中考数学试卷含答案
- 2024年世界职业院校技能大赛高职组“市政管线(道)数字化施工组”赛项考试题库
- 介绍蝴蝶兰课件
- 大学计算机基础(第2版) 课件 第1章 计算机概述
- 数字化年终述职报告
- 2024年职工普法教育宣讲培训课件
- 安保服务评分标准
评论
0/150
提交评论