版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章数据处理和可视化表达
课题数据处理和可视化表达课时4课时
本章是必修一第五章的内容,随着移动互联网和物联网的飞速发
展,人类社会产生的数据以惊人的速度增长,海量的数据几乎包含了一
教材切形式的数据。本章要让同学认识到大数据及其特征,认识大数据对人
分析们日常生活的影响,了解数据采集、分析和可视化表达的基本方法;学
会选用恰当的软件工具或平台处理数据,分析报告;学会利用python
的扩展库来解决会考题,理解对数据保护的意义。
在第五章当中学生已经对python语言已经有了基本的了解,在本
章的学习党中除了了解大数据还要学习python的扩展库。在本章节的
学情
学习当中要注重培养学生学习的主动性,培养学生自主学习的意识。让
分析
学生学会选择恰当的学习工具进行学习,建构知识,培养技能,发展
思维。促进信息技术学科核心素养达成,完成项目学习目标。
1.能够理解大数据的4V特征并能举出例子。
教学2.了解数据采集,分析和可视化表达的基本方法。
目标3.了解python的第三方库的基础知识,学会利用第三方库来做题。
4.促进信息技术学科核心素养达成,完成学习目标。
重点:大数据的4V特征,可视化表达的基本方法,python的扩展
重点与
库。
难点
难点:python的扩展库。
教学方
讲授法、任务驱动法、小组合作法、自主探究法
法
课前准
多媒体课件、教学视频,随堂练习
备
教学设计
让学生进行思考你在网站购物时是否出现过类似的事情:当你在搜
导入索一件物品的时候,购物网站就会给你进行类似商品的推荐和广告的投
放。从此例子来引入本章内容的学习。
任务一:认识大数据的概念和特征
1.让同学自行阅读课本P101-P102来了解大数据的概念和特征,
阅读完成之后学生进行总结,教师加以补充,在上新课之前所举的购物
网站的例子就是应用的大数据。
2.让学生4人为小组讨论一下在日常生活中还有哪些应用了大数
据?例如移动支付、网约车、高德地图等。
任务二:观看视频总结大数据对日常生活的影响
让学生们观看视频《大数据时代,我们无处可逃》然后以小组为单
位讨论一下大数据时代对日常生活的影响。
(一)正面影响
1.方便支付2.方便出行3.方便购物和产品推荐4.方便看病和
诊病
(二)负面影响
授新课1.个人信息泄露2.信息伤害与诈骗
任务三:阅读课本了解数据采集的方法和工具
让学生自行阅读课本P104-P109了解数据采集的方法和工具
以及数据的存储和保护,阅读完成之后学生进行总结。
任务四:学习python网络采集程序使用的扩展库
(一)导入模块的方法
1.import模块名as别名
例如:importnumpyasnp
2.from模块名import功能名as别名
例如:frommatplotlibimportpyplotaspit
(三)扩展库
1.NumPy:是Python语言的一个扩展程序库,支持大量的维度数
组与矩阵运算,此外也针对数组运算提供大量的数学函数库。
2.SciPy:是一个算法库和工具包
3.Matplotlib:是一个2D绘图库,可以生成绘图、直方图、条形图、
散点图。
4.NumPy常与SciPy和Matplotlib一起使用
importnumpyasnp
importmatplotlib.pyplotaspit
fromscipyimportoptimize
x=[l,2,3,4,5,6,7,8]
y=[1,1/2,1/3,1/4,1/5,1/6,1/7,1/8]
pit.title("test")#图标名称
pit.xlabel("X")#乂轴的名称
pit.ylabel(Y)#y轴的名祢
pit.scatter(x,y)#绘制散点图
pit.show()
金*Python3.8.5Shell*
importnumpyasnp
importmatplotlib.pyplotaspit
fromscipyimportoptimize
x=[l,2,3,4,5,6,7,8]
y=[l,1/2,1/3,1/4,1/5,1/6,1/7,1/8]
pit.title("test")#图标名称
pit.xlabel("X")#*轴的名称
plt.ylabel(〃Y〃)#y轴的名称
pit.plot(x,y)#绘制曲线图
pit.show()
FileEditShellDebugOptionsWindowHelp
知识点:
函数描述
Pit.title()设置图像的标题
pit.xlableO设置X轴的名称
Pit.ylableO设置y轴的名称
pit.show()显示图像
Pit.plot(x,y)绘制线性图
Pit.scatter(x,y)绘制散点图
Pit.pie(x,y)绘制饼图
Pit.bar(x,y)绘制柱形图
5.pandas库:Pandas库主要用于快速简单的数据操作,聚合和可
视化呈现。库中有两个主要的数据结构,一维数组(Series)和二维数
组(DataFrame)结构。
(1)Series:一维数组
importpandasaspd
grade=[47,58,67]
gradel=pd.Series([47,58,67])#自动索引
print(grade)
print(gradel)
二RESTART:C:\Users\s八A]
Py
rise.5867
[47,47
058
167
2
dtype:int64
(2)DataFrame:二维的表格型数据结构
importpandasaspd
grade=[[88,89,92],[77,86,89],[94,99,101]]
name=[〃张华〃,"李明〃,"王兴〃]
sub=[〃英语",〃数学”,〃语文〃]
df=pd.DataFrame(grade,name,sub)
print(df)
一英语」数学语文
张华888992
李明778689
王兴9499101
series求和sum(),求平均值mean()
importpandas
s=pandas.Series([6,8,9])
print(s.sum())#莉和
print(s.mean())#求平均值
23
7.666666666666667
DataFrame的行列求和,求平均值
importnumpyasnp
importpandasaspd
grade=[[88,89,92],[77,86,89],[94,99,101]]
name=["张华","李明","王兴”]
sub=["英语","数学","语文”]
df=pd.DataFrame(grade,name,sub)
dfRow_sum,]=df.apply(ambdax:x.sum(),axis=l)#行的求和
dffRow_mean,]二df.apply(lambdax:x.mean(),axis=l)#行的平均分
df.locfCol_sum,]=df.apply(lambdax:x・sum。)#列的求和
df.locfCol_mean,]=df.apply(lambdax:x.mean。)#列的平均值
print(df)
英语数学语文Row_sumRowmean
张
88.089.092.0269.0134.50
李
77.086.089.0252.0126.00
王
94.099.0101.0294.0147.00
cosum259.0274.0282.0815.0407.50
comean129.5137.0141.0407.5203.75
知识点:
Pandas.DataFrame.sum()返回所有列的和
Pandas.DataFrame.suni(axis=l)返回所有行的和
扩展:
Random生成随机数的函数库
importrandom
numl=random.random()#返回随机生成的一个实数
num2=random.randint(0,1。)#生成一个[0,10]之间的一个整数
print(numl)
print(num2)
0.5992866603390408
6
»>
0.8221011022241507
9
»>
importrandom
stud工厂小黄〃,〃小红〃,〃小蓝〃,〃小绿〃]
print(〃选手的报名顺序:\stud)
random,shuffle(stud)#打乱选手的报名顺序
print(〃选手的随机报名顺序为:〃,stud)
选手的报名顺序;['小黄',’小红',‘小蓝‘,‘小绿']
选手的随机报名顺序为:[‘小绿‘,‘小蓝‘,‘小黄‘,‘小红']
»>
知识点:random,random()返回随机生成的一个实数
Random,randint(a,b)生成一个[a,b]之间的整数
Random.Shuffle()打乱排序
任务五:观看视频了解数据的分析
数据的分析一般包括特征探索,关联分析,聚类分类,建立模型和
模型评价。
1、数据的特征探索:对数据进行预处理,发现和处理缺失值、异
常数据、绘制直方图、求最大值、最小值、极差
2、关联分析:发现大量数据集中的关联性或相关性,从而描述了
一个事物中某些属性同时出现的规律和模式。
3、聚类分析:依据研究对象(样品或指标)的特征,对其进行分
类的方法,减少研究对象的数目。
任务六:阅读课本了解数据的可视化表达的方式,观看视频了解什
么是词云图
一数据
J__IZ学生1、
学驾技数来蠢
技术数据”信息蕤
:习^^习数据
数据及术备一
■雪居
词云图是目前常用的关键词可视化数据的表达方式,词云图通常使
用文字的大小和颜色来表示关键词出现的频次。
用python编程进行词云图的制作的顺序为:导入文本,分词,特
征提取,数据分析,保存词云图
总结由学生进行总结,教师进行补充
1.手机导航应用能够实时推荐最快路线,主要体现了大数据的()
特征
A数据体量巨大B数据类型多
C数据变化速度快D价值密度低
课堂练
习22.020年11月1日,正式开始第七次全国人口普查,普查信息除了普
查员登记获取之外,还可以通过小程序自主填报。后者的数据采集方式
是()
A实验数据采集B传感器采集
C网络爬虫D系统录入
3.我们在用python进行数据分析的时候,经常会用到pandas库中的
DataFrame,这是类似于()的数据结构。
A一维表格B二维表格
C三维表格D四维表格
4.在用python编程对数据进行分析的时候,代码
pandas.DataFrame.sum()执行的操作是()
A返回所有列的和B返回所有行的和
C返回所有数据中的最大值D返回所有数中最小值
5.利用python程序绘制y=2的x次方(y=2%)函数图像,则下列程
序第五行应该填写的代码是()
1Importmatplotlib.pyplotaspit
2Importnumpyasnp
3x=np.1inspace(0,10,50)
4Y=2**x
5
6Pit.show()
Apit.plot(x,y)Bpit.plot(y,x)
Cpit.bar(x,y)Dpit.boxplot(x,y)
6.吴老师利用python编写一个程序画出一个一元一次方程的函数图,
程序如下所示:
y=2*x*x+6*x」2
1ZM
1importnumpyasnp
2frommatplotlibimportpyplotaspit
3x=np.arange(1,10)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 技术部门岗位职责
- 迷走神经电刺激术治疗难治性癫痫患者围手术期护理路径构建及实践研究-当代护理
- 轨道交通线路工知识理论题库
- DB13-T 5737-2023 冀北寒旱区春玉米秸秆还田垄-沟轮播栽培技术规程
- 安全教育说课稿
- 儿童脊柱保健教学课件
- LED培训资料教学课件
- 管晏列传 课件
- 培训课件-提升企业IT审计能力助力数字化转型
- 采购管理流程
- 用地性质分类表代码
- 取水协议书.doc
- 红色经典故事PPT课件
- (最新版)01SS105给排水常用仪表及特种阀门装置图集
- 锻件与铸件超声波探伤详细教程(附实例解析)
- 家庭血压测量记录表
- 学校食堂餐厨垃圾处理协议书(3篇)
- 总经理办公会资料全套模板(会议通知、议题模板、决议)
- 施工项目部标准化管理手册(线路工程分册2018年版)
- 北师大版数学四年级上册第四单元《加法交换律和乘法交换律》教案
- 胖厨师和小老鼠课件
评论
0/150
提交评论