版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
课题5.4.1数据的可视化表达课型新授课课时安排1教学目标1.了解数据可视化呈现的主要方式,能够根据数据特点选择合适的表达方式。2.通过实践体验感受数据可视化表达的方式意义,培养学生的归纳总结能力和数据处理能力。教学重难点重点:能够了解数据可视化的呈现方式;难点:选用恰当的可视化呈现表达数据,提升数据分析的效率。教学方法讲授法、任务驱动法、演示法、实践体验法等教学过程情境导入提问:众所周知,历史上我们国家一直是人口大国,为了全面查清我国人口数量、结构、分布等方面情况,国家前后进行七次人口普查活动,这为完善我国人口发展战略和政策体系、制定经济社会发展规划、推动高质量发展提供准确统计信息支持。假如你是人口普查活动工作的一员,现在要求你处理这些种类复杂繁多且体量巨大的人口数据,并简洁明了的介绍一下全中国各省市建国以来人口数量变迁史通过观看视频《观看全中国各省市建国以来人口数量变迁史》引入课题——数据可视化表达的方式。探究新知数据可视化是指以图形、图像、地图、动画等生动、易于理解的方式展示数据和诠释数据之间的关系、趋势与规律等,以便更好地理解数据。作用:把枯燥乏味的海量数据以丰富的视觉效果呈现数据所反映的本质问题,有效提升数据分析的效率。数据可视化的呈现类型从常用和实用的维度,数据可视化的呈现类型主要分为探索和解释两种不同的类型。探索类型可以帮助人们发现数据背后的价值2、解释类型把数据简单明了地解释给人们三、可视化呈现的主要方式(一)有关趋势分析:1.柱形图:柱形图又称长条图、柱状图是一种以长方形的长度为变量的统计图表,用来比较两个或以上的价值(不同时间或者不同条件),只有一个变量,通常利用于较小的数据集分析。亦可横向排列,或用多维方式表达。2.折线图:折线图是比较常用的图表,是排列在工作表的列或行中的数据可以绘制到折线图中。折线图可以显示随时间(根据常用比例设置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势。3.案例分析某图书2015~2021年线上销售情况表一①请制作图表比较2015年到2021年本图书销售总额情况②请制作图表反应2015年到2021年本图书在京东销售金额额的增长趋势教师提供代码如下:①柱形图importpandasaspd#将pandas重命名为pd#Pyplot是Matplotlib的子库。是常用的绘图模块,能很方便让用户绘制2D图表。importmatplotlib.pyplotasplt#将pyplot重命名为pltdf=pd.read_excel('销售情况.xls')plt.rcParams['font.sans-serif']=['SimHei']#解决中文乱码x=df['年份']y=df['总销售额']plt.grid(axis="y",which="major")#生成虚线网格#x、y轴标签plt.xlabel('年份')plt.ylabel('线上销售额(元)')#图表标题plt.title('2015-2021年线上图书销售额分析图')plt.bar(x,y,width=0.5,color='b')#设置柱的宽度为0.5,颜色为蓝色#图例plt.legend(['总销售额'])plt.show()②折线图importpandasaspd#将pandas重命名为pd#Pyplot是Matplotlib的子库。是常用的绘图模块,能很方便让用户绘制2D图表。importmatplotlib.pyplotasplt#将pyplot重命名为pltplt.rcParams['font.sans-serif']=['SimHei']#解决中文乱码plt.rcParams['xtick.direction']='out'#x轴的刻度线向外显示plt.rcParams['ytick.direction']='in'#y轴的刻度线向内显示df1=pd.read_excel('销售情况.xls')#导入Excel文件x1=df1['年份']y1=df1['京东']plt.title('2015-2021年线上图书销售额分析图',fontsize='18')#图表标题plt.plot(x1,y1,label='京东',color='r',marker='o')plt.grid(axis='y')#显示网格plt.ylabel('线上销售额(元)')plt.legend('京东')#图例plt.show()有关比例分析1.饼图:饼图用于显示数据系列中各项数据的大小与各项总和的比例。能很好的展示局部和整体的关系。2.百分比圆环图:百分比圆环图常用来展示完成率以及达成率之类的数据。3.案例分析还是某图书2015~2021年线上销售情况(表一)请制作图表显示2021年本图书在京东、天猫、自营的销售金额在总金额中占比教师提供代码如下:importpandasaspdfrommatplotlibimportpyplotaspltdf=pd.read_excel('销售情况.xls')plt.rcParams['font.sans-serif']=['SimHei']#解决中文乱码y=df.iloc[6]#获取2021年销售数据y1=[y[1],y[2],y[3]]#获取京东、天猫、自营销售数据x=['京东','天猫','自营']#设置饼形图每块的颜色colors=['red','yellow','blue']plt.pie(y1,#绘图数据labels=x,#添加区域水平标签colors=colors,#设置饼图的自定义填充色labeldistance=1.02,#设置各扇形标签(图例)与圆心的距离autopct='%.1f%%',#设置百分比的格式,这里保留一位小数startangle=90,#设置饼图的初始角度radius=0.5,#设置饼图的半径center=(0.2,0.2),#设置饼图的原点textprops={'fontsize':12,'color':'k'},#设置文本标签的属性值pctdistance=0.6)#设置百分比标签与圆心的距离#设置x,y轴刻度一致,保证饼图为圆形plt.axis('equal')plt.title('2021年销售情况分析')plt.show()有关关系分析(逻辑关系)1.散点图:散点图指在回归分析中,数据点在直角坐标系平面上的分布图,散点图表示因变量随自变量而变化的大致趋势,据此可以选择合适的函数对数据点进行拟合。2.词云:“词云”就是通过形成“关键词云层”或“关键词渲染”,对网络文本中出现频率较高的“关键词”的视觉上的突出。3.案例分析:体验词云教师提供代码如下:importjiebaimportnumpyasnpfromPILimportImagefromwordcloudimportWordCloudimportmatplotlib.pyplotasplt#####img="ty.jpg"#图片路径content='kebiao.txt'#文本路径#####pic_mask=np.array(Image.open(img))#获取词云形状的图片text=open(content,encoding='utf8')#获取分词数据mylist=list(text)word_list=["".join(jieba.cut(sentence))forsentenceinmylist]new_text=''.join(word_list)wordcloud=WordCloud(font_path='simhei.ttf',background_color="white",#显示的字体和背景颜色max_words=500,#出现次数最多的前500个分词max_font_size=150,#显示的最大字号random_state=40,#分词颜色的随机配色方案数量mask=pic_mask)#词云形状w=wordcloud.generate(new_text)#传入分词列表plt.imshow(w)#
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论