




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
5.4.2数据可视化表达的工具处理重复值处理缺失值处理异常值系统日志采集法网络数据采集法(网络爬虫)其他数据采集法数据分析的步骤《数据与计算》P118-1221.特点:主要关注统计模型的可视化Seaborn基于且高度依赖于MatplotlibSeaborn是matplotlib的强大的一个扩展。2.例如:直方图可以总结数据也可以描绘数据的总体分布一、Seaborn1.特点:可以实现交互式可视化独立于Matplotlib可以通过浏览器以数据驱动文档的风格呈现2.绘图步骤获取数据构建画布figure()添加图层,绘图line,circle,square,scatter,multiline等;自定义视觉属性:参数color,legend选择性展示折线数据,建立复选框激活显示,复选框(checkbox)二、Bokeh三、实践操作【项目练习】运行“程序5-10-1直方图(教材范例).py”,体验可视化工具Seaborn呈现直方图。#[0,0]图只显示直方图不显示核密度估计#[0,1]图中rug=True表示要生成观测数值的小细条,#hist=False不生成直方图,只生成核密度估计。#[1,0]图绘制一个填充核密度估计#[1,1]图,既绘制直方图,又绘制和密度估计sns.distplot(d,kde=False,color="b",ax=axes[0,0])sns.distplot(d,hist=False,rug=True,color="r",ax=axes[0,1])sns.distplot(d,hist=False,color="g",kde_kws={"shade":True},ax=axes[1,0])sns.distplot(d,color="m",ax=axes[1,1])plt.show()三、实践操作【项目练习】运行“程序5-10-2Bokeh示例(教材范例).py”,体验可视化工具Bokeh呈现正弦图。N=100#np.linspace(start,stop,N)在起始值和终止值之间,返回均匀间隔的N个元素x=np.linspace(0,4*np.pi,N)y0=np.sin(x)output_file('sinewave.html')#输出网页形式
#定义画布大小和图表标题sine=figure(width=500,plot_height=500,title='Sine')#根据x、y坐标绘制圆点,如果要画成方形,则用sine.square()#size为大小,color为颜色,alpha为透明度sine.circle(x,y0,size=10,color="navy",alpha=0.5)p=gridplot([[sine]],toolbar_location=None)#网格显示show(p)四、课堂小结数据可视化表达的工具Seaborn主要关注统计模型的可视化Seaborn基于且高度依赖于MatplotlibBokeh可以实现交互式可视化独立于Matplotlib可以通过浏览器以数据驱动文档的风格呈现五、本章小结数据采集数据预处理聚类分析可视化呈现分析报告聚类分析聚类分析系统日志采集法网络数据采集法其他数据采集法异常值处理求最值、极差...绘制直方图趋势比例逻辑关系空间关系1.
Seaborn基于且高度依赖于Matplotlib,可实现交互式可视化。()2.海军军官通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的()A.在数据基础上倾向于全体数据而不是抽样数据B.在分析方法上更注重相关分析而不是因果分析C.在分析效果上更追究效率而不是绝对精确D.在数据规模上强调相对数据而不是绝对数据BB五、课堂练习3.电子警察采用拍照的方式来约束车辆的行为,其拍照的过程属于()A.数据分析B.数据采集C.数据分类D.数据可视化表达4.数据特征探索的主要任务是对数据进行预处理,以下不属于该过程的是()A.数据清洗 B.异常数据处理C.数据缺失处理 D.数据分类处理5.大数据时代,数据应用的关键是()A.教据收集B.数据存储C.数据分析D.数据再利用BA五、课堂练习C6.为了弘扬和传承中华民族勤俭节约的传统美德,引导同学们进一步深化节约粮食的意识和行为习惯,学生会开展了“我为食堂提建议”的活动。请根据学生会开展该活动的几个步骤,排出最合理的顺序()。①根据数据分析结果,撰写数据分析报告,对食堂提出合理化建议;②学生会成员去学校食堂收集数据,并制作调查问卷的题目;③利用图表形式直观展示分析数据;④对问卷进行回收整理,将无效的问卷进行剔除;⑤学生会成员对就餐同学们进行问卷调查;⑥对调查数据和食堂数据进行分析与处理。A.②⑤④⑥③①B.②④⑤③⑥①C.⑤②④⑥③①D.⑤④②③⑥①A五、课堂练习五、课堂练习《活动手册》P119-120思考题(4)问题1:网站给用户自动推荐商品的依据是什么?采用了什么分析方法?1.关联分析法:根据购买了A商品的人大概率又购买了B商品的关联性,为用户
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030年中国铸造机械制造行业运营状况与发展前景分析报告
- 2025-2030年中国金属波纹管市场发展趋势规划研究报告
- 2025-2030年中国聚氨酯慢回弹海绵女性内衣市场运营状况及发展规划分析报告
- 2025-2030年中国综合肺功能测定仪市场发展状况及投资策略研究报告
- 2025-2030年中国纯锆珠行业运行现状及发展前景分析报告
- 2025-2030年中国矿渣粉行业运营格局及发展趋势分析报告
- 2025-2030年中国真空搬运机械行业竞争格局及发展趋势分析报告
- 2025-2030年中国盆景行业竞争状况规划研究报告
- 濮阳职业技术学院《药物合成实验》2023-2024学年第二学期期末试卷
- 吉林电子信息职业技术学院《施工技术与施工组织》2023-2024学年第二学期期末试卷
- 文化产业管理专业大学生职业生涯规划书
- DSM-V美国精神疾病诊断标准
- 文献的载体课件
- 2023年高考语文全国乙卷《长出一地的好荞麦》解析
- 混凝土强度回弹检测方案
- 历年中考地理生物变态难题
- 研学旅行课程标准(一)-前言、课程性质与定位、课程基本理念、课程目标
- 部编版二年级下册语文教案全册
- 解放牌汽车CA10B后钢板弹簧吊耳加工工艺及夹具设计哈
- 大学专科《机电传动控制》课件
- 高中地理高清区域地理填图册
评论
0/150
提交评论