《实战大数据 Hadoop Spark Flink 从平台构》读书笔记思维导图PPT模板下载_第1页
《实战大数据 Hadoop Spark Flink 从平台构》读书笔记思维导图PPT模板下载_第2页
《实战大数据 Hadoop Spark Flink 从平台构》读书笔记思维导图PPT模板下载_第3页
《实战大数据 Hadoop Spark Flink 从平台构》读书笔记思维导图PPT模板下载_第4页
《实战大数据 Hadoop Spark Flink 从平台构》读书笔记思维导图PPT模板下载_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《实战大数据HadoopSparkFlink从平台构》最新版读书笔记,下载可以直接修改思维导图PPT模板大数据数据管理平台系统离线小结数据库技术集群实时工程师项目资源用户开发分析行为第章本书关键字分析思维导图01第1章大数据技术概述第3章基于Hadoop构建大数据平台第5章用户行为离线分析——构建日志采集...第2章搭建IDEA开发环境及Linux...第4章基于HBase和Kafka构建海...第6章基于Spark的用户行为实时分析目录030502040607第7章基于Flink的用户行为实时分析内容简介第8章用户行为数据可视化目录0908内容摘要《实战大数据(Hadoop+Spark+Flink)——从平台构建到交互式数据分析(离线/实时)》详细介绍了大数据工程师在实际工作中应该熟练掌握的大数据技术。全书共8章,分别是大数据技术概述、搭建IDEA开发环境及Linux虚拟机、基于Hadoop构建大数据平台、基于HBase和Kafka构建海量数据存储与交换系统、用户行为离线分析—构建日志采集和分析平台、基于Spark的用户行为实时分析、基于Flink的用户行为实时分析、用户行为数据可视化。本书以一个完整的大数据项目为主线,涵盖Hadoop、Spark、Flink等主流大数据技术,按照大数据工程师的项目开发流程,理论与实践结合,逐步推进,使读者在学习大数据核心技术的同时,也能掌握开发大数据项目的完整流程,从而获得大数据项目开发经验。《实战大数据(Hadoop+Spark+Flink)——从平台构建到交互式数据分析(离线/实时)》既可以作为大数据工程师的必备开发手册,也可以作为高校大数据及相关专业的教材或实验手册。第1章大数据技术概述一般使用Flume、Logstash、Filebeat等工具采集日志文件数据,使用Sqoop、Canal等工具采集数据库中的数据。1.1什么是大数据1.2大数据平台架构1.3大数据工程师的技能树1.4大数据项目需求分析与设计1.5本章小结12345第1章大数据技术概述第2章搭建IDEA开发环境及Linux...为了提高集群资源利用率、解决资源共享问题,YARN在这种应用场景下应运而生。2.1搭建IDEA开发环境2.3本章小结2.2搭建Linux虚拟机第2章搭建IDEA开发环境及Linux...第3章基于Hadoop构建大数据平台YARN是一个通用的资源管理系统,对整个集群的资源进行统筹管理,其目标是将短作业和长服务混合部署到一个集群中,并为它们提供统一的资源管理和调度功能。3.1Zookeeper分布式协调服务3.2HDFS分布式文件系统3.3YARN资源管理系统3.4Hadoop分布式集群的构建3.5MapReduce分布式计算框架3.6本章小结010302040506第3章基于Hadoop构建大数据平台第4章基于HBase和Kafka构建海...当然Spark和Flink既支持离线处理也支持实时处理,SparkCore和FlinkDataSet支持离线处理,SparkStreaming和FlinkDataStream支持实时处理。4.1构建HBase分布式实时数据库4.3本章小结4.2搭建Kafka分布式消息系统第4章基于HBase和Kafka构建海...第5章用户行为离线分析——构建日志采集...大数据工程师需要掌握SparkStreaming、FlinkDataStream等大数据实时计算技术。5.1搭建Flume日志采集系统5.2使用Flume采集用户行为数据5.3基于Hive的离线大数据分析5.4基于Hive的用户行为数据离线分...5.5本章小结12345第5章用户行为离线分析——构建日志采集...第6章基于Spark的用户行为实时分析HBase数据库构建在HDFS之上,既解决了海量数据存储又能实现数据的实时随机查询与更新,满足线上用户的服务需求其中多租户、弹性伸缩、动态分配是资源管理系统要解决的核心问题。6.1Spark快速入门6.2SparkCore的核心功能6.3Spark分布式集群的构建6.4基于SparkStreamin...第6章基于Spark的用户行为实时分析6.5基于SparkSQL的新闻项目...6.7本章小结6.6基于SparkStructur...第6章基于Spark的用户行为实时分析第7章基于Flink的用户行为实时分析大数据工程师需要掌握MapReduce、Hive、SparkCore、SparkSQL、FlinkDataSet等大数据离线计算技术。7.1Flink快速入门7.2Flink分布式集群的构建7.3基于FlinkDataStre...7.4基于FlinkDataSet的...7.5本章小结12345第7章基于Flink的用户行为实时分析第8章用户行为数据可视化一种方式是使用冗余硬盘阵列(RAID),另外一种方式是本书稍后会讲到的Hadoop分布式文件系统(HadoopDistributedFileSystem,HDFS)。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论