《Spark大数据商业实战三部曲 内核解密 商业案例 性能调优》读书笔记思维导图PPT模板下载_第1页
《Spark大数据商业实战三部曲 内核解密 商业案例 性能调优》读书笔记思维导图PPT模板下载_第2页
《Spark大数据商业实战三部曲 内核解密 商业案例 性能调优》读书笔记思维导图PPT模板下载_第3页
《Spark大数据商业实战三部曲 内核解密 商业案例 性能调优》读书笔记思维导图PPT模板下载_第4页
《Spark大数据商业实战三部曲 内核解密 商业案例 性能调优》读书笔记思维导图PPT模板下载_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

思维导图PPT模板《Spark大数据商业实战三部曲内核解密商业案例性能调优》最新版读书笔记,下载可以直接修改案例原理源码第章实战分析性能系统数据代码应用内存商业综合广告电商环境电影实践本书关键字分析思维导图01内容简介第1版前言第2版前言第1篇内核解密篇目录03020405第2篇商业案例篇第4篇Spark+AI解密篇第3篇性能调优篇目录0706内容摘要本书基于Spark2.4.X版本,以Spark商业案例实战和Spark在生产环境下几乎所有类型的性能调优为核心,以Spark内核解密为基石,对企业生产环境下的Spark商业案例与性能调优抽丝剥茧地进行剖析。全书共分4篇,内核解密篇基于Spark源码,从一个实战案例入手,循序渐进地全面解析Spark2.4.X版本的新特性及Spark内核源码;商业案例篇选取Spark开发中最具代表性的经典学习案例,在案例中综合介绍Spark的大数据技术;性能调优篇覆盖Spark在生产环境下的所有调优技术;Spark+AI解密篇讲解深度学习实践、Spark+PyTorch案例实战、Spark+TensorFlow实战以及Spark上的深度学习内核解密。内容简介第2版前言第1版前言第1篇内核解密篇第1章电光石火间体验Spark2.4...第2章Spark2.4技术及原理第3章Spark的灵魂:RDD和Dat...第4章SparkDriver启动内幕...第5章Spark集群启动原理和源码详解第6章SparkApplicatio...010302040506第1篇内核解密篇第7章Shuffle原理和源码详解第8章Job工作原理和源码详解第9章Spark中Cache和chec...第10章Spark中Broadcast...第11章Spark与大数据其他经典组件...12345第1篇内核解密篇1.1通过RDD实战电影点评系统入门及...1.3Spark2.4源码阅读环境搭...1.2通过DataFrame和Data...第1章电光石火间体验Spark2.4...2.1Spark2.4综述2.2Spark2.4Core2.3Spark2.4SQL2.4Spark2.4Stream...2.5Spark2.4MLlib2.6Spark2.4GraphX010302040506第2章Spark2.4技术及原理3.1为什么说RDD和DataSet是...3.2RDD弹性特性7个方面解析3.3RDD依赖关系3.4解析Spark中的DAG逻辑视图3.5RDD内部的计算机制3.6SparkRDD容错原理及其四...010302040506第3章Spark的灵魂:RDD和Dat...3.7SparkRDD中Runtim...3.9基于DataSet的代码如何转化...3.8通过WordCount实战解析S...第3章Spark的灵魂:RDD和Dat...4.1SparkDriverPro...4.2DAGScheduler解析4.3TaskScheduler解析4.4SchedulerBackend...4.5打通Spark系统运行内幕机制循...4.6本章总结010302040506第4章SparkDriver启动内幕...5.1Master启动原理和源码详解5.2Worker启动原理和源码详解5.3ExecutorBackend启...5.4Executor中任务的执行5.5Executor执行结果的处理方...5.6本章总结010302040506第5章Spark集群启动原理和源码详解6.1SparkApplicatio...6.2SparkApplicatio...6.3从Application提交的角...6.4从Application提交的角...6.5Spark1.6RPC内幕解...6.6本章总结010302040506第6章SparkApplicatio...7.1概述7.2Shuffle的框架7.3HashBasedShuff...7.4SortedBasedShu...第7章Shuffle原理和源码详解7.5TungstenSorted...7.7本章总结7.6Shuffle与Storage模...第7章Shuffle原理和源码详解8.1Job到底在什么时候产生8.2Stage划分内幕8.3Task全生命周期详解8.4Driver如何管理Shuffl...第8章Job工作原理和源码详解9.2Spark中checkpoint...9.1Spark中Cache原理和源码...第9章Spark中Cache和chec...10.2Spark中Accumulat...10.1Spark中Broadcast...第10章Spark中Broadcast...11.1Spark组件综合应用11.2Spark与Alluxio整合...11.3Spark与JobServe...11.4Spark与Redis整合原理...第11章Spark与大数据其他经典组件...第2篇商业案例篇第12章Spark商业案例之大数据电影...第13章Spark2.2实战之Dat...第14章Spark商业案例之电商交互式...第15章Spark商业案例之NBA篮球...第2篇商业案例篇第16章电商广告点击大数据实时流处理系...第18章使用SparkGraphX实...第17章Spark在通信运营商生产环境...第2篇商业案例篇12.1通过RDD实现分析电影的用户行...12.2通过RDD实现电影流行度分析12.3通过RDD分析各种类型的最喜爱...12.4通过RDD分析电影点评系统仿Q...12.5通过RDD分析电影点评系统实现...12.6通过SparkSQL中的SQ...010302040506第12章Spark商业案例之大数据电影...12.7通过SparkSQL下的两种...12.8通过SparkSQL下的两种...12.9通过DataFrame分析最受...12.10纯粹通过DataFrame分...第12章Spark商业案例之大数据电影...12.11纯粹通过DataSet对电影...12.13本章总结12.12大数据电影点评系统应用案例涉...第12章Spark商业案例之大数据电影...13.1企业人员管理系统应用案例业务需...13.2企业人员管理系统应用案例数据建...13.3通过SparkSession创...13.4通过map、flatMap、m...13.5通过dropDuplicate...13.6通过sort、join、joi...010302040506第13章Spark2.2实战之Dat...13.7通过randomSplit、s...13.8通过groupBy、agg、c...13.9通过collect_list、...13.10通过avg、sum、coun...13.11Dataset开发实战企业人...13.12本章总结010302040506第13章Spark2.2实战之Dat...14.1纯粹通过DataSet进行电商...14.2纯粹通过DataSet分析特定...14.3纯粹通过DataSet进行电商...14.4电商交互式分析系统应用案例涉及...14.5本章总结12345第14章Spark商业案例之电商交互式...15.1NBA篮球运动员大数据分析系统...15.2NBA篮球运动员大数据分析系统...15.3NBA篮球运动员大数据分析代码...15.4NBA篮球运动员大数据分析完整...15.5NBA篮球运动员大数据分析系统...15.6本章总结010302040506第15章Spark商业案例之NBA篮球...16.1电商广告点击综合案例需求分析和...16.2电商广告点击综合案例在线点击统...16.3电商广告点击综合案例黑名单过滤...16.4电商广告点击综合案例底层数据层...16.5电商广告点击综合案例动态黑名单...16.6动态黑名单基于数据库MySQL...010302040506第16章电商广告点击大数据实时流处理系...16.7通过updateStateBy...16.8实现每个省份点击排名Top5广...16.9实现广告点击Trend趋势计算...16.10实战模拟点击数据的生成和数据...16.11电商广告点击综合案例运行结果16.12电商广告点击综合案例Scal...010302040506第16章电商广告点击大数据实时流处理系...16.13电商广告点击综合案例课程的J...16.15本章总结16.14电商广告点击综合案例课程的S...第16章电商广告点击大数据实时流处理系...17.1Spark在通信运营商融合支付...17.3本章总结17.2Spark在光宽用户流量热力分...第17章Spark在通信运营商生产环境...18.1SparkGraphX发展演...18.2SparkGraphX设计实...18.3TableOperator和...18.4Vertices、edges和...18.5以最原始的方式构建Graph18.6第一个Graph代码实例并进行...010302040506第18章使用SparkGraphX实...18.7数据加载成为Graph并进行操...18.8图操作之PropertyOp...18.9图操作之Structural...18.10图操作之Computing...18.11图操作之Collecting...18.12图操作之JoinOpera...010302040506第18章使用SparkGraphX实...18.13图操作之aggregateM...18.14图算法之PregelAPI...18.15图算法之ShortestPa...18.16图算法之PageRank原理...18.17图算法之TriangleCo...18.18使用SparkGraphX...010302040506第18章使用SparkGraphX实...第3篇性能调优篇第19章对运行在YARN上的Spark...第20章Spark算子调优最佳实践第21章Spark频繁遇到的性能问题及...第22章Spark集群资源分配及并行度...第23章Spark集群中Mapper端...第24章使用Broadcast实现Ma...010302040506第3篇性能调优篇第25章使用Accumulator高效...第26章Spark下JVM性能调优最佳...第27章Spark五大子框架调优最佳实...第28章Spark2.2.0新一代钨...第3篇性能调优篇第29章SparkShuffle调优...第31章Spark大数据性能调优实战专...第30章Spark性能调优之数据倾斜调...第3篇性能调优篇19.1运行环境Jar包管理及数据本地...19.2SparkonYARN两种...19.3YARN队列资源不足引起的Sp...19.4SparkonYARN模式...19.5YARN-Client模式下网...19.6YARN-Cluster模式下...010302040506第19章对运行在YARN上的Spark...20.1使用mapPartitions...20.2使用foreachPartit...20.3使用coalesce取代reP...20.4使用repartitionAn...20.5使用treeReduce取代r...20.6使用treeAggregate...010302040506第20章Spark算子调优最佳实践20.7reduceByKey高效运行...20.8使用AggregateByKe...20.9Join不产生Shuffle的...20.10RDD复用性能调优最佳实践第20章Spark算子调优最佳实践21.1使用BroadCast广播大变...21.2使用Kryo取代Scala默认...21.3使用FastUtil优化JVM...21.4Persist及checkpo...21.5序列化导致的报错原因解析和调优...21.6算子返回NULL产生的问题及解...010302040506第21章Spark频繁遇到的性能问题及...22.2Spark并行度设置最佳实践22.1实际生产环境下每个Execut...第22章Spark集群资源分配及并行度...23.2Spark集群中Reducer...23.1Spark集群中Mapper端...第23章Spark集群中Mapper端...24.2使用Broadcast实现Ma...24.1使用Broadcast实现Ma...第24章使用Broadcast实现Ma...25.1Accumulator内部工作...25.3Accumulator作全局计...25.2Accumulator自定义实...第25章使用Accumulator高效...26.1JVM内存架构详解及调优26.2Spark中对JVM使用的内存...26.3Spark下JVM的On-He...26.4Spark下JVMGC导致的...26.5Spark下Executor对...26.6Spark下JVM内存降低Ca...010302040506第26章Spark下JVM性能调优最佳...27.1SparkSQL调优原理及调...27.2SparkStreaming...27.3SparkGraphX调优原...27.4SparkML调优原理及调优...27.5SparkR调优原理及调优最佳...12345第27章Spark五大子框架调优最佳实...28.1概述28.2内存管理与二进制处理28.3缓存感知计算28.4代码生成28.5本章总结12345第28章Spark2.2.0新一代钨...29.1Shuffle对性能消耗的原理...29.2Spark.Shuffle.m...29.3Spark.Shuffle.b...29.4Spark.Shuffle.c...29.5Spre...29.6Spark.Shuffle.c...010302040506第29章SparkShuffle调优...29.7Spark.Shuffle.f...29.8Spark.Shuffle.i...29.9Spark.Shuffle.i...29.10Spark.Shuffle29.11Spark.reducer29.12Spark.Shuffle010302040506第29章SparkShuffle调优...29.13Spark.Shuffle29.14Spark.Shuffle29.15Spark.Shuffle29.16Spark.Shuffle29.17Spark.Shuffle29.18Spark.Shuffle010302040506第29章SparkShuffle调优...30.1为什么数据倾斜是分布式大数据系...30.2数据倾斜解决方案之一:对源数据...30.3数据倾斜解决方案之二:适当提高...30.4数据倾斜解决方案之三:使用随机...30.5数据倾斜解决方案之四:使用Ma...30.6数据倾斜解决方案之五:对倾斜的...0103

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论