


版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Scala语言特点,ScalaJava并发和分布式特质,特征(类似java中interfaces和 5).模式匹配(类似javaswitch)ScalaJavaScalastaticobjectmain方法就是在放object类型中;forScalaif语句、多层嵌yield语法产生新的集合;Scala定义函数使用defScala返回值类型是函数后ScalavalvarScala语法上支持很多省略的写法,如调用无参数时,()可以省略,当调.以及()List(1,2,3).size()写成Scala不支持break、continueScalatrait、Actorjavascala的关键字的差异:implicitrequiressealedsealedScalaActorActorActorModel是消息传递模型,基本特征就是消息传递importimportclassmyActorextendsdefreceive{casex:String=>println("getString="+casex:Int=>println("getcase_=>println("get}}}}objectLesson_Actordefmain(args:Array[String]):Unit=valactor=newactor!"iloveyou}}casecaseclassclassActor1extendsdefcasemsg:Message=>println("isavamsg!="+msg.actor!"imsg.actor!"iloveyoutoo}casemsg:String=>case_=>println("default}}}}classActor2(actor:Actor)extendsActor{actor!Message(this,"iloveyou!")defcasemsg:String=>if(msg.equals("iloveyoutoo!")){actor!"couldwehaveadate}}case_=>println("default}}}}objectLesson_Actor2defmain(args:Array[String]):Unit={valactor1=newActor1()valactor2=newActor2(actor1)}}SparkMR答:1.Spark可以基于内存处理数据,MRSparkDAGMRmapreduce,SparkSpark是粗粒度资源申请,MRSparksparkConfSparkRDD,RDDspark解释Spark1).RDDpartition组成的2).partition上的3).RDD之间有一系列的依赖关系4).k,vRDDSparkaction类算子cache,persist,checkpoint区别,各自cacheRDDpersist可以指定持久化的级别,最常用的是MEMORY_ONLYMEMORY_AND_DISKcachepersist都是懒执行,action类算子来触发执行cachepersist算子的返回值可以赋值给一个变量,在其他job中直接使用这个变量就是持久化的数据了,partitioncachepersistactioncheckpoint将RDD持久化到磁盘,还可以切断RDD之间的依赖关系 数据checkpoint执行原理RDDjob执行完之后,finalRDD当回溯到某一个RDD调用了checkpoint方对当前的RDD做一个标spark框架会自动启动一个新的job,RDD数据,HDFSSparkStandalone-client,clusterYarn-client,clusterclient模式提交任务后,driverdrivermasterapplication资源申请成功,drivertaskworkerworkertaskdriverdrivertaskworkerworkerdriverresourcemanager收到请求,随机选择一台nodemanager启动applicationmaster,这里的nodemanagerstandaloneworker节点applicationmaster启动后,会向resourcemanager请求一批container资源,用于启动executor5)resourcemanagernodemanager返回给applicationmaster,executor6)applicationmasternodemanagerexecutor7)executor启动后,会反向给driver,driver发送task到executor,执行情况和结果返回给driver端rs收到请求后,nodemanageram启动,amRS,containerRSnodemanagerobjectSpark02defmain(args:Array[String]):Unit=valspark=newsql.SparkSession.Builder().master("local").appName("test").getOrCreate()valsc=spark.sparkContext * valjoinRDD:RDD[(String,(Int,Int))]= * valresult:RDD[(String,(Int,Option[Int]))]= * valresult:RDD[(String,(Option[Int],Int))]= * valresult:RDD[(String,(Option[Int],Option[Int]))]= valnamePartition:Int= valscorePartition:Int= valpartitions:Int= * valresult:RDD[(String,Int)]= valpartitions:Int= * valrdd1:RDD[String]= valrdd2:RDD[String]= valresult:RDD[String]= * valresult:RDD[String]= valresult2:RDD[String]= * valrdd:RDD[String]= valresult:RDD[String]= * valresult:RDD[(String,(Iterable[Int],Iterable[Int]))]= valrdd1:RDD[String]= valrdd2:RDD[Int]= valresult:RDD[(String,Int)]= valresult2:RDD[(String,Long)]= defmain(args:Array[String]):Unit={valconf=newSparkConf()valsc=newvallines:RDD[String]=valwords:RDD[String]=lines.flatMap(line=>{line.split("")})valsampleResult:RDD[String]=words.sample(true,0.1)valsamplePairResult:RDD[(String,Int)]=sampleResult.map(word=>{newTuple2(word,1)}) valsampleSortResult:(String,Int)=sampleReduceResult.sortBy(tp=>{tp._2},false).()valsampleWord:String=sampleSortResult._1valpairResult:RDD[(String,Int)]=filterWords.map(word=>{newTuple2(word,1)})valreduceResult:RD
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度办公用品快递代理及仓储物流资源共享协议
- 2025年智能制造装备合作协议书
- 2025年电力电子元器件项目建议书
- 梭织服装企业数字化转型与智慧升级战略研究报告
- 新野纺织企业县域市场拓展与下沉战略研究报告
- 2025河南省建筑安全员B证考试题库及答案
- 2025年农村志愿服务活动报告范文
- 2025年羧甲淀粉钠项目合作计划书
- 2025年毫米波箔条项目合作计划书
- 2025云南省建筑安全员B证考试题库及答案
- 工艺能力分析报告
- 《给校园植物挂牌》课件
- 气道高反应性教学演示课件
- 健身房众筹方案
- 护理带教汇报课件
- 蔬菜种植与有机农业培训
- 新视野大学英语(第四版)读写教程1(思政智慧版)课件 Unit 5 Friendship across border and gender
- 智研咨询重磅发布:2023年中国高端聚烯烃行业供需态势、市场现状及发展前景预测报告
- JGT331-2011 建筑幕墙用氟碳铝单板制品
- 企业文化变革的阻力与推进策略
- 巡察组作风纪律情况评估表
评论
0/150
提交评论