版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Tracy 2017 年 3 月 8 日1676 【】博客内容由厦门大学数据库拥有,!一.运行环境介绍返回 Spark首页对 Scala 代码进行打包编译时,可以采用 Maven,也可以采用 sbt,相对而言,业界使用sbt。本介绍如何在 Ubuntu 中使用 Eclipse 来开发 scala程序(使用 Maven 工具),在 Spark 2.1.0,scala 2.11.8 下验证通过。使用Eclipse,可以直接运行代码,省去许多繁琐令。(相关文章:如何在Ubuntu 中使用 Eclipse 来开发 scala 程序(使用sbt 工具)使用 Eclipse 编写 Spark 应用程序(S
2、cala+Maven)二.安装必备Spark 和scala 安装方法可以参考,Spark 安装和使用 ,Scala 安装,eclipse 可以安装 scala ide for eclipse,这样可以省下很多工夫去不用安装maven 和scala 类似的相关插件,进入scala ide for eclipse,图如下所示,选择Linux GTK 64 bit,Scala ide for eclipse ubuntu 16.04spark 2.1.0scala 2.11接下来解压安装包到/usr/local 下,并测试运行eclipse1.sudo tar -zxvf /scala-SDK-4.
3、5.0-vfinal-2.11-linux.gtk.x86_64.tar.gz -C /usr/local2.cd /usr/local3./eclipse/eclipsehttp:/blog/1406/javascript:void(0);http:/blog/1406/javascript:void(0);出现如下界面说明运行成功了。如果各位没有安装该版本的eclipse,很可能会花费不必要的麻烦去安装相关的插件,下面笔者也介绍下安装maven 和scala 插件的方法,(ps:安装了scala idefor eclipse 的可以直接跳过该步骤)安装maven 插件和scala 插件先进
4、入eclipse 后,点击Help-Install New Software,在出现的install 界面上输入maven 插件的(注意:末尾的neno 是eclipse 对应的版本名称,如果你用的不是neno 版本,请换成自己用的eclipse 版本号),然后再在下面的文本框输入maven,点击selectall,点击next,接下来一直点击next 或 finish 就可以了。安装scala 插件同样,点击Help-Install New Software,在出现的install 界面上输入scala 插件的, ,摁下回车键,接着select all,然后同样一直next 或finish
5、就可以了。在/usr/local/spark 下建立目录/mycode/wordcount,然后在“/usr/local/spark/mycode/wordcount”目录下新建一个包含了一些语句的文本文件word.txt,命令如下:1.cd /usr/local/spark2.mkdir mycode3.cd mycode4.mkdir wordcount5.cd wordcount6.vim word.txt你可以在文本文件中随意输入一些单词,用空格隔开,会编写 Spark 程序对该文件进行单词词频统计。然后,按键盘Esc 键退出vim 编辑状态,输入“:wq”保存文件并退出vim 编辑器
6、。http:/blog/1406/javascript:void(0);http:/blog/1406/javas cript:void(0);打开eclipse 后,在工程栏右键New-Project,在出现的界面上双击maven文件,选择maven project,先点击右下角的 Add Archetype,第一个Archetype Grou选择net.alchim31.maven,第二个Archetype Artifactid 选择scala-archetype-simple,第三个选择 ver是 1.6,点击OK,在Catalog 里选择All Catalogs,在filter 里输入
7、scala,会出现net.alchim31.maven,ver为 1.6 版本的选项,选择它,点击next,然后在Grou上填写dblab,在Artifact 填写 WordCount,package 填写dblab.WordCount,点击Finish。这样就可以在maven 上创建 Scala 类了。三.创建maven 工程四.创建scala 类,运行scala 程序点击新建的WordCount 工程,再选择src/main/scala,右击dblab.WordCount那个建成的包,New-scala Class,然后在Name 那个文本框中输入dblab.WordCount.WordC
8、ount,点击Finish,然后将如下代码完全进去1.2. import.apache.spark.SparkContext._3.import.apache.spark.SparkConfimport.apache.spark.SparkContext4.5.object WordCount 6.def main(args: ArrayString) 7.val inputFile =file:/usr/local/spark/mycode/wordcount/word.txt8.val conf = new SparkConf().setAppName(WordCount).setMast
9、er(local2)9.val sc = new SparkContext(conf)10. val textFile = sc.textFile(inputFile)11. val wordCount = textFile.flatMap(line = line.split( ).map(word = (word, 1).reduceByKey(a, b) = a + b)12. wordCount.foreach(prln)13. 14. http:/blog/1406/javascript:void(0);http:/blog/1406/javascript:void(0);接下来编译p
10、om.xml 文件,把代码运行的包导入环境中,如图然后将pom.xml 里的内容清空,黏贴如下代码1./maven-v4_0_0.xsd2. 4.0.03. dblab4. WordCount5. 0.0.1-SNAPSHOT6. 20087. .1.0ation=.= xsi:schemaLocproject xmlns= xmlns:xsi10. 11.12. 13. 14. scala-tools.15. Scala-Tools Maven2 Reitory16.17. 18. 19.20. 21. 22. scala-tools.23. Scala-Tools Mav
11、en2 Reitory24.25. 26. 27.28. 29. 30. .apache.spark31. spark-core_$scala.ver32.$spark.ver33. 34.35. 36. junit37. junit38. 4.439. test40. 41. 42. .specs43. specs44. 1.2.545. test46. 47. 48.49. 50. src/main/scala51. src/test/scala52. 53. 54.55. maven-scala-plugin56. 57. 58. 59. compile60. pile61. 62. 6
12、3. 64. 65. $scala.ver66. 67. -:jvm-1.568. 69. 70. 71. 72. .apache.maven.plugins73. maven-eclipse-plugin74. 75.true.scala-tools76.77.mand78. 79. 80. ch.epfl.l.sdt.core.scalanature81. 82. 83. .eclipse.jdt.launching.JRE_CONTAINER84. ch.epfl.l.sdt.launching.SCALA_CONTAINER85. 86. 87. 88. 89. 90. 91. 92.
13、 93.scala-toolsch.epfl.l.sdt.core.scalabuilder94. maven-scala-plugin95. 96. $scala.ver97. 98. 99. 100. 101.在代码处右击,Run AS-Maven build,编译,如果在Console 栏里出现 Buildsucs,说明编译成功回到scala 程序界面,你会发现左边第二个src/test/scala 文件有个小红叉,这个对编译结果并没影响,但会影响后面打包,可以删除它http:/blog/1406/javascript:void(0);http:/blog/1406/javascript
14、:void(0);继续右击WordCount.scala.Run AS -scala Application,得出结果接着返回pom.xml 的界面,空白处右击,Run AS-Maven install,出现如下界面后说明打包已成功,打开Ubuntu 自带的文件夹系统,进入/home/hadoop/workspace/WordCount/,会看到WordCount-0.0.1-SNAPSHOT.jar,就是maven 打包成功的文件然后,由于Ubuntu 系统的原因,包的路径太深,运行很可能会出现找不到类的异常,所以可以把这个包移动到常用的较浅的目录下,1.nt-0.0.1-SNAPSHOT.jar /usr/local #/usr/local 是本人常用的目录接着运行以下指令,1. /usr/local/spark/bin/spark-submit -class WordCount/usr/local/WordCount-0.0.1-SNAPSHOT.jar出现
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 云南省昆明八中2025年高考物理模拟试卷(含答案)
- 安徽省联考2024-2025学年高一上学期1月期末英语试题(无答案)
- 生物-内蒙古鄂尔多斯市西四旗2024-2025学年2025届高三第一(上)学期期末联考试卷试题和答案
- 2024重庆离婚协议书格式范文
- 2024自动售货机租赁合同
- 2025年度5G通信基站建设与维护合同范本3篇
- 2025年度宠物猫寄养与宠物用品租赁一体化协议3篇
- 2024颐和园职工制服采购环保责任及回收利用合同3篇
- 2024甲乙双方关于购买房产的合同
- 2024版公私合营养老院服务协议示范文本版B版
- 环境毒理学(全套课件499P)
- 成品烟道安装施工方案
- 耳部铜砭刮痧技术评分标准
- 2022年初中历史课程标准电子版
- 数据库原理与应用课后习题答案李春葆 编
- 因公出国教育谈话记录
- 工程勘察设计收费标准(2002年修订本)完整版
- 湖北世界最大跨度三塔全悬吊悬索长江大桥建设移交B投标文件
- YC/T 306-2009烟草物流设备条烟分拣设备
- JJF 1616-2017脉冲电流法局部放电测试仪校准规范
- GB/T 6671-2001热塑性塑料管材纵向回缩率的测定
评论
0/150
提交评论