24日tachyon分布式内存文件系统深入详解-操作实战_第1页
24日tachyon分布式内存文件系统深入详解-操作实战_第2页
24日tachyon分布式内存文件系统深入详解-操作实战_第3页
24日tachyon分布式内存文件系统深入详解-操作实战_第4页
24日tachyon分布式内存文件系统深入详解-操作实战_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Tachyon(20:30准时开课)--讲师:Yasaka3月12日周末班

2月26日全日制班

3月19日

班的到来!等资料请加以下几位老师

:需要代码、PPT、:1786418286何老师:1926106490詹老师:2805048645技术可以加入以下

群,

156927834热烈庆祝1221全日制班以及1226周末班爆满

!!!16.1.1日之后学费上调,考虑春节后培训的学生可以提前报名,预订座位,不管以后何时过来学习,费用都是以报名进的费用为主!不建议直接可以直接

使用选择编译安装

/amplab/tachyon/releases编译安装命令为了更好地契合用户的本地环境,如java版本、hadoop版本或其他一些

包的版本,可以

Tachyon源码自行编译Tachyon项目采用Maven进行管理,因此可以采用mvnpackage

命令进行编译打包默认依赖的java版本为1.6,默认依赖的hadoop版本为1.0.4,如果要更改这些依赖的版本号可以在编译时加入选项mvn

clean

package

-Djava.version=1.7

-Dhadoop.version=2.5.0

–DskipTests编译好后

可以在./assembly/

/中找到tachyon-assemblies-0.8.2-jar-with-dependencies.jar配置单机磁盘版cp

conf/tachyon-env.sh.template

conf/tachyon-env.sh需要配置文件并且配置变量JAVA_HOME——系统中java的安装路径和编译版本保持一致TACHYON_MASTER_ADDRESS——启动TachyonMaster的地址,默认为localhost,所以在单机模式下不用更改TACHYON_UNDERFS_ADDRESS——Tachyon使用的底层文件系统的路径,在单机模式下可以直接使用本地文件系统,如"/tmp/tachyon“vi

conf/workers里面内容不用修改,默认为localhost启动单机版格式化文件./bin/tachyon

format启动./bin/tachyon-start.sh

local去确认正常运行,可以浏览停掉Tachyon使用./bin/tachyon-stop.shTachyon命令交互./bin/tachyon

tfs从本地上传一个文件到Tachyon./bin/tachyon

tfs

copyFromLocal

LICENSE

/LICENSE除了去页面上面确认,也可以通过命令行./bin/tachyon

tfs

ls

/也可以查看文件内容./bin/tachyon

tfs

cat

/LICENSE

mand-Line-Interface.htmlbin/tachyon

tfs

[COMMAND]cat:将文件内容输出到控制台count:输出符合路径前缀的文件总数ls:输出

中的文件信息lsr:递归输出

中的文件信息mkdir:创建指定

包括路径中的父

,如果

已经存在则创建失败rm:删除文件或者tail:将文件的最末1KB输出到控制台touch:在指定的位置创建空的文件mv:将文件移动到指定位置copyFromLocal:将文件从本地文件系统拷贝到Tachyon文件系统指定位置copyToLocal:将文件从Tachyon文件系统拷贝到本地文件系统指定位置fileinfo:打印指定文件的块信息pin:将指定文件常驻内存unpin:将常驻内存的文件撤销常驻状态BDASTachyon架构图配置集群HDFS版vi

conf/tachyon-env.shTACHYON_MASTER_ADDRESS——启动TachyonMaster的地址,默认为localhost,所以在HDFS模式下修改为作为Tachyon集群里面Master的那台机器TACHYON_UNDERFS_ADDRESS——Tachyon使用的底层文件系统的路径,在

HDFS下配置为hdfs://master_host:9000vi

conf/workers里面内容修改,默认为localhost,注释掉localhost之后,添加上Tachyon集群里面所有Works的那些机器启动集群版启动HDFSstart-dfs.sh格式化文件./bin/tachyon

format启动./bin/tachyon-start.sh

all

Mount去确认正常运行,可以浏览./bin/tachyon

tfs

copyFromLocal

LICENSE

/LICENSEMapReduce整合Tachyon/tachyon-Hadoop需要增加配置exportHADOOP_CLASSPATH=/pathToTachyon/clients/client/client-0.8.2-jar-with-dependencies.jar开启mapreducestart-yarn.shhadoop

jar

/usr/hadoopsoft/hadoop-2.5.2/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.2.jarwordcount

–libjars

/usr/hadoopsoft/tachyon-0.8.2/clients/client/

/tachyon-client-0.8.2-jar-with-dependencies.jartachyon://spark001:19998/LICENSE

tachyon://spark001:19998/LICENSE-wc利用Tachyon作为数据输入输出源查看结果./bin/tachyon

tfs

ls

/LICENSE-wc./bin/tachyon

tfs

cat

/LICENSE-wc/part-r-00000除了可以配置tachyon-client-0.8.2-jar-with-dependencies.jar到HADOOP_CLASSPATH中,另外

式就是可以将tachyon-client-0.8.2-jar-with-dependencies.jar拷贝到/usr/hadoopsoft/hadoop-2.5.2/share/hadoop/mapreduce/lib/hadoop

jar

/usr/hadoopsoft/hadoop-2.5.2/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.2.jarwordcount

tachyon://spark001:19998/LICENSEtachyon://spark001:19998/LICENSE-wcSpark整合Tachyon直接./bin/spark-s

--master

localval

s

=

sc.textFile("tachyon://spark001:19998/LICENSE")s.count会报错No

FileSystem

for

scheme:tachyonsc.hadoopConfiguration.set("fs.tachyon.impl",

"tachyon.hadoop.TFS")加上上面一句不会报之前的错,但是会一直不停的输出ERROR:Spark整合Tachyon版本问题,立马发现回看兼容性说明使用spark-1.3.1是无法与tachyon-0.8.2兼容的于是

改用spark-1.5.0配合tachyon-0.7.1另一个解决方案是修改pom.xml重新编译Spark利用Tachyon作为数据输入输出源如何编译、配置、格式化tachyon-0.7.1这里不再赘述启动tachyon./bin/tachyon-start.sh

local启动spark./bin/spark-s

--master

localval

s

=

sc.textFile("tachyon://spark001:19998/testdats.counts.saveAsTextFile("tachyon://spark001:19998/testdatople.txt")ople2.txt")持久化RDD到Tachyon中需要设置两个参数,spark.externalBlockStore.urlspark.externalBlockStore.baseDir1,可以配置到Spark的spark-defaults.conf文件中2,可以通过代码设置到SparkConf中3,也可以动态添加上,./bin/spark-s

--master

local

--conf"spark.externalBlockStore.url=tachyon://spark001:19998"持久化RDD到Tachyon中sc.hadoopConfiguration.set("fs.tachyon.impl",

"tachyon.hadoop.TFS")var

file

=

sc.textFile("file:///usr/hadoopsoft/spark-1.5.0-bin-hadoop2.4/CHAN

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论