下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于hadoop的大规模文本处理技术实验专业班级: 软件1102学生姓名: 张国宇学 号:setup hadoop on ubuntu 11.04 64-bit提示:前面的putty软件安装省略;直接进入jdk的安装。1. install sun jdk由于sun jdk在ubuntu的软件中心中无法找到,我们必须使用外部的ppa打开终端并且运行以下命令:sudo add-apt-repository ppa:ferramroberto/javasudo apt-get updatesudo apt-get install sun-java6-binsudo apt-get install s
2、un-java6-jdkadd java_home variable:先输入粘贴下面文字:sudo vi /etc/environment再将下面的文字输入进去:按i键添加,esc键退出,x保存退出;如下图:export java_home=/usr/lib/jvm/java-6-sun-1.6.0.26test the success of installation in terminal在终端测试安装是否成功,:sudo . /etc/environmentjava - version2. check ssh settingssh localhost如果出现“ connection ref
3、used ”,你最好重新安装 ssh (如下命令可以安装) :sudo apt-get install openssh-server openssh-client如果你没有通行证 ssh 到主机,执行下面的命令:ssh-keygen -t dsa -p -f /.ssh/id_dsacat /.ssh/id_dsa.pub /.ssh/authorized_keys3. setup hadoop安装 apache2sudo apt-get install apache2下载hadoop:1.0.4解压hadoop所下载的文件包:tar xvfz hadoop-1.0.4.tar.gz下载最近的
4、一个稳定版本,解压。编辑/ hadoop-env.sh 定义 java_home“use/library/java-6-sun-1.6.0.26 ”作为 hadoop 的根目录:sudo vi conf/hadoop-env.sh将以下内容加到文件最后:# the java implementation to use. required.export java_home=/usr/lib/jvm/java-6-sun-1.6.0.26pseudo-distributed operation (single-node cluster):将下面中间部分插入: (得到如图: )cat conf/co
5、re-site.xml:cat conf/hdfs-site.xml:dfs.replication1cat conf/mapred-site.xml:localhost:9001switch to hadoop root directory and format a new distributed filesystem:bin/hadoop namenode - format注意:这一步一定不能掉,否则后面会出错!you ll get info like“ storagedirectory/tmp/hadoop- ubuntu/dfs/name has been successfully f
6、ormatted. ” remember this path is the hdfs home directory of namenode. (你会得 到提示:你已经成功格式化。 ) start and stop hadoop daemons (启动和终止进程。 ) : bin/start-all.sh (start the hadoop) bin/stop-all.sh (stop the hadoop)web interfaces for the namenode and the jobtracker: namenode -提示:如果前面没有格式化成功,这个网址会出现就不去的现象! ! !
7、如果进 不去就先结束进程,重新格式化然后再开始进程。 jobtracker -4. deploy an example map-reduce job创 建 路 径 /home/ubuntu/mapreduce/wordcount/ , 并 在 该 目 录 下 放 置 文 本 文 件 worldcount.txt 。然后将这些文件复制到 hdfsb录: bin/hadoop dfs -copyfromlocal /home/ubuntu/mapreduce/wordcount /tmp/hadoop-ubuntu/dfs/name/wordcountbin/hadoop dfs -ls /tmp
8、/hadoop-ubuntu/dfs/name/wordcount run the job: bin/hadoop jar hadoop*examples*.jar wordcount /tmp/hadoop-ubuntu/dfs/name/wordcount /tmp/hadoop-ubuntu/dfs/name/wordcount-outputif the output info looks no problem, copy the output file from hdfsto local directory:bin/hadoop dfs -getmerge/tmp/hadoop-ubuntu/dfs/name/wordcount-output/home/ubuntu/mapreduce/wordcount/now you can open the output file in your local directory to view theresults.实验总结:1、 在实验过程中,发现对li
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度版权授权使用合同(含授权范围和费用支付)
- 2024年产品发布会合作合同
- 2024年广州临时工雇佣合同
- 2024年度短视频内容创作与版权交易合同
- 2024年工程吊篮长期租借协议
- 2024年度智能供应链管理软件购买合同
- 2024酒店用品采购合同模板
- 2024年农民工建筑行业用工合同
- 2024【工程劳务分包合同范本】装饰工程分包合同范本3
- 2024年度电力工程吊装安全合同
- 基于solidworks flow simulation油浸式变压器散热优化分析
- CPK与CP详细讲解资料(课堂PPT)
- 光动力治疗在气道肿瘤中的临床应用课件
- 小学语文人教三年级上册 群文阅读《奇妙的中心句》
- 大数据和人工智能知识考试题库600题(含答案)
- 2023年上海机场集团有限公司校园招聘笔试题库及答案解析
- 镜头的角度和方位课件
- 污水处理常用药剂简介知识讲解课件
- 五年级上册英语课件-Unit 1《My future》第1课时牛津上海版(三起) (共28张PPT)
- 光交接箱施工规范方案
- 气温和降水学案
评论
0/150
提交评论