厦门大学林子雨编著_第1页
厦门大学林子雨编著_第2页
厦门大学林子雨编著_第3页
厦门大学林子雨编著_第4页
厦门大学林子雨编著_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

厦门大学林子雨编著《大数据技术原理与应用》教材配套上机练习熟悉常用的HDFS操作(版本号:2016年1月24日版本)主讲教师:林子雨厦门大学数据库实验室二零一六年一月目录

目录1 作业题目 12 作业目的 13 作业性质 14 作业考核方法 15 作业提交日期与方式 16 实验平台 17 实验内容和要求 18 实验报告 2附录1:任课教师介绍 2附录2:课程教材介绍 2附录3:中国高校大数据课程公共服务平台介绍 4厦门大学林子雨编著《大数据技术原理与应用》教材配套上机练习熟悉常用的HDFS操作 主讲教师:林子雨/linziyu第1页

厦门大学林子雨编著《大数据技术原理与应用》教材配套上机练习熟悉常用的HDFS操作上机练习说明主讲教师:林子雨E-mail:ziyulin@个人主页:/linziyu作业题目熟悉常用的HDFS操作。作业目的(1) 理解HDFS在Hadoop体系结构中的角色;(2) 熟练使用HDFS操作常用的Shell命令;(3) 熟悉HDFS操作常用的JavaAPI。作业性质课后作业,必做,作为课堂平时成绩。作业考核方法提交上机实验报告,任课老师根据上机实验报告评定成绩。作业提交日期与方式林子雨编著《大数据技术原理与应用》教材第三章分布式文件系统HDFS内容结束后的下一周周六晚上9点之前提交。实验平台操作系统:LinuxHadoop版本:2.6.0或以上版本JDK版本:1.6或以上版本JavaIDE:Eclipse实验内容和要求首先,编程实现以下指定功能,并利用Hadoop提供的Shell命令完成相同任务:向HDFS中上传任意文本文件,如果指定的文件在HDFS中已经存在,由用户指定是追加到原有文件末尾还是覆盖原有的文件;从HDFS中下载指定文件,如果本地文件与要下载的文件名称相同,则自动对下载的文件重命名;将HDFS中指定文件的内容输出到终端中;显示HDFS中指定的文件的读写权限、大小、创建时间、路径等信息;给定HDFS中某一个目录,输出该目录下的所有文件的读写权限、大小、创建时间、路径等信息,如果该文件是目录,则递归输出该目录下所有文件相关信息;提供一个HDFS内的文件的路径,对该文件进行创建和删除操作。如果文件所在目录不存在,则自动创建目录;提供一个HDFS的目录的路径,对该目录进行创建和删除操作。创建目录时,如果目录文件所在目录不存在则自动创建相应目录;删除目录时,由用户指定当该目录不为空时是否还删除该目录;向HDFS中指定的文件追加内容,由用户指定内容追加到原有文件的开头或结尾;删除HDFS中指定的文件;删除HDFS中指定的目录,由用户指定目录中如果存在文件时是否删除目录;在HDFS中,将文件从源路径移动到目的路径。其次,编程实现一个类“MyFSDataInputStream”,该类继承“org.apache.hadoop.fs.FSDataInputStream”,要求如下:实现按行读取HDFS中指定文件的方法“readLine()”,如果读到文件末尾,则返回空,否则返回文件一行的文本。实现缓存功能,即利用“MyFSDataInputStream”读取若干字节数据时,首先查找缓存,如果缓存中有所需数据,则直接由缓存提供,否则向HDFS读取数据。查看Java帮助手册或其它资料,用“.URL”和“org.apache.hadoop.fs.FsURLStreamHandlerFactory”编程完成输出HDFS中指定文件的文本到终端中。实验报告厦门大学计算机系研究生课程《大数据技术原理与应用》实验报告题目:姓名日期实验环境:实验内容与完成情况:出现的问题:解决方案(列出遇到的问题和解决办法,列出没有解决的问题):附录1:任课教师介绍林子雨(1978-),男,博士,厦门大学计算机科学系助理教授,主要研究领域为数据库,实时主动数据仓库,数据挖掘.主讲课程:《大数据技术基础》办公地点:厦门大学海韵园科研2号楼E-mail:ziyulin@个人主页:/linziyu数据库实验室网站:附录2:课程教材介绍《大数据技术原理与应用——概念、存储、处理、分析与应用》,由厦门大学计算机科学系教师林子雨博士编著,是中国高校第一本系统介绍大数据知识的专业教材。本书定位为大数据技术入门教材,为读者搭建起通向“大数据知识空间”的桥梁和纽带,以“构建知识体系、阐明基本原理、引导初级实践、了解相关应用”为原则,为读者在大数据领域“深耕细作”奠定基础、指明方向。全书共有13章,系统地论述了大数据的基本概念、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库、分布式并行编程模型MapReduce、流计算、图计算、数据可视化以及大数据在互联网、生物医学和物流等各个领域的应用。在Hadoop、HDFS、HBase和MapReduce等重要章节,安排了入门级的实践操作,让读者更好地学习和掌握大数据关键技术。本书可以作为高等院校计算机专业、信息管理等相关专业的大数据课程教材,也可供相关技术人员参考、学习、培训之用。欢迎访问《大数据技术原理与应用——概念、存储、处理、分析与应用》教材官方网站:/post/bigdata扫一扫访问教材官网附录3:中国高校大数据课程公共服务平台介绍中国高校大数据课程公共服务平台,由中国高校首个“数字教师”的提出者和建设者——林子雨老师发起,由厦门大学数据库实验室全力打造,由厦门大学云计算与大数据研究中心、海峡云计算与大数据应用研究中心携手共建。这是国内第一个服务于高校大数据课程建设的公共服务平台,旨在促进国内高校大数据课程体系建设,提高大数据课程教学水平,降低大数据课程学习门槛,提升学生课程学习效果。平台服务对象涵盖高校、教师和学生。平台为高校开设大数据课程提供全流程辅助,为教师开展教学工作提供一站式服务,为学生学习大数据课程提供全方位辅导。平台重点打造

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论