




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
HDFS数据写过程目录HDFS数据写过程1写入文件2import
org.apache.hadoop.conf.Configuration;
import
org.apache.hadoop.fs.FileSystem;import
org.apache.hadoop.fs.FSDataOutputStream;import
org.apache.hadoop.fs.Path;
public
class
Chapter3
{
public
static
void
main(String[]
args)
{
try
{
Configuration
conf
=
new
Configuration();
FileSystem
fs
=
FileSystem.get(conf);
byte[]
buff
=
"Hello
world".getBytes();
//
要写入的内容
String
filename
=
"hdfs://localhost:9000/user/hadoop/test.txt";
//要写入的文件名
FSDataOutputStream
os
=fs.create(new
Path(filename));
os.write(buff,0,buff.length);
System.out.println("Create:"+
filename);
}
catch
(Exception
e)
{
e.printStackTrace();
}
}
}1、HDFS数据写过程3FileSystem是一个通用文件系统的抽象基类,可以被分布式文件系统继承,所有可能使用Hadoop文件系统的代码,都要使用这个类;Hadoop为FileSystem这个抽象类提供了多种具体实现;DistributedFileSystem就是FileSystem在HDFS文件系统中的具体实现;FileSystem的open()方法返回的是一个输入流FSDataInputStream对象,在HDFS文件系统中,具体的输入流就是DFSInputStream;FileSystem中的create()方法返回的是一个输出流FSDataOutputStream对象,在HDFS文件系统中,具体的输出流就是DFSOutputStream。Configurationconf=newConfiguration();FileSystemfs=FileSystem.get(conf);FSDataInputStreamin=fs.open(newPath(uri));FSDataOutputStreamout=fs.create(newPath(uri));备注:创建一个Configuration对象时,其构造方法会默认加载工程项目下两个配置文件,分别是hdfs-site.xml以及core-site.xml,这两个文件中会有访问HDFS所需的参数值,主要是fs.defaultFS,指定了HDFS的地址(比如hdfs://localhost:9000),有了这个地址客户端就可以通过这个地址访问HDFS了
4FileSystemfs=FileSystem.get(conf);FSDataOutputStreamout=fs.create(newPath(uri));Configurationconf=newConfiguration();importorg.apache.hadoop.fs.FileSystemRPC远程调用名称节点在文件系统的命名空间中新建一个文件名称节点会执行一些检查(文件是否存在,客户端权限)FSDataOutputStream封装了DFSOutputStream数据被分成一个个分包分包被放入DFSOutputStream对象的内部队列DFSOutputStream向名称节点申请保存数据块的若干数据节点这些数据节点形成一个数据流管道队列中的分包最后被打包成数据包发往数据流管道中的第一个数据节点第一个数据节点将数据包发送到第二个节点依此类推,形成“流水线复制”为了保证节点数据准确,接收到数据的数据节点要向发送者发送“确认包
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智慧办公解决方案技术框架与效果评估
- 数字化教育的商业前景与市场机遇分析
- 教育政策东西方理念的碰撞与融合
- 基于人工智能的教育机器人商业价值探索
- 抖音商户直播分享按钮优化制度
- 江西省广丰县联考2024年化学九年级第一学期期末统考模拟试题含解析
- 贵州省仁怀市2024年化学九年级第一学期期末学业质量监测模拟试题含解析
- 苏州卫生职业技术学院《地理专业英语》2023-2024学年第一学期期末试卷
- 2024年湖北省武汉武昌区四校联考化学九年级第一学期期末达标测试试题含解析
- 2025届潮安龙湖中学九上化学期末达标检测试题含解析
- 校园清廉建设活动方案
- 检查检验结果互认工作管理制度
- 光伏电站安全生产管理制度汇编
- 农村小学生科技活动方案
- 电脑设备报废管理制度
- 2025年北京高考物理试卷真题(含答案解析)
- 英语教学课件Unit 6 Useful numbers课件6
- GB/T 45823-2025光伏单晶硅生长用石英坩埚高纯内层砂
- 2025至2030中国建设工程质量检测产业市场深度调研及发展趋势与投资报告
- 胸痛医疗质控中心2025年工作计划
- 2025至2030年中国糖精钠行业市场运行态势及发展战略研究报告
评论
0/150
提交评论