版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、参考书籍: Hadoop in action, 吴超沉思录1.Hbase简介1.面向列的分布式数据库2. 以HDFS作为文件系统3. 利用MapReduce处理Hbase中海量数据4. ZookKeeper作为协调工具5. sqoop提供Hbase到关系型数据库中数据导入功能6. Hive和pig提供高层语言支持如HSQL2. 伪分布式安装准备: 安装Hadoop 详细见上一篇日志: hadoop分布式安装hbase版本: hbase-0.94.7-security.tar.gz安装目录 /usr/local步骤:1. 安装 tar -zxvf hbase-0.
2、94.7-security.tar.gz 2. 重命名: mv hbase-0.94.7-security hbase3. 配置环境变量hbase_home (vi /etc/profile)4. 修改配置文件1. hbase_home/conf/hbase_env.sh 修改java_home export JAVA_HOME=/usr/local/jdk/ 修改zookeeper(最后一行) export HBASE_MANAGES_ZK=true(使用Hbase托管的ZooKeeper)2. hbase_home/conf/hbase-site.xml文件
3、 configuration 中加入:<property> <name>hbase.rootdir</name> <value>hdfs:/hadoop0:9000/hbase</value></property><property> <name>hbase.cluster.distributed</name> <value>true</value></property><property> <name>hbase.zookee
4、per.quorum</name> <value>hadoop0</value></property><property> <name>dfs.replication</name> <value>1</value></property>5. 启动hbase先启动hadoop(start-all.sh)启用hbase (start-hbase.sh)jps查看进程 (HMaster,HRegionServer, HQuorumPeer)http:/hadoop0:60010可以
5、查看管理界面,如下:6. 进程说明:HMaster: 管理Hbase table的DDL操作给region分配工作HResionServer: 原则上每个slave对应一个HRegionServerHQuorumPeer: ZooKeeper的守护进程,此处我们使用的是Hbase内置的ZooKeeper(在hbase-env.sh中有配置) 3. 分布式安装准备条件: hadoop分布式环境已安装,查看 hadoop分布式安装hadoop0主机上hbase伪分布已安装完成安装:1. scp -rp /usr/local/hbase hadoop1:/usr/local2.
6、在hadoop0上更改hbase_home/conf/regionservers 将localhost更改为hadoop13. 在hadoop0上启动hbase4. jps查看,如下:hadoop0上进程: hadoop1上进程:同理可通过 hostname:60010访问hbase管理界面,同分布式安装部分4. 数据模型1. Hbase数据库采用了和Bigtable非常类似的数据类型,表格是稀疏的;1. row key 行键,table的主键2. timestamp 时间戳,数据操作时对应的时间戳,可以看成数据的version number3. Column Famil
7、y 列簇,每个family可以由任意多个column组成,列名是<族名>:<标签>形式;一个表格的族名时固定的,除非使用管理员权限来改变表格的族名; 不过可以在任何时候添加新的标签;eg:course对于表来说是一个有两个列的列族(该列族由两个列组成math和art);rowkeynameTimeStampcoursemathartwishwisht1t2t3979397987699rainraint410090 4.两张特殊的表 -ROOT- 和 .META.作用如下:(即-ROOT-记录.META.的region信息
8、,.META.记录用户表的region信息)关系如下:基本操作 (注意操作后不要加分号,习惯了sql,总是在后面加分号,然后发现执行语句后都一直没有反应,去掉分号后成功)(表名和列名都需要加引号,不区分单双引号)Hbase shell,是Hbase的命令行工具,命令行中执行hbase shell即可进入hbase shell命令行 1) list 查看hbase中所有表2) 创建表: create '表名','列簇1','列簇2'.create 'student', '
9、name','grade','course'在管理界面中查看student3)describe 查看表结构describe '表名' eg: describe 'student'hbase(main):003:0> describe "student"DESCRIPTION ENABLED 'student', NAME => 'course', DATA_BLOCK_ENCODING = true > 'NONE', BLOO
10、MFILTER => 'NONE', REPLICATION_SCOPE => '0', VERSIONS => '3', COMPRESSION => 'NONE', MIN _VERSIONS => '0', TTL => '2147483647', KEEP_DELETED _CELLS => 'false', BLOCKSIZE => '65536', IN_MEMORY => 'false'
11、;, ENCODE_ON_DISK => 'true', BLOCKCACHE => 'true', NAME => 'grade', DATA_BLOCK_ENCODING => 'NONE', BLOOMFILTER => 'NONE', REPLICATION_SCOPE => '0', VERSIONS => '3', COMPRESSION => 'NONE', MIN_V ERSIONS => '
12、;0', TTL => '2147483647', KEEP_DELETED_C ELLS => 'false', BLOCKSIZE => '65536', IN_MEMORY => 'false', ENCODE_ON_DISK => 'true', BLOCKCACHE => ' true', NAME => 'name', DATA_BLOCK_ENCODING => 'NO NE', BLOOMFILT
13、ER => 'NONE', REPLICATION_SCOPE => '0 ', VERSIONS => '3', COMPRESSION => 'NONE', MIN_VERS IONS => '0', TTL => '2147483647', KEEP_DELETED_CELL S => 'false', BLOCKSIZE => '65536', IN_MEMORY => 'f alse',
14、ENCODE_ON_DISK => 'true', BLOCKCACHE => 'tru e'4)插入数据和查看数据put '表名','行键名','列名','value','列名2','value2','family:列名1','value3'.put 'student','wish','name:','wish' 查询数据:get '表名
15、39;,'行名'get 'student','wish'插入更多数据hbase(main):004:0> put 'student','wish','course:English','100'hbase(main):005:0> put 'student','wish','course:Chinese','60'hbase(main):006:0> put 'student','rain','course:Chinese','100'hbase(main):007:0> put 'student','rain','course:English','200'查看表中数据: scan 'student'其他get例子:get 'student','wish','course'get 'student','wish
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二四年电子医疗服务合作协议
- 技术评审合同模板
- Unit3AfterschoolactivitiesLet'sSpell(课件)人教新起点版英语三年级下册
- 2024年度工厂产品质量保证与售后服务合同3篇
- 化工设计:第8章 化工管道设计
- 基于二零二四年度计划的白酒分销合同
- 生产厂家与代理的签订合同完整版
- 汽车抵押借款合同模板:2024年度特别版3篇
- 2024年度工程廉政协议书签订时间
- 轨道铺设工程合同段施工组织设计方案
- 广东省广州市2024年中考数学真题试卷(含答案)
- 2023年甘肃白银有色集团股份有限公司招聘考试真题
- 人教部编版七年级语文上册《阅读综合实践》示范课教学设计
- 企业信息化管理体系标准化建设方案
- 大学生心理健康教育(第二版) 课件 第十四章 大学生心理危机
- 2023-2024学年沪科版数学八年级上册期中测试题附答案(共2套)
- 高三一轮复习+化学反应速率及其影响因素+课件
- 五年级上册解方程练习100题及答案
- 北京市东城区2023-2024学年高三上学期期末统一测试英语试卷 含解析
- 2024年中科院心理咨询师官方备考试题库-上(单选题)
- 【S村剩余劳动力转移的情况调查报告4000字(论文)】
评论
0/150
提交评论