Hbase学习笔记_第1页
Hbase学习笔记_第2页
Hbase学习笔记_第3页
Hbase学习笔记_第4页
Hbase学习笔记_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、参考书籍: Hadoop in action, 吴超沉思录1.Hbase简介1.面向列的分布式数据库2. 以HDFS作为文件系统3. 利用MapReduce处理Hbase中海量数据4. ZookKeeper作为协调工具5. sqoop提供Hbase到关系型数据库中数据导入功能6. Hive和pig提供高层语言支持如HSQL2. 伪分布式安装准备: 安装Hadoop 详细见上一篇日志: hadoop分布式安装hbase版本: hbase-0.94.7-security.tar.gz安装目录 /usr/local步骤:1.  安装 tar -zxvf hbase-0.

2、94.7-security.tar.gz 2. 重命名: mv hbase-0.94.7-security hbase3. 配置环境变量hbase_home  (vi /etc/profile)4. 修改配置文件1. hbase_home/conf/hbase_env.sh 修改java_home export JAVA_HOME=/usr/local/jdk/ 修改zookeeper(最后一行) export HBASE_MANAGES_ZK=true(使用Hbase托管的ZooKeeper)2. hbase_home/conf/hbase-site.xml文件

3、 configuration 中加入:<property> <name>hbase.rootdir</name> <value>hdfs:/hadoop0:9000/hbase</value></property><property> <name>hbase.cluster.distributed</name> <value>true</value></property><property> <name>hbase.zookee

4、per.quorum</name> <value>hadoop0</value></property><property> <name>dfs.replication</name> <value>1</value></property>5. 启动hbase先启动hadoop(start-all.sh)启用hbase (start-hbase.sh)jps查看进程 (HMaster,HRegionServer, HQuorumPeer)http:/hadoop0:60010可以

5、查看管理界面,如下:6. 进程说明:HMaster: 管理Hbase table的DDL操作给region分配工作HResionServer: 原则上每个slave对应一个HRegionServerHQuorumPeer: ZooKeeper的守护进程,此处我们使用的是Hbase内置的ZooKeeper(在hbase-env.sh中有配置) 3. 分布式安装准备条件: hadoop分布式环境已安装,查看 hadoop分布式安装hadoop0主机上hbase伪分布已安装完成安装:1. scp -rp /usr/local/hbase hadoop1:/usr/local2.

6、在hadoop0上更改hbase_home/conf/regionservers 将localhost更改为hadoop13. 在hadoop0上启动hbase4. jps查看,如下:hadoop0上进程:  hadoop1上进程:同理可通过 hostname:60010访问hbase管理界面,同分布式安装部分4. 数据模型1. Hbase数据库采用了和Bigtable非常类似的数据类型,表格是稀疏的;1. row key 行键,table的主键2. timestamp 时间戳,数据操作时对应的时间戳,可以看成数据的version number3. Column Famil

7、y 列簇,每个family可以由任意多个column组成,列名是<族名>:<标签>形式;一个表格的族名时固定的,除非使用管理员权限来改变表格的族名; 不过可以在任何时候添加新的标签;eg:course对于表来说是一个有两个列的列族(该列族由两个列组成math和art);rowkeynameTimeStampcoursemathartwishwisht1t2t3979397987699rainraint410090     4.两张特殊的表  -ROOT- 和 .META.作用如下:(即-ROOT-记录.META.的region信息

8、,.META.记录用户表的region信息)关系如下:基本操作  (注意操作后不要加分号,习惯了sql,总是在后面加分号,然后发现执行语句后都一直没有反应,去掉分号后成功)(表名和列名都需要加引号,不区分单双引号)Hbase shell,是Hbase的命令行工具,命令行中执行hbase shell即可进入hbase shell命令行 1) list  查看hbase中所有表2) 创建表: create '表名','列簇1','列簇2'.create 'student', '

9、name','grade','course'在管理界面中查看student3)describe 查看表结构describe '表名' eg: describe 'student'hbase(main):003:0> describe "student"DESCRIPTION ENABLED 'student', NAME => 'course', DATA_BLOCK_ENCODING = true > 'NONE', BLOO

10、MFILTER => 'NONE', REPLICATION_SCOPE => '0', VERSIONS => '3', COMPRESSION => 'NONE', MIN _VERSIONS => '0', TTL => '2147483647', KEEP_DELETED _CELLS => 'false', BLOCKSIZE => '65536', IN_MEMORY => 'false'

11、;, ENCODE_ON_DISK => 'true', BLOCKCACHE => 'true', NAME => 'grade', DATA_BLOCK_ENCODING => 'NONE', BLOOMFILTER => 'NONE', REPLICATION_SCOPE => '0', VERSIONS => '3', COMPRESSION => 'NONE', MIN_V ERSIONS => '

12、;0', TTL => '2147483647', KEEP_DELETED_C ELLS => 'false', BLOCKSIZE => '65536', IN_MEMORY => 'false', ENCODE_ON_DISK => 'true', BLOCKCACHE => ' true', NAME => 'name', DATA_BLOCK_ENCODING => 'NO NE', BLOOMFILT

13、ER => 'NONE', REPLICATION_SCOPE => '0 ', VERSIONS => '3', COMPRESSION => 'NONE', MIN_VERS IONS => '0', TTL => '2147483647', KEEP_DELETED_CELL S => 'false', BLOCKSIZE => '65536', IN_MEMORY => 'f alse',

14、ENCODE_ON_DISK => 'true', BLOCKCACHE => 'tru e'4)插入数据和查看数据put '表名','行键名','列名','value','列名2','value2','family:列名1','value3'.put 'student','wish','name:','wish' 查询数据:get '表名&#

15、39;,'行名'get 'student','wish'插入更多数据hbase(main):004:0> put 'student','wish','course:English','100'hbase(main):005:0> put 'student','wish','course:Chinese','60'hbase(main):006:0> put 'student','rain','course:Chinese','100'hbase(main):007:0> put 'student','rain','course:English','200'查看表中数据: scan 'student'其他get例子:get 'student','wish','course'get 'student','wish&#

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论