




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、参考书籍: Hadoop in action, 吴超沉思录1.Hbase简介1.面向列的分布式数据库2. 以HDFS作为文件系统3. 利用MapReduce处理Hbase中海量数据4. ZookKeeper作为协调工具5. sqoop提供Hbase到关系型数据库中数据导入功能6. Hive和pig提供高层语言支持如HSQL2. 伪分布式安装准备: 安装Hadoop 详细见上一篇日志: hadoop分布式安装hbase版本: 安装目录 /usr/local步骤:1. 2. 重命名: mv hbase-0.94.7-security hbase
2、3. 配置环境变量hbase_home (vi /etc/profile)4. 修改配置文件1. hbase_home/conf/hbase_env.sh 修改java_home export JAVA_HOME=/usr/local/jdk/ 修改zookeeper(最后一行) export HBASE_MANAGES_ZK=true(使用Hbase托管的ZooKeeper)2. hbase_home/conf/hbase-site.xml文件 configuration 中加入:<property> <name>hbase.rootdir</nam
3、e> <value>hdfs:/hadoop0:9000/hbase</value></property><property> <name></name> <value>true</value></property><property> <name></name> <value>hadoop0</value></property><property> <name>dfs.replicat
4、ion</name> <value>1</value></property>5. 启动hbase先启动hadoop(start-all.sh)启用hbase (start-hbase.sh)jps查看进程 (HMaster,HRegionServer, HQuorumPeer)http:/hadoop0:60010可以查看管理界面,如下:6. 进程说明:HMaster: 管理Hbase table的DDL操作给region分配工作HResionServer: 原则上每个slave对应一个HRegionServerHQuorumPeer: ZooK
5、eeper的守护进程,此处我们使用的是Hbase内置的ZooKeeper(在hbase-env.sh中有配置) 3. 分布式安装准备条件: hadoop分布式环境已安装,查看 hadoop分布式安装hadoop0主机上hbase伪分布已安装完成安装:1. scp -rp /usr/local/hbase hadoop1:/usr/local2. 在hadoop0上更改hbase_home/conf/regionservers 将localhost更改为hadoop13. 在hadoop0上启动hbase4. jps查看,如下:hadoop0上进程: h
6、adoop1上进程:同理可通过 hostname:60010访问hbase管理界面,同分布式安装部分4. 数据模型1. Hbase数据库采用了和Bigtable非常类似的数据类型,表格是稀疏的;1. row key 行键,table的主键2. timestamp 时间戳,数据操作时对应的时间戳,可以看成数据的version number3. Column Family 列簇,每个family可以由任意多个column组成,列名是<族名>:<标签>形式;一个表格的族名时固定的,除非使用管理员权限来改变表格的族名; 不过可以在任何时候添加新的标签;eg:course对于表来
7、说是一个有两个列的列族(该列族由两个列组成math和art);rowkeynameTimeStampcoursemathartwishwisht1t2t3979397987699rainraint410090 4.两张特殊的表 -ROOT- 和 .META.作用如下:(即-ROOT-记录.META.的region信息,.META.记录用户表的region信息)关系如下:基本操作 (注意操作后不要加分号,习惯了sql,总是在后面加分号,然后发现执行语句后都一直没有反应,去掉分号后成功)(表名和列名都需要加引号,不区分单双引号
8、)Hbase shell,是Hbase的命令行工具,命令行中执行hbase shell即可进入hbase shell命令行 1) list 查看hbase中所有表2) 创建表: create '表名','列簇1','列簇2'.create 'student', 'name','grade','course'在管理界面中查看student3)describe 查看表结构describe '表名' eg: describe
9、9;student'hbase(main):003:0> describe "student"DESCRIPTION ENABLED 'student', NAME => 'course', DATA_BLOCK_ENCODING = true > 'NONE', BLOOMFILTER => 'NONE', REPLICATION_SCOPE => '0', VERSIONS => '3', COMPRESSION =>
10、9;NONE', MIN _VERSIONS => '0', TTL => '2147483647', KEEP_DELETED _CELLS => 'false', BLOCKSIZE => '65536', IN_MEMORY => 'false', ENCODE_ON_DISK => 'true', BLOCKCACHE => 'true', NAME => 'grade', DATA_BLOCK_ENCO
11、DING => 'NONE', BLOOMFILTER => 'NONE', REPLICATION_SCOPE => '0', VERSIONS => '3', COMPRESSION => 'NONE', MIN_V ERSIONS => '0', TTL => '2147483647', KEEP_DELETED_C ELLS => 'false', BLOCKSIZE => '65536',
12、 IN_MEMORY => 'false', ENCODE_ON_DISK => 'true', BLOCKCACHE => ' true', NAME => 'name', DATA_BLOCK_ENCODING => 'NO NE', BLOOMFILTER => 'NONE', REPLICATION_SCOPE => '0 ', VERSIONS => '3', COMPRESSION => 'NO
13、NE', MIN_VERS IONS => '0', TTL => '2147483647', KEEP_DELETED_CELL S => 'false', BLOCKSIZE => '65536', IN_MEMORY => 'f alse', ENCODE_ON_DISK => 'true', BLOCKCACHE => 'tru e'4)插入数据和查看数据put '表名','行键名','
14、列名','value','列名2','value2','family:列名1','value3'.put 'student','wish','name:','wish' 查询数据:get '表名','行名'get 'student','wish'插入更多数据hbase(main):004:0> put 'student','wish'
15、,'course:English','100'hbase(main):005:0> put 'student','wish','course:Chinese','60'hbase(main):006:0> put 'student','rain','course:Chinese','100'hbase(main):007:0> put 'student','rain','course:English','200'查看表中数据: scan 'student'其他get例子:get 'student','wish','course'get 'student','wish',&
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年加工承揽合同范本
- 南宫市电梯安全管理人员模拟试验题库和答案
- 地理信息数据处理技能竞赛试题
- 汽车维护管理与故障检测手册
- 广东湛江二中学港城中学2023-2024学年中考冲刺卷数学试题含解析
- 2025年四平考从业资格证货运试题
- 2025年周口货车从业资格证考试试题
- 人力资源管理基础试题库
- 邵阳县电梯安全管理人员校验测试题和答案
- 河北省衡水市阜城县阜城实验中学2024-2025学年高一下学期4月月考数学试题(原卷版+解析版)
- 私募投资学试题及答案
- 2025年合肥二模数学试题及答案
- 不要慌太阳下山有月光二部合唱简谱
- 干净整洁的个人卫生习惯
- 光伏补贴申请流程
- 小数与单位换算(说课稿)-2023-2024学年四年级下册数学人教版
- 实验诊断学练习题库(附参考答案)
- 无锡网格员考试题库
- 第9课 改变世界的工业革命
- 《供应商选择与评估》课件
- 新版申请银行减免利息的申请书
评论
0/150
提交评论