




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 Hive(数据仓库工具) 建表语句解析: create EXTERNAL table test(id int,cont string -表结构 row format delimited fields terminated by t -列分隔符 lines terminated by n -行分隔符 stored as textfile -HDFS文件格式 location /user/admin/test; -HDFS文件路径 Hive缺陷:执行延时较大,不适合实时查询业务 HBase(分布式的列数据库) 建立的HDFS之上,提供高可靠性、高性能、列存储、 可伸缩、实时读写的数据库系统。 列
2、数据库优点: 1.高效的储存空间利用率 同一类型的列存储在一起 2.不可见索引 列式数据库由于其数据的每一列都按照选择性进行排 序 适合应用: 适合大量的数据而不是小数据 实时加载数据仅限于增加(删除 和更新需要解压缩Block 然后计 算然后重新压缩储存 不适合应用 不适合扫描小量数据 不适合随机的更新 不适合做含有删除和更新的实时操作 总结 Hadoop非常适合大数据的采集和分析。 uHDFS用于数据文件分布式存储; uMapReduce用于数据分布式运算; uHive可通过SQL语句 (自动转换成MR)查询HDFS文件; uHbase是建议在HDFS之上,实时读写的数据库系统。 uHadoop前期投资较大,5台以下的集群很难发挥出Hadoop的优势; Hadoop在使用
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 动物生理与行为的关联性:试题及答案
- 2024年投资咨询工程师行业前景试题及答案
- 2024年区域经济发展问题试题及答案
- 2024年育婴师模拟考试试题及答案
- 人流术后恢复护理查房
- 2024年监理考试复习框架试题及答案
- 2024监理工程师重点难点试题及答案
- 2024人力资源管理新趋势试题及答案
- 黑龙江林业职业技术学院《日语听力Ⅱ》2023-2024学年第二学期期末试卷
- 黑龙江省东南联合体2025届高三物理试题4月质量调研测试(二模)试题含解析
- 《浅谈A企业消防安全管理中存在的问题及完善对策研究》6300字(论文)
- 秦汉考古Uooc课程答案
- 间质性肺病个案护理
- 《电力建设工程施工安全管理导则》(NB∕T 10096-2018)
- 医疗器械考试题及答案
- 画饼充饥儿童故事绘本 课件
- 土木工程CAD-终结性考核-国开(SC)-参考资料
- 脑梗死护理查房教学
- (新版)浙江省地方执法证考试题库及答案
- 车辆交通安全培训全面指南
- 科技大篷车进校园方案
评论
0/150
提交评论