版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 大数据 巨量资料,指所涉及资料量规模巨大 (Volume、Variety)无法透过目前主流 软件工具合理时间(Velocity)内达撷取、 管理、处理、并整理成帮助企业经营决策 (Variety)更积极目的的资讯 大数据与云计算 分布式实时流式处理系统 流式处理系统(规范且稳定的结构): http:/ 1213608837.html 分布式系统(网格,云计算,快速的部署能 力和容灾性,方便的扩展) 实时系统(快速的处理能力) 典型的场景 日志统计系统: 传统的解决方案: queue+worker实时系统实时系统:云统计云统计 问题:问题: 1、部署维护消息队列 2、自动容错机制,进程、机器挂
2、掉自动处 理 3、功能扩展性 Storm是什么 分布式实时流式处理系统 流式流式:提供了一个简单的计算模型和API (类似MapReduce),可以方便的处理不 断产生的数据 实时实时:系统本身的效率很高,处理延迟在毫 秒级 水平扩展水平扩展:通过简单加机器、提高并发数就 可以提高整体处理能力 自动容错自动容错:自动处理进程、机器挂掉的异常 Storm的位置 几个重要几个重要概念概念:数据输入:数据输入 Tuple:被处理的数据 Stream:一群消息的集合 Spout:产生数据源的组件 几个重要概念几个重要概念:数据数据处理处理 Bolt:接受数据后处理数据的组件 Worker:运行处理组件
3、逻辑的进程 Task:Work中每一个spout/bolt的线程 bolt的角色是处理数据,输入是上游 (spout或bolt)的tuple,输出是发往下游 (bolt)的tuple;bolt可以有多级,一般最 后一级bolt会定期把结果写到外部存储 几个重要概念几个重要概念:组合组合 Topology:对一个应用的spout、bolt类 型、输入输出tuple/stream、关联关系的 描述 几个重要概念:集群控制 Nimbus:主控节点。负责分配资源,任 务调度,监控集群等 Supervisor:接收任务,启动进程 Zookeeper:协调Nimbus和Supervisor之 间的工作,存放公共数据 几个重要概念:集群控制 Storm处理
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度版权质押合同标的和质押条件
- 2024年度农业机械租赁及种植服务合同2篇
- 2024年度新能源汽车电池灭火系统设计与安装合同
- 医疗窗口服务
- 2024年度企业场地租赁合同书样本
- 2024年度租赁代理合同标的及服务内容的详细规定
- 执业医师实践技能培训
- 2024年度汽车租赁给公司合同3篇
- 2024年度物流仓储服务合同标的
- 二零二四年度建筑设计及其修改合同
- GB/T 2423.65-2024环境试验第2部分:试验方法试验:盐雾/温度/湿度/太阳辐射综合
- 选择性必修第一册测试 高二上学期数学人教A版
- 2024深圳市房地产买卖合同范本
- “电解池”教学设计第1课时
- 博物馆建设项目可行性研究报告
- 实习生肾病内科出科考试试题
- 遥感概论课件
- JB-T 10833-2017 起重机用聚氨酯缓冲器
- YST 544-2009 铸造铜合金锭
- 三年级语文上册 第三单元 10 在牛肚子里旅行说课稿 新人教版
- 2024年4月21日四川省事业单位联考《综合知识》试题
评论
0/150
提交评论