真正的大数据云计算平台_第1页
真正的大数据云计算平台_第2页
真正的大数据云计算平台_第3页
真正的大数据云计算平台_第4页
真正的大数据云计算平台_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

真正的大数据云计算平台第1页,共45页,2023年,2月20日,星期日第一部分1.1云计算平台架构clouDil1.2MapReduce+TaskMaster1.3DataCube1.4cCloud1.5cStor第二部分云计算平台能力第2页,共45页,2023年,2月20日,星期日真正的云计算平台,它有五层架构:运维管理层:clouDil计算层:MapReduce+TaskMaster数据管理层:DataCube虚拟化层:cCloud存储层:cStor第3页,共45页,2023年,2月20日,星期日第4页,共45页,2023年,2月20日,星期日第一部分1.1云计算平台架构1.2MapReduce+TaskMaster1.3DataCube1.4cCloud1.5cStor第二部分云计算平台能力clouDil第5页,共45页,2023年,2月20日,星期日

在搭建云计算平台时,遇到了很多的问题和挑战。开始搭建时,第一次来了那么多性能强劲的机器,我们在感到兴奋的同时,也不免有些顾虑。出了问题怎么办,有没有预警机制?有没有可视化的管理界面?机器宕机,管理员能否实时监控到?如何做性能调优?扩容升级时,能否给出依据?

带着这些问题,我们开始了自己的云计算平台管理和运营之旅,现在完美的形成了一整套云计算平台管理体系。第6页,共45页,2023年,2月20日,星期日流量监控第7页,共45页,2023年,2月20日,星期日健康度报告第8页,共45页,2023年,2月20日,星期日节点性能监控第9页,共45页,2023年,2月20日,星期日集群状态监控第10页,共45页,2023年,2月20日,星期日集群状态监控第11页,共45页,2023年,2月20日,星期日第一部分1.1云计算平台架构1.2clouDil1.3DataCube1.4cCloud1.5cStor第二部分云计算平台能力MapReduce+TaskMaster第12页,共45页,2023年,2月20日,星期日MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。第13页,共45页,2023年,2月20日,星期日

TaskMaster是云创存储自主研发的一款高效云调度平台。它保证在云计算平台中部分硬件或软件发生故障的情况下仍不影响系统的正常运行;保证在云计算平台中高效稳定的合理化分配和执行任务,同时能够完美解决系统单点故障问题,负载均衡,自动调度与部署。第14页,共45页,2023年,2月20日,星期日产品优势高可靠性:采用“多主多备,负载均衡”的管理节点,从而保证无论管理节点还是处理节点都不存在任何单点故障问题。低依赖性:采用模块化设计思想,通过统一化配置和API接口的方式向用户提供服务。低干预性:采用基于事件化的统一管理模式。在系统无人值守的情况下自动完成故障处理等功能。高实时性:在机器性能允许的范围内,所有任务的控制工作基本都在秒级完成,具有前所未有的高效性。第15页,共45页,2023年,2月20日,星期日第一部分1.1云计算平台架构1.2clouDil1.3MapReduce+TaskMaster1.4cCloud1.5cStor第二部分云计算平台能力DataCube第16页,共45页,2023年,2月20日,星期日

数据立方是一种高效分布式的处理海量数据的云处理软件,具有从TB乃至PB级的数据中挖掘出有用的信息并进行快捷、高效处理的能力,同时支持数据仓库存储和商业智能分析等业务。该软件基于hadoop平台大数据处理的解决方案,具有处理能力高效、超高可靠性的优点。第17页,共45页,2023年,2月20日,星期日产品特点对任意多关键字实时索引支持类SQL复杂并行组合查询分布式万兆实时数据流秒级处理系统无单点,确保意外情况下,系统的正常运行第18页,共45页,2023年,2月20日,星期日第19页,共45页,2023年,2月20日,星期日第20页,共45页,2023年,2月20日,星期日第21页,共45页,2023年,2月20日,星期日第一部分1.1云计算平台架构1.2clouDil1.3MapReduce+TaskMaster1.4DataCube1.5cStor第二部分云计算平台能力cCloud第22页,共45页,2023年,2月20日,星期日

cCloud是南京云创存储科技有限公司自主研发的虚拟化云计算平台。 cCloud平台可以加速高伸缩性的公共和私有云IaaS的部署、管理、配置。帮助企业用户快速而轻松地将虚拟数据中心资源转 入自动化、富于弹性且可自我服务的云平台中。另外cCloud兼容亚马逊API接口允许跨cCloud和亚马逊平台实现负载兼容。使用cCloud作为基础数据中心操作者可以快速方便的通过现存基础架构创建云服务。第23页,共45页,2023年,2月20日,星期日cCloud系统构架第24页,共45页,2023年,2月20日,星期日第25页,共45页,2023年,2月20日,星期日第26页,共45页,2023年,2月20日,星期日第27页,共45页,2023年,2月20日,星期日第28页,共45页,2023年,2月20日,星期日第一部分1.1云计算平台架构1.2clouDil1.3MapReduce+TaskMaster1.4DataCube1.5cCloud第二部分云计算平台能力cStor第29页,共45页,2023年,2月20日,星期日

cStor云存储系统是南京云创存储自主研发的高科技产品。与传统的大规模存储系统相比,cStor针对绝大多数数据密集型应用的特点从多个方面进 行了优化,从而在一定规模下达到成本、可靠性和性能的最佳平衡。 目前,cStor云存储系统已成功应用于安防、广电、交通、电信、政务等诸多领域。第30页,共45页,2023年,2月20日,星期日产品特性优异性能:支持高并发、带宽饱和利用。cStor云存储系统将控制流和数据流分离,数据访问时多个存储服务器同时对外提供服务,实现高并发访问。高度可靠:采用多个数据块副本的方式实现冗余可靠,数据在不同的存储节点上具有多个块副本,任意节点发生故障,系统将自动复制数据块副本到新的存储节点上,数据不会丢失,实现数据完整可靠。第31页,共45页,2023年,2月20日,星期日在线伸缩:可以在不停止服务的情况下,动态加入新的存储节点,无需任何操作,即可实现系统容量从TB级向PB级平滑扩展;也可以取下任意节点,系统自动缩小规模而不丢失数据,并自动将取下的节点上的数据备份到其他节点上,保证整个系统数据的冗余数。超大规模:支持超大规模集群,理论容量为1024*1024*1024PB。简单通用:支持POSIX接口规范,支持Windows/Linux/MacOSX,可当成海量磁盘使用,无需修改应用。同时系统也对外提供专用的高速API访问接口。第32页,共45页,2023年,2月20日,星期日

cStor超安存云存储系统是新一代基于编码技术的分布式文件存储系统,它在cStor云存储系统的基础上,融入RS编解码取代传统副本冗余的方式进行系统容错,编解码参数M+N可根据应用需求灵活配置。 相对于传统的副本冗余容错 方式而言,具有更高的磁盘利用率和更高的系统可靠性,如采用8+2的编解码容错方式,磁盘利用率可以达到80%,允许同时损坏2台存储服务器。第33页,共45页,2023年,2月20日,星期日产品特性高磁盘利用率:对于传统具有N份副本容错而言,其磁盘利用率只有1/N,而采用编解码方式,磁盘利用率为M/(N+M),如8+2,其磁盘利用率为80%。高可靠性:传统全副本的容错方式,通过牺牲磁盘的有效容量来提升系统的可靠性,如1:1副本容错,磁盘利用率为50%,只能损坏1台存储节点;而采用2+2的编解码方式,在磁盘利用率为50%的情况下,允许同时损坏2台存储节点。第34页,共45页,2023年,2月20日,星期日高安全性:数据在编码的过程中,也起到数据加密的作用,必须通过对应的解密算法解码才能够获取到原始数据,提升了系统的安全性。优异性能:所有的存储节点兼作编解码计算节点,有效的保证了客户端的写入性能,同时充分利用了整个系统中大量存储节点的计算资源。第35页,共45页,2023年,2月20日,星期日第一部分1.1云计算平台架构1.2clouDil1.3MapReduce+TaskMaster1.4DataCube1.5cCloud第二部分cStor云计算平台能力第36页,共45页,2023年,2月20日,星期日数据立方etl工具是一个用来将数据立方和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如:MySQL,Oracle,Postgres等)中的数据导进到数据立方中,也可以将数据立方的数据导进到关系型数据库中。一大亮点就是可以通过hadoop的mapreduce把数据从关系型数据库中导入数据到数据立方。第37页,共45页,2023年,2月20日,星期日数据立方数据库OracleMysqlPostgreSQL……数据立方ETL工具第38页,共45页,2023年,2月20日,星期日硬件配置序号设备名称数量CPU内存硬盘网络1主控节点1双路四核,主频2GHz32GB2TB*8双千兆网卡绑定2处理节点10双路四核,主频2GHz32GB2TB*8双千兆网卡绑定3客户端1双路四核,主频2GHz32GB2TB*8双千兆网卡绑定*千兆48口交换机第39页,共45页,2023年,2月20日,星期日建表语句:createtableE_MP_POWER_CURVE(IDBIGINT,DATA_TYPEINT,DATA_POINT_FLAGINT,DATA_WHOLE_FLAGSTRING,P1DOUBLE,P2DOUBLE,P3DOUBLE,P4DOUBLE,P5DOUBLE,P6DOUBLE,P7DOUBLE,P8DOUBLE,P9DOUBLE,P10DOUBLE,P11DOUBLE,P12DOUBLE,P13DOUBLE,P14DOUBLE,P15DOUBLE,P16DOUBLE,P17DOUBLE,P18DOUBLE,P19DOUBLE,P20DOUBLE,P21DOUBLE,P22DOUBLE,P23DOUBLE,P24DOUBLE,P25DOUBLE,P26DOUBLE,P27DOUBLE,P28DOUBLE,P29DOUBLE,P30DOUBLE,P31DOUBLE,P32DOUBLE,P33DOUBLE,P34DOUBLE,P35DOUBLE,P36DOUBLE,P37DOUBLE,P38DOUBLE,P39DOUBLE,P40DOUBLE,P41DOUBLE,P42DOUBLE,P43DOUBLE,P44DOUBLE,P45DOUBLE,P46DOUBLE,P47DOUBLE,P48DOUBLE,P49DOUBLE,P50DOUBLE,P51DOUBLE,P52DOUBLE,P53DOUBLE,P54DOUBLE,P55DOUBLE,P56DOUBLE,P57DOUBLE,P58DOUBLE,P59DOUBLE,P60DOUBLE,P61DOUBLE,P62DOUBLE,P63DOUBLE,P64DOUBLE,P65DOUBLE,P66DOUBLE,P67DOUBLE,P68DOUBLE,P69DOUBLE,P70DOUBLE,P71DOUBLE,P72DOUBLE,P73DOUBLE,P74DOUBLE,P75DOUBLE,P76DOUBLE,P77DOUBLE,P78DOUBLE,P79DOUBLE,P80DOUBLE,P81DOUBLE,P82DOUBLE,P83DOUBLE,P84DOUBLE,P85DOUBLE,P86DOUBLE,P87DOUBLE,P88DOUBLE,P89DOUBLE,P90DOUBLE,P91DOUBLE,P92DOUBLE,P93DOUBLE,P94DOUBLE,P95DOUBLE,P96DOUBLE)PARTITIONEDBY(DATA_DATESTRING,IDRAGEBIGINT)ROWFORMATDELIMITEDFIELDSTERMINATEDBY','STOREDASTEXTFILE;第40页,共45页,2023年,2月20日,星期日该表一共104个字段,平均一条记录300Byte以下是从数据立方导入到Oracle的测试统计以下是从Oracle导入到数据立方的测试统计1000万条2500万条5000万条1亿条2亿

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论