




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、打造高效的 AIoT 数据平台大数据时代数据被源源不断发往云端芯片模组、终端 数据采集网络、IoT平台边缘计算数据引擎(存储查询计算)分析应用 系统+IoT设备数量增长Gartner预计,2021年全球IoT设备数 量将达250亿,届时,物联网生成的总 数据量将达到每年600ZBIoT物联网市场增长2020年全球物联网市场规模将达到1.7万亿美元, 2023年,全球数据库市 场规模可超过500亿美元物联网产业链通用大数据方案的挑战:低效、复杂、高成本通常将开源的 Kafka, Redis, Hbase, MongoDB, Cassandra, ES, Hadoop, Spark,Zookeep
2、er 等 大 数据软件拼装起来,利用集群来处理海量数据。开发效率低因牵涉到多种系统,每种系统有自己的开发语言和工具,开发精 力花在了系统联调上,而且数据的一致性难以保证。运行效率差非结构化数据技术来处理结构化数据,整体性能不够,系统资源 消耗大。因为多套系统,数据需要在各系统之间传输,造成额外 的运行代价。运维复杂每个系统都有自己的运维后台,带来更高的运维代价,出问题后 难以跟踪解决,系统的不稳定性大幅上升。应用推向市场慢集成复杂,得不到专业服务,项目实施周期长,导致人力攀升, 利润缩水。物联网、工业大数据特征:时序空间数据所有采集的数据都是时序的数据都是结构化的一个采集点的数据源是唯一的数据
3、很少有更新或删除操作数据一般是按到期日期来删除的数据以写操作为主,读操作为辅数据流量平稳,可以较为准确的计算数据都有统计、聚合等实时计算操作数据一定是指定时间段和指定区域查找的10数据量巨大,一天的数据量就超过100亿条TDengine 应运而生TDengine 提供的功能消 息 队 列自带消息队列,无需 Kafka 或其他 MQ缓 存所有设备最新记录实时返回数 据 库实时数据库,历史数据库 操作合一透明流 式 计 算对一个或多个数据流 实时聚合计算数 据 订 阅最新的数据可实时推送到应用工业大数据的全栈解决方案TDengine 的整体架构集群管理、资源调度、系统监测TDengine各类 数据
4、源数据采集实时数据历史数据分析引擎 流式计算SQL 引擎元数据各类 应用TDengine 技术生态图Shell: Command Line Interface GrafanaVisualization ToolTime-series Data Processing EngineTDenginePython/Matlab/RAnalytics, MLApplicationsIoT ApplicationJava/C/C+/RestfulTelegrafKafkaOPCData HubMQTTServerWeb Based Management ToolClusteredTDengine 的产品竞
5、争力u定义了创新的时序数据存储结构,通过采用无 锁设计和多核技术,TDengine 让数据插入和读 出的速度比现有通用数据库高了 10 倍以上。u单核一秒就可处理 2 万以上插入请求,插入数 百万数据点,可从硬盘读出一千万以上数据点。u数据都有预聚合处理,多表聚合查询保证只扫 描一次数据文件,查询速度数量级的提升。8 核服务器,100 亿条记录的平均值计算不到 2 秒完整对比测试报告,请参阅:10 倍以上的性能提升TDengine 的产品竞争力u由于超强性能,计算资源不到通用大数据方案的 1/5;通过列式存储和先进的压缩算法,存储空间 不到通用数据库的 1/10。u不用再集成 Kafka, R
6、edis, Spark, Hbase 等系 列软件,系统架构大幅简化,产品研发成本大幅 下降。u零管理,不用分库分表、不分历史库、实时库, 数据实时备份,运维成本大幅下降。完整对比测试报告,请参阅:总拥有成本大幅下降TDengine 的产品竞争力零学习成本u使用标准的 SQL 语法,并支持 C/C+, JAVA, GO, Python, RESTful 接口,应用 API 与 MySQL 高度相似, 让学习成本几乎为零u安装包仅仅 1.5 MB,不依赖任何其他软件。从下载、安 装到成功运行几秒搞定u无论是十年前还是一秒钟前的数据,指定时间范围即可 查询。数据可在时间轴或多个设备上进行聚合。临时
7、查 询可通过 Shell/Python/R/Matlab 随时进行u与第三方工具 Telegraf, Grafana, Matlab, R 等无缝 链接create database demo; use demo;create table t1(ts timestamp, degree float); insert into t1 values(now, 28.5);insert into t1 values(now, 29.0); select * from t1;select avg(degree), count(*) from t1;CNC 应用场景.MQTTServerCNCCNCCN
8、CCNC数据 轮询 转换 模块TDengine集群App (最新状态显示)Mobile AppApp ( 分析报表)关系数据库,配 置、设备、人员 信息管理、以及 报警信息统计ETL关键指标:相对MySQL,数据压缩率提升18倍,查询速度提升20倍以上。电力 IDC 运维监测场景Telegraf+TDengine+Grafana 组合:无需代码、搭建一个高效的IT运维监测平台GrafanaTelegraf CPURAMNETNGIXDBTelegrafCPURAMNET NG I X D B TDengine集群 油井开采、石油运输管线、炼化、 运输车队、加油站等实时监测水表、气表、城市管线、
9、 智慧家庭、智慧城市I T 基础设施、服务器、机房、 各种应用的监测和分析上网记录、通话记录、用户行为、 金融、证券交易记录电梯、锅炉、数控机床、挖掘机、 各种大型机械设备实时监测智能电表、电网骨干网、配网、 各种发电设备实时监测和分析各种物联网、车联网、工业互联网 的结构化日志数据处理天气、空气、湖泊等 环境监测自行车、汽车、出租、高铁、飞机、 轮船等各种出行工具TDeng创ine 技新术创新之处TDengine 对外接口C/C+Java、PythonClient 接口REST APIClient 接口SPARKHadoop 接口Meter数据采集点DBA Tool 引擎管理工具Meter数
10、据采集点TDengine Cluster. . .TDengine 系统结构V0V1V3dnode 7V0V1V3M0V0V1V0V1V2V3dnode 0V0V1V2V3dnode1V2V3dnode 2dnode 3V0V1V2dnode 4V0V1V2M1dnode 5V0V2V3V1dnode 6M2V3TDengine 一典型流程appvnodemnode1: insert3: response2: get meta-data4: insert5: ack6: acktaosc数据模型:一个设备一张表使用 KV 或关系型 DB,在多个数据采集点存在的情况 下难以保证一个采集点的数据在
11、内存或硬盘上的连续性TDengine,一个采集点的数据在一个块里是连续存放的,块的大小可配置 采取 Block Range Index, 可快速定位要查找的数据所处的块012345012345TDengine 数据写入流程WriteAppmemorydiskCommit logVnodeFILEFILEPeer VnodeFlushTDengine 数据压缩u采取列式存储,便于压缩u不同数据类型采用不同的压缩算法,包括 delta-delta 编码、simple 8B 方法、 zig-zag 编码、LZ4 等算法u二阶段压缩:压缩的基础上,用通用压缩 算法进行再压缩TDengine 单个采集点
12、数据插入、查询示例与传统关系型数据库一样,采用SQL语法,应用需先创建库,然后建表,就可以插入、查询create database demo; use demo;create table t1 (ts timestamp, degree float); insert into t1 values(now, 28.5);select * from t1;上述SQL 为一个温度传感器创建一张表,并插入一条记录、然后查询TDengine 超级表:多个采集点的数据聚合STable(超级表)是表的集合,包含多张表,而且每张表的schema是一样的。同一类型的采集设备可以 是一个STable,除定义Sch
13、ema外, 还可定义多个标签。标签定义表的静态属性,如设备型号、颜色等。 具体创建表时,指定使用哪个STable(采集点的类型),并指定标签值。实际场景中,经常需要将多个采集点数据进行聚合处理,比如所有温度传感器采集的温度的平均值。 因为一个传感器就是一张表,这样需要将多张表聚合。为减少应用的复杂性,TDengine引入STable概念。应用可以象查询表一样查询STable, 但可以通过标签过滤条件查询部分或全部数据采集点的记录,并且可 以做各种聚合、计算等,方便支持复杂查询,应对业务需求。每个表(采集点)都有对应一行的标签数据,保存在Meta节点,而且存放在内存并建有索引。标签数据 可以任意
14、增加、删除、修改。标签数据与采集数据完全分离,大大节省存储空间,并提高访问效率。而 且对于已经采集的历史数据,事后可以打上新的标签。TDengine 超级表实例createtablet1usingthermometertags(beijing,1);createtablet2usingthermometertags(beijing,2);createtablet3usingthermometertags(tianjin,1);createtablet4usingthermometertags(tianjin,2);为温度传感器建立一个 STable, 有两个标签:位置和类型create tab
15、le thermometer (ts timestamp, degree float) tags(loc binary(20), type int);用 Stable 创建 5 张表, 对应 5 个温度传感器,地理位置标签为北京、天津、上海等create table t5 using thermometer tags(shanghai,1);查询北京和天津所有温度传感器记录的最高值和最小值select max(degree), min(degree) from thermometer where loc=beijing or loc=tianjin;TDengine 聚合计算流程Data No
16、de 0Data Node 1Meta NodeDriverData NodeApp4-15-14-05-05-24-2TDengine 时间轴上的数据聚合实际场景中,经常需要将一段时间的数据进行聚合,比如downsampling, 采样频率为一秒 一次,但最终只记录一分钟的平均值。TDengine引入关键词interval, 以进行时间轴上的聚 合操作。时间轴的聚合既可以针对单独一张表,也可以针对符合标签过滤条件的一组表进 行。查询温度传感器t1记录的温度每五分钟的平均值select avg(degree) from t1 interval(5m);查询北京所有温度传感器记录的温度每五分钟的
17、平均值select avg(degree) from thermometer where loc=beijing interval(5m);TDengine 实时Stream计算目前支持Avg, Max, Min, Percentile, Sum, Count, Dev, First, Last, Diff, Scale, WAvg,Spread等操作。计算是针对时间段,同时可针对一张表或符合过滤条件的一组表进行聚合。实时计算的衍生数据可以实时写入新的表,方便后续的查询操作。衍生数据还可以与其 他原始数据或其他衍生数据进行各种聚合计算,生成新的数据。每隔一分钟计算北京刚刚过去的五分钟的温度平均
18、值select avg(degree) from thermometer where loc=beijing interval(5m) sliding(1m);每分钟计算一次北京刚过去的5分钟的温度平均值,并写入新的表d1create table d1 asselect avg(degree) from thermometer where loc=beijing interval(5m) sliding(1m);TDengine 水平扩展测试结果:完全线性数据插入吞吐量、延时与节点个数关系数据查询吞吐量、延时与节点个数关系数据订阅类似流行的Kafka,应用可以订阅数据流,只要数据有更新,应用将
19、得到及时通知订阅时,应用只要指定数据库的表名和开始时间即可APP 1APP 2APP 3Meter数据采集点Meter数据采集点TDengine ClusterTDe简ngin单e 零管理日常运维工作为零不存在分库、分表不存在实时库、历史库之分不存在档案数据之说,只需要配置好多级存储的存储路径扩容,加入新的节点,一条指令搞定系统根据资源情况,自动负载均衡,无需任何人工干预将副本数设置好,数据将自动实时备份TDengine 运维管理工具数据导入、导出:支持按SQL脚本文件导入,支持按数据文件导入在shell里按查询结果直接导出到CSV文件专用工具taosdump: 导出所有数据库、一个数据库或
20、者数据库中的一张表,所有数据或一时间段的数据,甚 至仅仅表的定义WEB管理工具:在shell里的操作都可在web页面上进行,更加友好各种系统监测指标(插入、查询次数,服务器资源等) 用图表可视化各种重要操作日志都可查询与运维监测平台无缝对接:各种监测量和日志都存放在DB里,可用标准SQL获取, 便于对接第三方运维监测平台TDengineIDC 迁移,可以无服务中断进行对于副本数,用户可以动态的调整,增加、减少都可以增加副本时,数据会立即同步到新的副本,而且服务不受中断为防止同步消耗资源过多,TDengine控制了一个节点并发的同步数量迁移IDC时,只需要做两件事将新IDC机房的服务器加入集群,负载均衡将自动启动,等待其完成将老的IDC机房,一台一台的关机。每关一台,等新的副本在新I
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025《房产交易合同》
- 2025年租赁合同及转租协议
- 2025体育中心场馆租赁合同
- 2024年九月租赁市场透明度提升方案实施框架
- 2025年河北货运从业资格考试模拟考试题库答案
- 2025年湖北货运从业资格证网上考试答案大全
- 2025年那曲货运从业资格证考试题库
- 2025年阿里a2货运从业资格证考试题
- 包括建立更加完善的预警机制、加强内部审计和监督等
- 水电包工付款合同范本
- 2025届福建省质检高三适应性练习英语试卷(含答案和音频)
- 中医适宜技术-中药热奄包
- 《药品经营质量管理规范》的五个附录
- 医院安全检查台账
- 浙江省温州市地图矢量PPT模板(图文)
- 重庆邮电大学本科毕业设计(论文)参考模板-2020版
- 微课国内外研究现状文档
- 结业证书模版(共1页)
- 生产线直通率统计表
- 过程审核检查表(根据大众FORMEL-Q要求)
- 大肠杆菌及大肠菌群计数方法
评论
0/150
提交评论