标准解读

GB/T 44216-2024是一项由中国国家标准化管理委员会发布的关于信息技术领域中大数据处理的技术标准,特别聚焦于批流融合计算技术。该标准为实现大数据处理中的批处理与流处理的有效整合提供了规范和技术要求,旨在提升数据处理的效率、实时性和灵活性。以下是对该标准主要内容的概述:

  1. 范围界定:标准明确了适用范围,涵盖了大数据批处理和流处理融合计算的技术框架、系统架构、数据模型、算法设计、接口规范及性能评估等方面,适用于大数据处理系统的开发、实施与运维。

  2. 术语定义:详细定义了批处理、流处理、批流融合计算等关键术语,为理解标准内容建立了统一的语言基础。

  3. 技术框架:提出了批流融合计算的整体架构,包括数据采集、数据预处理、融合计算引擎、数据存储与管理、数据分析与应用等模块,强调了各模块间的数据流动与交互机制。

  4. 系统架构:描述了支持批流融合的系统设计原则,如可扩展性、高可用性、实时处理能力等,并推荐了分布式、微服务等架构模式以适应大规模、高并发的数据处理需求。

  5. 数据模型:规定了批流融合场景下的数据表示方式和模型设计原则,确保不同来源、不同格式的数据能够被统一管理和高效处理。

  6. 算法与处理技术:介绍了适用于批流融合计算的算法和技术,如窗口计算、事件驱动处理、增量计算等,以及如何在保证数据一致性和时效性的前提下,优化计算效率。

  7. 接口规范:定义了数据接入、处理、输出等环节的接口标准,促进不同系统、工具间的互操作性,便于集成和维护。

  8. 性能评估:提出了一套评价批流融合计算系统性能的指标体系,包括吞吐量、延迟、资源利用率、容错能力等,为系统优化和选型提供参考依据。

  9. 安全与隐私保护:强调了在批流融合计算过程中应遵循的数据安全和隐私保护原则,要求实施相应的技术和管理措施,确保数据处理活动合规。

  10. 测试与验证:提供了对批流融合计算系统进行功能测试、性能测试和稳定性测试的方法指南,确保系统达到预期的设计目标。


如需获取更多详尽信息,请直接参考下方经官方授权发布的权威标准文档。

....

查看全部

  • 即将实施
  • 暂未开始实施
  • 2024-07-24 颁布
  • 2025-02-01 实施
©正版授权
GB/T 44216-2024信息技术大数据批流融合计算技术要求_第1页
GB/T 44216-2024信息技术大数据批流融合计算技术要求_第2页
GB/T 44216-2024信息技术大数据批流融合计算技术要求_第3页
GB/T 44216-2024信息技术大数据批流融合计算技术要求_第4页
GB/T 44216-2024信息技术大数据批流融合计算技术要求_第5页
免费预览已结束,剩余15页可下载查看

下载本文档

GB/T 44216-2024信息技术大数据批流融合计算技术要求-免费下载试读页

文档简介

ICS

35.240

CCS

L67

中华人民共和国国家标准

GB/T44216—2024

信息技术大数据

批流融合计算技术要求

Informationtechnology—Bigdata—Technicalrequirementsforintegratedbatch

andstreamingcomputing

2024-07-24发布2025-02-01实施

国家市场监督管理总局发布

国家标准化管理委员会

GB/T44216—2024

目次

前言

·····································································································

引言

·····································································································

1

范围

··································································································

1

2

规范性引用文件

······················································································

1

3

术语和定义

···························································································

1

4

缩略语

································································································

2

5

系统架构

······························································································

2

6

技术要求

······························································································

3

6.1

统一资源管理

····················································································

3

6.2

统一计算框架

····················································································

4

6.3

统一SQL接口

···················································································

4

6.4

统一API

·························································································

5

6.5

统一作业管理

····················································································

5

6.6

统一权限管理

····················································································

6

7

扩展性要求

···························································································

6

8

兼容性要求

···························································································

7

9

性能指标

······························································································

7

附录A(资料性)

批流融合计算应用场景

····························································

8

A.1

金融行业

························································································

8

A.2

智能制造行业

···················································································

8

A.3

物联网

···························································································

8

A.4

航空航天

························································································

8

附录B(资料性)

字符类型及操作中英文对照表

·····················································

9

参考文献

································································································

11

GB/T44216—2024

前言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规

定起草。

请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。

本文件由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。

本文件起草单位:阿里云计算有限公司、中国电子技术标准化研究院、浪潮电子信息产业股份有限

公司、华为技术有限公司、浙江中烟工业有限责任公司、蚂蚁科技集团股份有限公司、腾讯云计算

(北京)有限责任公司、杭州海康威视数字技术股份有限公司、北京易华录信息技术股份有限公司、

上海宝信软件股份有限公司、北京柏睿数据技术股份有限公司、山东浪潮数据库技术有限公司、上海计

算机软件技术开发中心、中国铁道科学研究院集团有限公司、中国电子系统技术有限公司、浪潮软件科

技有限公司、中通服咨询设计研究院有限公司、网易(杭州)网络有限公司、中国南方电网有限责任公

司、北京百分点科技集团股份有限公司、广东电网有限责任公司、北京华胜天成科技股份有限公司、

浙江邦盛科技股份有限公司、中国石油化工集团有限公司、普元信息技术股份有限公司、方正国际软件

(北京)有限公司、浙江创邻科技有限公司、四川发展数字金沙科技有限公司、北京庚顿数据科技有限

公司、陕西省信息化工程研究院、成都数据集团股份有限公司、国能信息技术有限公司、成都数之联科

技股份有限公司、云上贵州大数据产业发展有限公司、药融云数字科技(成都)有限公司、浙江智臾科

技有限公司、深圳市中丝贸科技有限公司、深圳亿维锐创科技股份有限公司、河南省新星科技有限公

司、浙江方信标准技术有限公司、海南电网有限责任公司、中国电信集团财务有限公司、复旦大学、上海交通

大学。

本文件主要起草人:朱松、陈守元、许洁、王峰、吴涛、刘健、杨锐、金泳、郭智慧、刘海涛、

蒋楠、黄超、陈小龙、张延生、王凌、黄明、赵菁华、朴晟宏、高阳、张黎明、陈敏刚、刘陈宇、

吴艳华、刘国栋、杨旭、王金超、张永良、马进、王宇静、陈彬、杨秋勇、钱正浩、梁盈威、孙伟、

梁钢、王新根、臧一超、张煜、周研、刘宇峰、王晋晖、张勇、李傲铁、李正、段智琛、傅彦、

周俊临、黄明峰、刘军、王军刚、张晖、李明、王中健、周小华、丘琳、许宏安、皮志新、董卫魏、

郭威、张磊、冯曹冲、陈勇锦、王毅、李爽、郑忠斌。

GB/T44216—2024

引言

随着数据量的增长,分布式计算模式逐渐成为大数据处理和计算的主流架构。为了满足程序的健壮

性和实时性要求,设计出了许多分布式计算框架,以屏蔽底层复杂的任务划分和集群调度细节,其中最

常用的两种是批计算技术和流式计算技术,二者有着迥异的编程模型和编程接口,适用于不同的计算场

景。批计算技术适合需访问全套记录才能完成的计算工作,流计算技术很适合用来处理需对变动或峰值

做出响应,并且关注一段时间内变化趋势的数据。

在实际应用中,经常会遇到两种计算技术共同工作的情况。将两种计算框架进行简单的叠加,则需

要在两个不同的引擎上实现相同的执行逻辑,还需要手工合并不同引擎的输出结果。如果需要更改查询

逻辑,两个系统也需要同时进行改动。这会极大地增加工程的开发和维护成本。因此,统一的批流融合

计算技术成为了大数据领域的重要发展趋势。

GB/T44216—2024

2信息技术大数据

批流融合计算技术要求

1范围

本文件规定了大数据批流融合计算技术要求,包括:技术要求、扩展性要求、兼容性要求、性能指

标等。

本文件适用于批流融合计算系统的设计、开发和部署。用户理解、采用、建设批流融合计算技术和

批流融合产品与服务评估参照执行。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文

件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用

于本文件。

GB/T35295—2017信息技术大数据术语

3术语和定义

GB/T35295—2017界定

温馨提示

  • 1. 本站所提供的标准文本仅供个人学习、研究之用,未经授权,严禁复制、发行、汇编、翻译或网络传播等,侵权必究。
  • 2. 本站所提供的标准均为PDF格式电子版文本(可阅读打印),因数字商品的特殊性,一经售出,不提供退换货服务。
  • 3. 标准文档要求电子版与印刷版保持一致,所以下载的文档中可能包含空白页,非文档质量问题。

评论

0/150

提交评论