2021大数据征基本概念_第1页
2021大数据征基本概念_第2页
2021大数据征基本概念_第3页
2021大数据征基本概念_第4页
2021大数据征基本概念_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE11PAGEPAGE10大数据基本术语(2021版)范围本标准界定了大数据征信领域中的常用术语和定义。本标准适用于大数据征信智能评估与开放服务平台的科研和应用。2.1数据data任何以电子或其他方式对信息的记录。2.2数据集dataset数据记录汇聚的数据形式。[GB/T35295—2017,定义2.1.46]2.3大数据bigdata具有体量巨大、来源多样、生成极快、且多变等特征并且难以用传统数据体系结构有效处理的包含大量数据集的数据。[GB/T35295—2017,定义2.1.1]2.4数据库database长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合。2.5结构化数据structureddata具有预定义模型或以预定义方式组织的数据,也称作行数据,可由二维表结构来逻辑表达和实现。2.6非结构化数据unstructureddata不具有预定义模型或未以预定义方式组织的数据。[GB/T35295—2017,定义2.1.25]2.7关系模型relationalmodel结构基于一组关系的数据模型。[GB/T5271.17—2010,定义17.04.04]2.8关系数据库relationaldatabase数据按关系模型来组织的数据库。[GB/T5271.17—2010,定义17.04.05]2.9数据仓库datawarehouse在数据准备之后用于永久性存储数据的数据库。[GB/T35295—2017,定义2.1.35]2.10数据管理datamanagement利用计算机硬件和软件技术对数据进行有效的收集、存储、处理和应用的过程。2.11分布式数据处理distributeddataprocessing;DDP将操作分散到计算机网络的各结点进行的数据处理。[GB/T5271.18—2008,定义18.01.08]2.12数据生存周期datalifecycle2.13元数据metadata([GB/T5271.17—2010,定义17.06.05]2.14语义元数据semanticmetadata2.15数据治理datagovernance对数据进行处置、格式化和规范化的过程注1:数据治理是数据和数据系统管理的基本要素。注2:数据治理涉及数据全生存周期管理,无论数据是处于静态、动态、未完成状态还是交易状态。[GB/T35295—2017,定义2.1.43]2.16开放数据opendata可为其他数据使用的数据。[GB/T35295—2017,定义2.1.44]2.17linkeddata[GB/T35295—2017,定义2.1.45]2.18数据技术datatechnology用于管理和处理数据所采用的各种技术的总称。2.19追溯provenance对数据集的历史元数据的讨论。[GB/T35295—2017,定义2.1.47]2.20分析analytics根据已有数据或信息合成知识的过程。2.21数据挖掘datamining从大量的数据中通过算法搜索隐藏于其中信息的过程。[GB/T33745—2017,定义2.5.3]2.22数据共享datasharing2.23数据交换dataexchange2.24数据溯源dataprovenance记录数据从产生到消亡或转换的整个生命周期内所发生的变化和经过处理的信息。2.25大规模并行处理massivelyparallelprocessing多个处理器并行工作以执行一个特定计算任务的过程。[GB/T35295—2017,定义2.1.20]2.26分布式文件系统distributedfilesystem多个结构化数据集分布在一个或多个服务器的各个计算节点的文件系统。[GB/T35295—2017,定义2.1.21]2.27分布式计算distributedcomputing一种覆盖存储层和处理层的、用于实现多类型程序设计算法模型的计算模式。[GB/T35295—2017,定义2.1.22]2.28大数据平台bigdataplatform以处理海量数据存储、计算及不间断流数据实时计算等场景为主的一套基础设施。2.29大数据服务bigdataservice基于底层可伸缩的大数据平台和上层各种大数据应用提供的各种覆盖数据生命周期相关活动的各种数据服务。2.30价值value从分析学角度考虑的数据对组织的重要性。[GB/T35295—2017,定义2.1.30]2.31波动性volatility[GB/T35295—20172.1.31]2.32正确性validity就数据预期用途而言的数据适当性。[GB/T35295—2017,定义2.1.32]2.33动态数据datainmotion处于活动状态,典型特征表现为大数据的速度和多变性特征的数据。[GB/T35295—2017,定义2.1.36]2.34静态数据dataatrest处于静止状态,典型特征表现为大数据的体量和多样性特征的数据。[GB/T35295—2017,定义2.1.37]2.35非关系模型non-relationalmodels用于数据存储和处理、不遵循关系代数的逻辑数据模型。[GB/T35295—2017,定义2.1.38]2.36联合数据库系统federateddatabasesystem一种元数据库管理系统,它透明地将多个自治数据库系统映射到一个单一联合数据库。[GB/T35295—2017,定义2.1.39]2.37共享磁盘文件系统shared-diskfilesystems使用单一存储池且与多个计算资源关联的存储数据的方法。[GB/T35295—2017,定义2.1.50]2.38datacharacteristichierarchy注:大数据的特征层级一般包括以下层级:——数据元素;——记录(数据元素的汇集);——数据集(记录的汇集);——多数据集(数据集的汇集)。[GB/T35295—2017,定义2.1.51]2.39隐私计算privacycomputation在保护数据本身不对外泄露的前提下实现数据分析计算的技术集合。2.40云计算cloudcomputing注:资源包括服务器、操作系统、网络、软件、应用和存储设备等。[GB/T32400—2015,定义3.2.5]2.41流数据streamingdata由接口传递,从连续运行的数据源产生的数据。[GB/T35295—2017,定义2.1.24]2.42数据中心datacenter机房([GB/T33136—2016,定义3.1.1]2.43资源协商resource

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论