2023学年完整公开课版数据溯源_第1页
2023学年完整公开课版数据溯源_第2页
2023学年完整公开课版数据溯源_第3页
2023学年完整公开课版数据溯源_第4页
2023学年完整公开课版数据溯源_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据溯源概念和定义0102数据溯源模型Content目录03几种主要的数据溯源模型01

概念和定义概念和定义Conceptanddefinition概念与定义

数据溯源(dataprovenance)是一个新兴的研究领域,诞生于20世纪90年代。当初,某些文献将其称为数据志或数据档案,后来,大部分文献将其命名为数据起源,有追踪数据的起源和重现数据的历史状态之意。本文称其为数据溯源,从应用的角度出发,强调追踪的过程和方法。目前,数据溯源还没有公认的定义,因应用领域不同而定义各异。参考一些学者给出的定义:1将数据溯源定义为从源数据到数据产品的衍生过程信息2在数据库领域将其定义为“数据及其在数据库间运动的起源”3数据溯源是对目标数据衍生前的原始数据以及演变过程的描述4数据溯源是一种元数据,用来记录工作流演变过程、标注信息以及实验过程等信息概念和定义

在其它一些领域中还有其它一些叫法:如数据族系(DataLineage)、数据系谱(DataPedigree)、数据来源(DataOrigin)、数据世系等。

数据溯源定义为记录原始数据在整个生命周期内(从产生、传播到消亡)的演变信息和演变处理内容。DataProvenance应该翻译成“数据溯源”,强调的是一种溯本追源的技术,根据追踪路径重现数据的历史状态和演变过程,实现数据历史档案的追溯。

Conceptanddefinition概念与定义概念和定义

在其它一些领域中还有其它一些叫法:如数据族系(DataLineage)、数据系谱(DataPedigree)、数据来源(DataOrigin)、数据世系等。

Conceptanddefinition概念与定义数据溯源定义为记录原始数据在整个生命周期内(从产生、传播到消亡)的演变信息和演变处理内容。DataProvenance应该翻译成“数据溯源”,强调的是一种溯本追源的技术,根据追踪路径重现数据的历史状态和演变过程,实现数据历史档案的追溯。02

数据溯源模型数据溯源模型

建立一个数据模型是数据溯源的关键技术。根据模型可以初步确定数据溯源的大体步骤和基本思路。从数据溯源信息管理的角度出发,提出异构数据的数据溯源概念。即采用横轴表示时间(t)、纵轴表示过程(p)、z轴表示数据的异构分布特性。将数据溯源信息保存到不同的数据库中,形成携带溯源信息的异构数据库。通过数据库接口以及数据转换工具汇聚成目标数据库。这个过程的逆过程所经历的路径能够实现数据溯源的各种操作,如:数据追踪、信息评估、过程重现等,从而完成数据溯源任务。

Datatraceabilitymodel数据溯源模型Datatraceabilitymodel数据溯源模型03

几种主要的数据溯源模型几种主要的数据溯源模型

数据溯源模型主要有:流溯源信息模型、时间-值中心溯源模型、四维溯源模型、开放的数据溯源模型、Provenir数据溯源模型、数据溯源安全模型,PrInt数据溯源模型等,这些模型都建立在不同领域、不同行业。1、流溯源信息模型由6个相关实体构成,主要包括流实体(变化事件实体、元数据实体和查询输入实体)和查询实体(变化事件实体、接收查询输入实体,包括元数据实体)。实体间关系密切,通过这种密切的关系可以根据数据的溯源时间来推断数据溯源。2、BowersS提出的Time-ValueCentric(TVC)模型又称时间-值中心溯源模型,是一种简单有效的溯源模型。由于过去的溯源模型无论是基于标注的还是基于过程的溯源模型都用于面向交易的系统中,并不适合高容量特定需求以及连续的医疗流。于是,提出支持医疗领域数据源特点的TVC模型专门处理医疗事件流的溯源信息。根据数据中的时间戳和流ID号来推断医疗事件的序列和原始数据的痕迹。Severalmaindatatraceabilitymodels几种主要的数据溯源模型

几种主要的数据溯源模型

3、四维溯源模型是由YogeshL.Simmhan等人提出。此模型将溯源看成一系列离散的活动集,这些活动发生在整个工作流生命周期中,并由四个维度(时间、空间、层和数据流分布)组成。四维溯源模型通过时间维区分标注链中处于不同活动层中的多个活动,进而通过追踪发生在不同工作流组件中的活动,捕获工作流溯源和支持工作流执行的数据溯源。Severalmaindatatraceabilitymodels几种主要的数据溯源模型4、开放的数据溯源模型OPM,在首届InternationalProvenanceandAnnotationWorkshop(IPAW)会议中,与会者对数据溯源的描述产生了一些共同的观念,并提出了一种原始的数据模型。后来,南安普顿大学等组织整理了会议

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论