元数据管理方案_第1页
元数据管理方案_第2页
元数据管理方案_第3页
元数据管理方案_第4页
元数据管理方案_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

元数据管理方案元数据管理方案元数据抽取为了简化元数据生成工作,系统提供自动生成元数据功效,即元数据抽取。经过元数据自动抽取,用户能够方便、快捷地取得大量元数据信息。抽取对象元数据抽取主要针正确对象有以下几个: 已经有目录:已建业务应用系统中现有目录资源。 数据库:各种数据库资源,包含关系型数据库、XML数据库等。 格式化电子文件:电子文件,比如Word、PDF、XLS等文件。元数据抽取流程元数据抽取流程有4个主要步骤,分别为: 数据源信息获取:处理要从哪个数据源取得元数据问题。 内容/结构分析:处理要从数据源中取得哪些元数据问题。 元数据提取:处理怎样从数据源中获取元数据问题。 存放入库:处理元数据存放问题。电子文档元数据抽取对于电子文档,首先各部门文档格式不尽相同,另外它们安全级别也各不相同,同时因为信息化建设水平不一致,有部门文档分散在各处,有部门文档是集中存放,甚至已经建立了完善电子系统进行管理。针对以上情况,对于电子文档元数据抽取需要进行以下抽取流程:整理归档对于分散在各处电子文档(纸质文档需要先进行电子化处理),必须由专员进行统一整理,依照公开共享前提进行集中,这种集中能够是物理上集中,也能够是逻辑上集中。但要满足以下标准,第一依照安全级别,便于外界访问;第二便于文档增量公布;第三便于采集工具自动化采集编目。各部门只有在文档完全整理归档情况下,进行自动化采集才是切实可行。在整理归档时候,各部门依照各自情况进行归档,没有必要千篇一律,也没有必要制订繁琐和呆板规则,只要能够满足以上标准即可。依照安全级别,建立对应访问机制因为受到安全级别限制,所以对于需要共享数据要进行安全方面限制,限制伎俩能够有:用户名/密码、数字证书、物理隔断等等,依照实际情况建立安全访问机制,做到主要信息不泄露,不丢失。编目处理现阶段,主流格式电子文档,主要包含:word、excel、ppt、pdf等。对主流格式电子文档,要提供自动采集工具进行编目处理。采集范围主要是文档标题和内容,对于其它元数据内容,要提供手工配置方式进行辅助。另外,在工具采集效率上,要提升增量文档公布后采集效率。对于格式特殊、内容有加密算法文档,是极难经过抓取工具进行采集,这些文档主要经过手工编目标方式来处理。对于存在管理库文档,就需要对数据库来进行编目采集,详见数据库元数据抽取部分。保留元数据采集后数据要放到数据库或者保留到硬盘上,另外要依照目录体系标准,把数据分解为元数据,然后进行存放数据库元数据抽取数据中心需要抽取数据库类型主要为Sqlserver,首先利用ETL工具从源数据库中将所需数据抽取至中心数据库基础业务库中,在利用元数据著录工具对抽取出来数据进行元数据著录。元数据著录依照《元数据标准》定义元数据项,提供著录界面,针对每一个著录项特点,提供文本框、列表框、复选框等录入形式。元数据内容录入元数据内容录入用于元数据内容录入处理,依照元数据库对各类信息元数据定义,帮助和引导录入人员建立符合要求信息资源元数据。元数据内容录入动态地完成编辑元数据所需处理,包含元素内容编辑组件动态生成、元素关系自动关联和元素值域检验等。其中编辑组件动态生成功效依照元数据标准定义元素数据类型和取值方式动态地确定界面编辑组件形式,使界面极具友好性;元素关系自动关联确保了元素之间约束关系能够被编辑器自动处理,降低了因为编辑人员对标准了解错误而产生元数据结构错误可能;元素值域检验可对用户输入数据有效性进行判断,以确保元数据信息内容正确性。标准逻辑分析元数据采集系统对描述元素处理不依赖于特定元数据标准,也就是说采集系统对元数据标准逻辑分析和处理是独立于标准本身。采集系统标准逻辑分析功效经过元数据标准XML描述取得元素之间制约关系、值域等处理逻辑。所以编辑器能够很好适应标准不停更新和升级。元数据完整性检验为确保元数据完整性,编辑器提供了元数据完整性检验功效。利用该功效,编辑器能够在输出文档之前对各个描述元素组织关系、元素内容完整性加以检验,发觉编辑过程中可能遗留问题,并提醒用户加以修正。经过完整性检验元数据将严格复合对应元数据内容标准所做要求。联机帮助处理用于完成系统联机帮助查询、显示操作。元数据审核元数据审核主要用于元数据报送到数据中心接收数据库但还没正式公布到公布数据库元数据。元数据有效性审核分为自动审核与手动审核两个部分,数据在接收报送系统报送数据时会开启自动审核系统对数据进行初步有效性审核,主要以过滤数据结构性错误为主,比如缺乏字段、类型错误、编码缺失或不可识别字符编码等。假如自动检验发觉错误,会将错误数据放入问题数据栏,方便数据管理员进行人工审核,假如人工审核认为数据没有问题,可强制确认有效,系统会自动提交勘误汇报给系统管员,作为自动审核功效改进依据,假如数据管理员也认为数据有误,能够将元数据退回给报送系统,由报送系统转交给报送部门从新报送。手工审核设计包含确认无误、退回重报、打印错误清单、直接更新元数据内容、打印元数据内容等功效,为了安全起见,更新元数据功效会统计详细操作审计日志。元数据公布假如接收数据库中元数据已经经过审核(手动或自动),元数据将自动进入待公布流程,能够从元数据管理平台待公布数据栏中看到全部等候公布数据,数据管理能够在此页面中看到全部等候公布数据,并作最终确认,系统在等到公布确认消息后会成批将全部报送上来原数据从接收数据库中转移到公布数据库中,完成正式公布过程,同时发送消息给报送单位,提醒公布成功。元数据公布审核设计包含确认公布、确认无效、打印公布清单、直接更新元数据内容、打印元数据内容等功效,为了安全起见,更新元数据功效会统计详细操作审计日志。元数据入库当元数据著录完成并经过语法检验后,可经过目录服务上传到元数据库中。元数据检验元数据检验是指检验员对操作员生成元数据进行正当性检验。主要检验信息资源元数据内容、格式符合标准规范要求,信息资源元数据内容必须符合《元数据规范》要求。形式化审核工作由工作系统自动完成。其它非形式化审核工作,比如资源分类是否准确、主题词提取是否准确等等,需要由检验员完成。未经过审核要求政务信息资源元数据需要操作员重新修订后提交。元数据入库元数据经过检验后上传到元数据库中存放。元数据维护元数据维护主要用于维护、查看已公布元数据,因为元数据公布需要经过严格审核流程,一旦审核经过,标准上元数据更改需要重新走元数据申报流程,包含已公布元数据实效申请和新元数据添加申请,而不允许对已公布元数据进行直接修改。但为了应急,特设置了此功效,但此功效只能开放给关键管理用户使用,为了安全起见,元数据维护功效全部操作都统计到操作审计日之中去。普通管理员只有查看、检索元数据权限。而管理员除了具备查看、检索元数据权限外,能够使用新增目录功效,将元数据字典中定义目录结构添加到现有目录中去,而且能够修改、更新、删除元数据。元数据维护设计包含依照元数据字典创建目录、打印现有目录结构、依照目录发觉、查找元数据、查看元数据内容等功效,关键管理层还能够查询、修改、删除、移动已经公布元数据内容。元数据查询系统提供基于元数据项查询功效,用户在输入需要查询信息后,系统自动搜索数据集元数据信息,返回相关查询结果。元数据浏览在数据集查询界面,系统以列表形式展现重点元数据信息内容,若用户需要查看元数据详细信息,能够点击查看元数据属性按钮,浏览详细元数据信息。注:图中数据为示例数据,仅为愈加好提供详细展现设计使用,不代表现实情况。元数据更新元数据更新采取两种模式,一个是基于单个数据集元数据信息修改模式。用户能够点击修改按钮对该数据集元数据信息进行修改,修改完成后提交审核。另一个模式是元数据库批量更新。元数据删除系统提供元数据删除功效。没有经过

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论