文物数字化技术及数字化文物系统初探——牛振东_第1页
文物数字化技术及数字化文物系统初探——牛振东_第2页
文物数字化技术及数字化文物系统初探——牛振东_第3页
文物数字化技术及数字化文物系统初探——牛振东_第4页
文物数字化技术及数字化文物系统初探——牛振东_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 文物数字化的背景、定义、意义文物数字化的背景、定义、意义2 文物数字化的关键技术文物数字化的关键技术 3 文物数字化应用系统组成文物数字化应用系统组成4 文物数字化应用系统的关键技术文物数字化应用系统的关键技术5 文物数字化应用项目文物数字化应用项目6 讨论讨论北京理工大学软件学院数字图书馆实验室 1.1 文物数字化的定义定义 1.2 文物数字化的背景及意义北京理工大学软件学院数字图书馆实验室 利用最新的数字技术如数字化扫描、摄影、数字化编辑、三维动画、虚拟现实以及网络等再现、保存、传播文物,对文物进行数字化加工处理; 涉及多学科的技术北京理工大学软件学院数字图书馆实验室计算机网络、通信、

2、计算机等技术的计算机网络、通信、计算机等技术的发展提供了发展基础发展提供了发展基础是文物保护、保存、文化传播的需要是文物保护、保存、文化传播的需要 * 文物的唯一性、不可共享和不可再生性相比;文物的唯一性、不可共享和不可再生性相比; * 数字化的文物信息是无限的、可共享的、可再生的数字化的文物信息是无限的、可共享的、可再生的 是是NII建设的重要组成部分,急需大规建设的重要组成部分,急需大规模有严密组织的信息资源库模有严密组织的信息资源库北京理工大学软件学院数字图书馆实验室360 Million用户用户 综综 合合数字图书馆数字图书馆Tiny(小型)(小型)Moderate (中型)中型)Im

3、mense (巨型)巨型)Content Scale(内容规模)(内容规模)Distribution(地域范围)地域范围)Wide Area(广域广域)Regional(区域)区域)(本地)(本地)LocalHours/Days(数时(数时/数天)数天)Months/Years(数月(数月/数年)数年)Decades/Centuries(数世纪)数世纪)/ (数十年(数十年)GeneralDigitalLibraryGlobalDesignDecisionNetworkLocalDesignDecisionNetwork应急管理应急管理知识网络知识网络 全全 球球决策网络决策网络 本本 地地决

4、策网络决策网络Lifetime(生命周期)(生命周期)美国美国NFS(国家科学基金会)关于知识联网的白皮书附图(国家科学基金会)关于知识联网的白皮书附图.图像拍摄技术、扫描技术2.2 虚拟现实2. 数字对象表示2. 数字化加工编辑处理技术 北京理工大学软件学院数字图书馆实验室 选择感光材料的传统相机为主,或数码相机 图像信息的数字化非数字化的图像经过光学信号转变成数字信号再存入计算机;分辩率和色深度是图像信息化的两个主要技术指标 提高图像的分辩率和突出主题是文物的要点 扫描仪 虚拟现实技术是20世纪末发展起来的一门涉及众多学科的高新技术,从本质上说是一种先进的计算机用户接口技术,给用户提供视觉

5、,听觉,触觉,嗅觉,味觉等各种直观而又自然的实时感知交互手段。 Virtual Reality Markup Language 1994年3月在日内瓦召开的第一届WWW大会上,首次正式提出了VRML这个名字。 1994年10月在芝加哥召开的第二届WWW大会上公布了规范的VRML1.0草案。 1996年8月在新奥尔良召开的优秀3D图形技术会议-Siggraph96上公布通过了规范的VRML2.0第一版。它在 VRML1.0的基础上进行了很大的补充和完善。 1997年12月VRML作为国际标准正式发布, 1998年1月正式获得国际标准化组织ISO批准简称VRML97。VRML97只是在VRML2.

6、0基础进行上进行了少量的修正。 1998年。VRML组织把自己改名为Web3D组织,同时制订了一个新的标准,Extensible 3D (X3D),到了2000年春天,Web3D组织完成了VRML到X3D的转换。X3D整合正在发展的XML、JAVA、流技术等先进技术,包括了更强 大、更高效的3D计算能力、渲染质量和传输速度。 VRML文件描述的基于时间的三维空间称为虚拟境界(Virtual World),它由对象构成,而对象及其属性用节点描述,节点是VRML的基本单元。每个节点由类型、域、事件、实现、名字组成,节点按一定规则构成场景图(Scenegraph)。 存在感。 多感知性。 交互性。

7、动态显示。 立体感的视觉与听觉效果。 脚本功能。数字信息管理的基本术语:1 数字对象:数字信息库中表示信息的基本逻辑单位。如文章,图片,一部音乐作品。2 元数据:描述对象实体的信息。元数据中可包含数字对象的唯一句柄。数字对象头数字对象体A1A2A3An元数据句柄 数字资源加工主要涉及元数据标准的制定与资源的元数据加工、工业化的OCR技术、自动标引、自动文摘、知识概念体系、网上资源的获取与处理、数据压缩、数字版权的管理等。 北京理工大学软件学院数字图书馆实验室 建立元数据标准和规范:建立元数据标准和规范:提高数字资源的可访问性和可检索性;为搜索结果提供更加有效的关联度排序;作为某些资源的替代品,

8、如需要花费大量时间下载或浏览的大型文件,需要进行解释才能理解的原始数据,甚至某些无法以电子方式获得的资源;有助于解决知识产权的辨认、跟踪和管理问题。 工业化的工业化的OCR技术:技术:为完成大批量的数字化工作,需要可靠的不依靠人工校对的图像处理和OCR技术,该技术要支持汉字大字符集下的工业化扫描和识别,其识别精确度要在99.99%以上。 自动标引、自动文摘生成、自动篇名生成自动标引、自动文摘生成、自动篇名生成技术:技术:以现有的主题和分类词表为基础,具有自学习的能力,学习成熟人员的经验,为标引人员自动生成或辅助生成主题和分类,并对人工标引进行必要的校对。同时,要求具有智能化的自动文摘生成技术及

9、自动篇名生成技术来大批量地生成文摘数据和篇名数据。 知识概念体系:知识概念体系:建立基于人工智能知识表达的知识概念体系,提供智能化的信息服务。 Web挖掘技术:挖掘技术:Web内容的挖掘是对Web中包含的文本、图像、视频等数据元素进行挖掘;Web结构的挖掘是从Web的链结构中发现知识;Web使用的挖掘是追随用户对Web页的交互和操纵,从中挖掘出有价值的用户存取模式。 北京理工大学软件学院数字图书馆实验室 多媒体挖掘技术:多媒体挖掘技术:基于多媒体的内容特性以及这些特性相关的语义,从大型多媒体数据集(不仅仅是多媒体数据库)中发现和分析出隐含的、有效的、有价值的、可理解的模式,使多媒体的处理和管理

10、从信息存取上升到知识获取层次,使多媒体内容的利用达到新的高度。 北京理工大学软件学院数字图书馆实验室 压缩、解压缩技术:压缩、解压缩技术:在数字资源的建设与使用的过程中,资源的加工必须是一次性的,而经过加工的资源应适应多种不同的用途。 数字版权管理技术:数字版权管理技术:通过对数字资源进行处理,有效地管理所有数字资源内容的知识产权,其中包括文字、图像、音频、视频等各种形式的数字对象。综合运用各种加密手段保证数字对象在网络传输过程中的安全,并建立网上授权认证机制,防止传播中的数字资源被非法使用,同时与精确的计费功能结合,提供安全可靠的信息交易平台。 数字版权管理技术:数字版权管理技术:通过对数字

11、资源进行处理,有效地管理所有数字资源内容的知识产权,其中包括文字、图像、音频、视频等各种形式的数字对象。综合运用各种加密手段保证数字对象在网络传输过程中的安全,并建立网上授权认证机制,防止传播中的数字资源被非法使用,同时与精确的计费功能结合,提供安全可靠的信息交易平台。 3.1文物数字化应用系统文物数字化应用系统定义3.2数字资源管理系统模型3.3文物数字化应用系统体系结文物数字化应用系统体系结构构 根据需求不同,文物数字化应用系统定义多根据需求不同,文物数字化应用系统定义多样样 本报告讨论的是一种具有开放式体系结构的、本报告讨论的是一种具有开放式体系结构的、有组织管理的网络数字文物藏品系统及

12、信息有组织管理的网络数字文物藏品系统及信息服务系统;服务系统; 它支持大范围、分布式的数字化文物的信息它支持大范围、分布式的数字化文物的信息服务,用户可在网络上横跨异构的支持知识服务,用户可在网络上横跨异构的支持知识关联的文物资源库,高效访问以多种数字格关联的文物资源库,高效访问以多种数字格式存储在其中的多媒体知识信息。式存储在其中的多媒体知识信息。 支持基于局域、互连网的服务支持基于局域、互连网的服务 与其它应用系统或资源库的关连与其它应用系统或资源库的关连元数据服务器对象数据服务器内容管理WEB PORTAL用户权限认证收费管理Web客户端管理工具存储管理北京理工大学软件学院数字图书馆实验

13、室存储与调度库数字资源管理体系用户信息服务体系数字资源建设体系存储与调度库数字资源管理体系用户信息服务体系数字资源建设体系资源创建互连网资源元数据结构定义用户管理数据加工加工资源库用户管理数据加工加工资源库调度注册数据装入数据输入输出XML文件调度注册数据装入数据输入输出XML文件调度库发布资源库调度库发布资源库抓取整理加工文献数字化资源原有资源库标引整合构成子系统用户界面数字化资源加工系统数字信息的存储管理资源调度系统信息访问和查询安全认证版权保护 用户界面1 为用户服务的界面浏览器:与用户交互作用客户服务:浏览器与系统其它部份的中介服务。2 为系统管理员提供的界面。q 数字化资源加工系统1

14、、对文本、图像、音频和视频等信息的数字化采集,加工,处理。2、实现信息资源的一次加工,多次使用。3、信息的表示格式与对系统升级的影响如一幅图像的表示:高分辨率;中分辨;低分辨;元数据q 数字化资源加工系统4、数字化标准 XML/SGMLSGML:标准通用标识语言XML:可括充的标识语言XML工具软件:编译,转换,编辑等5、从MARC到DC的辅助转换数字信息的存储管理实现对所有数据的存储管理,包括标准化的元数据和数字对象的存储格式、存储协议、元数据和对象数据的一致性、分布环境下数据的查询 数字信息的存储管理 LAN/WAN/INTERNET图书馆服务器对象服务器客户 数字信息的存储管理异地存储技

15、术更新 资源调度系统1、建立统一的资源命名规则2、建立调度机制3、为资源加工和用户服务提供调度服务功能信息查询系统 查询界面匹配系统/搜索引擎信息库信息库信息库信息查询系统1、统一检索功能:采取单一界面实现数据的统一检索。2、检索结果的显示过滤功能;信息选择,复杂检索功能;对多数据库的检索功能(结果合并等)3、影像数据的检索 对影像数据进行详细检索的功能。 信息查询系统4、人工标引,自动标引,半自动标引,标引转换生成5、多语言处理系统6、自然语言处理,基于语义的检索分类安全认证1、用户身份认证2、访问权限认证版权保护软件系统实现基于分布式环境下垮单位垮库环境下的版权保护和电子商务系统。登记;认

16、证;记费;结算分布式有偿服务的记费模型4.1 数字资源加工编辑相关技术数字资源加工编辑相关技术4.2 应用平台和资源管理应用平台和资源管理4.3 用户服务相关技术用户服务相关技术4.4 应该遵循的相关标准规范应该遵循的相关标准规范见提供对数字资源的管理和开发利用,是为用户提供各种信息与知识服务的后台系统。 检索技术:检索技术:包括纯文本的全文检索、概念检索、图像检索、视频检索、音频检索技术等。 智能型全文检索技术。智能型全文检索技术。主要解决跨地区、跨数据库的信息资源检索问题。检索软件应该能够根据用户的信息需求,帮助用户分析和制定检索策略,并能智能化地在不同地点、不同数据库中进行搜索,将用户所

17、需信息准确地检索显示出来。 命名系统:命名系统:系统中的资源需要具备一个长期的、全球唯一的、独立于地址的标识名,以便于用户对资源的检索。 资源调度技术:资源调度技术:主要负责从唯一的资源名到资源的网络地址的解析过程。 多媒体处理技术:多媒体处理技术:适于网络传输、多媒体的检索。 系统的互操作技术:系统的互操作技术:通过元数据的互操作,促进资源的共享;通过中间件、Agent以及Web Services解决分布式异构系统之间的互操作。 数字化信息资源管理技术:数字化信息资源管理技术:主要解决信息资源数字化后海量信息的存储和管理问题,一方面要保证海量信息存储有序,另一方面还要保证不影响信息的读取速度

18、和效果。 l 水印技术与密钥技术:水印技术与密钥技术:通过这种技术将对数字资源进行有效的知识产权保护。主要涉及人机交互方面的技术,为用户提供简单、便捷、灵活的友好界面。 多语言技术:多语言技术:要保证系统支持多语言技术,同时为满足更大范围的用户的需求,系统要通过机器翻译、多语言浏览等功能为用户提供跨语言的支持。 个性化定制服务技术:个性化定制服务技术:根据不同用户的不同需求,向他们提供个性化界面,以便高效、准确的知识服务。 北京理工大学软件学院数字图书馆实验室 ISO 10646 信息技术通用多个8比特编码字符集使用场所:底层数据编码标准,采用Unicode 4.0标准 ISO 14721 /

19、 OAIS 空间数据和信息传送系统开放档案信息系统参考模型使用场所:数字资源组织、管理、预发布参考模型 ISO 15836 信息和文档都柏林核心元数据元素集 Open Archives Initiative 用于元数据收获的开放档案主动协议使用场所:不同系统元数据收获处理北京理工大学软件学院数字图书馆实验室Z39.87数据字典对于数字静止图象的技术元数据使用场所:数字图书馆系统中,数字静止图象加工技术元数据参考Z39.88对于关系敏感服务的开放唯一资源定位的框架GB2312 / GB18030 国家中文信息编码标准使用场所:系统中,表现层信息编码中图分类法:中图分类法:中国国家图书馆分类方法使

20、用场所:数据分类规范,数据检索开关控制,参加关联检索北京理工大学软件学院数字图书馆实验室 Adobe PDF使用场所:电子文档表现格式,插件需要嵌入在标准浏览器中 中文图书主题规范数据中文图书主题规范数据 / 中文图书名称规范数据中文图书名称规范数据 / 题名规范题名规范 / 著者规范著者规范 / 地名规范地名规范 /团体单位名称规范数据:团体单位名称规范数据:知识库体系规范数据 其他主流流媒体格式:其他主流流媒体格式:主流的asf、mpeg、wav、mp3、rm等格式使用场所:系统中,用于流媒体数据对象格式或者流媒体转换格式,流媒体表现格式,插件需要嵌入在标准浏览器中 应该遵守W3C、ISO、GB相应的标准和规范; 应该参考相关的计算机、网络、安全、信息、软件设计等的标准规范。 北京理工大学软件学院数字图书馆实验室 美国:美国: 英国英国 法国法国 其他国

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论