




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、美国数字图书馆发展现况以及元数据方面的问题,2004年12月 复旦大学,NSF Post Digital Library Futures Workshop 国家自然科学基金会(NSF) 后数字图书馆未来研讨班, 2003,6月 麻省,/%7Edlwkshop/JISC/NSFreport.pdf/%7Edlwkshop/JISC/NSFreport.pdf/,总结报告:,加拿大数字图书馆的未来开拓研讨班 2004年3月,温哥华,The Future of Digital Libraries in Canad
2、a Exploratory Workshop 探讨在数字化环境中和个人及团体跨学科合作中分享知识的模式 加拿大国内外最新发展和最高成绩 为加拿大以及其它大型项目(如美国国家科学数字图书馆)的合作播下种子 鉴定聚焦在国家研究项目上的兴趣的可能性, 并可能撰写这样一个研究课题表, 在此基础上准备一份提交给加拿大政府的优秀中心网络项目的课题申请报告 http:/www.ece.ubc.ca/leei/fdlc/index.php,网络信息建设方面的几大工程,数字图书馆工程 DLI-1 (1994-1998 数字图书馆第一期工程) 2400多万美元、六所大学及其工业合作伙伴, 面向技术、以试验为目的
3、DLI-2 (1999 - 数字图书馆第二期工程) 投资翻倍,面向用户、全方位发展、以实用为目的缩小技术研究注意力 国家科学教育数字图书馆 (NSDL) 电子政府工程 文本检索会议(TREC),DLI2的研究空间 (1),1. 以人为中心的研究 试图进一步了解数字图书馆在增强人类在创造、寻求、使用信息方面的活动中的影响和潜力,并促进为这些活动设计的技术的研究。 引导更广泛范围的信息发掘、查询、检索、操作、表达的能力的方法、算法、软件, 智能用户界面, 合作技术与工具, 用户和可使用性研究,包括人-机交互、以人为中介的交流、 有特殊需求的用户和机构, 在教育、学习、能力建设方面的使用,特别是新的
4、和生手很多的用户群体, 与经济和社会相关的问题。,2. 以内容和收藏为基础的研究 注重于更好理解并完善获取新的电子内容和收藏的途径,鼓励跨学科研究,鼓励所有学科领域的参与。 有效的数据捕获、呈现、保存、和存档, 元数据, 内容与收藏的相互合作能力, 特定领域的信息物体, 强调与生产和使用数字收藏有关的社会经济法律问题的技术、方法、过程, 对应与新电子媒体的新的经济与商务模型, 教育资料的发展及获取途径。,DLI2的研究空间 (2),3. 以系统为中心的研究 注重于技术的部件与整合,因为社会环境是千变万化的、灵活的。这方面的成果应能在个人、团体、机构等各种层次上起作用,能够将庞大的、不定型的、不
5、断增长的数据体改成用户定义的结构和规模。 适应与信息环境的开放式的网络化的结构,能支持复杂的信息途径和信息分析以及合作工作方式, 智能代理商软件, 可互相合作能力, 与数字图书馆有关的网络、通讯、中间软件研究, 高级多媒体信息捕获、呈现、数字化, 系统评价和表现研究。,DLI2的研究空间 (3),DLI-2项目涉及许多领域和学科,考古,生物学, 文学经典, 计算机科学,经济,英语,艺术,地理,地质学,政府, 电子工程,环境科学,历史,信息管理,信息科学,语言技术,图书馆情报学,语言学,管理信息系统,医学情报学,政治学,心理学,宗教研究,机器人,社会学,西班牙语,课堂教育等。,DLI-2项目涉及
6、的内容形式多样,书目记录,工程教育物件, 电子印刷物,民间文学,地理参考信息,健康数据,古典文学经典,图书馆咨询服务,医疗图像,混合媒体,病人材料,乐谱,骨骼,模拟,社会科学数据,演讲,录相,万维网,X-射线CT扫描数据等。,DLI-2项目涉及多种技术,三维模型,途径控制,代理人软件,存档/文件保存,视听检索,分类与聚类,数据途径服务技术,数字录相,经济模型,电子笔记,联邦结构,地理信息系统,图像,信息过滤,信息图示化,学习环境,联接,追踪数据分析,移动计算,多媒体融合,自然语言处理,光学图像识别,并行处理,协议,个人化,起源,手稿再使用,演说文件处理,自动总结,文本分析,录相编辑等。,技术t
7、echnologies,内容 contents,用户群体communities,服务services,十年进展状况,从数字图书馆研究空间看,技术和内容方面的发展十年中占主导地位。Image adopted from Gary Marchioninis presentation, 03/2004 UBC,技术technologies,内容 contents,用户群体communities,服务services,文化遗产 (如美国国家、州、县、区、市的 记忆 (memories) 数字图书馆和数字馆藏) 大中小学教育数字图书馆和大型投放库 (repository) 科技领域特殊数据的数字图书馆,从
8、存储到检索,可视化,用户操纵的多界面 使用记录和用户档案的自动生成和管理 产权保护的技术方法 大规模集成和转换等,面向教学 残疾人服务 合作空间等,高科技用户 政府部门 数字图书馆研究群体 教育群体,十年进展状况,美国数字图书馆主要项目,针对美国本土文化财富的项目 如美国国家、州、县、区、市的 记忆 (memories) 数字图书馆和数字馆藏 特殊媒体历史材料数字图书馆项目 针对教育的数字图书馆项目 大中小学教育数字图书馆 大型投放库 (repository) 围绕大学教学建立的服务设施和工具 科技领域特殊数据的数字图书馆,美国记忆 (国家数字图书馆历史馆藏)-100多个数字馆藏参与,联合目录
9、查找 American Memory /ammem/collections/finder.html,美国俄亥俄州历史数字馆藏 “俄亥俄记忆” Ohio Memory /,美国 俄亥俄州 沃兴屯市历史数字馆藏 Worthington Memory /,哈佛福大学法学院图书馆的纽伦堡庭审项目数字文献馆藏 The Nuremberg Trials collection ,Word Spott
10、ing: Indexing Handwritten Manuscripts /trath/prj/hw_retr/demo_intro.html (手稿检索数字图书馆项目),历史之声 Historical Voices /,面向教育的数字图书馆项目,独立的数字图书馆 例:Perseus 人文科学数字图书馆 硕士博士学位论文数字图书馆 综合了100多个项目成果的数字图书馆和元数据投放库 国家科学数字图书馆 (NSDL) 在已建数字图书馆基础上建成的数字化学习环境 加州大学圣芭芭拉分校 亚历山
11、大数字地球模型系统 (ADEPT)数字化的学习环境 (DLE),Perseus 人文科学数字图书馆 9million pages/month A Digital Library for the Humanities /,浏览经典,电子馆藏包括: 经典 古代写在纸莎草纸上的文稿 文艺复新 伦敦 加州 上中西部 莎士比亚 波义耳作品 Tufts历史,语言统计,地图,年代,同样数据,多种看的方法,多种探索开发的方向,经典文献的地域分布图,波义耳作品的时间分布图(1),硕士博士学位论文图书馆,从计算机科学开始,组建推广到其它学科和国家 学生学会出版
12、 自己的成果 上交时必须填写元数据记录 (现在很多学术会议录也要求这样) 作者和读者/用人者的更好接触 由用户团体参与、不断扩充资源的数字图书馆,成功的可持续模式,National SMETE Digital Library,Science Mathematics Engineering Education Technology,科学、数学、工程、技术教育,国家科学数字图书馆 NSDL,科学教育数字图书馆(NSDL)的研究空间,收藏 collections 服务设施 services 特殊问题研究 Targeted research 专业化的路径 Pathways 一体化核心 Core Int
13、egration 这是与各个国家(包括美国)DL项目不同之处,是综合的关键。,至2004年6月: 共165项目,建起的数字馆藏达 118,综合是当前的关键步骤,单个数字图书馆馆藏或技术服务可以做到小而全,不成问题,也不影响太大。 问题在于: 怎样把若干个分散的资源综合起来,有机的形成一个大的数字图书馆 怎样能让资源和数据(包括元数据)能被重复使用 怎样做到在综合起来的数字图书馆中原来的语义依然清楚,不失去意义,NSDL中侧重于建立数字化资源的相+ 侧重于服务机制和手段的项目,至2004年6月: 共165项目,建起的数字馆藏达 118,,NSDL 数字馆藏一览,http:
14、/,地理学科:,数学:,NSDL 一体化核心项目,NSDL信息结构,nsdl,查寻:,元数据记录:,将数字图书馆用于数字环境下的教学,实例: 加州大学圣芭芭拉分校 亚历山大数字地球模型系统 (ADEPT - Alexandria Digital Earth Prototype)) 数字化的学习环境 Digital Learning Environment (DLE),ADEPT 项目的数字馆藏:,1. 学习物件(LO)馆藏,2000多件,全部做了详细的元数据记录 (属于著名的亚历山大数字图书馆) 2. 科学概念知识库 (KB),现有1200余个概念,每个根据概念的特征和
15、关系理论模型作入知识库 3. 教学材料馆藏,根据每堂课要讲的概念准备的讲义,1. 学习物件馆藏 Collections of learning objects (LO), over 2000 items,2. 科学概念知识库 Knowledge bases (KB) containing collections of SSM of relevant scientific concepts; (about 1200 concepts),SSM for Scientific Concepts (1),SSM for Scientific Concepts (2),SSM for Scientifi
16、c Concepts (3),3. 教学材料馆藏 Collections of instructional materials organized by concepts,左边是本堂课的总的大纲 (结构) 右边是课程内容 ADL 本身的通用像标显示符将概念连接到概念属性显示窗。其它显示符连接到物件窗。,将这三种数字馆藏应用到学习环境中,所用和不断生产的馆藏 科学概念知识库(KBs) 结构化的教学材料馆藏 学习物件(LO)馆藏,做有详细的ADN元数据记录 +概念标引,为此建造的服务设施 概念 网上概念输入和编辑工具 图示和文字式显示工具 教学材料 网上讲义编制工具 “概念形象化”图示工具“Con
17、ceptualization” 学习物件 元数据输入工具,Introductory Physical Geography (F2002, S2003),数字化学习环境的课堂 (1),知识窗 Knowledge window :显示概念和相关关系,课程讲义窗Lecture window:讲义、实验、或自习材料的显示,学习物件窗 Collection window:显示数字图书馆的具体物件(图像、地图、文字、动画、录像等),数字化学习环境的课堂(2),知识窗Knowledge window,讲义窗 Lecture window,学习物件窗 Collection window,课堂讲义的模式,对科学
18、现象的辨识: 主要题目,分题目,子题目等 观察过程 实例 对科学现象的表达: 事实 概念 理论,对科学现象的理解: 提问 回答 问题 解决方法 假设 评价 陈述 衍生 预言 测试 看法,对科学现象的辨识表达理解,课程讲义窗 Lecture window,物件(馆藏)窗:学习物件 Collection Window: Learning Objects,知识窗 Knowledge window 根据概念来看所学内容,坐井观天:我看NSDL的经验教训,NSDL搜集元数据记录已有2.5年 网站从2002年12月起正式运行 是不是只是“又一个网站”? 用户在哪里? 会不会像VASA那样
19、翻船?17世纪瑞典船,建造8年,下水后很快就沉了 哪些问题? 技术、馆藏资源、新的服务设施都不成问题 元数据方面的问题 互操作方面的问题 可持续性问题,Evolution of the Men,元数据方面的问题,元数据 传统的图书馆编目,元数据标准太多,没有哪个能完全满足特定DL需要 投放库 (repository) 没有整套标准 各家自有一套,照搬的或有修改的 目前按简单的都柏林核心元素集来整合 失去很多细节 由于DC不反映所用schemes, 集中起来后的元数据失去上下文 已有些理论上很吸引人的模型,但难以在实践中应用推广(如METS, RDF),元数据方面的问题 (1),元数据方面的问题
20、 (2),元数据库是建立在自愿基础上的 不能强行推行任何标准 存在各种质量问题: 完整性、准确性、一致性问题 重复的数据 给用户查找带来麻烦 影响以后用户加注过程,/NSDLMetadataQuality/,缺乏各种控制词汇 (schemes) 和标准 如:描述时间的标准格式,描述语言、名称、事物、用户对象、物件类型等的统一的控制词汇 有的根本不采用标准 有的采用了自己的控制词汇 在合并后,由于没有办法知道采用的什么词汇,失去上下文,元数据方面的问题 (3),元数据方面的问题 (4),以什么为单位? 如:每个图片一条记录,还是2000个图片归为一组做
21、一条记录 (想想NASA卫星每天发回的成百上千的图像) 元数据的自动生成 减少人工投入,增加产量 现存的资源比DL人功能描述的多得多 能否在capture 时就能自动抓取的数据 自动生产的元数据的质量控制,元数据措施 (1)(讨论中),对元数据的管理单位从记录改变成元素 对每个元素增加来源和日期修饰项 重新合并元数据 不同来源的记录有不同的详尽程度,合并后可以生成内容更加丰富的记录,元数据措施 (2)(讨论中),为下一个浪潮-加注做好准备 在元数据后面加注: 正式的评论 非正式的个人经验等,马上制定一套控制词汇, 主要是以下方面: NSDL的重点顺序 难度 Educational level1
22、R E Audience3H Mediator3+M Pedagogy4H Resource type2M Interactivity level5M+,元数据措施 (3)(讨论中),元数据质量管理,单条数据 单个数字图书馆 联合数据库 合并后的原数据库,Completeness (完整性) Correctness (正确性) Consistency (一致性) Duplication (重复率),互操作方面的问题,互操作方面的问题(1),硬件/网络 软件 包括中间软件、JAVA、开放标准、应用程序界面,插件、个人化的用户界面 信息 元数据、元数据的对照表、综合、翻译等 打破语词、特征的局限,走向概念,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- it工作培训合同样本
- 2025(标准)承包清工劳务合同协议书范本
- 公司辞退劳动合同标准文本
- 入股合同样本 电子商务
- 供卵合同样本
- 3固定合同样本
- 2025年广州市民用租赁合同示范文本
- 媒体关系维护推广合同(2篇)
- 2025合同转让协议之关键事项
- 2024年调酒师调酒比赛技巧试题及答案
- 2025年土木工程业务能力试题及答案
- 城区建筑垃圾处理资源再利用设备采购 投标方案(技术方案)
- 2025年开封大学单招职业倾向性测试题库含答案
- 全国川教版信息技术八年级下册第二单元第2节《制作文创作品》教学设计设计
- DG-TG08-12-2024 普通中小学建设标准
- 实时数字孪生数据同步技术-深度研究
- Unit 4 History and traditions Project 说课稿 -2024-2025学年高中英语人教版(2019)必修第二册
- 《浅谈A企业消防安全管理中存在的问题及完善对策研究》6300字(论文)
- 秦汉考古Uooc课程答案
- 《电力建设工程施工安全管理导则》(NB∕T 10096-2018)
- 医疗器械考试题及答案
评论
0/150
提交评论