【大学】 信息资源组织基础_第1页
【大学】 信息资源组织基础_第2页
【大学】 信息资源组织基础_第3页
【大学】 信息资源组织基础_第4页
【大学】 信息资源组织基础_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一讲信息资源组织基础元数据与信息资源组织编辑ppt第一章引言编辑ppt生活中的信息组织你怎么组织你的——书籍或资料衣物或任何其他生活杂物电脑文件大脑中的信息编辑ppt你怎么组织——藏书按用途:兴趣爱好的(小说、旅游、烹调),学习类的,收藏类,工具书类…按载体:刊物、报纸、图书、画册…按学科或专题:(藏书家)……编辑ppt你怎么整理——CD/DVD按类型:古典、流行、爵士、蓝调...或故事片、文艺片、MTV、动画片、纪录片;按人物:贝多芬、柴可夫斯基…或布鲁斯威利斯、李连杰、007…综合方法……编辑ppt你怎么整理——衣物类型;季节;面料;喜欢程度;……上述综合编辑ppt你怎么整理——计算机文件?你头脑中的信息?编辑ppt总结分类方法是人类最本能认识世界的方法,因而也应用于任何资源的组织;按使用方便(多数是内容)分类而不是按物理顺序(或字顺等)排列;用于类分事物的性质叫做“属性”,试行分内部属性和外部属性;不作索引或简单的书本式索引;凭记忆查找,因而强调助记性。编辑ppt总结:信息资源组织常用方法分类法主题法字顺法号码法(赋予号码后的字顺法)时空法(例如大事记,年鉴等)序列法(大小/多少/好坏/贵贱…)超文本法(链接法)编辑ppt相关因素信息资源组织与下列因素有关:信息资源组织的对象是什么?信息资源组织的目的是什么?信息资源组织对象有什么显著特性?如何更方便的使用(达到目的)编辑ppt第二章

信息资源组织的基本问题编辑ppt基本问题什么是信息?什么是信息资源?什么是信息资源组织?信息资源组织的对象是什么?(数据、信息、知识、智慧及其他相关概念的关系是什么?)信息资源组织的目的是什么?信息资源组织的相关应用领域传统图书馆(博物馆/档案馆)的信息资源组织现代信息资源组织面临的问题与挑战编辑ppt数据:离散、互不关联的客观事实,孤立的文字、数据和符号,缺乏关联和目的性信息:人们对数据进行系统组织、整理和分析,使其产生相关性,但没有与特定用户行动相关联知识:与行动和决策密切相关,人们做决策的行动能力,知识创造与环境相关智慧:对事务发展的前瞻性看法,智慧得益于人的内在价值观和信仰什么是数据、信息、知识、智慧编辑ppt什么是数据、信息、知识、智慧Data:数据=没有加工的事实数据对应于人、物理对象、事件或其它实体的原始事实。单独的数据没有意义计算机中表示为数字或其它符号形式(不仅是数字形式。Number强调数字的内容,Digital强调数的形式)例如10000Information:信息=数据+语境将数据放到一个语境(context)中,从而给予它一定的含义,它就成为信息经过处理的有用的数据,用来回答Who/What/Where/When的问题信息是经人组织的数据组成例如¥10000Knowledge:知识=信息+判断是一种由人创造的,并且反映他们是如何来进行判断、选择并且采取行动的know-how,知识一般与人们所受的教育、经验、思考方法、决策及其他能力相关。信息被阅读、告知或可视与理解等等例如¥10000是上海外环线附近2005年房产的单价Wisdom:智慧=知识+整合对知识进行组合、创造以及理解知识要义的能力Wisdomisnotaproductofschoolingbutofthelifelongattempttoacquireit.(AlbertEinstein)例如”以¥10000的单价购买外环线的房子肯定亏本”文献Document:记录有知识的一切载体。信息资源的一种形式;编辑ppt其他有关信息的定义信息如同反馈——指机器利用其行为造成的结果作为自适应信息以调整自身,作为正在进行的过程的一个部分——维纳《控制论》1949年

Informationasfeedback--theabilityofamachinetousetheresultsofitsownperformanceasself-regulatinginformationandadjustitselfaspartofitsongoingprocess--NorbertWeiner,Cybernetics,1949信息是能够被编码而通过连接信源和信宿的通道进行传输的东西——申农1949年

Informationiswhatevercanbecodedfortransmissionthroughamechanicalchannelconnectingasourcewithareceiver--Shannon,1949“Informationiscommonlyusedtodenotesomepopulationofobjectstowhichsomesignificantprobabilityofbeingusefullyinformativeinthefuturehasbeenattributed.”--Buckland,1991.Unlike‘knowledge’or‘belief’

“theconceptofinformationhasconnotationsofneutrality--itishomogeneousandnoncontroversial.Thereality,ofcourse,ismorecomplicated”--Agre,1995信息是负熵(申农《信息论》)编辑ppt什么是知识?知识是能够指导思考、行为和交流的正确和真实的观察、经验和过程的总结。知识包含真理和信念,观点和概念,判断和预期,方法和诀窍等内容,也可以理解为用于解决问题的结构化信息。编辑pptWorldsofKnowledge

(fromPopper’sObjectiveKnowledge)World1isthephysicalworldWorld2issubjectiveknowledgeorexperience--mentalstatesandprocesses.World3isobjectiveknowledge--recordedknowledge,publicknowledge--createdbypeople.编辑pptKnowledgeHierarchy[Source:KarlSveiby,TacitKnowledgeinKMYearbook1999-2000]3LevelsExpertiseKnow-HowSkillsKnowledgeInformationData编辑ppt智慧wisdom知识knowledge情报Intelligent信息information数据data隐性知识显性知识分散孤立与行动相关前瞻性具有相关性对抗性数据、信息、知识、智慧之间的关系编辑ppt知识的类型事实知识(Know-what)原理知识(Know-why)技能知识(Know-how)人力知识(know-who)检索知识(know-where

)编辑ppt再举一例“8,000’和‘10,000-数据‘10,000米的高山’与‘8,000米的飞机飞行最大高度’是信息“飞机无法飞越这座高山”是知识‘必须飞得比地形高’是智慧编辑ppt什么是信息资源信息资源即“作为资源的信息”,可以理解为有价值的信息。然而信息的价值是体现在使用中的,对于不同的使用者,信息可以有不同的价值,而且信息的不同组合、不同的关联也能使信息具有不同的价值。这反映了信息的特性:信息是具有语境(context,也译成“上下文”)的数据。从计算机操作的角度来看,“信息资源是具有标识的任何东西”。其价值由用户去判断。信息资源组织的目的就是以灵活的方式揭示信息之间的关联(包括结构关联和语义关联),满足不同用户的需要,使其成为“资源”。世间万物,只要人能够识别出来的东西,给它一个标识(最常用的标识就是名称),它就成了“资源”作为元数据描述的对象,DCMI和W3C强调,其“资源”只是在互联网上,由命名域给出URI标识的实体。编辑ppt什么是信息资源组织?即信息资源的有序化的活动:对于信息资源有序化的规律的认识,以及应用认识得来的规律从事有序化工作知识组织=信息资源组织利用一定科学规则和方法,通过对信息外在特征和内容特征的描述和序化,实现无需信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用及信息的有效流通和组合。信息的外在特征:信息的(物质)载体所直接反应的特征;信息的内容特征:信息所包含和承载的具体内容,即通过信息载体所传递和交流的具体内容。编辑ppt信息资源组织的目的查找Find标识Identify选择Select获取Obtain编辑ppt信息资源组织体系根据对象区分信息组织的不同领域:哲学认识论以知识的抽象本质组织知识;图书情报机构传统上结合实物载体组织信息资源;数字图书馆以数字化的信息形式组织资源;情报检索系统可以看成是DL中的一个部分,通过数字化信息内容的各种结构组织资源,人为标注的结构;本身的结构被人发现而利用;企业知识管理围绕企业管理中信息的利用组织资源;搜索引擎的信息组织;语义万维网中的信息组织;其他各种领域知识根据领域的特点组织知识编辑ppt图书馆的信息资源组织图书馆学的目的宗旨:信息资源整序图书馆工作的组成(采分编典流)的目的主要方法:目录学(关于传统图书馆信息组织的科学)分类法主题法文摘与索引图书编目无数的经验编辑ppt图书馆如何组织/整理图书?由于数量和体积庞大,引入图书代用品:目录卡片;(书、卡的分离图书馆管理上的一大进步。博物馆、档案馆等任何涉及载体管理的机构莫不如此)泥版、羊皮卷、纸莎草、竹简乃至半导体零件、各类仓储物资,在计算机发明之前,卡片目录是最先进管理方式。其意义甚至不亚于结绳记事、文字发明、书籍产生……目录是馆藏的缩影和“代用品”;为了达到方便存取的目的,多套目录卡片提供多种查询途径;图书采取唯一方式排架,目录卡片指引到唯一的图书排架号;每种途径反映了图书的某一属性,例如先按载体类型或语种分,再按学科分类,或其他属性分,如著者目录;卡片目录/图书典藏的排列是分类与字顺等多种方式的结合;目录卡片的种类有限,不可能穷尽用户认识的角度和使用需求与习惯;图书是知识的载体,部分目录反映馆藏知识体系,图书馆通过管理知识载体,间接地整理知识。编辑ppt图书馆的信息资源组织(续)连续出版物有一点不同二次文献(情报)服务有很大不同电子资源使传统图书馆的信息组织方寸大乱编辑ppt信息资源组织面临的数字环境传统情报检索的挑战处理单元变为“情报载体”:期刊论文、科研报告、报纸文章、专利文献…;解决方案:文献数据库+原文提供;数字化浪潮的挑战处理单元复杂化,包含书本、期刊、论文、报告、以及“事实”、“数据”(传统的事实数据以工具书形式存在)并且需要整合利用需要研究信息/知识整个生命周期的完整过程,甚至包括部分认知过程需要从数据、信息层面上升到“知识”层面这个过程是正在进行时,随着技术的发展正在变化。编辑pptCollectionsgrid信息资源类型highlowlowhighStewardship权威性Uniqueness稀缺性BooksJournalsNewspapersGov.docsCD,DVDMapsScoresSpecial

collections

ArchivesRarebooksLocalhistorymaterialsArchives&ManuscriptsTheses&dissertationsFreely-accessiblewebresourcesResearchandlearningmaterials

ePrints/techreportsLearningobjectsCoursewareE-portfoliosResearchdataUntransferredrecordsFrom:LorcanDempsey编辑pptWeb上的信息Google当前索引80多亿网页,每天平均收到2000万个查询。中国的公开网页在3-4亿,百度每天大概收到500万个查询每篇网页的平均大小在12KB左右,于是总共约40TB容量(10年)人类的1亿种书,每本算10万字,200KB,总共约20TB容量。(5000年)编辑ppt搜索引擎搜索引擎(SearchEngines)是对互联网上的信息资源(主要是网页)进行搜集整理,然后提供查询服务的系统,通常包括信息搜集、信息整理和用户查询三部分,但提供给用户的往往只是一个查询界面。两类搜索服务GoogleYahoo编辑ppt网络信息资源的挑战数量巨大没有一个搜索引擎能够覆盖万维网的16%网站;所有搜索引擎加起来覆盖了万维网的42%极端异质信息值不同长度不同语法或输入错误内容错误、过时或不可靠多种格式多语种速度问题每分钟需要接受15,000~20,000次查询请求编辑ppt数字化信息量举例音乐作品(莫扎特):约100MB报纸(华尔街杂志):100MB/年(文本)卡片目录(美国国会图书馆):17GB广播(WABC):270GB/年(未经压缩)网络论坛(Netnews):300GB/年地区图书馆(加州大学图书馆):1.4TB(图书扫描版)Internet出版(WWW):1997年约4TB电视(CNN新闻):1GB/1小时,6TB/年(经压缩)录像带出租(BlockbusterVideo):9TB科研图书馆(美国会图书馆):全部图书馆数字化20TB

来源:美国伯克利加州大学教授PeterLyman和AlexInternet公司总裁BrewsterKahle所著《文化制品数字化存档行动纲要》。编辑ppt信息检索的问题查找非结构信息有困难多数数据库在结构化字段上工作多数商业信息是非结构化的.报告、电子邮件、来往公函...美国商业每年产生4500亿份文件波音747文件比飞机重量还重索引是主观的索引者之间不一致,经验统计表明索引者之间仅20%相同.作者与索引者之间、检索者与用户之间不一致.信息超载信息太多,需要过滤检索结果垃圾太多,有害信息太多编

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论