版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
信息资源的过程管理第一页,共一百零七页,2022年,8月28日信息资源的过程管理信息资源流用户信息需求分析信息源分析信息采集和转换信息组织信息检索信息资源开发信息资源传播和服务第二页,共一百零七页,2022年,8月28日5.1信息资源流信息资源流是有序运动的信息资源的集合。.具备源头、渠道和目的地三个要素源头是拥有生产信息资源能力的人或机器;实际生活中,源头多为那些善于发掘、创造和积累信息资源的人,如科学家、教师、作家、记者、律师、管理者、工程师、决策者等;目的地则是需要信息资源的人即用户。一般大众更多是充当信息资源流的目的地的角色。第三页,共一百零七页,2022年,8月28日流通渠道一般分为正式渠道和非正式渠道;非正式渠道指信息资源流的源头和自的地之间不存在作为“第三者”的控制者。正式渠道则指在源头和目的地之间存在独立的控制者的交流渠道。第四页,共一百零七页,2022年,8月28日信息资源交流信息资源交流是一种有目的的社会活动。其控制对象是信息资源流。类型如下:以有无反馈机制为标准,分为单向交流和双向交流;以时空特性为标准,可分为时间交流和空间交流两大类型。以交流的性质和范围为标准,可分为自我交流、人际交流、组织交流和大众交流四种类型。第五页,共一百零七页,2022年,8月28日信息资源管理过程第六页,共一百零七页,2022年,8月28日5.2用户信息需求分析5.2.1用户及其信息需求用户通常指接受信息服务的人类个体或群体。读者、听众、观众.、受者等皆为信息用户的子集。具有三方面的特征:①拥有信息需求;②具备利用信息的能力(包括观察能力、理解能力、概括能办、抽象能力、分析与综合能力、判断与推理能力等);③具有接受信息服务的行动。第七页,共一百零七页,2022年,8月28日信息需求是信息用户最为本质的特征。需求是由人的需要引起的要求,而需要则属于人的本能的范畴。人的需要一般地也表现为愿望、意向、兴趣、理想和信念等,这些需要形式都可以直接地转化为信息需求。第八页,共一百零七页,2022年,8月28日据马斯洛的研究,人的需要可归纳为五大类。第九页,共一百零七页,2022年,8月28日人的需要也可以在一定条件下转化为动机和行动。第十页,共一百零七页,2022年,8月28日5.2.2用户信息需求的决定因素个人特征反映用户生理的、社会的独特性和多样性,又可分为自然特征(决定用户信息需求的类型和范围)和社会特征(决定用户信息需求的性质与数量)。第十一页,共一百零七页,2022年,8月28日组织特征反映用户所从属的社会组织的数量及其性质。大致可分为职业组织(直接规定用户信息需求的主体结构),业余组织(主要以其活动和参加人员等影响用户的信息需求)和社区组织(以其地域环境和资源,人口结构、社区文化、社区活动和社区变迁等因素影响用户的信息需求)等类型。第十二页,共一百零七页,2022年,8月28日社会特征从宏观上反映用户所处的时代背景和社会环境。一方面决定着用户信息需求的内容、新颖程度、量与质和发展趋势等,另一方面还为用户信息需求转化为实际的信息行为提供了条件。第十三页,共一百零七页,2022年,8月28日用户信息需求的共同规律(1用户信息需求的全面性(2)用户信息需求的集中性(3)用户信息需求的叠加性(4)用户信息需求的阶段性(5)用户信息需求的马太效应第十四页,共一百零七页,2022年,8月28日5.3信息源分析信息源及其类型依据信息源的层次及其加工和集约程度,可分为四次信息源;一次信息源也称本体论信息源.二次信息源也称感知信息源.三次信息源也称再生信息源.四次信息源也称集约信息源.第十五页,共一百零七页,2022年,8月28日依据信息源的内容类别,可分为五类信息源;自然信息源。社会信息源。经济信息源。科技信息源。控制信息源。第十六页,共一百零七页,2022年,8月28日依据信息源的运动方式,可分为静态信息源和动态信息源。静态信息源包括文献信息源、实物信息源和集约信息源。动态信息源主要包括本体论信息源和感知信息源。第十七页,共一百零七页,2022年,8月28日5.3.2信息源的分布信息源分布是一种自然现象,信息资源布局则是一种主观行为。信息源分布是长期的信息运动的结果,其实质是一种不平衡分布。信息源的不平衡分布表现在地区、机构和人的差异上。第十八页,共一百零七页,2022年,8月28日5.3.3文献信息源分析1.图书的数量和来源据1995年《联合国统计年鉴》对120个国家图书出版情况的统计,全世界共生产图书91万多种。1997年美国出版图书8.5万~10万种,英国9.5万种,中国大陆10万种(初版新书有5万种),德国7~8万种,法国3万种,日本6万种,还有意大利、西班牙等国,各有2万~3万种。近年来上述数字变化不大。俄罗斯出书也很多,前苏联一年出书8万种。第十九页,共一百零七页,2022年,8月28日我国(这里仅指大陆地区)2003年有出版社570家(包括副牌社35家),共出版图书190391种,其中新版图书110812种,重版、重印图书79579种,总印数66.7亿册。与上年相比图书品种增长11.4%,新版图书品种增长10%,重版、重印图书品种增长13.2%,总印数下降2.9%。第二十页,共一百零七页,2022年,8月28日2.期刊的数量和来源由于期刊变化太快,所以,全世界的期刊有多少种?现在在版期刊有多少种?尚无人精确统计过。美国鲍克公司出版《乌利希国际期刊指南》》(Ulrich‘s
International
Periodicals
Directory,New
York::Bowker,1932-)是目前反映国际期刊出版动态及订购期刊的重要工具、其收集品种几乎囊括了世界上正在出版的全部重要西文期刊。考察几种权威的期刊工具书,目前在版期刊大约有15万种。自有期刊以来,全世界累计出版期刊在300万至500万种之间。第二十一页,共一百零七页,2022年,8月28日我国大陆地区2003年共出版期刊9074种,平均期印数19909万册,总印数29.47亿册。与上年相比种数增长0.5%,平均期印数下降2.44%,总印数下降0.14%。出版报纸2119种,平均期印数19072.42万份,总印数383.12亿份。与上年相比,种数下降0.84%,平均期印数增长1.88%,总印数增长4.16%。台湾地区出版的期刊有5000余种。香港定期出版的期刊有670多种,澳门有20种。第二十二页,共一百零七页,2022年,8月28日3.专利说明书的数量和来源世界上每年出版的专利说明书约为100-110万件。根据中国国家知识产权局的统计数据,2003年我国专利申请总量为30.9万件,授权量18.2万件,分别比上年增长了22%和38%。英国国家图书馆2004年累计专利说明书5348万件专利说明书,是世界上最大的专利库藏。截止2004年底,我国国家知识产权局专利局专利文献馆拥有29个国家3个国际组织的专利说明书,总量为4000多万件;还可提供88个国家及国际组织专利信息检索工具。第二十三页,共一百零七页,2022年,8月28日4.技术标准的数量和来源技术标准是一种增长比较缓慢的文献。目前,国际标准化组织(ISO)和国际电工委员会(IEC)颁布的现行有效的国际标准有16745项。约有100多个国家和地区设有全国性标准化组织。其中有90多个国家和地区制订了国家标准。据统计,截止1991年年底,世界上各类标准文献共计120多万件。在我国,据统计,到2001年底,已颁布国家标准19744项,专业(部)标准31900项,地方标准11660项,企业标准871项。国家标准40%采用国际标准和国外先进标准。第二十四页,共一百零七页,2022年,8月28日5.其他文献的数量和来源据《科技会议录索引》(IndextoScientific&TechnicalProceedings,简称ISTP)报道,全世界每年要召开上万个科技会议。它每年报道大约4000多个会议的会议录、收录会议论文约16万篇。《世界会议》(WorldMeetings,简称WM)是由美国WorldMeetingsInformationCenterInc.编辑,MacMilanPublishingCompany出版,专门报导未来两年内将要召开的国际学术会议信息。第二十五页,共一百零七页,2022年,8月28日研究报告的数量随着科技和经济的发展而迅速增长,1945~1950年间年全世界的产量在7500~100000件之间,20世纪70年代增至每年50万件,80年代每年略有增加。在我国,中国科学技术情报研究所是收藏国外学位论文较多的单位。北京图书馆收藏了1983年由美国友好书刊基金会赠送的美国1938-1977年博士论文的缩微胶卷。1986年,清华大学订购了美国部分著名大学,如麻省理工学院(1983年以来的)、加利福尼亚大学伯克利分校、斯坦福大学(1984年以来某些系的)博士论文的缩微平片。《中国学位论文通报》是我国自然科学类学位论文的权威性检索工具,1985年创刊。第二十六页,共一百零七页,2022年,8月28日5.4信息采集和转换信息的采集,就是信息的选择过程,是根据不断变化的用户信息需求从已确定的信息源体系中连续地选择、提取和搜求信息的过程。选择是信息采集的核心,也是信息资源管理成败得失的关键。信息选择的质量主要取决于信息采集人员的整体素质。5.4.1信息的选择和采集
第二十七页,共一百零七页,2022年,8月28日5.4.2信息采集方法1.文献型信息资源的采集购买交换接收申请复制网络搜索第二十八页,共一百零七页,2022年,8月28日2.实物型信息资源的采集采集人员通过参观或参加各种实物展览、定货会、展销会、交易会,或者现场参观考察和观摩同行实验室、试验站等方式实地考察实物,直接购买或索取实物样品。第二十九页,共一百零七页,2022年,8月28日3.鲜活型信息资源的采集交谈:通过与员工、同事、熟人等进行直接对话、交谈、讨论和辩论来获取信息。采访:选择特定对象,针对某些感兴趣的问题主动提问,获取信息。社会调查:指直接从社会中了解情况,采集信息和数据,收集到第一手资料。这是获得真实可靠信息的重要手段。此外,还可以通过参加各类报告会或演讲会、各类培训班、其他社交活动以及现场录音等方式收集各种鲜活信息。第三十页,共一百零七页,2022年,8月28日4.数据的采集主要的采集方式有观察、实验、检测、考察、调查、统计、检索、普查和科学研究等。例如,空间信息的采集通常GPS系统、激光三维扫描系统、空间信息合成与编辑系统以及其他实时采集系统来实现。第三十一页,共一百零七页,2022年,8月28日其他采集方法(1)全自动电话访谈(CATS):近年来出现的一种使用内置声音回答技术,取代了传统的调研方式和电话访谈。它利用专业调研员的录音来代替访问员逐字逐句地念出问题及答案。回答者可以将封闭式问题的答案通过电话上的拨号盘键入,开放式问题的答案则被逐一录在磁带上。第三十二页,共一百零七页,2022年,8月28日(2)交互式计算机辅助电话访谈(CATI):是中心控制电话访谈的“电脑化”形式,目前在美国十分流行。每一位访问员各坐在一台计算机终端或个人电脑前,当被访者电话被接通后,访问员通过一个或几个键启动机器开始提问,问题和多选题的答案便立刻出现在屏幕上。这一方法省略了数据的编辑及录入的步骤。第三十三页,共一百零七页,2022年,8月28日(3)电脑柜调研:一种类似于公用电话亭的电脑直接访谈调研方式。带触摸屏的计算机存放在可自由移动的柜子里,计算机可以设计程序以指导复杂的调研,并显示出全颜色的扫描图像(产品、商店外观等),还可以播放声音录音和电视影像。这种访谈方式的费用较低,而且被访者更可能给出诚实的答案。由于调研前已进行了程序化设计,故更容易控制。在美国、西欧、日本等市场调研技术发达的国家,电脑柜调研已经成功的用于贸易展示、会议,现在正在尝试用于零售环境,在那里会有更多的用途。第三十四页,共一百零七页,2022年,8月28日(4)网络调研系统:主要有E-mail问卷、交互式电脑辅助电话访谈(CATI)系统和网络调研系统等三种基本类型。E-mail问卷按照已知的E-mail地址发出,被访者回答完毕将问卷回复给调研机构,有专门的程序进行问卷准备、列制E-mail地址和收集数据。交互式计算机辅助电话访谈(CATI)系统前面已介绍过。网络调研系统运用专门的问卷链接及传输软件,问卷由简易的可视问卷编辑器产生,自动传送到互联网服务器上,通过网站使用者可以随时在屏幕上对回答数据进行整体统计或图表统计。费用比CATI系统低,小规模的样本调研(低于500名)的费用比E-mail调研高。第三十五页,共一百零七页,2022年,8月28日5.4.3信息的转换信息转换大体包括信息资源所有权或使用权的转换、信息资源符号的转换、信息资源记录方式的转换和信息资源载体的转换等多种形式。信息资源所有权或使用权的转换是信息转换的核心内容,其他形式的转换都是所有权或使用权转换的延续和补充。第三十六页,共一百零七页,2022年,8月28日5.5信息组织信息资源的序化也称信息组织.
从宏观上包括两个部分:信源组织是根据某种规律或结构对信息资源进行序化处理;信道组织则是为了有效利用存储空间和提高传递效率而对信息资源实施重组。第三十七页,共一百零七页,2022年,8月28日5.5.1信息组织原理信息组织是对事物运动状态和方式,或者说是对事物属性的组织。信息组织的过程就是依照事物属性之间的同一性、包容性、交叉性和扫诉性等关系对信息实施序化的过程。信息组织的理论基础:语言学、逻辑学、系统科学。信息组织是一个序化过程,这个过程通常可分为两个阶段,即序化阶段和优化阶段。所有的信息组织方法都可以归纳为语法信息组织(形式)、语义信息组织(内容)和语用信息组织三大类型以及它们的不同组合形式。第三十八页,共一百零七页,2022年,8月28日5.5.2信息组织的三个层次语法信息组织语义信息组织语用信息组织:第三十九页,共一百零七页,2022年,8月28日5.5.3信息的综合组织方法目录学文献分类学档案分类法则编辑工作第四十页,共一百零七页,2022年,8月28日5.6信息检索信息检索就是将信息按一定的方式组织和存贮起来,并根据用户的需要找出有关信息的过程。它是人类信息活动的一种过程。广义的信息检索包括存与取两个环节,但又不是简单、机械的存取。存是指一种面向来自各种渠道的大量信息而进行的高度组织化的存贮,即信息组织。而所谓取,就是面向随机出现的信息需求而进行的高度选择性的检索,且尤其强调快速便利地检出与需求有关的信息。第四十一页,共一百零七页,2022年,8月28日5.6.1信息检索原理从一般意义上讲,信息检索就是一种搜索过程,也是一种广泛的社会活动。例如:八数码游戏第四十二页,共一百零七页,2022年,8月28日从信息资源管理的角度讲,信息检索是从已存储的信息资源中检索出与用户提问相关的文献、知识、事实、数据的逻辑运算和技术操作过程的总和。包括文献检索、数据检索和事实检索。第四十三页,共一百零七页,2022年,8月28日1.文献检索文献检索以文献为对象,是用户提问(检索课题)与文献集合(检索工具或数据库)中的记录相关匹配和选择的过程。从本质上看,文献检索是一种相关性检索。它不同于数据库检索和事实检索,不直接解答用户提出的问题本身,只限于提供与之相关的文献资料供参考。根据加工深度不同,文献检索可分为题录(目录)检索、文摘检索、全文检索和语段检索。第四十四页,共一百零七页,2022年,8月28日文献检索的核心问题是实现文献特征与用户提问特征的匹配。一方面要弄清文献的组织编排方式,检索者要具有”解构”的能力;另一方面要善于分析用户的提问,善于将用户的信息需求转化为可检索的概念术语。这是一个双向分析和匹配的过程。第四十五页,共一百零七页,2022年,8月28日对于文献检索理论,相关性是一个重要的概念。第四十六页,共一百零七页,2022年,8月28日2.数据检索数据检索是将经过选择、整理和评价(鉴定)的数据存入某种载体中,并根据用户需要从某种数据集合中检索出能回答其问题的准确(确定)数据的过程或技术。广泛地应用于研究开发、科学计算、质量控制、管理决策、计算机辅助设计与制造等领域。从本质上看,数据检索是一种确定性的检索,它要直接提供用户所需要的确切的数据或事实,而且检索的结果也是确定的,要么输出能回答用户的具体问题的答案,要么检索结果为零。数据检索的对象为数值性数据、非数值性但可用数值表示的(可量化的)数据(如颜色、形状等)。它们或来自文献资料,或直接来自实验、观测和调查过程,是信息内容的高度浓缩物。第四十七页,共一百零七页,2022年,8月28日3.事实检索事实检索是对事实、数据或知识进行组织、存贮和处理,并针对用户的提问直接提供答案的过程和技术。是信息检索中最高级最复杂的一种类型。它不同于文献检索和数据检索,因为其目的不是泛泛的提供参考文献,或者只限于提供已有的数据或事实,而是要从已有的基本数据或事实中推断或演绎出新的数据或事实。事实检索既包括数值性数据的存贮、检索、算术运算、比较和数学推导,还包括非数值性数据(如事实、概念、思想、知识等)的存贮、检索、比较和逻辑推理,从已有的数据或事实中发现、推导、归纳或演绎出新的知识。第四十八页,共一百零七页,2022年,8月28日5.6.2信息检索方法和技术信息检索方法依据不同标准可划分为多种类型。对应于四次信息源,可分为事实(或数据)检索方法、人名或机构名称检索方法、文献检索方法和信息资源体系(如图书馆馆藏等)检索方法等。对应于信息组织方法,可分为字顺(如题名、著者等)检索方法、类号检索方法、主题检索方法、关键词检索方法和加权检索方法等。对应于检索的时间范围,可分为定期从新文献中检索适用信息的现状追踪调查(如定题服务)和系统地调查过去资料的回溯检索两大类型。对应于信息检索方法的操作主体,可分为利用文献检索工具查询文献的手工检索方法、使用卡片系统和缩微系统的机器检索方法和利用计算机硬件和软件的计算机检索方法三大类。后两类检索方法常被称为检索技术。第四十九页,共一百零七页,2022年,8月28日信息检索技术计算机信息检索人类在经历了漫长的手工检索时代和短暂的机器检索阶段后,终于在20世纪60年代迎来了计算机检索时代。计算机信息检索是由人和计算机共同作用下完成的信息存贮与检索的过程。它60年代进入生产性开发和实际应用时期,70年代开始向联机化和网络化发展。实现计算机检索的主要设施是计算机信息检索系统。信息检索系统有许多不同类型,如脱机检索系统、联机检索系统、光盘检索系统、计算机辅助微缩品检索系统、电视信息查询系统(图文电视)、多媒体检索系统等。第五十页,共一百零七页,2022年,8月28日计算机检索系统的物理构成有三部分:硬件(计算机及外围设备)、软件(系统软件和情报检索软件)和数据库(文献或数据集合)。硬件部分主要包括具有一定性能的主计算机、外围设备以及与数据处理和数据传输有关的其他设备。第五十一页,共一百零七页,2022年,8月28日软件部分包括系统软件和应用软件。系统软件一般包括操作系统、编译程序与汇编程序、诊断程序、输入输出控制程序、作业程序与记帐程序、报表生成程序等。应用软件通常包括数据库管理系统、建库程序、数据输入输出程序、自动标引程序、文档管理程序、词表管理程序、定题检索服务程序、回溯检索程序、记帐统计程序、通讯管理程序、总控程序等。第五十二页,共一百零七页,2022年,8月28日数据库部分包括各种数据库和文档。数据库是在计算机存储设备上按照一定方式存储的相互关联的数据集合。按照国际通用的数据库分类方法,计算机检索用的数据库通常有下列类型。(1)参考数据库(Referencedatabase)(2)源数据库(Sourcedatabase)(3)混合型数据库(Hybriddatabases)此外,还可以按照载体形式来区分,有磁媒体数据库(Databasesonmagneticmedia)、光盘数据库(Databaseonopticaldisc)、多媒体数据库(Multimediadatabase)。
第五十三页,共一百零七页,2022年,8月28日联机检索系统联机检索系统曾经是一种最便利、使用最广泛的计算机检索系统。它允许用户以联机会话方式直接访问系统及其数据库,不管它们位于何处。要实现这一点,往往又离不开一定的通讯设施和服务体制。进入通讯网中的联机检索系统,又称为联机检索网络。它是联机检索实现网络化的结果,集合了许多现代先进的信息技术。一个实用的联机检索网络至少由联机检索中心、通讯设施、检索终端等三部分组成。第五十四页,共一百零七页,2022年,8月28日1.联机检索中心它是联机检索网络的中枢部分,由中央计算机、联机数据库、数据库检索与管理软件以及相应的检索服务体制组成。中央计算机及外部设备包括中央处理机、中央存贮器、通讯部件、控制部件和连接外围设备的通道输入输出子系统。中央计算机的功能是在系统软件和检索软件的支持下完成情报信息的存贮、处理和检索等操作,对整个系统的运行进行管理和控制。另外,还需要配备一些必要的外部设备,如磁盘、磁带机、光盘机、高速打印机等。第五十五页,共一百零七页,2022年,8月28日2.通讯设施它是发展联机检索服务的基础。没有发达的通讯网,建设联机检索网络就无从谈起。联机检索网络的通讯设施一般包括通讯网、调制解调器、检索终端、自动呼叫器、通讯控制器及其他设备。3.检索软件建立一个实用的联机检索系统,不仅需要上面所介绍的各种硬件设备、数据库、通讯设施和服务体制,而且还需要有一套高性能的信息检索软件,才能使计算机系统有效地发挥作用。第五十六页,共一百零七页,2022年,8月28日联机检索方法1.用户需求分析用户的信息需求多种多样。用户需求的形成,受许多社会因素和个人因素的影响。第一种对最新的信息的需求,即要求及时获得,迅速传递。有这种需求的大多是一些探索未知的研究人员,以及那些从事管理决策工作的人员。第二种需求想了解某一理论、方法、设备、过程的片断性信息,以解决其研究中的具体问题。这种需求最常见,数量最大,要求检出的信息针对性强,能解决具体问题。第三种需求是想对某一课题进行系统详尽的了解,以便掌握问题的历史、发展及现状。从事编写教材和科技综述,评价科技成果以及专利申请新颖性审查等工作的人往往会提出这种需求。这种需求要求检索全面、系统、彻底。第四种需求是用户已经知道所需文献资料的名称或作者,或文献号等,而要求获得该文献的原件、复印件、最新版本或不同文字的译本以及等同专利说明书等。第五十七页,共一百零七页,2022年,8月28日联机检索方法2.检索策略制定弄清楚用户需求之后,就要设计一种策略去达到目标。检索策略就是为实现检索目标而制定的全盘计划和方案,是对整个检索过程的谋划和指导。选择什么检索系统和数据库,通过什么途径,选用什么检索词和逻辑组配方法以及需要哪些反馈操作等一系列问题的考虑与安排,都属于检索策略的范围。美国人鲍纳(Charles
Bourne)比较全面地总结出了五种供联机检索检索策略:最专指面优先策略、最低登录量的面优先策略、积木式检索策略、“引文珠形增长”型策略、“逐次分馏”型策略,值得参考和应用。
第五十八页,共一百零七页,2022年,8月28日联机检索方法3.联机检索的基本程序从与联机系统相连接开始,到与联机系统脱离结束,主要经由以下步骤:①同中心计算机接通,并与系统联机;②根据既定的检索策略选择待检索的数据库或文档;③输入并组配检索词;④打印检索结果;⑤退出系统,并脱离电信系统连接。第五十九页,共一百零七页,2022年,8月28日4.检索技术(1)布尔检索布尔检索(BooleanSearch)利用布尔逻辑算符进行检索词或代码的逻辑组配,是信息检索中最常用的一种方法。常用的逻辑算符有:“AND”(与);“OR”(或);“NOT”(非)。第六十页,共一百零七页,2022年,8月28日(2)截词检索截词检索(TruncationSearch)也是信息检索中常用的技术之一,它可以截取检索词的某一部分用于检索。因此特别适合于西文检索,可一次性地解决词干相同的词、英美拼法不同的词的检索。截词符多采用通配符“*”,可以用它代表多个字符。因此,截词检索有时也称为通配符检索。截词检索又有多种类型。按截断的位置分,有:前方一致检索、后方一致检索、通配符检索。按截断的字符数量分,有:有限截断、无限截断。第六十一页,共一百零七页,2022年,8月28日(3)限制检索限制检索(LimitationSearch)是将检索词限定在某一范围内进行检索的方法,以提高检索效率。常用在字段限制中,即利用前、后缀符进行的字段检索,将提问词限定在标题、著者、关键词等字段中出现,以提高命中记录的相关度。在检索系统中,数据库提供的可检字段通常分为主题字段和非主题字段。第六十二页,共一百零七页,2022年,8月28日(4)位置检索位置检索(Proximitysearching)根据检索词之间的位置关系来定义命中记录。它允许指定两词之间的词序和词距。词序指两词之间前后顺序,词距指两词之间间隔的单词数。常用的表示有(以DIALOG系统为例):(W)或()算符、(N)算符、(nW)或(nN)算符、(S)算符。第六十三页,共一百零七页,2022年,8月28日(5)加权检索加权检索(WeightedSearch),是按照权重来决定文献是否命中的一种方法,是一种定量检索技术。其侧重点不是判定检索词是否存在,而是判定检索词在满足检索逻辑后对文献命中与否的影响程度。加权检索的基本方法是:在每个提问词后面给定一个数值表示其重要程度,这个数值称为权重。检索时,先查找这些检索词在数据库记录中是否存在,然后将每篇命中文献中出现的检索词的权值相加。权值之和达到或超过预先给定的阈值,该记录即为命中记录。运用加权检索可以命中核心概念文献,故它是一种缩小检索范围提高检准率的有效方法。第六十四页,共一百零七页,2022年,8月28日(6)多媒体检索和超文本检索多媒体检索(MultimediaSearch)包括基于描述的多媒体检索和基于内容的多媒体检索。基于描述的多媒体检索就是用一个关键词来描述所要查找的图片或是音乐,比如可以用“classroom”这个词来查找教室的图片,也可以“spring”这个词查找相关音乐。基于内容的多媒体检索就是用一些特征来查找多媒体信息,这些特征包括颜色、形状、纹理等视觉特征,及音频、音高、音长等听觉特征。第六十五页,共一百零七页,2022年,8月28日超文本检索(HypertextSearch):超文本是一种信息的组织方式,它把不定长的基本信息单元存放在结点上,这些基本信息单元可以是单个字、句子、章节、文献,甚至是图象、音乐或录象,结点以链路方式链接。链路可以分为层次链、交叉引用链、索引链等,构成网状层次结构。超文本的特点是以联想式的、非线性的、链路的网状层次关系,允许用户在阅读过程中从其认为有意义的地方入口,直接快速地检索到所需要的目标信息。第六十六页,共一百零七页,2022年,8月28日5.6.3信息检索过程和策略第六十七页,共一百零七页,2022年,8月28日5.6.4信息检索效果及其评价信息检索效果是信息检索服务所反映的效率和结果,有技术效果和社会经济效果之分。信息检索效果是通过评价相关信息检索过程的各种指标来衡量的。据美国学者克莱弗登的研究,评价信息检索效果的指标主要有六个:收录范围、查全率、查准率、响应时间、用户负担和输出形式。第六十八页,共一百零七页,2022年,8月28日案例分析:中国知网CNKI
第六十九页,共一百零七页,2022年,8月28日5.7信息资源开发5.7.1信息资源开发论5.7.2信息产品结构论5.7.3信息产品开发策略论5.7.4信息产品开发的方法论第七十页,共一百零七页,2022年,8月28日信息资源开发论内涵:信息资源开发利用是指根据社会需要,对信息资源进行采集、处理、存储、传播、服务、交换、共享和应用的过程。一是从处延上发掘信息来源,开拓信息渠道,建立信息库存,加速信息流动;二是从内涵上不断重组和加工信息内容本身。信息资源开发是一种创造和生产新的信息产品的活动,是信息资源服务的一种高级形式。第七十一页,共一百零七页,2022年,8月28日信息资源开发本身可分为潜在信息资源开发和现实信息资源开发两大部分。教育和大众传播领域是开发潜在信息资源的两大主导部门。信息资源管理机构的主要任务之一是开发现实信息资源。特尔斐法、访谈法、问卷法和测试法等是开发潜在信息资源的主要研究方法。现实信息资源开发又可分为文献信息资源开发和网上信息资源开发两大部分。第七十二页,共一百零七页,2022年,8月28日信息资源开发的最终目的是形成信息产品。简单的线索型信息产品对应于语法信息层次的信息资源开发;复杂的知识型信息产品对应于语义信息层次的信息资源开发;实用的个别化的信息产品对应于语用信息层次的信息资源开发。第七十三页,共一百零七页,2022年,8月28日信息资源开发的实质是一种前导性的研究活动,不同于一般的学术研究。信息资源开发是一种市场导向型的研究活动。信息资源开发是一种高层次的信息服务,它既不是纯粹的学术研究活动,也不是纯粹的生产经营活动,而是两者的结合。信息资源开发是生产和形成信息产品的过程,信息咨询服务则是以这些信息产品为依据提供事实、数据、线索和文本等的过程。第七十四页,共一百零七页,2022年,8月28日5.7.2信息产品结构论信息产品或称信息商品,是以信息为对象,经过开发、加工、组织和转换而形成的,能满足用户信息需求的,可在市场中自由移动的信息媒体。依据信息产品生命周期的幅度,分保存型信息产品,短命型信息产品,即时型信息产品。这些产品类型大多数是信息资源生产阶段的产物,不妨称之为生产型信息产品。再生型信息产品是信息资源开发阶段的产品,是对生产型信息产品进行再开发的结果,是信息资源再生产的产物,具有浓缩性、间接性和适用性等特征。再生型信息产品大约可归纳为索引类、汇编类、综述类、述评类和预测类五大类型。第七十五页,共一百零七页,2022年,8月28日索引类信息产品包括各种目录、书目、文摘、题录、索引、新书通报、广播电视节目预报和网络服务器登录菜单等。主要开发者和提供者是图书馆、情报中心和各类新兴的网络公司。汇编类信息产品主要包括文集、图集、手册、年鉴、大事记、人物年谱、机构名录和“新闻集锦”等。主要开发者和提供者是出版社、杂志社.、报社和档案馆等。综述类信息产品主要包括各类综述、学科总结、专题总结、年度总结、年度进展和“一周新闻回顾”等。主要开发者和提供者是各类情报中心、信息中心和大众传播机构。述评类信息产品主要包括各类评述、评论和点评等。述评类信息产品的主要开发者和提供者依然是各类情报中心、信息中心和大众传播部门。预测类信息产品主要包括各类预测、展望和趋势分析等。情报中心、信息中心和广播电视部门等是预测类信息产品的主要开发者和提供者。第七十六页,共一百零七页,2022年,8月28日再生型信息产品的内在结构第七十七页,共一百零七页,2022年,8月28日5.7.3信息产品开发策略论选准目标市场是信息产品开发的首要间题。保证高智力投人是确保信息产品质量和档次的重要前提。紧跟技术进步是提高产品开发效率的重要举措。确立竞争优势是信息产品开发的制胜法宝。实现规模经营是提高信息产品开发效益的核心间题。创造名牌产品.是信息产品进人国际市场的基本策略。第七十八页,共一百零七页,2022年,8月28日信息产品开发的方法论信息产品开发的方法论主要是由信息分析、信息综合和信息预测三类方法组成的;信息分析是手段,信息综合是目的,信息预测是发展,综合起来形成三位一体的结构。见P247,P248.第七十九页,共一百零七页,2022年,8月28日信息资源开发的意义我国政府的信息化领导机构早已提出:信息资源开发利用是国家信息化的核心。为什么信息资源开发利用问题现在上升到如此重要的地位?信息资源开发利用的重要性体现在哪些方面?可以从几个不同方面来说明信息资源开发利用的重要意义。第八十页,共一百零七页,2022年,8月28日(1)现代资源观:信息成为主要的生产要素。(2)信息资源是促进经济变革和增长的强大动力。(3)信息资源开发利用能力是核心竞争力的重要体现。(4)信息资源开发利用是完善市场经济的重要手段。(5)信息资源开发利用是提高政府运作效率的需要。(6)信息资源开发利用是实现可持续发展的需要。第八十一页,共一百零七页,2022年,8月28日我国信息资源状况我国信息资源的优势:我国历史悠久,人口众多,地域广阔,物种丰富,经济活动总量大,这些都是产生信息资源的优势条件。其中最有价值和最具特色的信息资源有:中国文化资源(历史文化、民族文化、语言文化、宗教文化等);中文信息资源;中国的统计信息资源;中国的市场信息资源;生物(物种和基因)信息资源。第八十二页,共一百零七页,2022年,8月28日从资源本身看,我国信息资源的劣势在于,科技领域缺乏原创性和高水平的成果,经济领域缺乏国外经济信息资源(如国外市场行情、国外企业信息等),文化领域缺乏现代文化娱乐资源(如游戏、电影等),本国生产的有自主知识产权并适合我国需要的产品与实际需要相比相差太远。从开发利用的角度看,我们的劣势在于对信息资源开发利用的重要性长期认识不足,现有的信息资源共享性差,重复采购和重复加工处理现象严重,造成很多浪费。信息资源开发利用的方式单一,单纯的依靠政府的投入。对信息资源的知识产权、安全等问题认识存在误区。第八十三页,共一百零七页,2022年,8月28日我国信息资源开发利用的原则国家信息化领导机构最近提出我国信息资源开发利用应当遵循以下四个原则:(1)统筹协调。(2)需求导向。(3)创新开放(4)确保安全。
第八十四页,共一百零七页,2022年,8月28日国家科学技术部科技文献平台(以国家科技图书文献中心为核心)建设规划是我国科技系统信息资源开发利用的重大举措。该规划提出了若干条建设原则,既具有宏观指导性,又具有较强的操作性和系统自身的特色。首先,强调得最多的是增量盘活存量原则。它指要通过“共建共享”机制和“网络化”的先进技术手段,盘活被行政部门和已有系统长期分割的国家科技信息资源存量,扩大国家科技创新所需要的科技信息资源增量。后来又改为按照“调控增量,盘活存量”的原则,从国家科技文献信息资源建设的全局性、战略性、权威性出发,推进科技文献信息资源的整合与共享,构建国家科技文献信息资源保障体系。第八十五页,共一百零七页,2022年,8月28日其次是统筹规划、分布实施原则,指在资源建设上要通过统一规划、统筹协调,克服以往各自为政、重复订购的现象,提高经费的使用效益,使外文文献资源迅速增长。第三是多种能力协同发展原则,指文献资源采集能力、信息加工能力、信息服务能力、支撑平台正常运行的能力等要协同发展,不断拓展服务方式,深化服务内容。后来又总结为五个能力,即文献保障能力,快速反应能力,决策支持能力,集成服务能力,持续发展能力。第八十六页,共一百零七页,2022年,8月28日在组织管理方面提出要坚持联合、协作、开放、共享的原则,从组织规划、建设管理、技术机制和服务模式等多方面推动中心各单位的共建共享,避免重复浪费,促进良性发展。在运营机制方面提出要在强调公益性和社会化原则的同时,针对某些特殊文献和深层次的信息知识服务,在一定范围内实行市场化的运作机制。此外,还提出了“边建设、边服务、边发展”原则和加强可持续能力建设(资源、长期保障、研发、机制)的原则。第八十七页,共一百零七页,2022年,8月28日国外信息资源开发利用的战略美国政府提出9项原则,实际上可以视为克林顿政府的信息资源开发利用的战略指导思想。它包括:⑴通过税收和法规政策,促进民间企业投资;⑵扩展“全民服务”概念,保护所有美国人以负担得起的价格享用信息资源;⑶以“催化剂”的作用来促进技术创新的新的应用,责成重要的政府研究计划和拨款帮助民间企业开发和应用NII所需要的技术;⑷促进NII以完备、交互和用户驱动的方式进行;⑸保证信息安全和网络的可靠性;⑹改进无线电频谱的管理,它是日趋重要的资源;⑺保护知识产权。为防止非法伪冒和保护知识产权的完整性,政府将研究如何加强国内的版权法和国际知识产权条约;⑻协调各级政府和其他国家的行为;⑼提供利用政府信息的机会,并改善政府的采购活动。第八十八页,共一百零七页,2022年,8月28日加拿大政府非常重视信息资源的开发利用,认为信息资源是与人力资源和自然资源同样重要的资产,特别是将政府信息资产作为加拿大信息资产中最重要的组成部分。加拿大政府认为,政府信息是有益于全体公众的资产,高效的政府信息管理会提高政府服务的效率和透明度,促进政府机构之间的协作,有助于政府决策和保存具有历史价值的信息。为此,1989年颁布了关于政府信息资源管理的新政策,以取代以往有关档案管理、电子数据处理、缩微技术和政府信息采集等方面的政策,并影响到其他有关方面的政策,如图书馆管理、《信息获取法》、《个人隐私法》、减轻公众与小企业文书负担等方面的法律。第八十九页,共一百零七页,2022年,8月28日欧盟2000年开始推行“电子欧洲行动计划”(e-Europe
Action
Plan)。欧盟认为,电子内容是重要的经济资源,其有效的开发利用对欧共体内的经济增长,增加就业,提高企业竞争力和公民生活质量以及进一步强化一体化内部市场,都有着极其重要的意义。第九十页,共一百零七页,2022年,8月28日法国政府一直奉行信息自主独立的政策,重视数据库和信息网络建设以及信息的传播和利用,避免依赖别国的信息资源,同时注意保护本国的文化和国家主权。第九十一页,共一百零七页,2022年,8月28日德国联邦政府1994年8月公布了第三个信息发展计划《1990-1994年联邦政府专业信息计划》。该计划突出地强调了以下五项政策:①加强和改善电子信息系统,建设高质量的数据库;②改善技术信息环境和经济发展条件,提高德国产品的新技术含量和国际竞争力;③加强信息科学人才的培养;④加强信息领域的国际交流与合作;⑤增强信息政策和法律的指导和调节功能。1996年2月,德国政府内阁通过了《信息2000年》,其主要内容之一是为信息社会制订新的法律框架,使世界上最现代化的的德国通信设施充分发挥作用。后来,又颁布了《信息和通讯服务规范法》,其宗旨是为利用电子信息和通信服务的各种可能性规定统一的经济框架条件。第九十二页,共一百零七页,2022年,8月28日印度政府把数据库建设作为发展重点之一,鼓励本国有关机构与外国合作,加快数据库建设速度。印度的数据库发展战略是:集中支持重要信息机构建设数据库,优先建设使用频率高的信息源数据库(如期刊、专利联合目录);建设国外较缺乏的数据库和本国更需要的数据库(如金属数据库、纺织数据库);大力发展光盘数据库;鼓励私营机构参与数据库建设;加强与国外数据库产业的联系,与国外合作开发印度数据库市场,包括合作建库,引入国外数据库联机检索服务,使印度数据库走向国际市场等。第九十三页,共一百零七页,2022年,8月28日新加坡继“IT2000”之后,新加坡又于1994年提出“图书馆2000年”计划,要建立一个“无围墙的图书馆”,通过计算机网络把新加坡500个图书馆和信息中心与国外的图书馆和数据库连接起来,作为建设智能岛和促进社会信息化计划的组成部分。第九十四页,共一百零七页,2022年,8月28日考察这些国家的信息资源开发利用战略,有些经验是值得我们借鉴的。一是政府在信息资源开发利用方面目标明确,责任清楚;二是政府在信息资源开发利用中有所为有所不为。国家主要承担公益性信息资源的建设项目,包括支持面向基础研究,提高公众科学文化素养和道德水平、保护和弘扬民族文化的研究以及服务于政府内政外交决策等方面的信息资源建设项目,支持图书馆做好公益性信息服务。而对于非公益性信息产品和服务,则主要由市场来提供。如商业信息、娱乐性信息产品和服务,应由民间机构来主导投资和开发。政府不能也不可能包揽起来,它只能起政策引导和调控作用。另外,还必须认真考虑国家主权和民族文化保护问题,要警惕过分依赖外国的信息资源。第九十五页,共一百零七页,2022年,8月28日我国信息资源开发利用战略我国国家信息化领导机构最近提出的有关文件,体现了国家层面的信息资源开发利用战略。其中强调:坚持以邓小平理论和“三个代表”重要思想为指导,牢固树立和落实科学发展观,以体制创新和机制创新为动力,以政务信息资源开发利用为先导,充分发挥公益性信息服务的作用,提高信息资源产业的社会效益和经济效益,完善信息资源开发利用的保障环境,推动信息资源的优化配置,促进社会主义物质文明、政治文明和精神文明协调发展。第九十六页,共一百零七页,2022年,8月28日该文件指出信息资源开发利用工作的总体任务是:强化全社会的信息意识,培育市场,扩大需求,发展壮大信息资源产业;着力开发和有效利用生产、经营活动中的信息资源,推进政府信息公开和政务信息共享,增强公益性信息服务能力,拓宽服务范围;完善法律法规和标准化体系,推动我国信息资源总量增加、质量提高、结构优化,提升全社会信息资源开发利用水平,提高信息化建设的综合效益。具体任务分为三大方面:加强政务信息资源的开发利用,加强信息资源的公益性开发利用和服务,促进信息资源市场繁荣和产业发展。最后提出了若干条战略措施,即完善信息资源开发利用工作的保障环境。第九十七页,共一百零七页,2022年,8月28日在中国科学院文献情报系统中长期规划战略研讨会上,有关负责人提出“十一五”专项建设的总体框架是:在保持和维
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 航运合同类型
- 提前解除物业服务合同申请
- 《血栓的类型和形态》课件
- 2025年吉林市货运资格证考试口诀
- 2025年拉萨货运从业资格考试试题及答案解析大全
- 2025年兰州货运从业资格考试题目和答案解析
- 《氨基酸本科》课件
- 2025年徐州货运从业资格证模拟考试下载题
- 2025年长沙货运从业资格证考试答案
- 幼儿园教师演讲稿15篇
- 电气工程预算课程设计
- 新苏教版五年级科学上册活动手册答案
- 教官协作服务合同
- 2024-2025学年五年级科学上册第二单元《地球表面的变化》测试卷(教科版)
- 第八单元测试卷-2024-2025学年统编版语文三年级上册
- 第11讲 海水性质和海水运动(练习)(教师版) 2025年高考地理一轮复习讲练测(新教材新高考)
- 专题9.9 解析几何(2021-2023年)真题训练(解析版)
- GB/T 16439-2024交流伺服系统通用技术规范
- 2024年婴幼儿发展引导员(中级)职业技能鉴定考试题库(含答案)
- 《工程制图》期中测试
- 解一元一次方程(单元整体说课)课件-2024-2025学年人教版七年级数学上册
评论
0/150
提交评论