信息检索基础演示文稿_第1页
信息检索基础演示文稿_第2页
信息检索基础演示文稿_第3页
信息检索基础演示文稿_第4页
信息检索基础演示文稿_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息检索基础演示文稿2009-2信息检索-第1单元1当前1页,总共62页。2009-2信息检索-第1单元2优选信息检索基础当前2页,总共62页。本学期授课计划安排课程学时14课时(2009年9~10月)。第一至第七周,每周2课时,讲课与实验/考查交替安排。学习成绩评定:考勤、课堂纪律15%;平时实验45%;综合考查40%。参考教材:周理盛.信息资源检索实务.北京:化学工业出版社,2007当前3页,总共62页。目次第一单元信息检索基础与网络信息检索第二单元如何查询图书、期刊和工具书第三单元其他数据库查询第四单元综合检索和竞争情报当前4页,总共62页。第一单元:信息检索基础与网络信息检索

1.1信息检索基础实验一1.2网络信息检索实验二

当前5页,总共62页。1.1信息检索基础1.1.1信息素养1.1.2相关概念1.1.3信息检索基本知识1.1.4关于信息图文中心当前6页,总共62页。信息挑战每个人都面临三种挑战:一是无限的文献量对有限的阅读时间的挑战二是急涌而至的文献对人们接受能力的挑战三是大量新知识的出现对人们理解能力的挑战要迎接挑战就必须学会和掌握文献检索的技能,实现在短时间内查找所需文献,并对知识信息进行筛选和浓缩,提高对知识信息吸收能力。当前7页,总共62页。1.1.1信息素养是什么?信息素养信息思考力信息技能信息意识力信息道德INFORMATIONLITERACY当前8页,总共62页。信息素养是什么?信息意识力——对新信息的敏锐,时刻追求新知识的热情。信息思考力——对获得信息进行辨识,选择;创新知识的能力。信息技能——获取、处理信息的能力,包括检索、组织和使用的能力。信息道德——继承已有研究成果,尊重知识产权,不抄袭剽窃。当前9页,总共62页。信息化生存策略信息化生存包括数字化生存、网络化生存和智能化生存。数字化、网络化构成了人们生存的信息环境智能化是有效发挥知识信息的功能、解决问题、克服危机和创造财富的最佳方案培养良好的信息意识注重提高信息检索能力WhatYouGetisWhatYouWant!当前10页,总共62页。信息意识信息意识包括:信息价值意识——创新意识;未来意识;时效意识。是否善于运用创造性思维,从大量信息中捕捉新动向,猎取趋势性的或有价值的信息。信息获取和传播意识——信息资源价值体现于传递和流通过程。信息道德、法治意识——不寻求、散布不良信息。

信息保密、安全意识和信息经济、环保意识。当前11页,总共62页。信息素养标准

1998年,全美图书馆协会和美国教育传播与技术协会专门制定了评价学生信息素质的九大标准:一、具有信息素质的学生(信息素质):

1、有能力有效地确定信息;

2、有能力批判性地评价信息;

3、能准确和创造性地利用信息;二、有独立学习能力的学生具有信息素质(独立学习):

1、能寻求与个人兴趣有关的信息;

2、能鉴别文献和对其它信息的创造性表达;

3、在信息查找和知识生产方面占有优势;三、对学习化社区和社会积极尽力的学生具有信息素质(社会责任):

1、并能认识到信息对一个民主社会的重要性;

2、并能实践关于信息与信息技术的伦理行为;

3、并在集体中积极参与跟踪和生产信息。当前12页,总共62页。信息环境与信息素养信息获取方式的环境在变化

各类资源在不断的整合…信息泛滥、信息污染、信息轰炸造成信息恐惧、信息焦虑(心理影响)和信息鸿沟(社会不平衡)。以最快的速度获取最新研究信息

在正确的地方使用正确的工具和正确的方法寻找正确的内容

当前13页,总共62页。1.1.2相关概念

信息的定义信息(information)自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。信息具有客观性、时效性、传载性、共享性、转换性、能动性和价值性。

当前14页,总共62页。

知识、情报、文献和数据的定义

1)知识(Knowledge)

人类在改造世界的过程中所获得的认识和经验的总和。2)情报(intelligence/information)

为一定目的,具有一定时效,运用一定形式传递给特定对象并产生效用的知识。3)文献(document)

记录有知识的一切载体。4)数据(data)

信息的记录形式和原材料。当前15页,总共62页。信息、知识、情报、文献和数据之间的关系

1)包含关系数据涵盖最广;信息包含知识,知识包含情报。2)转化关系文献是记录有知识的载体,当文献中记录的知识传递给用户,并为用户所利用时,就转化为情报。3)交叉关系情报虽大多来自文献,但也可能来自口头和实物,所以情报与文献存在交叉关系。

信息圈知识圈情报圈文献圈当前16页,总共62页。信息、知识、情报和文献之间的关系

信息采集---是信息的选择过程,根据不断变化的用户需求从已确定的信息源体系中选择、提取和

搜求的过程

4)逻辑关系:事实信息

知识

情报

产生人脑加工传递利用传递利用记录文献当前17页,总共62页。信息资源的含义

信息资源是指信息和信息载体。从广义范围来讲信息资源还包括信息资源开发、运用所需的,包括传递、加工和配置这些信息的信息技术,以及参与信息资源开发、运用和管理的人。当前18页,总共62页。

信息资源的类型1)按加工程度划分:零次文献---指未以公开的形式进入社会流通,只供一定范围内使用的文献,如手稿、私人笔记、会议记录、试验数据、内部档案、设计草稿、信件、企业活动中直接产生和记录的原始单据和凭证等。一次文献---作者以本人的研究成果为基本素材而发表的著作、演讲、谈话等,或其集合体。习惯称之为原始文献。二次文献---人们对一次文献进行加工、提炼或压缩之后得到的产物。是人们为了便于管理利用一次文献而编制和累计起来的工具性文献,如书目、题录、文摘等。三次文献---是对有关领域的一次文献和二次文献进行广泛深入的分析综合后得到的产物,如各种综述、述评、学科总结、百科全书、年鉴、手册、文献指南等。当前19页,总共62页。信息资源的类型2)按载体形式区分:1.印刷型主要指以纸张为载体,通过印刷手段把负载知识的文字固化在纸上。2.缩微型以感光材料为载体,以光学缩微技术为记录手段。3.声像型以磁性、感光材料为载体,直接记录声音、图像的一种文献。4.机读型利用计算机进行存储和阅读的一种文献形式。5.网络型利用网络进行传递和阅读的一种文献形式。6.手写型古代各种非印刷型文献如甲骨、简策、帛书等以及还没有正式付印的手稿。当前20页,总共62页。

信息资源的类型

3)几种主要的一次文献信息源图书

期刊

报纸

专利文献

标准文献

产品说明书

会议文献

档案文献

科技报告

政府出版物

学位论文

一次文献主要由上述十一类文献构成。当前21页,总共62页。

提示:确定所需信息的范围

如果你需要最新的信息,报纸和网络也许是你最先考虑的媒体。如果你需要一般的文章,杂志和网络可以提供有益的观点。如果你进行研究,图书、数据库、学术期刊、专利文献、科技报告、会议文献、学位论文等通常是不错的选择。注意:不要过多地依靠单一的信息源,这样你可以得到更充分更有力的观点。当前22页,总共62页。

1.1.3信息检索基本知识

信息检索的基本原理

信息检索类型

检索语言和检索系统

检索工具

检索方法和步骤

检索评价当前23页,总共62页。

信息检索的原理1)狭义的检索(Retrieval)是指依据一定的方法,从已经组织好的大量有关文献信息集合中,查找并获取特定的相关文献信息的过程。2)广义的检索包括信息的存储(Storage)和检索(Retrieval)两个过程。

存储:信息资源的有序化。检索:用户信息需求与信息集合匹配。当前24页,总共62页。

信息检索原理信息存储文献信息内容主题概念信息检索用户信息需要主题分析主题概念标引标引信息检索语言输入

输入信息检索系统输出检索结果信息标识

检索标识当前25页,总共62页。

信息检索的类型◆按信息检索的对象划分:1)文献检索

(DocumentRetrieval)2)数据检索

(DataRetrieval)3)事实检索

(FactRetrieval)

当前26页,总共62页。

信息检索的类型(续)◆按信息检索的方式划分:1)手工检索2)计算机检索(联机检索、光盘检索、网络检索)◆按信息组织的方式划分:1)目录检索

2)题录检索

3)文摘检索4)全文检索

当前27页,总共62页。

检索语言和检索系统检索语言:定义:为建立信息检索系统而创建的专门用来描述文献特征(内容特征或外表特征)和表达检索提问的一种人工语言,又称为信息存储与检索语言、标引语言、索引语言等。类型:分类检索语言(如:中国图书馆图书分类法)、主题检索语言(如:《汉语主题词表》)当前28页,总共62页。分类检索语言

分类法的目的就是编制或建立一个知识地图、一个知识树,既囊括人类的全部知识领域,又分门别类地进行聚类、疏理和组织,使人们可以从知识的整体结构或其中的一个知识结点入口层层深入,检索到相关的知识、信息、文献。分类法是知识分类组织的工具。当大量零散、无序的文献、信息、知识经过标引取得分类标识后,就可以纳入已确定的一个分类体系,揭示它们在整个知识系统中的位置,展示它们与其他知识的隶属关系、相关关系,成为有序知识系统的有机组成部分,因而可以从分类检索途径检索。当前29页,总共62页。分类检索语言的特点1)分类法符合人们认识事物的规律和处理事物的习惯。2)由于分类法是按学科、专业集中文献,能系统地揭示文献内容特征,因此能够实现族性检索,获得较高的查全率。3)便于组织图书资料的排架。4)分类检索语言是一种先组式语言,不能随时修改补充。因此,当新兴学科和边缘学科一旦出现,往往会排列在意想不到的类目下,造成检索上的困难。当前30页,总共62页。主题检索语言

主题语言可分为:标题词检索语言单元词检索语言人工语言叙词检索语言关键词检索语言自然语言当前31页,总共62页。叙词检索语言叙词是一些以概念为基础的、经过规范化的、并且有组配性能、能显示词间语义关系和动态性的词和词组,又称其为描述词、叙述词、主题词。叙词法(Descriptor)是以叙词作为标识符号,标引和检索文献信息的一种信息组织方法。叙词法也称主题词法,是一种用规范化的单元概念标引文献主题的方法,概念的组配可以在标引和检索时任意组配,是后组式的检索语言。叙词语言要求词与概念之间一一对应,即一个概念只能用一个词表达,一个词只能表达一个概念。为此,必须对自然语言加以一系列人工规范。当前32页,总共62页。叙词检索语言词义规范:

同义词:对同义词、准同义词、近义词、不同译名、学名与俗名等加以规范,只能用一个规范化的词作叙词。例:激光——莱塞、雷射

自行车——脚踏车

aircraft——plane、airplane、aeroplane

多义词:对多义词、同形词作概念、含义上的规范,即限定。例:迁移(心理学)反馈(学习心理)轻叩(球类运动)当前33页,总共62页。叙词检索语言词类规范:

虚词不能做叙词,实词中选名词、动名词做叙词。词形规范:词序(正序与倒序)例:湖南—南湖论文—文论语言—言语简称与全称例:人大——全国人民代表大会中国人民大学书写繁简体、标点符号当前34页,总共62页。

概念组配

组配规范:必须是概念与概念的组配,不能是字面上的组配。

1河北+梆子河北梆子?河北地方戏+梆子河北梆子2南京+板鸭南京板鸭?南京特产+板鸭南京板鸭3小天鹅+洗衣机小天鹅洗衣机?小天鹅牌电器+洗衣机小天鹅洗衣机4香蕉+苹果香蕉苹果?香蕉味食品+苹果香蕉苹果当前35页,总共62页。信息检索系统信息检索系统的组成要素:1)检索文档(file):即标有检索标识的信息集合。2)技术设备:即能存储信息的输入装置、存储器、输出装置、通信设备等。3)语言工具:即检索语言、标引规则、输入和输出标准等。4)作用于系统的人:即信息加工标引人员、录入人员、检索人员、系统管理维修人员等。当前36页,总共62页。

检索方法和步骤

检索方法:1)常规法顺查法、倒查法、时间抽样法。

2)引文法由近及远地追溯。

3)交替法引文法和常规法结合。当前37页,总共62页。

检索方法和步骤

检索途径:主题途径分类途径题名/责任者途径号码途径图2-1图2-2注:图2-1重庆维普《中文科技期刊数据库》部分检索标识图2-2中国国家科技图书文献中心数据库部分检索标识当前38页,总共62页。

检索方法和步骤

检索步骤:1)课题分析(需求分析);2)选择相关信息资源;3)构造检索式,选择检索入口;4)调整检索策略;5)获得信息线索,索取原文。当前39页,总共62页。分析课题选择工具确定途径检索式检索原文学科年限事实数据/论文特殊要求学科范围年限价格功能强弱信息类型主题、分类、作者、号码途径难点:主题词规范调整逻辑算符位置算符检索式筛选信息复印或下载远程传递

检索步骤当前40页,总共62页。

检索效果的评价指标

查全率(RecallFactor)查准率(PrecisionFactor)漏检率(OmissionFactor)当前41页,总共62页。

检索效果的评价指标

查全率R=a/(a+c)x100%

查准率P=a/(a+b)x100%

漏检率O=c/(a+c)x100%

误检率N=b/(a+b)x100%其中:a=检出的相关信息量a+b=检出的信息总量

b=检出的非相关信息量a+c=系统相关信息总量

c=未检出的相关信息量×当前42页,总共62页。信息的分析和利用创造性地利用信息:现有信息已有相关知识信息分析信息联想信息综合信息预测信息评估一定的技术手段增长的新信息调用借助+BAC当前43页,总共62页。信息素养与信息检索一个具有信息素养的人,他能够:

认识到精确的和完整的信息是作出合理决策的基础确定一个对信息的需求形成基于信息需求的问题从基于计算机的和其它的信息源中获取信息确定潜在的信息源确定成功的检索方案评价信息组织信息用于实际应用将新信息与原有的知识体系进行融合在批判性思考和问题解决的过程中使用信息当前44页,总共62页。思考题(一)

1)举例说明信息素养与创新能力的关系。

2)“信息”和“情报”在英语中都可以表述为information,是否需要加以区别?为什么?3)若写作“计算机软件设计与知识产权”论文,需参考哪些类型的文献?并简述查找所需文献的“路线图”。当前45页,总共62页。1.1.4关于信息图文中心

上海建桥学院图书馆在2000年4月学院创建时同时建立,2003年5月,图书馆和网络中心合并成立信息图文中心。2003年9月,总建筑面积10900平方米的信息图文中心大楼向读者全面开放。

上海建桥学院信息图文中心包含图书馆和网络中心两大职能,下设网络技术部、信息资源建设部、采访编目室、电子阅览室、图书借阅室和书刊阅览室;开设教师工作室和学生自修室,为全校师生提供图书报刊借阅、视听、网络和信息咨询等服务。信息图文中心目前正在进行改建。当前46页,总共62页。如何在校园网上浏览或查询

馆藏目录

进入“上海建桥学院图书馆WebPac服务系统”方法有三:一是打开校园网主页(),在“专题通道”栏目下点击“图书检索系统”;二是在校园网主页导航栏中找到“信图一图中心”,点击进入信息图文中心主页后,在“数字化图书馆”栏目内选中“图书检索系统”;三是直接在浏览器地址栏内输入,打开网页即可。图一当前47页,总共62页。如何在校园网上浏览或查询

馆藏目录

查询本校馆藏书刊进入了“上海建桥学院图书馆WebPac服务系统”,读者便可开始查询本校馆藏内可提供的您所需要的书、刊的书目信息和馆藏信息。馆藏书目查询系统提供“简单查询”和“高级查询”两类供选(见图一)①选择文献类型②选择查询途径③输入查询内容④最后点击查询控钮件图三1、点击“简单查询”,系统出现图三。按照图三右边的标注①—④操作,出现图四,便可查询所需要的书刊目录及其相关信息。

图四①选择文献类型②选择查询途径③输入查询内容④最后点击查询控钮件图三当前48页,总共62页。如何在校园网上浏览或查询

馆藏目录

2、点击高级查询,系统出现图五。读者可以根据已知的文献信息→针对性地选择输入书目名称、作者或者主题词(关键词)→选择匹配方式→点击“查询”控件,系统将会按书刊入馆藏时间顺序,由后往前列表,只要馆藏内有所要查找的书刊,便可快速准确地看到所需文献的信息。当前49页,总共62页。如何使用

数字图书和期刊一、进入路径数字图书和期刊仅限校园内网使用。进入方法有二:一是打开校园网主页(http:///),在网页上方的导航条中点击“信图中心”,进入信图中心首页后,在“数字化图书馆”板块中点选“数字图书馆”进入“书生”电子图书数据库,点选“中国期刊全文数据库”进入“同方”电子期刊数据库,点选“上海教育网络图书馆”进入“万方”、“维普”电子期刊和“超星”电子图书等数据库;二是直接在IE浏览器地址栏内输入“00”(“书生”电子图书),输入“48”(“同方”电子期刊),按回车键。无需注册和使用用户名及密码登陆。当前50页,总共62页。“书生”“数字图书馆”首页

当前51页,总共62页。“中国期刊全文数据库”使用1.选择专辑当前52页,总共62页。“中国期刊全文数据库”使用2、选择检索项3、输入检索词4、设置检索范围、方式6、命中结果、点击题名5、检索当前53页,总共62页。“中国

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论