北京大学化学信息学第四讲电子资源课件_第1页
北京大学化学信息学第四讲电子资源课件_第2页
北京大学化学信息学第四讲电子资源课件_第3页
北京大学化学信息学第四讲电子资源课件_第4页
北京大学化学信息学第四讲电子资源课件_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

化学信息学电子资源部分1.电子资源

传统上也称为电子出版物,指一切以电子方式或机读方式生产和发行的信息资源。电子资源中的信息,包括文字、图片、声音、动态图像等,都是以数字代码方式存储在磁带、磁盘、光盘等介质上,通过计算机输出设备和网络传送出去,最终显示在用户的计算机终端上。

1.1电子资源的产生与发展1960年代初,《化学题录》(ChemicalTitle)和《医学索引》(美国国家医学图书馆)相继产生。1965年,已有大约20个数据库可供使用,但这时的数据库存储介质仅限于机读磁带,内容以科技文献书目、索引、文摘为主。1965年以后,由于集成电路计算机及硬盘的产生,以及数字通讯技术和分组交换网的发展,开始有了数据库联机检索,著名的DIALOG系统以及MEDLINE、ORBIT、BRS、JOIS等相继开始服务,数据库的数量开始成倍增长,到1975年,已达到近300个数据库。1.2电子资源的类型

参考数据库:英文为referencedatabases,指包含各种数据、信息或知识的原始来源和属性的数据库。数据库中的记录是通过对数据、信息或知识的再加工和过滤,如编目、索引、摘要、分类等,然后形成的。参考数据库主要包括:书目数据库、文摘数据库、索引数据库。书目数据库主要是针对图书进行内容的报道与揭示的,如各图书馆的馆藏机读目录数据库;文摘和索引数据库则相对期刊论文、会议论文、专利文献、学位论文等进行内容和属性的认识与加工,如《科学引文索引》(ScienceCitationIndex)、《化学文摘》(ChemicalAbstracts)、《工程索引》(Engineeringlndex)等。

全文数据库:英文为full-textdatabases,即收录有原始文献全文的数据库,以期刊论文、会议论文、政府出版物、研究报告、法律条文和案例、商业信息等为主。如美国的LEXIS-NEXIS数据库、学术期刊图书馆(ProQuestAcademicResearchLibrary)及《中国人民大学书报资料中心复印报刊资料全文数据库》等。

事实数据库:英文为factualdatabases,指包含大量数据、事实的数据库,分为数值数据库、指南数据库、术语数据库等,相当于印刷型文献中的字典、辞典、手册、年鉴、百科全书、组织机构指南、人名录、公式与数表、图册(集)等。

电子图书:英文为electronicbooks,近年来网络电子图书尤其发展迅速,已涉及到了很多学科领域。

电子期刊:英文为electronicjournals或简称e-journal,包括:与纸本期刊并行的电子期刊,如著名的《科学》(Science)、《自然》(Nature)、中国电子期刊杂志社的期刊等:纯电子期刊,如《化学通报(电子版)》。

电子报纸:英文为electronicnewspaper,目前网上已有数千种报纸供用户使用。其它:如网站、FTP(文件传输)站点等,可以给用户提供一些有用的知识、动态信息或软件等。2.1电子资源检索系统

电子资源检索系统:由硬件、软件、数据库三部分组成。

硬件:大型计算机主机、服务器、存储器(硬盘或光盘)、通讯网络、计算机终端等。

软件:数据库系统管理软件、检索软件。包括:信息采集、信息标引加工、建库、词表管理、用户检索界面、提问处理、网络发布等模块。

数据库:按一定方式存储的相互关联的数据集合。由于数据库中的信息都经过了详细、精心的选择和加工,主题化,有序,能够提供多种检索途径,因此相对互联网上无组织和大量无用的信息来说,检索结果准确,价值高。

按设备和检索方式划分检索系统类型:联机数据库检索系统、光盘数据库检索系统、网络数据库检索系统。

2.2联机数据库检索联机检索(onlineretrieval)是指用户利用计算机终端设备,通过通信线路或网络,在联机检索中心的数据库中进行检索并获得信息的过程。检索终端通讯网络中央计算机数据库联机检索中心外设联机检索系统的网络结构2.3光盘数据库检索光盘数据库通常是指CD-ROM数据库。CD-ROM(CompactDiscRead-onlyMemory),意为只读光盘,轻便、灵活、体积小、容量大,一张只读光盘的最大存储量为600M,可存储文字、图片、图像、声音等。客户端光盘服务器系统软件光盘驱动器客户端客户端数据库光盘检索数据库检索联机光盘检索系统特点:l

数据库数量没有联机检索多。l

数据库更新速度慢,一般为月更新或季更新。l

数据库和系统集中式管理,负担重,数据库和用户越多,响应时间越长。l

检索模式:客户端/服务器,客户方运做在微机上进行、l

信息组织模式:普通线性文本。l

检索机制:检索功能强,索引多,不同的检索系统使用不同的检索命令,具备命令检索和菜单检索两种方式,后者对非专业人员来说,易学易用。l

系统访问通过局域网就可以进行,不需支付通讯费用。l

检索环境宽松,检索费用低。用户界面比较友好。网络数据库检索系统特点:l

数据库数量多,信息量大,同时提供了其它服务项,如有关的动态信息、统计数字、相关站点的链接等。l

数据库更新速度快,一般为日更新。l

数据库和系统分布式管理,响应快。l

检索模式:客户端/服务器方式,客户方运做在微机上进行,分析从服务器上返回的数据,给用户显示信息;服务方则给用户提供客户端应用程序,分析处理各类请求,并提供数据服务。l

应用程序与数据隔离,数据相对独立、完整、安全性好:但对客户方来说,由于访问是通过互联网进行的,安全性较差。l

信息组织模式:超文本。l

检索机制:检索功能强,索引多,不同的检索系统使用不同的检索命令,通过WWW浏览器提供检索,对非专业人员来说,易学易用。l

系统访问通过互联网进行,需支付少量通讯费用。l

检索环境宽松,检索费用较联机检索低,但高于光盘检索。l

用户界面基于WWW浏览器开发,方便友好。

2.5检索语言

检索语言(informationretrievallanguage),是信息存储与检索过程中用于描述信息特征和表达用户信息提问的一种专门语言。所谓检索的运算匹配就是通过检索语言的匹配来实现的。检索语言是人与检索系统对话的基础。人工语言(artificiallanguage)是根据信息检索的需要而由人工创制的,采用规范词(controlledterm.),由人工控制,包括分类检索语言(分类号)和主题检索语言。自然语言(naturallanguage)检索用词是从文献本身抽取的,是非规范词(uncontrolledterm),它的标识包括关键词、题名、摘要、全文等。3.2检索技术3.2.1布尔逻辑检索:即运用布尔逻辑算符(Booleanoperators)对检索词进行逻辑组配,表达两个概念之间的逻辑关系。逻辑与and:检索时,命中信息同时含有两个概念,专指性强;逻辑或or:检索时,命中信息包含所有关于逻辑A或逻辑B或同时有A和B的,检索范围加大了;逻辑非not:命中信息只包括逻辑A,不包括逻辑B或同时有A和B的,排除了不需要的检索词;逻辑异或xor:命中信息包含逻辑A,也包含逻辑B,但不包含同时含有A和B的信息。ABABAandBAorBABAnotBABAxorB3.2.2位置算符检索即运用位置算符(positionoperators)表示两个检索词间的位置邻近关系,又叫邻接检索。这种检索技术通常只出现在西文数据库中。

常用的位置算符有:(W)、(nW)、(N)、(nN)、(F)、Same3.2.4字段限制检索AB

Abstracts

文摘

AU

Author

作者

CS

CorporateSource机构名称DE

Descriptor

叙词

DT

Documenttype

文献类型FT

Full-text

全文

JN

Journalname

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论