计算机信息检索._第1页
计算机信息检索._第2页
计算机信息检索._第3页
计算机信息检索._第4页
计算机信息检索._第5页
已阅读5页,还剩141页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第2章 计算机信息检索 所谓计算机信息检索,简单来说就是利用电子计算机对信息和数据的高速处理能力来存贮数据并从中查找、取出数据这样一个过程。 2.1计算机信息检索的发展与类型2.2计算机信息检索原理系统的构成2.3计算机检索的方法与步骤 因此,计算机信息检索是对传统的手工检索的革命。手检虽然可以解决部分信息查询问题,但是这种检索方式越来越难以适应当代信息的发展。实践证明,计算机信息检索在信息检索领域将占据越来越大的比例,使用计算机检索信息是一项基本技能。一个具有这方面能力并善于从电子信息源中获取所需信息者,将在今后的信息社会中获取更多的成功机会。计算机信息检索系统的发计算机信息检索系统的发展展

2、 最早的计算机情报检索系统是由美国海军兵器中心(最早的计算机情报检索系统是由美国海军兵器中心(NOTSNOTS)图书馆于)图书馆于19541954年研制的。从年研制的。从5050年代初计算机首次应用于情报检索试验,到如今的多元年代初计算机首次应用于情报检索试验,到如今的多元化全面发展,计算机情报检索经历了以下几个阶段化全面发展,计算机情报检索经历了以下几个阶段 :脱机检索阶段脱机检索阶段(1954-1964)(1954-1964) 没有实用性,内部的实验性或半实验性系统没有实用性,内部的实验性或半实验性系统 联机检索阶段联机检索阶段(1965-1972)(1965-1972)第三代集成电路计算

3、机、硬磁盘及磁盘机的出第三代集成电路计算机、硬磁盘及磁盘机的出现,再加上数字通讯技术的发展和分组交换公现,再加上数字通讯技术的发展和分组交换公用数据通信网的普及,使得文献检索从脱机批用数据通信网的普及,使得文献检索从脱机批处理阶段进入联机检索阶段处理阶段进入联机检索阶段 。DIALOGDIALOG系统和系统和MEDLARSMEDLARS系统最具代表性。系统最具代表性。 国际联机检索国际联机检索 (1973- )(1973- )第四代计算机的出现,卫星通讯技术和光纤通讯技术第四代计算机的出现,卫星通讯技术和光纤通讯技术的实用化,使得计算机情报检索冲破时间和空间的限的实用化,使得计算机情报检索冲破

4、时间和空间的限制,为快速全面地获取全球性科技情报资料和经济信制,为快速全面地获取全球性科技情报资料和经济信息提供了非常方便的条件,从而极大地提高了情报资息提供了非常方便的条件,从而极大地提高了情报资料的可获得性和利用价值,充分实现了人类情报料的可获得性和利用价值,充分实现了人类情报资源资源的共享。的共享。2.1光盘检索系统光盘检索系统 (1985- )19851985年出现年出现CD-ROMCD-ROM数据库数据库. .使用方便,使用方便,存贮量大,不受检索时间、通信费用、存贮量大,不受检索时间、通信费用、打印篇数的严格限制而深受读者欢迎。打印篇数的严格限制而深受读者欢迎。 Internet检

5、索检索(1985- ) InternetInternet是世界上最大的互联网络;是是世界上最大的互联网络;是一个以一个以TCP/IPTCP/IP通讯协议连接各个国家、通讯协议连接各个国家、各个部门、各个机构计算机网络的数据各个部门、各个机构计算机网络的数据通信网;是一个集合各个专业、各个领通信网;是一个集合各个专业、各个领域、各种资源为一体的供网上用户共享域、各种资源为一体的供网上用户共享的信息资源网的信息资源网 在在InternetInternet上的科技信息资源占全部信上的科技信息资源占全部信息资源的息资源的2020以上。以上。 2.1.1脱机批处理检索 据记载,最早的计算机信息检索系统雏

6、形是美国海军兵器中心于1954年研制的。随着具有批处理能力的第二代计算机问世,计算机信息检索进入了生产性开发和实际应用的年代。 批式检索是计算机信息检索的主要方式。 批式检索的优点:比手工检索快捷、方便。 批式检索的缺点:用户不能与系统进行实时对话,不能及时修正检索策赂,并且,检索结果不能立即得到,必须等待成批处理或定期检索处理。2.1.2联机检索 在60年代初人们就开始研制联机检索系统。 1965年,美国系统发展公司开始研制交互式的联机检索系统,这种系统能够使用户直接同所检索的数据库进行会话式交流。 1966年,洛克希德空间与导弹公司(后来的DIALOG情报服务公司)建立了DIALOG系统,

7、并于1969年投人运行。 至70年代初,联机书目系统在美国和欧洲得到了广泛的利用。这一时期还出现了其他一些联机检索系统,如IBM公司的“文献处理系统”(DPS,即STAIRS的身),欧洲空间组织的ESA-IRS系统等 。2.1.2联机检索 联机检索是计算机系统与检索者之间通过检索语言和计算机命令进行的交互式检索, 检索过程是人机对话式的,允许及时修改捡索策略;可及时浏览,显示文献;可根据用户不同需求,进行各种输出,及时取得检索结果。 联机检索网络的组成:由联机检索中心、通讯网、检索终端等三部分组成。著名的国际联机检索系统。 目前世界上比较著名的联机检索系统有:美国的DIALOG系统、0RBIT

8、系统、BRS系统、MEDLINE系统、欧洲的ESA-IRS系统、日本的JOCST系统、德美日联合开发的STN系统等。 1) DIALOG系统 美国Dialog系统是目前世界上规模最大、影响最广泛的综合性商业联机检索系统,也是我国科技界广泛使用的系统。 Dialog联机检索用户遍布世界100多个国家。 D1ALOG现有全文、题录、事实及数据型数据库数百个,都是质量很高、很权威的核心数据库,其中包括著名的工程索引(Ei)、科学引文索引(SCI)、英国科学文摘(1NSPEC)、世界专利索引(WPI)等,其数量平均每年约增长20一28。文献量已近数亿篇,内容涉及自然科学、社会科学、工程技术、人文科学、

9、时事报道及商业经济等各个领域。 1) DIALOG系统 利用DIALOG数据,可查找各个学科各种类型的文献信息, 以及查找公司,专利、标准、科技报告、产品,市场等商业信息;查找结构,人物,书刊出版等参考信息,还可以阅览美国各地及世界各国的报纸新闻。 DIALOG数据库信息量大,检索方式灵活, 适用于做比较全面的文献调研检索。如:科研课题开题立项时进行文献回溯检索, 课题中期跟踪检索和课题结题时的查新检索。DIALOG提供的专业信息范围q科学技术科学技术 化学工程、机械与民用工程、航空技术、计化学工程、机械与民用工程、航空技术、计算机科学和软件学等应用科学领域;算机科学和软件学等应用科学领域;q

10、知识产权知识产权 专利、商标和版权信息;专利、商标和版权信息;q能源与环境能源与环境 石油、天然气、电能、原子能,环境污染与石油、天然气、电能、原子能,环境污染与保护等;保护等;q医学医学 生物医学研究、医学实践、医疗仪器、药物相互影生物医学研究、医学实践、医疗仪器、药物相互影响和治疗方法等;响和治疗方法等;q制药制药 追踪药物的发展,包括正在开发中的药物和新药;追踪药物的发展,包括正在开发中的药物和新药;药物登记、许可证、临床试验等。药物登记、许可证、临床试验等。q化学化学 化学物质的合成、最新发现以及商业开发;化学物质的合成、最新发现以及商业开发;DIALOG提供的专业信息范围q食品与农业

11、食品与农业 农业、营养学、食品科学、包装技农业、营养学、食品科学、包装技术、食品立法和食品与饮料市场等信息;术、食品立法和食品与饮料市场等信息;q社会科学社会科学 教育、信息科学、心理学、社会学、教育、信息科学、心理学、社会学、政治等;政治等;q政府和法规政府和法规 立法和法规信息;立法和法规信息;q商业与金融商业与金融 市场份额、销售指标、竞争情报、市场份额、销售指标、竞争情报、公司财务、商业目录等;公司财务、商业目录等;q新闻新闻 报纸、专业时事通讯、商业杂志等;报纸、专业时事通讯、商业杂志等;q参考信息参考信息 在印书籍、书评报道、名人录;基金、在印书籍、书评报道、名人录;基金、助学金;

12、标准、规范等信息。助学金;标准、规范等信息。DIALOG提供的检索方式DIALOG根据不同用户的需求,提供了多种根据不同用户的需求,提供了多种检索界面和联机方式,并制定了相应的收费检索界面和联机方式,并制定了相应的收费办法:办法: 专业检索人员使用的检索方式专业检索人员使用的检索方式 非专业检索人员使用的检索方式非专业检索人员使用的检索方式 1.通过CHINAPAC(专线)与DIALOG联机 2.通过CHINANET或Internet与DIALOG联机 ,利用web直接上网检索。 DIALOGWeb(http:/ DIALOGClassic(http:/)为专业人员推出的界面 DIALOGSe

13、lect(http:/)为非专业人员推出 的“傻瓜”界面,对于初学者、最终信息用户和不愿学习Dialog检索指令的人可使用其“傻瓜”界面。 数据库蓝页http:/www.library.D Web界面的检索方法DIALOG公司网址 http:/ 1利用利用eb直接上网检索。其直接上网检索。其eb网址网址为为http:/www.DialogW 特别为专业人员推出的Web界面。其网址为http:/www.DialogC 这是最新推出界面。速度快,检索过程每一屏幕均保留不丢失数据,便于存盘,界面是专 业人员熟悉的界面,能很快的从旧检索方式转入适应新的Web界面。 DIALOG系统提供非专业检索人员W

14、eb界面 其网址为http:/www.dialogS Dialog Select作为在Internet上的傻爪界面主要针对最终用户,而非专业人员。对于初 学者、最终信息用户和不愿学习Dialog检索指令的人可使用其傻瓜界面。2) 0RBIT系统 ORBIT系统是目前世界上第二大联机检索系统,是美国系统发展公司于1965年建立的, ORBIT是以该公司开发的软件ORBIT命名的,正式的机构名称为 ORBIT Search Service。ORBIT系统 拥有80多个文档(其中有20多个文档与DIAIOG系统相同),6000多万篇文献,约占世界机读文献总量的1/4。ORBIT系统拥有的数据库数量虽

15、然比DIALOG系统少得多,但极有特色,以汽车工程、石油、化工、生物化学、环境科学、安全科学、运动科学等文献收录齐备著称,并且对一批使用价值较高的数据库拥有独家经营服务权。QUESTELORBIT系统 QUESTELORBIT系统是法国著名的联机检索系统。 由QUESTEL系统 与ORBIT系统合并后形成的QUESTELORBIT。该系统目前拥有250个数据库,上亿篇文献,占世界机存文献的25%。该系统在专利、商标、化学、科学技术、商业和新闻等的联机服务,被公认世界领先的联机检索系统。每天24小时提供服务。 3)ESAIRS系统 ESAIRS系统是欧洲最大的联机检索系统,也是世界上第三大联机检

16、索系统。ESA-IRS是欧洲空间组织情报检索中心(European Space Agency-Information Retrieval Service)的英文缩写。3)ESAIRS系统 它拥有70多个数据库,存贮文献3000多万篇它拥有的数据库中,虽然近半数与DIALOG系统相重复,但拥有自己所独特的数据库,这样就弥补了DIALOG系统对欧洲数据库收录不全的缺陷。4)STN系统 STN系统是由美国化学文摘社(CAS)、德国卡尔斯鲁厄能源、物理、数学专业情报中心(FIZ)和日本国际化学情报协会(JAICI)三家合作建立的。 STN的全称是The Scientific and Technical

17、 Information Network-Internation(国际科学技术情报网络),始建于1979年。三个中心共向系统投入80多个数据库,约6000万条记录。数据库的专业涉及化工、数学、物理、能源、冶金、建筑、化工产品信息、公司信息和专利。数据库类型有书目型、全文型、指南型、数值型和图像型。我国联机检索概况 我国联机检索起步较晚,从70年代末到80年代初发展较快。 1981年底北方科技情报所与美国DIALOG联机系统直接联机。 1982年9月冶金部、石油部、化工部等部委情报所在北京实现了与DIALOG或0RBIT联机检索系统的直接联机。 1983年10月,中国科技情报所开始使用300Bi

18、t速率的数传终端与欧洲空间组织的ESAIRS联机检索系统联机。 我国联机检索概况 迄今,全国已在50多个城市建立了l00多个国际联机检索终端,与国外11个主要信息服务系统建立了联机检索业务。 这些信息服务系统是:美国的DIAILOG、BRS、INFOLINE、0RBIT、DMS/DRI,意大利的ESA-IRS,德国的STN,加拿大的ISHARPS,卢森堡的ECHO,奥地利的WSR,瑞士的DUNBradstreet、Data-Star。3.1.3光盘检索 光盘是20世纪80年代在计算机技术、激光技术等现代最新科技成果的基础上发展起来的新型电子出版物。 光盘具有信息存贮密度高、容量大、读取速度快、

19、存储信息类型多等优点,倍受人们的青睐。 光盘检索既可以进行单机检索,又可以实现网上共享。同时,光盘检索系统除可提供追溯检索、定题服务外,还可用于“自建库”、培训用户和作联机检索前预处理。 光盘检索系统的优点 (1)光盘系统是自成一体的完整的检索系统,使用光盘检索系统时,不受通信线路和主机的限制,检索方便。 (2)一旦订购了光盘数据库,光盘检索系统的使用量就没有限制,用户在使用时没有太大的经费压力。 (3)光盘具有很大的存贮容量,耐用,复制费用低。 (4)光盘数据库可以提供文本、图像、声音和动态图像等信息。 2.1.4网络检索 进入80年代末期,由于光纤的利用使信道容量大大增加,多媒体技术的发展

20、和多媒体信息网络的出现、智能计算机和人工智能网络的发展,特别是Internet网络的建成并得到广泛应用,人们的生活变得更加丰富多彩,人们获取信息的环境发生了根本性变化,网络检索已成为人们获取信息的最便利、最广泛、最有效的途径。信息检索的类型)按检索对象划分:分为文献检索、数据检索和事实检索。()文献检索: 它是以文献为对象的检索。检索的结果是相关的文献线它是以文献为对象的检索。检索的结果是相关的文献线索如文摘、题录或全文,系统不直接解答用户提出的问题,索如文摘、题录或全文,系统不直接解答用户提出的问题,通过检索工具(或数据库)查找。通过检索工具(或数据库)查找。 例例1:观赏草在园林中的应用及

21、栽培管理:观赏草在园林中的应用及栽培管理 例例2:基于:基于3S技术的区域生态环境质量监测研究技术的区域生态环境质量监测研究 例例3:创新教育在中学生物教育中的应用研究:创新教育在中学生物教育中的应用研究 利用CNKI中国期刊网等数据库检索出该课题的文献线索(文摘、题录或全文题录)例1:观赏草在园林中的应用及栽培管理文献线索全文例2:基于3S技术的区域生态环境质量监测研究文献线索摘要例3:创新教育在中学生物教育中的应用研究全文()数据检索是以数据为对象的检索。利用参考工具书、数据库等查出包含在信息中的某一数据、参数、公式、图表、或化学分子式等的检索。例如:2012年 9月CPI数据是多少?()

22、事实检索是以事实为对象的检索。是从存贮事实信息系统中查找出指定的事实的行为。例如:什么是达尔文理论?例如:第一台电子计算机于何年研制出来?达尔文理论2.2计算机信息检索原理与系统构成(P27) 2.2.1计算机信息检索原理 计算机技术与信息检索技术的结合,使信息检索向网络计算机技术与信息检索技术的结合,使信息检索向网络化、智能化方向发展。化、智能化方向发展。 计算机信息检索,就是在人机共同作用下完成信息存取操计算机信息检索,就是在人机共同作用下完成信息存取操作。在手工检索、机械检索和光电检索的基础上演变而来。作。在手工检索、机械检索和光电检索的基础上演变而来。 各类数据库,如书目、事实和数字型

23、数据库、全文数据库都各类数据库,如书目、事实和数字型数据库、全文数据库都是计算机检索的信息源。是计算机检索的信息源。其原理为其原理为:将检索提问标识与系统中的存储文献的特征将检索提问标识与系统中的存储文献的特征标识进行比较,并输出命中文献。标识进行比较,并输出命中文献。用户提问用户提问 匹配运算匹配运算 数据库数据库 命中情报命中情报2.2.2计算机检索系统的构成 1)硬件部分 2)软件部分 3)数据库 1)硬件 计算机的硬件主要包括具有一定性能的主机、外部设备,以及与数据处理或数据传送有关的具他设备,外部设备包括:外部存储器、输人输出设备等。2)软件 计算机软件分为系统软件和应用软件。 系统

24、软件包括:操作系统、编译程序与汇编程序、诊断程序等。 应用软件包括:数据库管理系统、建库程序、数据输入输出程序、自动标引程序、文件管理程序等。3)数据库 数据库的定义为:“至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种 数据集合。”数据库是计算机阅读的信息集合。数据库:海量数据的集合. 数据库主要类型如下: 文献型数据库、非文献型数据库和多媒体数据库3)数据库的类型 (1)参考数据库(Reference Database) 这是指用户从中获取信息线索后,还需要进一步查找 原文或其他资料的一类数据库。它包括书目数据库和指南数据库。 书目数据库(Bibliographic

25、 Database): 包括文摘、索引数据库为二次文献数据库 。书目数据库(Bibliographic Database): 提供存储和检索书目信息的文献数据库,通常是图书目录的计算机化的产物,又称机读目录,主要报道馆藏各种文献的书目信息和存贮地址。注:几乎所有图书馆的OPAC都是免费开放的,只要能够上互联网,就可以在线查询全世界图书馆的馆藏目录.指南型数据库(Directory Database) 提供用户参考,给予用户指南的各类信息,商业、企业、人物等简要描述性信息的一类数据库。 例如,公司名录数据库、人物传记数据库、产品数据等。例如公司名录数据库(2)源数据库(Source Databa

26、se): 为用户提供原始资料或具体数据的一类数据库。 具体分为以下类型: 数值数据库(Numeric database) 文本-数值数据库(Textual Numeric database) 术语数据库(Term database) 全文数据库(Full-text database) 图像数据库(Graphics database)数值数据库(Numeric database)中国统计数据应用支持系统术语型数据库 专门存储揭示各类名词、术语、词语的形、音、义与使用方法以及词义演变、发展等信息的检索工具,大多是辞书、词典、百科全书等的数字化版本.(见第三章)全文型数据库 主要指各种图书、期刊、法

27、律条文及案例、新闻报道以及百科全书、手册、年鉴等全部文字或原著的内容,被转换成计算机可读的形式.它将二次文献的检索同原文献的获取融为一体,用户可以从中直接查到所需文献全文及字、句、段、节、章及相关信息,不需再去查阅原文.具有更为直接、迅速、详尽而可靠的特点。数字图书全文库(例如超星数字图书馆)电子期刊全文数据库(例如CNKI) 中国知网CNKI的中国期刊全文数据库 中国知网CNKI的中国博士学位论文全文数据库 中国知网CNKI的中国优秀硕士学位论文全文数据库 重庆维普中文科技期刊数据库 中国知网CNKI的中国期刊全文数据库中国知网CNKI的中国期刊全文数据库中国知网CNKI的中国期刊全文数据库

28、3.多媒体数据库 能够对文本、数值、图形、图像、声音、动画、视频等 复杂的多媒体对象进行一体化存储、管理和检索的数据库。 例:新华社多媒体数据库2.3计算机信息检索步骤与方法(P30) 2.3.1计算机检索技术 是指应用于信息检索过程的原理、技术、方法、策略的总称,是检索系统为了提高检索效率,从概念相关性、位置相关性等方面对检索提问进行组配、加权、扩展、截词、邻近、限定的比较和运算处理技术。 常用的常用的计算机检索技术计算机检索技术布尔检索技术布尔检索技术1邻近检索技术邻近检索技术3短语检索技术短语检索技术4截词检索技术截词检索技术限定检索技术限定检索技术51、布尔检索、布尔检索 布尔检索(b

29、oolean retrieval)是用布尔逻辑算符将检索词、短语或代码进行逻辑组配的一种技术,也是目前最常用的一种检索技术。 常用的布尔逻辑算符有以下3种 :逻辑逻辑或或 (用用 OR 或或 + 表示表示 )逻辑逻辑非非 (用用 NOT 或或 - 表示表示 )逻辑逻辑与与 ( 用用AND或者或者 * 表示表示 )逻辑“与”具有概念交叉或概念限定关系的组配,用“*”或“AND”算符表示。检索词A和检索词B用“与”组配,检索式为:A AND B,或者 A * B它表示检出同时含有同时含有A、B两个检索词两个检索词的记录。 1)逻辑与 逻辑与的作用是增加限制条件,以缩小检索范围,减少终端显示文献的篇

30、数,提高检准率。 实例一:加入WTO对我国高等教育的影响与发展研究 提取关键词: WTO 高等教育高等教育 检索表达式检索表达式 WTO * 高等教育高等教育例如: 加入WTO对我国高等教育的影响研究利用中文Google :WTO 高等教育 例如: 加入WTO对我国高等教育的影响 利用:中国期刊全文数据库(CNKI):检索条件: (题名=WTO)并且(关键词=高等教育)例如中文Google:利用空格表示逻辑与例如中文Google:利用空格表示逻辑与查找:逻辑“或”逻辑“或”是一种具有概念并列关系的组配,用“+”或“OR”算符表示。检索式为:A OR B,或者 AB它表示检出所有含有所有含有A词

31、或者词或者B词词的记录。 例如检索式:中学教学(生物中学教学(生物 OR 地理)地理) 例如检索式:观赏植物观赏植物 OR 花卉花卉 2)逻辑或:扩大检索范围逻辑或(0R、十) 检索项A、B若用“逻辑或”组配,则逻辑式为“A OR B”或“A+B”。这表示被检索的文献只要有其中任意一个检索项,那么它将被命中。例如检索式:中学教学(生物中学教学(生物 OR 地理)地理)例如检索式:观赏植物观赏植物 OR 花卉花卉 因此,逻辑或是一种具有概念并列关系的组配形式。 具有并列关系的概念如同义词、近义词、相关词,包括上位词和下位词.组配符号用“or”或“+”表示。 逻辑或的作用是放宽检索范围,增加检索结

32、果,提高检全率.例如检索“中学生物或地理教学”逻辑或逻辑或 “+” 能力教育能力教育 + 素质教育素质教育逻辑“非” 逻辑“非”是一种具有概念排除关系的组配,用“”或“NOT”算符表示。检索式为:A Not B,或者 A-B它表示检出含有含有A词,但同时不含词,但同时不含B词词的记录。例如,欲检索“计算机软件测试”检索逻辑式为计算机 硬件测试 利用中国期刊全文数据库(CNKI):检索条件: (题名=计算机)不包含(关键词=硬件测试) 利用中国期刊全文数据库(CNKI):检索条件: (题名=计算机)并且(关键词=软件测试) 逻辑运算符的组合使用逻辑运算符的组合使用 上述这些逻辑运算符可以相互组合

33、使用,但有一定上述这些逻辑运算符可以相互组合使用,但有一定的执行顺序。的执行顺序。 它们的优先顺序依次为:它们的优先顺序依次为: 括号,括号,NOT,AND,OR 括号的作用括号的作用 与数学中的作用一样,是为了在多种符号组合时使用优与数学中的作用一样,是为了在多种符号组合时使用优先级。括号内的部分将具有最高优先级。先级。括号内的部分将具有最高优先级。 例如:例如: (多媒体多媒体 OR中学中学 生物生物)AND(教学教学 OR 论文论文) 由于括号调整了逻辑运算顺序,用户在提交检索请求后,由于括号调整了逻辑运算顺序,用户在提交检索请求后,实际查询的关键词是实际查询的关键词是“多媒体教学多媒体

34、教学”、“多媒体论文多媒体论文”、“中学生物中学生物教学教学”或者或者“中学中学生物论文生物论文”。 布尔逻辑组合检索例子布尔逻辑组合检索例子创新教育与中学生物多媒体教学研究创新教育与中学生物多媒体教学研究首先提取中外检索词:首先提取中外检索词:创新教育创新教育 中学生物中学生物 多媒体多媒体 教学模式教学模式构建检索式构建检索式检索式检索式:是检索策略的逻辑表达式,是是检索策略的逻辑表达式,是用来表达用户提问的,由基于检索概念用来表达用户提问的,由基于检索概念产生的检索词和各种组配算符构成。产生的检索词和各种组配算符构成。构建检索式:构建检索式: 注:在检索中,采用高级检索。每一框中填一检索

35、词,词与词之间选“并且”、“或者”等逻辑关系。 检索式检索式1 创新教育创新教育 AND 中学生物中学生物 AND 多媒体教学多媒体教学 检索式检索式2 创新教育创新教育 OR中学生物中学生物 AND 多媒体多媒体 教学教学检索式检索式1创新教育创新教育 AND 中学生物中学生物 AND 多媒多媒体体 教学教学检索式检索式2创新教育创新教育 OR中学生物中学生物 AND 多媒体多媒体 教学教学2)截词检索截词检索 用给定的词干做检索词,检索与含有该词干的全用给定的词干做检索词,检索与含有该词干的全部检索词相关的文献。它可以起到扩大检索范围、部检索词相关的文献。它可以起到扩大检索范围、提高查全率

36、、节省检索时间等作用,对西文文献提高查全率、节省检索时间等作用,对西文文献尤为重要。尤为重要。 例如,名词的单复数形式、词的不同拼写法、词例如,名词的单复数形式、词的不同拼写法、词尾的不同变化等尾的不同变化等 截词检索按截断部位划分为:右截断、左截断、截词检索按截断部位划分为:右截断、左截断、中截断等。中截断等。2)截词检索的类型与符号 截词符多采用通配符“?”、“$”、“*”等,因此,截词检索有时也称为通配符(wildcard)检索。 按截断的字符数量来分,可分为有限截断和无限截断两种类型: 有限截断是指有具体截去的字符数,用“?”来表示有限截断。 无限截断则不指明具体截去的字符数。用“”表

37、示无限截断。 “?” 、 “#” 和 “$”的相同点与不同点:(1)“?”与“#”均代表一个汉字、西文字符或其他字符; “#”与“$”均可以不代表任何汉字、西文字符或其他字 符,检出的词均包括词干本身。(2)不同点: 使用“?”,检出的词不包括词干本身; 使用“$”,可代表多个汉字、西文字符或其他字符 检出的词包括词干本身。n后截断n中截断n前截断无限截断如: economic? ?有限截断截词检索与截词检索算符economiceconomicseconomicsteconomicalismeconomiceconomicseconomicst如: economic*如:wom?nwomanw

38、omen如: ?lish sul*ur sulfur sulphur 无限截断有限截断n前后截断如: ?computer?可检出: computer、computers、 computerize、computerized、minicomputer、minicomputers、microcomputer、microcomputers 3)截词方法(1)前截词?ologygeology,sociology,psychology,archaeo-logy, biology等检索词的文献左截断(前截断)左截断(前截断) ?graphy(2)中间截词 :(2)中间截词 : wom?nwoman, wom

39、en(2)中间截词 : wom?nwoman, women(3)后截断 后截断也叫做右截断即将一个词字符串的后方或右方截去有限或无限个字符,后截断检索的方法也叫“前方一致”检索。例如:Comput* Comput* Computer, Computers, Computing右截断(后截断,用?和右截断(后截断,用?和 *)Comput? 可检出:Computer,Computers,Computing等检索词的文献。 进入我馆主页,点击进入EBSCOhost数据库例如:comput?technology3)位置检索位置检索 位置算符是表示所连接的各个单元词词间位置关系位置算符是表示所连接的各

40、个单元词词间位置关系的符号,用位置符可以限制两个检索词在文献中出的符号,用位置符可以限制两个检索词在文献中出现的先后顺序、相隔的距离等。位置检索是实现全现的先后顺序、相隔的距离等。位置检索是实现全文检索的查找方法。文检索的查找方法。(1)位置算符:(W)与(nW)位置算符 WITH(W),前后词的顺序不能颠倒,也不能插入词,但允许有空格或标点符号。例:information(W)retrieval只可检索出information retrieval,(2)()(N)算符)算符 A (N) B表示在此算符的两侧的检索词必须紧密相连,词间不能插人任何单词,但词序可以颠倒。 (nN)算符算符则表示在

41、两个检索词之间可以插入则表示在两个检索词之间可以插入n个单词,并且这两个词的词序可以个单词,并且这两个词的词序可以颠倒。颠倒。 economic (2N) recovery 可检出:可检出:economic recovery, recovery of the economy, recovery from economicSoftware (2N)Engineering 4)短语检索(Phrase Search 或 Exact Search)又称为精确检索短语用“”表示,检索出与“”内形式完全相同语言,以提高检索的精度和准确度,因而有人称之为“精确检索”。例如 “沁园春雪” “World Tra

42、de Organization” “George W. Washington”例如毛泽东撰写的“沁园春雪”5限定检索(Field Limiting) 1 是对检索词范围(时间、国别、语种、信息类型等)进行约束或压缩的方法,它大多通过检索系统的限制符号或限制指令来实现。 例如数据库的字段限制检索,限定的方法一般是把指定字段的标识符(代码)作为后缀,加到检索词或检索式之后。 例如:super conducing magnets/DE,TI,AB DE(descriptors)叙词 TI(title)篇名 AB(absbact)文摘 (1)字段限定检索(Field Limiting) 组成数据库的最

43、小单位是记录, 一条完整记录中的每一个著录事项为字段。 文献型数据库的记录基本包括下列字段: 篇(题)名字段(Title, TI) 文摘字段(Abstract, AB) 关键词字段(Keword ,kw)(1)字段限定检索(Field Limiting) 著者字段(Author, AU)、著者机构字段(corporate source , CS )、 刊名字段(journal name, JN)、出版年字段(publication year, PY)、 文献类型字段(document type, DT)、语种字段(language, LA)、 分类号字段(classification, CC)。其它限

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论