




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二讲第二讲 检索原理检索原理第一节第一节 信息检索的基本原理信息检索的基本原理 信息检索信息检索(Information RetrievalInformation Retrieval),是),是指将信息按一定的方式组织和存贮起来,并根据指将信息按一定的方式组织和存贮起来,并根据信息用户的信息需求查找所需信息的过程和技术,信息用户的信息需求查找所需信息的过程和技术,所以信息检索的全称又叫所以信息检索的全称又叫“信息存贮与检索信息存贮与检索”(Information Storage and RetrievalInformation Storage and Retrieval)。信)。信息检索又叫
2、息检索又叫情报检索情报检索或或文献检索文献检索。 文献信息检索文献信息检索是指从文献信息集合中查找是指从文献信息集合中查找所需文献或文献中包含的信息内容的过程。所需文献或文献中包含的信息内容的过程。存存 储储检检 索索原始文献原始文献加工整理加工整理数据库数据库提提 问问检检 索索输输 出出三、三、文献信息检索的分类(文献信息检索的分类(按其检索对象按其检索对象 ) 文献检索(文献检索(Document RetrievalDocument Retrieval) 文献信息检索文献信息检索 数据检索(数据检索(Data RetrievalData Retrieval) 事实检索(事实检索(Fact
3、 RetrievalFact Retrieval) 文献检索是以文献检索是以文献全文文献全文(或文献线(或文献线索、文摘)为检索对象的一种检索,索、文摘)为检索对象的一种检索,凡是查找某一主题、学科、时代、凡是查找某一主题、学科、时代、地区、著者、文种的有关文献均属地区、著者、文种的有关文献均属于这一范畴。于这一范畴。是以是以数值或图表数值或图表形式表示的数据为对形式表示的数据为对象的检索。例如,查找某一数学公式、象的检索。例如,查找某一数学公式、数据图表、某种材料的成分、性能等。数据图表、某种材料的成分、性能等。 是以事实作为检索对象,查找用户所是以事实作为检索对象,查找用户所需的描述性需的
4、描述性事实事实,其检索对象为机构、,其检索对象为机构、企业、人物的基本情况、历史变迁等。企业、人物的基本情况、历史变迁等。 也叫传统信息检索,是利用各种印刷型检索工具来查也叫传统信息检索,是利用各种印刷型检索工具来查找文献的一种方法。找文献的一种方法。 也叫现代信息检索,是指利用计算机和网络来处理和也叫现代信息检索,是指利用计算机和网络来处理和查找文献信息的检索方式。查找文献信息的检索方式。 http:/ 主要是指文献的题名(包括:书名、期刊名、篇名等)、著主要是指文献的题名(包括:书名、期刊名、篇名等)、著者姓名、研究机构、出版者、科技报告的报告号、专利号等。在者姓名、研究机构、出版者、科技
5、报告的报告号、专利号等。在检索工具中,文献的外表特征常常按名称、号码等序列排,方便检索工具中,文献的外表特征常常按名称、号码等序列排,方便易懂,检索较为方便。易懂,检索较为方便。 是指文献所论及的主题、观点、见解和结论等等,或者说,文是指文献所论及的主题、观点、见解和结论等等,或者说,文献所研究的是哪一学科、哪一专业的问题;研究的是哪一主题的献所研究的是哪一学科、哪一专业的问题;研究的是哪一主题的问题。由此可见,文献的内容特征常常需要分析研究才能得出。问题。由此可见,文献的内容特征常常需要分析研究才能得出。 (如:发展中国家(如:发展中国家兔的饲养、一个半劳动力)兔的饲养、一个半劳动力)是用来
6、加强文献标引人员和文献检索人员之间的联系,是用来加强文献标引人员和文献检索人员之间的联系,解决标引、存贮和检索、利用的矛盾,达到存贮和检索的一致性,解决标引、存贮和检索、利用的矛盾,达到存贮和检索的一致性,以提高检索效率的一种人工语言。以提高检索效率的一种人工语言。因此,我们常说,检索语言是因此,我们常说,检索语言是检索人员与检索工具之间的桥梁。因为自然语言本身存在大量的检索人员与检索工具之间的桥梁。因为自然语言本身存在大量的词汇歧义和语义歧解现象,不能直接用作存储和检索中的语言词汇歧义和语义歧解现象,不能直接用作存储和检索中的语言 (如:发展中国家兔的饲养、一个半劳动力、和服务)(如:发展中
7、国家兔的饲养、一个半劳动力、和服务)三、检索语言的种类三、检索语言的种类 分类语言分类语言 主题语言主题语言 号码语言号码语言 题名语言题名语言 著者语言著者语言 目前应用较多的是:分类语言中体系分类语言和主题语言中的标目前应用较多的是:分类语言中体系分类语言和主题语言中的标题语言、单元词语言、叙词语言和关键词语言。题语言、单元词语言、叙词语言和关键词语言。 3.分类表四、体系分类语言四、体系分类语言 是按照一定的观点,是按照一定的观点,以学科分类为基础以学科分类为基础,结合文献,结合文献内容特征,运用概念划分方法,按知识门类的逻辑次序,内容特征,运用概念划分方法,按知识门类的逻辑次序,从总到
8、分,从一般到具体,从低级到高级,层层划分,从总到分,从一般到具体,从低级到高级,层层划分,逐渐展开的一个逐渐展开的一个层累制层累制号码系统,是用分类号表达文献号码系统,是用分类号表达文献议题概念的检索语言。该语言对各级类目以固定组配形议题概念的检索语言。该语言对各级类目以固定组配形式供书目控制时使用。式供书目控制时使用。 1.1.体系分类法的原理体系分类法的原理 体系分类法是一种直接体现知识分类的等级制概念体系分类法是一种直接体现知识分类的等级制概念的标识系统。它是运用逻辑分类的原理,按照文献所属的标识系统。它是运用逻辑分类的原理,按照文献所属的学科、专业及特征,对文献进行系统化组织的一种方的
9、学科、专业及特征,对文献进行系统化组织的一种方法。它是使用最普遍的一种方法。法。它是使用最普遍的一种方法。如:如:TP TP 自动化技术自动化技术 计算技术计算技术 TP1 TP1 自动化基础理论自动化基础理论 TP2 TP2 自动化技术及设备自动化技术及设备 TP3 TP3 计算技术计算技术 计算机计算机 TP9 TP9 计算机应用计算机应用 TP91 TP91 信息处理信息处理 .7 .7 机器辅助技术机器辅助技术 .72 .72 机器辅助设计机器辅助设计 自动设计自动设计 CAD CAD .73 .73 机器辅助制造机器辅助制造 CAM CAM .75 .75 机器辅助计算机器辅助计算
10、TP93 TP93 计算机网络计算机网络 .1 .1 局部网络局部网络 .2 .2 远程网络远程网络 . 2.2.体系分类法的结构体系分类法的结构 我国广泛使用的中国图书馆图书分类法简称中图法,就是一种典型我国广泛使用的中国图书馆图书分类法简称中图法,就是一种典型的体系分类法,它由编制说明,基本大类,简表,详表,辅表五个部分组成。的体系分类法,它由编制说明,基本大类,简表,详表,辅表五个部分组成。现以现以19991999年出版的第四版中图法为例,说明体系分类法的结构。年出版的第四版中图法为例,说明体系分类法的结构。 (1) (1)编制说明:编制说明:包括该分类法的编制过程,所依据的编制原则、部
11、类及包括该分类法的编制过程,所依据的编制原则、部类及大类的设置和次序的理由,对各种分类问题的处理方法,标记方法,使用方大类的设置和次序的理由,对各种分类问题的处理方法,标记方法,使用方法等。法等。 (2)(2)基本大类:基本大类:采用五个基本部类。即马克思、采用五个基本部类。即马克思、 列宁主义毛泽东思想,列宁主义毛泽东思想,哲学,社会科学,自然科学,综合性图书。在此基础上组成了哲学,社会科学,自然科学,综合性图书。在此基础上组成了2222个基本大类个基本大类(一级类目)(一级类目) (3)(3)简表简表 由三级类目组成,是中图法的基本类目表,浏览简表可由三级类目组成,是中图法的基本类目表,浏
12、览简表可以很快了解整个分类体系的概貌,归类查表时只有从简表入手查详表,才能以很快了解整个分类体系的概貌,归类查表时只有从简表入手查详表,才能做到准确快速。做到准确快速。 (4)(4)详表详表 又叫主表,由类号、类目和注释组成。又叫主表,由类号、类目和注释组成。 (5)(5)辅表辅表 也叫复分表,也叫复分表, 用来对主表中所例举的类目进行细分,可分用来对主表中所例举的类目进行细分,可分为为“通用复分表通用复分表”和和“专用复分表专用复分表”。 基本大类表基本大类表 类目表类目表 简表简表 详表详表 复分表复分表 编制说明编制说明 中图法中图法的内容结构的内容结构 说说 明明 使用说明使用说明 类
13、目注释类目注释 索索 引引 中图法中图法体系结构体系结构基本大类 简表详表复分表主题字顺组织法(简称主题法主题字顺组织法(简称主题法 )所谓主题法,就是以自然语言中的词语或规范化的词语作为揭示文献所谓主题法,就是以自然语言中的词语或规范化的词语作为揭示文献主题的标识,并以此标识编排组织和查找文献的排检方法。主题的标识,并以此标识编排组织和查找文献的排检方法。 标题词法标题词法 单元词法单元词法 关键词法关键词法 叙词法叙词法 它是以标题词它是以标题词( (规范的事物名称、名规范的事物名称、名词术语词术语) )作为文献主题内容的标识和作为文献主题内容的标识和检索标识的主题法。检索标识的主题法。它
14、主张用最基本的、字面上不再分的它主张用最基本的、字面上不再分的词汇词汇单元词做主题词。单元词从单元词做主题词。单元词从文献内容中抽出,再经规范,能表达文献内容中抽出,再经规范,能表达一个独立的概念。一个独立的概念。 关键词法是直接从文献题名、文摘或全关键词法是直接从文献题名、文摘或全文中抽取出来的有实际检索意义的信息文中抽取出来的有实际检索意义的信息单元单元( (关键词关键词) )作为主题词。作为主题词。 叙词法是以叙词做主题词的主题法。叙词法是以叙词做主题词的主题法。叙词是一种以概念为基础的,经过优叙词是一种以概念为基础的,经过优选的规范化名词术语,具有单义性,选的规范化名词术语,具有单义性
15、,组配性能好的特性。组配性能好的特性。 五、主题语言:标题词语言五、主题语言:标题词语言 标题词语言:是最早出现的一种主题法类型。是以标题标题词语言:是最早出现的一种主题法类型。是以标题词作为文献内容标识和检索依据的主题语言。词作为文献内容标识和检索依据的主题语言。标题词:是从文献题目和内容中抽选出来,经过规范化标题词:是从文献题目和内容中抽选出来,经过规范化处理,用以描述文献内容特征的词,词组或短语。一般处理,用以描述文献内容特征的词,词组或短语。一般分为主、副标题词。分为主、副标题词。1.1.标题词法的原理标题词法的原理 是从科技人员熟悉的大量科技名词术语中,选出具是从科技人员熟悉的大量科
16、技名词术语中,选出具有实质性意义的科技名词术语,经过规范化处理,作为有实质性意义的科技名词术语,经过规范化处理,作为标识,来直接表达文献所论及的事物标识,来直接表达文献所论及的事物主题,而不管主题,而不管该文献是从哪个角度,哪个学科来论述该事物主题的,该文献是从哪个角度,哪个学科来论述该事物主题的,并将全部标识按字顺排列,而不管各个标识所表达的事并将全部标识按字顺排列,而不管各个标识所表达的事物物主题之间的关系。主题之间的关系。 主标题词的构成方式主标题词的构成方式正叙式:将事物的名称、现象、方法或过程和名词正叙式:将事物的名称、现象、方法或过程和名词术语直接作为主标题词。如术语直接作为主标题
17、词。如DATA PROLESSINGDATA PROLESSING倒叙式:是在事物的名称或方式、过程的名词后加倒叙式:是在事物的名称或方式、过程的名词后加上进一步表示该事物或过程的特征、类型的限定词,上进一步表示该事物或过程的特征、类型的限定词,中间用逗号分开的方式构成。如中间用逗号分开的方式构成。如PIPE,STEELPIPE,STEEL并列式:是将两种互有联系而又各自独立的事物或并列式:是将两种互有联系而又各自独立的事物或概念的名词,以并列的方式构成的主题词。如:概念的名词,以并列的方式构成的主题词。如:metal and alloysmetal and alloys副标题词是用来修饰、限
18、定和细分主标题词,经过副标题词是用来修饰、限定和细分主标题词,经过规范化的词、词组或短语。规范化的词、词组或短语。2.2.标题词的规范化处理标题词的规范化处理规范化处理:指对标题词中的同义词、近义词、多义规范化处理:指对标题词中的同义词、近义词、多义词、反义词等进行管理和控制,使标题词能满足准确词、反义词等进行管理和控制,使标题词能满足准确性和通用性的要求,以达到表述文献主题概念的唯一性和通用性的要求,以达到表述文献主题概念的唯一性。性。(1)(1)同义词同义词 a. a.新名与旧名,一般选用新名新名与旧名,一般选用新名 b. b.全称与全称与简称简称 一般选准确、通用为原则一般选准确、通用为
19、原则 c. c.学名与俗名学名与俗名 ,一,一般用学名般用学名 d. d.音译与意译,一般用意译音译与意译,一般用意译(2)(2)近义词近义词 合并作为概念的等同关系,如实验和试验合并作为概念的等同关系,如实验和试验(3)(3)反义词反义词 一般用正义词肯定词一般用正义词肯定词(4)(4)多义词多义词 一般用加上概念限制的方法一般用加上概念限制的方法六、主题语言:单元词语言六、主题语言:单元词语言 是以单元词作为文献内容标识和检索依据的主题语言。是以单元词作为文献内容标识和检索依据的主题语言。 单元词:是从文献中抽取出来,经过规范化的,能描述文献所单元词:是从文献中抽取出来,经过规范化的,能描
20、述文献所论及的事物论及的事物主题的那些最小,最基本的词汇单位。主题的那些最小,最基本的词汇单位。 1.1.单元词法的原理单元词法的原理 通过用单元词表达的单元概念的组合或组配,可以表达一个完通过用单元词表达的单元概念的组合或组配,可以表达一个完整的,复杂的概念。整的,复杂的概念。2.2.单元词法的特点单元词法的特点 优点:具有较强的语义表达能力、有利于主题因素复杂的多维优点:具有较强的语义表达能力、有利于主题因素复杂的多维概念文献的标引和检索。概念文献的标引和检索。 缺点:在组配时容易产生虚假组配,影响检索的准确性。如缺点:在组配时容易产生虚假组配,影响检索的准确性。如“机床机床”,“检修检修
21、”产生产生“机床的检修机床的检修”和和“检修用机床检修用机床”两种两种概念。概念。七、主题语言:叙词语言七、主题语言:叙词语言 叙词:是描述文献内容特征的知识单元,即在叙词:是描述文献内容特征的知识单元,即在概念概念上不上不能再分的基本概念。能再分的基本概念。1.1.叙词法的原理叙词法的原理概念组配,是将叙词表中两个以上的叙词,用一定的关概念组配,是将叙词表中两个以上的叙词,用一定的关系符号把它们连接在一起,以扩大或缩小其表达事物概系符号把它们连接在一起,以扩大或缩小其表达事物概念的本质属性。用以准确描述文献的议题内容。它是以念的本质属性。用以准确描述文献的议题内容。它是以逻辑运算方式来表达的
22、。逻辑运算方式来表达的。 2 2、叙词法优点、叙词法优点(1)(1)组配准确,标引能力强;组配准确,标引能力强;(2)(2)结构完备,词汇控制严格;结构完备,词汇控制严格;(3)(3)适合多途径检索,检索效率高;适合多途径检索,检索效率高;(4)(4)对检索系统的适应能力强;(能同时适应于标识对检索系统的适应能力强;(能同时适应于标识单元和文献单元检索方式,适应计算机检索系统和单元和文献单元检索方式,适应计算机检索系统和手工检索系统)手工检索系统)3 3、叙词法的缺点、叙词法的缺点 (1 1)词汇控制要求严格,词表编制和管理难度大,需)词汇控制要求严格,词表编制和管理难度大,需要花费较多人力、
23、物力;要花费较多人力、物力; (2 2)文献标引须在概念分析基础上进行,标引规则较)文献标引须在概念分析基础上进行,标引规则较复杂,标引难度大,速度慢;复杂,标引难度大,速度慢; (3 3)用户难以熟悉词表及标引规则,给使用带来不便。)用户难以熟悉词表及标引规则,给使用带来不便。 4.4.汉语主题词表简介汉语主题词表简介它是一种将自然语言转换为检索语言的叙词控制工具,它是一种将自然语言转换为检索语言的叙词控制工具,是叙词语言的具体表现。广泛用于编制中文检索工具和是叙词语言的具体表现。广泛用于编制中文检索工具和检索中文科技文献,它共收词检索中文科技文献,它共收词108568108568个(正式叙
24、词个(正式叙词9115891158,非正式叙词,非正式叙词1741017410),词族),词族37073707个。都是各学科个。都是各学科中有一定检索频率,并能汇集一定文献量或者具有组配中有一定检索频率,并能汇集一定文献量或者具有组配意义的最基本的名词或名词性词组。全部词表按社会科意义的最基本的名词或名词性词组。全部词表按社会科学和自然科学分别编辑。共出版学和自然科学分别编辑。共出版3 3卷卷1010分册,各分册均分册,各分册均由主表(字顺表)、附表、词族索引、范畴索引和英汉由主表(字顺表)、附表、词族索引、范畴索引和英汉对照索引个部分组成。对照索引个部分组成。例:叙词的词汇控制例:叙词的词汇
25、控制 (1 1)语义同义词:原子能工业(叙词)语义同义词:原子能工业(叙词) 核工业(入口词)核工业(入口词)(2 2)产品型号与代号之间:)产品型号与代号之间:SS-1SS-1导弹(叙)导弹(叙) “ “飞毛腿飞毛腿”导弹(入)导弹(入)(3 3)全称与简称之间:北京大学(叙)全称与简称之间:北京大学(叙) 北大(入)北大(入)(4 4)学名与俗名之间:玉米(叙)包谷(入)学名与俗名之间:玉米(叙)包谷(入) 玉蜀黍(入)玉蜀黍(入)(5 5)部分近义词之间:殖民地(叙)部分近义词之间:殖民地(叙) 非殖民地(入)非殖民地(入)(6 6)部分反义词之间:本质属性(叙)非本质属性(入)部分反义
26、词之间:本质属性(叙)非本质属性(入)(7 7)上位词置代:水污染(叙)上位词置代:水污染(叙) 地表水污染(入)地表水污染(入) 地下水污染(入)地下水污染(入) 水体污染(入)水体污染(入) 八、主题语言:关键词语言八、主题语言:关键词语言关键词:直接从文献的题名、文摘或正文中抽选出来,关键词:直接从文献的题名、文摘或正文中抽选出来,对表达文献主题具有实质意义、未经规范化处理的自由对表达文献主题具有实质意义、未经规范化处理的自由词汇,没有固定词表,属散组配语言。词汇,没有固定词表,属散组配语言。通常使用禁用词表(停用词表)(通常使用禁用词表(停用词表)(stop-liststop-list
27、): :指那些指那些词频较高,通常是一些虚词和没有实际检索意义的词,词频较高,通常是一些虚词和没有实际检索意义的词,如冠词、介词、连词、代词等等。如汉语中的如冠词、介词、连词、代词等等。如汉语中的“的的”“”“是是”,英语中的,英语中的a,an,the,this,that,or, and, a,an,the,this,that,or, and, in,on,with,they,it etc.in,on,with,they,it etc.1.1.关键词法的原理关键词法的原理 从文献题目,摘要和正文中抽选出具有实质意义的从文献题目,摘要和正文中抽选出具有实质意义的未经规范化处理,并能表达文献主题内
28、容特征的名词术未经规范化处理,并能表达文献主题内容特征的名词术语来作检索标识的。语来作检索标识的。2.2.关键词语言的应用关键词语言的应用在文献数据库和网络搜索引擎中使用的关键词是由计算机计算机通过词频统计自动产生的。而我们在期刊文献、会议文献中看到的关键词是由著者著者指定的。 3 3、关键词法的特点(与标题法、叙词法相比)、关键词法的特点(与标题法、叙词法相比)(1 1)关键词属于自然语言,标题词及叙词属于受)关键词属于自然语言,标题词及叙词属于受控语言;控语言;(2 2)关键词词表比标题表、叙词表简单的多,一)关键词词表比标题表、叙词表简单的多,一般不设任何参照,不显示任何词间关系,甚至不
29、附般不设任何参照,不显示任何词间关系,甚至不附带范畴号或分类号,因而篇幅也小得多;带范畴号或分类号,因而篇幅也小得多;(3 3)关键词通常使用禁用词表()关键词通常使用禁用词表(stop-liststop-list), ,而而标题法或叙词法使用许用词表(标题法或叙词法使用许用词表(go-listgo-list)。后者)。后者只允许用实际出现在词表上的那些词作标引词,而只允许用实际出现在词表上的那些词作标引词,而前者只允许所有不曾列入禁用词表的词作标引词。前者只允许所有不曾列入禁用词表的词作标引词。 5 5、关键词法的缺点、关键词法的缺点 (1 1)由于关键词往往直接来自于文献的题名,这样)由于
30、关键词往往直接来自于文献的题名,这样文献题名的质量直接决定用关键词语言编制检索工具文献题名的质量直接决定用关键词语言编制检索工具的质量(质量往往不稳定,会导致漏检)。的质量(质量往往不稳定,会导致漏检)。 (2 2)缺乏词形、词义方面的控制,降低检全率。)缺乏词形、词义方面的控制,降低检全率。(用户很难把表达同一概念的不同词形的关键词考虑(用户很难把表达同一概念的不同词形的关键词考虑周全)周全) (3 3)关键词语言通常用于计算机抽词标引,由于汉)关键词语言通常用于计算机抽词标引,由于汉语分词难题至今未能攻克,所以往往会切分出很多语分词难题至今未能攻克,所以往往会切分出很多“假词假词” ” ,
31、造成误检。,造成误检。4 4、关键词法的优点、关键词法的优点 (1 1)标引时无需主题分析和查看词表,简便易行,)标引时无需主题分析和查看词表,简便易行,因而降低对标引人员的要求,节省大量人力。因而降低对标引人员的要求,节省大量人力。 (2 2)易于实现检索工具编制过程的计算机化,从而)易于实现检索工具编制过程的计算机化,从而保证通报文献和传递信息的及时性、生产过程的高效保证通报文献和传递信息的及时性、生产过程的高效及低成本。及低成本。 (3 3)能够及时更新词汇,凡是出现在文献上的具有)能够及时更新词汇,凡是出现在文献上的具有检索意义的词汇都可以立即用于标引和检索。检索意义的词汇都可以立即用
32、于标引和检索。 (4 4)由于关键词通常取自于文献的题名和文摘,而)由于关键词通常取自于文献的题名和文摘,而题名及文摘基本上能够反映文献的主题内容,因此关题名及文摘基本上能够反映文献的主题内容,因此关键词语言的专指性优于标题语言和叙词语言,检准率键词语言的专指性优于标题语言和叙词语言,检准率较高。较高。 字面组配与概念组配比字面组配与概念组配比较较 第三节第三节 检索工具检索工具 一、检索工具的概念一、检索工具的概念 是指人们用来报道、存储和查找信息线索的工具。是指人们用来报道、存储和查找信息线索的工具。它是检索标志的集合体,它的基本职能一方面是揭示信它是检索标志的集合体,它的基本职能一方面是
33、揭示信息及其线索,另一方面提供一定的检索手段,使人们可息及其线索,另一方面提供一定的检索手段,使人们可以按照它的规则,从中检索出所需信息的线索。以按照它的规则,从中检索出所需信息的线索。二、检索工具的特征二、检索工具的特征 是用检索标识标引,按照一定的规律编排的文献是用检索标识标引,按照一定的规律编排的文献记录及其索引。对于计算机检索而言,记录及其索引。对于计算机检索而言,检索工具就是检检索工具就是检索系统的文献库即数据库。索系统的文献库即数据库。特征(四个基本条件):特征(四个基本条件):1.1.必须具有丰富的文献记录,即存贮有大量的文献的外必须具有丰富的文献记录,即存贮有大量的文献的外部特
34、征和内容特征部特征和内容特征;2.;2.必须具有必要的必须具有必要的检索标识检索标识(检索检索词词);3.;3.必须具有系统的排序方法必须具有系统的排序方法;4.;4.必须具有多种检索必须具有多种检索途径。途径。 三、检索工具的类型三、检索工具的类型 按处理信息的手段分:按处理信息的手段分:手工检索工具和机械检索工具手工检索工具和机械检索工具 按其报道的学科内容范围分:按其报道的学科内容范围分:包含多学科和综合性的检索工具和仅含单学科的专业包含多学科和综合性的检索工具和仅含单学科的专业性检索工具。性检索工具。 按著录方式分:按著录方式分:目录、题录、文摘和索引。目录、题录、文摘和索引。 二二、
35、检索效果评价、检索效果评价检索效果检索效果(retireval effectivenessretireval effectiveness):指指检索结果的有效程度。检索结果的有效程度。常用指标有:常用指标有:收录范围、查全率、查准率、响收录范围、查全率、查准率、响应时间、用户负担(费用)和输出形式等。其应时间、用户负担(费用)和输出形式等。其中主要是查全率和查准率。中主要是查全率和查准率。 查全率查全率(Recall RatioRecall Ratio)= =检出的相关文献数检出的相关文献数/ /文献库里文献库里相关文献总数相关文献总数* *100%100%即:即:R=a/a+c R=a/a+
36、c * *100%100%查准率查准率(Precision RatioPrecision Ratio)= =检出的相关文献数检出的相关文献数/ /检出检出的文献总数的文献总数* *100%100%即:即:P=a/a+b P=a/a+b * *100%100%漏检率漏检率= =未检出的相关文献数未检出的相关文献数/ /文献库里相关文献总数文献库里相关文献总数* *100%100%即:即:= c/a+c = c/a+c * *100%100%误检率误检率= =检出的非相关文献数检出的非相关文献数/ /检出的文献总数检出的文献总数* *100%100%即:即:=b/a+b =b/a+b * *100
37、%100% 查全率查全率+ +漏检率漏检率=1=1 查准率查准率+ +误检率误检率=1 =1 三、提高检索效率措施:三、提高检索效率措施:1 1选好检索工具;选好检索工具;2 2准确使用检索工具;准确使用检索工具;3 3用泛指性强的检索语言来提高查全率(模糊);用泛指性强的检索语言来提高查全率(模糊);4 4用专指性强的检索语言来提高查准率(精确);用专指性强的检索语言来提高查准率(精确);5. 5. 善于利用检索工具的各种辅助索引。善于利用检索工具的各种辅助索引。 一、课题分析一、课题分析目的是了解课题检索目的和范围,目的是了解课题检索目的和范围,明确课题要解决的实明确课题要解决的实质问题质
38、问题(课题涉及的学科范围,所需信息的内容及特征、(课题涉及的学科范围,所需信息的内容及特征、年代、类型,课题对查准、查全的要求),这是制定检年代、类型,课题对查准、查全的要求),这是制定检索策略的根本出发点,也是检索效率高低和成败的关键。索策略的根本出发点,也是检索效率高低和成败的关键。 二、选择检索工具或检索系统二、选择检索工具或检索系统 根据检索课题的主题及学科范围选择对口的检索系统根据检索课题的主题及学科范围选择对口的检索系统(数据库),可从文献的类型(数据库),可从文献的类型(如十大文献)(如十大文献)、语种、语种、出版的时间等方面来考虑出版的时间等方面来考虑 三、确定检索途径和检索策略三、确定检索途径和检索策略 反映内容特征的反映内容特征的分类、主题途径分类、主题途径和反映外部特征的和反映外部特征的著者、著者、号码、题名途径。号码、题名途径。分类途径分类途径 按文献所属的学科类型来查找,便于从学按文献所属的学科类型来查找,便于从学科体系的角度获得较系统的文
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025新风系统购销合同范本
- 2025年:探讨合作原则下的租赁合同与违约责任研究
- 2025北京租赁合同模板
- 个人经营合伙合同样本
- 2025湖北省非全日制用工合同协议范本
- 2025人力资源外包合同书
- 公寓油烟隔绝方案范本
- 蜘蛛车专项施工方案
- 出租建筑用地合同标准文本
- 2025年上海市购销合同范本购销合同
- 框架结构房屋的流水施工
- 第三章 装配式混凝土预制构件生产工艺
- XX项目阳光分包试点工作方案参考方案
- (完整版)数字电子技术基础教案
- 附九江学院第四届教工男子乒乓球单打赛程表
- 积极心理学-完整版教学课件
- 物资仓库防洪防汛应急预案
- .三坐标测量员技能考核考试题答案
- 大学语文课程建设与改革实施方案
- 【上海市静安区宝山路街道社区养老问题调查报告】
- 公文筐测验(案例题解示范)
评论
0/150
提交评论