




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 科技文献检索与利用哈工大图书馆信息咨询部参考书参考书1 1 于双城等,科技信息检索与利用,北京:清华大学出版社,于双城等,科技信息检索与利用,北京:清华大学出版社,201220122 2 于光等,信息检索,哈尔滨:电子工业出版社,于光等,信息检索,哈尔滨:电子工业出版社,201020103 3 徐庆宁等,信息检索与利用,上海:华东理工大学出版社,徐庆宁等,信息检索与利用,上海:华东理工大学出版社,200420044 4 符绍宏等,因特网信息资源检索与利用,北京:清华大学符绍宏等,因特网信息资源检索与利用,北京:清华大学出版社,出版社,20002000成绩评定方法成绩评定方法1 1 上课考勤占
2、上课考勤占 30%30%2 2 检索实习作业检索实习作业 70%70% 教学大纲教学大纲1 1、计算机信息检索基础知识(、计算机信息检索基础知识(2 2个学时)个学时)2 2、国外两大文摘数据库的检索与利用(、国外两大文摘数据库的检索与利用(2 2个学时)个学时)3 3、引文索引及其检索方法(、引文索引及其检索方法(2 2个学时)个学时)4 4、特种文献资源的检索与利用(、特种文献资源的检索与利用(2 2个学时)个学时)5 5、专利文献信息资源的检索与利用(、专利文献信息资源的检索与利用(2 2个学时)个学时)6 6、外文全文数据库的检索与利用(、外文全文数据库的检索与利用(2 2个学时)个学
3、时) 学习文献检索课的目的学习文献检索课的目的信息检索既是一门科学,又是一门技巧,在某种程度信息检索既是一门科学,又是一门技巧,在某种程度上也是一门艺术。上也是一门艺术。1 1、拓宽获取与利用信息的途径。、拓宽获取与利用信息的途径。2 2、可以获取学术动态,寻找未知问题的答案。、可以获取学术动态,寻找未知问题的答案。 3 3、写论文、做课题能积极主动有意识地利用信息。、写论文、做课题能积极主动有意识地利用信息。4 4、培养从主要记忆信息到主要应用信息和创新信息的、培养从主要记忆信息到主要应用信息和创新信息的 能力。能力。u以最少的时间、精力获取自己需要的信息学习文献检索课的目的学习文献检索课的
4、目的Where Where is it is it ?获取信息的总路线获取信息的总路线 计算机信息检索技术计算机信息检索技术 计算机信息检索的常用方法与步骤计算机信息检索的常用方法与步骤 我馆引进资源总体介绍我馆引进资源总体介绍 网络搜索引擎的利用网络搜索引擎的利用计算机信息检索基础知识计算机信息检索基础知识科技文献的定义科技文献的定义 记录有科技信息知识的纸张、胶片、磁带、磁盘、光盘以记录有科技信息知识的纸张、胶片、磁带、磁盘、光盘以及一些网络资源,称为科技文献。及一些网络资源,称为科技文献。 计算机信息检索技术计算机信息检索技术文献的类型文献的类型 按文献的出版形式划分按文献的出版形式划分
5、(1 1)科技图书)科技图书 (6 6)科技报告)科技报告(2 2)科技期刊)科技期刊 (7 7)标准文献)标准文献(3 3)会议文献)会议文献 (8 8)政府出版物)政府出版物(4 4)专利文献)专利文献 (9 9)科技档案)科技档案(5 5)学位论文)学位论文 (1010)产品样本)产品样本文献的类型文献的类型 按文献的出版形式划分按文献的出版形式划分(1 1)科技图书)科技图书 是对已发表的科研成果,生产技术和经验总结性的概括和论是对已发表的科研成果,生产技术和经验总结性的概括和论述。是存储和传播科学文化知识的主要载体。述。是存储和传播科学文化知识的主要载体。阅读型阅读型 :教科书:教科
6、书(Textbook)(Textbook)、专著、专著(Monograph)(Monograph)、 文集文集(Anthology)(Anthology)等等 工具性:工具性: 词典、百科全书及手册等词典、百科全书及手册等著录格式:(版权页)书名、作者、内容、出版社、著录格式:(版权页)书名、作者、内容、出版社、 出版时间、价格、出版时间、价格、 页次、页次、ISBNISBN号号特点:特点: 带有总结性、成熟定性(内容详实)带有总结性、成熟定性(内容详实) 传授知识,而不是报道最新信息(发表滞后)传授知识,而不是报道最新信息(发表滞后) (2 2)科技期刊)科技期刊 (journal, per
7、iodicaljournal, periodical) 采用统一名称的周期性出版刊物。采用统一名称的周期性出版刊物。 特特 点:名称固定点:名称固定 有连续的卷、年月顺序号有连续的卷、年月顺序号 数量大,内容丰富数量大,内容丰富; ; 出版周期短,报道速度快出版周期短,报道速度快; ; 在科学家和专家们所利用的全部科在科学家和专家们所利用的全部科 技信息中,由期刊提供的占技信息中,由期刊提供的占70%70%左右。左右。 期刊是获取信息的最重要来源。期刊是获取信息的最重要来源。 著录格式:刊名、卷、期、年、月、页次、著录格式:刊名、卷、期、年、月、页次、ISSNISSN号号 ISSN 1005-
8、1805 Vol 26 No2; V26 n2; 26(2) EI数据库举例:数据库举例:(3 3)会议文献)会议文献是科技人员在各级学术会议上,交流科技新成果、新进展及发是科技人员在各级学术会议上,交流科技新成果、新进展及发展趋势的讨论记录。展趋势的讨论记录。特点:内容新颖、传递及时、针对性强特点:内容新颖、传递及时、针对性强著录格式:会议名称、会议地址、会期、主办单位。著录格式:会议名称、会议地址、会期、主办单位。conference(大会)、(大会)、meeting(小型会议)、(小型会议)、symposium(讨论会)、(讨论会)、proceeding(会议录)、(会议录)、paper
9、(单篇论文)、(单篇论文)、transaction(学报、会议记(学报、会议记录)录)等。等。 IEEE(The Institute of Electrical and Electronic Engineers)最大的电子、工程类的专业技术学会,宗旨,召开各种学术会议,最大的电子、工程类的专业技术学会,宗旨,召开各种学术会议,主持编辑多种出版物,期刊几百种,标准:主持编辑多种出版物,期刊几百种,标准:1000多个,会议多个,会议1000多个多个最大的电子、工程最大的电子、工程类信息源类信息源例如:例如:图书馆收藏地点图书馆收藏地点 一区五楼一区五楼网上万方和网上万方和CNKI有专门的会议论文数
10、据库有专门的会议论文数据库EI中会议文献举例:中会议文献举例:(4 4)科技报告)科技报告是科研成果的总结或各阶段进展情况的实际记录。有科研项是科研成果的总结或各阶段进展情况的实际记录。有科研项目的研究方案、实验记录、实验数据、图表等。目的研究方案、实验记录、实验数据、图表等。 特点:独立成册特点:独立成册 ;内容新颖;内容新颖 ;内容详实专深;保密性;内容详实专深;保密性;著录格式:报告名称、年代、顺序号。著录格式:报告名称、年代、顺序号。美国政府四大报告美国政府四大报告:PB:PB报告报告 ADAD报告报告 NASANASA报告报告 DOEDOE报告报告 (NTISNTIS、NTRLNTR
11、L)PB报告报告 (美国商务出版局美国商务出版局) PB+年代年代+顺序号顺序号 民用工程、科学技术、城市规划、环保、生物医学等民用工程、科学技术、城市规划、环保、生物医学等AD报告报告 (美国军事国防部)(美国军事国防部) AD+A(B、C .)+顺序号顺序号 A 非密公开非密公开 B 非密限制非密限制 C 绝密绝密 机密机密 导弹、火箭、遥感、雷达、高能燃料等导弹、火箭、遥感、雷达、高能燃料等 NASA报告报告 (美国宇航局)(美国宇航局) N+年代年代+顺序号顺序号 空间动力学、飞行器及结构材料、试验设备、飞行器制导、航天与宇宙飞行空间动力学、飞行器及结构材料、试验设备、飞行器制导、航天
12、与宇宙飞行 DOE报告报告 (美国能源部)(美国能源部) DE+年代年代+顺序号顺序号 涉及核能、原子能、核安全、风能、电能和能源管理系统的报告。涉及核能、原子能、核安全、风能、电能和能源管理系统的报告。 (5 5)专利文献)专利文献 是一切与专利制度有关的专利文件的统称。如专利说明书和是一切与专利制度有关的专利文件的统称。如专利说明书和专利请求书。专利文献反映了当前最新的技术成果。专利请求书。专利文献反映了当前最新的技术成果。 专利文献识别:国别代码专利文献识别:国别代码+ +专利号专利号 中国专利:中国专利:CN97223700.3CN97223700.3 美国专利:美国专利:US6691
13、162 US6691162 (6 6)学位论文)学位论文作者为获取某种学位而撰写的论文称之为学位论文。作者为获取某种学位而撰写的论文称之为学位论文。可分为学士、硕士、博士三种形式。可分为学士、硕士、博士三种形式。著录格式:学校名称、授予学位学校、导师姓名、地址著录格式:学校名称、授予学位学校、导师姓名、地址 时间、页次时间、页次特点:硕士、博士论文具有较高的参考价值特点:硕士、博士论文具有较高的参考价值 一般偏重于理论,附有大量的参考文献,一般偏重于理论,附有大量的参考文献, 借此可以看出有关专题的发展,一般不出版发行,借此可以看出有关专题的发展,一般不出版发行, 而是保存在授予单位的图书馆里
14、而是保存在授予单位的图书馆里。万方中学位论文全文库和万方中学位论文全文库和CNKICNKI中优秀博硕论文全文库中优秀博硕论文全文库PQDTPQDT国外博硕论文全文库国外博硕论文全文库(7 7)标准文献)标准文献是对工农业产品及工程建设的质量、规格及其检验方法等所是对工农业产品及工程建设的质量、规格及其检验方法等所做的技术上的规定。做的技术上的规定。可划分为:可划分为:ISOISO(国际标准)、国家标准、机构和企业标准(国际标准)、国家标准、机构和企业标准著录格式:标准代号、种次号和公布年代著录格式:标准代号、种次号和公布年代(8 8)政府出版物)政府出版物 (略)(略)是各国政府部门及其设立的
15、专门机构所发表、出版的文件。是各国政府部门及其设立的专门机构所发表、出版的文件。(9 9)科技档案)科技档案 (略)(略)是科研生产活动中形成的有具体事物对象的技术文件、图纸、是科研生产活动中形成的有具体事物对象的技术文件、图纸、图表、照片和原始记录等的总称。图表、照片和原始记录等的总称。(1010)产品资料)产品资料 (略)(略)是厂商为推销产品而印发或放在网站上介绍产品情况的文献,是厂商为推销产品而印发或放在网站上介绍产品情况的文献,包括产品样本、产品说明书、产品目录、厂商介绍等。包括产品样本、产品说明书、产品目录、厂商介绍等。文献的类型文献的类型 按文献的加工程度划分按文献的加工程度划分
16、 零次文献:零次文献:口头信息、未公开发表的文字资料(手稿、书口头信息、未公开发表的文字资料(手稿、书信、笔记、博客等)信、笔记、博客等) ;时效性强;大量而无序;时效性强;大量而无序 一次文献:一次文献:期刊论文、专利文献、科技报告、会议录等;期刊论文、专利文献、科技报告、会议录等;研究人员最终索取的文献类型研究人员最终索取的文献类型 二次文献:二次文献:检索工具;如检索工具;如EIEI、 SCISCI、ISTP ISTP 等等 三次文献:三次文献:选用大量有关的文献,经过综合、分析、研究选用大量有关的文献,经过综合、分析、研究而编写出来的文献。而编写出来的文献。 如:综述、评论、评述、进展
17、、动如:综述、评论、评述、进展、动态等;研究人员最终需要的文献类型态等;研究人员最终需要的文献类型 计算机信息检索技术计算机信息检索技术哈尔滨工业大学文摘数据库哈尔滨工业大学文摘数据库哈尔滨工业大学全文数据库哈尔滨工业大学全文数据库信息检索的基本概念信息检索的基本概念广义广义的信息检索指将信息按一定的方式组织和存储起来,的信息检索指将信息按一定的方式组织和存储起来, 并根据信息用户的需要找出有关的信息的过程和技术。并根据信息用户的需要找出有关的信息的过程和技术。狭义狭义的信息检索指用户找出有关信息的过程。的信息检索指用户找出有关信息的过程。 计算机信息检索技术计算机信息检索技术计算机信息检索技
18、术计算机信息检索技术信息检索语言信息检索语言 是信息组织与信息检索时所用的语言,也称文献检索语言、是信息组织与信息检索时所用的语言,也称文献检索语言、情报语言等。情报语言等。 题题名名语语言言 著著者者语语言言 号号码码语语言言 分分类类语语言言 主主题题语语言言 描描述述文文献献外外部部 特特征征的的语语言言 描描述述文文献献内内部部 特特征征的的语语言言 检检索索语语言言 计算机信息检索技术计算机信息检索技术(一)分类检索语言(一)分类检索语言是按学科范畴和体系来划分事物而构成的一种检索语言,是按学科范畴和体系来划分事物而构成的一种检索语言,集中体现学科的系统性,反映事物的从属、派生关系,
19、集中体现学科的系统性,反映事物的从属、派生关系,由上至下,从总体到局部层层划分、展开,是一种等级体系。由上至下,从总体到局部层层划分、展开,是一种等级体系。用分类号表达概念用分类号表达概念广泛用于图书资料的是图书分类法广泛用于图书资料的是图书分类法 中国图书分类法中国图书分类法 中国科学院图书分类法中国科学院图书分类法 杜威十进制分类法杜威十进制分类法 国际十进制分类法国际十进制分类法 计算机信息检索技术计算机信息检索技术 中国图书馆分类法类目简表中国图书馆分类法类目简表5 5个基本部类个基本部类2222个基本大类个基本大类 马列、毛泽东思想马列、毛泽东思想A A 马列、毛泽东思想马列、毛泽东
20、思想 哲学哲学B B 哲学、宗教哲学、宗教 社会科学社会科学C C 社会科学总论;社会科学总论;D D 政治、法律;政治、法律; E E 军事;军事;F F经济经济G G 文化、科学、教育、体育;文化、科学、教育、体育; H H 语言、文字;语言、文字;I I 文学;文学; J J 艺术;艺术; K K 历史、地理历史、地理 自然科学自然科学N N 自然科学总论;自然科学总论; O O 数理科学和化学;数理科学和化学; P P天文学、天文学、地球科学;地球科学;Q Q生物科学;生物科学; R R医学、卫生;医学、卫生;S S 农业科学农业科学T T 工业技术;工业技术; U U 交通运输;交通
21、运输;V V 航空、航天;航空、航天;X X环境环境科学、劳动保护科学(安全科学)科学、劳动保护科学(安全科学) 综合性图书综合性图书Z Z 综合性图书综合性图书计算机信息检索技术计算机信息检索技术 (一)分类检索语言(一)分类检索语言 TV水水利利工工程程能能源源与与动动力力工工程程TB一般工业技术一般工业技术TB3工程工程材料材料学学(二)主题法检索语言(二)主题法检索语言是利用词语来表达信息资源中论述的主题概念。用来表达是利用词语来表达信息资源中论述的主题概念。用来表达信息内容的词语称为主题词。信息内容的词语称为主题词。主题词:通过文献内容的分析,从中找出那些具有实质意主题词:通过文献内
22、容的分析,从中找出那些具有实质意义的,能够表达事物特征的,并经过规范化处理的词或词义的,能够表达事物特征的,并经过规范化处理的词或词组。组。主题词表是对主题词进行规范化处理的依据,也是文献处主题词表是对主题词进行规范化处理的依据,也是文献处理者和检索者共同参照的依据。理者和检索者共同参照的依据。 计算机信息检索技术计算机信息检索技术关键词、主题词的比较关键词、主题词的比较计算机信息检索技术计算机信息检索技术关键词Keyword主题词Subject未经规范化的名词例如:脚踏车、单车 土豆、洋芋规范化的名词例如:自行车 马铃薯必须是直接从文献或标题中抽出的词汇可以是文献中的词汇,也可以不是外文文献
23、调研是开题前必须做的工作:外文文献调研是开题前必须做的工作:从文中选词检索易漏检或误检从文中选词检索易漏检或误检由于作者的用词习惯不同,会发生如下情况由于作者的用词习惯不同,会发生如下情况:一个概念会有多种表示导致漏检导致漏检 检索时需要收集同义词,费时麻烦且易漏检一个词可以表示多个概念导致误检导致误检cell 细胞、电池cell wn ti 检出的文献中有solar cell, tumor cells等除了用文中词汇检索外:还有无更好的办法? Ei的解决方案:对文献进行主题标引的解决方案:对文献进行主题标引采用规范化词组对文献进行主题标引 做到标引词与概念一一对应 标引词源于词表,故EI的标
24、引词也称受控词如“计算机层析” 这一概念在文中可以有如下表示:CT, computed tomography, computed tomography, computerized tomography, computerised tomography,computer-aided tomograpy EI主题标引时,统一表示为“Computerized Tomography” Ei同时采用受控词和非受控词进行主题标引同时采用受控词和非受控词进行主题标引采用受控词标引采用受控词标引提高主题检索效率提高主题检索效率标引词取自叙词表相应字段EI controlled term,CV EI main
25、heading, MH 非受控词标引字段非受控词标引字段解决词表更新滞后的问题解决词表更新滞后的问题 标引词直接取自文中词,如关键词及摘要 相应字段 uncontrolled term, FL信息检索技术信息检索技术信息检索技术是指利用现代信息检索系统,如联机数信息检索技术是指利用现代信息检索系统,如联机数据库、光盘数据库和网络数据库检索有关信息而采用据库、光盘数据库和网络数据库检索有关信息而采用的相关技术,主要信息检索技术有:的相关技术,主要信息检索技术有:布尔逻辑检索、截词检索、位置检索、字段限定检索布尔逻辑检索、截词检索、位置检索、字段限定检索。计算机信息检索技术计算机信息检索技术 1.
26、1.布尔逻辑检索布尔逻辑检索 布尔逻辑检索算符有以下三种:布尔逻辑检索算符有以下三种: (1 1)逻辑与)逻辑与ANDAND (2 2)逻辑或)逻辑或OR OR (3 3)逻辑非)逻辑非NOTNOT计算机信息检索技术计算机信息检索技术(*)(+)()计算机信息检索技术计算机信息检索技术1 1)逻辑与)逻辑与ANDAND(* *)逻辑与逻辑与ANDAND(* *):这是一种用于交叉概念或限定关系的组):这是一种用于交叉概念或限定关系的组配,可以缩小检索范围,提高查准率。配,可以缩小检索范围,提高查准率。【例例】查找查找“高强度低合金钢高强度低合金钢”方面的文献,可以将概念分解方面的文献,可以将概
27、念分解为:为:“high strength”high strength”、“low alloy”low alloy”和和“steel”steel”三个基三个基本概念。本概念。如用如用A A、B B、C C三个圆分别代表三个圆分别代表“steel”steel”、“high strength”high strength”和和“low alloy”low alloy”,则三圆交叉的斜线部分才是三个检索词同时,则三圆交叉的斜线部分才是三个检索词同时存存在的文献记录。在的文献记录。 A B C steel* hig h stre ng th*low ally 计算机信息检索技术计算机信息检索技术2 2)
28、逻辑或)逻辑或OROR(+ +)逻辑或逻辑或OROR(+ +):这是一种用于并列概念的组配,可以扩大检):这是一种用于并列概念的组配,可以扩大检索范围,避免漏检,提高了查全率。索范围,避免漏检,提高了查全率。【例例】查找有关查找有关“太阳能太阳能”方面的文献,不能确定主题词用方面的文献,不能确定主题词用“sun”sun”或或“solar”solar”,则采用,则采用“或或”组配。如用组配。如用A A、B B两圆分别代表两圆分别代表“sun”sun”或或“solar”solar”,则斜线部分为其中任何一个词或两个词同时存在的,则斜线部分为其中任何一个词或两个词同时存在的文献记录。文献记录。 B
29、A sun solar 计算机信息检索技术计算机信息检索技术3 3)逻辑非)逻辑非NOTNOT()逻辑非逻辑非NOTNOT():用于从原来的检索范围中排除不需要的概):用于从原来的检索范围中排除不需要的概念或影响检索结果的概念。用逻辑非,能够缩小命中文献范念或影响检索结果的概念。用逻辑非,能够缩小命中文献范围,提高查准率。围,提高查准率。【例例】查找查找“不包括核能的能源不包括核能的能源”的文献,用的文献,用A A、B B两圆分别代两圆分别代表表“energy”energy”、“nuclear”nuclear”,斜线部分从,斜线部分从energyenergy中排除了中排除了nuclearnuc
30、lear的文献。的文献。 A B energy-nuclear 布尔逻辑运算的优先执行顺序:Not And Or括号可以改变其执行顺序三个逻辑运算符和括号的运用可以将检索词组配成比较复杂的逻辑提问式,以满足复杂的信息检索的需要.例如:A*(B+C)2. 截词检索截词检索 是将检索词在被认为合适的地方用截词符进行截是将检索词在被认为合适的地方用截词符进行截断的方法。断的方法。 截词符用截词符用?或或*表示,前者通常表示有限截断,后表示,前者通常表示有限截断,后者表示无限截断。者表示无限截断。1)后截断)后截断 例如 输入输入computer*computers, computered, comp
31、uterize, 输入输入computer?computer, computers,computered注意:使用后截断有可能检索出无关词汇,尤其是在注意:使用后截断有可能检索出无关词汇,尤其是在使用无限后截断时,所选词干不能太短,否则将造成使用无限后截断时,所选词干不能太短,否则将造成大量误检,或发生溢出,导致检索失败。大量误检,或发生溢出,导致检索失败。2)前截断)前截断 例如 输入输入*computermicrocomputer, minicomputer, computer3)中间截断)中间截断 例如 analy?eanalyze, analyse wom?nwoman, women
32、它将截词符号置于一个检索词的中间。它对于解决它将截词符号置于一个检索词的中间。它对于解决英、美不同拼法、不规则的单、复数变化等很有用。英、美不同拼法、不规则的单、复数变化等很有用。4)前后截断)前后截断 例如 *Computer?minicomputers它是将前截断和后截断结合使用。它是将前截断和后截断结合使用。计算机信息检索技术计算机信息检索技术3 3位置检索位置检索位置检索又称邻近检索,用位置算符表示检索词之间的位置位置检索又称邻近检索,用位置算符表示检索词之间的位置邻近关系。在某种情况下,若不限制词的位置关系则会造成邻近关系。在某种情况下,若不限制词的位置关系则会造成误检,影响查准率。
33、比如:检索误检,影响查准率。比如:检索“生物防治生物防治”文献,若用检索文献,若用检索式式“biologicalbiological* *control”control”检索,则会将检索,则会将“抑制生物抑制生物”(control biologicalcontrol biological)的文献也检索出来,因此,大部分)的文献也检索出来,因此,大部分检索系统设定了位置算符以确定词之间的位置关系。检索系统设定了位置算符以确定词之间的位置关系。常用的位置算符有以下几种:常用的位置算符有以下几种:(W)(W)算符、算符、(nW)(nW)算符、算符、(N)(N)算符、算符、(nN)(nN)算符、算符、
34、(S)(S)算符、算符、(F)(F)算符。算符。计算机信息检索技术计算机信息检索技术1 1)(W)(W)算符算符W W是是WithWith的缩写,的缩写,(W)(W)表示其两侧的检索词必须按前表示其两侧的检索词必须按前后顺序出现在记录中,在两词之间不能插入其他词,后顺序出现在记录中,在两词之间不能插入其他词,只可能有空格或一个标点符号。只可能有空格或一个标点符号。(W)(W)算符严密性较算符严密性较强,它基本等价于词组检索,可以简写为强,它基本等价于词组检索,可以简写为()()。例如,例如,online()information()retrievalonline()information()r
35、etrieval计算机信息检索技术计算机信息检索技术2 2)(nW)(nW)算符算符W W是是WordsWords的缩写,的缩写,n n为自然数。为自然数。(nW)(nW)表示其两侧的检索词表示其两侧的检索词之间允许最多插入之间允许最多插入n n个词,但它们之间的位置不能颠倒。个词,但它们之间的位置不能颠倒。如如 laser(1W)printerlaser(1W)printer可检出可检出 “ “laser printer” laser printer” 、 “ “laser colour printer”laser colour printer”和和 “ “laser and printer
36、”laser and printer”计算机信息检索技术计算机信息检索技术3 3)(N)(N)算符算符N N是是nearnear的缩写,的缩写,(N)(N)表示其两侧的检索词必须彼此相表示其两侧的检索词必须彼此相邻,并且这两个检索词的次序任意。邻,并且这两个检索词的次序任意。如如 factory(N)automationfactory(N)automation可检出可检出factory automation factory automation 和和automation factoryautomation factory的信息。的信息。4 4)(nN)(nN)算符算符表示在其两侧的检索词之间允
37、许最多插入表示在其两侧的检索词之间允许最多插入n n个单词,且个单词,且两词词序可以改变。两词词序可以改变。如如 information(1N)retrievalinformation(1N)retrieval可检出可检出information information retrieval retrieval或或retrieval of informationretrieval of information的信息的信息计算机信息检索技术计算机信息检索技术5 5)(S)(S)算符算符S S是是subfieldsubfield的缩写,的缩写,(S)(S)表示其两侧的检索词必须出现在表示其两侧的检索词
38、必须出现在同一子字段,即一个句子或短语中,词序不限同一子字段,即一个句子或短语中,词序不限 , ,并且夹在并且夹在其间的词量不限。其间的词量不限。例如,例如,computer(S)applicationcomputer(S)application只要只要computercomputer和和application application 在一个句子或短语中即为命中文献。在一个句子或短语中即为命中文献。计算机信息检索技术计算机信息检索技术6 6)(F)(F)算符算符F F是是fieldfield的缩写,的缩写,(F)(F)表示其两侧的检索词必须出现在表示其两侧的检索词必须出现在同一个字段中同一个字
39、段中 ,如篇名字段,如篇名字段 、叙词字段、叙词字段 、文摘字段、文摘字段等,词序不限,并且夹在其间的词量不限。等,词序不限,并且夹在其间的词量不限。例如,例如,Pollution(F)controlPollution(F)control表示一篇标题为表示一篇标题为Control Control and Management of Industrial Pollutionand Management of Industrial Pollution的文献记的文献记录为命中文献。录为命中文献。计算机信息检索技术计算机信息检索技术4 4字段限定检索字段限定检索字段限定检索是利用检索字段符来限定检索字
40、段,即字段限定检索是利用检索字段符来限定检索字段,即指定检索词在记录中出现的字段。指定检索词在记录中出现的字段。检索字段符分为两类,即后缀方式和前缀方式。检索字段符分为两类,即后缀方式和前缀方式。前者对应于基本索引,反映文献的主题内容;前者对应于基本索引,反映文献的主题内容;后者对应于辅助索引,反映文献的外部特征后者对应于辅助索引,反映文献的外部特征。计算机信息检索技术计算机信息检索技术4 4字段限定检索字段限定检索1 1)后缀方式)后缀方式后缀方式在检索词后加上指定检索字段的后缀字段代后缀方式在检索词后加上指定检索字段的后缀字段代 码,反映文献的主题内容。常用的代码有码,反映文献的主题内容。
41、常用的代码有 /TI/TI(篇名)、(篇名)、 /AB/AB(文摘)、(文摘)、 /DE/DE(叙词)。(叙词)。例如,例如,information()retrieval/TIinformation()retrieval/TI表示仅在表示仅在TITI字段中字段中 检索检索information()retrievalinformation()retrieval。计算机信息检索技术计算机信息检索技术4 4字段限定检索字段限定检索2 2)前缀方式)前缀方式前缀方式是在检索词之前加上指定检索字段的前缀字前缀方式是在检索词之前加上指定检索字段的前缀字段代码,反映文献的外部特征。段代码,反映文献的外部特征
42、。常用的代码有常用的代码有AU=(AU=(作者作者) )、ISBN=(ISBNISBN=(ISBN号号) )、 CC=(CC=(分类号或类目名称分类号或类目名称) )、CD=(CD=(会议日期会议日期) )、CS=(CS=(机构名称机构名称) )、 DT=(DT=(文献类型文献类型) )、JN=(JN=(刊名刊名) )、 PY=(PY=(出版年出版年) )等。等。计算机信息检索技术计算机信息检索技术2 2)前缀方式)前缀方式例如,例如,AU=Liu, Mingzhu AND CS=(Harbin Institute of AU=Liu, Mingzhu AND CS=(Harbin Insti
43、tute of Technology)Technology)表示查找哈尔滨工业大学的刘明珠老师发表示查找哈尔滨工业大学的刘明珠老师发表的文献。表的文献。 计算机信息检索的计算机信息检索的常用方法与步骤常用方法与步骤1 1、信息检索方法、信息检索方法基于数据库的常用检索方法:基于数据库的常用检索方法:计算机检索方法没有固定模式计算机检索方法没有固定模式,常用的可以归纳,常用的可以归纳为以下几种:为以下几种: (1 1)基本检索)基本检索( (快速检索、简单检索快速检索、简单检索) ):是一种最简单的是一种最简单的检索方法,多数数据库只提供一个检索框且只能输一词或检索方法,多数数据库只提供一个检索
44、框且只能输一词或一个词组检索一个词组检索 ,但也有的数据库可对两词或多词进行逻,但也有的数据库可对两词或多词进行逻辑组配检索。辑组配检索。计算机信息检索的计算机信息检索的常用方法与步骤常用方法与步骤基于数据库的常用检索方法:基于数据库的常用检索方法:(2 2)高级检索)高级检索 :用户可通过点选检索系统给定的检索用户可通过点选检索系统给定的检索字段对多词进行逻辑组配。高级检索提供的检索框也较字段对多词进行逻辑组配。高级检索提供的检索框也较多,一般一个检索框只能输一词或一个词组,检索框经多,一般一个检索框只能输一词或一个词组,检索框经常控制在常控制在2-52-5个。个。计算机信息检索的计算机信息
45、检索的常用方法与步骤常用方法与步骤 基于数据库的常用检索方法:基于数据库的常用检索方法:(3 3)专业检索:)专业检索:一般只有一个大检索框,要求用户自一般只有一个大检索框,要求用户自己输词己输词 、字段、检索算符进行组配检索。要求用户有、字段、检索算符进行组配检索。要求用户有熟练的检索技术。熟练的检索技术。(4 4)分类检索:)分类检索:一般按分类表进行限定检索,或按学一般按分类表进行限定检索,或按学科进行一级一级浏览。科进行一级一级浏览。(5 5)二次检索:)二次检索:是在以上单项检索的基础上,进一步是在以上单项检索的基础上,进一步选用新词进行缩小范围的检索。选用新词进行缩小范围的检索。计
46、算机信息检索的计算机信息检索的常用方法与步骤常用方法与步骤 用用户户 主主题题分分析析 检检索索操操作作 初初始始检检索索结结果果输输出出 选选择择检检索索系系统统或或数数据据库库 制制定定检检索索策策略略和和检检索索方方式式 用用户户结结果果评评价价 检检索索结结果果 索索取取原原文文 满满意意 选选择择检检索索途途径径:主主题题词词、作作者者、机机构构等等 不不满满意意 研研究究课课题题 2、信息检索步骤图书馆引进全部电子资源的总体介绍图书馆引进全部电子资源的总体介绍 哈尔滨工业大学文摘数据库哈尔滨工业大学文摘数据库哈尔滨工业大学全文数据库哈尔滨工业大学全文数据库外文数据库一般由外文数据库
47、一般由3 3种机构出版种机构出版(1 1)大、中型专业出版公司)大、中型专业出版公司如世界著名的如世界著名的ElsevierElsevier(爱思唯尔)出版公司、(爱思唯尔)出版公司、John Wiley& John Wiley& SonsSons出版公司、出版公司、SpringerSpringer出版公司、剑桥大学出版社等出版公司、剑桥大学出版社等 (2 2)专业学协会)专业学协会如美国航空航天学会(如美国航空航天学会(AIAAAIAA)、美国电子电器工程师学会)、美国电子电器工程师学会(IEEEIEEE)、英国皇家物理学会()、英国皇家物理学会(IOPIOP)等。)等。(3 3)专门从事数
48、据库制作和销售的数据库商)专门从事数据库制作和销售的数据库商如如EBSCOEBSCO公司、公司、ProQuestProQuest公司等;自己没有出版物,但他们买出版公司等;自己没有出版物,但他们买出版公司的产品,然后建立检索平台供读者检索,例如公司的产品,然后建立检索平台供读者检索,例如iGroupiGroup公司建公司建立了立了ScitationScitation平台,在上面可以看到平台,在上面可以看到AIPAIP(美国物理学会)、(美国物理学会)、ASMEASME(美国机械工程师协会)等几十个专业学协会的电子期刊。(美国机械工程师协会)等几十个专业学协会的电子期刊。学术资源发现学术资源发现
49、简单检索简单检索高级检索高级检索liquid bearing扩展馆藏之外的检索结果扩展馆藏之外的检索结果检索结果处理输入检索词输入检索词网络搜索引擎的利用网络搜索引擎的利用1. 网络信息资源的特点网络信息资源的特点 数据量大、传播广泛数据量大、传播广泛 检索方便、成本低廉检索方便、成本低廉 内容丰富、形式多样内容丰富、形式多样 分散无序、缺乏管理分散无序、缺乏管理 分布不均、质量不一分布不均、质量不一网络信息资源网络信息资源2 2、搜索引擎检索和利用、搜索引擎检索和利用 1 1)搜索引擎的产生)搜索引擎的产生 是为了解决从海量信息中搜索所需信息的需求而出现的工具。是为了解决从海量信息中搜索所需
50、信息的需求而出现的工具。 搜索引擎就是指互联网上专门提供查询服务的网站。这些网站搜索引擎就是指互联网上专门提供查询服务的网站。这些网站 通过复杂的网络搜索系统,将互联网上大量网站页面收集到一起,通过复杂的网络搜索系统,将互联网上大量网站页面收集到一起,而能够对用户提出的各种查询作出响应,提供给用户所需要的信而能够对用户提出的各种查询作出响应,提供给用户所需要的信息。息。搜索引擎检索式的构成 常用限定代码网站:site文档:filetype标题:intitle链接:link检索词+限定代码 常用检索符号检索词“检索词”检索词* 逻辑算符 and, or, nota a)使用关键词的技巧)使用关键
51、词的技巧每个关键词之间用每个关键词之间用逗号逗号连接,会搜索到与其中任何一个关键连接,会搜索到与其中任何一个关键词相关的网站和网页,这样可以使搜索范围扩大,有效避免词相关的网站和网页,这样可以使搜索范围扩大,有效避免漏检。另外,要尽量漏检。另外,要尽量选用专指词、特定概念或专业术语选用专指词、特定概念或专业术语作为作为关键词,关键词,避免使用普通词和太泛的词避免使用普通词和太泛的词,如计算机、网络等词,如计算机、网络等词,太多太泛被称为检索太多太泛被称为检索“禁用词禁用词”。网络信息资源网络信息资源网络信息资源网络信息资源b b)减号)减号“ ”的运用的运用 “ ” ” 的作用是为了去除包含特
52、定的关键词但与检索目标的作用是为了去除包含特定的关键词但与检索目标无无关的搜索结果,提高搜索结果相关性。若在搜索结果中有关的搜索结果,提高搜索结果相关性。若在搜索结果中有很多不相关的结果,则可用很多不相关的结果,则可用“ ”减掉不相关结果的关键减掉不相关结果的关键词词网络信息资源网络信息资源例,检索例,检索 “ “手机手机”,输入,输入 “ “手机手机 电视剧电视剧” ” 来进行来进行搜索,查询的结果里就不会有手机电视剧的信息。需要搜索,查询的结果里就不会有手机电视剧的信息。需要注意的是,前一个关键词和减号之间注意的是,前一个关键词和减号之间必须有空格必须有空格,否则,否则,减号会被当成连字符
53、处理,而失去减号语法功能。减号和减号会被当成连字符处理,而失去减号语法功能。减号和后一个关键词之间,有无空格均可。后一个关键词之间,有无空格均可。网络信息资源网络信息资源c c)利用双引号)利用双引号“ ”“ ”进行精确匹配搜索进行精确匹配搜索使用双引号进行精确匹配检索,能缩小检索结果范围,提高使用双引号进行精确匹配检索,能缩小检索结果范围,提高查准率,得到的信息结果最少最精确。查准率,得到的信息结果最少最精确。如如,输入,输入“哈尔滨工业大学哈尔滨工业大学”,可以得到与输入词完全匹配的,可以得到与输入词完全匹配的结果,否则,搜索引擎就会将结果,否则,搜索引擎就会将“哈尔滨哈尔滨”或或“大学大
54、学”等词分别等词分别检检索出来。索出来。网络信息资源网络信息资源d d)停用词的应用)停用词的应用停用词(停用词(Stop WordsStop Words)主要常见于英文搜索引擎中,指的是)主要常见于英文搜索引擎中,指的是使用过于频繁的单词,如使用过于频繁的单词,如whowho、I I、whatwhat、itit、andand、howhow、的、的、地等。搜索引擎不支持停用词的检索。如果在搜索的检索词地等。搜索引擎不支持停用词的检索。如果在搜索的检索词中必须使用停用词,可以用加号中必须使用停用词,可以用加号“+”+”来解决。来解决。如搜索影片名称如搜索影片名称“Who am I”Who am
55、I”时,其中时,其中“Who”Who”和和“I”I”是停用词,是停用词,用用“+”+”号强制对其进行搜索,此时的搜索条件即号强制对其进行搜索,此时的搜索条件即+Who+am+I+Who+am+I或将全部检索词用或将全部检索词用“ ”“ ”引起来,进行精确匹配搜索。引起来,进行精确匹配搜索。网络信息资源网络信息资源3 3)常用的搜索引擎)常用的搜索引擎常用的中文搜索引擎常用的中文搜索引擎a a)百度()百度(http:/http:/)百度是全球最大的中文搜索引擎。百度是全球最大的中文搜索引擎。20002000年年1 1月月1 1日,百度公司日,百度公司创始人李彦宏、徐勇以创始人李彦宏、徐勇以12
56、0 120 万美元投资创建了百度公司。同万美元投资创建了百度公司。同年年1010月,百度搜索引擎正式发布。月,百度搜索引擎正式发布。百度采用百度采用基于内容基于内容和和基于超链接分析基于超链接分析相结合的方法进行相关相结合的方法进行相关度评价,能够客观分析网页所包含的信息,从而最大限度地度评价,能够客观分析网页所包含的信息,从而最大限度地保证了检索结果相关性。保证了检索结果相关性。网络信息资源网络信息资源百度的网页搜索特色功能包括以下方面。百度的网页搜索特色功能包括以下方面。(1 1)百度快照)百度快照。每个未被禁止搜索的网页。每个未被禁止搜索的网页 ,在百度上,在百度上都会自动生成临时缓存页
57、面,称为都会自动生成临时缓存页面,称为“百度快照百度快照”。当网站。当网站服务器暂时出现故障或网络传输堵塞时,可以通过服务器暂时出现故障或网络传输堵塞时,可以通过 “ “百百度快照度快照”快速浏览页面文本内容快速浏览页面文本内容 。因为百度快照只临时。因为百度快照只临时缓存网页的文本内容,所以那些图片、音乐等非文本信缓存网页的文本内容,所以那些图片、音乐等非文本信息,仍是存储于原网页息,仍是存储于原网页 。网络信息资源网络信息资源网络信息资源网络信息资源百度的网页搜索特色功能包括以下方面。百度的网页搜索特色功能包括以下方面。(2 2)专业文档搜索。)专业文档搜索。 很多有价值的资料,在互联网上
58、并非很多有价值的资料,在互联网上并非是普通的网页,而是以是普通的网页,而是以WordWord、PowerPoint PowerPoint 、PDFPDF等格式存在。等格式存在。百度支持对百度支持对Office Office 文档(包括文档(包括WordWord、ExcelExcel、PowerPointPowerPoint)、)、Adobe PDFAdobe PDF文档进行的全文搜索文档进行的全文搜索 。要搜索这类文档,在普通的检索词后,加一个要搜索这类文档,在普通的检索词后,加一个“filetype:”filetype:”文文档类型限定档类型限定 ,“filetype:” filetype:
59、” 后可以跟以下文件格式后可以跟以下文件格式 :DOCDOC、XLSXLS、PPTPPT、PDFPDF、RTFRTF、ALLALL。网络信息资源网络信息资源网络信息资源网络信息资源b b)搜狗()搜狗( http:/ http:/ )。搜狗是搜狐公司于搜狗是搜狐公司于20042004年年8 8月月3 3日推出的全球首个第三代互动式中文搜索引擎日推出的全球首个第三代互动式中文搜索引擎 。20072007年年1 1月月1 1日正式推出的全面升级的搜狗网页搜索日正式推出的全面升级的搜狗网页搜索 3.0 3.0 版本凭借自版本凭借自主研发的主研发的服务器集群并行抓取技术服务器集群并行抓取技术,成为全球首个中文网页成为全球首个中文网页收录量达到收录量达到100100亿的搜索引擎亿的搜索引擎,以每天,以每天5 5亿网页的速度更新。亿网页的速度更新。网络信息资源网络信息资源c c)新浪爱问搜索)新浪爱问搜索(http:/http:/ /)。)。新浪新浪 “ “ 爱问爱问i
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 湖南省常德市澧县2024-2025学年七年级上学期期末生物学试题(含答案)
- 新时代农业现代化智能种植技术的创新与发展战略
- 新材料研发及产业化应用合作协议
- 云计算服务与安全策略解析
- 《先秦诸子哲学思想比较:大三哲学文化课教案》
- 养殖业合作饲养及利润分配协议
- 电力工程设计与安装施工合同
- 智能基金投资管理及销售协议
- 乌江自刎的英雄故事征文
- 中小学生科普读物读后感
- 西门子S7-1200 PLC应用技术项目教程(第3版) 课件 1.认识S7-1200PLC宽屏-(LAD+SCL)
- 《税法》(第六版)全书教案电子讲义
- 翻斗车司机安全培训
- 计算机软件配置管理计划规范
- 《劳动保障监察条例》课件
- 中华人民共和国学前教育法
- 辩论英文课件教学课件
- 2021年广东省公务员录用考试《行测》题(乡镇卷)【原卷版】
- 2020年全国中学生生物学竞赛联赛试题真题(含答案解析)
- 足浴技师与店内禁止黄赌毒协议书范文
- 铁路专业基础知识考试题及答案
评论
0/150
提交评论