信息检索与利用2_第1页
信息检索与利用2_第2页
信息检索与利用2_第3页
信息检索与利用2_第4页
信息检索与利用2_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、信息检索与利用20092010学年上学期12.4 信息检索技术及其应用 布尔算符:是用来规定检索概念或检索词之间相互逻辑关系的算符逻辑“或” OR逻辑“与” AND逻辑“非” NOT2布尔算符AND 或 * 算符 实现逻辑“与”组配 检索时,命中信息同时含有两个概念,专指性强。如:作者王红 AND 地址四川大学作者赵飞 AND 作者李四3 2. OR 或 + 算符 实现逻辑“或”组配 3. NOT 或 算符 实现逻辑“非”组配检索时,命中信息包含所有关于逻辑A或逻辑B或同时有A和B的,检索范围比AND扩大。如:rapid transit OR light rail OR subways rai

2、lway OR railroad命中信息包含逻辑A、不包含逻辑B或同时有A和B的,排除了不需要的检索词。如:fruit NOT apple windows NOT Microsoft42 位置算符(词位算符)位置算符:用于限定词与词之间的位置关系,以提高查准率。 当检索词为词组形式时,或两个检索词之间可能被其他词或标点符号隔开时,均应使用位置算符。51.W - With W 算符是With的缩写,表示在此算符两侧的检索词必须按输入时的前后顺序排列,不能颠倒。所连接的词之间除可以有一个空格、标点或连接号外不得夹有任何其他单词或字母。 例: intelligent (W) robot? Wn( 或

3、nW) 表示在此算符两侧的检索词必须按输入时的前后顺序排列,不能颠倒。但允许在连接的两个词之间最多插入n个单元词。 例: intelligent w1 robot* 2. N - Near N算符是Near的缩写,表示此算符两侧的检索词必须紧密相连,所连接的词之间不允许插入任何其他单词或字母。但词序可以颠倒。 例: intelligent NEAR robot* Nn (或nN)表示在两个检索词之间最多可插入n个单词,且两词的词序任意。 例: intelligent N1 robot*63 截词检索 截词是指将检索词在适当的地方截断,截词检索是用截断词的一个局部进行的检索,凡是满足这个截词所有

4、字符(串)的记录,系统都为命中。 截词检索在西文数据库中广泛使用。是在词干后可能变化的位置加上截词符号。检索词的单复数形式,同一词英、美不同拼法,词根相同的词都可用截词检索。这样既可减少检索词的输入量,又可扩大查找范围,提高查全率。 按 截 词 位 置 分: 有前截断、后截断、中截断; 按截词的字符数量分:有非限制截断、限制截断。 * 表示截词的截断符号,各检索系统有不同的规定,没有统一标准。71. 后截断 后截断是在检索词词干后面加截词符,表示不限制或限制词尾可变化的字符数,即查找词干相同的所有词。从检索性质上讲,后截断是前方一致检索。 非限制截断:是在检索词词干后面加一个截词符,表示不限制

5、词尾可变化的字符位数,即查找词干相同的所有词。 例: comput? 表示允许其后可带有任何字符且数量不限,相当于查找compute、 computed、 computes、 computing、 computer、 computers、computerize、computerized、computation、 computations、 computational、 computationally 等词。 *不宜将词截得过短,否则容易造成误检。 限制截断 :是在检索词词干后面加若干个截词符,表示限制可变化的字符数。 例:fib? 相当于查找 fiber 或 fibre librar? 相当于

6、Libraries,librarian,library educat? 相当于Educator,educated82. 中截断 (通配符或屏蔽) 是把截断符号置于一个检索词的中间,对词中间出现变化的字符数加以限定。一般中截断仅允许有限截断。 例:organi#ation, 可检索到包含organization和organisation的记录。 一个?代表零个或任意个字符。 例: colo?r ,可检索到包含 color、colour、colonizer、 colorimeter的记录。 一个? 和数字,其中的数字代表可替换的字符数。 例:colo?1r, 只能检索到包含colour的记录。9四

7、、字段检索 (range searching) 字段检索即指定检索词出现的字段,被指定的字段也称检索入口,检索时,系统只对指定字段进行匹配运算,提高了效率和查准率。西文数据库,字段检索常用代码来表示,如下表所示。 10中图法大类马克思主义、列宁主义、毛泽东思想、邓小平理论A 马克思主义、列宁主义、毛泽东思想、邓小平理论哲学B 哲学、宗教社会科学C 社会科学总论 D 政治 法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言I 文学 J 艺术 K 历史 地理11自然科学N 自然科学总论O 数理科学和化学P 天文学 Q 生物科学 R 医药卫生S 农业科学T 工业技术U 交通运输V 航空

8、航天X 环境科学综合性图书Z 综合性图书T 工业技术TB一般工业技术TD矿业工程TE石油、天然气工业TF冶金工业TG金属学与金属工艺TH机械、仪表工业TJ武器工业TK能源与动力工程TL原子能技术TM电工技术TN无线电电子学、电信技术TP自动化技术、计算机技术TQ化学工业TS轻工业、手工业TU建筑科学TV水利工程12信息检索方法及技术应用实例例1:聚苯硫醚树脂制备及其复合材料研究1信息需求分析(1)明确检索目的与要求 1)检索目的:学位论文开题查新 2)检索要求:国内外聚苯硫醚树脂制备方法与工艺;聚苯硫醚树脂复合材料的制备技术。(2)进行主题分析,确定主题范围。根据检索目的与要求,该课题涉及的主

9、题范围重点为:聚苯硫醚、复合材料、制备。132制定检索策略(1) 选择检索词。根据主题分析确定的主题范围,选择检索词如下:#1 聚苯硫醚poly(phenylene sulfide);polyphenylene sulfide; PPS#2 制备preparation #3 合成synthesis#4 复合材料composite 14(2)使用相关检索技术构造提问式检索式1:聚苯硫醚and(合成or制备)检索式2:聚苯硫醚 and复合材料检索式3: poly(phenylene sulfide? ?)or polyphenylene sulfide? ? or PPS and(synthesi

10、s or preparation)检索式4:poly(phenylene sulfide? ?)or polyphenylene sulfide? ?or PPS and composite? ? 15第3章 参考工具书3.1 工具书概述 工具书是知识信息的高度概括和汇集,是作为工具使用的一种图书。特点:概括性查考性易检性16常用参考工具书书目:文献目录,是著录一批相关的图书或报刊文献的基本特征,按照一定次序编排而成的揭示和报道文献的工具。四库全书总目索引:将报刊书籍中某些重要的或有意义的信息,如书名、刊名、主题、人名、地名等分别摘录出来,按一定方式编排,并注明出处,以供检索的工具。全国报刊索

11、引】三国志地名索引17常用参考工具书文摘:用简明扼要的文字摘录文献内容的精华,按照一定的方式编排的检索工具。新华文摘社会科学文摘字典、词典百科全书:汇集人类一切门类知识或是某一学科门类所有知识的概述性的检索工具。大英百科全书18常用参考工具书类书、政书类书是辑录前代文献中的史实典故、名物制度、诗赋文章、骈词丽语等资料,以供查检、征引、校勘和辑佚古代文献的一种工具书。政书:专门记叙典章制度沿革和社会政治、经济、文化、军事发展状况的工具书。年鉴、手册表谱、图录19常用参考工具书机构指南统计资料传记资料地理资料20第4章 网络信息资源的检索214.1 网络信息资源概述概念网络信息资源是通过计算机网络

12、可以利用的各种信息资源的总称。22特点 网络信息资源是一类新型的数字化资源,与传统的信息资源相比,网络信息资源呈现出信息海量化、内容丰富、类型多样、信息更新快、代谢频率高、信息源庞杂等新的特点。 类型234.2 网络信息资源检索概述 浏览与检索 检索网络信息资源的工具 主题指南 搜索引擎 网络导航 搜索引擎 24搜索引擎的基本检索功能 搜索入门 使用空格 使用OR 使用双引号 使用减号 使用通配符 禁用词的使用 25第2部分 中文数据库检索26电子图书数据库电子图书是指用计算机可识别的电子形式记录图、文、声、像等知识信息,通过数码方式记录在以光、电、磁为介质的设备中,借助计算机等专门设备进行阅

13、读、传输的新型数字化图书。27中文电子图书阅览器下载、安装图书检索图书浏览28超星数字图书馆超星数字图书馆是目前中国最大的网上数字图书馆。设有文学、历史、法律、计算机等几十个分馆。目前超星电子图书为我校开通教育网远程访问的权限,该站点上有电子图书80多万册,均为我馆已购图书,我校校园网内的用户可通过我校图书馆主页“电子资源”中的中文电子图书链接直接进入该数据库进行访问,不需要帐号和口令。29超星数字图书馆超星图书可以在线阅读也可下载到本地硬盘保存。超星电子图书为加密数据。下载的电子图书与下载所用计算机绑定,拷贝到其他计算机上无法阅读。下载后图书的有效期为一个月,一个月后如需要访问该图书还需要重

14、新下载.30超星数字图书馆阅览器下载安装阅读超星图书,请先下载和安装4.0超星浏览器。 31超星数字图书馆32超星数字图书馆33超星数字图书馆超星数字图书馆提供三种检索方式:快速检索高级检索分类检索34快速检索 在搜索位置输入关键词,另可以根据书名、作者、全部字段三种条件对关键词进行检索。35超星数字图书馆高级检索高级检索适合多条件检索,可以进行逻辑组配,有更多的检索字段供选择,查出的结果更为准确 ,适合目的性强的读者。36分类检索建议在不知道具体的书名或作者时采用分类检索37检索结果38检索结果处理(1)阅读图书(2)下载图书(3)打印图书39检索结果处理40检索结果处理文字识别41检索结果

15、处理下载或打印42检索结果处理43书生之家数字图书馆44中文期刊全文数据库45龙源电子期刊目前全文在线的综合性人文社科类期刊品种已达到1000种。内容涵盖时政、党建、管理、财经、文学、艺术、哲学、 历史、社会、科普,军事、教育、家庭、体育、休闲、健康、时尚、职场等领域。更新及时,与纸版同步龙源的核心期刊能够在纸版期刊出版的同时推出网上电子版。操作简单,使用方便,既可以分期浏览,也可以可以通过关键词、标题、刊名进行检索46龙源电子期刊界面47期刊浏览48全文浏览49期刊检索期刊检索全文检索50中国期刊全文数据库(CNKI)中国期刊全文数据库该库是目前世界上最大的连续动态更新的中国期刊全文数据库

16、,收录1979年至今8200多种期刊(部分刊物回溯至创刊),按学科分为 168个专题,现有文献 2200 多万篇,每日更新。内容涵盖自然科学、工程技术、农业、医学、哲学、人文社会科学等学科领域 。该数据库数据高度整合,可实现一站式文献信息检索 ;同时还具有引文连接功能,还可用于个人、机构、论文、期刊等方面的计量与评价。51中国期刊全文数据库检索技术: 1布尔检索 2词位检索 3限制检索521布尔检索在初级和高级检索方式中,使用下拉菜单选择布尔检索算符,其逻辑算符为:逻辑与:并且逻辑或:或者逻辑非:不包含 532词位检索 提示同一检索项中两个检索词的词间关系。 同句:指两个标点符号之间,即多个检

17、索词限定在一个句子内出现。 543限制检索55检索方式 1. 检索方式 (1)快速检索 (2)标准检索 (3)专业检索 (4)引文检索 (5)作者发文检索2. 检索结果的处理 (1)结果选择保存 (2)全文下载及浏览 56(1)快速检索简单检索 简单检索只需要输入一个检索词,点击“检索”按钮即可获得结果。显示出检索结果后,将 “ 在结果中 检索”前的方框中打勾,即可进行二次或多次检索。57(2)标准检索 标准检索提供检索项之间的逻辑组配、同检索项中检索词之间的逻辑组配。,在一个检索项中可分别输入两个词,两词可分别受到词频控制。58(3)专业检索专业检索是指将检索式直接输入到检索框中进行检索的方

18、法。输入时须注意:逻辑与、逻辑或、逻辑非分别用and、or、not表示。如果要选择运算顺序,请使用半角圆括号“()”。在输入检索式时,除检索词之外的所有符号均采用半角。逻辑算符“and”、“or”、“not”前后要空一个字节。 59(4)引文检索60(5)作者发文检索61检索结果的处理(1)结果选择保存 1)选择题录: 如需要将检索结果保存以供它用时,可在检索结果的当前页面上选择条目进行保存(一次最多保存50篇题录)。其方式有 “单选” 和 “全选”。 单选是指在题名前的“” 勾选,选择需要保存的记录。全选是指点击右页面的 “ 全选 ” 按钮, 即可将当前页面的题录全部勾选。 2)保存结果: 系统提供多种保存格式。62题录结果保存63题录结果保存64检索结果的处理(2)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论