数字信息资源检索_第1页
数字信息资源检索_第2页
数字信息资源检索_第3页
数字信息资源检索_第4页
数字信息资源检索_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数字信息资源检索第一页,共五十四页,编辑于2023年,星期三自我介绍崔明Cming@第二页,共五十四页,编辑于2023年,星期三能学到什么?从事专业学习的需要

开展科学研究、创新的需要

提高素质和终身学习能力的需要

第三页,共五十四页,编辑于2023年,星期三课程设置讲授上机7周信息检索概述搜索引擎概述数据库资源概述文献综合查询6-7周Baidu、Google使用中文期刊、图书数据库外文期刊、索引数据库中外专利、NoteExpress使用网上课件第四页,共五十四页,编辑于2023年,星期三一信息及信息资源1.1.1信息的涵义:

信息是生物以及具有自动控制系统的机器通过感觉器官或者细胞组织,或者具有类似功能的设备部件与外界进行交流的一切内容。第五页,共五十四页,编辑于2023年,星期三一信息及信息资源1.1.2信息的类型自然信息生物信息机器信息社会信息描述对象第六页,共五十四页,编辑于2023年,星期三一信息及信息资源文献信息口头信息电子信息依附载体第七页,共五十四页,编辑于2023年,星期三差异性1.1.3信息特征一信息及信息资源传递性时效性可转换性共享性第八页,共五十四页,编辑于2023年,星期三一信息及信息资源差异性1.中国的外贸出口造成极大的伤害2.降低对外资的吸引力3.国际化定价的行业石化、钢铁、电子元器件等利润下降4.国家的外汇储备随着升值幅度多少,相应损失。1、有利于中国进口2、原材料进口依赖型厂商成本下降3、国内企业对外投资能力增强4、有利于旅游和留学。第九页,共五十四页,编辑于2023年,星期三一信息及信息资源传递性接受者传播途径信息源第十页,共五十四页,编辑于2023年,星期三一信息及信息资源时效性第十一页,共五十四页,编辑于2023年,星期三一信息及信息资源可转换性第十二页,共五十四页,编辑于2023年,星期三一信息及信息资源共享性非物质资源和能源资源所表现的占有和消耗同程度的享用,获取信息量因人而已第十三页,共五十四页,编辑于2023年,星期三一信息及信息资源1.2信息资源信息资源是经过人类主观或客观处理了的,并且能够被传播或传输的文字、声音、图像、数据等。网络技术、存储技术、多媒体技术、计算机技术推动下,以数字化形式(即二进制代码0、1)表现字、图、音、动的内容。1.2.1电子信息资源第十四页,共五十四页,编辑于2023年,星期三数字化电子信息资源特点一信息及信息资源存储多样化内容丰富容量大互动性强第十五页,共五十四页,编辑于2023年,星期三一信息及信息资源类型:1.网络传输协议1Web信息资源3Telnet信息资源2Ftp信息资源第十六页,共五十四页,编辑于2023年,星期三一信息及信息资源1Web信息资源HTTP超文本传输协议第十七页,共五十四页,编辑于2023年,星期三一信息及信息资源2Ftp信息资源FTP文件传输协议第十八页,共五十四页,编辑于2023年,星期三一信息及信息资源3Telnet信息资源Telnet远程登陆协议第十九页,共五十四页,编辑于2023年,星期三一信息及信息资源1.出版物类型1电子图书3电子报纸2电子期刊第二十页,共五十四页,编辑于2023年,星期三一信息及信息资源第二十一页,共五十四页,编辑于2023年,星期三二计算机信息检索原理1.检索原理:人们在计算机或者计算机检索网络的终端机上,使用特定的检索指令、检索词和检索策略从计算机检索系统的数据库中检索出所需信息再由终端设备显示或打印的过程。第二十二页,共五十四页,编辑于2023年,星期三二计算机信息检索原理主题分析著录标引原始信息信息标示数据库纪录信息存储第二十三页,共五十四页,编辑于2023年,星期三二计算机信息检索原理主题分析选定编制信息需求检索主题检索策略信息检索第二十四页,共五十四页,编辑于2023年,星期三二计算机信息检索原理匹配第二十五页,共五十四页,编辑于2023年,星期三二计算机信息检索原理90年代以后脱机批处理联机检索光盘检索网络化检索计算机信息检索发展70年代初80年代60年代第二十六页,共五十四页,编辑于2023年,星期三二计算机信息检索原理1946.2ENIAC第二十七页,共五十四页,编辑于2023年,星期三二计算机信息检索原理1981.8IBM5150第二十八页,共五十四页,编辑于2023年,星期三二计算机信息检索原理1952.5IBM--726第二十九页,共五十四页,编辑于2023年,星期三二计算机信息检索原理1956.9IBM350RAMAC第三十页,共五十四页,编辑于2023年,星期三二计算机信息检索原理1978Philips--LD第三十一页,共五十四页,编辑于2023年,星期三二计算机信息检索原理1969ARPAnet第三十二页,共五十四页,编辑于2023年,星期三二计算机信息检索原理1985Windows1.0第三十三页,共五十四页,编辑于2023年,星期三二计算机信息检索原理1994.101995.08第三十四页,共五十四页,编辑于2023年,星期三二计算机信息检索原理服务方式回溯检索定题检索随机问答联机订购第三十五页,共五十四页,编辑于2023年,星期三二计算机信息检索原理回溯检索Viableoffspringderivedfromfetalandadultmammaliancells.从胚胎和成年哺乳动物细胞中获得的成活的后代Nature,1997,385:810~~813第三十六页,共五十四页,编辑于2023年,星期三二计算机信息检索原理检索语言1布尔逻辑检索(Booleanlogic)

布尔逻辑检索一般指“与”、“或”、“非”三种运算。

第三十七页,共五十四页,编辑于2023年,星期三二计算机信息检索原理

逻辑“与”的布尔运算符为“AND”、“and”,有时也可用“*”表示。其含义是“与”前后的检索词全部出现时,所检索到的结果才算符合条件。

AANDB

或者A*B检索时,数据库中同时含有检索词A和检索词B的文献,为命中文献。

第三十八页,共五十四页,编辑于2023年,星期三二计算机信息检索原理逻辑“或”的布尔运算符为“OR”、“or”,有时也可用“+”表示。其含义是“或”前后的检索词有一个出现或全部出现,所检索到的结果均算符合条件AORB或者

A+B检索时,数据库中的文献凡含有检索词A或者检索词B或者同时含有检索词A和B的,均为命中文献。第三十九页,共五十四页,编辑于2023年,星期三二计算机信息检索原理逻辑“非”的布尔运算符为“NOT”、“not”,有时也可用“-”符号表示。其含义是搜索结果应满足“NOT”前面的检索词而排除“NOT”后面的检索词。

ANOTB

或者A-B对于这个提问式,数据库中凡含有检索词A而不含有检索词B的文献,即为命中文献。第四十页,共五十四页,编辑于2023年,星期三二计算机信息检索原理2词组检索(phrasesearch)

词组检索(phrase),也称为短语检索,或字符串检索。它是将一个词组或短语用双引号“

”括起作为一个独立运算单元,进行严格匹配,以提高检索准确度的一种方法。几乎所有的搜索引擎都支持词组检索。“computernetwork”“山东大学威海分校”第四十一页,共五十四页,编辑于2023年,星期三二计算机信息检索原理3截词检索(truncationsearch)

所谓截词(truncation),是指检索者将检索词在他认为合适的地方截断;而截词检索,则是用截断的词的一个局部进行的检索,凡满足这个词局部中的所有字符(串)的文献,都为命中的文献。

后截断

前截断

中间截断

第四十二页,共五十四页,编辑于2023年,星期三二计算机信息检索原理

1)后截断后截断是最常用的截词检索技术。它是将截词符放在一串字符的右面,用以表示截词符右面的有限或无限个字符不影响该字符串的检索,这种方式称为检索词的后截断。从检索性质上讲,后截断是前方一致检索。

有限截断无限截断第四十三页,共五十四页,编辑于2023年,星期三二计算机信息检索原理例1system??这是两个字符有限截断检索,该表达式可检出的词汇有:systemic但不能检索出下列词汇systematicsystematicalsystematicianSystematics┇

有限截断第四十四页,共五十四页,编辑于2023年,星期三二计算机信息检索原理无限截断例2comput*这是一个无限后截断的例子。这种方法可以查找出含有相同字符串的所有检索词。Comput*可检出词汇有computabilitycomputablecomputationcomputationalcomputativecomputecomputer┇第四十五页,共五十四页,编辑于2023年,星期三二计算机信息检索原理2)前截断与后截断相对,前截断是将截词符号置放在一个字符串左方,以表示截词符左面的有限或无限个字符不影响该字符串的检索。这种方式称为检索词的前截断。从检索性质上讲,前截断是后方一致检索。

第四十六页,共五十四页,编辑于2023年,星期三二计算机信息检索原理例3.*magnetic这是一个无限前截断的表达式,可检出下列词汇:magnetic有磁性的electro-magnetic电磁的electromagnetic电磁的paramagnetic顺磁的thermo-magnetic热磁的thermomagnetic热磁的但是检索不出magneticsmagnetical等等。

第四十七页,共五十四页,编辑于2023年,星期三二计算机信息检索原理3)中间截断中间截断又称为中间屏蔽,是一种用截词符屏蔽词中不同字符的方法。例如,“woman”和“women”,可用“wom?n”代替;“defence”和“defense”,可用“defen?e”代替。一般地,中间截词仅允许有限截断。

第四十八页,共五十四页,编辑于2023年,星期三二计算机信息检索原理4字段限定检索(fieldlimiting)字段检索(field)是一种用于限定提问关键词在数据库记录中出现的区域,控制检索结果的相关性,提高检索效果的检索方法,多以字段限定方式实现。

第四十九页,共五十四页,编辑于2023年,星期三二计算机信息检索原理字段代码字段名称ABAbstract文摘AUAuthor作者CCClassificationCode分类代码CSCorporateSource机构名称DEDescriptor叙词DTDocumentType文献类型IDIdentifier标识词JNJournalName刊名LALanguage语种PYPublicationYear出版年TITitle题名如在DIALOG系统中,情况是这样的:第五十页,共五十四页,编辑于2023年,星期三二

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论