




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数字信息资源概述参考数据库全文数据库事实数据库电子图书电子期刊电子报纸搜索引擎/分类指南网络学术资源学科导航FTP资源其他:网站、BBS、新闻组等检索提问式的定义及类型概括地说,检索式是检索策略的逻辑表达式,是指计算机信息检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符以及系统规定的其他组配连接符号组成。布尔逻辑检索式是目前使用最普遍的检索式,即用布尔算符(and、or、not)将检索词组合起来。位置算符检索式是对布尔逻辑检索式的一种改进,式中不仅有布尔算符,而且有位置算符,用以指明检索词之间的位置关系,从而解决了布尔算符组配检索词时没有词序的问题,进而提高了查准率。构成检索提问式的5种符号位置算符:表示所连接的各个单元词词间位置关系的符号,在不同的系统中往往以不同的符号表示。字段后缀符:限制检索词在数据记录中出现的字段位置,主要是题名、文摘、叙词和标识词字段,分别缩写为TI、AB、DE和ID。通常是在检出的文献量较多的情况下才考虑使用。限制符:挑选命中文献的文种、文献类型、出版时间和重要文章,约束检索结果。其形式和用法同上。字段前缀符:其作用与限制符一样,都是表示文献的外部标志,不反映文献的内容,对检索式的命中文献从非主题方面加以限制。截词符:其作用是在保证关键词检索的前提下,扩大检索范围。除了以上5种符号外,构造检索式还常常用到括号。括号可以规定运算的优先次序。一般说来,使用布尔算符、括号、截词符和位置算符,就可以构造出一个比较完善、切题的检索式了。数字信息资源概述:检索技术布尔逻辑检索布尔逻辑检索逻辑“与”(and):检索时,命中信息同时含有两个概念,专指性强;
逻辑“或”(or):检索时,命中信息包含所有关于逻辑A或逻辑B或同时有A和B的,检索范围比and扩大。
逻辑“非”(not):命中信息只包括逻辑A,不包括逻辑B或同时有A和B的,排除了不需要的检索词。
逻辑“异或”(xor):命中信息包含逻辑A,也包含逻辑B,但不包含同时含有A和B的信息。
布尔逻辑检索:运用布尔逻辑算符(Booleanoperators)对检索词进行逻辑组配,表达两个概念之间的逻辑关系。布尔逻辑检索(续)注意:在不同的检索系统里,布尔逻辑的运算次序是不同的,因此会导致检索结果的不同。通常运算次序有这样几种形式:一是按算符出现的顺序,如果是and、or、not,就按and、or、not的顺序运算;如果是or、not、and,就按or、not、and的顺序运算;二是默认and优先运算,其次是or、not;三是默认or优先运算,然后是and、not。一般来讲,检索系统的“帮助”文件中都会有这类说明,只要注意查看即可。在中文数据库里,布尔逻辑运算符有时用and、or、not下拉菜单形式表示,供用户选择;有时用“*”号表示逻辑“与”,用“+”表示逻辑“或”,用“-”表示逻辑“非”。
检索技术位置算符检索:即运用位置算符(positionoperators)表示两个检索词间的位置邻近关系,又叫邻接检索(proximity)。这种检索技术通常只出现在西文数据库中,在全文检索中应用较多。如果说布尔逻辑算符是表示两个概念之间的逻辑关系的话,位置算符表示的是两个概念在信息中的实际物理位置关系。位置算符检索位置算符(position)With(field):samefieldorsamesequenceNear:samesentencePre(precede):librarypresciencelibraryscience,librarywithscience,...w/n(Within):libraryw/nsciencelibraryscience,sciencelibrary,…Field:samefieldSame:sameparagraph位置算符检索(续)常用的位置算符有算符
功能
表达式
检索结果
W,W/Nwithwithin两词相邻,按输入时顺序排列(也有数据库允许顺序颠倒)
Education(W)school,或EducationwithschoolEducationschoolEducationschools(schoolofeducationschoolsofeducation)
nW
同上,两词中间允许插入n个词Education(1W)schoolEducationschoolEducationschoolsEducationandmusicschoolSchoolofcontinuededucationPre两词相邻,按输入顺序排列
EducationPreschoolEducationschoolEducationschools位置算符检索(续)常用的位置算符有算符
功能
表达式
检索结果
N,near,adj
两词相邻,顺序可以颠倒
Education(N)school,或EducationnearschoolEducationschoolEducationschoolsSchoolofeducationnN
同上,两词中间可以插入n个词
Education(1N)schoolEducationschoolSchoolofeducationEducationandmusicschoolF两个词同在一个标引字段中Education(F)school例如同时出现在题名或文摘字段中Same两个词同在一个段落(paragraph)中EducationSameschool同时出现在一个段落中位置算符检索(续)注意:不是每一个检索系统都使用上述位置算符,不同的系统使用的位置算符不同,不同的算符在不同的系统中有时可能含义不同。例如“W”算符,在Dialog检索系统表示两词相邻,输入顺序不变;在ProQuest系统中,“W”算符表示输入的两个词相邻,但顺序可变,如顺序要求不变,则使用“Pre”算符。用户可以查阅help帮助文档说明。
检索技术(续)截词检索:用截词符号“?”、“*”或“$”加在检索词的前后或中间,以检索一组概念相关或同一词根的词。这种检索方式可以扩大检索范围,提高查全率,主要用于西文数据库检索。中文数据库通常不使用这种技术。
截词检索类型截词方式根据截词的位置不同,分为前截断、后截断、中截断;根据截断的数量不同,分为有限截断和无限截断。
截词检索(truncation)后截断:是前方一致检索,又称右截断,截词符放在被截词的右边,是最常用的截词检索技术。后截断主要用于下列检索:词的单复数检索,如company与companies;年代检索,如199?(九十年代);词根检索,如socio*,可以检索sociobiology,socioecology,sociology等20多个词汇。前截断:截词符放在被截词的左边,可与后截断一同使用。例如输入*magnetic,可检electro-magnetic、electromagnetic、thermo-magnetic等。目前这种检索技术应用已经极少。中截断:把截词符放在词的中间。如organi?ation,可检索organisation、organization。这种方式查找英美不同拼法的概念最有效。截词检索(truncation)(续)截词举例符号:*,?,$后截断:librar*library,libraries,librarian,…前截断:*magneticmagnetic,electro-magnetic,electromagnetic,thermo-magnetic,…中截断:organi?ation
organization,organisation截词检索(truncation)(续)截词检索类型根据截断的数量不同,分为有限截断和无限截断。无限截断:不限制被截断的字符数量,例如输入educat?,可以检索educator,educators,educated,educating,education,educational,等等。
有限截断:限制被截断的字符数量,例如输入educat**,表示被截断的字符只有两个,可以检索educator,educated两个词。
截词检索(truncation)(续)词根检索有些检索系统不支持使用截词符的截词检索技术,系统默认的是词根检索,即输入一个词,系统会自动检索出同一词根的一组词,例如输入gene,可以检索出gene,genic,genome等。这是一种智能检索方式,但要求系统内必须预先配置词根表。IEE/IEEE全文数据库默认词根检索有些数据库需要加入词根运算符如“$”才进行词根检索
网上各类型信息资源查询数字图书馆:中国数字图书馆、书生之家数字图书馆、超星数字图书馆、北大方正的Apabi系统。报刊资料:中国学术期刊网、中文科技期刊数据库、中国财经报刊数据库。会议文献:中国科学院学术会公告、学界动态、IEEE学术会议数据库、万方学术会议文献数据库、中国重要会议论文集全文数据库、国内专业会议资料数据库、OCLC的会议文献数据库、美国科学信息研究所(ISI)会议数据库。网上各类型信息资源查询(续)学位论文:中国学术期刊网和万方数据资源系统的学位论文数据库、高校学位论文数据库、PQDD数据库(美国)。专利文献:中国专利信息网、国家知识产权局、DILAOG系统、世界知识产权组织专利数据库、美国专利商标局专利检索数据库。标准类:中国标准咨询网、万方数据资源系统标准数据库、国际标准化组织、美国国家标准委员会。搜索引擎简介搜索引擎是采用信息自动跟踪标引等技术、建立在因特网上专门提供网络信息资源导航服务检索工具。搜索引擎的检索系统由以下几部分组成:搜索器、分析器、索引器、检索器和用户接口。同检索数据库一样,利用搜索工具检索,也需要用户能够将自己的检索需求编制成合适的检索策略,并且需要一定的检索技巧。搜索引擎采用的检索词和信息标识词匹配运算的主要方法有:布尔逻辑检索、截词检索、限制检索、加权检索、词位置检索和全文检索等。搜索引擎分类
检索型搜索引擎:它使用自动索引软件来发现、收集并标引网页,建立数据库,并以Web形式让用户找到所需信息资源。比较著名的有:AltaVista、Google、天网、百度、悠游等。目录型搜索引擎:这类引擎将信息系统地分门归类,经过人工整理后形成庞大而有序的分类目录体系,用户可以在目录体系的导引下通过逐级浏览,发现、检索到有关的信息。雅虎就是以卓越的分类目录型导航服务而称誉全球。混合型搜索引擎:它兼有检索型和目录型两种方式。如:新浪、搜狐、网易、中华等门户网站。多元搜索引擎:也称为集合型搜索引擎。它是将多个搜索引擎集成在一起,通过统一的检索界面进行网络信息多元搜索的检索工具。国外综合型检索工具目前有记录可查的国外的搜索引擎数量已达到2500个,其中有不少优秀的综合型搜索引擎,如:Google、Yahoo!、AltaVista、Excite、Infoseek、Lycos、HotBot、OpenText等。访问AltaVista(http://www.altavista.com)的次数超过1亿次。HotBot(http://www.hotbot.com)是美国享有盛誉的综合型、混合型搜索引擎。著名综合型检索工具Google
(http://www.google.com)Google是目前世界上最大的搜索引擎,它提供70多种界面语言和35种检索语言,有分类查询和关键词检索两种检索功能。Google不支持“词干法”和“通配符”,但可使用布尔逻辑检索,且逻辑“与”不用算符,词与词之间留一空格,逻辑“或(|)”和“非(-)”算符前必须留一空格。简单检索可直接使用字段限定检索。Google的字段限定检索site:限定在某个特定的域或站点中进行检索。命令格式:检索词site:域名示例:要搜索北京大学山鹰社的信息。检索式:山鹰社site:pku.edu.cn
inurl:表示限定搜索结果,网页的URL必须包含所规定的字符串。命令格式:inurl:限定的字符串检索词示例:搜索电子商务软件环境的专题资料。许多中文网站都以“dzsw”作为电子商务专题目录或频道名称。检索式:inurl:dzsw软件环境
filetype:用来限定命中文件的类型。命令格式:filetype:文件类型检索词
试析检索式:filetype:ppt信息检索著名综合型检索工具Yahoo
()Yahoo是因特网上历史最悠久、用户数最多的综合型、混合型搜索引擎,是分类式搜索引擎的典范。它拥有10余种语言版本,且各版本的内容互不相同。如果用户的检索词在Yahoo!中查询不到结果,它会自动将查询转交给Google搜索引擎做进一步的检索。Yahoo!支持词语检索和“+”和“–”限制检索等,它还提供日期限定、URL和题名限制检索等。“+”限定关键字串一定要出现在结果中;“–”限定关键字串一定不要出现在结果中。Yahoo搜索(续)(http://cn.)“雅虎中国”(http://cn.)提供了一份细蜜、层次丰富的中文网站分类目录。雅虎允许用多个关键词检索,各个关键词之间必须留一个空格,系统默认逻辑“与”检索。雅虎支持词组短语检索和“+”和“–”限定符,提供两种字段限定功能:t:网站名称搜索和u:网址(URLs)搜索。综合型中文搜索引擎目前形成规模的综合型中文搜索引擎有:搜狐、网易、新浪、天网、北极星、搜索客、悠游、中国搜索、263在线搜索引擎、21cn搜索引擎、TOM中文搜索、常春藤、焦点搜索引擎、看中国、中国搜索、中国导航等。综合型中文搜索引擎(续)新浪搜索(http://search.sina.com.cn):采用具有世界先进水平的百度搜索技术。提供“分类检索”和“关键词”查找两种查找方法。搜狐搜索(http://dir.sohu.com):采用先进的Google检索技术,提供多语言检索。天网搜索(http://e.pku.edu.cn):支持中英文搜索,只提供关键词查询方式。百度搜索引擎百度(http://www.baidu.com):百度搜索引擎是目前最有影响的中文网络信息检索系统。它的检索词可以是中文、英文、数字,或中英文数字的混合体。百度提供逻辑与、或、非检索,多个关键词之间必须留一个空格,系统默认为逻辑“与”检索,其他同Google的检索方法。百度的字段限定检索同Google专题型搜索引擎专题型检索工具专门提供某一学科/主题范围的网络信息资源导航系统。塞迪网“IT罗盘”(http://itsearch.ccidnet.com):塞迪网是国内著名的面向IT行业提供全面信息服务的垂直门户站点。因特网法律资源指南(InternetLegalResourceGuide,简称ILRG。(http://www.ilrg.com):是1995年美国推出的第一家系统、全面提供法律网络信息资源导航网站。它选择收集了来自238个国家、地区的4000多个与法律密切相关的网站,提供了较全面的法律信息检索。中文多元型搜索引擎多元搜索引擎又称为集合式搜索引擎。它是将多个搜索引擎集成在一起,通过一个统一的检索界面方便、快速、全面获取网络信息的检索工具。中文多元型搜索引擎(续)万维搜索引擎(http://www.widewaysearch.com):是上海万维信息技术有限公司2000年推出的多元搜索引擎。网络灯塔(http://www.haiyan.com/steelk/navigator/gbindex.htm):集成了50多个中文搜索引擎,分别提供简繁体中文网站、网页和新闻的多元信息搜索服务。英文多元型搜索引擎Dogpile(http://www.dogpile.com):是因特网上最早出现也是影响最大的多元搜索引擎。Dogpile集成了21个不同类型的搜索引擎,按照检索对象可以将这些检索工具分成6种类型:Web页、图像、FTP文件、新闻组、多媒体。系统支持的运算功能与运算符主要有4种:AND,+;OR;NOT,-;词组短语(用双引号)。MetaCrawler(http://www.metacrawler.com):是因特网上最有影响的多元搜索引擎之一,也是最典型的综合型集成搜索引擎。FTP资源及其使用FTP是英文TransterProtocol(文件传输协议)的缩写,和TCP/IP一样是因特网上广泛使用的一种通讯协议,是互联网上传送文件的标准。如果说TCP/IP是实现不同机器,不同操作系统、不同网络间互联的一座桥梁的话,那么FTP则是把资料从此岸传输至彼岸的货车。通过FTP协议,我们就可以跟互联网上的FTP服务器进行文件的上传(upload)或下载(download)等动作。FTP资源及其使用(续)和使用自己的硬盘不同,FTP服务器并不是可以随意使用的,上载和下载通常只对部分用户,因此登录FTP服务器需要用户帐号和口令。不过,在互联网上有很多匿名(anonymous)的FTP服务器,这些服务器向全世界开放,可以公开访问。这些FTP服务器在登录时使用“anonymous”作为用户名,而将你的E-mail地址作为口令进行登录。FTP资源及其使用(续)通过命令行使用FTP(略)用IE或Netscape浏览器进行文件传输:IE或Netscape不仅可以访问WWW主页,也可以访问FTP服务器。只要在地址栏中输入相应的服务器地址,然后按回车键。一个典型的FTP地址是:ftp://ftp.lib.pku.edu.cnFTP搜索引擎如同搜索主页一样,可以用FTP搜索引擎来搜索一个文件存在于哪些互联网的FTP服务器上。为什么要使用FTP搜索引擎呢?1.在WWW主页上搜索到的文件往往要经过多重链接才能下载;2.下载速度慢(用http方式下载)且大多数不能断线连续传;3.更多的文件只是放在FTP的主机上,并没有做http链接,用户经常舍近求远。CERNET内的主要的
FTP搜索引擎北大天网的FTP搜索引擎http://bingle.pku.edu.cn星空互联之FTP星空搜索http://sheenk.com/ftpsearch/search.html南京理工大学的“一网打尽”搜索引擎http://search.njust.edu.cn西安交通大学思源搜索引擎http://search.xjtu.edu.cn北京科技大学幻想FTP搜索.cn中国科技大学天狼中英文搜索引擎http://search.ustc.edu.cn非CERNET的主要的
FTP搜索引擎中国自由软件库http://freesoft.cei.gov.cn/freesoft.html中国下载(原名“金蜘蛛”软件下载中心)http://.cn国外FTP搜索引擎http://gais.cs.ccu.edu.tw/GaisFtp收录台湾大学里面的FTP站点,可以限定前方一致和区分英文大小写。http://www.philes.com自称全球最大的FTP搜索引擎。http://www.alltheweb.comhttp://www.filesearching.comhttp://www.ftpfind.com中国教育科研网内主要FTP站点北京大学ftp://ftp.pku.edu.cn允许匿名方式北大图书馆ftp://ftp.lib.pku.edu.cn允许匿名方式访问北京大学计算机系ftp://ftp.cs.pku.edu.cn允许匿名方式访问清华大学ftp://ftp.tsinghua.edu.cn北京邮电大学ftp://ftp.bupt.edu.cn允许匿名方式访问,人数限制80国内其他FTP站点中国下载FTP服务器:.cn/黄金眼FTP服务器:2EastDoor亦多下载中心FTP服务器:20深圳热线FTP服务器:ftp://ftp.szonline.net中国经济信息网FTP服务器:ftp://ftp.cei.gov.cn中经网自由软件FTP服务器:ftp://freesoft.cei.gov.cn
国外FTP站点微软FTP服务器:ftp://ftp.microsoft.comIBM电脑FTP服务器:ftp://ftp.pc.ibm.comBorland公司FTP服务器:ftp://ftp.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 商务会议组织中的礼仪体系试题及答案
- 公厕安全我知道
- 急诊留观病人管理办法计划
- 年度创新计划的实施路径
- 设计用户体验的提升方案计划
- 提高服务意识的工作计划
- 开展社会责任活动的工作思路计划
- 希望这些标题能够帮助你!计划
- 制定个人会计专业技能拓展计划
- 生物实践基地建设计划
- 2025年军队文职考试《公共科目》试题与参考答案
- 2023年新疆中考英语试题(含答案)
- 咨询顾问费合同范例
- 重大火灾隐患判定方法知识培训
- 北师大版四年级下册数学第一单元测试卷带答案
- 2024中国工业品电商采购白皮书
- 二年级数学绘本
- 矿业废弃地生态修复与再利用
- 部编版六年级下册语文古诗三首《石灰吟》(课件)
- GB/T 44465-2024虚拟/增强现实内容制作流程规范
- DBJ50-T-390-2021公交停车港设计标准
评论
0/150
提交评论