版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
相关检索技术2023/2/51主要内容布尔逻辑检索1截词检索技术2位置算符检索3词组检索与字段检索4其它检索技术52023/2/52布尔逻辑检索运用布尔逻辑算符(Booleanoperators)对检索词进行逻辑组配,表达两个概念之间的逻辑关系。布尔逻辑算符主要有AND(与)逻辑乘OR(或)逻辑加NOT(非)逻辑减2023/2/53布尔逻辑在中文数据库里,布尔逻辑运算符有时用AND、OR、NOT表示,有时用“*”、“+”、“-”有时也用“+”表示AND“-”表示NOT默认为OR2023/2/54逻辑与(逻辑乘)表示概念的相交、限定,缩小检索范围,提高检准率。用运算符号AND或*连接检索词
AANDB
A
B2023/2/55“逻辑与”举例计算机在图书馆的应用计算机图书馆计算机
AND
图书馆2023/2/56“逻辑与”举例人类活动对群落多样性的影响检索概念人类活动、群落多样性、影响检索式人类活动AND群落多样性人类活动AND群落多样性AND影响2023/2/57人类活动AND群落多样性2023/2/58人类活动AND群落多样性
AND影响2023/2/59逻辑或表示概念的平行、并列,用于扩大检索范围,提高查全率用运算符“OR”
或“+”连接两检索词
AORB
A
B2023/2/510“逻辑或”举例乙肝病毒的研究
检索词乙肝、乙型肝炎、HBV、HepatitisBvirus检索式乙肝OR乙型肝炎ORHBVHepatitisBvirusORHBV2023/2/511HepatitisBvirus2023/2/512193条命中结果2023/2/513HepatitisBvirusORHBV2023/2/514311条命中结果2023/2/515逻辑非去掉一个主题中某一部分的主题,用于缩小检索范围,提高查准率;用运算符号“NOT”或“-”连接两检索词
ANOTB
A
B2023/2/516“逻辑非”举例例1:查“玉米但不是甜玉米”方面的文献。检索式=玉米-甜玉米例2:查“国外有关数字图书馆方面”的文献检索式=数字图书馆-国内2023/2/517复合(嵌套)布尔检索运算顺序:NOT>AND>OR可通过()来改变运算的优先顺序例:乙肝病毒受体的筛选检索词
HBV、HepatitisBvirus、receptor、screen检索式
(HBVORHepatitisBvirus)ANDreceptorANDscreen2023/2/518
2023/2/51910条命中结果2023/2/520截词检索在实际检索中,常遇到词干相同、词义相近的检索词,或同一词的单、复数形式,动、名词形式,英美拼法等。用截词符号“?”、“*”或“$”加在检索词的前后或中间,以检索一组概念相关或同一词根的词。2023/2/521截词检索这种检索方式可以扩大检索范围,提高查全率。截词运算符号通常有两个“?、*”在不同系统中表示的含义不同。2023/2/522按截断的位置分后截断、前截断、中间截断按截词的字符数量分
有限截词无限截词2023/2/523后截断在检索词后(右方)截断有限或无限的字母。如:librar*
library、librarian、libraries……主要用于词的单复数检索、词根检索(socio*)、年代检索(199*)2023/2/524前截断将截词符号放在检索字符串的左方,表示其左边不管截去多少个字符,只要与截词符后面部分字符相同的检索词即可。也称为后方一致。如:*chemistrymicrochemistry、macrochemistry2023/2/525中间截断又称“通用字符法”或“内嵌字符截断”,在检索词中间加一个或几个?号。主要解决一些英美拼写不同,单复数形式的不同的词的输入。输入wom?n可检出woman,women输入defen?e可检出defence、defense2023/2/526有限截词即在检索词后截去有限的字母,如名词的单复数,动词的词尾变化等。输入computer??表示有0-2个字母变化,可检出computer和computers.输入stud???表示截断处有0-3个字母变化,可检出study,studies,studied。2023/2/527无限截词在检索词后加一个“*“,表示该词后可加任意个字符。使用无限截词,所截词根不能太短,否则会输出许多无关文献,易误检。
例如:educat*
可检出educator,educators,educated,educating,education2023/2/528位置算符检索布尔逻辑运算符有时难以表达某些检索课题的确切提问要求,用词间位置算符来限定和组配检索词,可弥补布尔逻辑算符只是定性规定检索词的范围。2023/2/529位置算符检索就是利用一些特定的位置算符来表达检索词之间的位置关系,并且可以不用叙词表而直接使用自由词进行检索的方法。位置算符检索2023/2/530位置算符通常只出现在英文数据库中,多用于全文检索。常用的位置算符有W、nWN、nNF、SAME位置算符2023/2/531W功能:两词相邻,词序不变,中间不可插词,但两词间可有一个标点,连字符或空格。表达式Education(W)school或EducationWITHschool
检索结果educationschool;education-school2023/2/532nW功能:两词相邻,词序不变,两词之间允许插入0~n个词。表达式:electronic(1W)resources检索结果ElectronicresourcesElectronicinformationresources2023/2/533N功能:词序不限,中间不可插词,但两词间可有一个标点,连字符或空格。表达式:Education(N)school检索结果EducationschoolEducation-schoolSchoolofEducation2023/2/534nN功能:词序不限,中间可插0~n个词,两词间可有一个标点,连字符或空格。表达式:Education(1N)school检索结果EducationschoolschoolofeducationEducationandschoolschoolofmusicandeducation2023/2/535F功能:两词必须出现在同一字段中,词序与词量不限表达式:Education(F)school/AB检索结果:Education和school必须同时出现在文摘字段内即可字段名,表示文摘2023/2/536SAME功能:两词出现在同一自然句中,其词序与词量不受限制表达式:EducationSAMEschool检索结果:Education和school两词出现在同一句子中即可。2023/2/537词组检索将一个词组或短语用双引号“”括起作为一个独立运算单元,进行严格匹配,以提高检索准确度。
如:“GlobalPositioningSystem”,只检索出规定字段中包含完整词组的记录。2023/2/538不加“”检索2023/2/539命中结果504条2023/2/540词组检索“”2023/2/541命中结果431条2023/2/542字段检索组成数据库的最小单位是记录,一条完整记录的每个著录事项为字段。在许多检索检索系统中,为了提高查全率或者查准率,需要将检索过程限制在特定的字段中,即字段检索。2023/2/543数据库中常用检索字段列表西文数据库常用字段中文数据库常用字段字段名称字段代码AbstractsAB摘要AuthorAU作者CorporateSource、Organization、CompanyCS机构名称Descriptor、SubjectDE叙词/主题词DocumentTypeDT文献类型Full-textFT全文ISSNISSN国际标准连续出版物号JournalName、PublicationTitleJN期刊名称Keyword、TopicKW关键词LanguageLA语言PublicationYearPY出版年TitleTI标题2023/2/544使用字段检索对检索出文献数量和相关程度有极大影响。例如:DVD、DVD/ab、DVD/kw、DVD/ti、这些检索式从左到右检索范围缩小,检索出文献的数量也随之减少,但检索出文献与课题(DVD)的相关性提高。字段检索2023/2/545其它检索技术区分大小写检索Web:专指万维网web:表示普通的网(蜘蛛网)2023/2/546加权检索加权检索用加号表示某检索词一定要在检索结果中出现如:“十亚洲十金融风暴”含义是:找出关于在亚洲发生的金融风暴的信息,而不要亚洲之外的(即结果中必须同时有“亚洲”和“金融风暴”这两个词)2023/2/547加权检索减号则用于表示英检索词一定不能出现在检索结果中。如:“十亚洲十金融风暴一南美洲”检索结果中绝对不要含有关于南美洲的信息(即检索结果中一定不能有“南美洲”这个词)。2023/2/548加权检索由于加权检索技术在网络信息检索中应用的时间较短,因此,检索提问往往不能获得预期的效果。如果在一个检索提问中使用了表示加权捡索的加号或减号,其余未加符号的检索词在检索过程中的作用将被大大减弱。2023/2/549自然语言检索自然语言捡索指用户在检索时可输入自然语言表达的检索要求。例如“P1easefindformesomethingaboutautomobilesaleinNewYorkstate”检索工具会按照提问检索出关于在纽约州(NewYorkstate)汽车销售(automobilesale)的信息。2023/2/550自然语言检索这种检索的基本处理过程是:检索工具在接收到用户提问后,首先利用一个禁用词表从提问中剔除那些没有实质主题意义的词汇。例如各种副词、介词、代词、常用请求词(please、help、would、may等)、检索提问词(find、search、locate、check、information、materials等)然后将余下的词汇作为关键词进行检索。2023/2/551自然语言检索自然语言检索的效果取决于检索工具选择关键词的效率,而这方面我们仍面临许多局限。且用户输入词汇中往往有一些属于“禁用词”但确实表达了实质主题意义,如:
“help
mefindsomematerialsonsearchengines”中的‘‘search”、‘‘locatedepartmentsofmaterialssciences”的“materials”
由于现在几乎所有检索工具都支持简单关键词检索,所以直接输入某句话中的关键词要比输入这句话本身要好得多(至少输入几个词吧)。2023/2/552相关信息反馈检索在检索过程中人们会发现某个结果非常符合自己需要,因此希望能进一步检索到与该结果类似的结果,我们称之为相关信息反馈捡索。我们可以人工进行这种检索,从已检索的信息中选取与提问相关的词语,作为下一轮检索的检索词。2023/2/553相关信息反馈检索利用相关信息反馈检索,人们获得的检索结果似滚雪球一般,愈来愈多。SearchformoredocumentslikethisoneMor
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 综合消费受托支付合同(2篇)
- 银行贷款进货合同(2篇)
- 2024-2025学年初中同步测控优化设计物理八年级下册配人教版第11章 第4节 机械能及其转化含答案
- 荷花 作文 课件
- 西京学院《中国文化经典选读》2022-2023学年第一学期期末试卷
- 西京学院《土木工程施工技术与组织》2022-2023学年第一学期期末试卷
- 西京学院《建筑工程计量与计价》2022-2023学年第一学期期末试卷
- 西京学院《非线性编辑》2022-2023学年第一学期期末试卷
- 西京学院《大数据存储与管理技术》2023-2024学年期末试卷
- 西华师范大学《学科课程标准与教材研究》2021-2022学年第一学期期末试卷
- 八年级物理全册全套试卷综合测试卷(含答案)
- 人教版数学七年级上册动点专题讲义
- 立式机组轴线调整及瓦间隙计算
- 数字媒体艺术与设计职业生涯规划书
- 水泥池清淤施工方案怎么写
- 幼儿园晨检记录表模板
- OSA患者围术期管理的专家共识
- 第8课认识tcp-ip 课件 2023-2024学年浙教版(2023)初中信息技术七年级上册
- 中等职业学校教育特色化专业建设方案(机电技术应用专业)
- 河北省沧衡八校联盟2023-2024学年高二上学期11月期中数学试题
- 公文格式(政府发文与政府发文)
评论
0/150
提交评论