布尔逻辑检索式_第1页
布尔逻辑检索式_第2页
布尔逻辑检索式_第3页
布尔逻辑检索式_第4页
布尔逻辑检索式_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

布尔逻辑检索式

布尔伯罗斯逻辑搜索包括搜索词和逻辑运算符。一些逻辑运算符、集运算符和真值联结词会导致混淆或误解。在这项工作中,我们使用综合理论和逻辑方法来分析它们之间的相应关系,以提高文献搜索的效率。1逻辑语言和符号的含义和用法1.1检索和检索在某个数据库里,输入检索词或者检索式,检索系统会自动地得到符合条件的命中文献的集合。设有检索词A,没有逻辑运算符,可以在某个数据库中检索出含有检索词A的文献。所有这些命中文献的集合记作S1设有检索词B,没有逻辑运算符,可以在某个数据库中检索出含有检索词B的文献。所有这些命中文献的集合记作S2设有两个检索词(例如A和B)以及一个逻辑运算符,也可以在某个数据库中检索出某些文献。如使用三个逻辑运算符:逻辑与、逻辑或、逻辑非。逻辑“与”算符,用AND或“x”表示;用汉字表示为“并且”。设有检索式AANDB,或A*B,意思是要在某个数据库中检索出既含有检索词A同时又含有检索词B的文献。所有这些命中文献的集合记作S3逻辑“或”算符,用OR或“+”表示;用汉字表示为“或”。设有检索式AORB,或A+B,意思是要在某个数据库中检索出含有检索词A或者含有检索词B或者同时含有检索词A和B的文献。所有这些命中文献的集合记作S4逻辑“非”算符,用.NOT或ANDNOT或“-”来表示;用汉字表示为“并非”。设有检索式ANOTB,或A-B,意思是要在某个数据库检索出含有检索词A同时不含检索词B的文献。所有这些命中文献的集合记作S51.2集合运算符和命题的真值联结词这些集合可以用数学公式表示,也可以用文恩图进行图解。为了完整地表示某个集合S,可以列出它的全部元素,例如:也可以使用构集命题描述集合的全部元素,例如:其中“x≤5”就是一个构集命题。表示“所有的元素x,x小于或等于5”。对于命中文献的集合,数据库通常是列举出它的全部元素。为了准确分析检索式的逻辑运算符,本文使用构集命题描述它的全部元素。a.命中文献的集合可以用符号表示如下。集合运算符的意义参见图1至图5;真值联结词的定义参见表2。上述公式里的符号意义如下所述:∪是并集运算符;是二元运算符;例如:S∪R{x}P(x)}:其中“|”读作“使得”;其意是:该集合的所有元素x,使得构集命题P(x)为真。∀xA(x)是构集命题,其意是:所有文献x,x包含检索词A。∀xB(x)是构集命题,其意是:所有文献x,x包含检索词B。∀x[A(x)∧B(x)]是构集命题,其意是:所有文献x,x包含检索词A并且x包含检索词B。∀x[A(x)∨B(x)]是构集命题,其意是:所有文献x,x包含检索词A或)(包含检索词B。∀x[A(x)∧(B(x))]是构集命题,其意是:所有文献x,x包含检索词A但是x(不包含检索词B。综上所述,在S3,S4,S5的表达式里,集合运算符和命题的真值联结词是完全不同的,但是它们之间却是一一对应的。参见表1。b.命中文献的集合,它们的元素个数有以下数量关系:c.命中文献集合的文恩图,真值联结词的定义。1.3u3000中含声母e的分子身份证编码1:January8:August9:September那么,经过检索以后,可以得到如下命中文献的集合(命中文献以序号表示。)在数据库里,所有的包含字母e的单词的集合,记作S1。在数据库里,所有的既包含字母e也包含字母u的单词的集合,记作S3。S3=S1∩S2={词|[“词包含e”与“词包含u”]}={2,6}在数据库里,所有的或者包含字母e或者包含字母u的单词的集合,记作S4。S4=S1∪S2={词|[“词包含e”或“词包含u”]}={1,2,6,7,8,9,10,11,12}在数据库里,所有的包含字母e但是不包含字母u的单词的集合,记作S5。S5=S1-S2={词|[“词包含e”并非“词包含u”]}={9,10,11,12}在数据库里,所有的不包含字母e的单词的集合,记作S6。S6=~S1={词|[词不包含e]}={1,3,4,5,7,8}在数据库里,所有的不包含字母u的单词的集合,记作S7。S7=~S2={词|[词不包含u]}={3,4,5,9,10,11,12}在数据库里,所有的单词的集合,记作U。2计算函数在搜索公式中的讨论2.1文献筛选和数据整理任意选定一个数据库,任意输入两个检索词,可以分别得到上述的命中文献的集合的元素个数。本文作者使用CNKI和NTSL两个数据库,任意输入10对检索词,实际记录了这些文献数量。经过统计,它们都符合下列数量关系。2.2“清”还是“非”三组符号的对应关系(参见表1)。可见它们相似不相同。逻辑运算符:AND并且(与);OR或;ANDNOT并非。集合运算符:∩交集,∪并集,∩~(-)差集。真值联结词:∧和(and),∨或(or),∧并非(andnot)。对于逻辑运算符“ANDNOT”经常有些误解。经过以上的对比分析可见,误解的原因是,集合里面有差集运算符[-];但是真值联结词里却没有与它对应的单个逻辑学符号。魏铁进将它误解为一元运算符,实际上它由两个运算符组成,一个是二元运算符(AND),一个是一元运算符(NOT)。刘红泉等对“ANDNOT”的文恩图解也是错误的;将集合“S1-S2”误解成“U-S2”,或者误解成“~S2”。在本文的图1、图2图5之间,可以清楚地区别“补集”和“差集”。医学文献检索教材的图解没有画出论域U,虽然正确但有时会引起误解。2.3生成的集合运算逻辑运算符在不同的数据库和搜索引擎里尽管意义相同,但是有各种表现形式。赵媛介绍,它们有不同的代表符号,应注意数据库内部的说明资料。x是任意一篇文献;是变项;U是数据库全部文献的集合;在检索时是个常项;x∈U,x是集合U的元素;∩是交集运算符:是二元运算符;例如:S∩R-是差集运算符;是二元运算符;例如:S-R一是补集运算符;是一元运算符;例如:~R∧数理逻辑的真值联结词,AND;例如:P∧Q∨数理逻辑的真值联结词,OR;例如:P∨Q如果集合的元素个数如下表示,集合S1的元素个数记作|S1|;集合S2的元素个数记作|S2|;集合~S1的元素个数记作|~S1|;数据库U的元素个数记作|U|;集合S3(S1∩S2)的元素个数为|S1∩S2|;集合S4(S1∪S2)的元素个数为|S1∪S2|;集合S5(S1-S2)的元素个数为|S1-S2|;那么,集合的元素个数有以下数量关系:图1~图5,集合运算的文恩图图解。2:February3:M

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论