数据库检索方式课件_第1页
数据库检索方式课件_第2页
数据库检索方式课件_第3页
数据库检索方式课件_第4页
数据库检索方式课件_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章计算机信息检索的基本技术与方法第四章1计算机信息检索的基本技术:布尔逻辑、截词检索、加权检索,位置算符等在进行计算机检索时,有时有一些比较复杂的课题,如:“GPS在建筑中的应用”,既涉及GPS,又涉及建筑,还有“应用”,这时候就要编制出满足要求的计算机检索式,它是机检的基础。1布尔逻辑检索(BooleanLogicRetrieva)逻辑检索的基础是逻辑运算,逻辑运算中最常用的是布尔逻辑运算符(BooleanLogicOperators),即与或、非三种运算符号,用它们可以表示概念之间的逻辑关系。计算机信息检索的基本技术:2检索要逻辑检课题表达式检索结求索果概念相AND与让算机用于制图AANDB缩小检交、限ABA*B索范围定提高查准率概念平OR土地管理与土地利用AORB扩大检行、并或+ABA+B索范围提高查全率某一主题去NOT非除光电测以外的BNOTA提高查掉一部分相电磁波测距B-A准率关主题B检索要逻辑检32位置算符(ProximityOperators)位置算符是表示检索词之间位置关系的一种运算符。由于英文对一句话有多种表达方法,写法可能不同。如:“GPS在铁路桥研究中的应用”这个课题,用英文表达可能是“UsingofGPsinRailwaybridge”,也可能是“UsingofGPsinBridgeofRailway”,因而可能编制出这样的检索It,GPSAND(Railway(2N)Bridge)我们可以通过位置检索提高检索的准确率2位置算符(ProximityOperators)4(1)(W)算符与(nW)算符W是word与with的缩写。特点:W词序不变,中间不可插词,但两词间可有个标点,连字符或空格。nW词序不变,中间可插入N个词。如:potential(w)energy可能检出potentialenergyandfunction又如:gone(2w)wind可能检出gonewiththewind(2)(N)与nN)算符N是near的缩写特点:N词序不限,中间不可插词,但两词间可有一个标点,连字符或空格。nN词序不限,中间可插入N个词。如:econom??(2N)recovery可能检出economIcrecovery,recoveryoftheeconomy,(1)(W)算符与(nW)算符W是word与with的缩写。5(3)同字段检索A(F)B,F是fled的缩写。特点:A、B两词必须出现在同一字段中,词序与词量不限如:environment(F)impact/DE,表示两个词必须同时出现在叙词字段内。(4)同句检索A(S)B,S是sentence的缩写特点:A、B出现在同一自然句中(子字段),其词序与词量不受限制如:electric(S)pant可检出electricpowerplants如:E中的NEAR;PQDD中的Wn(两词间距小于n个单词,且前后位置任意),Pren(两词间距小于n个单词,且前后位置一定)(3)同字段检索A(F)B,F是fled的缩写。63小词算特Truncatingoperators)原因:在英语词汇中,一个词可能有多种形态,如词的单、复数形式的不同,英美拼写方法不同、词性不同等。如果检索时将这类词全部输入进去,会增加检索时间和费用,采用截词法可解决这一问题。所谓截词检索,是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。检索中计算机会将所有含有相同部分标识的记录全部检索出来。常用“?”、“*”符号表示(1)有服截词。即在检索词后后截几个有限的字母,如名词的单复数,动词的词尾变化等。如输入computer??表示有0-1个字母变化,可检出computer和computers输入stud???表示截断处有0-3个字母变化,可检出study,studies,studied,studing3小词算特Truncatingoperators)7(2)无限截断:在检索词后加一个“?“,表示该词后可加任意个字符。使用无限截词,所截词根不能太短,否则会输出许多无关文献,造成误检。如:computer?可检出computers,computering,computered,computerization(3)中间截断:在检索词中间加一个或几个?号,主要解决一些英美拼写不同,单复数形式的不同的词的输入,可简化输入。如:输入wom?n可检出woman,women(2)无限截断:在检索词后加一个“?“,表8各种算符在数据库中的实际应用位置算符1)EInearBridgeNEARPiling*表示这两个词要彼此接近,前后顺序不限。W/nPig*W/2pine*表示两个词的距离不能超过n个单词Adjchanneladjtunnel表示含有这两个词,两个词相邻位置一定2)ISIProceedings用同句算符(SAME):如IChannelsametunnel,表示channe1和tunnel出现在同一句子中才符合检索条件。各种算符在数据库中的实际应用93)CSAwithin"X“表示两词之间不得多于X个词,前后位置任意又、如“womenwithin8movement"(顺序不定)Elsevier:ADJ表示两词相邻,前后顺序固定,与"词检"的结果相同;NEAR或NEAR(N),表示西词相邻,中间可插入少于或等于n个单词,前后顺序可以发生变化,如果不使用(N),糸统默认值为103)CSA10数据库检索方式课件11数据库检索方式课件12数据库检索方式课件13数据库检索方式课件14数据库检索方式课件15数据库检索方式课件16数据库检索方式课件17数据库检索方式课件18数据库检索方式课件19数据库检索方式课件20数据库检索方式课件21数据库检索方式课件22数据库检索方式课件23数据库检索方式课件24数据库检索方式课件25数据库检索方式课件26数据库检索方式课件27数据库检索方式课件28数据库检索方式课件29数据库检索方式课件30数据库检索方式课件31数据库检索方式课件32数据库检索方式课件33数据库检索方式课件34数据库检索方式课件35数据库检索方式课件36数据库检索方式课件37数据库检索方式课件38数据库检索方式课件39数据库检索方式课件40数据库检索方式课件41数据库检索方式课件42数据库检索方式课件43数据库检索方式课件44数据库检索方式课件45第四章计算机信息检索的基本技术与方法第四章46计算机信息检索的基本技术:布尔逻辑、截词检索、加权检索,位置算符等在进行计算机检索时,有时有一些比较复杂的课题,如:“GPS在建筑中的应用”,既涉及GPS,又涉及建筑,还有“应用”,这时候就要编制出满足要求的计算机检索式,它是机检的基础。1布尔逻辑检索(BooleanLogicRetrieva)逻辑检索的基础是逻辑运算,逻辑运算中最常用的是布尔逻辑运算符(BooleanLogicOperators),即与或、非三种运算符号,用它们可以表示概念之间的逻辑关系。计算机信息检索的基本技术:47检索要逻辑检课题表达式检索结求索果概念相AND与让算机用于制图AANDB缩小检交、限ABA*B索范围定提高查准率概念平OR土地管理与土地利用AORB扩大检行、并或+ABA+B索范围提高查全率某一主题去NOT非除光电测以外的BNOTA提高查掉一部分相电磁波测距B-A准率关主题B检索要逻辑检482位置算符(ProximityOperators)位置算符是表示检索词之间位置关系的一种运算符。由于英文对一句话有多种表达方法,写法可能不同。如:“GPS在铁路桥研究中的应用”这个课题,用英文表达可能是“UsingofGPsinRailwaybridge”,也可能是“UsingofGPsinBridgeofRailway”,因而可能编制出这样的检索It,GPSAND(Railway(2N)Bridge)我们可以通过位置检索提高检索的准确率2位置算符(ProximityOperators)49(1)(W)算符与(nW)算符W是word与with的缩写。特点:W词序不变,中间不可插词,但两词间可有个标点,连字符或空格。nW词序不变,中间可插入N个词。如:potential(w)energy可能检出potentialenergyandfunction又如:gone(2w)wind可能检出gonewiththewind(2)(N)与nN)算符N是near的缩写特点:N词序不限,中间不可插词,但两词间可有一个标点,连字符或空格。nN词序不限,中间可插入N个词。如:econom??(2N)recovery可能检出economIcrecovery,recoveryoftheeconomy,(1)(W)算符与(nW)算符W是word与with的缩写。50(3)同字段检索A(F)B,F是fled的缩写。特点:A、B两词必须出现在同一字段中,词序与词量不限如:environment(F)impact/DE,表示两个词必须同时出现在叙词字段内。(4)同句检索A(S)B,S是sentence的缩写特点:A、B出现在同一自然句中(子字段),其词序与词量不受限制如:electric(S)pant可检出electricpowerplants如:E中的NEAR;PQDD中的Wn(两词间距小于n个单词,且前后位置任意),Pren(两词间距小于n个单词,且前后位置一定)(3)同字段检索A(F)B,F是fled的缩写。513小词算特Truncatingoperators)原因:在英语词汇中,一个词可能有多种形态,如词的单、复数形式的不同,英美拼写方法不同、词性不同等。如果检索时将这类词全部输入进去,会增加检索时间和费用,采用截词法可解决这一问题。所谓截词检索,是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。检索中计算机会将所有含有相同部分标识的记录全部检索出来。常用“?”、“*”符号表示(1)有服截词。即在检索词后后截几个有限的字母,如名词的单复数,动词的词尾变化等。如输入computer??表示有0-1个字母变化,可检出computer和computers输入stud???表示截断处有0-3个字母变化,可检出study,studies,studied,studing3小词算特Truncatingoperators)52(2)无限截断:在检索词后加一个“?“,表示该词后可加任意个字符。使用无限截词,所截词根不能太短,否则会输出许多无关文献,造成误检。如:computer?可检出computers,computering,computered,computerization(3)中间截断:在检索词中间加一个或几个?号,主要解决一些英美拼写不同,单复数形式的不同的词的输入,可简化输入。如:输入wom?n可检出woman,women(2)无限截断:在检索词后加一个“?“,表53各种算符在数据库中的实际应用位置算符1)EInearBridgeNEARPiling*表示这两个词要彼此接近,前后顺序不限。W/nPig*W/2pine*表示两个词的距离不能超过n个单词Adjchanneladjtunnel表示含有这两个词,两个词相邻位置一定2)ISIProceedings用同句算符(SAME):如IChannelsametunnel,表示channe1和tunnel出现在同一句子中才符合检索条件。各种算符在数据库中的实际应用543)CSAwithin"X“表示两词之间不得多于X个词,前后位置任意又、如“womenwithin8movement"(顺序不定)Elsevier:ADJ表示两词相邻,前后顺序固定,与"词检"的结果相同;NEAR或NEAR(N),表示西词相邻,中间可插入少于或等于n个单词,前后顺序可以发生变化,如果不使用(N),糸统默认值为103)CSA55数据库检索方式课件56数据库检索方式课件57数据库检索方式课件58数据库检索方式课件59数据库检索方式课件60数据库检索方式课件61数据库检索方式课件62数据库检索方式课件63数据库检索方式课件64数据库检索方式课件65数据库检索方式课件66数据库检索方式课件67数据库检索

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论