版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、.,1,科研技能培训,王星华 图书馆咨询部文献检索室 电话:51688293 邮件:,.,2,爆炸的信息和知识,全世界每年生产11018到21018字节的信息,大约为全世界每人250兆字节。 所有印刷载体的信息量只占0.003%,平均年增长率为2%; 磁介质所承载的信息量达93%,年增长率为50%-100%; 网络交流中也产生大量的数字化信息; WWW网络中不重复的可公共浏览的网页21亿(每个网页 平均10数据),每天将会增加7百万新网页; 众多网络数据库还以非网页形式存储了7500TB数据,包含5500亿不同的记录或文件。,加州大学伯克利分校2001年数字信息规模和增长速度调查,.,3,科研
2、投入与信息获取,据统计,科研人员花费在科技文献检索上的时间占整个科研活动的3040%。而由于信息不灵、忽视文献检索而不能及时获取相关的最新科技文献资料,造成了人财力和时间的浪费。 据报道,全球重复研究造成的浪费占科研经费的10%左右。如果科技人员能及时了解当前国内外同行在做的同样或相近的研究工作及其进展情况等就能扬长避短、开拓思路,在新起点上做出新的研究,取得更先进的研究成果。 通过文检课的学习,教会学生“捕鱼”的本领,使学生真正成为科技信息检索的驾驭者,为更好地完成科研工作奠定坚实的基础。,.,4,你是否会经常遇到下列问题 不确定性;机器人;滑动模控制分类号:TP273 文献标识码:B 文章
3、编号:1009-0134(2005)03-0066-03,基于并行工程的CAPP与生产调度集成研究 花广如 赵丽香 周雄辉 摘要:传统的CAPP是基于制造资源静态考虑的, 关键词:CAPP;生产调度;工序分段设计;扩展事件驱动的再调度分类号:TP162;TP39文献标识码:A 文章编号:1009-0134(2005)03-0045-04,.,30,文献标识码示例-2,夯实基础 实现铁路运输安全长治久安 傅志寰 摘要:总结了铁路运输安全5年来创造的历史最好成绩关键词:铁路运输;安全生产;科技;总结;目标分类号:F530.69 文献标识码:C文章编号:1003-1421(2003)01-0001-
4、04,说文解字的流传与版本 冯玉涛 摘要:东汉许慎说文解字是中国历史上第一部字典关键词:说文解字;许慎;流传;版本分类号:G256.3文献标识码:E文章编号:1005-8214(2004)01-0049-03,.,31,文后参考文献类型标识代码规定,文献类型标识: 专著M;期刊J;论文集C;学位论文D;标准S;报告R;专利P;报纸N; 其它未说明的文献类型Z;专著或论文集中的析出文献A; 电子文献类型标识: 数据库DB; 计算机程序CP; 电子公告EB; 电子文献的载体类型标识: 联机网上数据库 DB/OL;磁带数据库 DB/MT; 光盘图书 M/CD; 磁盘软件 CR/DK; 网上期刊 J/
5、OL; 电子公告 ED/OL。,.,32,各类型文献著录及辩识示例-1,1任柏峰.我国铋工业发展现状及对策J.世界有色金属,1999, (11):10-13. 2杨凯华,段隆臣,汤凤林,等.新型金刚石工具研究M.武汉:中国地质大学出版社,2001. 3葛纬桢.近岸工程与小水线面双体船A.第八届全国海洋工程学术会议论文集C,2000. 4Lars Krog,et al.Application of topology,sizing and shape optimization methods to optimal design of aircraft components Z.Altair Eng
6、ineering Ltd. 2002. 5 Altair OptiStruct Users GuideCP. Altair Engineering, Inc.2003. 6 Moore G J.MSC/Nastran users guide V68: design sensitivity and optimizationM.USA:The MacNeal-Schwendler Corporation, 1994. 7GB/T240011996 idt ISO14001:1996,环境管理体系规范及使用指南S.,.,33,各类型文献著录及辩识示例-2,8 ENNIS J B, SONG B M.
7、 Custom design of components and power supplies for pulsed power systemsA. The 29th Annual Conference of the IEEE Industrial Electronics SocietyC, 2003 (1):87-92. 9 张艾锋等.小水线面双体船有限元强度计算报告R.中国船舶科学研究中心科技报告,2004. 10 KUBO S, YAMAMOTO O. Production of Finely-divided Particulate Bismuth OxideP. US: 4675171
8、, 1987-06-23. 11 ALLAITH N A, Grant D A. Intelligent power modules for voltage-fed converter drives.Canadian Conference on Electrical and Computer Engineering C,2000(2):918-921. 12 WADASAKO M, KUBOTA M. Preparation of Compound Bismuth OxideP. JP: 61086423, 1986-05-01. 13 FELDMANN C. Polyol Mediated
9、Synthesis of Sub-micrometer Bi2O3 ParticlesJ.Journal of Materials Science, 2001, 36(2):297-299.,.,34,各类型文献著录及辩识示例-3,14ISO/TC207.International Standards of The ISO 1400 Series S. ,2000-10-03 15HEUBACH R. Process and Apparatus for the Preparation of Bismuth Oxide and Bismuth Mixed O
10、xidesP. EP: 0704408, 1996-04-03. 16中国国家统计局.中国统计年鉴M/CD.2000. 17肖红.救生衣浮力及新型浮力材料的研究D.北京:北京服装学院,2003 18IEEE Std 802.3u-1995(Supplement to ISO/IEC 8802-3:1993ANSI/IEEE Std 802.3,1993).Meia Access Control(MAC)Parameters,Physical Layer,Medium Attachment Units and Repcater for 100Mb/s Operation,Type 100BASE
11、-T (Clauses 21-30) 19海南省国民体质监测中心. 海南省国民体质监测工作数据库DB/MT.2001-03-20.,.,35,各类型文献著录及辩识示例-4,20 黎屹.DSL:点铜成金的宽带接入技术CP/DK.世界电子元器件,2001-01. 21China Academy of Railway Sciences. Report on the Freight Train Derailment Test on the Tianjin-Pukou Railway LineR. Beijing: China Academy of Railway Sciences, 1997.(in
12、Chinese) 22XUE Bi-yi. Mechanism of Derailment and its Experimental StudyD. Chengdu: Southwest Jiaotong University, 1998.(in Chinese) 23李立.公用事业民营化要翻三座大山J/OL. http:/,2003-03-07 . 24黄以宽.电子政务的需求主导辩析DB/OL, http:/. 25张勤.国家知识产权战略的思考EB/OL.http:/. 2004-12-30.,.,36,第三节 文献检索工具的基本概念 一检索工具定义 定义:用来报道,存储和查找文献的印刷型出
13、版物或数据库系统。文献检索工具是指对体积庞大、无序的一次文献经过加工压缩而成体积较小的二次文献,再根据一定的原理和规则编制而成的工具。可满足各种用户的不同层次的检索需求。,.,37,二、检索工具的类型 检索工具可以依据不同的标准来划分,根据著录内容可划分为以下四种: 1.目录 ( catalog ) 目录是对一批相关文献外部特征的揭示和报道。通常以一个完整的出版或收藏单位为著录的基本单位来报道和记录文献。只记录文献外部特征(如名称,著者,出版事项等)。目录一般按分类或字顺编排,主要供人们了解出版或收藏机构是否拥有所需图书、期刊等出版物。 目录类型: 馆藏目录:反映一个图书馆文献收藏情况的目录。
14、 中国国家图书馆 http:/ 联合目录:反映一个地区或一个系统甚至全国或世界范围的图书馆、信息服务机构文献收藏情况的一种统一目录。 全国中西文期刊联合目录0/catalog/default.htm CALIS联机公共数据库 http:/ OCLC联机检索系统(见第二讲内容),.,38,按出版类型划分:图书目录、期刊目录、会议论文目录。 按物质形式划分:卡片目录、书本目录、机读目录(MARC)、联机公共检索目录(OPAC ,Online Public Access Catalog )等。 目录示例: 可参照图书馆主页熟悉了解。 http:/202.112.
15、150.129/index.htm,OPAC :是指以计算机编码形式存贮在计算机 系统内,供读者通过终端设备进行联机检索的 图书馆目录,即书目数据库的一种形式。,.,39,2. 题录 ( bibliography 、bibliographic、citation ) 题录是单篇文献外表特征的揭示和报导,即对某一文献外部特征的描述,由一组著录项目构成一条文献记录。 题录的著录项目一般有著者,篇名及出处等,常以一个内容上独立的文献单元(如一篇文章,图书中的一部分,有时也可以是整本出版物)为基本著录单位。题录在揭示文献内容的深度方面,比目录深入,但又比文摘简单。 示例1:,.,40,文摘示例1:,3.
16、 文摘 ( abstract ) 文摘是指对一份文献(或称一个文献单元)的内容所做的简略、准确的描述,文摘的著录项目除了著者,篇名及出处等外,还有表示文献内容特征的摘要。,.,41,4. 索引 ( index ) 索引是对一组信息集合的有系统的指引。索引是一种附属性的检索工具,通常称为辅助索引。索引具有便于检索,揭示事物比较深入、全面、明细等方面的优点。 索引的用途在文献检索中体现得极为突出,科技文献数量庞大、内容复杂多样,使用面广且频繁。虽然已将其中绝大部分加工压缩成文摘或题录等。但如果没索引,查检起来还是很不方便。严格地说,没有索引的检索工具不能称为完善的检索工具。 最常用的索引是主题索引
17、、分类索引和著者索引等。,.,42,索引示例:Ei CPX Web (工程索引网络版索引显示格式),.,43,三、网络信息检索工具 搜索引擎( Search Engine ) 定义:是一些在网页中主动搜索信息并将其自动索引的Web网站,与普通网站不同的是,搜索引擎网站的主要资源是它的索引数据库,收集了全世界成百万上千万个网站和网页的信息,存储在可供检索的大型服务器中,建立索引和目录服务。 主要功能:是为人们搜索Internet上信息并提供获得所需信息的途径。 “搜索引擎”也就是指充分利用各种网络自动搜索技术,对网络信息资源提供强有力检索的工具。 常用搜索引擎介绍与链接: 1.EI中的Sircu
18、s 2.百度搜索 http:/ 3.http:/ ,.,44,第四节 文献检索的方法和途径 一、检索方法 文献检索的方法(查找文献的方法)大致可以归纳为三种: 1.直接法:即直接利用文献检索工具或检索系统来查找文献的方法,是一种常规的科学检索方法。分为顺查法、倒查法和抽查法。 2.追溯法:又称引文法,是一种跟踪查找法。是利用文献(尤其是评述性论文或有关专著) 后面所附的参考文献,进行逐一地追踪查找原文。(例如:SCI) 3.综合法:1、2两种方法的综合。利用检索工具或检索系统进行常规检索,再利用文献后所附参考文献进行追溯检索,分期分段交替使用这两种方法,直到满足要求为止。可以查得较全面较准确,
19、尤其适用于那些过去年代内文献较少的课题。,.,45,追溯法示例,通过文后参考文献查找,.,46,二检索途径 文献检索的途径主要可以分为以下几种: 1. 内容途径 文献检索一般是根据课题内容查找有关的文献信息,因此该途径是主要的检索途径。内容途径又可分为以下两种检索途径: 分类途径 是一种按照文献信息所属学科(专业)属性(类别)进行检索的途径。一般检索系统均提供数据库所使用的分类表的分类号索引。 主题途径 通过文献信息的内容主题进行检索的途径。计算机检索主要是主题检索,检索系统可提供多个检索点。,分类语言 分类表 分类语言 是一种按学科范畴和体系来划分事物的检索语言,以分类表的 形式体现。它展示
20、了学科的系统性,反映了事物的从属、派生关系,从上至下, 从总体到局部层层划分展开,是一种等级体系。由类目和相对应的类号来表达 各种概念,构成一个完整的分类类目表。 如:中国图书馆分类法,.,47,中图法的分类原则,根据当前社会科学和自然科学所包括的学科多、发展快等特点,按图书学科内容作为分类的主要标准与依据。将图书在五个基本部类的基础上分为22个大类,分别以拉丁字母AZ表示。,.,48,示例:中图法,社 会 科 学,自 然 科 学,.,49,索书号: 是识别一种图书的唯一标识,图书馆同一分类号的文献数量很多,为了区别相同类号的文献,在分类号的基础上,又给了一个区分符号,这个符号称之为书次号。书
21、次号与分类号一起共同构成索书号。图书馆的文献就是按照索书号的顺序排架管理的。 中文书索书号如:TP312/ 39, 西文书索书号如:O6/ FC56,.,50,2. 著者途径 是根据已知文献著者姓名来查找文献的途径。文献著者包括个人著者和团体著者。一般检索系统都有著者(个人)索引,有的还有团体著者(机构)索引,均按字顺编排,其下为记录个数或文摘号。在利用内容途径查文献有困难时,如一些新近发展起来的学科或技术,往往难于确定类目或检索词,使用著者途径查找文献就显出其优越性,但该方法不能满足全面检索某一课题文献的需要。 3. 名称途径 根据文献的名称查找文献的途径。一般多用于查找图书、期刊、会议名称
22、。常用于目录性检索工具/系统,如书名目录期刊目录期刊联合目录等。 4. 序号途径 以文献的编号为特征,检索文献的途径。根据一些文献类型的特有标识,如科技报告的报告号;专利文献的专利号、入藏号,合同号,技术标准的标准号;ISSN,ISBN等作为检索点。 5. 其他途径 如分子式、元素符号、数字等。,.,51,.,52,核心期刊: http:/,.,53,三、文献检索步骤,检索步骤是根据既定课题要求,利用检索工具查找有关文献资料的具体过程,实际是信息检索的具体化。为实现检索而制定的计划或方案称之为检索策略。主要有以下步骤: (1)进行课题分析,明确课题需求。 指在着手查找文献信息前对课题内容进行分
23、析,明确文献检索的目的需求。 课题需求可以分为三种类型: 普查型:需要全面收集有关某一主题的文献资料,如以课题开题、教材编写、专题综述、学科总结、基础研究或应用研究为目的的课题。这类需求具有普查、回溯的特点,要求尽可能高的查全率。 攻关型:需要收集有关某一主题某一特定方面的文献,其目的在于解决科研、生产中的关键问题,这类需求不强调查询的文献数量,但需要查得的文献具有较强的专指性。 探索型:需要了解掌握某一领域的最新研究动向或研究成果,要求查到的文献具有新颖及时的特点,而对查全率和查准率不一定有很高的要求。,.,54,课题分析,课题分析:要求明确课题对查新、查全和查准的要求,主要包括信息的内容需
24、求和形式需求。 内容需求指检索课题涉及的学科范围、主题内容和有关的主题词、分类号等,以及它们之间的逻辑关系。 在此基础上,确定检索主题,根据其结构、类型、专业范围、性质等,提取主题概念、尤其注意挖掘隐含的主题概念,形成若干能代表信息而且有检索意义的主题概念。 形式需求包括所需文献的类型、数量、语种、年代等。,.,55,(2)选择检索工具,选择检索工具时要考虑是否与文献需求紧密结合、学科专业对口、覆盖信息面广、报道及时、揭示信息内容准确、有一定深度的工具以及检索系统的检索功能是否完善等,主要有几个方面: 全面性,即是否与课题相关的内容都要检索,包括的工具有一次文献和二次文献数据库,以及网上相关资
25、源等。 针对性,保证选择的检索工具与检索课题的学科一致; 专业性,即选择与学科专业相关的工具,特别注意跨学科领域内容; 权威性,尽量选用该学科的权威性检索工具; 了解检索工具收录的范围,包括时间跨度、地理范围、文献语种、类型等; 检索工具的检索方法和系统功能是否全面有效。,.,56,(3)确定检索词,检索词是表达信息需求和检索课题内容的基本单元,选择恰当与否,会直接影响检索效果。检索词可分为四类: 表示主题的检索词,包括经过人工规范化处理的标题词、单元词、叙词(将有稍后叙述)和未经规范化处理的自然语言关键词。 表示作者的检索词,包括作者姓名及机构名称。 表示分类的检索词,如分类号等。 表示特殊
26、意义的检索词,如专利号、标准号、分子式等。 检索词的选择与确定要注意两个原则: 根据检索课题所涉及的学科专业和技术内容选词; 对检索词进行处理,一个概念可以用不同的词来描述,不同的角度反映了同一概念的不同内涵,具有不同的切题深度和广度,因此要注意比照,选用规范词汇,尽量使用通用术语。,.,57,(4)制定检索式,选择检索途径,构造检索式,利用检索词和课题的逻辑关系构造出既能表达课题需求,又能被计算机识别的检索提问式, 检索式由检索词和和各种布尔逻辑算符、位置算符、截词算符及其它链接组配符号组成。 检索式是检索策略的具体体现,是检索策略构造中的关键环节,其优化与否决定了检索的质量,对检索结果产生
27、决定性作用。 检索式可一次完成,也可分步完成,检索式的表达对一个课题不是唯一的,有多种选择、组配、限定。 拟定好检索式后,就要选择检索点,也就是选择检索途径或检索入口或检索字段,常用的检索入口有题名、著者、主题词、关键词、引文、文摘、全文、出版年、分类号等。 检索点正确与否决定着检索结果的数量和质量,如使用全文检索,结果数量大,但相关性差;使用题名或文摘检索,结果数量少但较准确。,.,58,(5)调整检索策略,检索过程是一个动态的随机过程,需要随时根据反馈的检索结果进行评估,针对与检索目标相差甚远或不理想的结果,反复调整检索式,直到得到满意的结果。 检索策略的优化:,扩检:对检索数量比较少的结
28、果,扩大检索范围,提高查全率。 增加补充检索词及近义词、同义词、上位词、缩写、全称等; 扩大概念组配范围,变逻辑“与”为逻辑“或”; 取消或放宽检索限定,如年限或核心刊与否; 增加或修改检索途径,如改题名检索为文摘检索或全文检索等。 缩检:对检索数量过多的结果,缩小检索范围,提高查准率。 细化主题与分类,更多地采用下位词或下位类; 通过浏览结果选择更专指的词; 缩小概念组配范围,利用and,not,with,near等加以限制或排除; 指定检索字段,及从年代和地理及语言,文献类型上进行限制。,.,59,(6)原文获取,文献检索的最终目的是找到适合的原文文献,有几种方法: 先电子后印刷,数字化出
29、版物一般更新快、出版快、查询输出方便,利用有关全文数据库,打印下载原始信息; 先近后远,利用图书馆馆藏目录获取原始信息,如先查本馆馆藏,再利用联合目录查找附近的馆藏; 利用馆际互借及原文传递服务,馆际互借是馆与馆间的图书资料借阅合作,是图书馆开放服务的一个重要方面,应充分使用; 充分利用网络环境下的资源共享,一方面Internet网上提供了许多免费的原文,另一方面,原文数据库商也提供原文链接服务,只要提出申请即可满足需求。其特点是:速度快,保障率高,价格较贵。提供这种服务的如ProQuest、OCLC、ISI等。要充分利用这些联机信息和网络信息,网上订购、联机传递、E-mail、FAX或脱机邮
30、寄等方式获取原始信息。,.,60,文献信息检索步骤流程图,明确需求,分析主题,选择检索工具或数据库,确定检索词,制定检索表达式,提交检索表达式,修改检索式,获取原文,完成,显示与优化检索结果,.,61,图书馆购买、拥有使用权 的电子资源(网络资源),一、数据库概念,由IP地址限制, 专线访问,,免费使用,并发用户 ( 3-15人 ),注意:严禁过量下载,即在一定时间内集中、 批量下载全文数量 超过50篇以上,电子资源 知识产权,第五节 计算机检索基础知识,.,62,二、数据库的类型 目前在计算机检索领域中数据库种类繁多,为便于学习,归纳为文献数据库和非文献数据库两大类。 文献数据库包括:题录文
31、摘数据库、全文数据库; 非文献数据库包括:事实数据库、数值数据库等。 1. 题录、文摘数据库 (bibliographic database): 是一种二次文献数据库,主要存贮相关主题领域的各类文献资料的书目信息,包括机读版的文摘、题录、目录、索引等。用户可从大量文献记录中筛选出有参考价值的文献源,并依据记录提供的来源指示获取一次文献。如:Ei CPX Web(工程索引)、中文期刊数据库(文摘题录版)等。,.,63,2.全文数据库(full-text database): 是将一个完整的信息源的全部内容转化为计算机可识别和处理的信息单元而形成的数据集合,即机读化的一次文献。用户可直接检索出原始
32、文献,也可检索全文中的段、节、章等内容。 如:中国学术期刊数据库、维普中文科技期刊(全文版)等。 3.事实数据库 (fact database): 这类数据库能直接向用户提供可用的数据 (包括文字、图形、图象、声音、计算机程序等)。如:百科全书、辞典、手册、指南、地图集、人名录、企事业名录、计算机程序、音乐等。 如:中经专网(教育版)、中国资讯行、万方。 4.数值数据库(numeric database): 这类数据库主要提供来自原始文献的统计数据、调查数据或经过处理的各种数据、数值表格。 如:气象数据、地质资料、化学或物理化合物特性的文献数据、财务数据、人口统计资料、市场调研数据等。,.,6
33、4,三、 数据库检索方式 1. 联机数据库 联机检索是用户利用计算机终端设备,通过通信线路与联机信息检索中心的中央计算机联机进行检索。联机检索系统由用户检索终端、通信网络和联机信息检索中心组成。联机检索允许用户采用人机对话的交互方式直接访问检索系统和数据库,检索是在线实时进行的。如:Dialog国际联机检索系统。 2. 光盘数据库 光盘检索系统的基本构成包括微机、CD-ROM驱动器、软件(检索软件和系统软件)。 光盘检索系统可单用户检索,也可将CD-ROM驱动器接入局域网,如通过图书馆网或校园网连接多个用户终端,用服务器管理运行一组光盘数据库,组成多用户CD-ROM网络。 如:INSPEC (
34、19892000) 3. 网络数据库 通过WWW访问数据库站点,确认合法用户和口令或IP地址后,进入检索界面进行检索。该种检索方式不受时空限制,合法用户可在任何地方适时检索。,.,65,三、词位置检索(positional operator) 位置运算符 利用布尔逻辑算符对检索词进行逻辑组配时,未限定检索词之间的位置关系,会影响某些课题的查准率并容易造成误检。为了弥补其不足,一般检索系统都提供文中自由词检索功能,也称全文检索功能 (Full text searching)。 所谓全文检索是利用文献记录中任何有实义的关键词、词组或字符串作为检索词,词与词之间的位置关系可以用位置运算符来表达。位置
35、运算符的使用,进一步强化了对概念的限制,比布尔逻辑运算符更能表达复杂的概念,并避免AND逻辑组配产生的词义含糊或误检。 为了提高检索的广度和准确度,常常需要对检索词之间的位置关系加以限定。 *全文检索的运算方式,不同的检索系统有不同的规定,主要差别有两点: 规定的位置算符不同; 位置算符的职能和使用范围不同。 下面介绍几种数据库经常使用的位置运算符:,.,66,检索效果: 查全率:检索过程中,计算机输出的相关文献数与计算机数据库中相关文献的总数之比。 检 出 相 关 文 献 量 100% 文献库内相关文献总量 查准率:检索过程中,计算机输出的相关文献数与输出的文献总数之比。 检 出 相 关 文
36、 献 量 100% 检 出 文 献 总 量 实验证明: 在查全率和查准率之间存在着相反的相互依赖关系如果提高输出的查全率,就会降低其查准率,反之亦然。,.,67,第六节 计算机检索技术 一、布尔逻辑检索 在计算机文献检索中,用户的检索需求是通过检索提问式表达的,逻辑算符在检索提问式中起着逻辑组配作用,它们能把一些具有简单概念的检索词(或检索项)组配成为一个具有复杂概念的检索式,用以表达用户的检索需求。 布尔逻辑(组配)算符:系统中采用的逻辑组配算符是布尔代数中的逻辑运算符AND/*(与)、OR/+(或)、NOT/(非)。 布尔逻辑检索: 即运用布尔逻辑算符对检索词进行逻辑组配,表达两个概念之间
37、的逻辑关系。 1. AND 或 * 算符 实现逻辑“与”组配,检索时,命中信息同时含有两个概念,专指性强。 如:logistics AND e-commerce traffic AND control,.,68,2. OR 或 + 算符 实现逻辑“或”组配,3. NOT 或 算符 实现逻辑“非”组配,检索时,命中信息包含所有关于逻辑A或逻辑B或同时有A和B的,检索范围比AND扩大。 如:rapid transit OR light rail OR subways railway OR railroad,命中信息包含逻辑A、不包含逻辑B或同时有A和B的,排除了不需要的检索词。 如:fruit N
38、OT apple windows NOT Microsoft,.,69,二、截词检索 (truncation) 截词符 截词是指将检索词在适当的地方截断,截词检索是用截断词的一个局部进行的检索,凡是满足这个截词所有字符(串)的记录,系统都为命中。 截词检索在西文数据库中广泛使用。是在词干后可能变化的位置加上截词符号。检索词的单复数形式,同一词英、美不同拼法,词根相同的词都可用截词检索。这样既可减少检索词的输入量,又可扩大查找范围,提高查全率。 按 截 词 位 置 分: 有前截断、后截断、中截断; 按截词的字符数量分:有非限制截断、限制截断。 * 表示截词的截断符号,各检索系统有不同的规定,没有
39、统一标准。,.,70,1. 后截断 后截断是在检索词词干后面加截词符,表示不限制或限制词尾可变化的字符数,即查找词干相同的所有词。从检索性质上讲,后截断是前方一致检索。 非限制截断:是在检索词词干后面加一个截词符,表示不限制词尾可变化的字符位数,即查找词干相同的所有词。 例: comput? 表示允许其后可带有任何字符且数量不限,相当于查找compute、 computed、 computes、 computing、 computer、 computers、computerize、computerized、computation、 computations、 computational、 co
40、mputationally 等词。 *不宜将词截得过短,否则容易造成误检。 限制截断 :是在检索词词干后面加若干个截词符,表示限制可变化的字符数。 例:fib? 相当于查找 fiber 或 fibre (Ei Compendex Plus) librar? 相当于Libraries,librarian,library educat? 相当于Educator,educated,.,71,2. 中截断 (通配符或屏蔽) 是把截断符号置于一个检索词的中间,对词中间出现变化的字符数加以限定。一般中截断仅允许有限截断。 例:organi#ation, 可检索到包含organization和organisation的记录。 一个?代表零个或任意个字符。 例: colo?r ,可检索到包含 color、colour、colonizer、 colorimeter的记录。 一个? 和数字,其中的数字代表可替换的字符数。 例:colo?1r, 只能检索到包含colour的记录。,.,72,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【教案】部编语文三上7 听听秋的声音【国家级】一
- 员工三级安全培训
- 医疗器械质检教学
- 《通风工程》课件
- 小学三年级数学两位数乘两位数笔算水平作业练习题大全附答案
- 前叉韧带重建手术
- 福建省福州市高三下学期毕业班3月质量检测(一模)化学试题
- 社区背景资料来源社会工作专业教学案例宝典
- 婴幼儿记忆的发生长沙民政李鑫
- 中医异位妊娠保守治疗
- 大学生职业生涯规划书环境设计
- 【川教版】《生命 生态 安全》五上第17课《发明让生活更美好》课件
- 五年级上册口算练习400题及答案
- 2024年中国铁路成都局集团有限公司招聘笔试参考题库含答案解析
- 艺术机构退费制度
- 《河流(第2课时)》公开课教学设计【人教八年级地理上册】
- 诺如病毒幼儿园知识讲座
- 建筑机械使用安全技术规程-JGJ33
- 2023年浙江嘉兴南湖区教育研究培训中心选聘研训员考前自测高频考点模拟试题(共500题)含答案详解
- 社会工作者考试题库及答案
- 重庆市2023-2024学年九年级上学期11月期中物理试题
评论
0/150
提交评论