第四讲信息检索原理方法策略_第1页
第四讲信息检索原理方法策略_第2页
第四讲信息检索原理方法策略_第3页
第四讲信息检索原理方法策略_第4页
第四讲信息检索原理方法策略_第5页
已阅读5页,还剩74页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四讲信息检索原理方法策略第一页,共七十九页,编辑于2023年,星期一4.1信息检索及其原理4.1.1信息检索概述1.信息检索定义1)国外关于信息检索的定义(Beihang《信息检索原理》课程)信息检索-InformationRetrieval(IR)–

thescienceofsearchingfordocuments,forinformationwithindocumentsandformetadataaboutdocuments,aswellasthatofsearchingrelationaldatabasesandtheWorldWideWeb.-FromWikipedia–

关于对文档、文档中的信息、文档的元数据的搜索,以及对关系数据库和万维网搜索的科学2)国内定义指为达到某一特定目的,将信息源与用户需求连接起来,查询、鉴别、选择并确定相关信息的过程p159。广义的信息检索包括“存储”和“检索”两个部分,狭义的信息检索仅指广义中的检索部分。第二页,共七十九页,编辑于2023年,星期一4.1信息检索及其原理4.1.1信息检索概述2.信息检索的作用获取知识的途径,学习的助手管理和决策的依据-全面、准确、及时的信息——切合实际、正确无误决策科学研究的工具和指南信息控制的手段第三页,共七十九页,编辑于2023年,星期一4.1信息检索及其原理4.1.1信息检索概述3.信息检索原理即检索者的检索提问词与存储在检索系统中的检索标引词进行匹配对比、取得一致,即为检索命中,命中结果可从检索系统中以各种方式输出。检索者可据此线索对原文进行判断、筛选,以获取自己所需要的信息。广义和狭义(p160)见信息检索原理图第四页,共七十九页,编辑于2023年,星期一4.1信息检索及其原理4.1.1信息检索概述信息检索原理即检索者的检索提问词与存储在检索系统中的检索标引词进行匹配对比、取得一致,即为检索命中,命中结果可从检索系统中以各种方式输出。检索者可据此线索对原文进行判断、筛选,以获取自己所需要的信息。

信息检索原理图第五页,共七十九页,编辑于2023年,星期一4.1信息检索及其原理4.1.1信息检索概述4.信息检索途径(p161)所谓检索途径就是检索时切入信息群体的路径。检索途径有两大类,一类是用信息的外部特征,如题名、责任者、某种序号、机构名等作为检索标识;另一类是用能够描述信息内容的分类号、关键词、主题词等作为检索标识。在数据库中检索时,几乎所有的字段都可以作为检索的途径。1)分类途径:分类语言,“分类目录”“分类索引”,便于族性检索2)主题途径:主题语言

,“主题索引”

“关键词索引”

“叙词索引”

,便于特性检索

3)著者途径:“著者目录”、“著者索引”4)其他途径篇名途径包括书名、刊名和篇名

序号途径包括报告号、标准号、专利号、登记号等分子式途径第六页,共七十九页,编辑于2023年,星期一4.1信息检索及其原理4.1.2.信息的组织与标引1.信息组织信息组织是为了方便人们检索获取信息,将大量、庞杂、无序的信息进行系统化和有序化的过程。它包括信息的描述(外部特征),信息的标引(内容),信息的整序等过程。

2.信息标引标引是指根据一定的规则和程序对文献内容进行分析,然后赋予每篇文献以一定数量的内容标识(分类号、主题词、关键词等),作为存储与检索的依据。标引的第一步叫“概念标引”,目前自动标引正成为一种新的发展方向:其流程主要包括:自动分词——选出标引词——转换。第七页,共七十九页,编辑于2023年,星期一4.1信息检索及其原理4.1.3信息检索语言1.信息检索语言的概念又称为标引语言、引索语言、文献检索语言、信息存储与检索语言等,它是用于描述信息系统中信息的内部特征和外部特征及表达信息用户需求提问的一种专门语言。是一种把文献的存储与检索联系起来、把标引人员和检索人员沟通起来的约定人工语言2.检索语言的种类按是否受控划分为人工语言和自然语言按内容性质划分为分类语言和主题语言第八页,共七十九页,编辑于2023年,星期一4.1信息检索及其原理4.1.3信息检索语言(p163-177自学,考点)2.1分类语言用分类号和相应分类款目来表达各种概念,它以学科体系为基础将各种概念按学科性质和逻辑层次结构进行分类和系统排序。按照分类方式又分为体系分类语言、组配分类语言和混合分类语言。2.2主题语言对表达信息主题内容特征的主题词汇概念经规范化处理所形成的检索语言。按照主题性质的不同,又分为标题词语言、单元词语言、叙词语言、关键词语言和引文语言。

第九页,共七十九页,编辑于2023年,星期一4.1信息检索及其原理4.1.4分类检索语言1.分类的思想文献分类的实质是按照知识体系分类和概念逻辑方法,对文献信息进行区分和归类。类目是组成分类语言的基本单元,每一个类目都是一个相同事物构成的集合。根据文献信息的内容特征和分类词表,把相同内容的文献信息集中起来,又把不同内容的文献信息区别开来,以实现相关集中的功能。第十页,共七十九页,编辑于2023年,星期一4.1信息检索及其原理4.1.4分类检索语言2.分类语言的基本原则类目划分的依据只有一个;上位类可按照一定的标准划分为若干个同级的下位类,任何一个下位类都有而且只能有一个上位类;同位类之间互相排斥。3.分类语言的性能分类语言的主要特点是按学科、专业集中相关文献信息,从知识分类的角度揭示文献信息之间的区别和联系,提供从学科专业领域检索文献信息的途径。第十一页,共七十九页,编辑于2023年,星期一4.1信息检索及其原理4.1.4分类检索语言4.分类语言的性能分类语言的符号——利用字母或数字的号码作为分类标识分类语言的词语——语义表达、词间关系、文献信息的集散分类语言的语法——先组配式的信息检索语言分类语言的使用——主题范围较大的文献(如图书),类号的确定较为容易;对于细小、复杂主题的文献(期刊论文),类号的选择相对较难。第十二页,共七十九页,编辑于2023年,星期一4.1信息检索及其原理4.1.4分类检索语言5.典型的分类语言——《中国图书馆分类法》《中国图书馆分类法》(原称《中国图书馆图书分类法》)是我国建国后编制出版的一部具有代表性的大型综合性分类法,是当今国内图书馆使用最广泛的分类法体系,是用的最广泛的分类语言。第十三页,共七十九页,编辑于2023年,星期一4.1信息检索及其原理4.1.5主题语言1.构成原理利用自然语言表达文献和提问内容的主题标识即主题词。利用各种参照系统等显示主题标识之间各种关系利用主题词的字顺序列排列与检索文献信息。第十四页,共七十九页,编辑于2023年,星期一4.1信息检索及其原理4.1.5主题语言2.主题语言的性能符号

——直接利用自然语言的词语主题语言的词语

——语义表达和它在自然语言中的含义一致,词间关系通过主题词表不同的参照系统和各种注释等来加以展示。

主题语言的语法

——有先组配式的信息检索语言,如标题语言;也有后组配式的信息检索语言,如叙词语言主题语言的使用

——主题范围复杂、细小的、研究特定对象的文献,利用主题语言进行标引和检索,可以充分发挥主题语言的优势主题词表

——同义词互见和对检索标引用词规范;上位词、下位词的显示来扩检或缩检;通过有关联主题词的“参见”提高查全率第十五页,共七十九页,编辑于2023年,星期一4.1信息检索及其原理4.1.5主题语言3.主题语言的种类标题语言——基本构成单元是主标题、副标题;标题表主要由主表和附表两大部分组成。

元词语言——是一种后组式的信息检索语言;基本构成单元是元词,从文献中选出来无法再拆分的词汇。叙词语言——叙词(descriptor)是指以概念为基础、经规范化且具有组配功能并可以显示词间关系的动态性词或词组。叙词表是叙词语言的词典。叙词表通常由字顺主表、范畴表、词族表或其他附表组成。关键词语言——虽然也属主题语言的范畴,但没有经过规范化处理,属非受控语言(Uncontrolledterm)。类型:题内关键词索引、题外关键词索引、双重关键词索引。第十六页,共七十九页,编辑于2023年,星期一4.1信息检索及其原理4.1.6自然语言自然语言就是我们说话或写文章时候使用的书面语言,比较自由。自然语言检索计算机技术迅速发展的情况下,自然语言作为检索语言是一种必然的趋势。第十七页,共七十九页,编辑于2023年,星期一一条完整的CNMARC数据包含分类和主题两种语言主题语言分类语言分类语言主题语言第十八页,共七十九页,编辑于2023年,星期一4.2计算机信息检索原理与技术4.2.1计算机信息检索的发展概况脱机检索阶段、联机检索阶段、光盘检索阶段、网络化联机检索阶段4.2.2计算机检索原理和技术计算机信息检索原理实质就是由计算机将输入的检索策略与系统中存储的文献的特征标识及其逻辑组配关系进行类比、匹配的过程。

第十九页,共七十九页,编辑于2023年,星期一4.2计算机信息检索原理与技术4.2.2计算机检索原理和技术数据库的结构和类型数据库定义——是至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。数据库的类型参考数据库——书目数据库(BibliographicDatabases)、指南数据库(ReferenceDatabases)源数据库——数值数据库、事实数据库、全文数据库、术语数据库、图像数据库。第二十页,共七十九页,编辑于2023年,星期一4.2计算机信息检索原理与技术4.2.2计算机检索原理和技术数据库的结构及全文检索数据库主要由文档、记录、字段三个层次存取号一般由6-9位数字组成基本索引字段主要包括篇名字段、文摘、叙词、自由标引词。辅助索引字段用来描述文献外表特征的字段。P182页第二十一页,共七十九页,编辑于2023年,星期一数据库的结构图数据库是由若干个互有联系的文档(file)组成的,文档是书目数据库数据组织的基本形式,文档里的数据被称为记录,一个记录又包含若干个字段。数据库文档字、词记录字段第二十二页,共七十九页,编辑于2023年,星期一1.文档数据库是由若干个互有联系的文档(file)组成的,信息检索数据库的文档包括主文档、索引文档和帮助系统文档三部分。第二十三页,共七十九页,编辑于2023年,星期一主文档(顺排文档)记录按时间顺序存放,记录之间的逻辑顺序与物理顺序是一致的,是一种线形文档,文档的记录按文献信息获得的先后顺序排列,故又名为顺排文档。但对于所存储数据的某一方面属性,如作者、关键词等,则是无序的,即不能按关键词的字顺查询。第二十四页,共七十九页,编辑于2023年,星期一索引文档(倒排文档)

将顺排文档中各个记录中含有主题性质的字段(如主题词字段、标题字段、叙词字段等)和非主题性质字段(如作者字段、机构字段、来源字段等)分别提取出来,按某种顺序重新组织得到的一种文档。

第二十五页,共七十九页,编辑于2023年,星期一帮助系统文档凡是比较成熟的信息检索系统,还配有完善的在线检索帮助,包括系统使用的检索算符、组配规则、以及使用实例说明性文档,以网页的形式提供给在线用户。第二十六页,共七十九页,编辑于2023年,星期一2.记录记录是数据库中数据集合的一个单位,是组成文档的基本数据单位。在书目数据库中,一个记录相当于一条题录或文摘记录又由字段构成,字段则是组成记录的基本数据单位。一个记录通常由标题字段、作者字段、来源字段、文摘字段、主题词字段、分类号字段、语种字段等组成。第二十七页,共七十九页,编辑于2023年,星期一CNKI中的一条记录题名字段作者字段文摘字段关键词字段来源字段第二十八页,共七十九页,编辑于2023年,星期一EI

中的一条记录

主题字段辅助字段12第二十九页,共七十九页,编辑于2023年,星期一3.字段字段是组成记录的基本数据单位。字段通常有标题字段、作者字段、来源字段、文摘字段、主题词字段、分类号字段、语种字段等。按照字段所代表记录的性质不同,字段通常分为基本字段和辅助字段两类。基本字段有题名字段、文摘字段、主题词字段等。辅助字段有作者、作者工作单位,文献来源,出版事项等。第三十页,共七十九页,编辑于2023年,星期一基本字段辅助字段字段名称字段代码字段名称字段代码标题T/TI记录号AN文摘R/AB作者A/AU叙词DE机构S/OG标识词ID来源SO关键词K/KW出版年PY

控制词CT国家CU

非控制词UT语种LA

字段类型与代码第三十一页,共七十九页,编辑于2023年,星期一CNKI数据库常用的字段第三十二页,共七十九页,编辑于2023年,星期一4.3检索词的确定与选择4.3.1相同概念的检索词扩展1.同义词扩展法

即在同一概念的范围内,从语言学角度选择不同的名称、不同的拼写方法和单复数形式,不同的名称包括学名俗名简称和全称商品名称和产品名、事物的代码和事物学名的。例.“超声波在污水处理中的应用”超声波是指频率介于20kHz—2MHz,人耳听不到的声波。以往超声波只用于医疗诊断、清洗、探测等方面。目前,超声波在饮用水,工业污水污泥处理中具有巨大的应用潜力。中文关键词:超声波、污水检索策略1:超声波and污水----会漏检很多文献检索策略2:(超声波or声化学)and(污水or废水),检索结果较多,较全面。第三十三页,共七十九页,编辑于2023年,星期一4.3检索词的确定与选择4.3.1相同概念的检索词扩展2.截词法检索词词干相同、词义相近,但词尾或词中间有变化,可以采用截词方法扩展检索词。第三十四页,共七十九页,编辑于2023年,星期一截词法举例:检索“微型热管的研究进展”这一课题,就可以使用截词。案例分析:随着计算机芯片中电路数目的增加,其产生热量的散逸变得越来越困难。微型热管作为一项很有前途的技术,可用于计算机芯片以获得高的热量导出率及温度均匀化。即微型热管成为电子芯片内部的一部分,直接将热量从最大热量区域中取出。微型:miniature,minitype,微型的:micro,mini,miniature热管:heatpipe*检索策略1:microheatpipe*orminiatureheatpipe*检索策略2:(microormini*)andheatpipe*检索策略3:(microormini*)and“heatpipe*”

这样就能把以“mi”为词根的所有词语检索出来,再通过逻辑算符的组配,实现准确检索。第三十五页,共七十九页,编辑于2023年,星期一4.3检索词的确定与选择4.3.1相同概念的检索词扩展3.主题词表有时候用户会使用自由词,也就是自然语言,但数据库标引时用的是规范词。EI数据库中就有词表例:自由词:维生素C(vitaminC);标引词:抗坏血酸(ASCORBICACID)自由词(直译):supermolecular;标引词:macromolecular例如:检索“六行程发动机”的资料,把“六行程”作主题词时,就不能找到相关资料,而用六冲程作为主题词就可以找到。第三十六页,共七十九页,编辑于2023年,星期一4.3检索词的确定与选择4.3.2检索词的使用要恰当1.检索词要使用单元词使用概念上不可再分的词语,如要检索“建筑物防灾与减灾”这一课题,这一课题包含的基本概念,建筑物,灾害,防治,减灾等都是单元词第三十七页,共七十九页,编辑于2023年,星期一4.3检索词的确定与选择4.3.2检索词的使用要恰当2.概念不能太大也不能太小例1:“煤脱硫的最新工艺与技术”,若用“煤脱硫”作为主题概念,有1000多篇——概念太大。这时候就要选择更具体的概念“微波煤脱硫”,有10多篇——概念定位恰当。第三十八页,共七十九页,编辑于2023年,星期一4.3检索词的确定与选择4.3.2检索词的使用要恰当3.多主题概念的选词以“简”为主

例:课题“利用基因工程的手段提高植物中淀粉的含量”

检索策略:“基因工程”

AND“植物”AND“淀粉”AND“含量”——检索结果为零。对于本课题,只有2个主题概念最为关键---“基因”AND“淀粉”。4.词语要规范化俗名“六六六”检索,检索结果很不理想,应该用“六氯环己烷”、“六氯化苯”、“BHC”第三十九页,共七十九页,编辑于2023年,星期一4.4检索词组配算符4.4.1布尔逻辑算符组配检索1.逻辑与用符号“and”

“*”表示其逻辑表达式为:AandB或A*B其意义为检索记录中必须同时含有检索词A和B的文献,才算命中文献。AB第四十页,共七十九页,编辑于2023年,星期一逻辑与示例例如你想在题名中检索有关新闻美学的文献,如只输入“新闻”或“美学”,则命中文献太多,且有许多不是自己所要的。如果输入“新闻*美学”,则检索出题名中同时含有“新闻”和“美学”的文献,检索结果大大缩小。第四十一页,共七十九页,编辑于2023年,星期一逻辑与在CNKI中的应用第四十二页,共七十九页,编辑于2023年,星期一4.4检索词组配算符4.4.1布尔逻辑算符组配检索2.逻辑或用符号“or”或“+”表示,其逻辑表达式为:AorB或A+B其意义为检索记录中凡含有检索词A或检索词B,或同时含有检索词A和B的,均为命中文献。AB第四十三页,共七十九页,编辑于2023年,星期一4.4检索词组配算符4.4.1布尔逻辑算符组配检索3.逻辑非用符号“not”或“-”表示其逻辑表达式为:AnotB或A–B其意义为:检索记录中含有检索词A,但不能含有检索词B的文献,才算命中文献。例如我需要中国旅游方面的资料,但不包括地图,检索式为:中国*旅游-地图AB第四十四页,共七十九页,编辑于2023年,星期一4.4检索词组配算符4.4.2截词符利用检索词的词干或不完整的词形进行检索,在检索词的适当位置进行截断,节省输入的字符,达到较高的查全率。包括无限截断和有限截断,无限截断又包括后方截断和前方截断。把截词符放在字根的右边,如“Comput*”则Computer、Computers、Computerise、Computerize等均为命中把截词符放在字根的左边,如*Computer,那么在计算机检索时,索引词Microcomputer均算命中。

若干个限制截词符“?”放在词干上,向系统表示在此位置上允许出现相应数目的字母。三个截词符“?”代表可增加0-3个字母,例如:plant???,相当于查找plant,plants,planted,planter等词。

第四十五页,共七十九页,编辑于2023年,星期一4.4检索词组配算符4.4.3位置算符(W)与(nW)算符表示其两侧的检索词必须按前后顺序出现在记录中,而且两词之间不允许插入其他字符和单词,只允许有空格或一个标点符号。实例:sdouble(W)digit等价于sdoubledigit检索出doubledigit和double-digit。(nW)中的n表示两检索词中间允许插入的单词数目少于或等于n个,算符两侧检索词的词序不能颠倒。实例:asolar(1W)energy,检出solarenergy,solarradiantenergy,solarelectricenergy。第四十六页,共七十九页,编辑于2023年,星期一位置算符(N)与(nN)算符(N)表示其两侧的检索词位置可以倒置,但在两词之间不能插入其他字符;实例:sfiber?(N)optic,检出fiberoptic,fiberoptics,opticalfiber,opticalfibers。(nN)中的n表示允许插入单词的数目量少于或等于n个,两检索词的词序可以颠倒。实例:sallergic(2N)reaction?检出allergicreactions,allergicdrugreactions,allergiccross-reactions,reactionsofthoseallergic第四十七页,共七十九页,编辑于2023年,星期一4.4.3位置算符(X)算符与(nX)算符A(X)B,表示A和B检索词出现完全一致,并以指定的顺序相邻,且中间不允许任何其他单词和字母;nX含义同上,就是两词之间字符数小于等于n。(L)算符(link)A(L)B表示A和B有主从关系,A为主,B为副。此算符对于用标题词进行标引的文献。(S)算符A(s)B,表A和B必须同时出现在记录的同一个句子或短语中,但次序可能随意改变,A与B之间可以有若干个其他的词。

(F)算符A(F)B,表示A和B必须同时出现在记录的同一个字段之中,但位置和次序不限,两者之间还可以任意加词。如Rice(F)Genetics/Ti要求Rice和Genetics必在同时出现在篇名之中。第四十八页,共七十九页,编辑于2023年,星期一4.4检索词组配算符4.4.4字段限制符1)后缀限定(/)electron/TI2)前缀限定(=)AU=Rankin,K.M.LA=English3)时间限制符(:)PY=1990:1999

4)限定网站site:【实例】输入“金庸古龙site:”搜索包含“金庸”和“古龙”的中文新浪网站页面。第四十九页,共七十九页,编辑于2023年,星期一4.4检索词组配算符4.4.4字段限制符5)限定网页【实例】输入“inurl:midi沧海一声笑”查找MIDI曲“沧海一声笑”。【实例】输入inurl:"plog/register.php",搜索plog注册文件(现在用的很普遍的一套PHP博客程序,在其安装说明中明确说明希望用户安装后删除register.php文件)。【实例】输入“inurlecuritywindows2000site:”查找微软网站上关于windows2000的安全课题资料。第五十页,共七十九页,编辑于2023年,星期一4.4检索词组配算符4.4.4字段限制符6)限定标题【实例】输入“intitle:张娜拉写真”查找韩国张娜拉的照片集。

7)限定文件类型【实例】输入filetype:litlit(books¦ebooks),搜索网络图书(FILETYPE可以更换)。【实例】利用后缀名来搜索电子书,输入“存在与虚无chm”、“菜根谭exe”、“水煮三国chm”。

8)其他类型限定第五十一页,共七十九页,编辑于2023年,星期一4.4检索词组配算符4.4.5加权检索根据检索词在需求中的重要程度给定一个权值。在检索中,由系统先查找存在这些检索词的文献,并计算它们的权值总和。然后,检索者再给定一个阈值大于或等于该阈值时,才算命中。4.4.6聚类检索主题相近、内容相关的文献便聚在一起,而相异的则被区分开来4.4.7跨文档检索用一个检索式可以同时检索多个文档,如CNKI的跨库检索第五十二页,共七十九页,编辑于2023年,星期一4.4.8、概念检索同时对同义词、近义词、广义词、狭义词进行检索。例,输入“土豆”,检出结果不多,还可以再次输入“马铃薯,洋芋”等同义词,就可检索更多结果。4.4.9、深入检索(二次检索)例:查找“信息检索”,会出来很多结果,这时候需要“在结果中进一步检索”以得到更精确的结果。4.4检索词组配算符第五十三页,共七十九页,编辑于2023年,星期一4.5信息检索方法和步骤□分析课题□选择检索系统□确定检索词□构造检索式□调整检索策略□输出检索结果□获取原始文献第五十四页,共七十九页,编辑于2023年,星期一

信息检索的基本步骤图分析检索课题1.主题概念2.信息类型3.时间范围4.检索目的构造检索式(试验性检索)1.简单提问式2.上下文提问式3.复合提问式4.结构性提问式调整检索策略(正式检索)1,信息量过多时2.信息量太少时输出检索结果1.文摘2.全文选择检索系统1.学科范围2.系统类型3.系统功能

确定检索词

1.切分2.删除3.替补4.组合5.增加用户评价

第五十五页,共七十九页,编辑于2023年,星期一算符使用,检索时使用逻辑算符,位置算符,截词算符使用系统的基本检索和高级检索选择相应的检索字段:题名,著者,关键词检索相关词:有些系统自动提示相关词,可以选择4.5信息检索方法和步骤4.5.1检索规则第五十六页,共七十九页,编辑于2023年,星期一1.检索式的含义所谓的检索提问式(query,searchformulation),是信息检索中用来表达用户检索提问的逻辑表达式,主要是使用各种布尔逻辑算符、位置算符、截词符、限制算符以及系统规定的其他组配连接符号将检索词进行组配,确定检索词之间的概念关系或位置关系。4.5信息检索方法和步骤4.5.2检索式的表达第五十七页,共七十九页,编辑于2023年,星期一2.构造检索式要注意的用词技巧:少用或不用对课题检索意义不大的词词义泛指过大(不用)、词义延伸过大(少用)、规范词是可优先考虑使用

充分利用所选主题表达的上位或下位概念缩小主题范畴明确课题的“学科归属”4.5.2检索式的表达4.5信息检索方法和步骤第五十八页,共七十九页,编辑于2023年,星期一3.检索表达式构造课题:地震序列分析的工具和方法研究要完成本项检索课题,必须使用如下的检索式:(“sequenceanalysis”INTI)AND((method*ORtool*ORinstrument*)INAB))

AND(SeismicORearthquake)4.5.2检索式的表达4.5信息检索方法和步骤第五十九页,共七十九页,编辑于2023年,星期一课题1:建筑节能与集中供热新技术研究(设备)constructionconservesenergy,centralheating,study;research4.5.3检索实例4.5信息检索方法和步骤第六十页,共七十九页,编辑于2023年,星期一课题2:高层建筑结构优化设计

1.信息需求分析(1)明确检索目的与要求

1)检索目的:硕士学位论文开题查新

2)检索要求:国内外关于高层建筑结构优化设计方面的相关信息

3)确定检索类型:属书目及全文信息检索(2)主题分析第一概面:高层建筑第二概面

结构设计第三概面

:优化设计4.5.3检索实例4.5信息检索方法和步骤第六十一页,共七十九页,编辑于2023年,星期一检索课题2:高层建筑结构优化设计2.制定检索策略选择检索词根据主题分析确定的主题范围,选择检索词如下:

高层建筑tallbuilding*

高层建筑highrisebuilding*

高层建筑highrisebuilding*

结构设计structuraldesign

优化设计optimization第六十二页,共七十九页,编辑于2023年,星期一检索课题2:高层建筑结构优化设计3.编写检索提问式检索式1

高层建筑and结构设计

检索式2

高层建筑and结构设计and优化检索式3(tallbuilding*orhighrisebuilding*orhighrisebuilding*)andstructuraldesign检索式4

building*and(tallorhighriseorhighrise)andstructuraldesign检索式5

building*and(tallorhighriseorhighrise)andstructuraldesignandoptimization检索式6[building*and(tallorhighriseorhighrise)andstructuraldesignandoptimization]/AB检索式7[building*and(tallorhighriseorhighrise)andstructuraldesignandoptimization]/TI第六十三页,共七十九页,编辑于2023年,星期一4.选择检索系统,输入检索式5.查看检索结果,优化检索式6.筛选检索结果检索课题2:高层建筑结构优化设计第六十四页,共七十九页,编辑于2023年,星期一4.6原始文献分析4.6.1课题思路的调整重新选择检索词使用网络搜索引擎4.6.2原始文献的评价和筛选4.6.3原始文献的阅读与分析评价4.6.4检索到的原始文献观点的归纳与总结4.6.5创新性观点的形成第六十五页,共七十九页,编辑于2023年,星期一4.7检索结果及全文索取4.7.1原始文献的评价和筛选

检索到的文献有的存在问题,要辨证的认识所获文献,批判继承4.7.2原文获取途径馆际互借与全文传递联机检索中心,提供全文信息检索(DIALOG)网络环境下的图书馆区域合作:天津的高校数字图书馆联盟,免费全文传递第六十六页,共七十九页,编辑于2023年,星期一4.8信息检索技巧总结当我们遇到一个课题,应该从哪些方面入手?如何完成一个准确而全面的检索?第六十七页,共七十九页,编辑于2023年,星期一第一步先分析课题的词义,获取关键词1.1.分析课题查找词语的意义,可以借助字典词典百科全书,或者工具书手册等,明确课题的意义和学科归属。1.2关键词提炼4.8信息检索技巧总结第六十八页,共七十九页,编辑于2023年,星期一1.2关键词选择技巧1.选定的关键词应符合课题主题;并应列出常用中外文同义词、缩写词,以及核心关键词的上下位类词。

2.应充分利用词表、辞海、术语标准、词典等工具书,以及从已检出的文献中,扩展检索用词。第六十九页,共七十九页,编辑于2023年,星期一1.2关键词选择技巧3.立足规范词,兼顾自由词4.词的全称、简称及缩写字母5.必要时应向上下位类词扩检

6.注意外来词的译写变化7.慎用词组或短语第七十页,共七十九页,编辑于2023年,星期一第二步选择适合课题的检索系统

了解检索工具的学科特色、收录文献类型、时间范围、特色、检索方法等第七十一页,共七十九页,编辑于2023年,星期一第三步调整检索策略1.当检索结果信息量过多时原因:选用了多义性的检索词;截词截得过短;输入的检索词太少;应该使用“与(AND)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论