版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
信息检索概念信息检索类型信息检索方法信息检索途径信息检索语言文献信息数据库原理第二讲信息资源检索基础知识(二)信息检索概念第二讲信息资源检索基础知识(二)1信息检索:是指将信息(主要指文献信息)按一定的方式组织和存储起来,并根据用户的需要找出相关信息的过程。
信息检索存储检索存储:是对信息进行著录、标引、整序,编制检索工具和建立检索系统的过程。检索:是指面向信息需求而进行高度选择性的查找过程。一、信息检索信息检索:是指将信息信息检索存储检索存储:是对信息进行著录、2信息检索过程:存储过程:
标引员广泛收集信息,形成检索标识,把这些标识按一定方法组织成形成各种检索系统,即信息源的形成过程。检索过程:
检索人员分析课题,用检索提问标识,从检索系统中查获所需的信息。信息检索原理:用户检索提问标识(提问检索词)与存储在检索工具中的标引标识(标引词)进行比较,两者一致或信息标引标识中包含提问标识即是命中的信息。能否准确地检索出用户所需的信息,关键在于能否准确地选择检索词。这里所谓的“准确”,是指用户所选用的检索词必须与数据库中标引文献记录所用的标引词相一致。
信息检索过程:3信息检索过程一个匹配(Match)过程信息检索过程一个匹配(Match)过程4按检索内容划分数据检索是以数据为检索内容的信息检索,要求从检索系统存储的大量原始调查数据和其它统计数据中查出所需的数字资料。全文检索即检索系统存储的是整篇文章或整本图书。书目检索是以文献线索为检索内容的信息检索。二、信息检索类型按检索内容划分数据检索书目检索二、信息检索类型5事实检索是以原始文献中抽取的事物的情况为检索对象,检索结果是事物发生的时间、地点和情况等具体答案,也是一种确定性的检索。例如:查找“前事不忘、后事之师”最早的出处。检索“赤壁之战发生在湖北赤壁市么?”图像检索即以图形、图像或图文信息为检索内容的信息检索。多媒体检索是以文字、图像、声音等多媒体信息为检索内容的信息检索。事实检索图像检索6按是否使用检索工具划分直接检索就是指利用一次文献进行检索,这是以前比较常用的一种查找方法。所花时间多和精力大,检出文献少。(简单模糊检索)间接检索就是指利用各种检索工具获得文献线索,再根据线索去查找原始文献线索的方法。(高级检索,限定检索等)按是否使用检索工具划分7按信息检索手段划分传统信息检索就是手工信息检索,是利用各种印刷型检索工具来查找文献的一种方法。一般是利用各种印刷型检索工具。现代信息检索现代信息检索即计算机信息检索,是指利用计算机和网络来处理和查找文献信息的检索方式。分:联机检索、光盘检索、网络检索。按信息检索手段划分8信息检索的方法主要有:常规法,引文法,综合法。常规法:常规法是指直接利用检索工具检索文献的方
法,主要有顺查法、倒查法和抽查法。
顺查法:按照时间顺序,由远及近地利用检索系统进行文献检
索的方法,这种方法能收集到某一课题的系统的文献,适用于
课题的文献检索。
倒查法:倒查法是由近及远,从新到旧,逆时间的顺序利用检
索工具进行文献检索的方法。
抽查法:针对项目的特点,选择有关该项目的文献信息最可能
出现或最多出现的时间段,利用检索工具进行重点检索的方法。三、信息检索方法信息检索的方法主要有:常规法,引文法,综合法。三、信息检索方9引文法:利用文献后所附的参考文献进行检索的方法,由追溯检索法和引文索引法组成。追溯检索法:即从文献信息密度较大的几种期刊的最近两三年论文中查出一批与检索课题有关的文献,再以这批文献所附的参考文献作为线索,找到第二批相关文献,以此类推获得一批与主题相关的文献,这种方法的出发点是从引用论文开始查找。引文索引法:利用引文索引,从被引论文开始查找引用它的全部论文,通过此方法可得到与来源文献同一主题的相关文献。专门工具:引文索引,如《科学引文索引》、《社会科学引文索引》等。综合法:又称循环法,就是常规法与引文法综合运
用的方法。引文法:利用文献后所附的参考文献进行检索的方10检索途径是由提取信息源的外部与内部特征形成的,又称检索点或检索入口。外部特征的检索途径:题名途径:利用书刊名或文献题名编成的索引进行信息检索的途径,一般多用于查找图书,期刊,单篇文献。著者途径:根据已知文献源著者直接或间接查找文献源的途径。号码途径:通过各种专用的符号代码直接或间接查找文献的方法,包括书号、刊号、报告号、专利号、标准号等。四、信息检索途径检索途径是由提取信息源的外部与内部特征形成的,又四、信息检索11内部特征的检索途径:分类途径:用分类法组织的信息为用户提供从科学属
性查找的途径就是分类途径。
分类法:
按照信息内容的科学属性,运用概念划分与归纳的方法
形成各级类,从而使信息形成一种有序化的知识体系的信息组织方法。
主题途径:用户根据所确定的主题词或关键词,利用主题词表和主题索引实施检索的途径。
主题词:以规范化的词汇来表达文献的内容的主题。
关键词:一种非规范化词汇。内部特征的检索途径:12检索语言是信息存储与检索过程中用于描述信息特征和表达用户信息提问的一种专门语言。是在信息储存和信息检索中所使用的标识语言,它既包括受控的人工语言(通过词表或分类表进行规范过的语言),也可包括未受控的自然语言。检索语言是根据检索途径来确定,使用什么样的检索途径,就使用什么样的检索语言。注意:信息检索存储过程中使用的标引语言(标引词或文献标识),也是在信息检索的检索过程中使用的检索语言(标引词或检索标识),标引语言和检索语言必须一致才能准确检索出结果。五、信息检索语言检索语言是信息存储与检索过程中用于描述信息特征和表达用户信息13检索语言的类型检索语言的类型表述文献外表特征的语言表述文献内容特征的语言著者号码题名分类主题非规范化语言(自然)规范化主题词(人工)叙词标题词关键词自由词检索语言的类型检索语言的类型表述文献外表表述文献内容著者分类14文献外部特征检索语言:著者检索语言:主要针对编有著者姓名索引的检索工具,输入著者姓名就可以检索到所要查询的内容,但要注意姓名输入的格式变化。文献代码检索语言:文献代码即文献编号,例如,国际统一书号ISBN,国际统一刊号ISNN,数字文献表引号DOI,科技报告的报告号,科技标准的标准号,专利的公开号、公告号以及专利号等,如果在文献数据库中建有相应的代码字段,那么就可以建立代码索引,用相应的代码作为检索词进行检索。题名检索语言:即通过文献名就可以检索到所要查询的内容。文献外部特征检索语言:15文献内容特征检索语言分类检索语言按知识门类的逻辑次序将信息系统地组织和划分的语言,具体体现为用分类号和类名来表达信息的主题概念。通过分类表来对分类号进行控制。
例:I712.45/26达芬奇密码
I712.45/404暮光之城.新月主要分类法《中国图书馆图书分类法》(简称《中图法》)《中国标准文献分类法》(简称《标准法》)《InternationalPatentClassification》(国际专利分类法,简称《IPC》)
文献内容特征检索语言16《中国图书馆图书分类法》将图书分为马列、哲学、社会科学、自然科学、综合五大类。分类标识即分类号,由字母或字母和数字组成。采用等级列举表达从属关系。《中国图书馆图书分类法》将图书分为马列、哲学、社会科学、自然17C社会科学总论D政治、法律E军事F经济G文教、科学、体育H语言J艺术I文学K历史、地理自然科学总论NRSTO数理化P天文学、地球科学Q生物科学医药、卫生农业科学工业技术U交通运输V航空、航天X环境科学Z综合性图书社会科学自然科学机械、仪表建筑科学马列主义、毛泽东思想A马列B哲学哲学综合TBTDTETFTGTHTJTLTKTMTNTPTQTSTUTV一般工业技术矿业工程石油冶金工业无线电、电子学、电讯技术自动化计算化学工业轻工业、手工业金属学武器工业动力工程原子能技术电工技术水利工程C社会科学总论D政治、法律E军事F经济G文教、科学、体育H语18主题检索语言主题检索语言直接采用能反映文献主题概念的词语来标引文献。目前国内外在主题检索语言中采用的语主要非规范化语言(关键词、自由词)、
规范化主题语言(叙词、标题词)等几种。主题检索语言19非规范化语言它是以关键词作为信息内容标识和检索依据的主题语言。它将描述主题内容的关键词抽出,按字顺排列提供检索。一般不加或加以少量规范处理。关键词:是能反映文献主题概念的关键词语,可直接从文献记录
的篇名、文摘或全文中,按字面拆分抽取,没有词表来
对选词进行控制,是一种非受控的、不规范的词语。自由词:在文中自由散布的,非人工标引的,叫做文中自由词(
freetermsintext)或简称自由词。
例:动压空气轴承
关键词:动压轴承/空气轴承
自由词:动压/空气/轴承,或:动/压/空/气/轴/承非规范化语言20规范化检索语言
规范化词称作叙词、标题词等,就是受控词。指从自然语言中优选
出来的并经过规范化处理的名词术语。
把规范化词按照一种便于检索的方式编排起来,就形成主题词表。“规范化处理”就是通过叙词表对选词的词类、词形、同义词、
多义词等进行处理的过程。
例如、同义词规范类型:
同一事物的不同称呼,
如:西红柿与蕃茄、网上聊天与QQ、儿歌与童谣等。
同一事物的简称、全称、音译等,
如:日本语与日语、互联网与因特网、中央电视台与CCTV等。规范化检索语言规范化词称作叙词、标题词等,就是受控词21标题词:标题词语言采用标准化处理的名词术语作为标识,来表达文献所论述或涉及的事物主题,并将全部标识按字顺排序。
叙词:主要通过叙词表来加以规范的人工受
控词语,故又称为
受控词(controlledterms)。主要的叙词表
《汉语主题词表》(简称《汉表》); 《INSPECthesaurus》; 《EiEngineeringInformationThesaurus》例:欲在美国EI检索系统中利用叙词索引检索有关电弧焊新技术的引
文文献,可以拟检索词为Arcwelding,查EIThesaurus,得到
Arcwelding
USE:Electricarcwelding 说明Arcwelding不是正式检索词,必须按照用项(USE)的指引换用
正式叙词Electricarcwelding作为检索词。标题词:标题词语言采用标准化处理的名词术语作为标识,来表达22非规范化语言与规范化语言的比较非规范化语言(自然语言),没有词表的约束和复杂规则的限
制,检索者可以使用在文献中出现的任何一个有实际意义的词进
行检索,所以较受控语言使用方便。规范化语言对同义词、近义词、一词多义、一义多词加以规范统
一,显示多种形式的相关关系,因而,查准率和查全率较高。例:查关于大学教育系的文章。
用关键词语言:原文中使用什么就抽取什么如:education
department/educationschoool/schoolofeducation,
用主题语言语言:则使用主题词表将这一类文章统一规范为
schoolofeducation。检索时,结果将包括所有关于大学教育
系的文章。非规范化语言与规范化语言的比较23数据库的定义和类型数据库的构成文献信息数据库的检索原理六、文献信息数据库原理数据库的定义和类型六、文献信息数据库原理241.数据库原理定义至少由一种文档(file)组成,能满足特定目的或特定功能数据处理系统需要的数据集合。简言之就是数据的集合,存储在计算机内的、有组织的、可共享的数据集合。1.数据库原理定义至少由一种文档(file)组成,能满足25数据库类型类型:
信息内容:文字型(大多数)数值型多媒体加工深度:一次文献:全文型(中刊网、Elsevier等)
二次文献:目录型(iPac、期刊目录等)题录型(SKBK等)文摘型(Compendex等)三次文献:网络在线词典等工具书数据库类型类型:262.数据库的结构数据库的构成:
“文档—记录—字段”三个层次构成
字段:是构成记录的基本单元,用于描述实体的某一方面属性,在同
一个文档中,各条记录都具有相同性质的字段。
与文献内容相关:基本字段
与文献内容无关:辅助字段记录:是构成文档的基本单位,也是机器存取数据的基本单位,它
描述某一实体的全部属性。
全文数据库:一条记录对应一篇全文
书目数据库:一条记录对应一条文摘或题录2.数据库的结构27
基本字段名称:
文摘(Abstracts)
文章题目(ArticleTitle)
作者关键词(AuthorKeyWords)
辅助字段名称:
作者(Authors)
作者机构
期刊名称(JournalTitle)
国际标准连续出版物号(ISSN)等。
基本字段名称:28数据库主要组成:主文档索引文档帮助系统主文档:是数据库数据组织的基本形式,由于该文档内的记录按文
献信息获得的先后顺序排列,故又名顺排文档。
记录(记录号大小排列)的集合内容无序,无法直接检索。数据库主要组成:29顺排文档示意图记录号记录4基本字段辅助字段记录6一条记录顺排文档示意图记录号记录4基本字段辅助字段记录6一条记录30索引文档:是对主文档的再加工,它把主文档记录中的某些字段(
如作者、关键词、分类号等字段)中的个别单元(如某一位作者,某
一条关键词)及其所对应的记录号抽出,分别按某种顺序(如音序、
数序等)进行排序,然后统计出具有同一单元的记录条数,另行归并
成索引文档,又称倒排文档。
记录的特征标识(作者、期刊名称等)排序,其后列出含有此标识的
记录号提高检索效率。索引文档:是对主文档的再加工,它把主文档记录中的某些字段(31计算机检索原理示意题名记录输出检索结果计算机检索原理示意题名记录输出检索结果32数据库结构图
数据库(文档)
主文档
索引文档(若干)
记录的集合
主题词
作者期刊名称等倒排文档…
字段给出特征标识记录数
基本字段
辅助字段
数据库结构图333.文献信息检索原理机检原理(检索):输入检索提问标识→倒排文档(与数据库标引标识进行比较匹配,给出记录篇数)
→顺排文档(根据记录号读取)→输出结果。(结果不理想时要进一步修改检索提问标识)
3.文献信息检索原理机检原理(检索):34总结:1.掌握文献信息检索的过程原理。2.了解检索途径和检索语言的分类。3.思考题:王仕同是我国神经网络领域的著名学者,希望了解他近两年的研究动态,通过什么途径检索? 制冷剂“氟利昂”(Freon)是一个外来语,又译作“氟里昂”,欲检索“氟利昂”方面的研究论文,从什么途径检索可以较快的速度,获得较高的查全率?总结:35信息检索概念信息检索类型信息检索方法信息检索途径信息检索语言文献信息数据库原理第二讲信息资源检索基础知识(二)信息检索概念第二讲信息资源检索基础知识(二)36信息检索:是指将信息(主要指文献信息)按一定的方式组织和存储起来,并根据用户的需要找出相关信息的过程。
信息检索存储检索存储:是对信息进行著录、标引、整序,编制检索工具和建立检索系统的过程。检索:是指面向信息需求而进行高度选择性的查找过程。一、信息检索信息检索:是指将信息信息检索存储检索存储:是对信息进行著录、37信息检索过程:存储过程:
标引员广泛收集信息,形成检索标识,把这些标识按一定方法组织成形成各种检索系统,即信息源的形成过程。检索过程:
检索人员分析课题,用检索提问标识,从检索系统中查获所需的信息。信息检索原理:用户检索提问标识(提问检索词)与存储在检索工具中的标引标识(标引词)进行比较,两者一致或信息标引标识中包含提问标识即是命中的信息。能否准确地检索出用户所需的信息,关键在于能否准确地选择检索词。这里所谓的“准确”,是指用户所选用的检索词必须与数据库中标引文献记录所用的标引词相一致。
信息检索过程:38信息检索过程一个匹配(Match)过程信息检索过程一个匹配(Match)过程39按检索内容划分数据检索是以数据为检索内容的信息检索,要求从检索系统存储的大量原始调查数据和其它统计数据中查出所需的数字资料。全文检索即检索系统存储的是整篇文章或整本图书。书目检索是以文献线索为检索内容的信息检索。二、信息检索类型按检索内容划分数据检索书目检索二、信息检索类型40事实检索是以原始文献中抽取的事物的情况为检索对象,检索结果是事物发生的时间、地点和情况等具体答案,也是一种确定性的检索。例如:查找“前事不忘、后事之师”最早的出处。检索“赤壁之战发生在湖北赤壁市么?”图像检索即以图形、图像或图文信息为检索内容的信息检索。多媒体检索是以文字、图像、声音等多媒体信息为检索内容的信息检索。事实检索图像检索41按是否使用检索工具划分直接检索就是指利用一次文献进行检索,这是以前比较常用的一种查找方法。所花时间多和精力大,检出文献少。(简单模糊检索)间接检索就是指利用各种检索工具获得文献线索,再根据线索去查找原始文献线索的方法。(高级检索,限定检索等)按是否使用检索工具划分42按信息检索手段划分传统信息检索就是手工信息检索,是利用各种印刷型检索工具来查找文献的一种方法。一般是利用各种印刷型检索工具。现代信息检索现代信息检索即计算机信息检索,是指利用计算机和网络来处理和查找文献信息的检索方式。分:联机检索、光盘检索、网络检索。按信息检索手段划分43信息检索的方法主要有:常规法,引文法,综合法。常规法:常规法是指直接利用检索工具检索文献的方
法,主要有顺查法、倒查法和抽查法。
顺查法:按照时间顺序,由远及近地利用检索系统进行文献检
索的方法,这种方法能收集到某一课题的系统的文献,适用于
课题的文献检索。
倒查法:倒查法是由近及远,从新到旧,逆时间的顺序利用检
索工具进行文献检索的方法。
抽查法:针对项目的特点,选择有关该项目的文献信息最可能
出现或最多出现的时间段,利用检索工具进行重点检索的方法。三、信息检索方法信息检索的方法主要有:常规法,引文法,综合法。三、信息检索方44引文法:利用文献后所附的参考文献进行检索的方法,由追溯检索法和引文索引法组成。追溯检索法:即从文献信息密度较大的几种期刊的最近两三年论文中查出一批与检索课题有关的文献,再以这批文献所附的参考文献作为线索,找到第二批相关文献,以此类推获得一批与主题相关的文献,这种方法的出发点是从引用论文开始查找。引文索引法:利用引文索引,从被引论文开始查找引用它的全部论文,通过此方法可得到与来源文献同一主题的相关文献。专门工具:引文索引,如《科学引文索引》、《社会科学引文索引》等。综合法:又称循环法,就是常规法与引文法综合运
用的方法。引文法:利用文献后所附的参考文献进行检索的方45检索途径是由提取信息源的外部与内部特征形成的,又称检索点或检索入口。外部特征的检索途径:题名途径:利用书刊名或文献题名编成的索引进行信息检索的途径,一般多用于查找图书,期刊,单篇文献。著者途径:根据已知文献源著者直接或间接查找文献源的途径。号码途径:通过各种专用的符号代码直接或间接查找文献的方法,包括书号、刊号、报告号、专利号、标准号等。四、信息检索途径检索途径是由提取信息源的外部与内部特征形成的,又四、信息检索46内部特征的检索途径:分类途径:用分类法组织的信息为用户提供从科学属
性查找的途径就是分类途径。
分类法:
按照信息内容的科学属性,运用概念划分与归纳的方法
形成各级类,从而使信息形成一种有序化的知识体系的信息组织方法。
主题途径:用户根据所确定的主题词或关键词,利用主题词表和主题索引实施检索的途径。
主题词:以规范化的词汇来表达文献的内容的主题。
关键词:一种非规范化词汇。内部特征的检索途径:47检索语言是信息存储与检索过程中用于描述信息特征和表达用户信息提问的一种专门语言。是在信息储存和信息检索中所使用的标识语言,它既包括受控的人工语言(通过词表或分类表进行规范过的语言),也可包括未受控的自然语言。检索语言是根据检索途径来确定,使用什么样的检索途径,就使用什么样的检索语言。注意:信息检索存储过程中使用的标引语言(标引词或文献标识),也是在信息检索的检索过程中使用的检索语言(标引词或检索标识),标引语言和检索语言必须一致才能准确检索出结果。五、信息检索语言检索语言是信息存储与检索过程中用于描述信息特征和表达用户信息48检索语言的类型检索语言的类型表述文献外表特征的语言表述文献内容特征的语言著者号码题名分类主题非规范化语言(自然)规范化主题词(人工)叙词标题词关键词自由词检索语言的类型检索语言的类型表述文献外表表述文献内容著者分类49文献外部特征检索语言:著者检索语言:主要针对编有著者姓名索引的检索工具,输入著者姓名就可以检索到所要查询的内容,但要注意姓名输入的格式变化。文献代码检索语言:文献代码即文献编号,例如,国际统一书号ISBN,国际统一刊号ISNN,数字文献表引号DOI,科技报告的报告号,科技标准的标准号,专利的公开号、公告号以及专利号等,如果在文献数据库中建有相应的代码字段,那么就可以建立代码索引,用相应的代码作为检索词进行检索。题名检索语言:即通过文献名就可以检索到所要查询的内容。文献外部特征检索语言:50文献内容特征检索语言分类检索语言按知识门类的逻辑次序将信息系统地组织和划分的语言,具体体现为用分类号和类名来表达信息的主题概念。通过分类表来对分类号进行控制。
例:I712.45/26达芬奇密码
I712.45/404暮光之城.新月主要分类法《中国图书馆图书分类法》(简称《中图法》)《中国标准文献分类法》(简称《标准法》)《InternationalPatentClassification》(国际专利分类法,简称《IPC》)
文献内容特征检索语言51《中国图书馆图书分类法》将图书分为马列、哲学、社会科学、自然科学、综合五大类。分类标识即分类号,由字母或字母和数字组成。采用等级列举表达从属关系。《中国图书馆图书分类法》将图书分为马列、哲学、社会科学、自然52C社会科学总论D政治、法律E军事F经济G文教、科学、体育H语言J艺术I文学K历史、地理自然科学总论NRSTO数理化P天文学、地球科学Q生物科学医药、卫生农业科学工业技术U交通运输V航空、航天X环境科学Z综合性图书社会科学自然科学机械、仪表建筑科学马列主义、毛泽东思想A马列B哲学哲学综合TBTDTETFTGTHTJTLTKTMTNTPTQTSTUTV一般工业技术矿业工程石油冶金工业无线电、电子学、电讯技术自动化计算化学工业轻工业、手工业金属学武器工业动力工程原子能技术电工技术水利工程C社会科学总论D政治、法律E军事F经济G文教、科学、体育H语53主题检索语言主题检索语言直接采用能反映文献主题概念的词语来标引文献。目前国内外在主题检索语言中采用的语主要非规范化语言(关键词、自由词)、
规范化主题语言(叙词、标题词)等几种。主题检索语言54非规范化语言它是以关键词作为信息内容标识和检索依据的主题语言。它将描述主题内容的关键词抽出,按字顺排列提供检索。一般不加或加以少量规范处理。关键词:是能反映文献主题概念的关键词语,可直接从文献记录
的篇名、文摘或全文中,按字面拆分抽取,没有词表来
对选词进行控制,是一种非受控的、不规范的词语。自由词:在文中自由散布的,非人工标引的,叫做文中自由词(
freetermsintext)或简称自由词。
例:动压空气轴承
关键词:动压轴承/空气轴承
自由词:动压/空气/轴承,或:动/压/空/气/轴/承非规范化语言55规范化检索语言
规范化词称作叙词、标题词等,就是受控词。指从自然语言中优选
出来的并经过规范化处理的名词术语。
把规范化词按照一种便于检索的方式编排起来,就形成主题词表。“规范化处理”就是通过叙词表对选词的词类、词形、同义词、
多义词等进行处理的过程。
例如、同义词规范类型:
同一事物的不同称呼,
如:西红柿与蕃茄、网上聊天与QQ、儿歌与童谣等。
同一事物的简称、全称、音译等,
如:日本语与日语、互联网与因特网、中央电视台与CCTV等。规范化检索语言规范化词称作叙词、标题词等,就是受控词56标题词:标题词语言采用标准化处理的名词术语作为标识,来表达文献所论述或涉及的事物主题,并将全部标识按字顺排序。
叙词:主要通过叙词表来加以规范的人工受
控词语,故又称为
受控词(controlledterms)。主要的叙词表
《汉语主题词表》(简称《汉表》); 《INSPECthesaurus》; 《EiEngineeringInformationThesaurus》例:欲在美国EI检索系统中利用叙词索引检索有关电弧焊新技术的引
文文献,可以拟检索词为Arcwelding,查EIThesaurus,得到
Arcwelding
USE:Electricarcwelding 说明Arcwelding不是正式检索词,必须按照用项(USE)的指引换用
正式叙词Electricarcwelding作为检索词。标题词:标题词语言采用标准化处理的名词术语作为标识,来表达57非规范化语言与规范化语言的比较非规范化语言(自然语言),没有词表的约束和复杂规则的限
制,检索者可以使用在文献中出现的任何一个有实际意义的词进
行检索,所以较受控语言使用方便。规范化语言对同义词、近义词、一词多义、一义多词加以规范统
一,显示多种形式的相关关系,因而,查准率和查全率较高。例:查关于大学教育系的文章。
用关键词语言:原文中使用什么就抽取什么如:education
department/educationschoool/schoolofeducation,
用主题语言语言:则使用主题词表将这一类文章统一规范为
schoolofeducation。检索时,结果将包括所有关于大学教育
系的文章。非规范化语言与规范化语言的比较58数据库的定义和类型数据库的构成文献信息数据库的检索原理六、文献信息数据库原理数据库的定义和类型六、文献信息数据库原理591.数据库原理定义至少由一种文档(file)组成,能满足特定目的或特定功能数据处理系统需要的数据集合。简言之就是数据的集合,存储在计算机内的、有组织的、可共享的数据集合。1.数据库原理定义至少由一种文档(file)组成,能满足60数据库类型类型:
信息内容:文字型(大多数)数值型多媒体加工深度:一次文献:全文型(中刊网、Elsevier等)
二次文献:目录型(iPac、期刊目录等)题录型(SKBK等)文摘型(Compendex等)三次文献:网络在线词典等工具书数据库类型类型:612.数据库的结构数据库的构成:
“文档—记录—字段”三个层次构成
字段:是构成记录的基本单元,用于描述实体的某一方面属性,在同
一个文档中,各条记录都具有相同性质的字段。
与文献内容相关:基本字段
与文献内容无关:辅助字段记录:是构成文档的基本单位,也是机器存取数据的基本单位,它
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 餐饮商标使用合同模板
- 保洁劳务分包安全协议书
- 股权收购合同新
- 机电销售合同模板
- 经纪人与艺人合作合同范本
- 江西省景德镇市2024年七年级上学期数学期中考试试卷【附答案】
- 大型酒店装修协议书
- 服装购销合同简单详细版范文
- 163二次根式的加减(原卷版)
- 工程项目内部承包合同
- 河南省南阳市方城县2023-2024学年八年级上学期期中道德与法治试题
- 国网新疆电力有限公司架空输电线路无人机安全工作规程题库
- Unit 1 课件(第1课时)【知识精研+拓展提升】 中职专用 高一英语高效课堂
- 风电网:风机基础混凝土冬季施工建议措施
- 2023-2024学年北京四中七年级(上)月考数学试卷(10月份)(含解析)
- 关于酒驾醉驾开展谈心谈话
- 《婴幼儿常见疾病预防与照护》课程标准
- 《让我们的学校更美好》课件ppt
- JTGT-3833-2018-公路工程机械台班费用定额
- 疗效精油轻图典
- NB/T 11115-2023煤矿智能供电系统技术导则
评论
0/150
提交评论