《网络信息文献检索》复习资料-庞佳.doc_第1页
《网络信息文献检索》复习资料-庞佳.doc_第2页
《网络信息文献检索》复习资料-庞佳.doc_第3页
《网络信息文献检索》复习资料-庞佳.doc_第4页
《网络信息文献检索》复习资料-庞佳.doc_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、网络信息文献检索课程期末复习资料一、客观部分(单项选择、多项选择、判断)( - )选择部分考核知识点:网络信息资源的类型附: 1.1.1 (考核知识点解释):网络信息资源可以根据多种不同的标准进行划分,根据信息资源的出版形 式,网络信息资源可以划分多种形式,其中包括( 1) 电子图书:正式出版的具 有一定篇幅的非连续性的出版物,可以是直接在网络上以电子形式出版的,也可 以是以纸质形态出版后,以数字化形式保存在互联网中供读者使用的图书。 ( 2 ) 电子期刊:期刊,又称连续出版物,是定期或不定期发行的连续出版物。电子期 刊则是电子化的期刊。目前出版的形式有两种,一是以纸质形式出版后,将其数 字化

2、,并通过网络传播;二是直接在网络上以电子形式出版。 ( 3)会议论文:会 议论文是指在各种学术、专题会议上发表的论文、报告。会议论文时效性强,可 以及时反映某一领域或专题的研究动态、最新研究成果,代表着这一领域的研究 水平。会议论文一般以论文集的形式出版,有时也会发表在专业期刊上。 ( 4) 学 位论文:学位论文是研究者旨在获得某个专业的专业学位而完成的研究型论文。 学位论文的结构完整,会对研究的背景、内容、方法、结果等方面进行系统的分析与论述。目前数据库中较为常见的学位论文为硕士和博士学位论文。按照信息资源中数据类型划分的标准又可以将网络信息资源分为事实型信息、 数值型信息等。而这些信息资源

3、是进行研究特别是实证研究时必须的信息资源。因此,电子期刊、事实数据和学位论文都是撰写论文时应该检索的重要信息 资源。考核知识点:网络信息资源检索技术附: 1.1.2 (考核知识点解释):布尔逻辑检索是运用布尔逻辑算符表达检索词之间的逻辑关系,组配出完整 的检索概念,实现信息检索目的的检索技术。布尔逻辑检索采用的逻辑运算符包括“与”、“或”、“非”,以及大于、小于、 等于、不等于等。“与”、“或”、“非”是最为常用的逻辑运算符。(1) 逻辑“与”逻辑“与”用“AND”或“ * ”表示,其含义为若两个或多个检索词间以“AND”或“ * ”相连接,则表示该两个或多个检索词需同时出现在检索字段中,则文

4、 献才被命中。(2) 逻辑“或”逻辑“或”用“ OR” 或“ + ”表示,其含义为若两个或多个检索词间以“ OR”或“”相连接,则表示该两个或多个检索词只要有一个出现在检索字段中, 则文献被命中。(3) 逻辑“非”逻辑“非”用“ NOT” 或“ - ”表示,其含义为若两个检索词间以“ NOT” 或“ - ”相连接,则表示只有NOTW面的检索词出现在检索字段中,而 NOTW面的检索词不出现在检索 字段中,则文献被命中,其他情况文献不被命中。考核知识点:网络信息资源检索技术附: 1.1.3 (考核知识点解释) :截词符的形式与分类不同的系统使用的截词符不完全相同,但最常用的截词符有“ * ”和“

5、?”等多种截词符。按照截词符代替的字符或字符串的数量可以分为有限截词和无限截词。有限截词,即指一个截词符只代表一个字符。无限截词则是指一个截词符可代表多个字符或一个字符串。因此,“ * ”和“? ”也代表了不同的截词含义。0 或 1 个字符,而“? ”代表 0或多个字符或一个字符串。(1)“*式拼写时,使用“(2)“?* ”只代表单词中任意位置的 0 或 1 个英文字符。在出现单词的单复 数、英式和美* ”可以一次将两种不同写法同时检索出来。? ”可以代表单词中的 0 或多个字符。在检索词出现名词、现在分词、 过去分词等不同形式时,可以采用“? ”代替单词的不同词根部分,一次性获得全部形式的检

6、索结果。考核知识点:网络信息资源检索技术附: 1.1.4 (考核知识点解释人CNK臻:据库跨库检索结果分组类型包括:学科类别、中文关键词、研究层 次、文献作度。者、作者单位、文献出版来源、研究获得资助、来源数据库、发表年考核知识点:网络信息资源的组织方式 附: 1.1.5 (考核知识点解释人网络信息资源的组织是根据网络信息资源的内部与外部特征对信息进行的 序化和表征,用以更加系统、 规律地揭示信息资源及其内在与外在联系, 实现信 息资源查找的方便、 准确。按照不同的组织原则,信息资源被组织成不同的结构 , 形成不同的组织方式。常见的信息资源组织方式有数据库方式、搜索引擎方式和 主题指南方式。(

7、 1) 在数据库中,信息资源被分解为基木的存储单元一一字段,并按照相 应的规则进行组织,用户可以根据需要,对不同字段进行检索,也可根据具体的 要求,将多个字段内容组合检索,获得精确的检索结果。 ( 2) 以搜索引擎方式存在的信息资源,是自动搜索程序对网络中公开的信息进行持续收集,利用索引软 件对收集到的信息进行自动标引,构建成基于Web的数据库,并向用户提供关键词检索。(3)主题指南方式是一种综合利用分类与主题相结合的信息资源组织方 式,以主题词为类目划分的标识,利用超文本链接技术将网络中的信息组织成检 索体系,逐层导引用户找到自己需要的网络信息资源。考核知识点:截词检索的使用方法附: 1.1

8、.6 (考核知识点解释):截词检索主要是利用检索词的词干或者不完整的词形进行检索。最为常见的 是 ” 和 “ ? ”。“? ”可以代表单词中的0或多个字符。在检索词出现名词、现在分词、过去分词等不同形式口寸,可以采用“?”代替单词的不同词根部分,一次性获得全部形式的检索结果。如:检索“管理”这个概念,会有 manage, managing.management等多个拼写形式,那么可以将检索式写为:manag?,则检索结果 会将包含上述单词的文献全部显示。考核知识点:截词检索的使用方法附: 1.1.7 (考核知识点解释人网络信息资源的检索,可以根据不同的需求和具备的检索条件,选择不同的 检索方法

9、。经常使用的检索方法包括常用检索法、回溯检索法和循环检索法。考核知识点:数据库的分类附:1.1.8 (考核知识点解释人除了从数据结构的角度对数据库进行划分,数据库还可以从应用的角度划分。按照数据库中数据的用途可将其划分为学术数据库、应试数据库、实证数据库和休闲数据库。(1)学术数据库:学术数据库是指包含各类学术信息,用于学术信息检索与分析的各类数据库系统,包括学术期刊数据库、电子书数据库、学位论文数据库、会议论文数据库等。(2)应试数据库:应试数据库是指包含各类资格考试与等级考试信息、真题、 模拟题的 数据库,这些数据库可以提供考试要求、历年考试真题、模拟题等数据内容,并提供在线测试、计分、答

10、案分析等数据使用功能。(3)实证数据库:实证数据库是指仅包含各类统计数据、事实数据、案例、标 准、专利 等客观内容的数据库。这些数据可以为研究者提供很好的客观研究依据、详实的数据,形成研究中的事实依据,也可以为研究者提供对研究内容的考证依据。这类数据库具有极高的客观性。(4)休闲数据库:休闲数据库是指以娱乐休闲信息资源为主体的数据库,可以为人们提供娱乐、休闲的内容与服务功能。比如提供歌曲、休闲讲座的音频与视 频数据库,讲授健身、 舞蹈、旅游等内容的多媒体数据库等都是休闲数据库。考核知识点:网络信息资源的检索策略附:1.1.9 (考核知识点解释人在检索网络信息时,应分析检索课题的主旨内容,明确检

11、索的目的和要求,根据要求检索相应的学科和文献信息类型。在选题阶段对于该文题的研究综述、最新研究成果的报道索的信息资源。这样才能保证所选题目具有较好的新颖性和研究价值。考核知识点:信息资源的组织形式附: 1.1.10 (考核知识点解释人网络信息资源的组织是根据网络信息资源的内部与外部特征对信息进行的 序化和表征,用以更加系统、 规律地揭示信息资源及其内在与外在联系, 实现信 息资源查找的方便、 准确。按照不同的组织原则,信息资源被组织成不同的结构 , 形成不同的组织方式。常见的信息资源组织方式有数据库方式、搜索引擎方式和 主题指南方式。考核知识点:信息检索的基本原理附: 1.1.11 (考核知识

12、点解释):网络信息资源检索从狭义上讲,是对互联网或数据库中存在的信息进行查 找、保存的过程。从广义上说,则包括对信息资源进行加工存储和检索获取两个部分。网络信息资源的加工存储是利用检索语言对信息资源进行标引、分类,形成 信息资源标识并以数字化、网络化的形式存储在检索系统中,形成数据集合的过不旱,是检索网络信息资源的基础。网络信息资源的检索则是将用户的需求进行分析、标引,形成提问标识,按 照一定的语法规则与信息资源标识进行匹配,当匹配结果一致或包含有检索标识 时,系统以信息记录的形式输出检索结果的过程,这是网络信息资源检索的目的。不同的检索系统有不同的检索原理,但总体上的规则是相通的,即信息资源

13、标识与提考核知识点 : 网络信息资源的概念问标识匹配结果一致,或包含提问标识,则命中信息资源标识,并显示 检索记录。附: 1. 1. 12 (考核知识点解释) :网络信息资源又称为虚拟资源、因特网信息资源、电子信息资源、数字信息 资源、联机信息、万维网资源。由于网络信息资源的形式众多、特点各异,因此 , 目前还没有对网络信息资源的统一定义。一般可以将网络信息资源理解为“将文 字、图像、声音、视频等多种形式的信息, 存储在以光、 磁等非印刷介质的载体上, 以超文木、 数字化为组织和存在方式,以互联网为渠道,进行发布、传递、 存储和利用的各种信息资源的总和”。考核知识点:网络信息资源检索的效果评价

14、附: 1. 1. 13 (考核知识点解释) :查准率,是衡量某一检索系统的信号噪声比的一种指标,即检出的相关文献 与检出的全部文献的百分比。使用泛指性较强的检索语言,如上位类、上位主题 词能提高查全率,但查准率下降。考核知识点:数据库的结构布局附: 1.1.14 (考核知识点解释) :数据库的组织结构一般会按照分类、主题或分类与主题相结合的方式进行, 为了方便初次使用数据库或不熟悉数据库采用的编排体系的用户,大多数数据库都会提供分类导航或主题导航。通过导航,可以帮助使用者按照相关的主题“顺 藤摸瓜”,快速了解自己的检索需求在数据库的哪些部分中,提高检索的准确率和效率。考核知识点:网络信息资源的

15、组织附: 1.1.15 (考核知识点解释) :数据库方式是网络信息资源组织中的重要方式之一。在数据库中,信息资源被分解为基本的存储单元一一字段,并按照相应的规则进行组织,用户可以根据 需要,对不同字段进行检索,也可根据具体的要求,将多个字段内容组合检索, 获得精确的检索结果。以数据库方式组织起来的信息资源,数据规范、统一,具 有良好的操作界面,使用简便,检索效果好。由于对检索范围可以准确的控制,因此,数据库组织方式下的信息检索效率 较高,网络负载较低。考核知识点:网络信息资源的组织附: 1. 1. 16 (考核知识点解释):网络信息资源的检索可以根据信息资源木身的内外部特征,从多种不同途径 检

16、索到同一个信息资源或某一类信息资源。目前一般依据信息资源的外部特征和 内容特征将这些途径分成两大类。信息资源的内容特征是指从信息资源所承载的具体内容中提炼出的某些内 容和信息特征。通过信息资源的内部特征,可以查找到特定主题的信息,从而获 得与该主题相关的文献及其线索。对信息资源内部特征我们一般按照分类、主题 或者分类与主题相结合的方式对不同信息内容特征进行提取与归纳。考核知识点:搜索引擎的类型附: 1.1.17 (考核知识点解释人独立搜索引擎是能够对Internet 网络信息资源进行收集、整理与组织,并 提供检索服务的信息服务系统。独立搜索引擎针对网页信息进行全文搜索,搜索 的领域更广更深,但

17、由于每个搜索引擎的数据资源不同、更新速度不同,标引过程中没有人工干预,因此,使用独立搜索引擎需要进行多次检索,检出的信息存 在大量重复,检索效率较差。元搜索引擎与独立搜索引擎相对,是建立在多个搜索引擎基础上的搜索引 擎,它通过统一的查询界面接收查询请求,调用若干独立搜索引擎进行搜索,对不同搜索引擎的检索结果进行统一处理后,用统一的格式反馈给用户结果。 集成搜索引擎也称为“多引擎同步检索系统”,是在一个 Web页面上链接多个独 立搜索引擎,用户在检索时需要指定搜索引擎,其检索结果由各搜索引擎分别以 不同页面的形式显示或者集中到一个页面分块显示。考核知识点:网络信息资源的检索策略附: 1.1.18

18、 (考核知识点解释) :课题研究的过程中应该注重所检索的信息资源的质量,从而保障研究成果的 质量,因此在研究过程中不仅要关注期刊论文,还要关注论述较为系统的图书。 为了避免因出版周期过长而导致的研究迟滞,在文献类型的选择上应该包括出版 周期较短的会议论文和直接在网络上出版的该主题的学术信息,同时在使用网络信息资源的同时,也应该注重对纸本信息资源的补充,以保证信息的全面和完整。二、主观部分(名词解释、简答、论述)( - )名词解释考核知识点:网络信息资源的含义2.1.1 (考核知识点解释):资源、联机信息、万维网资源。是将文字、图像、声音、视频等多种形式的信息 , 存储在以光、磁等 非印刷介质的

19、载体上,以超文本、数字化为组织和存在方式, 以互联网为渠道,进行发布、 传递、存储和利用的各种信息资源的总和。考核知识点:网络信息资源的类型2.1.2 (考核知识点解释人一次信息,也称原始信息,是指从劳动实践或者研究中产生并正式发表的信息,包括电子图书、电子期刊、电子报纸、专利信息、各种数据库等。一次信息规范、系统,是对新知识、新发现、新技术等内容规范、详细的描述,具有很好的科学性、严谨性,是人们创造性劳动的结晶,具有参考、借鉴的 价值,也是我们检索 和利用信息资源的最主要来源。考核知识点:网络信息资源检索的效果评价2.1.3 (考核知识点解释人查全率即召回率,是衡量某一检索系统从文献集合中检

20、出相关文献成功度的 一项指标,即检出的相关文献与全部相关文献的百分比。普遍表示为:查全率系统中的相关信息总量)xl00%o考核知识点:搜索引擎的类型附: 2. 1.4 (考核知识点解释):元搜索引擎,与独立搜索引擎相对,是建立在多个搜索引擎基础上的搜索引 擎,它通过统一的查询界面接收查询请求,调用若干独立搜索引擎进行搜索,对不同搜索引擎的检索结果进行统一处理后,用统一的格式反馈给用户结果。元搜索引擎的优点在于一次检索查找了多个搜索引擎的内容,其自身的检索 结果显示机制对来源不同的结果进行了汇集、筛选、去重、合并等优化处理,降低了检索的兀余,提高了效率。缺点在于检索质量很大程度依赖于所链接的独立

21、搜索引擎的数据质量,受到 查询语法转换能力的限制,元搜索引擎目前能提供的查询语法还不完善。考核知识点:网络信息资源的类型附: 2.1.5 (考核知识点解释人二次信息:是对一次信息进行组织、加工、整理后,使之按照一定的规律进行编排而形成的内容,也称为检索工具。二次信息资源主要包括电子目录、索引、 摘要、导航等信息内容。二次信息是检索一次信息的工具。考核知识点:互联网信息中网络检索工具的分类附: 2. 1.6 (考核知识点解释人学科信息门户提供可检索和可浏览的因特网资源目录的联机服务系统, -?般 集中于某一相关的学术领域,提供对经图书馆工作人员遴选和按学科组织的因特 网资源的利用。学科信息门户以

22、专业用户群为服务对象,起到的是学科信息资源 的导航作用。学科信息门户按照所体现信息资源的范围,可以分为综合性的学科信息门 户、单一学科信息门户等。考核知识点:搜索引擎的分类与含义附: 2.1.7 (考核知识点解释人集成搜索引擎 (All-in-one Search Page ) , 也称为 " 多引擎同步检索系统” , 是在一个Web页面上链接多个独立搜索引擎,用户在检索时需要指定搜索引擎,其检索结果由各搜索引擎分别以不同页面的形式显示或者集中到一个页面分块显刀£ O考核知识点:网络信息资源的类型附: 2.1.8 (考核知识点解释人零次信息指未形成正式出版物或未进入社会进行

23、交流的信息,是人们撰写文 章、设计草图、 统计数据的原始资料, 是形成一次信息的基础。 包括各种书信、 私人笔记, 以及 Blog.微博、BBS上的帖子、QQ MSNE交流的信息等。零次信息内容新颖,但不规范,分布的非常分散,其内容有时具有非常高的 价值,但不公开交流,难以获得。考核知识点:网络信息资源的类型附: 2.1.9 (考核知识点解释人与查全率和查准率相对应,我们把检索口寸检索系统与检索需求不匹配,但实际上信息内容与检索需求相关的信息遗漏的概率称为漏检率。也就是说检索相关 文献数量与系统中相关文献总量相除的百分比即为漏检率。 如果以完整的与检索 需求相关的文献作为整体1 的话,那么漏检

24、率就等于 1- 查全率。考核知识点:网络信息资源的类型附: 2. 1. 10 (考核知识点解释) :搜索引擎是指定期遍历各类网站来发现、 收集并标引网页, 建立索引数据库, 并通过 WEB形式的检索界而接受用户的查询请求。搜索引擎针对网页信息进行全 文搜索。更新速度快,可直接输入关键词检索,不需要确定检索的范围。但检索 结果的准确性差。其类型包括:独立搜索引擎、元搜索引擎和集成搜索引擎。考核知识点:网络信息资源检索的方法附: 2.1.11 (考核知识点解释人直接检索法,是在检索系统中根据检索系统的设置直接按照不同的字段进行检索的方法。如按照题目、著者、关键词、出版时 ?间、文献类型等不同内容进

25、行检索。通过直接检索法,可以检索到确定的知识、信息、文献等内容,获取信息 的效率也较高。考核知识点:网络信息资源检索技术附: 2.1.12 (考核知识点解释) :截词是指在检索词的合理位置截断检索词,然后使用截词符进行替代。截词 检索是利用截断的词的一个局部进行的检索,并认为凡满足这个词局部中的所有 字符(串)的信息,都为命中的信息。不同的系统使用的截词符不完全相同,但最常用的截词符有“ * ”和“ ?”等多种截词符。按照截词符代替的字符或字符串的数量可以分为有限截词和无限截词。有限截词,即指一个截词符只代表一个字符。无限截词则是指一个截词符可代表多个字符或一个字符串。因此,“ * ”和“?

26、”也代表了不同的截词含义。“ ”代表 0 或 1 个字符,而“? ”代表 0 或多个字符或一个字符串。考核知识点:网络信息资源检索的效果评价附: 2.1.13 (考核知识点解释):网络信息资源检索的效果是一个综合性的指标,应该从多个角度共同进行考量,寻找一个最佳的平衡点,以达到信息资源检索的最优效果,查准率即是其中的指标之一。查准率,即精度,是衡量某一检索系统的信号噪声比的一种指标,即检出的相关文献与检出的全部文献的百分比。普遍表示为:查准率二( 检索出的相关信 息量 / 检索出的信息总量)x100%使用泛指性较强的检索语言(如上位类、上位 主题词)能提高查全率,但查准率下 降。考核知识点:开

27、放获取附: 2. 1. 14( 考核知识点解释):开放存取,也称开放获取(0pen Access), 即把同行评议过的科学论文或学 术文献放到互联网上,使用户可以免费获得,而不需考虑版权或注册的限制。开放获取运动旨在打破学术研究的人为壁垒。考核知识点:网络信息资源检索技术附: 2.1.15 (考核知识点解释)布尔逻辑检索是运用布尔逻辑算符表达检索词 Z 间的逻辑关系,组配出完整 的检索概念,实现信息检索目的的检索技术。布尔逻辑检索采用的逻辑运算符包括“与”、“或”、“非”,以及大于、小于、 等 于、不等于等。“与”、“或”、“非”是最为常用的逻辑运算符。(1) 逻辑“与”逻辑“与”用“AND”

28、 或“ * ”表示,其含义为若两个或多个检索词间以“AND”或“ * ”相连接,则表示该两个或多个检索词需同时出现在检索字段中,则文 献才被命中。(2) 逻辑“或”逻辑“或”用“ OR” 或“ + ”表示,其含义为若两个或多个检索词间以“ OR”或“ + ”相连接,则表示该两个或多个检索词只要有一个出现在检索字段中, 则文献被命中。(3) 逻辑“非”逻辑“非”用 “ NOT” 或“ - ”表示,其含义为若两个检索词间以“ NOT” 或“ - ”相连接,则表示只有NOTW面的检索词出现在检索字段中,而NO诟面的检索词不出现在检索字段中,则文献被命中,其他情况文献不被命中。考核知识点:搜索引擎分类

29、附: 2. 1. 16 (考核知识点解释)独立搜索引擎是能够对Internet 网络信息资源进行收集、整理与组织,并 提供检索服务的信息服务系统。独立搜索引擎针对网页信息进行全文搜索,搜索 的领域更广更深,但由于每个搜索引擎的数据资源不同、更新速度不同,标引过程中没有人工干预,因此,使用独立搜索引擎需要进行多次检索,检出的信息存 在大量重复,检索效率较差(二)简答考核知识点:网络信息资源的类型附: 2.2.1 (考核知识点解释人按照信息的加工程度,网络信息资源可以划分为零次信息、一次信息、二次 信息、三次信息。零次信息指未形成正式出版物或未进入社会进行交流的信息, 是人们撰写文章、设计草图、统

30、计数据的原始资料,是形成一次信息的基础。一 次信息,也称原始信息,是指从劳动实践或者研究中产生并正式发表的信息。二 次信息是指是对一次信息进行组织、加工、整理后,使之按照一定的规律进行编 排而形成的内容,也称为检索工具。是对一次信息、二次信息进行分析、评述等深加工后形成的信息。考核知识点:网络信息资源检索的含义附: 2.2.2 (考核知识点解释人网络信息资源检索从狭义上讲,是对互联网或数据库中存在的信息进行查 找、保存的过程。从广义上说,则包括对信息资源进行加工存储和检索获取两个部分。网络信息资源的加工存储是利用检索语言对信息资源进行标引、分类,形成 信息资源标识并以数字化、网络化的形式存储在

31、检索系统中,形成数据集合的过程,是检索网络信息资源的基础。网络信息资源的检索则是将用户的需求进行分析、标引,形成提问标识,按 照一定的语法规则与信息资源标识进行兀配,当匹配结果一致或包含有检索标识 时,系统以信息记录的形式输出检索结果的过程,这是网络信息资源检索的目的。不同的检索系统有不同的检索原理,但总体上的规则是相通的,即信息资源标识与提问标识匹配结果一致,或包含提问标识,则命中信息资源标识,并显示 检索记录。考核知识点:网络信息资源的检索途径附: 2. 2.3 (考核知识点解释人( 1) 按信息资源外部特征检索可以划分为题名途径、责任者途径和号码途径。题名途径是指以书名、刊名、文章名、新

32、闻标题、CD名、视频名、音频名等为检索入口的途径称为题名途径。通过题名途径可以查找到具体的某一个图 书、期刊或文章,查准率极高。 但在题名检索中应注意不同系统对题名规范的程 度不同, 采用适合本系统的检索技巧。责任者途径是以信息资源中的责任者为检索入口的途径称为责任者途径。常 用的责任者包括著者、编者、译者、演唱者、出版者、发明者等。责任者又根据 其属性区分为个人责任者和团体责任者。通过责任者途径可以查找到具体的某一 作者或某一机构出版或发表的成果与信息,可以很好的了解某一个作者的研究兴 趣、研究领域、研究的动态与研究焦点的变化。也可以通过对机构作者的检索了 解一个机构的研究概貌,系统的掌握机

33、构研究的整体情况。号码途径是以信息资源出版或进行著录加工时,赋予信息资源的特别号码为 检索入口的途径称为号码途径。包括文献的出版号、专利说明书的专利号、科技 报告的报告号,信息资源收录单位或系统的馆藏号、索取号、分类号等。( 2) 按信息资源内容特征检索可以划分为分类途径、主题途径和分类主题途径。分类途径是按照已有的分类法,根据信息所属的学科属性对信息进行分类,并按照分类体系的规律进行检索的方法。主题途径是将揭示信息资源内容的主题用语排列成词表,按照字顺排列并提供检索入口的检索途径。主题词的提取应准确、全而的反应信息资源所包含的内 容主题,一般采用主题词、关键词、叙词、标题词等来进行描述。分类

34、主题途径:是分类途径与主题途径相结合的检索途径,既保留了分类途 径具备一定的层次划分,揭示事物间隶属关系的特点,乂能够根据内容提炼出多 个特征描述的关键词,使相关内容之间通过语义表达形成关联。考核知识点:截词检索的使用方法附: 2. 2. 4( 考核知识点解释人截词检索主要是利用检索词的词干或者不完整的词形进行检索。最为常见的 是 “ * ”和 “ ? ”。(1) “ * ”代表单词中任意位置的0或1个英文字符。在出现单词的单复数、英式和美式拼写时,使用“ * ”可以一次将两种不同写法同时检索出来。 如:检索 colour 或color 口寸,可以写成colour, 这样可以用“ * ”代替“

35、 u ” 或没有字符,那么检索结果会将包含 colour 和 color 两个词的文献全部命中。(2) “ ? ”可以代表单词中的0或多个字符。在检索词出现名词、现在分 词、过去分词等不同形式时,可以采用“? ”代替单词的不同词根部分,一次 性获得全部形式的检索结果。如:检索"管理”这个概念,会有manage>managingA management等多个拼写形式,那么可以将检索式写为:manag?,则检索结果会将包含上述单词的文献全部显示。考核知识点:搜索引擎的分类与含义附: 2.2.5 (考核知识点解释) :搜索引擎是定期遍历各类网站来发现、收集并标引网页,建立索引数据库,

36、 并通过 WEB形式的检索界面接受用户的查询请求的信息服务网站。分为三类: ( 1) 独立搜索引擎,能够对 Internet 网络信息资源进行收集、整理与组织,并提供检索服务的信息服务系统。 (2)元搜索引擎,与独立搜索引擎相对,是建立在多 个搜索引擎基础上的搜索引擎,它通过统一的查询界面接收查询请求,调用若干 独立搜索引擎进行搜索,对不同搜索引擎的检索结果进行统一处理后,用统一的 格式反馈给用户结果。 (3) 集成搜索引擎,即多引擎同步检索系统,是在一个Web页面上链接多个独立搜索引擎,用户在检索时需要指定搜索引擎,其检索结果由各搜索引擎分别以不同页面的形式显示或者集中到一个页面分块显示。考

37、核知识点:网络信息资源的分类附: 2. 2.6(考核知识点解释人按照信息资源的发布方式,网络信息资源一般被划分为三种信息模式,即目 录信息、文摘信息和全文信息。目录和文摘信息是对全文信息内容的揭示;全文 信息是目录检索的最终目标。目录是著录一个体系内相关信息的记录集合( 名称、 著者、出版、内容、收藏等) ,并按照一定的次序进行编排而形成的揭示信息资源外形特征和内容概貌的工具。文摘也称为摘要,是描述文献内容特征的条目, 介绍了其所对应全文信息的内容概要,是获取全文信息的基础。全文信息是信息 资源的主体,完整的描述或展示了信息资源的整体内容。全文信息可以是一篇文章、一首歌曲、一部视频等。考核知识

38、点:互网络信息资源的特点附: 2.2.7 (考核知识点解释) :与数据库相比,互联网信息资源有一些自己独特的特点。(1) 信息来源分散,质量良莠不齐(2) 数量庞大,变动频繁(3) 内容广泛,形式多样(4) 具有多媒体和超链接特性,交互性强(5) 共享程度高,便于获取考核知识点:互联网络信息资源的特点附: 2. 2.8(考核知识点解释人开放获取的常用途径包括: (1) 开放获取期刊 (OA Journals), 采取读者免 费,作者付费模式。 代表期刊有: PLoSBiology, BioMed Central (BMC), NewJournal of Physics(NJoP)等。(2)作者

39、自存档(Author-Self Archiving), HP作者把将发表,或已发表的研究文章以电子格式放到专门的开放获取知识库中 与同行交流。代表: arxiv. org, qi ji. cn/eprint等。考核知识点:网络信息资源的组织方式 附: 2.2.9 (考核知识点解释):网络信息资源的组织是根据网络信息资源的内部与外部特征对信息进行的 序化和表征,用以更加系统、 规律地揭示信息资源及其内在与外在联系, 实现信 息资源查找的方便、 准确。按照不同的组织原则,信息资源被组织成不同的结构 , 形成不同的组织方式。常见的信息资源组织方式有数据库方式、搜索引擎方式和 主题指南方式。( 1)

40、在数据库中,信息资源被分解为基本的存储单元一一字段,并按照相 应的规则进行组织,用户可以根据需要,对不同字段进行检索,也可根据具体的 要求,将多个字段内容组合检索,获得精确的检索结果。 ( 2) 以搜索引擎方式存在的信息资源,是自动搜索程序对网络中公开的信息进行持续收集,利用索引软 件对收集到的信息进行自动标引,构建成基于Web的数据库,并向用户提供关键词检索。(3)主题指南方式是一种综合利用分类与主题相结合的信息资源组织方 式,以主题词为类目划分的标识,利用超文本链接技术将网络中的信息组织成检索体系,逐层导引用户找到自己需要的网络信息资源。考核知识点:开放获取的特点 附: 2.2.10 (考

41、核知识点解释):开放获取 ( Open Access ) , 即把同行评议过的科学论文或学术文献放到互联 网上,使用户可以免费获得,而不需考虑版权或注册的限制。开放获取运动旨在 打破学术研究的人为壁垒。与一般网络信息资源相比,具有以下特点:( 1) 0A 资源是经过学术评价或权威机构发布的免费学术资源,信息价值较 高;一 般网络资源加工状态各异,发布者复杂,信息质量不一而足。( 2) 0A 资源来源有限,查全率不能保证;一般网络资源覆盖较全面,但查准率较低( 3) 0A 资源类型以文本、图像为主,适合专业研究使用;网络资源类型多样,生活检索与学术检索兼顾4) 0A 资源可提供全文;网络资源全文

42、提供程度有限考核知识点:网络信息资源检索的类型附:2.2.11(考核知识点解释):根据检索内容的不同,网络信息资源检索可以划分为文献检索、数据检索和事实检索,文献检索是以文献为检索对象的信息检索,即利用一定的检索方法与技术在互联网或数据库系统中查找和获取所需文献的过程。数据检索即数值检索,是以数据为检索对象的信息资源检索。事实检索乂称事项检索,是对某一客观事实的检索。事实检索的结果是事实(Face)、 数值(Numeric Data )和文献的综合。考核知识点:信息资源的载体形态附:2.2. 12(考核知识点解释):信息资源的外部特征是指信息资源载体上表征的特征,包括书名、网站名、著者、译到某

43、种信息资源,将多个外部特征组合使用,川关检索到具体某一个信息资源。 题名途径常见的信息资源外部特征包括:题名、著者卜 '按信息资源外部特征检索J责任者途径分类途径主题途径号码途径网络信息资源F检索途径按信息资源内容特征检索者、专利权人、出版机构、表发日期等。通过某一外部特征,可以检索 _分类主题途径考核知识点:数据库的类型附:2.2. 13(考核知识点解释):按照数据库发展的阶段不同,数据库的类型大致可以划分为层次和网状数据库管理系统、关系数据库管理系统以及面向对象的数据库系统等不同数据库结构体系。层次数据库是是指将数据组织成有序的树结构,并用“一对多”的关系联结不同层次的数据库。网状

44、数据库是指处理以记录类型为结点的网状数据模型 的数据库,其处理方法是将网状结构分解成若干二级树结构,称为系。系类型是二个或二个以上的记录类型之间联系的一种描述。关系数据库,是建立在关系模 型基础上的数据库,借助于集合代数等数学概念和方法来处理数据库中的数据。 现实世界中的齐种实体以及实体之间的齐种联系均用关系模型来表示。而向对彖 的数据模型,即对象模型,是把数据库技术与面向对象的方法结合起来形成的数据库称之为面向对象的数据模型。考核知识点:互联网信息中网络检索工具的分类附: 2. 2. 14 (考核知识点解释) :网络检索工具分为网络资源目录、搜索引擎和学科信息门户三类。网络资源 目录通过人工

45、或机器方式采集网络信息,按照一定的主题和分类体系,将网络信 息组织成一个等级结构目录。学科信息门户是提供可检索和可浏览的因特网资源 目录的联机服务系统,一般集中于某一相关的学术领域,提供对经图书馆工作人 员遴选和按学科组织的因特网资源的利用。搜索引擎是在检索框内输入检索词或 检索表达式,根据该表达式检索网络信息资源的检索工具。考核知识点:互联网信息中网络检索工具的分类附: 2.2. 15 (考核知识点解释):网络信息资源的检索,可以根据不同的需求和具备的检索条件,选择不同的 检索方法。经常使用的网络信息资源检索方法根据检索手段的不同可以分为常用检索法、循环法和同溯法。常用检索法又可以分为直接检

46、索法、间接检索法、顺 查法、倒查法和抽查法。循环法乂 可以分为复合交叉法和间隔交替法。 考核知识点:网络信息资源的类型划分附:2. 2.16(考核知识点解释):按照网络信息资源组织的方式,可以将网络信息资源分为文本信息资源、超 文本/多媒 体/超媒体信息资源、按数据库方式组织和按网站方式组织的信息资源。 考核知识点:信息资源的检索途径附:2.2. 17(考核知识点解释):网络信息资源的检索可以根据信息资源本身的内外部特征,从多种不同途径检索到同一个信息资源或某一类信息资源。目前一般依据信息资源的外部特征和内容特征将这些途径分成两大类。信息资源的内容特征是指从信息资源所承载的具体内容中提炼出的某

47、些内容和信息特征。通过信息资源的内部特征,可以查找到特定主题的信息,从而获得与该主题相关的文献及其线索。对信息资源内部特征我们一般按照分类、主题 或者分类与主题相结合的方式对不 同信息内容特征进行提取与归纳。 考核知识点:搜索引擎的分类附:2.2. 18(考核知识点解释):独立搜索引擎是能够对Internet网络信息资源进行收集、整理与组织,并 提供检索服 务的信息服务系统。独立搜索引擎针对网页信息进行全文搜索,搜索的领域更广更深,但由于每个搜索引擎的数据资源不同、更新速度不同,标引过程中没有人工干预,因此,使用独立搜索引擎需要进行多次检索,检出的信息存在大量重复,检索效率较差。元搜索引擎与独

48、立搜索引擎相对,是建立在多个搜索引擎基础上的搜索引擎,它通过统一的查询界面接收查询请求,调用若干独立搜索引擎进行搜索,对 不同搜索引擎的检索结 果进行统一处理后,用统一的格式反馈给用户结果。集成搜索引擎也称为“多引擎同步检索系统”,是在一个 Web页面上链接多 个独立搜 索引擎,用户在检索时需要指定搜索引擎,其检索结果由各搜索引擎分别以不同页面的形式显示或者集中到一个页面分块显示。考核知识点:布尔逻辑检索附:2.2. 19 (考核知识点解释):在逻辑运算中,如果有多个以“非”、“与”、“或”相组配的检索词表达一个完整的概念时,有时需要确定其检索顺序,让检索系统进行多步检索,实现更加准确的检索需

49、求与检索内容的匹配。此时,我们会选用括号来标示检索的顺序,并将其称为算法的优先级。如果检索式中有括号,则括号内的检索式被优先执行,然后再执行括号外的检索式。如果一个检索式中有两个或多个括号,那么先执行里面的括号,再依次执行外面的括号。考核知识点:网络信息资源的载体形态附:2. 2. 20(考核知识点解释):网络信息资源分类的角度/依据网络信息资源的类型,性质语法指I点语义指I京语用指肩、,哲学认识主体客观缶1点主观指1U、H信息的运动状态连续指1羡、昌故信II乩半连续信i息H加工程度零次指I1、次彳口 I)、一次缶肩【、次彳口息H所涉及的领域农业指1短、工业t短、军事彳口肩1、经济彳口息、文化

50、怎息、科技信息、政治信息等按碣装发布的方式非正式信;息资源、半正式信息资源、正式信息、资 源按记录符号文子彳口息、声音仿1为图像信息、数据信息等按组织方式数据库信;息、互联网信息等H出版形式电子图卡专利指空;、电子期刊、电子报纸、学位论文、会 议论文、标准、政府信息、电子档案、产品资 料等。段公开的方式全文信息、文摘彳口点目录信息等H网络传输协议wwW百息、资源、FTP信息资源、Telnet彳凡息资源等考核知识点:网络信息资源的载体形态附:2.2.21(考核知识点解释):目录型检索工具是将网络信息按一定的主题分类体系组织成一个层次结构,并通过浏览层次型分类目录来查找所需信息的检索工具称为目录型

51、检索工具。目录型检索工具以浏览、引导功能为主。目录型检索工具提供的检索功能,是直接检索目录所指向的信息资源的具体内容而非网页信息。代表性的检索工具有Yahoo!.搜狐、新浪、网易及一些网络导航系统、学科信息门户。(三)、论述题考核知识点:网络信息资源的特点与传统信息资源的特点附:2. 3.1(考核知识点解释):答:特性网络信息资源传统仿息资源载体以光磁等为介质以纸、胶片等固态为介质传播途径以互联网传播为主通过流通领域传播,不可共享承载内容的形式文字、图像、首频、视频、动 回等文字、图片出版方式预出版、正式出版正式出版检索途径互联网互联网、卡片目录时效性时效性强时滞长更新速度非常快更新速度较慢共

52、享性共享性极高,可多人同时共用不可共享,同一时间只能供 一人使用指息来源来源广泛,来自于各种正式和非正式发布渠道来源相对较少,主要来自于正式出版机构互动性互动性强,使用方便无法互动考核知识点:网络信息资源检索步骤的应用附:2. 3.2(考核知识点解释):(1)进行课题或论文内容的需求分析:在进行论文写作时,首先要明确所写论文的主题、内容,从而确定检索的资源范围、时间范围和信息资源的类型。如在如进行论文的开题, 就应该检索到最新的研究成果,以确保未来的研究没有进行重复劳动;如果要考察市场的现状,制定的策略就应该确保检索的结果全面,以便制定更好的市场策略。(2)根据已经明确的检索需求,确定合理的检

53、索系统,并且从质量、数据范 圉、数据 权威性、更新频率和数据类型上考量所选数据库系统是否合理,以确保后续的检索结果有较好的质量。如要发表一篇学术论文,那么就要检索包括最新研究成果的学术论文数据库,并通过互联网途径查找在线出版的论文作为补充;如果要为写学位论文做准备,那么就检索学位论文数据库,了解哪些研究前人已 系统做过,不必再做,从而选择更加合理的研究内容作 为研究方向。(3)根据要查找的内容性质,确定合理检索途径与检索方法。如检索的目的是为了开题,那么则应该通过主题途径,检索与研究课题相关的内容;如果是在论文撰写的过程中需要寻找某些具体的资料或论据作为研究支撑,则可以通过篇名、关键词或者作者

54、等途径检索到具体的内容。(4)根据检索的具体内容,确定全面、准确的检索词。首先要保证检索词可以准确的表达检索的内容,同时保证所有检索内容中的同义词能够全而被采 用,以避免漏检。如检索有关平板电脑的内容,也应该使用 ipad. pad 这样的检 索词。对于英文检索词,应该考虑用截词符替代一些具体的内容,从而实现快速、 完整的检索。如检索 color 这类拼写方式多样的词,应该写成 col?r 的形式。( 5) 当我们要检所的内容用一个词无法表达的时候,将多个检索词和逻辑 运算符结合,构造能够完整表达检索内容含义的检索式,从而达到检索出与检索目标匹配度较高的检索结果。要检索2011年秋季最流行的服

55、装款式,则可以构造检索式“2011 AND秋季AND流行AN,艮装AND©:式”,这样就可以在数据库中检索到与检索需求最为密切的信息资源。( 6) 将构造好的检索策略放入选择的检索系统中进行检索实施检索,如果 检索结果满意, 则完成检索过程。 如果检索结果不理想, 则调整检索策略, 通过 扩大或缩小检索范围,调整检索词等手段改变检索策略,直到获得满意的检索结果为止。考核知识点:网络信息资源检索的效果评价附: 2. 3.3 (考核知识点解释):网络信息资源检索的效果是一个综合性的指标,应该从多个角度共同进行考 量,寻找一个最佳的平衡点,以达到信息资源检索的最优效果,其评价指标包才 4( 1) 查准率,即精度,是衡量某一检索系统的信号噪声比的一种指标,即检 出的相关文献与检出的全部文献的百分比。普遍表示为:查准率二(检索出的相 关信息量 / 检索出

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论