信息组织复习资料(共8页)_第1页
信息组织复习资料(共8页)_第2页
信息组织复习资料(共8页)_第3页
信息组织复习资料(共8页)_第4页
信息组织复习资料(共8页)_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、信息组织(zzh)考试题目名词解释:信息组织(zzh),检全率,分类标引,轮排解答题:信息组织(zzh)与信息检索的关系,主题法的特征,信息资源分类的特征论述题:主题标引与分类标引的异同 分类法的类型年复习资料名词解释1.信息组织亦称为信息资源组织,它是根据信息资源检索的需要,以文本及各类型的信息资源为对象,通过对其内容特征等的分析、选择、处理、序化,并以适当的方式加以提供的活动。2.检索语言 是一种由表达信息资源主题概念及其相互关系的词汇及规则组成的人工语言系统,国内亦称为情报检索语言。3.词汇控制 指根据文献标引和检索的需要,对自然语言中的词汇进行选择、规范并揭示其相关性的过程.4. 句法

2、控制是指根据信息资源标引和检索的需要,通过一定的组词造句的规则,对检索语词的组合方式作出规定。5. 轮排转换(转动轮排)。即依次将检索语句中每一个有检索意义的语词轮流在排检位置上排列,并对句子中其他语词在保持原有相对位置不变的情况下随着移动6。搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。7. 信息资源分类,是指根据信息资源内容属性和其他特征,将各种类型的资源分门别类地、系统地组织和揭示的方法。8. 分类(法)表,亦称信息资源分类表,是根据类目之间关系组织起来

3、的,并配有一定标记符号的类分信息资源的工具。9基本部类 是为分类法合理展开对知识范畴所作的最概括、最本质的划分10类目索引是一种按主题字顺方式,从主题名称指向分类号或相应类目,帮助分类人员利用类目表的工具。11. 同位类 从同一个上位类区分出来的一组处于同等地位的子类, 12. 交替类目,是指在为一个知识门类设置使用类目的同时,在相应门类下设置的具有同一关系的类目。13.分类标引,又称为归类,是指依据一定的分类语言,对信息资源的内容特征进行分析、判断、选择(xunz),赋予分类标识的过程。14. 种次号,是指根据同类书分编的先后,按每一种书为计数单位(dnwi)顺序编制的号码。15.主题(zh

4、t)法,一般是指直接以表达主题内容的语词作检索标识、以字顺为主要检索途径的标引和检索信息资源的方法。16. 轮排索引,亦称轮排表,是将词表中的叙词按词素的字顺排列,使含有同一词素的叙词集中显示于一处的词汇表,是一种从词素的角度查找叙词的辅助工具。17.关键词法 直接以自然语言中未经控制或只作少量控制的语词为文献主题标识,通过对关键词的轮排的方式揭示文献主题的主题法。18.后控词表是一种在检索阶段进行控制的词表,它不像传统的控制词表那样在标引阶段对标识实施控制,而是在检索阶段通过同对控制和相关词推荐等方式提供检索帮助。19.自动主题标引就是由计算机自动赋予语词标识来表达信息资源主题内容的过程.2

5、0.复分表 亦称副表 辅助表 共性区分表 为了增强分类体系的细分程度,缩小类表的篇幅,分类法一般将这些共性子目抽出,单独编列成表、供有关类目进一步区分时共同使用,这种由共性子母构成,供主表有关类目共同使用的表。 21.叙词法 叙词法是以从自然语言中精选出来的、经过严格处理的语词作为文献主题标识,通过概念组配方式表达文献主题的主题法类型22.叙词表 国内又称为主题词表,按照其功能,叙词表是一种将标引人员或用户使用的自然语言转换成规范化的系统语言的术语控制工具;按照其结构,叙词表是一种概括特定知识领域并由词义相关、语义相关的术语组成的可以不断补充的规范化词典。23.组配次序:亦称引用次序。指复合主

6、题标引和检索时,各个主题因素的组合次序。阮冈纳赞提出的按检索具体性优先的基本范畴引用次序、依据各学科领域的主题特征将文献主题因素按其性质概括为本体、物质、动力、空间、时间五大范畴。24.文献组织的两种基本形式:固定排列法;按一定意义的次序排列(使用做多的是按分类方式排列)25.信息组织活动包括两个基本方面:(1)信息组织的操作(2)信息资源组织规范26.检全率=检出的相关信息资源量系统相关信息总量100检准率=检出的相关信息资源数检出的信息资源总数100两者为互逆关系27.检索的成本效益:指检索系统的成本和效益之比。成本一般指检索系统设备费用,标引处理费用,检索运行费用。28.分类(fn li

7、)就总体而言包括聚类和归类两个方面。信息资源分类法按照其编制方式,通常可以区分为等级列举(lij)式,分面组配式和列举组配式三种。29.列举组配式分类法的定义:是等级列举式分类法和分面组配式分类法两种编制方式的结合,是一种在详尽(xingjn)类表的基础上,广泛采用各种组配方式的分类法。30.分面组配式分类法的定义:是一种为克服等级列举式分类法的不足,适应现代信息资源标引和检索的需要发展起来的分类法类型,是一种依据分析兼综合的原则编制的分类法类型.31.分类索书号定义:又称分类排架号,是表示文献在分类收藏中位置的号码。一种文献号能有一个分类索书号。32.书次号:又称同类书区分号,是表示同类书先

8、后次序的号码。33.主题法类型:标题法、元词法、叙词法、关键词法。34.字顺表:国内又称主题词表;是一种由众多叙词款目和非叙词款目按字顺排列的一览表。一般是词表的主体,故习惯成为主表。35.范畴索引:亦称为分类索引,范畴表式一种按照词汇所属学科和专业范畴编制的概略分类系统,是从分类角度寻找叙词的辅助工具。36.文体检索,亦称自然语言检索,指不对文献进行任何标引,直接通过计算机,以自然语言中的语词匹配查找的系统。37.自由标引:通常指由标引人员直接选择自然语言中的语词进行标引。38.自动标引概念及分类:也称计算机索引,是一种依据一定的算法,由计算机赋予文献检索标识的过程。类型:自动抽词标引,自动

9、赋词标引,自动分类。解答题:1.信息组织与信息检索的关系 信息组织和信息检索是密切联系的。 (1) 信息组织是信息检索的基础和前提,只有进行信息资源处理和有序化组织,才可以利用它有效地进行检索查找。 (2)信息检索是信息组织的出发点和归宿,是信息组织的主要目标之一。(3)信息组织和检索中使用的、用以描述检索特征的控制语言及规则,则是根据文献或信息资源组织和揭示的需要制订的组织规范。包括信息资源描述规范,情报检索语言等。 (4)信息标识选择和组织的规范是保证信息组织过程中处理的质量有一致性的重要依据,是信息组织和检索的重要工具。两者既有区别,又是相互依存、互为因果的。2.传统文献单位对文献处理的

10、基本目标主要包括:(1)识别、确认需要处理的所有的物理媒介的文献资源; (2)确认文献中或其部分中的著作; (3) 按照标准引文规则生成这些文献和著作的系统; (4)提供有价值的检索点,至少包括题名,责任者和主题等(5) 在文献单位或其他检索集合中提供某种评论资源的方式。3.信息资源的处理的基本做法是: (1)对信息资源的特征进行描述:包括:著录或编写题录,通过对信息资源外部特征进行记录,用于识别或确认该资源。 (2)对信息资源的内容进行浓缩:包括编写内容提要或文摘,使用户能迅速了解其内容和特点,供检索查找时选择、判断。(3)提供检索点:主要是确定检索特征及可检信息,以便据此对信息资源进行有序

11、化组织。4. 对信息组织(zzh)的要求 “全、准、快、便、省。” 也是评价系统检索效率的几个重要指标. 1 检全率 亦称查全率、命中率,指系统实施检索时检出的与某一检索提问相关的文献数与检索系统中与该提问相关的实有文献总数(zngsh)之比. 2检准率 亦称查准率、相关率,指系统实施检索时检出的与某一检索提问相关的文献数与检出的文献总数之比. 3、检索速度和系统的及时性。 涉及组织时间和检索时间两个指标。4、系统的易用性 包括标引者和检索者两个方面。5、检索的成本效益5.信息资源组织的特点(信息组织应考虑的因素): 1文献保证原则指依据文献的特征、数量进行相应的控制2用户保证原则,即根据用户

12、需要进行描述控制和词汇控制。3、与设备条件相适应信息组织中的规范控制是通过一定的设备条件发生作用的,只有与设备条件的特点保持一致,才能取得较好的实际效果。4应尽量取得费用和效果的平衡 检索系统的各种性能以及性能与费用效益之间的关系是相对的。关键是在各种关系的基础上确定适合(shh)的度。5重视规范控制技术方法的完善和使用6. 信息资源分类一般具有的特征: (一)、按照信息资源内容特征的相互关系加以组织 (二)、一般是从一定的角度出发组织信息资源( 三)、以一定标记符号作为排序工具 (四)、一般通过类目索引提供从字顺角度查找类目的途径 7信息资源分类具有的作用:1.进行资源组织.。最常见的是用于

13、文献资源的分类排架。2.建立分类检索工具。即将分类法用于信息资源的揭示。3.分类统计。这是有效进行资源管理和利用的基本手段。4.兼容工具8. 复分表的作用: 缩小类表的篇幅 通过使用复分表,可以使类表在较小篇幅的情况下,达到较大的细分程度。 加强类表的伸缩性 可以根据实际使用的需要,通过在分类体系展开中增加或减少复分表的使用,调整细分程度,加强类表的灵活性。 增强类表的规律性 采用统一方式编列共性子目、配置号码,有助于使类目体系的列举更加一致,增加类目的助记性。 9. 分类号的要求 分类号通常由数字、字母及相应的辅助符号组成。在实际使用中,分类号一般应当符合以下4个要求:(1) 简明性 要求号

14、码简短明了、顺序性强、易读、易写、易记、易于排检、易于输入电子计算机,适合实际使用的需要。()表达性 指号码不仅能表达类目的排列次序,而且能揭示类目的结构特点。 (3) 容纳性又称扩充性,指标记系统能根据发展的需要,随时为类目体系的各种增补变动配以恰当的号码。(4) 助记性 即帮助记忆的能力。目的是通过号码配置中的规律性,改进标记的易用性,改善检索效果。10. 标记技术为了使标记系统在具有表达性的同时保持容纳性和简明性,分类标记一般还采用以下各种标记技术:(1)八分法,亦称扩九法(2)集团标记法(双位制)(3)借号法在层累标记制中使用的一种灵活借用上位类或下位(xi wi)类的号码配置方法。(

15、4)预留空号法 指根据学科发展和类目设置的可能,在号码配置时,预先留下一些空号,供类目增补时使用。(5) 对应编号法即按照类目设置的规律统一配置对应号码,使标记:具有规律性,一致性,方便用户使用。(6) 字母标记法即在数字标记中,直接以类名的首字母为标记,标示下一级类目。11. 一般认为类名的选择应具有以下4要求: (1) 科学即类名应使用能准确反映其含义,语词严谨、明晰、完整,一般不再同时收入其同义词、近义词、俗称等。 (2) 简明即所使用的词汇应简短、明了,尽量使用精炼的术语,避免冗长、拖沓。 (3) 确切即语词应能准确反映类目的内容含义,贴切揭示类目概念的内涵和外延,使用类名无法(wf)

16、确切揭示类目范围时,应通过类目注释加以补充说明。 (4) 通用 即使用的语词应符合用户使用的习惯,有较好的通用性。12为了保证标引工作的质量(zhling),分类标引工作必须遵一定的操作程序。包括:查重主题分析归类给号复核1、查重 主要查核该标引对象是否为已经处理过的信息资源。2、主题分析 对文献的内容特征进行分析,确定需要揭示的主题概念。3、主题概念转换归类即将主题分析的结果归入分类体系中相应的门类。4、确定标识给号主题分析的结果在按照信息资源的内容特征归类以后,通常应根据确定的类目给予相应的分类号。5审核 在结束文献标引前,必须对每种文献的标引结果进行审核。13. 主题法一般都具有下述特征

17、: (1)、直接以语词作为检索标识(2)、以字顺作为主要检索途径。(3)、以特定的事物、问题、现象,即主题为中心集中信息资源。(4)往往是通过的参照系统等方式揭示主题词之间关系。14.关键词语言的特点在标引阶段只进行少量控制或不控制。通常使用禁用词表(stoplist),来淘汰题名中的非关键词,亦即不具有检索意义的词。一般不建立关键词表,即使建立关键词表,也比标题表、叙词表简单得多,通常不设置任何参照或词间关系,因而篇幅较小,处理方便。15、关键词语言的主要类型 (1)、普通(单纯)关键词索引 把文献的正文、摘要和题目中抽出的关键词按字顺轮流领头进行排列且没有上下文修饰,每组关键词后著录文献号

18、码,组成一个款目。(2)、题内关键词索引(Keyword in context index,KWIC) 又称上下文关键词索引。关键词保留在文献题目内,关键词的上下文和词序都不变。在编制索引款目时,每个关键字按字顺轮流做检索标目,排在版面的固定位置,用黑体字表示为作为标目的关键词,上下文也随之移动位置。(3)、题外关键词索引(Keyword out of context index,KWOC) 也称上下文索引,针对KWIC提出的改进形式。编制原理和单纯关键词索引基本相同,不同的是把文献中抽出的关键词轮流放在题目、号码前面。16.常见(chn jin)的标引和检索的自然语言类型:(1)关键词法 直

19、接以自然语言中未经控制或只作少量控制的语词为文献主题标识,通过对关键词的轮排的方式揭示文献主题的主题法。(2)文本检索 不进行标引,直接利用计算机的功能,通过自然语言中的语词对信息资源的文本数据进行匹配检索的方式。 (3) 自由标引 通常指由标引人员直接选择自然语言中语词进行标引。自由标引不需要(xyo)依据词表,但一般应通过建立严格的标引规则以提高标引质量。 (4)自然语言入口词检索 包括受控系统中使用入口词表检索与后控检索。 (5) 自动标引也称计算机标引,是一种依据一定的算法,由计算机赋予文献检索标识的过程。通常包括自动抽词,自动赋词标引,自动分类等。17按照对信息资源内容的揭示特点,分

20、类(fn li)标引和主题标引的标引方式通常可以分成以下几种: 整体标引;全面标引; 对口标引;综合标引; 分析标引整体标引,亦称浅标引,是一种概括揭示信息资源基本主题内容的标引。(2)全面标引,亦称深标引,是一种充分揭示信息资源论及的所有有检索价值的主题概念的标引。(3)对口标引,亦称重点标引,是一种只揭示信息资源中适合本专业需要的主题内容的标引。(4)综合标引是一种以丛书、多卷书、论文集、会议录、标准汇编、档案的案卷等为单位进行的概括性标引。(5)分析标引是一种根据资源中部分片段或集合型资源的构成单元进行的标引。18.中图法中组配标引的类型:(1).使用复分表即在使用主表类目分类的同时,结

21、合使用复分表的类目进行区分通常按类表要求,将主表号码与负分表号码加以组配.(2),仿分.既利用同类性质的子目进一步组分.(3).类间组配,即按照分类法的要求,使用特定的辅助符号,将一个主类号与其它与文献内容相关的主类号组合,表达文献内容。19.自然语言检索系统地优点:(1)专指度更高,有助于提高检准率;(2)能提供更多的检索点;(3)加工速度快;(4)词汇更新及时;(5)成本低;(6)系统地有效性更强20.自然语言检索系统的不足:(1)缺乏同义词控制,影响检全率;(2)缺乏多义词控制,且使用词汇较多,影响检准率;(3)自然语言词汇关系往往具有多元性和不确定性,无法结合知识关系进行扩检、缩检,调

22、整检索方向等,不利用用户进行相关性查找。论述题一。按照分类标引规则的特点和涉及的内容对象范围,分类标引规则一般可以分为基本标引规则、一般标引规则、特殊标引规则三类。基本分类标引规则 1、 信息资源的分类根据信息资源的性质,按照其各自的特点进行标引 一般应以其内容属性为主要依据,同时兼顾其他特征,如国别、时代、形式、类型等。 2、 信息资源的分类必须能体现分类法的逻辑性、等级性、次第性即凡是能归入某一类的文献,必然带有其上位类的属性。3、 信息资源必须归入最切合其内容的类即应依据资源的内容,将其分入分类体系中内涵外延最符合其内容、最确切的类目。 4、 类分的文献必须归入用途最大的类文献分类是为使

23、用服务的,必须根据使用的需要进行。 5、不能单凭题名、篇名的意义归类。 文献名可以在一定程度上反映文献的内容,但许多文献名特别是文艺、社会科学领域文献的题名,往往只有象征意义,并不能确切反映文献的内容。6、应注意标引的思想性。对于社会科学特定对象的信息资源,在必要时,应注意对其内容性质进行揭示。二(一)主题标引与分类标引的相同(xin tn)点,主要表现在:(1) 揭示的对象相同。都是以信息资源的主题内容为揭示和转换对象,在对资源属性的分析过程中都是以主题内容为主要标准,以国别、时代、资源形式等其他属性为次要标准。(2) 依据的数据来源相同。都是以信息资源的题名,目次,提要等说明文字及正文为标

24、引依据。 (3) 操作程序相同。一般都需要首先进行主题分析,在弄清主题内容的基础上进行标识的转换和确定,并必须遵守一定的标引程序。(4)基本处理方法相同。 (二)分类标引和主题标引的不同:在分类标引采用中图法,主题标引采用汉表的情况下,两者主要存在着下列不同:(1) 主题分析的角度不同。分类侧重于从学科角度进行组织和揭示,除需要确定待标的内容对象外,还必须进一步弄清其研究的学科角度。主题标引则不必考虑资源的学科属性(shxng),可以直接按其内容对象进行标引。(2) 转换途径不同。 分类标引以分类表为工具,一般必须通过分类体系层层查找;主题标引则以字顺系统为主要途径,可以直接从语词出发进行查找。 (3) 标识不同。 标识成分上,分类标引的标识是分类号,主题标引的结果是主题词; (4) 揭示的特点不同。 分类标引以学科体系为展开的基础,子目的列举受到先组式体系的束缚,适合对资源的整体内容进行标引,对主题对象的揭示比较概括;主

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论