版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、文献信息组织和文献检索 1文献检索的根本原理1.文献替代1定义:对原始文献的外表特征和内容特征进 行描述的过程。2著录:将原始文献制成它的替代文献 二次 文献,著录必须客观准确地反映原文的特征, 工程简洁,醒目易辨。 1983年,我国公布?检索期刊条目著录格式?GB379383文献的特征:外表特征:可以在文献的封面或扉页,即不翻开书本,或不看文献的具体内容就可以确定一篇文献。如题目、作者、出处、作者工作单位、专利号、报告号。 内容特征:深入文献内容中间获得的特征,如分类号、主题词、摘要等。 模糊对应外表特征内容特征精确对应文 献?环境科学文摘?著录格式:?中国药学文摘?著录格式:中国专利文献著
2、录格式:2.文献整序1定义:对替代文献进行标引,给出文献标识,将所有替代文献按其标识进行有规律的组织排列并编制出各种类型的索引的过程。2分类:形式整序 内容整序3.文献特征标识与检索提问标识的匹配 标引员对文献的表达检索者对文献需要的表达文献检索匹配实现检索语言2 文献检索语言1.定义:是根据信息检索的需要编制的,供标引文献和检索文献用的一种人工语言,是标引者和检索者共同约定使用的语言。2.特点: 1表达的概念具有单义行和唯一性 2可使内容相同和相关的文献集中,使大量分散的文献存储系统化、组织化,便于进行有规律的检索。文献检索语言3.分类表3 文献信息组织法1.体系分类法2.主题法3.分类法与
3、主题法的比较1.体系分类法1构成原理:把具有某种或某些共同属性的事物集合,划分为一类,用概括该类事物所共有的本质属性的概念作为类目,并给出相应的标记符号作为类号,在一类事物中,每一事物除了具有与同类其他事物共同的属性外,还有许多与同类事物不同的属性。用这些不同属性的一种作为标准划分该类事物,会得到假设干个下位类,再分别给出每个下位类的类号,各下位类又可按事物的另外一种属性为标准进行细分,以此类推。 分类法语言使用分类号来标识类目,分类号可反映类目在分类体系中的位置和排列次序。2种类: ?中图法? ?杜威十进分类法?国际十进分类法? ?中图法?体系结构根本大类 简表详表复分表?杜威十进分类法?
4、(Dewey Decimal Classification and Relative lndex)简称DC或DDC或杜威法,又名?十进制图书分类法?,是美国图书馆学家麦威尔杜威(Melvil Dewey)所创制的,初版于1876年,1971年已出第18版。这是一部在国际上出现最早、流行最广、影响最大的图书分类法。采用十进制的等级分类体系,即把所有学科分成9大类,分别标以100900的数字。9大类表示9个专门的主题范畴,各类中的类目均按照从一般到特殊,从总论到具体的组织原那么,对不能归人任何一类的综合性资料入第10类,即总论类,以下依次逐级分类,形成一个层层展开的等级体系。从18版起,该分类法采
5、用了一些分面综合手段,增强组配性能。 ?杜威十进分类法?体系结构000 Generalities100 Philosophy and related disciplines200 Religion300 Social sciences400 Language500 Pure sciences600 Technology(Applied sciences)700The arts800 Literature(belles-lettres)900 General geography and history ?国际十进分类法?(Universal Decimal Classification)简称UD
6、C。由比利时学者鲍威尔奥特勒(Paul Otlet)和亨利拉芳(Henri La)在DDC的根底上补充而成,初版于1905年,现已出第3版。它是一种半组配式的体系分类法,现已有3种文本,从20世纪60年代末期起被称为世界图书信息的国际交流语言。该分类法由主表、辅助表及辅助符号3大局部组成。主表把知识分为10大门类、大类划分沿用了?杜威法?的根本大类结构。全表有近20万个类目,是世界上现有各种分类法中类目设置最多的一部,科技局部设类尤为详尽。 ?国际十进分类法?体系结构0 总类1 哲学2 宗教、科学3 社会科学、经济、法律、行政4 (语言学)(该类1963年已并入第8类,现为空类)5 数学、自然
7、科学6 应用数学、医学、工业、农业7 艺术8 语言学、文学9 地理、传记、历史1.体系分类法3特点:优点:表达了学科的系统性,便于从学科和专业的角度出发进行族性检索缺点:缺乏进行多概念灵活组配的能力;无法反映新学科和新技术的内容;不能全面检索有关跨学科专业的某一事物的所有文献。2.主题法:1定义:以自然语言中的词语或标准化的词语作为揭示文献主题的标识,并以此标识编排组织和查找文献的排检方法。主题词:表达主题概念的词语,优选出的词语必须词义明确,防止其多义性,并受特定的词表控制。2分类:a标题词法、b单元词法、c关键词法 d叙词法 a标题词法:a1定义:以标题词(标准的事物名称、名词术语)作为文
8、献主题内容的标识和检索标识的先组式主题法。 标准化处理:同义词计算机和电脑、近义词实验与试验、词形汉字的简体、繁体、异体、词组的组合方式正叙、倒叙、并列、用注释方式对标题词的内涵进行限制的标准a2标题词表:?工程标题词表?(SHE) ?工程标题词表?(SHE) INFORMATION SCIENCE 903 (Before 01/86,use code 901) Abstracting (Beginning01/81) Indexing (Apply code 723 if computerized) (723) Information Dissemination See INFORMATIO
9、N DISSEMINATION Information Retrieval (For systems, see INFORMATION RETRIEVAL SYSTEMS) Information Use Language Translation and Linguistics (723) (Apply code 723 if computerized. See also TRANSLATING MACHINES) 说明:主标题词;注释项,说明词的使用范围、用法及含义;副标题词;见项,指向标准化的标题词;参见项,指向相关的标题词;分类号(用于计算机检索)。 a标题词法a3特点:优点:使检索具有
10、直接性与直观性;适合于从事物出发按专题进行特性检索缺点:缺乏按学科进行族性检索的能力;缺乏表述专指度较高的复杂概念的能力;缺乏多途径检索和自由扩检的能力。b单元词法b1定义:以单元词作为文献主题内容的标识和检索标识的后组式主题法。b2单元词表:专利工具中的?WPI标准化主题词表?单元词从文献内容中抽出,再经标准,能表达一个独立的概念。是最根本的、不能再分的词汇,比方“计算机软件不是单元词,而“计算机和“软件才是单元词。 b单元词法b3特点:优点:强调词汇的单元化和后期组配,因此提高了主题法的灵活性;缺点:由于它过分强调词汇单元化,词汇处理方法又不甚合理,易发生错误组配,误检率较高,故实用性不是
11、很好。C关键词法C1定义:以关键词作为文献主题内容的标识和检索标识的主题法。 关键词:直接从文献题名、文摘或全文中抽取出来的有实际检索意义的信息单元(关键词)。关键词是非标准的,无需查阅标准词表,或者只编制一个“禁用词表,它收录为数不多的禁用词,如助词、连词、介词、冠词以及一些通用概念的词。 C关键词法C2特点:优点:关键词法不受词表控制,快捷简便,适于用计算机组织和检索文献信息;缺点:由于关键词法的词语不标准,影响了文献信息的查全率和查准率。d叙词法d1定义:以叙词做主题词的后组式主题法 d2叙词表:?汉语主题词表? 叙词:是一种以概念为根底的,经过优选的标准化名词术语,具有单义性,组配性能
12、好的特性。 组配的形式1概念相交:即内涵不同、外延局部重合的两个相同性质概念之间的组配。组配的结果产生一个新概念,这个概念分别属于这两个概念的下位概念。2概念限定:即两个不同性质概念之间的组配,其中一个概念反映了另一概念的某一方面、某一特征或时空中的某一局部。限定的结果也产生一个新概念,它表示该事物的某一方面或某一特征。3概念概括:即两个或两个以上的同级概念相加或并列,组配结果形成一个新概念,作为原来概念的属概念。4概念联结:这种组配表示几个概念之间的联系,并不形成新的概念。 例如:档案学+图书馆学一档案学与图书馆学的关系。组配的条件1当组配表达会产生意义失真时,不用组配表达。例如,用“蘑菇和
13、“战术两个词来组配表达“蘑菇战术这个概念,“蘑菇一词在检索时独立使用会产生误检,所以应直接采用专指性词组,即在叙词表中设置“蘑菇战术这一叙词。2某些专业词汇和专有名词不必用组配,可直接采用专指性词组。如“收录两用机。3当组配表达不可能得到组配长处时,就采用专指性词组。例如,“文化水平 一词就不必分拆成文化+水平。因为“水平一词并没有检索意义,不会成为一条检索途径。 组配的作用 1 控制词量。组配可以起到控制词表体积的作用。只要选择了根本的词汇,通过组配,就可以用少量的词表达和描述尽可能多的概念。组配实际上遵循了数字排列组合的原理和方法。2扩大检索途径。在组配中,每一个词及其组合都可以作为检索人
14、口参加排序,所以可以扩大检索途径。如查找教育心理学方面的文献,可有三个人口,教育学、心理学及教育+心理学,即提供了三条检索途径。3可以自由扩大、缩小或改变检索范围。在标引时,可用许多个词来标识一篇文献,因而可以到达很高的专指度和标引深度。在检索时,可根据检索中出现的具体情况,随时增减叙词,以扩大、缩小或改变检索范围,直到满足检索要求为止。?汉语主题词表? 词目一: 正式叙词与非正式叙词款目结构 shou fa kai guan guan 收发开关管 56CD 范畴号 Transmit receive tubes D 放电器 收发管 F 放电管 宽频带开关管 窄频带开关管 S 充气管 Z 电子管
15、*族首词符号 C 反收发开关管 词目二: shou fa guan 收发管 56CD Transmitreceive tubes Y 收发开关管 ?汉语主题词表?的结构:主表:全部叙词+局部非叙词注释范畴号参照系统附表:从主表中别离出来的专用叙词表,包括世界各国政区名称、自然地理区划名称、组织机构、人物名称 ?汉语主题词表?词目三:Gao Wen fa 高温阀温度4500C含义注释词目四:Fen xihua xue 分析化学*使用范围注释 Analysis(chemical) F 半微量分析参照系统: ?汉语主题词表?辅助表: 词族索引:等级索引,利用概念成族原理 范畴索引:分类索引,采用三级
16、分类制体系,数字与字母混合的号码标记制度,把主表中全部叙词按学科分类排列 英汉对照索引:按英文名称字母顺序排列,提供从英文名查找叙词的检索途径。 词族索引款目结构: chu deng shu xue 初等数学 * 初等代数 初等几何 立体几何 平面几何 三角 球面三角 算术范畴索引款目结构:45 生物科学 45R 人类学 45RA 古人类学 阿特拉猿人 Y 毛里坦直立人 北京猿人 Y 北京直立人 北京直立人英汉对照索引款目结构: Air drag 空气阻力 Y 大气阻力 Air drilling 空气钻进 Air drills 风钻 d叙词法d3 特点:网罗性高:能形成概念网罗性高的检索标识,概括主题所涉及的各个方面,提高查全率;专指度高:能形成专指度高的检索标识,表达主题所包含的复杂概念,提高查准率;能形成假设干检索标识,可进行多途径检索;完善的参照系统,可帮助选准叙词,并可进行扩检和缩检。主题语言按字顺排列,其参照系统反映的是直接上下级关系,所以无法从整体上揭示某一词族的关系,因而它所反映的族性关系不如在体系分类法中表现的充分。 3.分类法与主题法的比较:1相同点: 都是文献信息单位广
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医院后勤服务合同规范
- 体育场馆混凝土路面施工合同
- 机械设备租赁服务合同签订要点
- 企事业单位车辆租赁协议
- 信托公司合同
- 展览馆门卫安全协议
- 知识产权风险管理指南
- 传媒科技公司税务申报指南
- 礼拜堂租赁合同
- 招投标中心项目招标问题总结
- 牧原人才测评试题及答案
- (高清版)DZT 0216-2020 煤层气储量估算规范
- 区域销售目标管理
- 上肢筋伤-骨伤科
- 医院感染风险评估表(适用于病房、换药室、治疗室、注射室)
- HTML5+CSS3网页设计智慧树知到期末考试答案2024年
- 企业风险管理中的企业伦理与道德风险管理
- 私立医院药房述职报告
- 高血压与生活方式的干预
- JJG 633-2024气体容积式流量计
- 美国总统大选与民主课件
评论
0/150
提交评论