![信息检索复习资料副本_第1页](http://file4.renrendoc.com/view/828570dbac6234c35caa16ac5bf46e14/828570dbac6234c35caa16ac5bf46e141.gif)
![信息检索复习资料副本_第2页](http://file4.renrendoc.com/view/828570dbac6234c35caa16ac5bf46e14/828570dbac6234c35caa16ac5bf46e142.gif)
![信息检索复习资料副本_第3页](http://file4.renrendoc.com/view/828570dbac6234c35caa16ac5bf46e14/828570dbac6234c35caa16ac5bf46e143.gif)
![信息检索复习资料副本_第4页](http://file4.renrendoc.com/view/828570dbac6234c35caa16ac5bf46e14/828570dbac6234c35caa16ac5bf46e144.gif)
![信息检索复习资料副本_第5页](http://file4.renrendoc.com/view/828570dbac6234c35caa16ac5bf46e14/828570dbac6234c35caa16ac5bf46e145.gif)
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
、 了解信息、知识、情报和文献四个概念,掌握他们之间的关系P1-8掌握情报和文献的定义,情报的属性、文献的四个要素,及广义理解何为情报、文献P5-7信息:信息是自然界和人类社会一切事物存在方式和运动状态的反映,它是不依赖于是否被人类感知理解而客观存在的。知识:知识是人类在认识世界和改造世界的社会实践活动中获得的对客观事物本质属性的认识,是人们通过信息对自然、人类社会以及思维方式与运动客观规律的认识和掌握。情报:情报是指为一泄目的而收集和传递的有特定效用的知识。情报的属性:知识性、传递性、效用性文献:记录一切人类知识信息的载体。文献的四个要素:知识或信息内容、记录符号、物质载体、记录手段广义理解何为情报、文献:文献具有记录、存储和传播知识、、信息和情报的作用,是知识、信息和情报的存储载体和重要的传播工具。四者关系:信息包含知识;知识包含情报和文献:文献和情报相互交叉,相互转化。如:感觉到天气的冷暧(信息)知道是气候的变化引起了冷和热(知识)收听天气预报得知气温变化了(文献)为了研究果树的生长规律而收集的气象资料(知识)2、 文献信息资源按物质载体和记录形式的划分类型P13-14手写型文献、印刷型文献、缩微型文献、声像型文献、机读型文献文献信息资源按加工深度不同的划分类型P19-20零次文献:未经出版发行的或问进入社会焦炉的最原始文献。如:私人笔记、手稿、个人信件、工程图纸、实验记录、原始单据等一次文献:指作者根据本人的实践、研究成果和生产经验为基本素材而创作或撰写并首次公开发表的文献。如:期刊论文、科技报告、会议论文、专利说明书、学位论文、专箸等。二次文献:指将大量分散的、无组织的一次文献进行收集、提炼、浓缩、、加工、整理,并按一定的科学方法组织编排、编借出版的文献。如:目录、题录、文摘等。三次文献:指根据一左的目的和需求,对某一领域、某一学科或某一专题有关的一次文献和二次文献进行广泛检索、收集,并对苴内容进行广泛而深入的分析、对比、综合、提炼、重组、概括而成的文献。如:各种述评、综述、学科年度进展报告、百科全书、字典、年鉴、手册等。文献信息资源按出版形式的几种划分类型,各种类型文献的二次文献项目(或指具体每种类型在数据库中的字段)、内容特点、有代表性的号码等 P14-19重点:图书、期刊、学位论文、科技报告、专利按出版形式的划分:图书、期刊、报纸、科技报告、会议文献、专利文献、标准文献、学位论文、政府岀版物、产品资料、技术档案。各种类型文献的二次文献项目:类型二次文献项目内容特点有代表性的号码图书专著、教科书.丛书、l:JUS优点:内容比较全而系统•论点较成熟可靠。缺点:传递信息速度慢期刊学术性、技术性刊物:见索性刊物:其它类信息含址大.出版周期短.报道速度快.内容新颖.能及时反映最新科技水平和动态。国际标准号:ISSN国内统一刊号:CN型期刊学位论文学士论文、硕士论文.博士论文选题新颖.内容较专一.理论性和学术性较强,引用材料广泛、闸述系统.论证详细。但水平差异很大,质虽参差不齐。科技报告形式上:每份报告无论篇幅大小独立成册.有机构名称和统一的編号,出版发行不规则:内容上:表述严谨.叙述详尽.专深具体流通范用上:大部分科技报告具有一定的保密性,属于保密或控制发行,仅有一小部分可以公开或半公开发表,或者等到内容已无保密必要时可转为公开发表。专利编写格式统一.出版快.内容新颖、技术性强.实用性强而且具法律效力等有代表性的号码:ISSN…国际标准刊号ISBN—■国际标准书号ISO…国际标准化组织IEC-…国际电工委员会标准GB-…强制性国家标准GB/T-推荐性国家标准GB/Z—指导性国家标准第二章信息检索基础知识与原理1、 广义信息检索的概念P21广义信息检索是指将信息按照一泄的规则和方式组织与存储起来,井根据信息永和的特定需求査找得到所需的信息的过程。它包括信息的存储和检索两个过程,全称又叫信息存储与检索。按检索内容划分,信息检索的类型P26-27文献信息检索、数据信息检索、事实信息检索其他代码语言分子式语言、环状结构式语言等2、 分类语言(分类法)的概念及其特点P33概念及其特点:分类法是以科学分类为基础,运用概念划分和归属的方法,将各种概念按其性质进行分类和系统排列而成。中图法的体系结构、基本22个大类、标记符号、等级划分以及所学专业、常用学科专业的分类号等P34-35中图法的体系结构:《中图法》的主体是它的类目表,包括基本部类表、基本大类表、简表、祥表、复分表和编制说明等部分。基本22个大类:英基本结构是将知识门类分为马列主义毛泽东思想、哲学、社会科学、自然科学与综合性图书5个基本部类,在此基础上,为了满足图书资料分类的需要,在社会科学下又展开分为9个基本大类:在自然科学下展开分成10个基本大类。这样就构成了《中图法》22个基本大类(也称为一级类目)标记符号:数字的设置采用层累制,在分类号的每三位数字之间,用“•”隔开,使分类号清晰明了、易于辨认,另外,《中图法》还采用了一些辅助符号,例如,推荐符号用“a”、总论复分号用“一”、类目起止符号用“/”、交替类目符号用“[]”、组配符号用“:”、国家区分号“()”、时代区分号等。等级划分以及所学专业:以这22个基本大类(一级类目)为基础,对每个大类进行进一步的细分,就构成了二级类目。以此类推,层层划分,逐级展开出三级、四级……类目。常用学科专业的分类号:见P35页示意图。第三章计算机检索基础知识1、 检索系统的构成P58构成计算机信息检索系统的要素硬件部分 软件部分 信息数据库 作用于系统的人数据库的结构P591•字段2•记录3.文档字段(不同文献类型)-检索字段-检索途径(分类、主题、著者、题名、号码等)记录、文档2、 布尔逻辑算符:类型及其应用P62类型:逻借与(and、*)、逻辑或(or、+)、逻辑非(not、—)(1) 逻辑与(乘),常用符号“and”或"”表示,增加限制因素,缩小检索范围,提高检索的专指性,提髙查准率:(2) 逻辑或(和),常用符号“or”或“+”表示,增加逻辑或的组而,可扩大检索范围,提高查全率:(3) 逻辑非(差),常用符号“not”或表示;用于排除不希望出现的检索词可缩小检索范围,提高检索的准确性。执行顺序按照逻辑非一逻辑与一逻借或的次序运算,小括号里的先运算应用:逻借与:两个概念之间的相交关系或限泄关系的运算逻辑或:用于同义词、近义词、相关词等逻辑非:用于排除不希望岀现的检索词3、 截词算符P63—64、字段检索(与实习(具体数据库)结合)P65截词算符:截词检索可以节约时间和节省费用。按截词算符的位置不同可分为前截词、后截词、前后截词、中间截词。按截断字符数量可分为有限截断和无限截断。无限截断:在检索词的词干前后,加一个“?”表示在此位巻上可能出现的字符数量不受限制,可查找词干相同的所有词。有限截断:用两个“?”并在之间空一格,即“??”,表示该位宜允许出现0—1个字符,用两个“?”,即“??”则表示在此位宜允许出现0—2个字符,用三个“?”,即“???”则表示在此位巻允许出现0—3个字符。例如comput??—可在末尾插入0-1个字符:comput??一可在末尾插入0-2个字符:comput???-可插入0-3个字符。字段检索:对于在“基本索引字段(TI、AB、DE、ID)”中的查找,用后缀方式,常用符号有“/”或“in”,如“apple?门T'或者“applc*inTI”;对于在“辅助索引字段(AU、BN、SN、CC等或者PJ、JN或JA、LA、PY、SO等)”中的査找,用前缀方式,常用符号有“==”等。如“LA=French”,“PY>=1992”。4、 检索途径(与实习结合)P691、分类途径2、主体途经3、题名途径4、著者途径5、号码途径6、其他途径5、 信息检索的一般程序P70-76一般程序:分析检索要求,选择检索手段、选择检索工具,确启检索途径、选择检索词,构建检索提问式,实施检索并调整检索提问式,输岀检索结果。重点:课题主题概念的分析P71、P73(1) 找出信息需求的主题概念并明确其逻辑关系(2>找出隐性主题概念(3)找出核心概念,排除无关概念和重复概念课题概念的分析:当检索课题所需信息的范用较广时,应选用族性检索功能较强的分类途径,或进行全文检索;当检索课题所需范围较窄、较专深具体时,以选用特性检索功能较强的主题途径、题名途径为宜。检索表达式的构建:检索提问式是指将选择出的检索词,用布尔逻辑算符、截词算符、位置算符以及系统规定的其他连接符号,按检索课题的具体需要进行合理组配,形成表达具体需求的逻辑表达式。检索效果评价P76-77查全率(R)=检岀的相关信息数/数据库中相关信息总数查准率(P)=检出的相关信息数/检出信息总数查全率与査准率是一种互逆关系,当放宽检索条件,扩大检索范用以提高查全率时,往往查准率就下降:反之,增加检索条件,缩小检索范帀以提高专指性、提高查准率时,往往会导致査全率下降。提高检索效果的主要措施(提高査全率与査准率的措施)P77-78(1)提高査全率的措施:主要从扩大检索范囤,增加检索网罗度入手,常用方法有:1将同义词、近义词、缩写词、各种词形代码等尽量选全,并用逻辑“或”组配检索;2选用某些上位概念词、下位概念词或相关词,并用逻辑“或”组配进行检索;3减少逻辑“与”的运算,丢掉某些不堪重要的或者太专指的槪念组而:4进行截词检索,选择恰当的截词位置:5调整字段限制,在几个字段或文摘字段、任意字段甚至在全文本中进行检索:6调整位置算符,由严密变宽松,如(W)f(N):7采用族性检索功能较强的分类目录或分类号进行检索;8增加检索途径,讲主题、篇统、分类等途径联合使用;9增加检索系统和数据库。(2)提高査准率的措施:主要从缩小检索范囤、提髙检索专指性入手,常用方法有:1提高检索词的专指度,选用下位概念词或专指性较强的词,减少同族近义词与相关词的使用:2增加概念组面限制,即采用逻借“与”连接相关概念组而的检索词,以进一步限泄主题概念的范風3使用逻辑“非”算符,排除一些无关的概念:4对检索词的截词不可截得太短:5使用字段限制,将检索词限泄在篇需或主题词字段中进行检索:6使用位置算符指左邻接关系,并由宽松变严密,如(N)f(W):7利用信息的外部特征限制输出的检索结果,包括限制输岀的类型、语种、出版时间等。第四章网络信息检索与搜索引擎1、 网络基础知识:TCP/IP协议、IP地址、域名地址P245-247TCP/IP协议:中文译为传输控制协议/网际协议,TCP/IP协议立义了计算机如何连入因特网,以及数据在因特网上传输的标准。IP地址:由4个字节共32位的数字串组成,每个字节的数字必须小于256。是一种数字型网络和主机标识域名地址:字符型的地址(使用的字符包括字母、数字和连字符,而且必须以字母或数字开头和结尾)以主机、子域和域)的形式表示的Internet地址,与数字表示的IP地址相对的2、 搜索引擎的概念P254搜索引擎:是查找互联网上信息资源的工具,也称为网络检索工具按工作原理划分,搜索引擎的种类及其特点P255—258种类:全文搜索引擎(包括搜索器、索引器、检索器和用户接口)、目录式搜索引擎和元搜索引擎(包括检索请求提交机制、检索接口代理机制、检索结果显示机制)特点:(1)全文搜索引擎:优点:信息量大、更新及时、无需人工干预:缺点:返回信息过多,有很多无关的信息,用户必须从结果中进行筛选。(2) 目录式搜索引擎:优点:加入了人工智能,保证了信息加工的质量,所以信息准确、导航质量高:缺点:信息量相对较少,信息更新不及时。(3) 元搜索引擎:优点:把主要精力放在提高搜索速度、智能化处理搜索结果、个性搜索功能的设宜和用户检索界面的友好性上,査全率和查准率都比较快,返回结果的信息量更大更全:缺点:不能够充分使用所使用的各个搜索引擎的功能。3、搜索引擎的语法规则(逻辑算符、字段限制(intitle,site、filetype,link)、精确检索的表达方法)等(结合Google.百度,或者结合综合实习报告)P258-260搜索引擎的语法规则1、 布尔逻辑运算符:逻辑“与”:一般用空格、“AND”表示,有的还可以用“&”、“+”表示逻辑“或”:一般用“OR”表示,有的搜索引擎还可以用"I”、“,”表示逻辑“非”:一般用“NOT”表示,有的搜索引擎还可以用“[”、“一”表示2、 限制字段搜索:限泄搜索词在搜索引擎数据库中某个字段范囤进行査找,如网页标题、站点、网址、链接字段限制:(1) 标题限泄检索:在网页的标题中查找输入的检索词,使用命令一般是“title”或者“intitle”,其格式为:intitle:检索式。例如:intitle:水稻基因图谱。(2) 文件类型限泄检索:指查岀特泄文件类型的相关结果,使用命令一般为"filetype”,其格式为:检索式filetype:文件类型。例如:农业综述filetype:PDF,表明想査找关于农业综述写作方面的PDF格式的文献。(3) 站点限左检索:如果想知道某个或某类站点中自己需要的找的东西,就可以把检索范用限泄在这个网站中,提高査询效率。使用命令一般是"site”。格式为:检索式site:域名或者网站。例如:检索式:水稻基因site:。(4) 链接检索:在与特泄网页地址有链接的所有网页中进行检索。使用命令一般是“link”,其格式为:link:特定网页地址。3、 空格、逗号、引号等的作用空格:与逻辑"与”相同,表示要检索出同时包含两个概念的信息逗号:逗号的作用类似于逻辑“或”,也是查找那些至少含有一个指泄关键词的页而引号:引号的作用是,引号中的一个或多个检索词被当做一个短语来进行检索,即精确检索,也就是完全按照引号中的内容进行査找。例如检索式:"biologicalcontrol",表示把"biologicalcontrol”当作一个短语•来搜索。如果没加引号,搜索引擎就会自动扩展检索,把biological与control两词分开,这样得到的检索结果中,很多可能与用户要求的主题内容相去甚远。4、 Google.百度的特色搜索 P261-267Google特色搜索:学术搜索、图书搜索、专利搜索百度特色搜索:百度百科、专利搜索、统计数据、百度国学、法律搜索第五章专利基础知识及专利检索 P143-146专利的概念、特性、种类(与专利号、申请号的关系),授予条件及专利检索专利的概念:有三方面的含义:是指专利法保护的发明创造;是指载有发明创造详细内容的专利说明书:是指专利权。特性:时限性、地域性、专有性种类(与专利号、申请号的关系):1、发明专利2、实用新型专利3、外观设计专利与专利号、申请号的关系:CN2OO31发明专利,CN20032实用新型专利,CN20033外观设计专利,专利号相应地改为ZL(说明:中间的2003表示年份)授予条件:1、新颖性2、创造性(或先进性)3、实用性专利检索:1、百度2、中国知识产权局中国专利数据库3、万方数据库4、中国知网第七章各类型文献的网络检索 P269-279实习:重点参见各次实习作业P1、总结、掌握各种文献类型的査找方法图书:a通过图书数据库的网站进行查找(超星数字图书馆、馆藏图书目录/CALIS联合目录公共检索系统(OPAC)、任一英他图书馆的图书目录)b通过访问OPAC(Onli
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 物联网时代的网络安全技术及管理策略
- 3 桂花雨(说课稿)-2024-2025学年统编版语文五年级上册
- 2023九年级数学上册 第2章 一元二次方程2.2 一元二次方程的解法2.2.1 配方法第3课时 用配方法解二次项系数不为1的一元二次方程说课稿 (新版)湘教版
- Unit 6 Food Lesson 1(说课稿)-2024-2025学年人教精通版(2024)英语三年级上册001
- 2025房地产委托合同书范本
- 2023九年级数学上册 第二十四章 圆24.2 点和圆、直线和圆的位置关系24.2.2 直线和圆的位置关系第3课时 切线长定理说课稿(新版)新人教版001
- 2《我爱我们的祖国》说课稿-2024-2025学年统编版语文一年级上册
- Unit1 Making friends Part C Make a mind map of making friends(说课稿)-2024-2025学年人教PEP版(2024)英语三年级上册
- 2《我是什么》(说课稿)2024-2025学年二年级上册语文统编版
- 2025关于招标合同的报告
- 2025年上海用人单位劳动合同(4篇)
- 二年级上册口算题3000道-打印版让孩子口算无忧
- 新疆乌鲁木齐地区2025年高三年级第一次质量监测生物学试卷(含答案)
- 卫生服务个人基本信息表
- 高中英语北师大版必修第一册全册单词表(按单元编排)
- 新教科版科学小学四年级下册全册教案
- 苗圃建设项目施工组织设计范本
- 广东省湛江市廉江市2023-2024学年八年级上学期期末考试数学试卷(含答案)
- 学校食品安全举报投诉处理制度
- 安徽省芜湖市2023-2024学年高一上学期期末考试 生物 含解析
- 北师大版八上《生物的遗传和变异》
评论
0/150
提交评论