信息技术(第2版)课件 刘来权 【ch01】信息检索_第1页
信息技术(第2版)课件 刘来权 【ch01】信息检索_第2页
信息技术(第2版)课件 刘来权 【ch01】信息检索_第3页
信息技术(第2版)课件 刘来权 【ch01】信息检索_第4页
信息技术(第2版)课件 刘来权 【ch01】信息检索_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息技术(第2版)信息检索第一章高等职业院校精品教材系列01精确检索《海南自由贸易港建设白皮书(2021)》文档在信息化时代的今天,人们对信息表现出了前所未有的依赖,信息已经成为人们生活中不可或缺的资源——除物质、能源外的第三种资源。根据《CNNIC:2022年第49次中国互联网络发展状况统计报告》,截至2021年12月,我国网民规模达10.32亿,网站有418万个,网页有3350亿个,App有252万款,互联网普及率达73.0%,网民人均每周上网时长达到28.5小时,网民用手机、台式计算机、笔记本电脑、电视、平板电脑上网的比例分别是99.7%、35.0%、33.0%、28.1%和27.4%。网民上网的过程就是获取信息、处理信息、产生信息的过程。1.1.1什么是信息是对客观世界中各种事物的运动状态和变化的反映,是客观事物之间相互联系和相互作用的结果,表现的是客观事物运动状态和变化的实质内容。文字、图像、声音、动画、视频等均为承载信息的媒体。1.1.1什么是信息信息(information)随着互联网的发展,越来越多的传统业务已迁移到线上,越来越多的网民活跃在互联网上,每天都会产生大量的数据。据有关资料,全球每年产生的数据总量在2018年为33ZB,在2020年为59ZB,预计到2025年将增长到175ZB,那时候相当于每天将产生491EB的数据,如图1.1.1所示。1.1.2什么是信息检索用户进行信息查询和获取的主要方式。狭义的信息检索仅指信息查询(informationsearch),即用户根据需要,采用一定的方法,借助检索工具,从信息集合中找出所需要信息的查找过程。广义的信息检索是指对信息按一定的方式进行加工、整理、组织并存储起来,再根据用户特定的信息需求将相关信息准确地查找出来的过程,又称为信息的存储与检索。1.1.2什么是信息检索信息检索(informationretrieval)1.1.2什么是信息检索信息检索(informationretrieval)(1)site:用于在指定网站检索信息,如检索式“学习site:.**”表示仅从“.**”网站检索包含“学习”的信息。(2)filetype:制定检索文档的格式,如pdf、rtf、doc、xls、ppt等,如检索式“英语四级filetype:pdf”表示检索包含“英语四级”的pdf文件。1.1.3常用数据库利用百度检索时,可以选用“高级搜索”或选用以下检索条件。(3)intitle:对网页标题进行精准搜索。(4)inrul:在URL(统一资源定位器)中检索特定的名称。(5)link:检索链接到某网站的所有网页。1.1.3常用数据库利用百度检索时,可以选用“高级搜索”或选用以下检索条件。确定检索需求,根据检索需求选择合适的数据库,确定检索词,根据检索词的逻辑关系确定检索式,然后实施检索,根据检索结果调整检索式或检索词,甚至重新选择数据库,直到获得满意的检索结果,如图1.1.3所示。1.1.4信息检索的基本流程信息检索的基本流程1.1.4信息检索的基本流程信息检索的基本流程02检索非接触电梯按键专利文档即专有的权利和利益,是由国家知识产权局根据申请而颁发的一种文件,这种文件记载了发明创造的内容,并且在一定时期内产生这样一种法律状态,即获得专利的发明创造在一般情况下他人只有经专利权人许可才能予以实施。在我国专利分为发明专利、实用新型专利和外观设计专利三种类型。《中华人民共和国2021年国民经济和社会发展统计公报》显示,在2021年我国授予专利权460.1万件。1.2.1专利数据库专利(patent)1.2.1专利数据库布尔逻辑检索是使用标准的布尔逻辑关系符号来表达检索词之间的逻辑关系的检索方法。目前最常用的布尔逻辑运算符有“与”(AND)、“或”(OR)、“非”(NOT),见表1.2.2。在检索实践中,组合使用布尔逻辑运算符,可以准确地表达检索主题。1.2.2常用检索方法1.布尔逻辑检索1.2.2常用检索方法1.布尔逻辑检索(1)“与”,用AND表示,用来表达不同含义检索词之间的并列限定关系。检索词A、B以AND相连,即“AANDB”,表示同时包含A、B两词的文献才能符合检索要求,从而缩小检索范围,提高检索结果的查准率。例如,要查找“海南自贸港”方面的文献,中文检索式为“海南AND自贸港”,运算的结果是同时包含检索词“海南”和检索词“自贸港”的文献才能被检索出来。一般情况下,在搜索引擎中默认使用空格代替AND。1.2.2常用检索方法1.布尔逻辑检索(2)“或”,用OR表示,用来表达同义或者同族检索词之间的并列允许关系。检索词A、B以OR相连,即“AORB”,表示只要包含A、B之一或者同时包含A、B的文献都是符合检索要求的。因而“或”运算可用于扩大检索范围。例如,要查找“按键”方面的文献,因为“按键”和“按钮”是同义词,所以为了避免漏检,检索式就可表示为“按键OR按钮”。运算的结果包含“按键”或“按钮”中任意一个或者同时包含两个词的文献均可被检索到。1.2.2常用检索方法1.布尔逻辑检索(3)“非”,用NOT表示,用来表达不包含的关系,可以从原检索范围中排除一部分,从而缩小检索范围。检索词A、B以NOT相连,表示只包含检索词A而不包含B的文献才能符合检索要求。例如,要查找有关“能源”,但又不涉及“核能”方面的文献,检索式可表示为“能源NOT核能”。运算的结果是包含“能源”,但不包含“核能”的文献将被检索出来。1.2.2常用检索方法1.布尔逻辑检索截词检索是在英文数据库中广泛应用的检索技术,用特定的符号表示检索词的某一部分字符,常用的截词符为“?”和“*”(见表1.2.3)。例如,“*”表示任何字符组,包括空字符;“?”表示任意一个字符。1.2.2常用检索方法2.截词检索截词检索按截词位置可以分为左截词、中间截词、右截词以及左右截词。按照截断的字符长度不同,可以分为有限截词和无限截词。1.2.2常用检索方法2.截词检索临近检索,又称为未知检索,通过检索式中的特定符号限制相应检索词的相对位置。例如,使用“NEAR/x”作为特定的符号,如检索式“ComputerNEAR/5Tools”表示查找同时包含“Computer”和“Tools”的记录,且两个字符之间相隔不超过5个单词。1.2.2常用检索方法3.临近检索1.2.2常用检索方法4.字段检索字段检索是限定字段在数据库范围内进行的一种检索技术。在检索时,数据仅仅支持从限定的字段中检索结果。中国知网的常用字段名称见表1.2.4。03精确检素“红色娘子军”学术文献图书馆是搜集、整理、收藏图书资料以供人阅览的机构,据有关考证我国早在3000年前就出现了图书馆——在安阳殷墟考古发现的殷人保存典册的府库。在图书馆中收藏着图书、期刊、报纸等文献,有些是纸质的文献,也有电子文献。图书的纸质文献一般采用中国图书馆分类法编码。为了方便读者检索,图书馆一般建有文献检索系统,通过在线检索找到图书的分类号,然后按分类号到相应书架上找书。国内常见的中文电子文献提供机构主要有:中国知网(ki.n**)、万方数据知识服务平台(.**)、超星读书(book.chaoxing.c**)、畅想之星馆配电子书(www.cxstar.c**)等。1.3.1图书馆中国知网(ki.n**)万方数据知识服务平台(.**)超星读书(book.chaoxing.c**)畅想之星馆配电子书(www.cxstar.c**)1.3.1图书馆国内常见的中文电子文献提供机构1.3.2中国图书馆分类法基本部类基本大类标识符号类

名马克思主义、列宁主义、

毛泽东思想、邓小平理论A马克思主义、列宁主义、

毛泽东思想、邓小平理论哲学、宗教B哲学、宗教社会科学C社会科学总论D政治、法律E军事F经济G文化、科学、教育、体育H语言、文字

文学J艺术K历史、地理1.3.2中国图书馆分类法基本部类基本大类标识符号类

名自然科学N自然科学总论O数理科学和化学P天文学、地球科学Q生物科学R医药、卫生S农业科学T工业技术U交通运输V航空、航天X环境科学、安全科学综合性图书Z综合性图书第一个字母表示一个大类;二级类目以下的标志可以用字母,也可以用数字。以字母或数字的顺序反映类目的系列。在字母后用数字表示类目的细分,当数字超过三位时在第三位后加间隔符号“”。1.3.2中国图书馆分类法具体的分类号采用字母与阿拉伯数字相结合的混合制号码。以“网络浏览器”说明其分类号,具体类目的细分如下:T工业技术TP自动化技术、计算机技术TP3计算技术、计算机技术TP39计算机的应用TP393计算机网络TP393.0一般性问题TP393.09计算机网络应用程序TP393.092网络浏览器1.3.2中国图书馆分类法具体的分类号采用字母与阿拉伯数字相结合的混合制号码。由清华大学、清华同方股份有限公司发起,始建于1999年6月,采用自主开发并具有国际领先水平的数字图书馆技术,建成了世界上全文信息量最大的“CNKI数字图书馆”,促进了全社会知识资源的高效共享,提供了最丰富的知识信息资源和最有效的知识传播与数字化学习平台。1.3.3中国知网中国知网中国知网收录中文学术期刊8560余种,含北大核心期刊1970余种,网络首发期刊2240余种,发表时间最早可回溯至1915年,共约有5910万篇全文文献;外文学术期刊包括来自80个国家及地区900余家出版社的7.5万余种期刊,覆盖JCR(《期刊引用报告》)收录期刊的96%、Scopus收录期刊的90%,发表时间最早可回溯至19世纪,共约有1.1亿篇外文题录,并且可链接全文。对于中国知网的在线数据,检索不收费,但如果要查阅全文或下载文件,就需要付费。中国知网是国内高校常用的数据库之一,有不少学校以IP授权方式购买了部分数据库一定时期的使用权,在校内均可访问。1.3.3中国知网04精确检索“信息检索”网络课程我国从2000年后就开始发展网络课程建设,国内不少高校还借此开展了学历型“网络教育

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论