信息检索与科技写作课件:网络信息检索与在线检索工具_第1页
信息检索与科技写作课件:网络信息检索与在线检索工具_第2页
信息检索与科技写作课件:网络信息检索与在线检索工具_第3页
信息检索与科技写作课件:网络信息检索与在线检索工具_第4页
信息检索与科技写作课件:网络信息检索与在线检索工具_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

网络信息检索与在线检索工具网络信息检索与在线检索工具随着计算机技术和互联网技术的迅猛发展,计算机网络在现代信息社会中的作用越来越重要,人们可以通过互联网获得数据、图片、文本、科技文献等信息,也可以通过互联网进行信息的保存和整理。在信息社会,检索、保存和利用网络信息资源,是科研工作者必须具备的基本素质。本章的主要内容3.1网络信息资源概述3.2网络信息检索基础3.3网络信息在线检索工具网络信息检索与在线检索工具3.1网络信息资源概述3.1.1网络信息资源的概念网络信息资源也称虚拟信息资源,是互联网时代的产物。,网络信息资源以数字化形式记录,以多媒体形式表达,存储在网络计算机磁介质、光介质以及各类通信介质上,并通过计算机网络进行信息传递。资源提供方基于http、ftp、telnet、ed2k、thunder等协议通过网络对外提供信息服务,用户利用计算机、智能手机等网络终端设备对这些信息进行获取或下载。网络信息检索与在线检索工具3.1网络信息资源概述3.1.2网络信息资源的特点传统信息资源的载体体积较大且不易携带,会受地域空间的影响,导致信息在短时间内无法共享。现代网络信息资源则突破了信息检索的区域性和局限性,极大地增加了检索范围,优化了检索途径。与传统信息资源相比,网络信息资源包括以下特点:(1)开放性、共享性。网络信息资源的共享,使得人们获取信息的方式得到了很大改善,不再受时空和地理位置差异的影响。(2)检索的便捷性。网络环境下信息的传递和反馈快速灵敏,具有动态性和实时性等特点。信息在网络中的流动性非常迅速,无线电和卫星通信技术的充分运用,使得上传到网上的任何信息资源,只需要短短的数秒钟就能传递到世界各地的每一个角落网络信息检索与在线检索工具3.1网络信息资源概述3.1.2网络信息资源的特点(3)网络信息资源建设的高效性。网络信息资源的高效性并不是指速度方面的高效率,而是指用户所需要的知识信息对自己从事的活动具有较高价值。(4)时效性强、交互功能强。网络信息资源从本质上改变了信息的创造交流和获取方式,实现了无纸化出版,去掉了传统出版的纸质书稿的印刷投递等,使得时效性得到巨大提升,减少了出版时间,加快了知识传播速度。此外,网络平台具有强大的交互功能,在网络信息资源高效共享下,有关专家可以就某一专题开展电子论坛,大家都可以参与讨论交流。作者、出版社和读者对文章的讨论也更加方便。网络信息检索与在线检索工具3.1网络信息资源概述3.1.2网络信息资源的特点(5)容量大、内容丰富、形式复杂。与基于纸介质的传统信息资源不同,数字化存储是网络信息资源存储的基本形式,存储介质主要以磁介质、光介质为主。高密度、大容量的数字化存储不仅适合计算机的高速处理、低成本远距离传输,同时也方便用户查询和获取。尽管数字化的网络信息资源在物理层面都是以二进制表示,但其外在表现形式复杂多样,具体包括文本、图形、图像、音频、视频、软件等多种形式。网络信息检索与在线检索工具3.1网络信息资源概述3.1.2网络信息资源的特点(6)微观有序、宏观无序与不均衡性。从微观层面来看,网络获取的多数内容都经过不同程度的有序化,并存储在一个具体的系统中,从而呈现局部有序状态。但是从宏观来看,由众多来源不同的微观有序系统组合而成的网络信息资源系统呈现无序分散状态,其结构复杂,难以控制,缺乏稳定性。这种宏观无序的状态降低了信息获取的效率,增加了信息获取的难度。信息资源的非均衡性表现为地域的非均衡性和语言的非均衡性。在全球范围内,以美国为首的西方发达国家信息资源发展水平远高于发展中国家。在我国,东部地区的信息资源发展水平高于西部地区。网络信息检索与在线检索工具3.1网络信息资源概述3.1.3网络信息资源的分类1、按照网络类型划分局域网信息资源。局域网是指将一定区域内的各类计算机、外部设备和数据库连接起来形成计算机通信网。通过专用数据线路与其他局域网或数据库连接,可以形成更大范围的信息处理系统。联机检索信息资源。联机检索是指用户借助通信线路,通过终端设备连接检索系统进行文献与数据检索。互联网信息资源。互联网以相互交流信息资源为目的,基于通信协议,由路由器和通信线路联结而成,是一个实现资源共享的综合平台。网络信息检索与在线检索工具3.1网络信息资源概述3.1.3网络信息资源的分类2、按照网络传输协议或技术划分万维网信息资源。万维网信息资源(www)以超文本和超媒体技术为基础,集文本、图像、图形和声音于一体。它通过超文本传输协议在万维网客户端和服务器之间传输。文件传输协议信息资源。文件传输协议(filetransferprotocol,FTP)信息资源是指网络中基于FTP进行交流的文件信息资源。流媒体信息资源。流媒体信息资源基于流媒体技术进行传输,将一连串的媒体数据压缩后,以流的方式在网络中分段传送,实现在网络上实时传输影音。P2P信息资源。P2P信息资源指基于P2P传输模式的信息资源。P2P传输模式是指不通过中枢服务器在个人电脑之间实现文件交换和共享的一种新模式。其他信息资源。从传输协议的角度分析,除上述几种信息资源之外,还有一些基于其他协议传输的网络信息资源,如Telnet信息资源、Gopher信息资源等。网络信息检索与在线检索工具3.1网络信息资源概述3.1.3网络信息资源的分类3、按信息交流方式划分正式出版信息资源。正式出版信息资源是指受到知识产权保护,信息质量可靠,利用率较高的网络信息资源,包括电子图书、电子期刊、电子报纸、搜索引擎、网络导航、检索数据库、网络述评、在线字(辞)典、在线百科全书、在线参考数据库等。半正式出版信息资源。半正式出版信息资源是指受到知识产权保护但没有纳入正式出版系统的信息资源。这部分信息资源可以从各种学术团体、教育机构、企业部门、国际组织、政府机构、行业协会等单位的网站上获取。非正式出版信息资源。非正式出版信息资源是指数量大、流动性较强、质量难以保证的动态性信息。任何组织和个人都有机会成为网络信息资源的内容制造者。网络信息检索与在线检索工具3.1网络信息资源概述3.1.4网络信息资源的载体形式信息载体是指在信息传播中携带信息的媒介,即用于记录、传输、积累和保存信息的实体,包括以能源和介质为特征,运用声波、光波、电波传递信息的无形载体和以实物形态记录为特征,运用纸张、胶卷、胶片、磁带和磁盘传递和贮存信息的有形载体。网络信息资源的载体为无形载体,具体表型形式包括文本、图形、图像、音频、视频、动画、软件等。网络信息检索与在线检索工具3.2网络信息检索基础3.2.1网络信息检索特点网络信息检索克服了传统信息检索的众多缺点,将人工查询和获取转变为互联网操作,减少了检索时间,简化了操作流程,提高了检索精确度,突破了传统信息检索的局限性。网络信息检索具备以下主要特点:(1)检索范围广。互联网将全球网络信息资源连成一个整体,消除了信息资源检索和获取的空间障碍和地域界限。通过专业网络检索工具,用户可以随时检索到世界各地可供查阅的网络信息资源。(2)检索速度快。互联网技术的发展提升了网络信息检索速度,专业检索工具提高了网络信息检索的效率。对于一般的网络信息搜索引擎而言,从检索条件的提交到检索结果的返回,其时间跨度一般在一秒以内,而检索结果则成千上万,极大地提高了网络信息资源的检索效率。网络信息检索与在线检索工具3.2网络信息检索基础3.2.1网络信息检索特点(3)交互性强。交互式作业是目前所有网络信息检索工具的必备特征,网络信息检索工具能够从用户命令中获取指令并及时响应用户的要求、具有良好的信息反馈功能。网络检索工具提供的错别字提示、拼音提示、相关搜索、联想搜索、模糊搜索等功能,都是网络信息检索交互性的具体体现。(4)检索过程简单。在网络信息检索中,尽管不同的检索工具、检索系统在结构和功能上千差万别,但它们都追求一个共同的目标,即尽量简化用户的操作和使用。生活中那些简洁明了的搜索引擎(如百度、谷歌等)、条理清晰的导航网站(如hao123),无不体现了网络信息检索工具操作简单的设计理念。网络信息检索与在线检索工具3.2网络信息检索基础3.2.2网络信息检索策略互联网中蕴含了丰富的信息资源,且每时每刻都在变化更新,如何找寻所需的信息是网络信息检索主要目标。科技论文的检索不仅要讲求方法,更要讲求策略。检索策略的完善度直接决定着检索结果是否符合要求。用户制定文献检索策略,要根据文献检索的需要与可能性,制定一套符合文献分布规律的检索方案,其基本内容包括多个检索步骤。网络信息检索与在线检索工具图3-1网络信息检索过程3.2网络信息检索基础3.2.2网络信息检索策略目前常用的检索策略有基于有效信息来源的检索策略和基于检索工具的网络信息检索策略。1、基于有效信息来源的检索策略(1)直接法。直接发指利用文献检索系统对所需文献的关键词进行查询,最后获得系统数据库中全部包含此关键词的文献。直接法根据查询时间范围还可分为顺查法、逆查法和抽查法三种。(2)追溯法。追溯法又称引文法,是一种跟踪查找法,指对文献末尾的参考文献进行跟踪查找。(3)综合法。综合法是一种将直接法与追溯法两种方法相结合的检索方法。综合法通过利用检索工具或检索系统进行常规检索,再利用文献后的参考文献进行追溯检索。网络信息检索与在线检索工具3.2网络信息检索基础3.2.2网络信息检索策略2、基于检索工具的网络信息检索方法(1)随意浏览法。随意浏览法又称为漫游法,在没有明确的检索目的和要求的情况下,用户从一个网页链接到另一个想要浏览的页面,没有确切的检索目的。(2)搜索引擎检索法。搜索引擎检索法是最为常规的网络信息检索方法。搜索引擎是利用关键词、词组或自然语言检索的工具。(3)网络导航检索法。网络导航检索法是基于分类体系的目录型检索方法,也是较为常用的信息检索方法。(4)专业资源系统检索法。专业资源系统在人工参与的前提下,通过对大量整理后信息资源进行存储、管理和维护更新,并在互联网上借助一个具体的检索网页为用户提供查询服务。网络信息检索与在线检索工具3.3网络信息在线检索工具3.3.1搜索引擎检索工具搜索引擎指根据一定的策略,运用特定的计算机程序从互联网上搜集信息,并对信息进行组织和处理后,为用户提供检索服务的系统工具。1、搜索引擎分类(1)全文搜索引擎。如谷歌、百度等全文搜索引擎从互联网中获取各个网站的信息资源,通过建立数据库使用户能够获取与检索内容匹配的内容,并按照一定顺序呈现检索结果(2)目录索引搜索引擎。用户可以按照分类目录找到所需要的信息,而不依靠关键词进行查询。目录索引用最具代表性的是“雅虎搜索”“新浪分类目录搜索”,各类引文索引平台亦属于目录索引。网络信息检索与在线检索工具3.3网络信息在线检索工具3.3.1搜索引擎检索工具(3)元搜索引擎。元搜索引擎是将多个单一搜索引擎集成在一起,提供统一的检索界面,对用户的检索需求同时在多个搜索引擎中进行搜索,并将结果反馈给用户。有的元搜索引擎则按自定的规则将结果重新排列组合,如“360搜索”;有的元搜索引擎直接按来源引擎排列搜索结果,如“Jopee元搜索”。(4)垂直搜索引擎。垂直搜索引擎是专门检索某一主题或某一类型信息的搜索引擎,以专业性与服务性作为特点。常用的垂直搜索引擎有:“Jooble搜索(找工作搜索引擎)”“新浪微博搜索(博客、微博搜索引擎)”“百度学术搜索(学术搜索引擎)”“书问搜索(图书搜索引擎)”等。网络信息检索与在线检索工具3.3网络信息在线检索工具3.3.1搜索引擎检索工具(5)后搜索引擎。后搜索引擎是对众多流行搜索引擎的搜索结果进行归纳整理,它是由全球最大的中介搜索引擎“Ixquick搜索”提出的。(6)计算型搜索引擎。计算型搜索引擎是指一种利用自然语言检索技术的搜索引擎。通过这种计算型搜索引擎,用户检索到的信息已经不限于互联网中已有的信息资源,而是经过服务器处理计算得到的新信息。较其他搜索引擎,用户能检索关键词后,直接获得检索引擎返回的处理结果,而不是网页链接。例如,在WolframAlpha搜索引擎中中输入“HowmanypeopleinXi’an”,结果显示“12million952thousandpeople”等结果。网络信息检索与在线检索工具3.3网络信息在线检索工具3.3.1搜索引擎检索工具2、搜索引擎工作基本原理搜索引擎的工作步骤一般包括爬行、抓取存储、预处理以及排序,其中每一步的工作原理如下:(1)爬行。搜索引擎是通过一种特定规律的算法跟踪网页的链接,像蜘蛛在蜘蛛网爬行一样,从一个链接爬到另外一个链接,所以被称为“爬行”。它需要遵从一些跟踪算法的命令或相关文件的指令。(2)抓起存储。搜索引擎通过爬行跟踪链接到网页,并将抓取的数据存入原始页面数据库。搜索引擎在抓取页面时,也做一定的重复内容检测,一旦遇到权重很低的网站(如包含有大量抄袭、采集或者复制的内容),搜索引擎很可能就不再抓取存储。网络信息检索与在线检索工具3.3网络信息在线检索工具3.3.1搜索引擎检索工具

(3)预处理。搜索引擎将抓取回来的页面,进行以下步骤的预处理:①

提取文字;②

中文分词;③

去停止词;④

消除噪音;⑤

正向索引;⑥

倒排索引;⑦

链接关系计算;⑧

特殊文件处理。(4)排序。用户在搜索引擎检索框中输入需要检索的关键词后,排序程序调动索引库数据,计算排序并显示给用户。搜索引擎检索出来的匹配结果很多,一般情况下都是按照日、周、月等时间间隔进行阶段性更新。网络信息检索与在线检索工具3.3网络信息在线检索工具3.3.2引文索引类检索工具引文索引是利用文献之间的印证关系,将文献的参考文献表编在一起的引文机制。引文索引的基本作用是在检索工具中利用引文去查找相关文献。它能够体现文献间引用和被引用的关系、规律以及论文后所附参考文献的作者、题目、出处等项目。用户可以使用引文索引方法,以某一信息为查找点,检索出其他与之有关的信息。1、引文索引的编制原理引文索引的编制原理是按照文献的相互引用关系建立索引系统。文献之间的相互引用形成文献网络,根据该文献网络可以检索相关文献,并通过追溯检索查找更多相关的参考文献。因此,引文索引的核心是引证索引和来源索引。网络信息检索与在线检索工具3.3网络信息在线检索工具3.3.2引文索引类检索工具2、引文索引的意义和作用引文检索虽然不是常规的检索途径,但在学术交流和科研评价中的作用越来越大。随着时间的推移,论文可能被另外的论文所引用,引用和被引用的相互作用就逐渐形成了一个网络,即引文网络。引文索引的作用有以下几个方面:(1)文献检索获取。由于被引文献和引用文献在内容上存在关联性。因此通过检索一位知名学者或一篇较有质量的文献,通常可获得一系列主题相关的新文献。(2)科研管理与研究预测。一篇文献一经发表,其参考文献永远不变,但被引用次数可能会逐渐变多。该论文被其他文献引用说明其学术观点和研究成果有被人参考借鉴的作用,被引用频次越高表示论文的影响力越大。网络信息检索与在线检索工具3.3网络信息在线检索工具3.3.2引文索引类检索工具(3)分析评价。目前学术界普遍认为文献质量与文献被引次数成正比。在晋升职称和引进人才时,通常要求出示具有检索资质图书馆验证的查收查引报告。用文献被权威数据库收录和被他人引用频次来评价科研人员学术水平高低。文献被引总频次主要取决于文献发表量和文献本身的学术质量,对科研机构、大学乃至国家而言,文献被引总频次在一定程度上能反映其总体实力。网络信息检索与在线检索工具3.3网络信息在线检索工具3.3.2引文索引类检索工具3、常见的引文索引机构网络信息检索与在线检索工具序号名称简介1《科学引文索引》科学引文索引(ScienceCitationIndex,简称S

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论