第四讲 网络信息检索课件_第1页
第四讲 网络信息检索课件_第2页
第四讲 网络信息检索课件_第3页
第四讲 网络信息检索课件_第4页
第四讲 网络信息检索课件_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四讲:网络信息检索第四讲网络信息检索第四讲:网络信息检索导言:网络社会在现在的网络信息环境下,网络信息资源是我们学习、工作、生活中利用率最高的信息资源之一。对网络信息资源和网络的利用是终身学习的需要,也是个人信息素质中的重要内容。相对与图书馆纸本文献信息资源和数字资源的检索利用,其对人的影响更为深远。今后的社会,网络是一个基本要素,它将对社会经济、科技教育、国防乃至政治产生决定性的影响。

第四讲:网络信息检索目录网络信息资源概述

1

2

4

3网络信息检索工具搜索引擎检索技术网络信息检索技巧第四讲:网络信息检索网络信息资源概念

信息资源以电子数据的形式存放在非印刷型的介质中,并通过网络通信手段,在计算机等终端上再现的信息的总和。1.网络信息资源概述第四讲:网络信息检索网络信息资源类型

按信息内容的表现形式和内容划分可分为:全文型信息:直接在网上发行的电子期刊,网上报纸,印刷型期刊的电子版,网络学院的各类教材,政府出版物,标准全文等;事实型信息天气预报,节目预告,火车车次,飞机航班,城市或景点介绍,工程实况、IP地址等;数值型信息:主要是指各种统计数据;

数据库类信息:如CNKI,万方等,是传统数据库的网络化;

微信息(web2.0特征):如博客、播客,BBS,聊天,邮件讨论组,网络新闻组等;

其它类型:投资行情和分析,图形图象,影视广告等。1.网络信息资源概述第四讲:网络信息检索1.网络信息资源概述按所采用的网络传输协议可分为:WWW网络资源:因特网信息资源的主流,它使用http协议,使用简单,功能强大,能方便迅速的浏览和传递分布于网络各处的文字、图象、声音和多媒体超文本信息。FTP信息资源:它使用ftp协议,该协议主要用语连网计算机之间传输文件。FTP相当于在网络上两个主机之间复制文件。目前仍是发布、传递软件和长文件的主要方法。TELNET信息资源:telnet是远程登陆协议。telnet信息资源包括硬件资源和软件资源。许多机构都提供远程登陆的信息系统,如图书馆的公共目录系统,信息服务机构的综合信息系统等。用户服务组资源:包括新闻组,电子邮件组等。第四讲:网络信息检索1.网络信息资源概述网络信息资源特点信息资源丰富、种类繁多超文本、超媒体、集成式提供信息,图表、图形、图像、声音、动画等信息来源分散、无序,没有统一的管理机构,没有统一的发布标准价廉,但质量良莠不齐正式出版物和非正式信息交流交织在一起共享程度高是信息资源的宝库……第四讲:网络信息检索1.网络信息资源概述网络信息资源的评价与选择网络信息资源的评价与选择主要是针对信息源内容因素:内容是评价与选择的核心和重点,从中可以反映网络信息资源的本质。评价网络信息资源的内容因素主要有:权威性、完备性、可靠性、原创性、新颖性、稳定性等。形式因素:形式指标反映了外部特征以及操作使用等方面,是为提示内容服务的,主要包括:美观性、条理性、查检性、帮助性、快捷性、低耗性等。定量的评价:Google的pagerank;星数评价等级。第四讲:网络信息检索1.网络信息资源概述网络检索的类型按搜索的目标分类,可分为站点搜索普通搜索引擎、新浪、搜狐、Yahoo等图书资料网上图书馆、电子图书、网上商店专业文献专业数据库(中外文期刊、专利、图书)第四讲:网络信息检索1.网络信息资源概述

寻找因特网上的任何一个网页,其中的环节不会超过十九个页面六度空间理论?搜索的六度空间理论?寻找世界上任何一个人其中的环节不会超过六个人第四讲:网络信息检索1.网络信息资源概述附:人肉搜索请通过百度百科中的“人肉搜索引擎”词条了解人肉搜索

人肉搜索,其实是情报学中的信息分析和情报调研过程,是信息检索技能、信息分析方法和情报调研过程的集中应用。其最大的特点是应用web2.0的思路,网聚人力,虚拟与现实结合。第四讲:网络信息检索2.网络信息检索工具当已经知道地址时,直接通过地址访问。当不知道地址时,需要借助检索工具。搜索引擎网络资源目录信息门户搜索软件第四讲:网络信息检索2.网络信息检索工具当别人问你一个问题,而你10秒内无法想出答案时,你是否会回答去网上搜索一下?

当你需要编写一个格式报告(如毕业论文、年终总结)时,你是否会先搜索一些范例并参照编写?

如果你马上要和别人就一个你不熟悉的领域进行讨论时,你是否会赶紧先搜索一把,储备足够的背景知识,然后出动?

你是否经常有这样的感觉,凡是我想到的,别人都想到了;凡是我想知道的,一定有人知道答案?

当你即将前往一个陌生的地方,你是否会先打开搜索引擎页面,查阅当地的地理人文、风俗习惯,然后再启程?

第四讲:网络信息检索2.网络信息检索工具搜索引擎搜索引擎

自动从因特网搜集信息,经过一定整理以后,提供给用户进行查询的系统

Googlebaiduyahoo除此之外,还有哪些??……第四讲:网络信息检索2.网络信息检索工具中文常用搜索引擎国内搜索引擎百度(Baidu)—

国内唯一商业化的全文搜索引擎,提供搜狐、新浪、263、Tom等站点的网页搜索服务。

国内目录索引搜狐(Sohu)—

国内三大门户之一,最早在国内推出搜索引擎收费登录服务新浪(Sina)—

最大的中文门户网站,同样也推出了搜索引擎收费索引项目网易(Netease)—网易旗下搜索引擎,主要提供网页、图片、热闻、视频、音乐、博客等传统搜索服务,同时推出海量词典、阅读、购物搜索等创新型产品。第四讲:网络信息检索2.网络信息检索工具英文常用搜索引擎Google—

以搜索精度高、速度快成为最受欢迎的搜索引擎,搜索界的领军人物。Yahoo—

最著名的目录索引,搜索引擎开山鼻祖之一.第四讲:网络信息检索2.网络信息检索工具搜索引擎只是一个索引数据库,一般没有自己的信息资源,信息的可获得性与搜索引擎无关。不过搜索引擎有时也会在数据库中存储某些信息的内容。baidugoogle第四讲:网络信息检索2.网络信息检索工具水平搜索引擎(综合搜索引擎)水平搜索引擎索引几乎所有可能内容,包括多种类型、大量领域。在内容类型和领域方面表现出综合性。水平搜索引擎强调信息的宽广、面对的是广泛用户的信息需求。典型的水平搜索引擎有:百度中文搜索引擎:

Google中文搜索引擎:第四讲:网络信息检索2.网络信息检索工具垂直搜索引擎垂直搜索引擎

即专业或专用搜索引擎,它专门用来检索某一主题范围或某一类型信息,追求专业性与服务深度是它的特点。垂直搜索引擎不但可保证此领域信息的收录齐全与更新及时,而且检索深度和分类细化远远优于综合搜索引擎。垂直搜索引擎的检出结果虽可能较综合搜索引擎少,但检出结果重复率低、相关性强、查准率高,适合于满足较具体的、针对性强的检索要求。目前已经涉及到购物,旅游,汽车,工作,房产,交友等行业。第四讲:网络信息检索2.网络信息检索工具找工作的搜索引擎:

google学术搜索:google图书搜索:

比价购物搜索引擎:论坛搜索引擎:

旅行TripAdvisor图像搜索引擎:第四讲:网络信息检索2.网络信息检索工具综合搜索引擎的专门化趋势搜狗(Sogou)[人物、音乐、购物、图片、地图]

GOOGLE学术搜索:

GOOGLE图书搜索

AllTheWeb[能专门对图像、多媒体信息。]

第四讲:网络信息检索2.网络信息检索工具元搜索引擎元搜索引擎(matesearch)又称集合型搜索引擎,将多个单一搜索引擎集成在一起,提供统一的检索界面,将用户的检索提问一次搜索多个搜索引擎,并将结果返回给用户。

优点:能同时搜索多个搜索引擎,能在一定程度上提高查询的广度。缺点:因为有时后并不能对一个搜索引擎全部查完,有时后也会漏掉一些重要信息。例如:搜魅网(someta)、马虎聚搜第四讲:网络信息检索2.网络信息检索工具网络资源目录由人工采集网上信息,然后按照一定分类标准,比如学科类型、主题等,建立网站分类目录,并将筛选后的信息分门别类放入各类目中供用户进行浏览。1.信息组织的专题性较强,满足族性检索要求2.使用简单,只要选择相关类目,依照页面之间的超链接指引很快就能到达目的信息,适于检索不熟悉的领域或建议不熟悉网络的用户使用.优点1.人工采集信息的收录范围小,更新慢;

2.受主观因素影响,类目设置不够科学,缺少规范。缺点第四讲:网络信息检索2.网络信息检索工具搜索引擎目录[目录索引]:新浪目录开放目录[ODP]、

中国艺术开放目录

专题网址

如搜索引擎的专题网址:第四讲:网络信息检索2.网络信息检索工具信息门户学科信息门户

政府信息门户

(首都之窗)商业信息门户公司信息门户导航库第四讲:网络信息检索一些疑问?搜索引擎到底有什么搜索技术?搜索引擎技术都有哪些应用?是不是也有应用实例演示?……我们将进入本次课程下一个部分的学习…………第四讲:网络信息检索3.搜索引擎检索技术一、Google二、Baidu三、其他第四讲:网络信息检索3.搜索引擎检索技术第四讲:网络信息检索3.搜索引擎检索技术第四讲:网络信息检索3.搜索引擎检索技术谷歌网址:

谷歌宣传动画:

“Google”取自数学术语googol,意思是一个1后面有100个0。意在表现该引擎“搜集和驾御浩瀚无穷的网络信息”的宏图。第四讲:网络信息检索3.搜索引擎检索技术谷歌一般搜索技术默认模糊搜索、默认拆分语句和过长的短语如何精确搜索(短语搜索)通配符*用法点号匹配任意字符:.布尔逻辑与:空格、AND或:OR、|非:-(减号)约束条件:+同义词:~数字范围:..括号:()第四讲:网络信息检索3.搜索引擎检索技术默认模糊搜索、默认拆分语句和过长的短语第四讲:网络信息检索3.搜索引擎检索技术如何精确搜索(短语搜索)第四讲:网络信息检索3.搜索引擎检索技术通配符*用法如:检索【”市场*研究报告“】第四讲:网络信息检索3.搜索引擎检索技术点号匹配任意字符(也可不用引号)与通配符星号“*”不一样的是,点号“.”匹配的是字符,不是字、短语等内容。保留的字符有[、(、-等。如:【“大全.中国”】第四讲:网络信息检索3.搜索引擎检索技术布尔逻辑布尔逻辑是许多检索系统的基本检索技术,在搜索引擎中也一样适用,在谷歌网页搜索中需要注意的是:谷歌和许多搜索引擎一样,多个词见的逻辑关系默认的是逻辑与(空格)。当用逻辑算符的时候,词与逻辑算符之间用需要空格分隔,包括后面讲的各种语法,均要有空格。逻辑非是特例,即减号必须与对应的词连在一起。对于复杂的逻辑关系,可用括号分组。如:逻辑与:【电子行业AND研究报告】,用空格和AND以及小写搜索结果差别不大。此例是搜索电子行业的研究报告。

逻辑或:【电子行业AND研究报告AND(人才|风险)】此例是搜索电子行业的人才或风险方面的研究报告。

逻辑非:【电子行业AND研究报告AND(人才|风险)-2007】此例是搜索电子行业的人才或风险方面的研究报告,但不要2007年的。第四讲:网络信息检索3.搜索引擎检索技术约束条件加号“+”用于强制搜索,即必须包含加号后的内容。一般与精确搜索符一起应用,如:【研究报告+"学术信息资源开放目录"】第四讲:网络信息检索3.搜索引擎检索技术同义词仅限于英文搜索。一般来说,加~符号会比不加搜索出来的多一些。总体来说效果不是很明显。如:搜索【~PC】能搜索出Computer、windows等内容。第四讲:网络信息检索3.搜索引擎检索技术数字范围用两个点号“..”表示一个数字范围。一般应用于日期、货币、尺寸、重量、高度等范围的搜索。用作范围时最好给一定的含义。

如:【格力空调2000..2800元】搜索价格区间。本例仅仅搜索格力空调的价格在2000元到2800元之间的信息。

【格力空调..2800元】2800元以下的。

【格力空调2800..元】2800元以上的。

第四讲:网络信息检索3.搜索引擎检索技术括号分组逻辑组配时分组,避免逻辑混乱。括号“()”是分组符号。

如:【(格力空调|海尔空调)元2800..】2800元以上的格力空调或者海尔空调。第四讲:网络信息检索3.搜索引擎检索技术谷歌高级搜索语法intitle、allintitle:搜索范围限制在网页的标题intext,allintext:搜索范围限制在网页中的正文中搜索inurl、allinurl:搜索范围限制在URL:根据文件后缀搜索特定文件类型define:谷歌网页搜索中搜索定义的语法site:搜索范围限制在某网站或顶级域名中。第四讲:网络信息检索3.搜索引擎检索技术intitle:搜索范围限制在网页的标题第四讲:网络信息检索3.搜索引擎检索技术intext:搜索范围限制在网页中的正文第四讲:网络信息检索3.搜索引擎检索技术inurl:限定搜索网址的语法。是In-系指令中最强大的一个,换句话说,这个高级指令能够直接从网站的URL入手挖掘信息,只要略微了解普通网站的URL格式,就可以极具针对性地找到你所需要的资源--甚至隐藏内容。搜索图片--【inurl:photo】,搜索所有网络地址中包含“photo”的关键词的页面结果。指令中的photo也可以替代为picture、image等搜索音乐--【inurl:mp3毕业生】,在所有网络地址中包含“mp3”的页面中搜索“毕业生”。这个时候返回的“毕业生”肯定是音乐,而不是关于“毕业生”的其它话题。Google中搜索音乐的另一有效方式是MP3可以替换为wma/rm等。

搜索软件--【inurl:downloadqq】,直接查找QQ软件的下载页面。

搜索电子论文--【inurl:eprint“InformationRetrieval”】搜索有关InformationRetrieval的电子论文(通常这类搜索结果能直接下载全文)。

搜索特定网站中的内容【讲座】搜索

网站中有“讲座”的内容第四讲:网络信息检索3.搜索引擎检索技术:根据文件后缀搜索特定文件类型这个语法非常有用,我们在网上常常要找一些范文或参考资料的时候常用这个语法。是根据文件后缀搜索特定文件类型,比如支持的文档有:pdf、ppt、doc、xls等;网页文件:htm、asp、php等。

如:【市场研究报告】,搜索有关市场研究报告的WORD文档。第四讲:网络信息检索3.搜索引擎检索技术define:谷歌网页搜索中搜索定义的语法用于搜索定义或解释。在阅读、学习、研究或撰写论文中,遇到陌生的词或缩写,可以用该语法得到确切的定义或解释。而且可以了解多种语言的定义情况。【define:文献】得到关于文献的多个定义来源。

第四讲:网络信息检索3.搜索引擎检索技术site:搜索范围限制在某网站或顶级域名中。

如:【医药site:】搜索我国教育科研网中关于“医药”的信息,医药院校或专业的信息等。这样能排除很多医药领域的公司信息。

第四讲:网络信息检索3.搜索引擎检索技术混合使用搜索技术

混合搜索实例:查找产业报告类的全文资料。

当然,可以直接用【产业报告】搜索,如果你掌握了一定的搜索语法知识,你可以这样搜索:【产业报告】,能搜索到word格式的许多行业的产业报告文档。

而且,你还可以近一步进行限定,搜索仅2005年以来的相关内容:【产业报告2005..】。这样搜索到的信息资源并不逊色于专门的数据库。

第四讲:网络信息检索3.搜索引擎检索技术有趣的谷歌应用谷歌每逢节假日、纪念日或重大事件,会更改首页图标以示纪念。谷歌假日图标从1999至今的链接:

第四讲:网络信息检索3.搜索引擎检索技术百度网址:

2000年1月由李彦宏、徐勇两人创立于北京中关村,致力于向人们提供“简单,可依赖”的信息获取方式“百度”二字源于中国宋朝词人辛弃疾的《青玉案》诗句:“众里寻他千百度”中国领先的搜索技术提供商2011年中国搜索引擎市场份额占有率中,百度占有率为:77.7%,谷歌中国占有率18.3%。

第四讲:网络信息检索3.搜索引擎检索技术一搜就体验,精彩无极限(视频)

搜索一下,想知道就知道(视频)

轻松一点,网络音乐随我听(视频)

上网查一查,出行问题全解决(视频)

第四讲:网络信息检索3.搜索引擎检索技术其它搜索工具:在线翻译工具:CNKI翻译助手:金山词霸:在线和下载版爱词霸:

海词:中文搜索引擎指南

搜索研究院

第四讲:网络信息检索4.网络信息检索技巧网络信息检索的基本技巧之一:

恰当选用数据资源恰当选用数据资源(检索工具)对于信息检索而言,重要的是在检索前正确的选择数据资源。只有如此,才能保证最终检索结果在一定程度上的查全率、查准率。正确地了解、认识、熟悉各类检索系统,是恰当选用数据库的前提。

第四讲:网络信息检索4.网络信息检索技巧网络信息检索的基本技巧之二:

利用系统检索提示大多数计算机检索系统、网站都提供一些介绍文件,如aboutus(关于我们)、Help(帮助)和FAQ(经常提问的问题)、SearchTip(检索提示)等,仔细阅读这些文件,对于了解系统的设计、数据库覆盖的范围、检索的具体要求都非常重要。不要因为追求检索的速度而忽视了这一环节。第四讲:网络信息检索4.网络信息检索技巧网络信息检索的基本技巧之三:

充分利用检索条件在使用大型期刊文献数据库时,由于有完善的检索功能,应充分应用布尔逻辑检索方法,选择利用各种检索入口,设计合理完善的检索式。有些信息检索系统,常常提供检索的表达条件或检索限制,使用时只需从给定的条件中选择需要的项目即可,如查找的年代、资料的类型、是否需要全文等。正确选择各项内容,让计算机较好地理解用户的检索意图是十分必要的。通过这些选项,计算机会更加精确地把检索结果呈现出来。

第四讲:网络信息检索4.网络信息检索技巧网络信息检索的基本技巧之四:

选择恰当的检索词选择查询词是一种经验积累,在一定程度上也有章可循:①表述准确:网站或数据库会严格按照您提交的查询词去搜索,因此,查询词表述准确是获得良好搜索结果的必要前提。一类常见的表述不准确情况是,脑袋里想着一回事,搜索框里输入的是另一回事。另一类典型的表述不准确,是查询词中包含错别字。②查询词的主题关联与简练。目前的搜索引擎并不能很好的处理自然语言。因此,在提交搜索请求时,您最好把自己的想法,提炼成简单的,而且与希望找到的信息内容主题关联的查询词。

如某三年级小学生,想查一些关于时间的名人名言

他的查询词是“小学三年级关于时间的名人名言”。这个查询词很完整的体现了搜索者的搜索意图,但效果并不好。可改为:“时间名人名言”或“时间名言”。第四讲:网络信息检索4.网络信息检索技巧网络信息检索的基本技巧之五:

恰当选用搜索引擎了解和掌握主题式、目录式搜索引擎,独立、多元搜索引擎的不同检索功能,而后根据自己的检索需求,选择恰当的搜索引擎,以期得到满意的检索结果。第四讲:网络信息检索4.网络信息检索技巧网络信息检索的基本技巧之六:

掌握扩检和缩检方法信息检索过程是不断调整检索策略的过程,也是进行扩检或缩检的过程。当检索结果中相关信息或所需要的信息太少或没有时,需要进行扩检,反之就需要进行缩检。第四讲:网络信息检索4.网络信息检索技巧扩检主要方法(一)①多搜索引擎、多库检索据有关资料介绍,目前国外大型搜索引擎在Web上仅能收录覆盖1/3的公开Web页面,任何大型搜索引擎也不可能将公开网页全部收录。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论