《网络信息检索》PPT_第1页
《网络信息检索》PPT_第2页
《网络信息检索》PPT_第3页
《网络信息检索》PPT_第4页
《网络信息检索》PPT_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、网络信息检索PPT 本课件仅供大家学习使用 本课件仅供大家学习使用 本课件仅供大家学习使用 学习完毕请自行删除导言:网络社会在现在的网络信息环境下,网络信息资源是我们学习、工作、生活中利用率最高的信息资源之一。对网络信息资源和网络的利用是终身学习的需要,也是个人信息素质中的重要内容。相对与图书馆纸本文献信息资源和数字资源的检索利用,其对人的影响更为深远。今后的社会,网络是一个根本要素,它将对社会经济、科技教育、国防乃至政治产生决定性的影响。 目录网络信息资源概述 1 2 4 3网络信息检索工具搜索引擎检索技术网络信息检索技巧 网络信息资源概念 信息资源以电子数据的形式存放在非印刷型的介质中,并

2、通过网络通信手段,在计算机等终端上再现的信息的总和。1.网络信息资源概述网络信息资源类型 按信息内容的表现形式和内容划分可分为: 全文型信息:直接在网上发行的电子期刊,网上报纸,印刷型期刊的电子版,网络学院的各类教材,政府出版物,标准全文等; 事实型信息 天气预报,节目预告,火车车次,飞机航班,城市或景点介绍,工程实况、IP地址等; 数值型信息:主要是指各种统计数据; 数据库类信息:如CNKI,万方等,是传统数据库的网络化; 微信息web2.0特征:如博客、播客,BBS,聊天,邮件讨论组,网络新闻组等; 其它类型:投资行情和分析,图形图象,影视广告等。1.网络信息资源概述按所采用的网络传输协议

3、可分为:WWW网络资源: 因特网信息资源的主流,它使用http协议,使用简单,功能强大,能方便迅速的浏览和传递分布于网络各处的文字、图象、声音和多媒体超文本信息。FTP信息资源:它使用ftp协议,该协议主要用语连网计算机之间传输文件。FTP相当于在网络上两个主机之间复制文件。目前仍是发布、传递软件和长文件的主要方法。TELNET信息资源:telnet是远程登陆协议。telnet信息资源包括硬件资源和软件资源。许多机构都提供远程登陆的信息系统,如图书馆的公共目录系统,信息效劳机构的综合信息系统等。用户效劳组资源:包括新闻组,电子邮件组等。网络信息资源特点信息资源丰富、种类繁多超文本、超媒体、集成

4、式提供信息,图表、图形、图像、声音、动画等信息来源分散、无序,没有统一的管理机构,没有统一的发布标准价廉,但质量良莠不齐正式出版物和非正式信息交流交织在一起共享程度高 是信息资源的宝库网络信息资源的评价与选择网络信息资源的评价与选择主要是针对信息源内容因素:内容是评价与选择的核心和重点,从中可以反映网络信息资源的本质。评价网络信息资源的内容因素主要有:权威性、完备性、可靠性、原创性、新颖性、稳定性等。形式因素:形式指标反映了外部特征以及操作使用等方面,是为提示内容效劳的,主要包括:美观性、条理性、查检性、帮助性、快捷性、低耗性等。定量的评价:Google的pagerank;星数评价等级。网络检

5、索的类型按搜索的目标分类,可分为站点搜索普通搜索引擎、新浪、搜狐、Yahoo等图书资料网上图书馆、电子图书、网上商店专业文献专业数据库中外文期刊、专利、图书 寻找因特网上的任何一个网页,其中的环节不会超过十九个页面六度空间理论?搜索的六度空间理论?寻找世界上任何一个人其中的环节不会超过六个人附:人肉搜索人肉搜索,其实是情报学中的信息分析和情报调研过程,是信息检索技能、信息分析方法和情报调研过程的集中应用。其最大的特点是应用web2.0的思路,网聚人力,虚拟与现实结合。2. 网络信息检索工具当已经知道地址时,直接通过地址访问。当不知道地址时,需要借助检索工具。搜索引擎网络资源目录信息门户搜索软件

6、2. 网络信息检索工具当别人问你一个问题,而你10秒内无法想出答案时,你是否会答复去网上搜索一下?当你需要编写一个格式报告如毕业论文、年终总结时,你是否会先搜索一些范例并参照编写?如果你马上要和别人就一个你不熟悉的领域进展讨论时,你是否会赶紧先搜索一把,储藏足够的背景知识,然后出动?你是否经常有这样的感觉,但凡我想到的,别人都想到了;但凡我想知道的,一定有人知道答案?当你即将前往一个陌生的地方,你是否会先翻开搜索引擎页面,查阅当地的地理人文、风俗习惯,然后再启程?2. 网络信息检索工具搜索引擎搜索引擎 自动从因特网搜集信息,经过一定整理以后,提供给用户进行查询的系统 Googlebaiduya

7、hoo除此之外,还有哪些?2. 网络信息检索工具中文常用搜索引擎国内搜索引擎百度Baidu 国内唯一商业化的全文搜索引擎,提供搜狐、新浪、263、Tom等站点的网页搜索效劳。 国内目录索引搜狐Sohu 国内三大门户之一,最早在国内推出搜索引擎收费登录效劳新浪Sina 最大的中文门户网站,同样也推出了搜索引擎收费索引工程网易Netease网易旗下搜索引擎,主要提供网页、图片、热闻、视频、音乐、博客等传统搜索效劳,同时推出海量词典、阅读、购物搜索等创新型产品。2. 网络信息检索工具英文常用搜索引擎Google 以搜索精度高、速度快成为最受欢送的搜索引擎,搜索界的领军人物。Yahoo 最著名的目录索

8、引,搜索引擎开山鼻祖之一.2. 网络信息检索工具搜索引擎只是一个索引数据库,一般没有自己的信息资源,信息的可获得性与搜索引擎无关。不过搜索引擎有时也会在数据库中存储某些信息的内容。baidugoogle2. 网络信息检索工具水平搜索引擎综合搜索引擎水平搜索引擎索引几乎所有可能内容, 包括多种类型、大量领域。在 内容类型和领域方面表现出综合性。水平搜索引擎强调信息的宽广、面对的是广泛用户的信息需求。典型的水平搜索引擎有:2. 网络信息检索工具垂直搜索引擎垂直搜索引擎 即专业或专用搜索引擎,它专门用来检索某一主题范围或某一类型信息,追求专业性与效劳深度是它的特点。 垂直搜索引擎不但可保证此领域信息

9、的收录齐全与更新及时,而且检索深度和分类细化远远优于综合搜索引擎。垂直搜索引擎的检出结果虽可能较综合搜索引擎少,但检出结果重复率低、相关性强 、查准率高,适合于满足较具体的 、针对性强的检索要求 。目前已经涉及到购物,旅游,汽车,工作,房产,交友等行业。2. 网络信息检索工具找工作的搜索引擎: google学术搜索:google图书搜索: 比价购物搜索引擎:论坛搜索引擎: 旅行TripAdvisor 图像搜索引擎:2. 网络信息检索工具综合搜索引擎的专门化趋势搜狗(Sogou) 人物、音乐、购物、图片、地图 GOOGLE 学术搜索: GOOGLE 图书搜索 AllTheWeb 能专门对图像、多

10、媒体信息。 2. 网络信息检索工具元搜索引擎元搜索引擎matesearch又称集合型搜索引擎,将多个单一搜索引擎集成在一起,提供统一的检索界面,将用户的检索提问一次搜索多个搜索引擎,并将结果返回给用户。 优点:能同时搜索多个搜索引擎,能在一定程度上提高查询的广度。 缺点:因为有时后并不能对一个搜索引擎全部查完,有时后也会漏掉一些重要信息。 例如:搜魅网someta、马虎聚搜2. 网络信息检索工具网络资源目录由人工采集网上信息,然后按照一定分类标准,比方学科类型、主题等,建立网站分类目录,并将筛选后的信息分门别类放入各类目中供用户进展浏览。1 .信息组织的专题性较强,满足族性检索要求2.使用简单

11、,只要选择相关类目,依照页面之间的超链接指引很快就能到达目的信息,适于检索不熟悉的领域或建议不熟悉网络的用户使用.优点1.人工采集信息的收录范围小,更新慢;2.受主观因素影响,类目设置不够科学,缺少规范。缺点2. 网络信息检索工具2. 网络信息检索工具信息门户学科信息门户政府信息门户 /首都之窗商业信息门户公司信息门户导航库一些疑问?搜索引擎到底有什么搜索技术?搜索引擎技术都有哪些应用?是不是也有应用实例演示?我们将进入本次课程下一个局部的学习一、Google二、Baidu三、其他谷歌 .hk “ Google 取自数学术语googol ,意思是一个1后面有100个0。意在表现该引擎“搜集和驾

12、御浩瀚无穷的网络信息的宏图。 谷歌一般搜索技术默认模糊搜索、默认拆分语句和过长的短语如何准确搜索短语搜索通配符*用法点号匹配任意字符:.布尔逻辑与:空格、AND或:OR、|非:-减号约束条件:+同义词:数字范围:.括号:()默认模糊搜索、默认拆分语句和过长的短语如何准确搜索短语搜索通配符*用法如:检索【市场*研究报告】点号匹配任意字符也可不用引号与通配符星号“*不一样的是,点号“.匹配的是字符,不是字、短语等内容。保存的字符有、(、-等 。如:【“大全.中国】布尔逻辑 布尔逻辑是许多检索系统的根本检索技术,在搜索引擎中也一样适用,在谷歌网页搜索中需要注意的是:谷歌和许多搜索引擎一样,多个词间的

13、逻辑关系默认的是逻辑“与空格。当用逻辑算符的时候,词与逻辑算符之间需要用空格分隔,包括后面讲的各种语法,均要有空格。“或OR必须大写,“非是特例,即减号必须与对应的词连在一起。对于复杂的逻辑关系,可用括号分组。如:逻辑与:【电子行业 AND 研究报告】,用空格和AND 以及小写搜索结果差异不大。此例是搜索电子行业的研究报告。 逻辑或:【电子行业 AND 研究报告 AND (人才 | 风险)】此例是搜索电子行业的人才或风险方面的研究报告。 逻辑非:【电子行业 AND 研究报告 AND (人才 | 风险) -2007】此例是搜索电子行业的人才或风险方面的研究报告,但不要2007年的。 约束条件加号

14、“+用于强制搜索,即必须包含加号后的内容。一般与准确搜索符一起应用,如:【研究报告 +学术信息资源开放目录】同义词仅限于英文搜索。一般来说,加符号会比不加搜索出来的多一些。总体来说效果不是很明显。如:搜索【PC】能搜索出Computer、windows等内容。数字范围用两个点号“.表示一个数字范围。一般应用于日期、货币、尺寸、重量、高度等范围的搜索。用作范围时最好给一定的含义。如:【格力空调 2000.2800 元】搜索价格区间。本例仅仅搜索格力空调 的价格在2000元到2800元之间的信息。 【格力空调 .2800 元】2800元以下的。 【格力空调 2800. 元】2800元以上的。 括号

15、分组逻辑组配时分组,防止逻辑混乱。括号“()是分组符号。 如:【格力空调 | 海尔空调 元 2800.】2800元以上的格力空调或者海尔空调。谷歌高级搜索语法intitle、allintitle:搜索范围限制在网页的标题 例:intitle:以德服人intext,allintext:搜索范围限制在网页中的正文中搜索 inurl、allinurl:搜索范围限制在URL 可以查找某些特定内容,比方音乐或视频。例:最炫民族风 inurl:mp3filetype:根据文件后缀搜索特定文件类型define :谷歌网页搜索中搜索定义的语法site:搜索范围限制在某网站或顶级域名中。 例:台湾 site:

16、凤凰网关于台湾的网页 intitle:搜索范围限制在网页的标题intext:搜索范围限制在网页中的正文inurl :限定搜索网址的语法。是In-系指令中最强大的一个,换句话说,这个高级指令能够直接从网站的URL入手挖掘信息,只要略微了解普通网站的URL格式,就可以极具针对性地找到你所需要的资源甚至隐藏内容。搜索图片【inurl:photo】,搜索所有网络地址中包含“photo的关键词的 页面结果。指令中的photo也可以替代为picture、image等搜索音乐【inurl:mp3 毕业生】,在所有网络地址中包含“mp3的页面中 搜索“毕业生。这个时候返回的“毕业生肯定是音乐,而不是关于“毕业

17、生的其它话题。Google中搜索音乐的另一有效方式是MP3可以替换为wma/rm等。 搜索软件【inurl:download qq】,直接查找QQ软件的下载页面。 搜索电子论文【inurl:eprint “Information Retrieval】 搜索有关Information Retrieval的电子论文通常这类搜索结果能直接下载全文。 搜索特定网站中的内容【inurl: 讲座】搜索 网 站中有“讲座的内容 filetype:根据文件后缀搜索特定文件类型这个语法非常有用,我们在网上常常要找一些范文或参考资料的时候常用这个语法。filetype是根据文件后缀搜索特定文件类型,比方支持的文档

18、有:pdf、ppt、doc、xls等;网页文件:htm、asp、php等。 如:【市场研究报告 filetype:doc】, 搜索有关市场研究报告的WORD文档。 define :谷歌网页搜索中搜索定义的语法用于搜索定义或解释。在阅读、学习、研究或撰写论文中,遇到陌生的词或缩写,可以用该语法得到确切的定义或解释。而且可以了解多种语言的定义情况。 【define:文献】得到关于文献的多个定义来源。 site:搜索范围限制在某网站或顶级域名中。 如:【医药 site:】搜索我国教育科研网中关于“医药的信息,医药院校或专业的信息等。这样能排除很多医药领域的公司信息。 混合使用搜索技术 混合搜索实例:

19、查找产业报告类的全文资料。 当然,可以直接用【产业报告】搜索,如果你掌握了一定的搜索语法知识,你可以这样搜索:【产业报告 filetype:doc】,能搜索到word格式的许多行业的产业报告文档。 而且,你还可以近一步进展限定,搜索仅2005年以来的相关内容:【产业报告 filetype:doc 2005.】。这样搜索到的信息资源并不逊色于专门的数据库。 有趣的谷歌应用谷歌每逢节假日、纪念日或重大事件,会更改首页图标以示纪念。谷歌假日图标从1999至今的链接: 百度 2000年1月由李彦宏、徐勇两人创立于北京中关村,致力于向人们提供“简单,可依赖的信息获取方式“百度二字源于中国宋朝词人辛弃疾的

20、?青玉案?诗句:“众里寻他千百度中国领先的搜索技术提供商2021年中国搜索引擎市场份额占有率中,百度占有率为:77.7%,谷歌中国占有率18.3%。 一搜就体验,精彩无极限 (视频) 搜索一下,想知道就知道(视频) 轻松一点,网络音乐随我听视频上网查一查,出行问题全解决视频 百度支持“与、“或、“非。在关键词之间插入“空格、“| 、“ - , 可指定查询串中各关键词间“与、“或、“非的关系。百度不支持AND、“ + 等符号的使用。其它搜索工具:在线翻译工具:CNKI翻译助手:金山词霸:在线和下载版爱词霸 : 海词:中文搜索引擎指南 搜索研究院 网络信息检索的根本技巧之一: 恰中选用数据资源恰中

21、选用数据资源检索工具对于信息检索而言,重要的是在检索前正确的选择数据资源。只有如此,才能保证最终检索结果在一定程度上的查全率、查准率。正确地了解、认识、熟悉各类检索系统,是恰中选用数据库的前提。 网络信息检索的根本技巧之二: 利用系统检索提示大多数计算机检索系统、网站都提供一些介绍文件,如about us关于我们、Help帮助和 FAQ经常提问的问题、 Search Tip检索提示等,仔细阅读这些文件,对于了解系统的设计、数据库覆盖的范围、检索的具体要求都非常重要。不要因为追求检索的速度而无视了这一环节。网络信息检索的根本技巧之三: 充分利用检索条件在使用大型期刊文献数据库时,由于有完善的检索

22、功能,应充分应用布尔逻辑检索方法,选择利用各种检索入口,设计合理完善的检索式。有些信息检索系统,常常提供检索的表达条件或检索限制,使用时只需从给定的条件中选择需要的工程即可,如查找的年代、资料的类型、是否需要全文等。正确选择各项内容,让计算机较好地理解用户的检索意图是十分必要的。通过这些选项,计算时机更加准确地把检索结果呈现出来。 网络信息检索的根本技巧之四: 选择恰当的检索词选择查询词是一种经历积累,在一定程度上也有章可循: 表述准确:网站或数据库会严格按照您提交的查询词去搜索,因此,查询词表述准确是获得良好搜索结果的必要前提。一类常见的表述不准确情况是,脑袋里想着一回事,搜索框里输入的是另

23、一回事。另一类典型的表述不准确,是查询词中包含错别字。 查询词的主题关联与简练。 目前的搜索引擎并不能很好的处理自然语言。因此,在提交搜索请求时,您最好把自己的想法,提炼成简单的,而且与希望找到的信息内容主题关联的查询词。 如某三年级小学生,想查一些关于时间的名人名言 他的查询词是“小学三年级关于时间的名人名言。 这个查询词很完整的表达了搜索者的搜索意图,但效果并不好。可改为:“时间 名人名言或“时间名言。网络信息检索的根本技巧之五: 恰中选用搜索引擎了解和掌握主题式、目录式搜索引擎,、多元搜索引擎的不同检索功能,而后根据自己的检索需求,选择恰当的搜索引擎,以期得到满意的检索结果。网络信息检索的根本技巧之六: 掌握扩检和缩检方法信息检索过程是不断调整检索策略的过程,也是进展扩检或缩检的过程。当检索结果中相关信息或所需要的信息太少或没有时,需要进展扩检,反之就需要进展缩检。 扩检主要方法(一多搜索引擎、多库检索 据有关资料介绍,目前国外大型搜索引擎在Web上

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论