版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、搜索引擎使用技巧专题讲座网络学术信息资源检索工具 搜索引擎搜索引擎概述常用搜索引擎介绍及示例搜索引擎概述所谓搜索引擎,是基于WWW的信息处理系统,是对网络资源进行标引和检索的工具。它通过一定的机制和方法对网络信息进行搜索,将搜索的信息进行理解、提取、组织和处理,由索引器建立索引,并储存于可供检索的大型数据库中。当用户输入检索提问时,搜索引擎会告知包含这个检索提问的所有网址,并提供通向该网址的链接点。搜索引擎是用来对网络信息资源管理和检索的一系列软件,是一种在INTERNET上查找信息的工具。含义主题搜索引擎(基于Robot的搜索引擎)目录式(Directory,也叫做Catalog搜索引擎)元
2、(Meta)搜索引擎搜索引擎概述类型主题搜索引擎所谓基于Robot的搜索引擎是指利用一个称为Robot(也叫做Spider、Web Crawler或Web Wanderer)的程序自动访问Web站点,提取站点上的网页,并根据网页中的链接进一步提取其它网页,或转移到其它站点上的搜索引擎。Robot搜集的网页被加入到搜索引擎的数据库中,供用户查询使用Internet上最早出现的搜索引擎就是利用Robot来建立数据库,“搜索引擎”这个词的原义也只是指这种狭义上的基于Robot的搜索引擎含义主题搜索引擎工作原理三个主要构成部分 网页等级计算公式RobotIndex搜索软件目录式搜索引擎这种搜索引擎是以
3、人工方式或半自动方式搜集信息,由编辑人员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面向网站,提供目录浏览服务和直接检索服务目录的用户界面基本上都是分级结构,首页提供了最基本的几个大类的入口,用户可以一级一级地向下访问,直至找到自己感兴趣的类别,另外,用户也可以利用目录提供的搜索功能直接查找关键词含义与Robot搜索引擎的区别:人工建立索引数据库分类浏览与关键词查询相结合检索结果更具参考价值目录式搜索引擎元搜索引擎Meta搜索引擎也叫做Multiple Search Engine,它的特点是本身并没有存放网页信息的数据库,当用户查询一个关键词时,它把用户的查询请求
4、转换成其它搜索引擎能够接受的命令格式,并行地访问数个搜索引擎来查询这个关键词,并把这些搜索引擎返回的结果经过处理后再返回给用户对于返回的结果系统会进行重复排除、重新排序等处理后,作为自己的结果返回给用户服务方式为面向网页的全文检索严格意义上来讲,Meta搜索引擎只能算是一种用户代理,而不是真正的搜索引擎搜索引擎的检索方法布尔逻辑检索截词检索字符串检索字段检索位置检索常用检索技术模糊查询与精确查询通配符和标点符号逻辑条件限制And/Or/Not范围限制分类范围、地域范围、时间范围、网站类型范围等搜索引擎的检索方法常用检索功能常用搜索引擎介绍及示例Google(中文)网址:概述特点检索功能使用时应
5、主意的问题Google概述Google是由美国斯坦福大学的两位博士生拉里佩吉和谢尔盖布林于1998年创建的其优势在于掌握的信息量以及检索模型和检索速度。它可为世界各地的用户提供适需的搜索结果,而且搜索时间通常不到半秒Google采用全文标引方式,提供每日更新。现在,Google可以查询的网页达40多亿个,每天需要提供 2 亿次查询服务Google 的查询界面设置搜索偏好,包括每个网页上默认的搜索结果数量、界面语言,以及查询语言直接进入最符合搜索条件的网页Google的其它版本Google特点支持多达132种语言提供40多亿个搜索网页,涵盖内容齐全搜索速度快结果命中率高搜索结果摘录查询网页的部分
6、具体内容,而不仅仅是网站简介智能化的“手气不错”功能,提供可能最符合要求的网页“网页快照”功能,能从Google服务器里直接取出缓存的网页Google检索功能基本检索:(布尔检索功能)逻辑“与”:检索框中的两个关键词之间用空格隔开则默认为是“AND”(“与”运算)连接逻辑“非”:用“”(减号)表示,同时要求在减号前保留一个空格逻辑“或”:用“OR”表示双引号、连字号、斜线、问号、等号、省略号都可以作为短语的连接符号查找名言或专有名词指定网域:利用site:可以在某个特定的网站或域中进行搜索指定文件类型:filetype:文件类型,可以在一类文件中进行搜索,比如,filetype:pdf, fi
7、letype:ppt等逻辑与功能逻辑非功能逻辑或功能专用语查询功能“ ”、“-”、“”、“+”、“=”、“,”“”指定网域指定文件类型检索功能基本检索其它检索语法搜索的关键词包含在URL链接中:inurl:搜索的关键词包含在网页标题中:intitle:搜索的关键词包含在网页的“锚”中:inanchor: 或allinanchor:搜索所有链接到某个URL的网页:link:Google检索功能高级检索功能可以排除某个特定站点的网页(限定网域)可以对检索结果页面的语言类型进行限制(限定语种)可以限定检索结果的时间范围(更新日期)可以限定关键词出现的位置(字词位置)可以检索链向某一个网页的所有页面(
8、键连功能)可以检索与某一个网页相关的所有网页(相似网页检索)高级检索界面高级检索示例输入检索条件高级检索示例检索结果Google检索功能图像检索Google 分析页面上图像附近的文字、图像标题以及许多其它元素来确定图像的内容。Google 还使用复杂的算法来删除重复的内容,并确保在搜索结果中首先显示质量最好的图像目前可以搜索超过10亿张图像可以搜索特定类型的图像图像搜索时可以使用布尔逻辑算符和google的其它检索命令点击进入图像搜索Google检索功能网页快照如果原地址打开很慢,那么可以直接查看Google缓存页面,因为Google服务器速度极快 如果原链接已经死掉或者因为网络的原因暂时链接
9、不通,那么可以通过网页快照看到该页面信息。当然,快照内容不是该页最新页面如果打开的页面信息量巨大,一下子找不到关键词所在位置,那么可以通过网页快照,因为快照中Google用黄色表明关键字位置Google检索功能集成化的工具条为了方便搜索者,Google提供了工具条,集成于浏览器中,用户无需打开Google主页就可以在工具条内输入关键字进行搜索工具条还提供了许多其它功能,如显示页面PageRank等。最方便的一点在于用户可以快捷的在Google主页、目录服务、新闻组搜索、高级搜索和搜索设定之间切换。安装Google的工具条,可以访问“http:/”,按页面提示可以自动下载并安装点击下载Googl
10、e使用时应注意的问题Google不区分英文字母的大小写,所有字母均作小写对待。例如:输入“george washington”(乔治华盛顿),或是“George Washington”, 再或是“gEoRgE wAsHiNgToN”,结果都是一样的通配符问题。Google对通配符的支持有限,只能用“*”代替单个字符,而且必须将检索词用引号引起来,如“以*治国”搜索引擎忽略的字符与强制检索。Google对一些出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略处理。如果检索词中包含这些字符,必须进行强制检索,在这些字符前后用“+”,如“+www+的历
11、史”,或用英文的引号强制搜索学术搜索引擎百度网址:概述检索技巧百度简介1999年底,百度由李彦宏先生和徐勇先生于美国硅谷创建。2000年百度回国发展。百度在中国各地和美国均设有服务器,搜索范围涵盖了中国大陆、香港、台湾、澳门、新加坡等华语地区以及北美、欧洲的部分地点。百度搜索引擎拥有目前世界上最大的中文信息库,总量达到3亿页以上,并且还在以每天几十万页的速度快速增长,百度搜索引擎具有高准确性、高查全率、更新快以及服务稳定的特点,因此深受网民的喜爱。 1、百度快照 每个被收录的网页,在百度上都存有一个纯文本的备份,称为“百度快照”。百度只保留文本内容,所以,那些图片、音乐等非文本信息,快照页面还
12、是直接从原网页调用。如果您无法连接原网页,那么快照上的图片等非文本内容,会无法显示。 例:“金庸”中国文艺金庸特辑花2元拿下金庸力作?李亚鹏将演“傻郭靖”(图) 金庸小传:金庸一生大事记 金庸传奇:详细介绍金.金庸剧场:收集根据金庸作品改编的电视剧的剧照、主题曲及相关评论 精彩推荐 金庸和夏梦的精神恋 金庸剧. / 12K 2006-5-21 - 百度快照 2、相关搜索搜索结果不佳,有时候是因为选择的查询词不是很妥当。您可以通过参考别人是怎么搜的,来获得一些启发。百度的“相关搜索”,就是和您的搜索很相似的一系列查询词。百度相关搜索排布在搜索结果页的下方,按搜索热门度排序。 下面是“小说”的相关
13、搜索。点击这些词,可以直接获得他们的搜索结果。 相关搜索 武侠小说玄幻小说网络小说小说阅读网网游小说小说下载小说网小说频道小说天下更多相关搜索.3、拼音提示 如果只知道某个词的发音,却不知道怎么写,或者嫌某个词拼写输入太麻烦,该怎么办? 百度拼音提示能帮您解决问题。只要您输入查询词的汉语拼音,百度就能把最符合要求的对应汉字提示出来。它事实上是一个无比强大的拼音输入法。 拼音提示显示在搜索结果上方。如,输入“zhurongji”,提示如下:您要找的是不是: 朱鎔基4、错别字提示 由于汉字输入法的局限性,我们在搜索时经常会输入一些错别字,导致搜索结果不佳。别担心,百度会给出错别字纠正提示。错别字提
14、示显示在搜索结果上方。如,输入“唐醋排骨”,提示如下:您要找的是不是: 糖醋排骨。5、英汉互译词典 百度还有线上英汉互译词典?没错。 随便输入一个英语单词,或者输入一个汉字词语,留意一下搜索框上方多出来的词典提示。如,搜索“apple”,点击结果页上的“词典”链接,就可以得到高质量的翻译结果。百度的线上词典不但能翻译普通的英语单词、词组、汉字词语,甚至还能翻译常见的成语!您也可以通过 百度词典搜索 界面(http:/) ,直接使用英汉互译功能。 6、计算器和度量衡转换 1、计算四则运算 35*82-(32+11)2、公式计算 log(sin(5)2)-3+pi换算数量换算前单位?换算后单位 3
15、、单位换算 1海里?公里7、专业文档搜索 很多有价值的资料,在互联网上并非是普通的网页,而是以Word、PowerPoint、PDF等格式存在。百度支持对Office文档(包括Word、Excel、Powerpoint)、Adobe PDF文档、RTF文档进行的全文搜索。要搜索这类文档,很简单,在普通的查询词后面,加一个“filetype:”文档类型限定。“Filetype:”后可以跟以下文件格式:DOC、XLS、PPT、PDF、RTF、ALL。其中,ALL表示搜索所有这些文件类型。例如,查找张五常关于交易费用方面的经济学论文。“交易费用 张五常 filetype:doc”,点击结果标题,直接
16、下载该文档,也可以点击标题后的“HTML版”快速查看该文档的网页格式内容。 您也可以通过 百度文档搜索 界面(http:/) ,直接使用专业文档搜索功能。 8、股票、列车时刻表和飞机航班查询在百度搜索框中输入股票代码、列车车次或者飞机航班号,您就能直接获得相关信息。例如,输入深发展的股票代码“000001”,搜索结果上方,显示深发展的股票实时行情。 也可以在百度常用搜索(http:/life/)中,进行上述查询。9、高级搜索语法把搜索范围限定在网页标题中intitle网页标题通常是对网页内容提纲挈领式的归纳。把查询内容范围限定在网页标题中,有时能获得良好的效果。使用的方式,是把查询内容中,特别
17、关键的部分,用“intitle:”领起来。例如,找林青霞的写真,就可以这样查询:写真 intitle:林青霞注意,intitle:和后面的关键词之间,不要有空格。高级搜索语法把搜索范围限定在特定站点中site有时候,您如果知道某个站点中有自己需要找的东西,就可以把搜索范围限定在这个站点中,提高查询效率。使用的方式,是在查询内容的后面,加上“site:站点域名”。例如,天空网下载软件不错,就可以这样查询:msn site:注意,“site:”后面跟的站点域名,不要带“http:/”;另外,site:和站点名之间,不要带空格。 高级搜索语法把搜索范围限定在url链接中inurl网页url中的某些信
18、息,常常有某种有价值的含义。于是,您如果对搜索结果的url做某种限定,就可以获得良好的效果。实现的方式,是用“inurl:”,后跟需要在url中出现的关键词。例如,找关于photoshop的使用技巧,可以这样查询:photoshop inurl:jiqiao上面这个查询串中的“photoshop”,是可以出现在网页的任何位置,而“jiqiao”则必须出现在网页url中。注意,inurl:语法和后面所跟的关键词,不要有空格。高级搜索语法精确匹配双引号和书名号如果输入的查询词很长,百度在经过分析后,给出的搜索结果中的查询词,可能是拆分的。如果您对这种情况不满意,可以尝试让百度不拆分查询词。给查询词加上双引号,就可以达到这种效果。例如,搜索 上海科技大学 ,如果不加双引号,搜索结果被拆分,效果不是很好,但加上双引号后,“上海科技大学”,获得的结果就全是符合要求的了。 书名号是百度独有的一个特殊查询语法。在其他搜索引擎中,书名号会被忽略,而在百度,中文书名号是可被查询的。加上书名号的查询词,有两层特殊功能,一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分。 书名号在某些情况下特别有效果,例如,查名字很通俗和常用的那些电影或者小说
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论