版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
关于常用搜索引擎使用技巧搜索引擎可分为三种目录式搜索引擎(网站):
雅虎、搜狐、网易全文式搜索引擎(网页):Google、百度、天网(FTP)元搜索引擎第2页,共59页,2024年2月25日,星期天目录索引搜索引擎的使用Yahoo!的创建原理以主题为基础,分类主题目录是其最大的特点,作为目录型搜索工具的典范,Yahoo!在主题分类、目录结构方面具有代表性。它将网络资源按内容分为14个大类,每个总类下又链接多个小类,逐级链接,最后与网页、新闻组等相连接。用户可以借助高质量的主题分类目录,选择自己所需要的主题类目,通过点击超级链接进入各层,从而找到需要的信息。“雅虎中国”()提供了一份细蜜、层次丰富的中文网站分类目录。第3页,共59页,2024年2月25日,星期天全文搜索引擎全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google、国内著名的有百度(Baidu)等。它们都是通过从互联网上提取的各个网站的信息,以网页文字为主,搜索出与用户查询条件相匹配的记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎。第4页,共59页,2024年2月25日,星期天元搜索引擎万纬搜索引擎是最有名的中文元搜索引擎。万纬中文集成搜索引擎包括了5个英文搜索引擎Argos、Google、hotbot、northernLight、Yahoo和7个中文搜索引擎如网典、新浪、雅虎(中文)、搜狐、天网、悠游搜索。用户可根据需要自由选择其中最多6个引擎进行同步搜索,搜索结果可按相关度、时间、域名和引擎分类。第5页,共59页,2024年2月25日,星期天第6页,共59页,2024年2月25日,星期天学会利用搜索引擎
记得1996年夏季的时候,当我第一次接触Internet,便被扑面而来的魔力征服了。那种天涯咫尺的感觉,真是妙不可言。在经历了疯狂的WWW冲浪和如痴如醉的BBS沉迷之后,我意识到Internet对我影响至深的还是学习方式的变迁。如何来描述这种变迁呢?当社会处于初级阶段,,人们靠口传身授、背诵记忆,尚能从容地进行知识的传授、吸收和应用。这种学习方式造就了很多“才高八斗,学富五车”的大才子。但是,随着社会的发展和进步,现在的世界早就不是“四书五经”的年代了,仅靠“皓首穷经,博闻强记”一类的古老的方式已无法有效地吸收所需要的知识信息了。人们确实非常需要一种在较短的时间内获得较多、较全、较新的知识或信息的工具。第7页,共59页,2024年2月25日,星期天学会利用搜索引擎
比方说,我们到了大型的图书馆,往往有一种不知所措的感觉。目的明确的去学习,即先知道要学什么,然后有目的的去寻找答案,这种新的方式看上去才更加有效率。我们不妨把这称为“即学式”,相应的,旧的称为“预学式”。第8页,共59页,2024年2月25日,星期天学会利用搜索引擎
不过,“即学式”的实施是有前提的。首先,要求学习者拥有一个包罗万象的信息库,以供随时抽取各种目的信息;其次,是需要一个强劲的信息检索工具,以便高效率的从信息库中提取信息。很明显,
Internet可以充当那个海量的信息库,而搜索引擎——
则正是寻找光明之火的绝好工具。“公欲善其事,必先利其器”。Internet只有一个,而搜索引擎则有N
个。不同的搜索引擎,搜索结果不尽相同。第9页,共59页,2024年2月25日,星期天学会利用搜索引擎
老鸟和菜鸟的区别,往往只是在于会不会利用资源,搜索引擎是很重要的手段。别看很多老鸟好像从来不提问题,而且还能回答新人的问题,好像他们什么都懂似的,其实他们并没那么厉害,只不过完全可以通过自己的搜索找到答案,所以不需要提问……有搜索高手说,所谓搜索,就是“在正确的地方使用正确的工具和正确的方法寻找正确的内容”。第10页,共59页,2024年2月25日,星期天网络资源查询
小李正在准备一份介绍海口城市概况和近几年发展的多媒体材料,打算为国外来的同行作报告用。小李应该怎样在网上查找呢?
在没有互联网的时代,面对这样的一项工作,仅仅资料的收集可能就要花上好多天的时间。幸运的是,我们现在有了网络。但是,您千万别以为有了网络,有了网络资源搜索工具,一切都会迎刃而解,万事大吉!第11页,共59页,2024年2月25日,星期天网络资源查询
原来,小李自以为很简单,他在Google搜索引擎中使用“海口”提问关键词进行了检索,结果怎样呢?返回的结果约有1450000条,上百万呢!小李简直不敢相信自己的眼睛。他想,再试试“Yahoo”吧。他仍然利用“海口”这一提问关键词在Yahoo!中进行搜索,结果会使他满意吗第12页,共59页,2024年2月25日,星期天网络资源查询当然不会啦!小李同样陷入几千个相关网站和上百万个网页的信息沼泽之中。这时,小李有点不知所措了,他甚至有点怀疑是否选错了搜索引擎。第13页,共59页,2024年2月25日,星期天提示:网络资源搜索的第一步不是选择搜索引擎,而是分析提问内容,从提问内容中提取最能表达提问主题的若干个关键词,再将这些提问关键词组合成最适合表达提问内容的提问表达式。
内容----关键词---表达式第14页,共59页,2024年2月25日,星期天网络信息检索
小李可能也意识到返回的结果与他想得到的结果之间的巨大差距,他仔细查阅了这些返回的结果,发现其中含有大量的大学院校、医院等众多不需要的信息。于是,他利用这两个搜索引擎提供的布尔逻辑功能进行检索。
第15页,共59页,2024年2月25日,星期天布尔逻辑
在检索中,检索提问涉及的概念往往不止一个,而是同一个概念涉及多个同义词或相关词,为了准确表达检索提问,必须使用逻辑算符将不同的检索词组配起来。常用布尔检索。第16页,共59页,2024年2月25日,星期天逻辑或检索式AORB
检索式A+B逻辑“或”是并列概念关系的一种组配,通常用运算符为“OR”或“+”表示,能够扩大检索结果,运算结果是阴影部分例:周恩来OR周总理少年or儿童至少要有一个出现在记录中AB第17页,共59页,2024年2月25日,星期天逻辑与检索式AANDB
A*B
是具有概念交叉关系和限定关系的一种组配。可缩小检索范围,提高查准率。
如:①感冒AND咳嗽②大学生AND心理障碍③市场经济AND诚信(有“市场经济”同时有“诚信”,运算结果是阴影部分)。
表明结果必须同时含有A和B才为命中,指必须出现在同一个记录中。ABABC第18页,共59页,2024年2月25日,星期天逻辑非检索式ANOTB
A-B
表达检索词间的排除关系。可缩小检索范围,提高查准率,运算结果是阴影部分。例:①学生NOT小学生②微量元素NOT
锌③能源NOT
核能AB第19页,共59页,2024年2月25日,星期天布尔逻辑算符查询时用的()+-*?!均为半角!但是我们可以根据需要用括号改变执行顺序。第20页,共59页,2024年2月25日,星期天例:政治经济学and于光远政治经济学*于光远表示检索出来的文献既含“政治经济学”同时又含“于光远”的文献。ABAandB或A*BABAorB或A+B例:政治经济学or于光远政治经济学+于光远表示含有“政治经济学”、“于光远”、“政治经济学”和“于光远”均为命中文献。第21页,共59页,2024年2月25日,星期天提示:
搜索引擎在收录内容、检索功能等方面各有千秋,使用者应仔细阅读系统帮助文件,根据自己的特定检索需求合理地选择搜索引擎。命令式检索使用特定的操作命令来实施检索,一般每个系统都有自己特定的指令系统。每个搜索引擎提供的检索功能和检索特性是不一样的,同一种检索功能在每个搜索引擎中表达方式和使用方法也是不尽相同的。(确切地知晓每一种搜索引擎的检索功能与特性,无需死记硬背。只要在使用时,查看帮助信息便是了)。第22页,共59页,2024年2月25日,星期天检索语法小李立即在Google、Yahoo中分别用:海口-大学-医院海口NOT大学NOT医院果不出所料,返回的记录已减少了很多!然而,Google仍然有46300项之多,。怎么办呢?
第23页,共59页,2024年2月25日,星期天检索语法
看来仅仅依靠逻辑“非”功能是远远不能达到预期目标的,小李不得不调整检索关键词。经过仔细分析,他觉得向国外公司的同行介绍的内容应该为海口的一般性的介绍,使用“海口”和“概况”这两个关键词也许更切合提问主题。赶紧试试看!小李立即在Goggled中输入:海口概况结果怎么样呢?
第24页,共59页,2024年2月25日,星期天提示:
在分析提问内容时,需细化提问内容的主题,提取多个符合提问内容的关键词,这样,可以获得较有效的检索结果。小李第一次搜索失败的原因正是在于使用了“海口"这样一个太宽泛的提问关键词。
????第25页,共59页,2024年2月25日,星期天什么是关键词?关键词,就是您输入搜索框中的文字,也就是您命令搜索引擎寻找的东西。
您可以命令搜索引擎寻找任何内容,所以关键词的内容可以是:人名、网站、新闻、小说、软件、游戏、星座、工作、购物、论文……
而那些对文献主题无实质意义的词汇,如冠词、介词、连词、某些副词以及某些形容词均不能做关键词。(禁用词表)第26页,共59页,2024年2月25日,星期天关键词法一般不编关键词表,而是相反,编制“非关键词表”或称禁用词,如:aasbutfromheinofthatwasyouanatbyhadherisonthiswhich&arebeforhavehisitortowith第27页,共59页,2024年2月25日,星期天
关键词的选择技巧
我们了解常规搜索方式,但每个人都会搜索出不同结果,为什么?核心问题在于关键词选择不同。在当今互联网上,你永远不会愁你找不到东西,而是东西太多,你无法找到你需要的东西,因此搜索效率便成为最重要的一环,搜索效率直接关系到搜索的关键词的选择。第28页,共59页,2024年2月25日,星期天中文分词
中文搜索引擎,跟英文搜索引擎最大的区别是分词。因为英文的单词与单词之间是天然分隔的,而中文是按句写的,字与字之间是没有间隔的。例如:跳迪斯科
“跳”
“迪”
“斯”
“科”
“跳”
“迪斯科”第29页,共59页,2024年2月25日,星期天谁说牛奶不如果汁好喝
理解了搜索引擎的分词,了解了用“眼镜”很可能搜索不到“眼镜蛇”,用“海参”很可能搜索不到“海参崴”,用“异性”很可能搜不到“相异性”,搜索者就可以更有效地选择关键词了。第30页,共59页,2024年2月25日,星期天关键词的分析必须保证三点
一是注意专业性:
不使用过于通俗简单的词语,比如,你想查找有关降雨量方面的信息,虽然它属于天气方面的,但如果你输入的是“天气”,就会返回大量与天气有关的信息,而结果中充斥大量无关的信息,但如你直接输入“降雨量”,就会获得比较满意的结果。
第31页,共59页,2024年2月25日,星期天
二是具有代表性:
要注意一词多意的问题,很多词具有一词多意的特性。比如,笔记本,可以指用来手写的本子,现在也作为笔记本电脑的简称。遇到这类词,可能需要在搜索框中输入尽量减少歧义的词语,比如改输入笔记本电脑。第32页,共59页,2024年2月25日,星期天往往同一件事情或事物,不同作者喜欢用不同的词来表达,这就造成了庞大的同义词,如果偏偏你头脑中的“同义词”不是那么全,造成漏检就不足为怪了。例:艾滋病——艾滋病、爱滋病碳纤维——碳纤维、炭纤维三注意使用“同义词”第33页,共59页,2024年2月25日,星期天提示
大多数的搜索引擎都是采用相关度来对检索结果进行排序的,最终结果都是与提问关键词相关程序最大的命中记录排在前。所以,仔细查阅前10-20个记录,可以基本满足需求。第34页,共59页,2024年2月25日,星期天《跨国公司经营管理研究》跨国公司的同义词有:
跨国企业跨国经营国际化经营等1、分析检索课题、选择概念表达词
(1)注意选择同义词和相关词第35页,共59页,2024年2月25日,星期天《论中国特色的社会保障制度》
社会保障的相关词是:
社会保险社会救助社会福利等第36页,共59页,2024年2月25日,星期天(2)注意适当控制检索词的内涵与外延
例:《跨国公司经营管理研究》
如以跨国公司和经营管理作为检索词,将会漏掉一些文章,因为有些文献题名对跨国公司经营管理的表述并没有“经营管理”一词。像跨国公司的营销管理、跨国公司的质量管理、跨国公司的财务管理、跨国公司的不动产管理、跨国公司的流动资产管理等等,所以“管理”一词,则可保证最大限度的查全率。第37页,共59页,2024年2月25日,星期天字段限定检索技术(fieldlimit)
限定检索:为了提高检索的查准率,缩小检索的范围,将检索词限定在特定的字段中进行检索。限定字段通常包括:
题名作者机构关键词主题词分类号出版社出处(刊名、卷期)文摘URL主机域名Usenet新闻组TI---篇名AB---文摘SH---主题词AU---著者Cs---著者单位DT---文献类型JN---期刊名LA---语种PY---年份
CC---分类号
KW---关键词
常用检索字段符第38页,共59页,2024年2月25日,星期天逻辑算符的组合使用方法
(构造检索提问式是计算机信息检索的关键)
如检索题“跨国公司经营管理研究”:
提问式1:(跨国公司+跨国企业+跨国经营)×管理=检索结果90篇
提问式2:(跨国公司+跨国企业+跨国经营)×管理×(1997+1996)=检索结果35篇
第39页,共59页,2024年2月25日,星期天题“论中国特色的社会保障制度”:
提问式1:(社会保障制度+社会保险制度)×(我国+中国)×(PY=1997+PY=1996)=检索结果99篇提问式2:(社会保障制度+社会保险制度+养老保险+医疗保险+失业保障)×(我国+中国)×(PY=1997+PY=1996)×G=中国=检索结果160篇扩展检索的方法:
概念的扩大;范围的扩大;增加同义词;年代的扩大。例如:检索与“汽车营销”相关的信息提问式1:汽车营销提问式2:汽车营销+汽车构造+汽车保险+汽车修复+汽车美容+汽车整形+汽车理赔第40页,共59页,2024年2月25日,星期天使用搜索引擎常见错误:
经常有网友抱怨搜索引擎实在太烂,什么东西都找不到。其实并不是搜索引擎有问题,而是你的使用方法有待商妥。常见错误1——
输入错别字
当你感觉某种内容网上应该有很多相关内容,但搜索到的确是寥寥无几的几个时,这时你就应该看看是不是输入的关键词有错别字了。如想找“星际争霸”的相关内容,而你输入了“星际争吧”、“星及争霸”、“星际争罢”等,还有“刘得华”、“以德制国”之类的,这样的关键词就会搜索不到有用的资料。第41页,共59页,2024年2月25日,星期天常见错误2——
滥用多义词
如我们搜索“Java”,搜索引擎是不能象我们一样理解多义词的,搜索到的结果既是太平洋上的一个岛、又是一种著名的咖啡、还是一种计算机语言,这样得到的搜索结果就很杂乱。如果我们用多个关键词或其他词语代替多义词作为搜索关键词,像用“爪哇印尼”
“爪哇咖啡”
“Java语言”分别来搜索我们不同的需要,这样就会得到比较满意的结果。
第42页,共59页,2024年2月25日,星期天常见错误3——不拆分关键词如我们输入“广州到北京的列车时间表”、“广州日报在广州的发行情况”、“刘德华今年多大了”等,使用这些关键字就好比你把搜索引擎当成了一个服务员问话一样,搜索引擎只是机械,它只会把含有这个关键词的网页找出来,根本不管你网页上的内容是什么。如果我们使用:“广州北京列车时刻表”、“广州日报发行”这样去搜索就会好的多。
第43页,共59页,2024年2月25日,星期天常见错误4:
滥用搜索引擎
一般的搜索引擎对动态内容,如:论坛和数据库内容的网页检索能力较弱,所以这类信息也不适合用一般的搜索引擎搜索,而是应该去专用网站寻找。搜索引擎并不是万能的,有时候我们需要查找的资料找不到原因是:搜索引擎从抓取网页、解析、索引到提供检索是有一定周期的,信息滞后的周期从一周到一月不等。如每四年一次奥运会,大家最关心的是随时知道中国获得了几块金牌,这时专业的新闻网站才是你的正确选择。
第44页,共59页,2024年2月25日,星期天检索策略的优化:细化即缩小检索范围主题细化,或者用主题词表、索引词表选择更专指的主题词或关键词通过浏览结果选择更专指的词运用算符and,not等限制或排除指定字段检索从年代和地理及语言、文献类型上限制窍门1第45页,共59页,2024年2月25日,星期天检索策略的优化:扩展对已确定的检索词进行其同义词、同义的相关词、缩写和全称检索,保证文献的检全率,防止漏检利用系统的助检手段和功能,有的系统提供树形词表浏览,使我们可以用规范词、相关词、更广义的上位词进行扩展。利用论文所征引的参考文献,当找到和课题相关的论文时,可参考其所征引的参考文献。使用运算符OR或截词符“*”、“?”等进行扩展检索窍门2第46页,共59页,2024年2月25日,星期天窍门3学会强制搜索:
用句子做关键词,必须加英文引号(注意:不使用过长的词组或短语)。
例1:搜索《再别康桥》英文译稿关键词要用“再别康桥+Cambridge”(康桥的英文单词)。注意:本例中的关键词用“再别+Cambridge”,这也是查找英文译稿或其他翻译文章的重要方法。
例2:给关键词加””(要是半角的哦),可以进行不分散型查询。如“伊拉克战争爆发”,在查询到的文档中将作为一个整体出现。“”第47页,共59页,2024年2月25日,星期天第48页,共59页,2024年2月25日,星期天第49页,共59页,2024年2月25日,星期天调整检索策略什么是“检索策略”,就是全盘计划与方案,检索词可以是:①单一词汇(简单检索),例如:电子商务、图书馆、mp3等。会寻找合适的检索词并分解到最小的检索点。②一个以上的词汇(词组检索),会用布尔逻辑或其他策略将他们结合起来。③一句完整的话(语句检索),如,目前全台湾上网人口有多少?1976年历史上发生了什么事?你就应该?第50页,共59页,2024年2月25日,星期天缩小检索范围,提高查准率的方法:1、使用and、not等限制检索范围;2、减少同义词与相关词;3、选择检索范围较小的字段4、使用二次检索;5、使用下位词;6、使用精确检索,如对于固定短语来说可用英文“”引起来。扩大检索范围,提高查全率的方法:1、选用同义词或近义词、相关词
,使用布尔逻辑符or连接;2、减少逻辑“与”的使用,丢掉一些太专指的概念;3、选择较大检索范围的字段如摘要;4、使用截词符;5、使用上位词(如飞行器航天飞机载人航天飞机)。检索策略第51页,共59页,2024年2月25日,星期天检索实例主题1:
第二次世界大战中的美国政治和军事领导人
检索步骤(分析主题逻辑关系):
1)、政治领导人或军事领导人
2)、(政治领导人或军事领导人)和美国
3)、(政治领导人或军事领导人)和美国和第二次世界大战
第52页,共59页,2024年2月25日,星期天网上信息检索实例2查询某地区电子企业的财务信息a:未知IP地址,利用搜索引擎Yahoo,输入http://www.Yahoo.Comb:选择electronics(电子行业)c:输入
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2023年自考市场营销学练习题及答案
- IPSec VPN网络连接协议
- 2023年注册岩土工程师考试题库
- 2023年注册土木工程师(水利水电)真题(含答案)
- 泉州华光职业学院《管理模型与决策基础》2023-2024学年第一学期期末试卷
- 泉州工艺美术职业学院《电影中的教育学》2023-2024学年第一学期期末试卷
- 学校澡堂维修合同范例
- 2023年注安考试原题案例分析试题
- 曲靖师范学院《大型数据库设计》2023-2024学年第一学期期末试卷
- 曲阜远东职业技术学院《信息技术在农业上的应用》2023-2024学年第一学期期末试卷
- 个体诊所药品清单
- 国网基建国家电网公司输变电工程结算管理办法
- 深度学习数学案例(课堂PPT)
- 中国地图含省份信息可编辑矢量图
- 卧式钻床液压系统设计课件
- 路政运政交通运输执法人员考试题库
- 水库维修养护工程施工合同协议书范本
- MS培养基及配制注意事项
- 企业技术标准化管理
- 投资学第19章财务分析stu
- 已有输华贸易的国家(地区)及水产品品种目录
评论
0/150
提交评论