下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
浅谈网络环境下搜索引擎使用技术
关键词网络信息检索搜索引擎一、前言随着Internet的迅速发展,网上信息正以爆炸性的速度增长,其资源内容几乎涉及所有领域,已经成为知识、信息的集合体,是人们获取信息的基本工具。在Internet网上进行浏览和检索,就好比进入了世界上最大的图书馆,而这个图书馆里的书刊、杂志、广告、新闻及各种形式的文献信息全都没有规律地排放着,没有一个中心目录将这些信息组织起来。正是因为Internet资源既丰富又分散且处于无序状态,使得人们在网上查找自己所需的信息并非易事。这时为满足人众信息检索的需求,搜索引擎便应运而生。搜索引擎是指使用某些自动索引软件来发现、收集网络上的信息,然后对收集的网页进行标引,建立一个可供查询的大型数据库。Intemet提供了多种不同的检索工具,它们各自有各自的数据库、语言、检索功能和显示方式,对用户来说,最重要的就是熟悉这些工具的性能,掌握检索技巧,提高检索的命中率。二、搜索引擎的工作原理搜索引擎的工作原理可以简单概括为:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。从互联网上抓取网页利用能够从互联网上自动收集网页的Spider(又名为:Robot,Crawler,Worms,Wanders)系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。建立索引数据库由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。在索引数据库中搜索排序当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。最后由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。说到这里,网络搜索引擎的基本工作原理基本上让大家了解了。三、检索技巧(一)科学选择关键词。由于搜索引擎智能化程度的影响,它只能在现存的数据库中查找匹配的关键词,因此,这种匹配相对比较盲目,我们在选择关键词时,要注意两方面的问题,才有可能得到较好的搜索效果。(二)使用双引号进行精确查询。如果查找的是一个词组或多个汉字,最好的办法就是将它们用双引号括起来,这样得到的结果最少、最精确。(三)使用加号(+)、减号(一)限定查找。很多搜索引擎都支持在搜索词前冠以加号(+)限定搜索结果中必须包含的词汇,用减号(一)限定搜索结果不能包含的词汇。(四)灵活运用使用通配符。很多搜索引擎支持通配符号,如“*”代表一连串字符,“?”代表单个字符。(五)使用逻辑词辅助查找。比较大的搜索引擎都支持使用逻辑词进行更复杂的搜索界定,常用的有:AND(和)、OR(或)、NOT(否)及NEAR(两个单词的靠近程度),恰当应用它们可以使搜索结果非常精确。另外,也可以使用括号将搜索词分别组合,如[(新闻OR足球)AND米卢)NoT新闻”OR足球)(六)有针对性地选择搜索引擎。用不同的搜索引擎进行查询得到的结果常常有很大的差异,这是因为它们的设计目的和发展走向存在着许多的不同,比如:D是针对软件类的搜索引擎,可搜寻大量的自由软件和共享软件。驱动之家主要是提供查找驱动程序及硬件厂商信息。(七)使用元词检索。大多数搜索引擎都支持“元词”(metawords)功能,用户把元词放在关键词的前面,就可以告诉搜索引擎你想要检索的内容具有哪些明确的特征。例如,你在搜索引擎中输入“title:清华大学”,就可以查到网页标题中带有清华大学的网页。其他元词还包括:image,用于检索图片;link,用于检索链接到某个选定网站的页面;URL,用于检索地址中带有某个关键词的网页。(八)细化查询。许多搜索引擎都提供了对搜索结果进行细化与再查询的功能,如有的搜索引擎在结果中有”查询类似网页”的按钮,还有一些则可以对得到的结果进行新一轮的查询。(九)尽可能将搜索范围限制在特定的领域里。比如在yahoo中文网站中,你要查找的是与电脑相关的知识,那么你没有必要让搜索引擎在休闲与运动、健康与医药、艺术与人文等其他分类中查找。你可以进入“电脑与因特网”这一类,选中“检索此目录下的网站”。然后再开始搜索。四、结束语要完成一个有效的搜索,首先要确定要检索的主题,选择合适的检索工具、抽取适当的关键词。为避免可能出现搜索结果的冗余性,要尽可能限制查询范围,正确构造检索式。同时要使用逻辑条件限制及模糊或精确查询的功能保证能真正检索到我们所需的网络信息资源。总之,只要掌握一定的方法与技巧并经常实践.利用搜索引擎一定能从网上获取许多有价值的信息。由于网上信息具有动态性、多变性,今天能看到的信息也许明天便不复存在,要注意对检索到的有价值信息的进行保存。参考文献1.符绍宏,雷菊霞.因特网信息资源检索与利用[M].北京:清华大学出版社,20002.陈春阳.如何利用网络搜索引擎检索网络信息资源.兰州工业高等专科学校学报.20033.刘毓华.网络信息资源检索初探.现代情报,20034.陈永斌,邱苇.网络时代搜索引擎带来的社会问题[J].图书情报lT作,2006;(3):l19~1225.宋蓓玲,王新.浅析构建网络信息检索体系[J].现代情报.2005;(6):54~576.贾红英.网络搜索引擎探析[J].情报资料工作,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版新能源充电桩投资加盟合作协议范本3篇
- 2025年度住宅小区景观窗帘艺术化设计与安装合同范本4篇
- 基坑坍塌事故案例分析
- 二零二五年度车辆检测报告服务合同2篇
- 二零二五年度情侣心灵契合不分手情感咨询合同2篇
- 二零二五版绿色生态农业种植项目合作协议4篇
- 新课标下的实验教学新趋势-以小学科学为例
- 学生工业实习中的实践能力锻炼
- 2025年度房屋装修工程验收与保修个人房屋装修合同模板
- 白山2025年吉林白山市县事业单位招聘应征入伍高校毕业生14人笔试历年参考题库附带答案详解
- 中国2型糖尿病运动治疗指南 (2024版)
- 货物运输安全培训课件
- 统编版高中政治选择性必修2《法律与生活》知识点复习提纲详细版
- 前端年终述职报告
- 2024小说推文行业白皮书
- 特殊感染手术管理考试试题及答案
- 旅馆治安管理制度及突发事件应急方案三篇
- 市人民医院关于开展“改善就医感受提升患者体验主题活动”2023-2025年实施方案及资料汇编
- 政绩观存在的问题及整改措施范文(7篇)
- GB 1886.232-2016食品安全国家标准食品添加剂羧甲基纤维素钠
- 《港口管理》课件综述
评论
0/150
提交评论