版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
3.2
因特网上的信息检索本节主要内容1、介绍常用的特色信息检索工具;2、搜索引擎的工作过程。★文档搜索特色信息检索工具:牛档网★试题搜索特色信息检索工具:题问365网★找机票火车票特色信息检索工具:酷讯网★找机票火车票特色信息检索工具:去哪儿网★全国公交查询网特色信息检索工具:8684网★电影电视下载特色信息检索工具:狗狗搜索信息检索工具工作原理1、全文搜索引擎的工作原理搜索器:负责定期地自动到各个网站上,把网页抓下来,并顺着上面的链接,持续不断地抓取网页。如“网络机器人”、“爬虫”、“蜘蛛”。索引器:把搜索器抓来的网页进行分析,按照关键词句进行索引,并存入服务器的数据库中。检索器:面向用户,接收用户提交的查询字串,在索引数据库中查询,并将结果反馈给用户。检索器索引器搜索器一、从互联网上“抓取”网页;二、建立索引数据库;三、在索引数据库中搜索排序;四、用户接口。1、全文搜索引擎的工作原理实例讲解:工作原理分析:“蜘蛛”程序“爬”到“爱自由旅游网上,抓到了/travel_guide/a01/1_0_0_1_0_0.html页面,并从全文中抽取一系列的关键字,包括“北京”、“概况”等等,并把网页网址与这些关键字关联,利用“索引器”建立网页索引数据库.当你向“百度”提交了这些关键字,“百度”就利用“检索器”从索引数据库中搜索,并将搜索到的结果展示在页面上.2、目录搜索引擎的工作原理:
目录索引类搜索引擎一般采用人工方式采集的存储网络信息,依靠手工为每个网站确定一个标题,并给出大概的描述,建立关键字索引,将其放入相应的类目体系中。1、总目录3、链接2、专题目录总目录——专题目录——链接——网站请利用本节课所学的知识搜索以下内容:1、成语“目无全牛”的相关题目;2、最近重
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 福建公务员面试模拟29
- 北京行政职业能力模拟67
- 2012年4月22日上午浙江省面试真题
- 24.4 解直角三角形 华师大版数学九年级上册教案
- 地方公务员西藏申论52
- 2024年房地产中介佣金协议正式
- 2024年全新60岁离婚协议书范文
- 河南面试模拟56
- 2024年停车场管理系统升级合同
- 2017年4月24日广州单考区公务员考试面试真题
- 陶瓷专利导航分析报告
- 第3课《美丽的川西高原》课件
- 供应室护理责任组长竞聘
- 《工法编写要求》课件
- 新婚避孕知识讲座
- 黄精加工项目可行性方案
- LTC与铁三角从线索到回款
- 《旅游市场营销》课程教学设计
- 外贸业务员负责外贸业务开展
- 课程思政理念下的高中历史教学设计研究
- 工会福利培训课件
评论
0/150
提交评论