




已阅读5页,还剩38页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
网上信息检索及杉达图书馆资源利用上海杉达学院图书馆1第一章 网上信息检索u搜索引擎的工作原理u搜索信息的方法和技巧u著名的中文和英文搜索引擎2搜索引擎( Search Engine)u搜索引擎是一种基于 Internet上的信息查询系统。 是通过在建立引擎的 WEB页上输入我们所查询信息的关键词,经过引擎的检索服务器在内部数据库找到相关资料并按一定的规则整理后再输送出来,通过网络传到本地主机的一种在线服务方式3搜索引擎的功能u搜索引擎有三个功能信息采集功能: 广泛收集因特网上的 Web页面,构建一个信息空间的作用信息组织和标记功能: 通过某种形式来组织、标引所收集的 Web页面信息检索功能: 通过建立数据库,接受用户查询,利用信息检索算法,尽可能将最相关的页面返还给用户,达到有效检索的目的4搜索引擎的工作原理u使用一种自动跟踪标引软件,也称为 “机器人 ”程序,它能自动地浏览 Web上的超文本结构。机器人找到一个文件后,对它进行分析标引,然后把它送到索引数据库中,索引数据库是搜索引擎搜索信息的信息源。用户查询时,搜索引擎根据用户输入的提问式,在索引数据库中找出与之相匹配的记录,并返回给用户。5搜索引擎的工作原理u搜索引擎自动获取信息的两种方法定期搜索: 每隔一段时间,搜索引擎派出机器人程序,对指定范围的 IP地址的互联网站进行检索,发现新的网站,就自动提取网页信息和网址加入自己的数据库。提交网址: 网站拥有者主动向搜索引擎提交网址。在一定时间内向提交网站派出机器人程序,扫描该网站并将有关信息存入数据库6搜索引擎的类型和特点u分类目录搜索引擎通过人工发现信息,并依靠标记人员区别和分类,用户在分类体系中直接进行浏览检索,如: Yahoo, Sohu等。信息质量高,检索准确率高。人力资源花费大,信息量大的情况下 ,更新慢。u独立搜索引擎 (机器人搜索)独立完成搜索任务。依据一定的网络协议自动地在 Internet上发现、加工、整理信息,如:google, Alta Vista, Infoseek等。信息量大,人力耗费小,但检索准确率低。7搜索引擎的类型和特点u元搜索引擎查询时向其他多个独立搜索引擎发出搜索请求,并对返回的查询结果进行处理。一般仅支持AND、 OR、 NOT等较简单的语法操作。u网络搜索软件用户可下载网络搜索软件到本地计算机安装使用,是一种具有网络查询功能的离线浏览器。可以快速查询网络上的相关资源,灵活的控制输出结果8搜索引擎的语法规则u使用布尔逻辑操作符And( &): A&B 包含 A,B两个关键词Or( |): A|B 包含 A或 B或 A,BNot( -): A -B 包含 A,不含 B括号: (A or B) and C 包含 AC 或 BCu使用逗号:与 or相似,但有排列次序u使用空格:类似与 &u使用双引号:组合关键字作为一个字符串9搜索引擎的语法规则u使用通配符 *,?:代替任意字母组合u使用 + - 号: +计算机, -计算机u使用 near, in:限定范围u使用 t , u:t+关键字 查询网站名称u+关键字 查询网址 不同的搜索引擎提供的查询方法不完全相同,可以去相应的搜索引擎的 “帮助 ”或者 “搜索技巧 ”中查找。10选择搜索引擎的标准u速度:信息查询速度,信息更新速度u查全率(返回的信息量):返回的有效信息量多,收录的信息范围广,数据容量大u查准率(信息相关度):查询的信息准确,信息的关联度高u易用性:操作简单、易用u稳定性:服务器和数据库稳定,提供安全可靠的查询服务。11英文搜索引擎uYAHOO: uAltavista: uExcite: uInfoseek: uHotBot: uLycos: uWebCrawler: 12特种搜索引擎u搜索电话、人名、电子邮件、地址等查询电话号码: 全球华人寻人: u查询地图信息图行天下: u查询图像信息Virage: 13常用搜索引擎介绍uGoogle: 搜索图像、目录搜索u北大天网: 网页搜索、 FTP搜索u百度搜索: 主题搜索、搜索论坛u3721: 实名搜索14Google搜索u特点 : 关键词搜索较好,但不支持通配符手气不错:搜索与关键字最匹配的网页网页快照:直接取出缓存网页支持高级搜索语法格式: filetype、 link、Inurl、 Intile等15Google搜索uFiletype语法规则:含义:定制文件类型搜索格式:关键词 filetype:文件类型 选择 “所有网页 ”搜索模式 ,回车搜索的文件格式:lSWF格式( Flash文件)lDOC、 PPT、 XLS、 GIF、 JPGlPDF格式 (一种电子图书格式)16Google搜索uFiletype实例输入 :“东北人都是活雷锋 filetype:swf” 就得到了所有版本的 “东北人都是活雷锋 ”的flash动画 Internet filetype:ppt flower filetype:jpg 网络基础 filetype:doc 17其他规则u网页链接中包含第一个关键词Inurl:mp3 yesterday once more可用于搜索 MIDI、 MP3等文件u搜索的关键词包含在网页标题中Intitle:北京大学u在指定的网站范围搜索在图象搜索中,用: Cat site:u搜索有多少链接到某个地址的网页Link:18北大天网u特点: 是教育科研网内的搜索引擎,速度较快, 有功能强大的 FTP检索能力,可以直接搜索 FTP文件,包括图片、声音、动画等。搜索范围较小,数据库中资料不够多,经常造成只能看到摘要,不能调出全文的死链接。19北大天网u简单搜索在文本框中输入关键词,按 “搜索 www网页 ”u复杂搜索使用逻辑语法规则查询“&”:与运算,用 “A&B”进行查询的结果是既包含查询词 A又包含查询词 B的网页“-”:非运算, 如: A-B表示包含 A,不含 B“|”:或运算 空格:等同于 &20北大天网uFTP搜索:按文件名匹配搜索三种方式:按文件类型、快捷方式和 FTP复杂搜索u按类型搜索:输入主文件名,可使用 *、 ?通配符文件类型可以直接输入扩展名通过 “分类搜索 ”指定的类型21北大天网u使用快捷方式: FTP文件分类列表uFTP复杂搜索: 可以指定搜索的文件的长度、最后修改日期和搜索范围。u实例:保存搜索结果l搜索一个苹果图片 (apple)l搜索一张老虎图片 (tiger)l搜索一首 yesterday once more的 MP3音乐l搜索一个 IE5的安装程序22百度搜索u拥有目前世界上最大的中文搜索引擎,总量超过 3亿页以上,并且还在保持快速的增长。u特色功能:l相关检索 根据用户提供的简单词语搜索,提供 “其它用户搜索过的相关搜索词 “作参考。l 百度快照 l 网页预览 l Flash搜索 l 在指定网站内搜索 sitel 在标题中搜索 l 在 url中搜索 l 搜索援助中心 l IE搜索伴侣 23百度搜索u简单搜索在文本框中输入关键词,按 “搜索 www网页 ”u二次搜索使用逻辑语法规则查询“&”:与运算,用 “A&B”进行查询的结果是既包含查询词 A又包含查询词 B的网页“-”:非运算, 如: A-B表示包含 A,不含 B“|”:或运算 空格:等同于 &24网络实名 3721u地址: u智能推测、拼音使用等功能可以帮助我们搜索那些名称不确切的网址u用网络实名查询:广州市政府, YAHOOu为自己的电脑开通实名服务u在地址栏输入实名,如中山大学、 OICQ25其他常用搜索引擎u新浪: u网易 : u搜狐 : uYahoo中文: u中华网: u中文搜索引擎指南 (元搜索引擎 ):26网上中文信息搜索中国期刊网: 报刊园 : 高校图书馆网址: 1/gxtsg.htm超星数字图书馆: 万方数据: 27推荐使用的中文搜索引擎uYahoo中文: u搜狐: u新浪网: u网易: u百度搜索: u悠游中文: u中华网: u3721 实名: u硅谷动力: 28第二章 杉达图书馆资源介绍u本地可利用资源馆藏资源维普中文期刊数据库本馆
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论