第五讲搜索引擎与数据库_第1页
第五讲搜索引擎与数据库_第2页
第五讲搜索引擎与数据库_第3页
第五讲搜索引擎与数据库_第4页
第五讲搜索引擎与数据库_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《信息检索》主讲:张颖

第五讲搜索引擎与数据库搜索引擎数据库小结一、搜索引擎-搜索引擎定义

搜索引擎(searchengine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。它包括信息搜集、信息整理和用户查询三部分。-搜索引擎基本原理如果输入一个特定的搜索词,搜索引擎就会自动进入索引清单,将所有与搜索词相匹配的内容找出,并显示一个指向存放这些信息的链接清单。检索优点:内容广泛,检索简单。利用搜索引擎可以帮助人们在茫茫网海中搜寻到所需要的信息。检索缺点:查全率高,查准率低,结果数量大,学术文献量少且无法获取全文(免费文献除外)。-搜索引擎的特点常用搜索引擎百度Google中国搜索Yahoo-常用搜索引擎——baidu-常用搜索引擎——google-常用搜索引擎——中搜-常用搜索引擎——雅虎分析检索的主题选择合适的搜索引擎抽取适当的关键词正确构造检索式及时调整检索策略-搜索引擎检索技巧了解查询目的和要求,确定需要的:信息类型(全文、文本、图像、声音等)查询方式(浏览、分类检索、关键词检索等)查询范围(全文、网页、标题、FTP、软件、外文等)查询时间-分析检索的主题-选择合适的搜索引擎英文信息中文信息使用名词或物体做关键词检索式中使用2-3个关键词要注意同义词、近义词、相关词或同一术语的不同表达方式。如,internet、web、www、thenet对固定短语,用“

”括起来进行检索,以提高检索的精确度。如,“worldwideweb”-抽取关键词使用逻辑算符将检索词连接起来构成检索式。网络搜索引擎惯用空格(与)、逗号(或)、减号(非)表示逻辑关系,但具体情况因搜索引擎而异。-构造检索式扩大检索范围:使用同义词、近义词或相关词减少最不重要的概念词,或使用较普遍的词,或改用上位词。利用某些搜索引擎的自动扩检功能进行相关检索,如百度的“相关搜索”。使用多个搜索引擎。-调整检索策略缩小检索范围:使用布尔逻辑使用词组检索使用高级检索语法-调整检索策略学术搜索引擎googlescholar百度学术搜索

=%D1%A7%CA%F5&tn=xueshu&rn=10&p=mini读秀学术搜索

ilib中国科技论文在线Yahoo!奇摩学术SCIRUSINFOMINEIntuteOAIsterFindArticles学术搜索引擎学术搜索引擎简介GoogleScholar

Google推出的免费学术搜索工具,可以帮助用户快速查找学术资料,包括来自学术著作出版商、专业性社团、预印本、各大学及其他学术组织的经同行评论的文章、论文、图书、摘要和技术报告。百度学术搜索百度学术搜索通过和专业站点的合作收录了上千万篇的学术论文,可检索到收费及免费版学术论文,并通过时间筛选、标题、关键字、摘要、作者、出版物、文献类型、被引用次数等细化指标提高检索的精准性。读秀学术搜索“读秀学术搜索”是基于海量中文学术资源开发的庞大学术搜索服务系统,它把所有的图书变成一部最大的百科全书,拥有6亿页的图书、4500万篇期刊、1000万条报纸、会议论文、学位论文、专利、标准、人物库、词条库、视频等。ilib

ilib是股份有限公司旗下的专业学术搜索平台,是GoogleScholar和Yahoo!奇摩学术搜索重要的内容提供者,平均每周新增文献5万余篇。中国科技论文在线中国科技论文在线是经教育部批准,由教育部科技发展中心主办,针对科研人员普遍反映的论文发表困难,学术交流渠道窄,不利于科研成果快速、高效地转化为现实生产力而创建的科技论文网站。Yahoo!奇摩学术台湾,包括“全國”博碩士論文、中文期刊篇目、大陸萬方期刊全文、學術網路資源、“全國”書目資訊網、數位典藏聯合目錄学术搜索引擎学术搜索引擎简介SCIRUSSCIRUS科技信息专用搜索引擎,以自身拥有的资源为主体,对网上具有科学价值的资源进行整合,集聚了带有科学内容的网站及与科学相关的网页上的科学论文、科技报告、会议论文、专业文献、预印本等。覆盖的学科范围包括:农业与生物学,经济、金融与管理科学,工程、能源与技术,环境科学,语言学,法学,生命科学,材料科学,数学,医学,心理学,社会与行为科学,社会学等。INFOMINE

INFOMINE是为大学教师、学生和研究人员建立的网络学术资源虚拟图书馆。它拥有电子期刊、电子图书、公告栏、邮件列表、图书馆在线目录、研究人员人名录,以及其他类型的信息资源40000多个。INFOMINE共包括12个数据库:商业和经济数据库,多样性文化及种族资源数据库,电子期刊,政府信息数据库,教育资源数据库、社会学和人类学数据库,视觉艺术和表演艺术数据库。IntuteIntute

是一个搜索工具,专注教学、研究方面的网络资源。共设四大领域:科学与技术、艺术与人文、社会科学、健康与生命科学。OAIster

OAIster

是密歇根大学开发维护的一个优秀的开放存取搜索引擎,收集了来自536家学术机构的590万篇文档,包括开放使用期刊的文章、工作论文、讨论文章、会议论文和学位论文。FindArticlesInformationFindArticles提供多种顶极刊物的上千万篇论文,涵盖艺术与娱乐、汽车、商业与经融、计算机与技术、健康与健身、新闻与社会、科学教育、体育等各个方面的内容。学术搜索引擎——googlescholar

-Googlescholar学术搜索技巧及应用基本搜索“AND(与)”“OR(或)”“NOT(非)”“标题:”操作符如[标题:mars]得到的结果只包括文件名中的学术信息。(“标题:”与搜索词之间不能有空格)“作者:”操作符如[作者:mars]得到的结果只包括与该作者相关的学术信息。(“作者:”与搜索词之间不能有空格)-Googlescholar学术搜索技巧及应用不使用“词干法”,也不支持“通配符”(*)搜索。也就是说,Google只搜索与输入的关键词完全一样的字词。例如:搜索“air”,不会得到类似“airline”或“airlines”的结果。字母大小写不敏感,BOOK和book的搜索结果一样。默认为模糊检索,并会自动拆分搜索的词组和句子;精确检索用双引号””。可以搜索词组或句子,如:【“检索技术”】和【”关于google使用的文章网”】-Googlescholar学术搜索技巧及应用高级搜索可按照文章、作者、出版物、日期进行查找,提高查准率。-Googlescholar学术搜索结果二、数据库

数据库是存储在一起的相关数据的集合,这些数据是结构化的,无有害的或不必要的冗余,并为多种应用服务;数据的存储独立于使用它的程序;对数据库插入新数据,修改和检索原有数据均能按一种公用的和可控制的方式进行。(J.Martin)-数据库定义检索:布尔逻辑检索、字段检索检索优点:检准率高、具有针对性、学校资源提供大量的学术文献(可获取全文、文摘等)、检索方法多种检索缺点:每个数据库相对独立、只能检索数据库限定的内容、检索相对复杂-数据库特点三、小结搜索引擎的一般检索策略与技巧数据库的基本特点本讲重点内容①金庸先生的十四部武侠作品可以用一副对联来描述,请你查找出这副对联。并给出这十四部武侠小说的书名。②查找一张电视剧《武林外传》的剧

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论