学术搜索引擎和资源发现系统的对比分析,搜索引擎论文_第1页
学术搜索引擎和资源发现系统的对比分析,搜索引擎论文_第2页
学术搜索引擎和资源发现系统的对比分析,搜索引擎论文_第3页
学术搜索引擎和资源发现系统的对比分析,搜索引擎论文_第4页
学术搜索引擎和资源发现系统的对比分析,搜索引擎论文_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学术搜索引擎和资源发现系统的对比分析,搜索引擎论文摘要:比拟资源发现系统和学术搜索引擎的功能异同,有助于优化图书馆发现服务。本文选取EDS和百度学术搜索为研究对象,通过文献述评与实验方式方法,从资源收录范围、数据来源与组织方式、检索功能、检索结果运用以及个性化服务等方面比拟了两者异同。结果显示,在详细的功能上,两个系统各有优点。最后,本文从资源整合、信息素养教育、知识发现服务三个方面提出图书馆发现服务优化建议。本文关键词语:发现服务;资源发现系统;学术搜索;图书馆;Abstract:Comparingthefunctionalsimilaritiesanddifferencesbetweentheresourcediscoverysystemandacademicsearchenginewilloptimizethelibrarydiscoveryservice.EDSandBaiduAcademicSearchareselectedasresearchobjectsinthispaper.Throughliteraturereviewandexperimentalmethods,thispapercomparesthemfromtheviewofresourcetypes,datasourceandorganizationmode,searchfunction,searchresultapplicationandpersonalizedservice.Theresultsshowthatthetwosystemshavetheirownadvantagesinspecificfunctions.Finally,itputsforwardoptimizationsuggestionsforlibrarydiscoveryservicefromthreeaspects:resourceintegration,informationliteracyeducationandknowledgediscoveryservice.Keyword:Discoveryservice;Resourcediscoverysystem;Academicsearch;Library;0、引言近年来,几大搜索引擎公司为进一步方便学术用户获取学术资源,纷纷在其原有搜索引擎的基础上推出了学术搜索引擎。学术搜索引擎通过科学组织、管理和维护网络中的学术信息,使用户通过一个检索入口快速获取网络学术信息[1]。当前,该类型的搜索引擎主要有GoogleScholar、MicrosoftAcademicSearch以及百度学术搜索。同时,随着GoogleScholar学术搜索的典范效应,元数据索引服务开场进入图书馆界的视野,基于元数据仓储的资源发现系统面世,并在国内外图书馆中得到迅速而广泛的应用。资源发现系统是通过抽取、映射、收割、导入等手段对海量的来自异构资源的元数据和部分对象数据进行预收集,并通过归并映射到一个标准的表示出式进行预聚合,构成统一的元数据索引,通过单一但功能强大的搜索引擎向终端用户提供基于本地分布或者远程中心平台的统一检索和服务的系统[2]。资源发现系统自2018年面世以后,发展很快,华而不实在国内被广泛应用的系统主要有ProQuest公司的Summon和PrimoCentral、EBSCO公司的EBSCODiscoveryService(EDS〕以及超星发现系统。当前,国内学者对学术搜索引擎以及资源发现系统分别做了大量的研究,也有少量的研究是分析比拟了这两类系统的性能、特点,为用户选择和使用提供指导,为图书馆引进资源发现系统提供参考,但都没有牵涉面对学术搜索的竞争,图书馆的发现服务该怎样应对[3,4,5,6]。本文从资源收录范围、数据来源与组织方式、检索功能、检索结果以及个性化服务等方面比拟这两类系统的异同,明确各系统的特点,并根据比拟结果对图书馆的发现服务提出优化建议。1、研究对象与方式方法1.1、研究对象本文以EDS与百度学术搜索为研究对象。EDS是EBSCO公司2018年推出的网络级资源发现系统,利用EDS,读者只需使用单一检索框,即可在几秒钟之内检索到图书馆的各种电子和纸本馆藏,检索结果与本馆馆藏资源保持一致。百度学术搜索是百度旗下的学术资源搜索平台,提供海量中英文文献检索,涵盖了各类学术期刊、会议论文等资源,遭到了教育和科研机构用户的广泛关注,成为科研工作者获取文献的利器。1.2、研究方式方法本文采用的研究方式方法主要有两种:一是文献调查方式方法,通过收集与资源发现系统相关的期刊论文、会议报告、产品讲明书等,了解资源发现系统的评价指标,尤其是EDS和百度学术的发展历程与产品性能特征;二是实验方式方法,通过详细检索词的测试与分析,从系统收录的学术资源、检索性能、检索结果处理以及个性化功能等方面进行比拟分析。2、比拟结果分析2.1、学术资源(1〕收录范围。EDS的收录范围相对明确,根据EBSCO公司最新数据,其收录了近10万家期刊和图书出版机构的资源,覆盖的资源类型丰富,包括图书、期刊、学位论文、会议论文、报纸、音频、乐谱等,但其资源以外文为主,在中文资源方面有所欠缺,当前能够索引到的中文期刊仅有重庆维普以及万方期刊。百度学术并没有明确资源收录的范围,从其详细的使用来看,资源类型少于EDS,仅仅包括期刊、学位论文、会议论文、图书、专利5种,资源语种包括中文和英文。无论是百度学术还是EDS,均不支持空检索,因而,笔者随机选择几个检索词,对检索结果的中外文数量做了比拟,详细结果见表1。由比拟结果可看出,对于中文检索词,百度学术检索结果数量优势明显,对于英文检索词,EDS检索结果数量则遥遥领先,这也反映了这两个系统收录中英文资源的差异。表1检索实例比拟(2〕资源来源。EDS和百度学术的资源来源详细如此图1所示。图1EDS和百度学术的资源来源EDS资源主要来源于数据库资源、OA资源以及图书馆自建资源。对于数据库以及OA资源,主要通过和数据库商及出版社合作的方式获取;图书馆自建资源主要是指图书馆自建的书目数据库以及机构知识库等本地资源,本地资源是EDS知识库的重要组成部分,主要通过自动收割或人工导入的方式完成对本地资源数据的映射和上载工作。百度学术搜索的资源主要来源于数据库资源、OA资源以及网上的免费资源。网上免费资源是指来源于百度文库、豆丁网、爱学术等途径的资源,这部分资源以非传统的形式发布,未经过同行评审,因而会在质量和权威性方面存在差异。(3〕资源组织。EDS的资料团队会把不同来源的元数据整合在一起,经过一系列规范化的预处理构成EDS格式统一、内容丰富、构造清楚明晰的元数据仓储。与资源发现系统的原理类似,百度学术搜索将各种分散的数据不分学科都集中到一个资源库,构成百度学术搜索后台超大规模元数据索引知识库。根据百度学术的声明,此知识库元数据来源途径有三种:题录数据,来自于数据商合作、OAI(OpenArchivesInitiative〕协议收割、搜索引擎收录;引文数据,来源于OA(OpenAccess〕集成;全文数据,来自于数据商合作、学术网站解析、PDF解析[7]。笔者在实际运用中发现,百度学术部分资源的元数据存在错误或不规范的现象,如在资源类型分类中,部分期刊论文、会议论文没有能正确标引,在检索结果中被划分为其他类型等。笔者将这两个系统元数据的主要优势进行总结比拟,详细见表2。表2资源组织比拟2.2、检索性能检索性能的强弱是评价学术搜索引擎的重要指标,会直接影响用户体验效果。(1〕基本检索。百度学术搜索和EDS均提供基本检索和高级检索两种检索功能。基本检索界面,均为一框式检索,系统根据用户输入的本文关键词语进行检索。不同的是,EDS除了以上功能外,还支持检索词的位置限定功能,提供作者和标题两种位置限定。为进一步测试这两大检索系统的功能,笔者选择检索词大数据中国temp*ols?n,并对检索词大数据中国使用布尔逻辑检索词进行组配,结果发现,百度学术搜索和EDS均支持布尔逻辑检索。但对于截词符,EDS支持截词符?*检索,但百度学术搜索却不支持,本文关键词语中的*或者?会被忽略掉。详细见表3所示。(2〕高级检索。EDS和百度学术搜索的高级检索功能比拟类似,主要有下面两个方面:一是对检索词的限定,如检索词出现的位置,多个检索词之间的逻辑关系等;二是对检索结果的挑选,可从作者、出版物、发表时间、语言等方面对检索结果进行限定。详细比拟见表3。相较于百度学术搜索,EDS在每一部分都提供了多而细致的检索字段,选项愈加丰富。(3〕辅助检索功能。百度学术搜索和EDS均支持检索词自动补全功能、中英文互检功能〔利用一个检索词可同时获取中文和英文资源〕。除了以上常见辅助检索功能外,两个系统还具有其独特的智能化辅助检索功能。百度学术搜索提供类似文献、以下为参考文献和引证文献的查看功能,从多个角度为用户提供相关信息;同时具有检索词纠错功能,对拼写有误的检索词进行指正、修改。EDS的辅助检索功能主要有刊内检索功能和相关主题扩展检索。当检索词和刊名一致时,EDS将期刊作为第一条检索结果呈现,并提供检索框,用户可输入检索词,在这里刊内检索,提升检索结果的相关度。EDS还提供应用对等科目功能,可根据用户输入的本文关键词语,自动匹配出此本文关键词语的不同表述方式,使检索结果愈加完好。表3检索性能比拟2.3、检索结果(1〕结果展示。检索结果页面展示的信息越具体,越有利于用户对资源内容的准确把握,百度学术搜索和EDS均以列表的形式展示检索结果,且两者的检索结果信息较为类似,都包含了文献的题名、着者、本文关键词语、出版物、内容摘要、出版日期等主要信息。详细比拟见表4。被引量是百度学术搜索免费提供的增值功能,不仅能够免费搜索跟踪期刊文献的引证文献,还能搜索跟踪会议录、学位论文以及图书、专利的引证文献。EDS检索结果页面信息提供4种格式供用户选择:标准格式、仅限标题格式、简介格式和具体格式。选择的格式不同,检索结果页展示的信息具体程度也不同,本文以标准格式为例。馆藏信息是针对本馆书目信息资源独有的内容,能够查看该资源的馆藏地、流通状态等信息。使用量是与PlumX整合后具有的功能,查看检索结果被使用情况。(2〕结果排序。百度学术搜索和EDS默认状态下均是按相关性对检索结果进行排序,最相关的文献排在最上方。时间的排序可帮助用户挑选出最新和最早的研究。按被引量排序根据了文献的影响力,引用量越高的资源排序越靠前。(3〕分面精炼。分面是指事物的多维度属性,分面精炼是指通过事物的这些属性不断挑选、过滤检索结果的方式方法[8]。百度学术搜索和EDS提供多个分面,包括内容类型、主题、着者、出版时间、语言等等。利用这些分面,读者能够从不同的角度对检索结果进行归类整合、层层细化。这两个系统详细的分面比拟见表4。通过比拟发现,两个系统在详细的分面项设置上存在较大差异不同。对于文献类型分面,百度学术搜索仅能提供10个二级分面选项,而EDS提供的文献类型有20多个,且百度学术搜索只能从系统提供的期刊、学位论文、会议论文、专利等选项中选择一项,但EDS却能够选择多项;在出版时间这一分面项上,百度学术搜索可精到准确到年,而EDS可精到准确到月。(4〕全文获取。EDS和百度学术都提供数据库的全文下载链接,如万方、Elsevier等,但这一功能的前提下实现的学校已经购买了这些数据库,具有全文访问权限,且在学校IP地址范围内访问;对于免费资源,则访问不受限制,如百度学术可提供百度文库、道客巴巴、豆丁网、爱学术等免费网络资源的获取途径,EDS也支持OA资源的不受限访问。(5〕引文输出。EDS和百度学术搜索均提供多种引文格式供用户选择,也均支持以单条或批量的形式直接导入到文献管理软件中。详细见表4。表4检索结果比拟2.4辅助功能(1〕个性化功能。学术搜索平台能够通过获取并分析用户的偏好、背景以及信息行为形式,提供充分知足用户信息需求的个性化信息服务,使资源发挥出更大成效[9]。百度学术搜索的个性化服务主要包括我的学术、订阅搜索等功能。我的学术能够看作是百度为用户开创建立的一个虚拟学术空间[10],它主要包括我的主页我的珍藏和我的订阅三种功能。我的主页是指用户的个人学术信息,主要是管理自个发表的文献。我的珍藏是面向历史数据的,用户能够像在电脑上建立文件夹一样,分类管理珍藏的文献。我的订阅是面向将来数据的,类似RSS阅读器。用户完成检索之后,能够点击网页上面的订阅该搜索,随时跟踪相关研究的前沿动态。EDS对图书馆是完全开放的,允许图书馆定制用户界面,包括名称、语言、LOGO、文字讲明、颜色以及文献输出格式等,同时也允许个人用户开创建立EBSCO账户,管理文件夹,此文件夹可用于管理文献、保存检索历史、开创建立电子邮件快讯以及RSS源等。另外,此文件夹可与其别人分享,允许别人查看,自个可以以查看别人的文件夹,方便学术的合作沟通。(2〕系统可扩展性。百度学术搜索不能被集成进虚拟数字图书馆环境中,图书馆能够在其系统中提供百度学术搜索服务,但当用户点击百度学术搜索链接时,会跳转到与图书馆无关的百度学术搜索的站点上。而EDS发现系统能够很好地集成图书馆系统,图书馆不但能够根据本馆的要求灵敏定制EDS的用户界面,而且能够实现EDS系统和本馆的机构门户等的无缝集成。3、结论与建议3.1、主要结论EDS和百度学术搜索都具有学术资源的发现功能,能够帮助用户在海量的信息资源中发现知识。两个系统工作原理基本一致,但在详细的功能上还存在差异不同,优劣并存。EDS服务对象主要是EDS成员馆的用户,帮助用户发现本机构拥有的资源。其收录的资源内容明确,且均为通过正规渠道出版的资源,在学术性和权威性方面要优于百度学术搜索,但其在中文资源的覆盖面上还非常欠缺。在资源组织上,EDS的元数据在规范性、完好性、稳定性等各方面较百度学术都具有无法比较的优势。在检索性能方面,EDS提供了非常详尽的检索选项,整体上优于百度学术搜索,但在本地化方面,还有待加强,如还不支持核心期刊数据以及国内期刊常用的GB/T7714引文格式。百度学术是免费搜索工具,倾向于公网文献的获取,资源来源广泛,既有数据库资源,又有网络免费资源,尤其在中文资源上具有得天独厚的优势,但其资源类型较少,且元数据的质量呈现良莠不齐状态,这直接限制了百度学术检索和分面功能。但其检索词纠错功能、核心期刊的挑选功能、引文的GB/T7714格式以及被引次数查看功能符合国内用户的需求和使用习惯,极大提升了用户的使用体验。3.2、实践建议(1〕学术资源整合方面。首先是加强中文资源的收录,对中文资源收录的缺失,是国外资源发现系统的一大软肋,应尽快与国内数据库商合作。其次是增加网络免费资源的收录。图书馆发现系统应在做好这些资源的学术性、稳定性评估的前提下,提供网络免费资源检索服务。(2〕信息素养教育方面,应注重提升学生整体信息素养。信息素养教育内容应在原有的检索及处理技能的基础上,更多地转向对信息资源的评估、分析和分享方面,培养学生判定信息的权威性、可靠性、真实性的能力,使学生能自觉运用批判性思维及时修正、调整认知经过。同时,图书馆应教会学生利用社交技术建立个人学习网络,与学习网络密切相关的标签、隐私等相关问题都应成为当下信息素养教育的主要内容。在教育方式上,以资源发现系统为平台,开展信息搜索、信息评估乃至英文阅读等教学。(3〕知识发现服务方面,应向着个性化和精准化方向发展。发现服务系统将图书馆海量的数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论