范例基于学术动态的科研热点检索_第1页
范例基于学术动态的科研热点检索_第2页
范例基于学术动态的科研热点检索_第3页
范例基于学术动态的科研热点检索_第4页
范例基于学术动态的科研热点检索_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

深圳大学研究生课程论文题目基于学术动态的科研热点检索成绩专业软件工程课程名称、代码信息检索1312011081210年级2012姓名黄瑞娟学号2121230204时间2013年7月任课教师贾森

目录1信息检索概述 21.1 信息检索目的和意义 21.2 信息检索的工具和比较 21.3 信息检索的方法 32实验检索说明 32.1检索方法和流程 32.2关键字介绍 43.关键字引导检索 43.1检索说明 43.2检索结果比较 44.刊物引导检索 54.1检索说明 54.2检索结果比较 65.检索结果的分析和实验方向的确定 65.1结果的比较分析 65.2检索实验方向的确定 66.DifferentialEvolution相关检索 76.1检索基本情况 76.2分析检索结果 76.3引文报告 97.实验总结 11

基于学术动态的科研热点检索黄瑞娟2121230204软件工程(秋)1信息检索概述信息检索目的和意义信息在有了语言和文字的交流之后开始累计,历史、创作、革命等使得信息量大大增加,而互联网时代使得信息的交互速度和交互数量更为剧烈:2010年全球产生的数字化信息总量超过1W亿的吉比特。信息量大,增长快,形式多样包括视频、音频和文字等,传播的速度因微博等社交应用而更快更广,同时又有各国文化对信息的再改造,又存在信息老化的加速这么个影响,重复的、无用的信息干扰等。如何在日益呈爆炸式增长的信息里头找到自己所需要的资讯也催生了信息检索这一学问。信息包括多个领域,如人类政治、经济、自然科学、生命科学、系统科学等几乎所有科学领域,与物质、能量、相互作用等许多重要的基本概念密切相关,也与认识层次的思维、智能等相关,通过图书、期刊、报告、互联网等作为载体进行传播,在这里我们将就如何在学术科研里利用信息检索进行讨论。信息检索的合理利用可以帮助我们与时俱进,跟踪学术最新动态,除了出席会议和阅读期刊外通过互联网获取学术最新动态更为方便,同时还有统计信息。足够丰富和精确的信息检索使得科研时间大大的降低,站在巨人的肩膀上吸取经验从而提高工作效率。全面的检索可以帮助我们了解研究的领域深度和广度,降低重复研究已经存在的科研的可能性,节省经费精力。有了对所有统一领域的科研了解,才能找到创新的突破口,在未被涉及和完善的领域上有所作为。如果能够检索到市场的起伏原因信息,还可以帮助指定高明的市场谋略,这些检索到的信息将为决策提供科学依据。通过检索信息获取有效知识,筛选评价后对有价值的信息进行分析管理,再合理利用。信息检索的工具和比较网络的学术资源有搜索引擎,学科门户网站和学术资源导航,图书馆联机公共目录,科研报告,政府出版物等。不同的科研领域有不同的搜索资源,大分类的有综合性信息源(CNKI,万方,Elsevier),自然科学信息源(nature,science,SCIE),人文科学信息源(SSCI,CSSCI,CNKI社科),和专门学科类信息源(RSC,ACS,REAXYS,SCIFINDER,MRS)。根据需求到相关的信息源进行搜索将得到最为实时全面的领域信息。现有众多会议和期刊,评判一个会议或者期刊的优与缺可以从影响因子、引文数目进行分析。一个信息源所能够收录的目录是有限的,与会议和期刊的评判标准不同,信息源的评判标准从覆盖率、统计能力和易用性进行分析。通常有价值高可用性的都是收费的,通过注册会员或者按篇进行收费。而检索效果也有可以进行评价,从检全率(检出相关文献与系统相关文献的百分比)、检准率(检出相关文献量与检出文献总量的百分比)漏检率(漏检相关文献量与系统相关文献总量的百分比)和误检率(误检文献量与检出文献总量的百分比),这些与信息源的系统易用性和用户对检索关键字的敏感以及系统的使用熟练程度相关下面将主流的信息源进行比较,包括综合的、开放的、中文的和计算机领域的信息源,如表1所示。表1主流信息源的比较信息源收录情况说明GOOGLE几乎所有文献涵盖几乎所有领域的所有文献,包括会议、期刊、专利等。是一个全面综合性的搜索工具,如果用户拥有该期刊文献的访问权限,可以直接点击进入全文阅览页面。如果已经知道搜索的关键字,GOOGLE是很好的工具。A47W预印本文献涉及物理、数学、计算机等学科的预印本信息,帮助科研人员跟踪学科最新的研究进展,避免研究工作重复,每日更新内容。OpenJ-Gate8529种期刊超过5716种学术期刊通过同行评议,目前最大的开放获取期刊门户,提供开放获取期刊的免费检索和全文链接,包括学校、科研机构、生物医学等。CNKI几乎所有中文文献中文文献覆盖率几乎所有,也有14W的外文文献。如需查找中文文献,这个是很全面的网站,但同时也是收费的。WOK集成平台为科研人员研究工作流整合的创新研究平台,包括开题检索、查新、跟踪、寻找未来学习和工作机会等提供帮助,是一个完整的科研工作流平台CiteSeer50W篇论文涉及的内容为计算机与信息科学领域,查看引用情况和相关文献以及时间分布,并且可以浏览下载全文。信息检索的方法信息检索的方法有两种,一种是以关键字引导检索,另一种是以期刊引导的检索。标题引导检索是指直接使用若干关键字包括标题,作者等进行检索的方法,前提是已经了解某个领域的知识并且知道这个领域可能存在的关键字有哪些,或者是这个领域的前沿科研人员的信息。通过关键字直接检索,获得复合关键字的信息条目。而以期刊引导的检索,则是直接输入期刊的名字,以查看某个期刊所发布的文献条目,根据该期刊的所发布的内容找到自己感兴趣的文献,前提是了解各个期刊的名称以及所涵盖的领域内容。前者对于领域知识的要求比较高,好的关键字的组合可以搜索到与检索目的要求复合的文献,也就是检索结果的质量因关键字而参差不齐。而后者需要对各期刊的背景了解更多,如领域内容,影响因子,引文数目和自引数目等,到备受好评的期刊上查找到的文献通常质量会更好。2实验检索说明2.1检索方法和流程 本次实验将就两种检索方法对计算机技术与软件的内容进行检索,找到最近较为热门的科研领域后再针对该领域进行更为完整的检索和认知。 关键字引导的检索,从最近几年学院为学生所准备的学术会议以及上课所传授的热点内容进行检索,在WOK里检索每项关键字,查看从2004年至2013年工10年见的文献数量以及引用次数,得到该类科研内容是个朝阳科研领域还是夕阳科研领域。过程如图1所示。图1关键字检索过程 刊物引导检索,从JCR最近公布的影响因子排序列表找到最近影响较为大的刊物,进入各刊物查看发布的文献以及内容,找到较多被涉及的关键字,并查看今年被引用的次数和发布文献的数量,以此找到推断该科研内容是朝阳科研领域还是夕阳科研领域,过程如图2所示。图2期刊引导检索2.2关键字介绍 近期学院为学生准备的学术会议内容包括云计算(Cloudcomputing),物联网(Internetofthings),大数据(Bigdata),数据挖掘(Datamining),涉及的算法有聚类算法K-means(clustering),分类算法SVM(classifiers),同时本人较为感兴趣移动开发技术Android和IOS,数据挖掘算法贝叶斯网络(Bayesnet)。为了确保检准率,同一个领域的知识用多个检索关键字。关键字列表如下表2所示。表2领域及关键字领域关键字云计算Cloudcomputing,cloudgambit,cloud-based,物联网Internetofthings,physicalinternet,web-connectedthings大数据Bigdata数据挖掘Datamining聚类算法k-means,kmeans分类算法SVM,supportvectormachines贝叶斯网络Bayesnet,Bayesiannetwork,beliefnetwork移动开发Android,ios,Objective-C3.关键字引导检索3.1检索说明 关键字引导的检索根据前面表2的领域和关键字进行搜索,在WOK的WebofScience那里进行检索,检索范围选择“主题”,以限制强关联,使得搜索得到的结果更为复合内容。限制里面的时间跨度选择“从2004年至2013年”共10年的跨度,使得关注较为新的更新。3.2检索结果比较 检索的结果以四个角度进行比较:关键字领域,检索的结果数目,主要来源的国家,每年发表的文献数目柱状图。根据表2的关键字,得到检索的结果对比如表3所示。表3检索结果一云计算物联网大数据数据挖掘40519613035671中国(23.48%)中国(53.29%)美国(40.92%)中国(23.38%)表4检索结果二聚类算法k-means分类算法SVM贝叶斯网络bayesnet移动开发6913718341801915中国(22.15%)中国(43.28%)美国(23.80%)美国(27.89%) 从表3和表4可以看出,云计算和物联网最近兴起的话题,在近4年才开始有更多的研究,在中国研究的更多。大数据在美国是一边倒研究的也是兴起的领域,而数据挖掘开始慢慢回落,但是数据挖掘的聚类算法K-means和分类算法Bayesiannetwork仍然还是较多人研究的,SVM因研究已到了一个无法突破的境地而回落。移动开发在最近两年呈现爆炸式的研究,这个是与前面学术性质的研究不一样,这个是应用方面的研究。4.刊物引导检索4.1检索说明 刊物引导检索需要到JCR,通过两个领域获取影响因子前十的刊物,再根据刊物的内容选择其中两个刊物查看近年的影响因子情况,再到WOK以刊物搜索获得较多引用且新的文章的关键字,以此确定主题。所选择的刊物领域softwareengineering和Theoryandmethod,与本人的软件工程较为相关,如图3和图4所示。图3softwareengineering的刊物影响因子排序图4Theoryandmethod的刊物影响因子排序4.2检索结果比较 通过从2012的影响因子,近年影响因子起伏状态,以及该领域被引用较多的文献的共同关键字来进行比较,如表5所示。表5各大期刊影响因子及关键字IEEETSOFTWAREENGJACMIEEETEVOLUTCOMPUTACMCOMPUTSURV2.5882.3704.8103.543codeanddesignsmellsPrincipalcomponentsDifferentialEvolutionAnomalydetection 根据找到的关键字再次以关键词引导检索,获得近年研究的情况,如表6所示。表6期刊引导的关键字检索结果代码与设计主成分分析差分进化算法异态检测68702942112934加拿大(16.18%)中国(27.42%)中国(25.10%)美国(34.63%) 根据期刊引导关键字检索的结果可以看出,codeanddesignsmells虽然在柱状图上看是一个照样科研领域,但是研究的人数较少;而主成分分析Principalcomponents的研究较为稳定,但是在近两年的数目也相对较少了;差分进化算法DifferentialEvolution的研究是比较稳步上升的,异态检测Anomalydetection的研究跟主成份分析比较相像,也是较为稳定的但是相对来说高峰期在前两年。5.检索结果的分析和实验方向的确定5.1结果的比较分析 综合关键字引导检索和期刊引导检索,可以看出某些研究领域在某些地区呈现一边倒的研究现象,也就是某个领域在一个国家可能会出现过度重视的现象,这样的学科可能受到的政府推动作用比较大,如物联网在中国是收到推动作用的研究领域,又或者是真的在一个国家里面会有更好的基础和学术氛围催生整个领域的发展在这个国家有更好的前景,如SVM。关键字引导的检索受到的外围影响会比较大,因为是人为地选择热点,而期刊引导的检索会更加的客观,虽然在关键字的选择上会有所影响,但是可以从多引用的文献得出受关注的程度,从而得到关键字在进行检索。 5.2检索实验方向的确定 从期刊的影响因子来看,IEEETEVOLUTCOMPUT的4.810是最高的,而且近年的影响因子也比较稳定,ACMCOMPUTSURV的影响因子则呈现从9下降至3.5,每况愈下。而结合期刊得到的关键字DifferentialEvolution的趋势,可以看到是稳步上升的,是个照样科研领域,因此从上面的搜索对比可以得到本次实验最后需要进行的详细检索的关键词是DifferentialEvolution。6.DifferentialEvolution相关检索6.1检索基本情况 通过“主题”包含关键字“DifferentialEvolution”的检索按照相关性的排序如下图5所示,从2004年到2013年共10年间有4211篇文献,相关研究的领域有动态差分进化算法在某些领域的应用,基于差分进化的最近原型分类,给予随机定位的差分进化算法,优化的差分进化算法等,总结起来就是通过优化差分进化算法结合其他理念使得在某个问题或者某个领域有更好的表现。图5检索基本信息6.2分析检索结果 点击wok的“分析检索结果”进入检索结果分类分析的页面,接下来将比较重要的类别进行分析。图6为按作者进行排序,知道DASS和SuganthanPN在这个领域的研究比较多。图6按作者排序 通过选择作者的到这两个作者被引用最多并且感兴趣的的4篇文章,添加到WOK的endnoteWeb如图7。图7添加到endnoteWeb 研究最多的国家是中国,前五的其次国家是印度,美国,爱尔兰,台湾。如图8所示。图8研究国家排序 从基金赞助机构可以看出,中国对与这个领域的赞助是很多的,因为中国的大力支持而使得在这个领域中国的研究人员比其他国家更多,资金赞助可以影响到研究国家排序。图9资金赞助排序 按照来源出版物排序,可以看到从我们一开始就找到的期刊IEEETEVOLUTCOMPUT是排在21位,更多的是在IEEECEVOLUTCOMPUT在各个会议上发布的收集,通过谷歌搜索与其相关的会议时间和官网进行更多的了解。图10发布机构排序6.3引文报告 点击右方的“引文报告”,进入引文相关信息页面,选择时间段为2009-2013年,可以看到近3,4年的研究文献数目为3024篇,被引用最多的前面6篇,期货总第1,3,5篇已经被放在endnoteweb里面,可以说明在按照作者排序的时候,通常发表较多的作者他们在这个领域的造诣也是相对更高的。图10引文数目与发布作者排序是相关的 选择上面被

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论