

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Scholargate全球高水平学者数据库 11.Scholargate全球高水平学者数据库概述 31.1背景概述 31.2建设内容概述 32.数据库特点 53.业务流程 64.数据关联 75.数据库使用说明 85.1汇总全球各领域高水平学者,展示全球科研现状 85.2助力科研,提升科研水平 115.3增加国际合作,提升学术声誉 235.4形成引进人才靶向目标库 246.技术路线 286.1MPP 286.2Hadoop 286.3Spark 296.4Sphnix 296.5Redis 306.6Python 301.Scholargate全球高水平学者数据库概述1.1背景概述根据“双一流”建设中的“建设一流师资队伍,培养拔尖创新人才,提升科学研究水平,传承创新优秀文化”的需求,为助推我国尽快形成科技人才高峰,推进全球高水平学者的引进,更好的服务我国“双一流”的建设,提升我国的科技影响力,宝和数据股份有限公司(以下简称:宝和数据)与爱思唯尔(Elsevier以下简称:爱思唯尔)公司(世界著名的科学、技术和医学信息产品和服务出版商)进行战略合作,双方基于优势资源互补的理念,宝和数据引入爱思唯尔的版权数据,由宝和数据自主研发独立知识产权的全球高水平学者数据库,围绕重点发展的学科和产业领域,建立全球顶尖专家人才和海内外高层次华人专家数据库,集成高水平人才在全球范围内的科研产出、就职机构、合作网络等动态信息并实现相互关联,实现信息查询、专家匹配、人才比对和统计分析评价等功能,为政府、高校、科研院所和科技企业在人才引进、人才评估、专家评审、数据统计、趋势研究、科技合作等方面提供信息支撑服务。Scholargate全球高水平学者数据库(以下简称:学者库)已正式开通上线,学者库中共有全球30多万名高水平学者可供查询,面向用户提供专家信息查询、专家比对、专家资讯等基本功能。1.2建设内容概述在学科建设的过程中,明确建设的学科方向,提升建设单位整体的科研水平,同时,通过人才的培养或引进,带动学科的发展与建设,是学科建设过程中可尝试的推动学科快速发展的方式。在学术人才方面,针对高校不同类型的用户,具有不同的需求。对建设单位的科研学者来说,他们希望有一个平台可以帮助他们助力科研,提升他们的科研学术水平,使他们能在海量的信息中,快速的了解个人感兴趣的信息,诸如:(1)科研学者相关的或者感兴趣的研究领域,在当下全球有哪些高水平学者?(2)这些高水平学者有哪些高质量成果?(3)这些高水平学者有哪些最新成果?(4)能否邮件推送高水平学者阶段性动态成果?在科研学者潜心科研的过程中,他们希望能增加个人国际影响力,提升个人被引与国际学术声誉等,因此,他们就希望知道,是否有这样一个产品或者数据库,可以帮助他们联络全球高水平学者,寻求国际合作;帮助他们了解高水平学者的合作团队或者能通过合作团队寻求熟人引荐,通过各种方法,实现国际合作,真正提高个人的学术影响力。对高校的学者服务部门或者管理者来说,他们希望可以准确地获知需要引进人才地研究领域在全球范围内有哪些高水平学者;又如何获得这些人的相关信息或联系方式;是否可以通过高水平学者的合作团队,需求推荐其他相关人才进行引进工作。另一方面,高校也希望可以通过提高本校的发文、促进国际发文,增加本校的发文数量,提升本校的被引次数,产生更多的高被引文献,从而提高学校国际声誉,提升大学的国际、国内排名。基于以上不同用户在人才方面的不同需求,我们推出了学者库,旨在有效支撑高端人才引进工作,为政府、高校、科研院所在人才引进、人才评估、数据统计、趋势研究、科技合作、科技人员考核等等方面提供信息支撑服务以及专业的需求解决方案。学者库基于爱思唯尔提供的Scopus版权数据和SciVal研究情报数据,通过大数据分析,按照教育部学位授予和人才培养学科目录以及普通高等学校本科专业目录,集成各领域下的高水平人才基本数据、在全球范围内的学术影响以及学术成果等动态信息并实现相互关联,直观地展示高水平学者研究热点词云、历年的科研情况、学者的合作关系网、合作国家以及发文期刊情况,实现高水平人才信息查询、高水平人才匹配和统计分析等功能,帮助科研人员发现关注细分学科领域高水平度的学者,建立自己的领域学者关系网、跟踪领域研究前沿、促进领域内国际合作,提升高校与科研机构的学术水平,提高国际声誉。2.数据库特点(1)数据来源为爱思唯尔的Scopus数据库的底层版权数据。(2)数据内容涉及全球3万机构中的30万高水平学者以及学者的1700万文献。(3)按照教育部学位授予和人才培养学科目录以及普通高等学校本科专业目录,分别集成展示各个领域下的高水平学者。(4)基于底层数据,进行数据挖掘与二次文献分析,以可视化形式展示数据背后的隐形关联。(5)展示高水平学者学术影响、学术贡献以及知识图谱,促进国际合作,提升科研学者或机构的科研水平、学术声誉,为学科建设与人才引进提供数据支撑。3.业务流程学者库集成全球高被引的30万学者,对学者相关所有数据进行二次分析。具体流程如下:(1)通过人工的方式,补充人员的学术履历;(2)通过大数据分析,对学者文献进行二次分析;(3)以可视化的形式,对收集与分析的数据进行展示:展示学者的基本信息、学者的学术影响、学者的学术贡献以及学者的关联知识图谱。可直观的获悉学者的科研详情。图3-1业务流程图4.数据关联学者库通过大数据分析,以可视化的方式,展示学者科研数据中隐藏的关联。学者关联信息主要包括学者的基础信息与学科的科研信息。学者基础信息则包括:学者姓名:包括学者的简称与学者的全称的对应;学者所属国家;学者所属一级机构、分支机构或实验室研究机构等;学者所属学科;学者的通讯方式。学者的科研信息包括:学者学术影响(h指数、FWCI、国际FWCI);学者历年学术成果;学者履历;学者合作国家;学者合作机构;学者合作作者;学者研究热点;学者发文期刊情况。学者关联信息如下图所示:图4-1高水平学者数据关联图数据库使用说明5.1汇总全球各领域高水平学者,展示全球科研现状(1)科研现状总览首页展示全球科研现状,包括普通高等学校本科专业目录中304个研究领域、教育部学位授予和人才培养学科目中的93个研究领域,301421全球学者(其中华人学者13337人、中国学者14863人)、32820全球机构及17374180学者文献。图5.1-1高水平学者库(2)学科导航左侧导航栏,通过映射关系,按照教育部学位授予和人才培养学科目录以及普通高等学校本科专业目录,展示至三级学科,用户可自主选择细分研究领域,查看各个体系下,全球各个研究领域下的高水平学者科研情况。图5.1-2研究领域(3)全球研究热点与热点研究方向通过对30万学者以及学者相关1700万文献数据的二次分析,聚合出全球前十的研究热点以及热点研究方向(全球研究热点为学者文献关键词聚类所得研究点,研究方向为学者在Scopus中对应的研究方向),在首页以柱状图形式展示全球各研究领域的研究热点与热点研究方向,点击可切换查看。图5.1-3全球各研究领域热点研究方向TOP10(4)全球高水平学者国家/地区分布情况展示高水平学者在全球的分布情况。鼠标移动至圆圈处,可查看当前国家/地区的学者人数。由图可见,全球范围内,聚集高水平学者最多的国家为美国。图5.1-4高水平学者全球分布图5.2助力科研,提升科研水平助力科研学者的学术研究,提升他们的科研学术水平,使他们能在海量的信息中,快速的了解个人感兴趣的信息。(1)机构高水平学者查询在下图标红的检索框内,可根据学者、机构和学科进行高水平学者的检索。以输入的检索词是机构名称为例,输入机构名称:“STANFORDUNIVERSITY”,点击搜索按钮,系统自动匹配相关学者,展示斯坦福大学所有的高水平学者列表、研究热点情况、分布国家、分布机构情况。列表中展示的学者信息包括:学者姓名学者机构学者国家学者的科研情况:发文总数、被引总数、篇均被引次数学者的影响力情况:H指数与FWCI。点击“订阅最新发文”按钮,输入个人的常用邮箱,即可订阅该学者,监测学者的科研动态。在列表页,亦可根据国家、机构,对学者进行筛选。支持根据被引频次、发文量、H指数和FWCI进行排序。图5.2-1按机构查看高水平学者情况以可视化的方式展示机构的研究热点情况(点击可切换显示中文词云与英文词云)、分布国家、分布机构情况。图5.2-2研究热点中英词云(2)学科高水平学者查询在学科左导航,选择个人感兴趣的学科,点击后查看当前所选学科高水平学者情况、研究热点情况、分布国家、分布机构情况。列表中展示的学者信息包括:学者姓名学者机构学者国家学者的科研情况:发文总数、被引总数、篇均被引次数学者的影响力情况:H指数与FWCI。点击“订阅最新发文”按钮,输入个人的常用邮箱,即可订阅该学者,监测学者的科研动态。在列表页,亦可根据国家、机构,对学者进行筛选。支持根据被引频次、发文量、H指数和FWCI进行排序。可学科下高水平学者国家分布情况以及各国家高水平学者占比情况。图5.2-3高水平学者所在国家分布图以柱状图形式展示学科下高水平学者所在机构情况。鼠标移至柱形,可详细查看当前机构高水平学者的具体数量。图5.2-4高水平学者所在机构图以上可通过不同角度,筛选跟踪领域内高水平学者。(3)学者详情查看点击学者姓名,进入学者详情页。学者详情页展示学者的基本信息内容包括:学者姓名学者H指数学者研究热点学者研究方向学者所在机构图5.2-5高水平学者基础信息通过数据的关联与分析,提供高水平学者详细信息与功能包括:提供订阅功能,点击“订阅最新发文”按钮,在弹窗内输入个人的常用邮箱,订阅该学者,即可以邮件的形式,监测学者的科研动态,以邮件形式向科研者推送高水平学者动态或成果。图5.2-6订阅学者最新发文提供学者学术影响情况提供学者发文详细情况:总发文数量、国际发文数量、前1%高被引发文数量、前10%高被引发文数量、国际发文占比情况、前1%高被引发文占比情况、前10%高被引占比情况。图5.2-7学者发文影响力提供学者发文被引详细情况:发文总被引、国际被引情况、遴选去除中国被引情况以及篇均被引情况。图5.2-8学者被引影响力提供学者所在机构的影响力情况,展示学者所在机构各类学术排名的情况,包括:QS、USNEWS、THE以及ARWU。图5.2-9学者所属机构学术影响力提供学者学术影响详细情况:H指数、FWCI以及国际FWCI,并以图示样式具体展示学者的学科规范化引文影响力(FWCI)情况,定位越大(指标越展示越靠右),说明当前学者远高于全球的学科平均值,学术的影响力越大。图5.2-10学者学术影响力提供学者学术贡献情况按发文时间顺序,展示学者历年的发文成果列表。展示学术贡献内容包括:学者所有文献的文章标题、文献的所有作者(区分第一作者)、文献关键词、来源期刊与文献摘要。提供文献的聚类筛选。聚类内容包括:期刊名称、年份、作者、国家以及关键词。图5.2-11学者学术贡献提供学者知识图谱对学者文献数据进行二次分析,并以可视化方式展示学者知识图谱。以表格以及词云的方式,展示学者中英研究热点。可直观查看学者的研究热点或专业。图5.2-12学者研究热点展示学者历年的发文趋势情况,可通过高水平学者历年发文数据趋势情况,分析学者的学术高峰。图5.2-13学者历年发文趋势展示学者的合作图谱情况,分析当前高水平学者的合作情况。图5.2-14学者合作图谱展示学者的发文合作国家分布情况,可直观查看当前学者的合作国家分布情况。图5.2-15学者合作国家分布展示学者的发文期刊与占比情况。图5.2-16学者发文期刊与占比提供学者学术履历通过对学者文献数据进行二次分析,切取学者历年署名机构,以时间轴的方式,展示学者学术履历。图5.2-17学者学术履历5.3增加国际合作,提升学术声誉提供高水平学者的联系方式,用户通过Email的方式,联系感兴趣学者或其合作者,寻求国际合作,带动个人高水平文献的发表,提高个人的被引影响力。图5.3-1学者联系互动以知识图谱的方式,展示全球领域高水平学者合作情况,展示学者的合作国家分布以及合作机构情况,通过分布情况的展示,进行科研跟踪或国际合作,指引机构学者的发文,促进国际合作文献的发表,提升文献被引的机率,从而提高机构的学术声誉。图5.3-2合作国家分布5.4形成引进人才靶向目标库基于教育部学位授予和人才培养学科目录以及普通高等学校本科专业目录,展示对应学科下所有高水平学者,学者研究热点,国家分布情况以及机构分布情况,帮助相关职能部门找寻研究热点下专业人才,助力筛选想要引进的人员。图5.4-1研究领域高水平学者研究热点图5.4-2研究领域高水平学者国家分布图5.4-3研究领域高水平学者机构分布图5.4-4作者发文情况学者知识图谱中,以可视化方式展示当前高水平学者的合作图谱,在无法引进当前高水平学者的情况下,通过查看高水平学者的合作关系,找出潜在的可引进的相关人才,助力高层次人才的引进。图5.4-5高水平学者合作情况展示学者学术履历中,展示当前高水平学者的历年发文机构具体情况,为人才的引进提供事实数据参考。图5.4-6高水平学者合作情况展示技术路线6.1MPP大规模并行处理(MPP)技术是从原来的并行数据库发展而来的,基于关系数据库的成熟技术,伴随着分布式与并行数据库技术的发展而来的。其中最为关键的技术就是它能够判断出数据之间的相互依赖关系,将可以并行的部分分发到各个节点上并行运行,针对关系数据库中最为常用的等值比较和等值联接(Join)等操作做出特别的优化,将待比较的列按照某种规律进行hash,根据不同的hash值分发到不同的节点上去进行比较处理(它可以被看作是HashJoin的分布式版本)。将查询中能并行的操作和操作产生的中间结果,通过这样的方式分发到不同的节点上去运算,从而最大程度地并行处理,来达到提高性能的方法。6.2HadoopHadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。
Hadoop实现了一个分布式文件系统(HadoopDistributedFileSystem),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的硬件上;而且它提供高吞吐量来访问应用程序的数据,适合那些有着超大数据集的应用程序。HDFS放宽了POSIX的要求,可以以流的形式访问文件系统中的数据。Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。6.3SparkApacheSpark是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UCBerkeleyAMPlab所开源的类HadoopMapReduce的通用并行框架,Spark拥有HadoopMapReduce所具有的优点;但不同于MapReduce的是Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。Spark是一种与
Hadoop
相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使Spark在某些工作负载方面表现得更加优越,换句话说,Spark启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。Spark是在
Scala
语言中实现的,它将Scala用作其应用程序框架。与Hadoop不同,Spark和Scala能够紧密集成,其中的Scala可以像操作本地集合对象一样轻松地操作分布式数据集。尽管创建Spark是为了支持分布式数据集上的迭代作业,它是对Hadoop的补充,可以在Hadoop文件系统中并行运行。通过名为Mesos的第三方集群框架可以支持此行为。Spark可用来构建大型的、低延迟的数据分析应用程序。6.4SphnixSphinx是一个在GPLv2下分发的全文检索引擎;一般而言,Sphinx是一个独立的全文搜索引擎;Sphinx可以非常容易的与SQL数据库和脚本语言集成。系统内置MySQL和PostgreSQL数据库数据源的支持,也支持从管道标准输入读
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医疗软件购买合同范本
- 县城餐饮转让合同范本
- 三个合伙购房合同范例
- 厨师保密协议合同范本
- 原油供销合同范例
- 合伙创业办厂合同范本
- 卖卖布合同范本
- 加工砖头销售合同范本
- 人保车险客户专员合同范本
- 分期购买钉鞋合同范本
- 动画分镜头脚本设计课件
- DB37T 5245-2022 桥梁智慧健康监测技术标准
- 学校餐厅除虫灭害记录表
- 落地式钢管脚手架验收记录表
- 供应商变更申请表
- 冢本监督的番号前缀及一些简介
- 放射诊疗机构放射治疗诊疗科目放射防护管理情况自查表
- 幼儿教师口语(学前教育专业高职)PPT完整全套教学课件
- 电压互感器试验报告
- 中学体育教学设计PPT完整全套教学课件
- 功能科运用PDCA循环提高超声报告图像质量PDCA成果汇报
评论
0/150
提交评论