![2023人工智能图计算_第1页](http://file4.renrendoc.com/view/b682d9e6914392fad6c36ecf65e73b5f/b682d9e6914392fad6c36ecf65e73b5f1.gif)
![2023人工智能图计算_第2页](http://file4.renrendoc.com/view/b682d9e6914392fad6c36ecf65e73b5f/b682d9e6914392fad6c36ecf65e73b5f2.gif)
![2023人工智能图计算_第3页](http://file4.renrendoc.com/view/b682d9e6914392fad6c36ecf65e73b5f/b682d9e6914392fad6c36ecf65e73b5f3.gif)
![2023人工智能图计算_第4页](http://file4.renrendoc.com/view/b682d9e6914392fad6c36ecf65e73b5f/b682d9e6914392fad6c36ecf65e73b5f4.gif)
![2023人工智能图计算_第5页](http://file4.renrendoc.com/view/b682d9e6914392fad6c36ecf65e73b5f/b682d9e6914392fad6c36ecf65e73b5f5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
/uhome/6011145050000024.html人工智能图计算/uhome/6011145050000024.html目录概篇 1计的义 1计的生发展 2计的征 3计的展境 5技篇 6算法 6数计模型 7计系统 12计中关技术 20术战 22术源 24引文 25人篇 27者况览 27型者介 31产应篇 39疗业应用 39融业应用 39联行的用 40趋篇 43局度 43期度 43叉究析 44术见 48附录 50图表目录图1图据型子 1图2图算发展 3图3图据算型及应系统 8图4计系框分类 13图5VenueColletionofOAG 24图6PaperCollectionofOAG 24图7AuthorCollectionofOAG 24图8全图算域学者布图 27图9中图算域学者布图 28图10全图算域跃学迁图 29图11全图算域跃学机分布 29图12全图算域跃者h-index分布 30图13全图算域跃学性比 30图14全图算域跃学性比 41图15腾星应场景 42图16腾星应场景 43图17graphcomputing期热度 43图182007今graphcomputing与datamining领交叉析 45图192007今graphcomputing与machinelearning领域叉析 46图20图算术见图 48表1图算应用 2表2图算型比 12表3图算统览 19表42007至今graphcomputing与datamining领叉分析 45表52007年今graphcomputing与datamining交叉研文citation分布 45表72007年今graphcomputing与machinelearning领交研学者h-index分布 47表82007年今graphcomputing与machinelearning领交研论文citation分布 47摘要图计算是基于图数据的分析技术与关系技术应运而生的,图计算系统是针对处理图结图计算领域专家介绍。依据AMiner数据平台信息,对图计算领域研究学者进行梳理,h-index图计算趋势研究。对图计算的发展趋势特点进行分析。并基于AMiner数据平台,对近/uhome/6011145050000024.html概述篇图计算的定义Gap(即Eweb((()图1图数据典型例子图相关的算法。比如图的最短路径算法可以做好友推荐,计算关系紧密程度;对图做PageRankFacebook20147122GBTB1PAGEPAGE24.51.5数据包含全量的站点1425\h\h文件400GB表1图计算的应用应用元素(图计算顶点)连接(图计算的边)社交网络社交成员友情计算机网络计算机网络链接网页内容网页超链接交通城市公路电路设备电线商务顾客、商品交易方式工厂机械设备生产线供应链供应商距离电信移动电话电话沟通图计算的产生与发展尽管图形分析一直以来都是计算机相关研究的一个重要领域,但图计算的研究在近年20012004GoogleApacheHadoopHadoop(HDFS)以及新的HadoopMapReduce2009AMPLabSparkMapReduceMapReduce(buknchonouspocen)BSPBSPBSP基于BSP2010PregelGooglePregel统GraphLab,其经过多个版本演化已发展成为当前最有影响力的图计算系统之一。虽然pregelGraphLab(iteration)是20142015KineograghChronos和ImmortalGraphGraphEngine系统变得格外受欢迎,出现了多个具有不同编程模型和功能的分布式图处理框架,比如Giraph、Gemini图2图计算的发展图计算的特征“图”是针对“图论”而言的,是一种以“图论”为基础的对现实世界的一种“图”结构图计算系统将图结构化数据表示为属性图,它将用户定义的属性与每个顶点和边缘相((PageRankED,其中V图计算系统的数据结构很好地表达了数据之间的关联性,关联性计算是大数据计算的核心——图数据模型并行抽象图的经典算法中,从PageRank例如Pregel)或共享状态(例如/uhome/6011145050000024.html图模型系统优化对图数据模型进行抽象和对稀疏图模型结构进行限制,使一系列重要的系统得到了优GraphLabGASGatherApplyScatterGASPregel图计算的发展困境Spark[1]MapReduceMPIOpenMPSparkSparkScalaJVM128Spark2010TB往往需要数百TBSogou137TBSparkweb技术篇图算法PageRank、BayesianBeliefPropagationPrim算法和Kruskal(1)(2)(3)(4)0,(CommunityDetection)66PAGEPAGE10FacebookTwitter等PageRankPageRankSergeyBrinLarryPage1998PageRankPageRank搜索weibo,会出来非常多有着weibo关键字的网页,可能有上千上万个相关网页,而PageRank最短路径用于计算一个节点到其他所有节点的最短路径。主要特点是以起始点为中心图数据计算模型图计算模型即针对图数据和图计算特点设计实现的计算模型,一般应用于图计算系统中。与传统计算模型相比,图计算模型主要针对解决以下问题:(1)图计算的频繁迭代带来的读写数据等待和通信开销大的问题;(2)图算法对节点和边的邻居信息的计算依赖问题;(3)图数据的复杂结构使得图算法难以实现分布不均匀的分块上并行计算的问题。图3图数据计算模型分类及应用系统MapReduceMapReduce2010BSPopue函数;由于图算法在不同节点上的迭代次数不同,每个节点都执行相同轮次的迭代计算是不合理的,所以同步计算模型将节点分为活跃(active)和不活跃(inactive)两种状态。当节(inneighbor)(不)MapReduceGiraphGPS、Mizan、xDGPLogGP2010GraphLab,2012distributedGraphLabBSP(1)((GAS(gather、apply、scatter)Gonzalez等人提出了GASGAS(1)(gather)GASGASGASGASBiGraphPowerLyra。然而,GAS节点中心模型提高了图计算系统实现图数据计算分析的能力,但是在实际应用中仍面(1)(2)为解决设备资源受限和边数目远大于节点数目时的图数据分析计算问题,洛桑联邦理2013XStream1(2)应用将目的节点列表重排序(shuffle)为更新消息流;(3)读取更新消息流和源节点列表,更新源节点值。三步操作在一次迭代计算中顺序执行。边中心计算模型将图数据以边列表为核心数据结构并维护源节点列表,每次迭代的计限和通信开销过大的难题。边中心计算模型的流式顺序计算特点使得在全局图数据上的计边中心计算模型和节点中心计算模型分别将图算法转换为可在节点和边上执行的迭代PathGraph。(oadedeaesle(ees-edgetraversaltree)路径中心计算模型从数据结构决定图算法计算顺序的角度出发,设计前向边遍历树和心计算模型,当图节点规模在百万级以上和边规模在亿级以上的数据集上测试BFS、PageRank~路径中心计算模型相比以节点或边作为计算中心的模型更接近图结构上的理想计算状(1)(2)2013年在图计算系统Giraph++:(1);(2)表2图计算模型对比图计算模型任务调度数据划分并行性系统实现优势局限节点中心同步/异步节点序列子集高分布式/单机边中心同步/异步边序列分块中单机模型实现对设备资源要求低;数据存储、分块和读写访问更加简单;数据访问顺序执行,易于维护数据一致性计算并行性受边列表分块限制;图算法迁移复杂,且适用范围小路径中心同步子树中分布式/单机数据查找访问简单快捷;基于两步操作,图算法实现简单构建遍历树的初始化开销大;数据一致性实现复杂;模型实现困难,且数据存储复杂子图中心同步/异步子图低分布式/单机超步运算之间通信开销小;完成图算法的迭代次数少图计算系统2080OracleMySQL(RDBMS)Neo4j、InfiniteGraph依据大规模图计算系统的使用场景以及计算平台架构的不同,我们将其分为单机内存图计算系统、单机外存图计算系统、分布式内存图计算系统和分布式外存图计算系统。图4计算系统框架分类单机内存图处理系统就是图处理系统运行在单机环境,并且将图数据全部缓冲到内存(Single-machineout-of-coresystems)trillion的图。下面对各类典型的图计算系统逐一做简单介绍:2013LigraGalois2015年发布的GraphMat和Polymer。其中LigraGalois使用出更复杂的算法完成图分析工作,并发现当输入图是道路网络或者具有较大直径的图时能DSLs基础上提供了轻量级的GraphMat是第一个对多核CPUPolymerNUMAintra-node还是RAMSSD、SASHDDGraphChi、TurboGraphX-StreamPathGraphGridGraphFlashGraph。这些系统在最大化磁盘顺序读写、选择调度和同异步计算模式等方面做出了重要探索,TurboGraphFlashGraphGraphChiGraphChiGASshard(PSW)shardPSWGraphChi在计算前首先会对图数据进行预处理,将输入的图划分成多个shard,每个shardIDshardshardGraphChi心的计算模型,使用并行滑动窗口(parallelslidingwindow)来加载数据进行计算。每次shard()shard(),X-StreamX-StreamscattergatherX-Stream(CacheRAM,RAMSSD/Disk)X-Stream流式访问图数据,其流划分相比于GraphChi无需shardwork-stealingScatter-Gather导X-StreamshuffleVENUS2013VENUS成为10IOGraphLab+(scale(scaleup)(scaleout)VENUS每一个数据分片被分为v-shard和g-shardv-shardg-shardVENUSg-shardIOg-shards-shardv-shardg-shardv-shardg-shardv-shardIOGridGraphGridGraphPchunkP*PblockchunkchunkCache/RAM/DiskStreamverticesandedges(DualSlidingWindows)大大减少了开blockX-Streamshuffleblock能达到最大化的Cache/Memory命中率。PregelPiccolo,同时支持同步和异步的系统PowerGraphGraphLabGraphXPowerSwitch和PowerLyra则对PowerGraphPregel为了更有效地解决大规模图上的计算问题,学术界与工业界提出了大量专门为图优化PregelGoogle的图计算领域的开山之作,是首个采用BSP(messageBSP(BarrierGiraph是PregelFacebook在Pregelcompute((activevertex)会执行compute()((inactivevertex)在下一轮收到消息时,就会重新处于活跃状态。当所有活跃的点执行完compute()函数之后,当前迭代结束,并且进入到下一次迭代。如果系统当中所有的点都处于不活跃状态,并且没有任何新的消息,算法结束。GiraphGiraph构建在HadoopGooglePregelFacebookGiraphGiraphGiraphGraphLabPregelBSPGraphLabGASGraphLab(sharedmemory)GraphLab上GAS行该函数。在gather阶段,每个执行GASapplyscatter的邻点。在GraphLabGraphLab(synchronous(asynchronousexecution)PageRankBP)PowerGraphPowerGraph是面向分布式内存的解决方案,通过使用更多的机器来扩展能够处理的图的规模。PowerGraph包含在GraphLab2.2中,是在GraphLab的基础上对符合幂律分布(power-law)PowerGraph少了通信量以及由度数较高顶点导致的负载不均衡。后续的很多分布式图计算系统比如GraphXPowerLyra等均沿用了PowerGraphGraphXGraphX是一个基于ApacheSpark(ApacheSparkGraphXPregel和GraphLabSpark中RDD(resilientdistributeddataset),引入了RDG(resilientdistributedjoinmapSparkvertex-cutGraphXGraphXAPIGraphX化重新分配为分布式连接优化和材料化视图维护。通过利用分布式数据流框架的进步,GraphXGeminiGeminiGemini针对图结构的稀疏或稠密情况使用与Ligra相同的自适应推动/拉动了eniokeang)的GeminiSingle-machineout-of-coresystems2015Chaos。ChaosX-Streamwork-stealingChaos新集依然很庞大与边量级相当;计算与存储独立设计增加了系统的复杂性和不可避免的通信开销;存储子系统为了使存储设备时刻忙碌而占用了较多的计算资源。TuX2TuX210TuX2表3图计算系统概览年份系统编程模型架构运算模型通信模型调度存储方式2009PEGASUSN/ADN/ADFSynchDB2010PregelVDBSPMPSynchDB2010Signal/CollectVSSignal/CollectMPBothDB2010SurfurVDTransfer-combineMPSynchDB2010JPregelVDBSPMPSynchDB2010GraphLabVSN/ASMAsynchDB2010PiccoloDaDThreePhasesDFSynchDB2011GoldenOrdVDBSPSMSynchDB2011GBaseEDN/ADFSynchDB2011HipGVDBSPSMBothDB2012GiraphVDBSPMPSynchDB2012DistributedGraphLabVDGASSMBothDB2012KineoGraphVDPush/pullMPSynchMB2012PowerGraphEDGASSMBothDB2012SedgeVDBSPMPSynchDB2012GraphChiVSPSWSMAsynchDB2013TOTEMVHBSPMP&SMAsynchMB2013MizanVDBSPMPSynchDB2013TrinityVDTSLSMAsynchMB2013GraceVSThreephasesMPAsynchDB2013GPSVDBSPMPSynchDB2013Giraph++CDBSPMP&SMBothDB2013NaiadVDTimelydataflowSMBothMB2013PAGEVDPartition-awareMPSynchDB2013StratospherVDPush/pullDFSynchDB2013TurboGraphVSPin-and-slideSMAsynchDB2013xDGPVDBSPMPSynchDB2013X-StreamESScatter-gatherMPSynchDB2013GiraphXVDBSPSMAsynchDB2013GraphXEDGASDFSynchMB2013GaloisVSADPSMAsynchDB2013GREVDScatter-combineMPSynchDB2013LigraCSPush-pullSMAsynchMB2013LFGreaphVDN/ASMSynchMB2013PowerSwitchVDHybridSMBothDB2013PrestoVDN/ADFSynchDB2013MedusaVHEMVMPSynchMB2014RASPVSScatter-gatherSMAsynchDB2014GoFFishCDIterativeBSPMP&SMSynchMB2014GasCLVHGASMPSynchMB2014CuSHaVHGASSMAsynchMB2014BPPVSBSPSMAsynchDB2014ImitatorVDBSPMPSynchDB2014GraphHPVDBSPMPSynchDB2014PathGraphPSScatter-gatherSMAsynchDB2014SeraphVDGESMPSynchDB2014GraphGenVHN/ASMSynchMB2014BlogelBDN/AMPSynchMB2015PregelixVDJoin-operatorbasedMPSynchDB2015FlashGraphVSBSPMP&SMAsynchDB2015GraSPVDN/AMPSynchMB2015ChaosEDGASMPSynchDB2015GraphMapVDBSPMPSynchDB2015GridGraphESStreaming-ApplySMAsynchDB2015GraphTwistESSlice/CutpruningSMAsynchDB2015GraphQVSCheck/RefineSMAsynchDB2016GunrockDaHBSPSMSynchMB2016GraphInVDI-GASMPSynchMB2016LCC-GraphVDLLC-BSPMPSynchMB2016DUALSIMVSN/ASMAsynchDB2016iGiraphVDBSPMPSynchDB2017GraphMPVSVSWSMAsynchDB2017GraphGenVSN/ASMAsynchMB2017MosaicV/ESPRAMPSynchDB-编程模型:以顶点为中心(V),以边缘为中心(E),以组件为中心(C),以路径为中心(P),以数据为中心(Da),以块为中心(B)-架构:分布式(D),单机(S),异构(H)-运算模型:不同系统使用不同的名称-通信模型:消息传递(MP),存储器共享(SM),数据流(DF)-调度:同步(Synch),异步(Asynch),混合调度(Both)-存储方式:基于磁盘(DB),基于内存(MB)-N/A表示没有特定的名称或定义图计算中的关键技术本节将重点介绍在分布式和单机图处理系统中常用的技术。GPUCPUTOTEMCPUGPUMapGraph和CuShaGPUGPUCPUharddiskdrive如TurboGraphFlashGraph)针对SSDSDDPregelGiraphGraphLab和PowerGraph)(ghostNPGphhi使用shdshdedge-cutvertexcutedge-cutvertex-cutvertex-cut有助于系统的负载均衡,但是图计算系统需要使用以边为中心的计算模型,如PowerGraph。负载均衡的算法分为静态负载均衡和动态负载均衡,静态负载均衡在算法执行之前进容错checkpointlog技术挑战MPINP高访存/计算比I/O/技术资源OpenAcademicMicrosoftAcademicAMIner(\h/oag2019)OGA2019呈现为下面三个图,包括VenueCollectionPaperCollectionAuthorCollection图5VenueColletionofOAG图6PaperCollectionofOAG图7AuthorCollectionofOAG高引论文下边是一些图计算相关引用量较高的论文:\hPregel:asystemforlarge-scalegraphprocessingSIGMODConference,,pp.135-146,(2010)DistributedGraphLab:aframeworkformachinelearninganddatamininginthecloud8PowerGraph:distributedgraph-parallelcomputationonnaturalgraphsGraphLab:ANewFrameworkForParallelMachineLearning.YuchengLow,JosephGonzalez,AapoKyrola,DannyBickson,CarlosGuestrin,JosephM.HellersteinClinicalOrthopaedicsandRelatedResearch,(2014)GraphChi:large-scalegraphcomputationonjustaPCAapoKyrola,GuyBlelloch,andCarlosGuestrin.GraphChi:large-scalegraphcomputationonjustaPC.OSDI,2012.Graphx:GraphprocessinginadistributeddataflowframeworkJosephE.Gonzalez,ReynoldS.Xin,AnkurDave,DanielCrankshaw,MichaelJ.Franklin,IonStoicaOSDI,,pp.599-613,(2014)X-Stream:edge-centricgraphprocessingusingstreamingpartitionsAmitabhaRoy,IvoMihailovic,IvoMihailovic,WillyZwaenepoelSOSP,,pp.472-488,(2013)\h/pdf/20170130/pdfs/sosp/ozz12hqruancqbijue8b6pm7siewytf0.pdfLigra:alightweightgraphprocessingframeworkforsharedmemoryJulianShun,GuyE.BlellochPPOPP,,pp.135-146,(2013)\h/pdf/20170130/pdfs/ppopp/gxrite4sseq1juzxofcanzbnplrhh5kv.pdfPowerLyra:differentiatedgraphcomputationandpartitioningonskewedgraphsGridGraph:Large-ScaleGraphProcessingonaSingleMachineUsing2-LevelHierarchicalPartitioningXiaoweiZhu,WentaoHan,WenguangChenUSENIXAnnualTechnicalConference,,(2015)GridGraph:Large-ScaleGraphProcessingonaSingleMachineUsing2-LevelHierarchicalPartitioningXiaoweiZhu,WentaoHan,WenguangChenUSENIXAnnualTechnicalConference,,(2015)RongChen,JiaxinShi,YanzheChen,andHaiboChen.PowerLyra:differentiatedgraphcomputationandpartitioningonskewedgraphs.EuroSys,2015.人才篇Google还是图计算相关的重要会议包括:OSDI(USENIXSymposiumonOperatingSystemsDesignandImplementation)SOSP(SymposiumonOperatingSystemsPrinciples)USENIXATC(USENIXAnnualTechnicalConference)VLDB(InternationalConferenceonVeryLargeDataBases)SIGMOD(SpecialInterestGrouponManagementOfData)EuroSys(TheEuropeanConferenceonComputerSystems)SIGPLANAnnualSymposiumPrinciplesandPracticeofParallelProgramming)等。10年(20092018)graphgraphcomputinggraphpatterngraphmininggraphprocessing等1000学者情况概览本节对这些学者进行了简单的统计分析,包括他们的分布地图、迁徙状况、机构分布、h-index水平、性别分布等。27图8全球图计算领域活跃学者分布图27PAGEPAGE28AMiner89图9中国图计算领域活跃学者分布图10图10全球图计算领域活跃学者迁徙图UniversityofCaliforniaUniversityofIllinoisatUrbanaChampaignTheChineseUniversityofHongKongCarnenieMellonUniversityNationalUniversityofSingaporeUniversityofScienceandTechnologyofChinaUniversityofWashingtonTeradataAsterCornellParasolPekingUniversityStanfordUniversityUniversityofWaterlooHongKongUniversityofScienceandTechnologyFudanNanyangTechnologicalUniversityUniversityofNewSouthWalesTsinghuaUniversity5526201717171615121110988888766650 10 20 30 40 50 60图11全球图计算领域活跃学者机构分布11Microsoft()5526UniversityofCalifornia(2010171110人以下的机构分别有PekingUniversity(北京大学)HongKongUniversityofScienceandTechnology(、FudanUniversity(复旦大学)以及TsinghuaUniversity(清华大学)。700184987018498706495004003002001000≥61 41-60 21-40 ≤20图12全球图计算领域活跃学者h-index分布h-index21h-index≥2138.03%;可见,h-index61.97%h-index2064964.84%;h-index≥60706.99%。女37人,3.69%男964人,96.31%图13全球图计算领域活跃学者性别比在性别比例方面,男性(占比96.31%)占据多数,比例要远高于该领域女性所占比例(3.69%)。典型学者简介h-index(有疏漏,还请与AMiner\h/国外学者简介IonStoicaIonStoica\h,美国加州大学伯克利分校的\h计算机科学系\h教授,\hAMPLab的共同创始人,Spark核心作者。\h\h\h,\h\h。2000\h业博士学位。其研究主题包括\hChord((CSFQ)InternetHuiZhang是P2PEndSystemMulticastIonStoicaHuiZhang的基础上进一步将P2P技SIGCOMM'01Chord:Ascalablepeer-to-peerlookupserviceforinternetapplications》成为结构化P2PIonStoica的研究兴趣包括\h云计算、\h网络、\h分布式系统和\h大数据。他在\h计算机科学的各个领域撰写或共同撰写了100多篇\h同行评审论文。2001年获得奖;20032007年获得CoNEXT(InternationalConferenceonemergingNetworkingEXperimentsandTechnologies)2011SIGCOMM(SpecialInterestGrouponDataCommunication美国计算机协会ACM数据通信专业组)时间测试奖。\h\hStoica在\h担任\h2006Conviva\h(CTO)CMU\hEndSystemMulticast2013\hDatabricks,20161\hAliGhodsiACM()Fellow。WillyZwaenepoelWillyZwaenepoel,ACM2018615WillyZwaenepoel1984WebTreadmarksOpenMP的工作促成了iMimicNetworking20002005他目前的兴趣包括大规模数据存储和软件测试。他在软件测试方面的工作促成了一家BugBusterBugBuster1998IEEEFellow,2000ACMFellow19982002IEEE年担任OSDI项InternationalConferenceonMobileSystems,Applications,andServices)2006Eurosys项目主席。20029月,他加入了polytechniquefédéraledeLausanne20022011EPFLEPFL之前,(RiceUniversity)KarlHasselmann2000他分别在1984年SigComm,1999年的OSDI、Usenix2000、Usenix2006和Eurosys2007上获得了最佳论文奖。他还获得了2007年IEEETsutomuKanai奖。KeshavKPingaliKeshavKPingali,美国计算机科学家,ACMFellow,IEEEFellow\h,德克萨斯大学奥斯\h汀分校网格和分布式计算的\hWilliamMoncrief主席。KeshavKPingali于1986年获得麻省理工学院硕士和博士学位。他曾获得2013年IITKanpur杰出校友奖。KeshavKPingali\h\hWilliamMoncrief2003年-2006\h\hNRamaRao教授。他还是AAAS(\hACMIEEEFellow。GuyE.BlellochGuyE.Blelloch,ACMFellow,卡内基梅隆大学计算机科学系教授,以并行编程和并行算法领域的研究而闻名。GuyE.Blelloch在卡内基梅隆大学教授现实世界中的算法、并行算法课程,以及并行和顺序数据结构和算法课程。10CarlosGuestrinCaosGueTui曾用名Gaphab和DaTur)PpuarScec(208Bant1010。CarlosGuestrinPaulG.AllenCarlosGuestrinFinmeccanicaTuri2009年卡耐2016andWorkshoponNeuralInformationProcessingSystems)2003和2007,VLDB2004,UAI(ConferenceonUnceanynAcalnelgence200CM(nenaonalCneenceonMhneeanng)2005,IPSN(InternationalConferenceonInformationProcessinginSensorNetworks)2005和DiscoveryandData(InternationalConferenceonArtificialIntelligenceandStatistics)2010,JAIR(JournalofArtificialIntelligenceResearch)20072012ONRNSF(NationalScienceFoundationAlfredP.Sloan奖学金和斯坦福百年教学助理奖的获得者。他还获得了IJCAI(InternationalJointConferenceonArtificialIntelligence)计算机和思想奖以及科学家和PECASE(。PDeenedancedReeachPoecsgency)(ISAT)ChristosFaloutsosChristosFaloutsos,被誉为“数据库大师”。ChristosFaloutsos19891994SIGMOD1997年以他的R+VLDBforComputingMachinery)2010SIGKDDChristosFaloutsos发表了300多篇评论文章,一篇专著,并拥有五项专利。他是SIGKDD国际会议执行委员会成员,并在2010年被任命为ACMFellow。国内学者简介陈文光陈文光于2000年获得清华大学计算机系博士学位。2007年-2015年任清华大学计算机系副主任、现任清华大学计算机系学术委员会副主任,兼任青海大学计算机系主任。他是ACM中国操作系统分会ChinaSysAmericanCommonMarket)JournalofComputerScienceandTechnolog》计算机系统与体系结构LeadingEditor,《软件学报》责任编委,曾经参与编著《JAVA虚拟机规范》以及《MPI与OpenMP并行程序设计:C语言版世界著名计算机教材精选》等书。ASPLOS(ACMInternationalConferenceonArchitecturalSupportforProgrammingLanguagesandOperatingSystems),PLDI(ACMSIGPLANconferenceonProgrammingLanguageDesignandImplementation),PPoPP,SC(SupercomputingConference算大会),CGO(InternationalSymposiumonCodeGenerationandOptimization),IPDPS(InternationalParallelandDistributedProcessingSymposium),APSYS(ACMAsia-PacificWorkshoponSystems)等领域内重要会议的程序委员会委员。11陈文光长期研究高性能计算编程模型和编译系统,近几年在以图计算系统为代表的新一代大数据处理系统方面取得了进展。2014GridGraph性能比国际上同类单机图处理引擎如X-STREAM和GraphChi个数量级,论文在USENIXATC152016/据分析应用(如PageRank、ALS等)上的性能是国际同类图计算系统PowerGraph和PowerLyraSpark100其十分之一,其论文在OSDI16陈海波陈海波,现任上海交通大学软件学院教授,PowerLyra共同作者,主要研究领域为系统软件,系统结构与系统虚拟化。他于2009年获得复旦大学计算机系统结构专业博士学位。VMWare2011ACM(APSys2011)2012年UENXUsnAC2022013(SOSP(EuroSys2013)程序委员会委员。其相关研究成果发表在诸多国际顶级会议如国际操作系统原理大会国(MICRO)(ICSE),IEEETransactionsonSoftwareEngineering等。2009IT2010IBMX1020112009年中国计算机学会优秀博士论文奖,他还于2012年获得NetApp学院奖学金。武永卫IEEECloudComputing2002(/系统的远程部署方法、基于网络的高性他提出了基于区间的高性能计算系统的负载预测方法,为改善高性能计算系统的运行效能提供支持。该方法系统分析和聚类各种高性能计算系统的运行trace特点,通过自适应//作为开发组组长,他研制完成的网格中间件系统CGSP支持了中国教育科研网格GlobusToolkitsTsinghuaCloudCloudBookCorsair200811ScalComIMIS2014FSEACMSIGSOFT杰出论文奖;20152015ScienceandTechnology代亚非代亚非,现\h任北京大学信息科学技术学院\h教授,从事分布式系统方面的研究工作。她于1993年从哈尔滨工业大学计算机系获得\h博士学位。\h\h\h和\hP2PP2PP2P存储系统Amazingstore973863\h\h国\h\h2142015产业应用篇2016IBMFacebookTwitter医疗行业的应用图计算的出现使得对病人的智能诊断成为可能。对病人开具处方需要依据病人的病情(SQL金融行业的应用39(39PAGEPAGE40业务场景的数据分析和挖掘目标。而图计算和基于图的认知分析正是在这方面弥补了传统(Placement)面对这样的复杂困难问题,目前金融机构采取的手段都是基于预先设定的规则来分析80%[3]。互联网行业的应用ITGooglePregel、FacebookGraphGES华为——GESEngine其主要应用场景如下:图14全球图计算领域活跃学者性别比百度——Hugegraph百度安全开源的图数据库(Vertex)和边(Edge),实现ApacheTinkerPop3框架,支持Gremlin(StarKnowledgeGraph,即SKG)14图15腾讯星图应用场景分析(地图LightningGraphNeptuneAmazonNeptuneAmazonNeptune以存储数十亿个关系并将图查询延迟降低到毫秒级。AmazonNeptune支持常见的图模型PropertyGraphW3CRDFApacheTinkerPopGremlinSPARQL。NeptuneTigerGraphTigerGraph(3TigerGraph的Parallel趋势篇全局热度16图16腾讯星图应用场景从全局的角度来看,自1992年至今,datamining、computervision、graphmatching、patternrecognition等一直都是研究人员研究的重点。近期热度相较于全局热点,largegraph、socialnetwork、graphtheory、datamining、editdistance等则是近期的研究重点,具体热度趋势如下图所示:43图17graphcomputing近期热度43PAGEPAGE44交叉研究分析根据全局热点与近期热点的趋势图,我们选取graphcomputing&datamining、graphcomputing&machinelearning、graphcomputing&socialnetwork2007预测仅以未来3年为周期来探讨。领域交叉热力值由交叉研究的论文的citation等数据加权计算得出,热力值越高,表明这两个交叉子领域交叉研究的越深入和广泛。学者研究影响度由交叉领域内论文量,h-index等计算得出;论文相关度由交叉领域内论文的关联程度和引用数量等计算得出。(citation)GraphComputing&DataMining我们选取graphcomputing的11个相关领域作为研究对象,具体包括:1.graphcomputing 2.datastructures3.graphmining 4.database5.graphtheory 6.algorithms7.distributedcomputing 8.putationalgeometry 10.numericalanalysis11.textanalysisdatamining101.datamining 2.clustering3.textmining 4.classification5.taxonomy 6.timeseriesanalysis7.associationrule 8.bigdata9.datamanagement 10.networkanalysis对两个领域的细分子领域进行笛卡尔乘积热点挖掘,得出历史交叉热点图如下所示:图182007至今graphcomputing与datamining领域交叉分析2007492166graphcomputingdatamining16922034.38%223063h-indexcitation表42007至今graphcomputing与datamining领域交叉分析h-index专家人数分布占比小于1046937995.37%10~20158223.21%20~4052531.07%大于4011280.23%总计492166100%表52007年至今graphcomputing与datamining交叉研究论文citation分布citation专家人数分布占比小于109911944.44%1~107653334.31%10~1004265419.12%100~20029461.32%大于20018110.81%总计223063100%GraphComputing&MachineLearninggraphcomputing111.graphcomputing 2.datastructures3.supervisedlearning 4.database5.algorithms 6.graphworkanalysis 8.distributedcomputing9.systemmodeling 10.numericalanalysis11.textanalysismachinelearning101.machinelearning 2.neuralnetworks3.unsupervisedlearning 4.clusteranalysis5.regularization 6.anomalydetection7.reinforcementlearning 8.dynamicprogramming9.supportvectormachines 10.objectrecognition对两个领域的细分子领域进行笛卡尔乘积热点挖掘,得出历史交叉热点图如下所示:图192007至今graphcomputing与machinelearning领域交叉分析2007331387graphcomputingmachinelearning12679338.26%151511h-indexcitation表62007年至今graphcomputing与machinelearning领域交叉研究学者h-index分布h-index专家人数分布占比小于1031016193.59%10~20133304.02%20~4056621.71%大于4013440.41%总计331387100%表72007年至今graphcomputing与machinelearning领域交叉研究论文citation分布Citation专家人数分布占比小于106590543.50%1~105316235.09%10~1002893519.10%100~20021641.43%大于20013450.89%总计151511100%技术预见AMinercobnaoalagohasoaonsheeuanodn、empiricalentropysuffixtreehypergraphssub-dominanthypercubedissimilaritypathsandconnectivityproblemsroutingnp-completenesscomputationalcomplexityshortestpathgraphenumeration。图20图计算技术预见图PAGEPAGE51附录GraphComputing知识图谱(共包含二级节点15个,三级节点93个):领域二级分类三级分类图计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030全球5C超快充电池行业调研及趋势分析报告
- 2025年全球及中国火药量器行业头部企业市场占有率及排名调研报告
- 2025融资买卖合同范文
- 酒水购销合同模板
- 分期付款买卖合同参考范文
- 2025太原市购房合同范本范文
- 水果长期供应购销合同范本
- 2025厨房设备购买合同样本
- 灯具购销合同书范本
- 探索未知世界主题班会
- 2024年中考语文 (湖北专用)专题一 字音、字形课件
- T-ACEF 095-2023 挥发性有机物泄漏检测红外成像仪(OGI)技术要求及监测规范
- 2023年全国高考乙卷历史真题试卷及答案
- 骨科手术的术后饮食和营养指导
- 旅游定制师入行培训方案
- 2024年中国南方航空股份有限公司招聘笔试参考题库含答案解析
- 六年级上册数学应用题100题
- 个人代卖协议
- 赏析小说语言(二)
- 【立高食品公司的偿债能力现状及问题分析(论文9000字)】
- 10.《运动技能学习与控制》李强
评论
0/150
提交评论