已阅读5页,还剩13页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
GPU计算解决方案 - 成功案例 NVIDIA Tesla解决方案帮助我们更快、更准确地解决了多个行业中世界上最重要的计算难题。CAD/CAM/CAE计算金融计算流体动力学學地理信息服务成像生命科学學石油天然气NVIDIA Tesla解决方案帮助我们更快、更准确地解决了多个行业中世界上最重要的计算难题。挑战虚拟时装表演能否成为未来的潮流? 这一问题尚不确定,但以色列佩塔提克瓦的OptiTex Ltd.公司已经利用其3D计算机辅助设计/计算机辅助制造(CAD/CAM)设计技术将整个设计业带入了全新境界。传统上,设计师必须真正创造出实际衣物线条的织物样品来进行原型制作以及为潜在投资者提供展示。这是一个相当耗时且代价高昂的过程,会产生很大的浪费。 OptiTex 3D实现了这一过程的现代化。该软件通过让设计师在虚拟模特身上模拟衣物设计的外观和运动,从而让他们在剪裁第一块布料之前就能够审视、优化以及衡量这些样品。解决方案为解决这一设计难题,OptiTex利用NVIDIA CUDA软件开发环境来重新构建其衣物模拟引擎的数据与算法以使其能够在GPU上运行。 GPU计算解决方案让开发人员能够消除CPU环境下的瓶颈,最高实现10倍的性能提升。 季节性系列产品的开发时间一般为190天。但是使用了重新构建的OptiTex 3D解决方案之后,上市时间被缩短为短短的35天。OptiTex, Ltd.公司总裁兼首席执行官Ran Machtinger表示:“OptiTex 3D向GPU平台的转变大大提升了我们产品的效率,进一步为我们的客户提供了巨大效益。 有了实时能力,制版过程将彻底改变。 纺织业客户将不必依赖用户体验以及详尽的测试来确定最终版型,因为人们始终可以在3D模式下查看这些服装。影响由于GPU计算解决方案带来了实时性能,因此设计师能够降低生产成本并缩短设计周期时间。 服装、汽车、航空等各行各业的用户实际上无需浪费布料、纸张、用电、工时以及快递费用,从而节约了材料、电力、以及制造费用。NVIDIA(英伟达)Tesla解决方案可帮助更快、更精确地解决世界上计算金融行业最重要的计算难题。SciComp公司利用该解决方案计算衍生产品模型挑战金融衍生产品市场是一个高风险行业,在合同评估中,即使是最微小的错误也能够酿成巨额损失。因此,交易者必须仰仗复杂的数学模型来实现对合同价值与风险的敏感度。金融市场的快节奏性要求衍生产品的评估必须做到快速而准确。蒙特卡洛模型是一种应用最广泛的方法,该模型可以模拟潜在合同变量的数百万种情形,这些变量包括股票行市、物价、利率等等。这种模型虽然具有以上优点,但是却需要耗费特别长的计算时间。衍生产品合同的复杂程度、针对快速模型开发与快速准确评估方面的需求凸显了衍生产品市场所面临的一些挑战。SciComp公司出品的SciFinance等复杂软件包可提供有效的方法来解决这些难题。解决方案SciFinance是一款衍生产品模型开发环境,它可以从简明的高级模型技术规范中自动生成串行C语言/C+源代码。现在,为了大幅提升蒙特卡洛定价与风险模型的执行速度,SciComp公司在软件中加入了一大特性,使其能够自动生成支持NVIDIA(英伟达)CUDA的源代码。这一全新代码形式让关键的定价代码部分能够利用NVIDIA(英伟达)GPU(图形处理器)的高度并行架构。想要触发这种全新的代码形式,用户只需在模型技术规范中加入关键字“CUDA”即可生成支持CUDA、可编译的并行代码。这样做的结果是,当使用一颗NVIDIA(英伟达)Tesla C1060 GPU时,速度可从30倍提升至100倍以上。如果增加GPU的数量,性能则会进一步直线上升。SciComp公司执行副总裁CurtRandall表示:“用户凭借CUDA与GPU所能实现的速度提升是相当惊人的。凭借在GPU上的并行处理,外来合同大型投资组合的定价只需短短几分钟即可完成而非从前的数小时之久。由于金融机构能够在NVIDIA(英伟达)解决方案上轻松地运行我们的软件,因此采用该解决方案是这些金融机构的不二选择。”影响更快地创建和执行蒙特卡洛定价模型的能力让交易者与风险经理能够评估其它模型情形并加强风险分析。更好地理解衍生产品合同及其风险敏感度则会提高交易的利润潜力。NVIDIA Tesla解决方案帮助我们更快、更准确地解决了世界计算流体动力学行业中最重要的计算难题。美国国家大气研究中心BAE Systems:使用MATLAB实现地理定位加速GPU计算复杂多相流动分子动力学模拟挑战从致命的飓风到全球气候变化,天气是影响我们日常生活最大的不可控制因素,有时甚至会决定我们是生死还是存亡。然而,现在天气情况的早期预测变得更快、更精确,这样就为人们提供了更长的准备时间。在美国国家大气研究中心(NCAR),一支科学家队伍已经开发出即时、长期以及短期天气条件的复杂的预报模型。气象研究与预报模型(WRF)是世界上应用最广泛的模型,其用户包括美国国家气象局、空军气象局、国外气象局以及商业性天气预报公司等。美国国家大气研究中心气候与气象模型正从Tera级(1万亿FLOPS)向Peta级应用程序转变,其发展速度比传统计算群集的更快,而添加更多CPU已经无法有效提升速度。这种问题在应用程序包含实时组件或其它在时间上有要求的解决方案时尤为突出。解决方案在提升总体预报速度与精确性方法的调查过程中,美国国家大气研究中心的技术人员与科罗拉多大学波尔德分校的研究人员展开合作,转向NVIDIA GPU计算解决方案。在移植到NVIDIA CUDA之后,微观物理学速度提升了10倍。微观物理学是至关重要、但又非常耗费计算资源的气象研究与预报模型部件。虽然微观物理学由不到百分之一的模型源代码构成,但是将其转化为CUDA还是实现了整个模型20%的速度提升。气象研究与预报模型主要软件开发人员、美国国家大气研究中心的John Michalakes表示:“当我们在传统群集上为高时效性预报而用尽全部系统动力时,这一结果的及时到来相当鼓舞人心。由于我们能够把NVIDIA的GPU计算技术整合到更多的气象研究与预报模型中,因此我们的目标是将预报时间至少缩短两倍。我认为加速器的作用将彻底改变气象与气候的建模。”影响现在美国国家大气研究中心以及全世界依赖气象研究与预报模型的多家机构均能够更快地发布人们迫切需要的实时天气事件预报以及发展动态。结果,人们将能够为这些天气事件早做准备并预防损失。GPU计算复杂多相流动分子动力学模拟挑战分子动力学(molecular dynamics,MD)模拟是随着计算机技术的发展而兴起的一种科学计算方法,现已应用到广泛的领域中,如医药、材料、能源、机电等。随着纳米、微机电和微化工等技术的兴起,纳微流动的MD模拟近年来也成为热点。传统连续流体力学难以处理和解释这些尺度上的独特性质与现象,而流动归根结底是流体分子的集体行为,MD模拟能详细跟踪每个分子的运动,并通过分析速度、温度等统计性质阐释理论中的难点、发现新的机理,故日益受到重视。但计算能力一直是制约此研究发展的瓶颈。现在这方面很多成熟算法都基于传统体系结构的中央处理器(CPU),但其发展已显颓势。图形处理器(GPU)的计算能力现已远高于CPU一到两个量级。如何在MD流动模拟中利用GPU的强大能力已成为一个重要的现实课题。解决方案中国科学院过程工程研究所多相复杂系统国家重点实验室进行了图形处理器(GPU)上的分子动力学(MD)模拟。即利用配备了一片NVIDIA Tesla C870的服务系统来运行NVIDIA CUDA架构, 通过方腔流及颗粒-气泡接触等实例初步展示了此方式从微观上模拟介观行为的能力。经证实,在NVIDIA公司技术助力下,该计算过程速度是以往运用单核CPU计算的20到60倍,最高可达150 Gflops。传统GPU对非图形应用支持有限,只能通过图形API编程,内存带宽较低且访问限制多,从而制约了其性能发挥。NVIDIA CUDA的发布打破了传统GPU的性能瓶颈,提供了新的软硬件架构。本次模拟的多相体系中,CUDA把GPU直接视作数据并行计算设备而不再将计算映射到图形操作上,以扩展性较好的区域分解和常用的消息传递接口(Message Passing Interface, MPI)协议实现各节点间GPU的并行计算,以类C语言的方式给开发者更大自由来实现GPU算法。CUDA还能结合OpenMP,MPI和PVM等其他并行方式在节点内和节点间继续扩展计算能力,更好的发挥了GPU的强大性能,并将计算中的数据访问效率提高了一个量级以上。Tesla C870的有效计算性能(指计算分子对相互作用时的浮点操作数)是以往所采用的单核CPU的2030倍。若考察极端情况,即只测试耗时最长的分子间作用力计算,GPU更占优势, 约能发挥150 Gflops,占其可利用计算峰值(346 Gflops)的40%多,而CPU能发挥2.4 Gflops,GPU的计算能力达到CPU的60倍之多!说明GPU很适合像多体问题。影响方腔流是流体动力学的一个经典问题,本次模拟将GPU应用于方腔流的MD模拟,使得模拟体系的规模有较大提高,在一定程度上达到了(亚)微米尺度,沟通了连续的流体力学和离散的分子动力学。而多相纳微流动研究对纳米、材料、生物、微机电与微化工系统等技术领域更有实用性,但也更有挑战性,目前还没有成熟的理论方法,其MD模拟需要更多的计算资源且实现更加复杂,因此GPU的应用显得更有价值。另一方面, 利用CUDA技术和MPI协议,MD模拟可以实现某些物理实验难以进行的极端情况,这是MD模拟非常值得关注的新方式。总体来说,GPU在MD模拟上的应用还有巨大的潜力。如需进一步了解,请参阅科学出版社于2009年出版的基于GPU的多尺度离散模拟并行计算一书。挑战地理信息服务(GIS)技术对安全以及我们日常生活质量有着重大的影响。城市规划者以及规划公司使用地理信息服务应用程序来将物理地图信息与人口统计资料结合起来,这些资料包括人口数量、街道布局以及本地资源。从追踪911电话、研究二氧化碳浓度到监控杀虫剂的应用,这类应用程序应用越来越多。由于用户需求不断超越地理信息服务应用程序的范围,因此数据集变得越来越复杂,常常需要处理显示向量层、表面层以及图像的数G级字节的互动地图。M是一家领先的地理信息服务系统开发商。在市场的迫切需求下,M必须开发出能够高效、绝对准确地处理最大数据集的产品。对于这些如此先进的项目以及预计会越来越多的功能需求,该公司意识到基于CPU的计算解决方案已无法满足用户的需求了。解决方案Manifold于是就将其软件转到NVIDIA CUDA平台下,让用户能够享受到GPU的并行处理能力以及由PCI Express高带宽支持的数据互动。凭借CUDA配置,从前需要20分钟才能完成的运算现在30秒内即可完成。而且,从前需要30秒到40秒的运算现在达到了实时运算。M产品部经理Dimitri Rotow表示:“说NVIDIA CUDA技术是计算机科学界自微处理器问世以来最具革命性的发明一点都不为过。该技术速度快、价格低并且具有很大的潜力。NVIDIA CUDA太重要了,因此所有Manifold的用户都应坚持采购支持CUDA的计算机硬件。”影响凭借其全新的CUDA加速,Manifold正在帮助开采之前无法开采的燃料矿藏、追踪空气中污染物的情况以及为警察和火警提供更加准确的信息。挑战人人都已经习惯于现代医疗机构紧密的时间安排,在这些地方,半小时的预约就像整天一样漫长。因此,这种环境中的实用技术需要具备极快的速度,以便配合当今快节奏的医疗实践。 患者需要快速、精确并且舒适的诊断,而医生则需要能够实现高效诊断的工具。新一代成像系统全乳房超声波(WBU)系统正是为了进行这些检查而开发设计。Techniscan Medical System公司的开发人员在开发这一全新成像系统时面临着这些挑战。然而,在开发的早期,使用多台联网计算机进行运算,检查结果通常需要花费数小时才能得出。 即使是采用最新Xeon处理器的16台计算机组成群集也无法在一天时间里完成众多患者的扫描检查。解决方案为解决这一难题,Techniscan公司将其专有的逆向散射算法从传统的FORTRAN以及MPI系统上移植到NVIDIA CUDA上。 在测试了该配置之后,开发人员完全被测试结果所折服。因为他们发现,这种配置在不损失检查结果画质的情况下能够使系统更快地运行。Tesla计算系统可为全乳房超声波系统提供足够的动力,使其符合医疗行业的快节奏要求。 四颗Tesla GPU处理器的配置就能够在不到20分钟时间里完成Techniscan算法的处理。 通过比较,传统16核计算机系统耗费了超过两倍的时间。Techniscan现已将扫描仪内置的群集全部替换为两个强大的并行NVIDIA Tesla D870桌边型GPU计算系统,用来处理逆向散射代码。Techniscan公司高级软件工程师Jim Hardwick表示:“CUDA让我们能够极其轻松地利用GPU超强的处理能力,为我们节约了许多时间和成本。 一台主机系统以及两个Tesla D870系统远比16核群集便宜得多。 这不仅在成产与销售方面意义重大,而且还大大降低了设计过程中的研发成本。”影响通过使用具备NVIDIA的GPU计算技术的Techniscan系统,放射科医师就可以进行完整的超声波扫描并在患者就诊的30分钟内得出结果。 这样就消除了检测结果的延迟时间,患者与医生都能够依靠这一高效快速的设备在当代医学的快节奏下得出检测结果。挑战Evolved Machines正在从事大脑回路反向工程的研究工作,以期开发出设备技术的一个全新典范。他们的研究工作需要进行神经生物学真实神经回路的大规模模拟,这就需要强大的并行计算能力。单个神经元的模拟每秒钟要进行2亿次微分方程式的估算,大约需要4 gigaflops的浮点性能。负责处理感官的神经阵列需要数以千计的神经元,因此神经系统的实时精细模拟则需要10 teraflops以上的浮点计算能力。解决方案Evolved Machines于2006年与NVIDIA(英伟达)公司在GPU方面首次展开了合作。与采用当代x86微处理器进行模拟相比,他们将速度提升了大约130倍。他们现在正在进行GPU机架的设计,该产品成本只有世界顶级系统的百分之一,而性能却可以与之相媲美。影响Evolved Machines公司正在开发的应用程序包括视觉物体辨识以及味觉辨识程序。为了开发出能够学习物体进而在真实环境中辨识这些物体的设备,人造神经回路需要在接受感官输入期间逐渐“连通”,就像婴儿出生后六个月内学习辨识环境中的物体一样。有了GPU(图形处理器),具备学习能力以及感知气味能力的设备就成为了可能。这些设备可用于在现实环境中检查爆炸物或监控食品新鲜度。在利用内容以及自动导向机器人所采集图像构建数据库这一领域中,图像检测技术的进一步发展能够利用神经模拟数据处理来实现当前所无法实现的功能。挑战伊利诺伊大学厄本那-香槟分校(UIUC)纳米级分子动力学(NAMD)以及视觉分子动力学(VMD)都是功能强大且应用广泛的工具软件,它们被用于生物分子过程的模拟和可视化。模拟复杂的分子系统是一件耗时的工作,而且还需要使用巨大、复杂的计算机群集才能完成。解决方案为了提高性能,伊利诺伊大学厄本那-香槟分校的研究人员将“cionize”离子排列工具移植到了NVIDIA GPU计算解决方案上。其目的就是为运算生物学分子与离子的互动而加快计算量超大的内核速度。通过移植,伊利诺伊大学厄本那-香槟分校的研究人员在离子模拟方面获得了比18颗CPU的群集高出100多倍的速度提升(以CPU总时间对比GPU总时间为基础计算得出)。采用一台三颗GPU的工作站时,类似的视觉分子动力学工具中的时均化静电运算达到了705 Gigaflops的浮点性能。这种超高的性能让所有生物学研究人员的工作站均能够达到等同于计算群集的计算能力。影响有了GPU计算,这些分子模拟就不再受到群集的服务器空间限制了。通过在个人实验室的工作站以及台式机上运行模拟,项目不再因计算资源稀缺而互相争抢。与从前只能排队等待处理相反的是,研究人员在需要时可及时获得运算结果。而且,大型服务器群集拥有了GPU之后,更复杂的难题就能够得以解决。而这种计算能力一年前还只是一个梦想。纳米级分子动力学与NVIDIA计算解决方案的结合是前沿技术研究与软件开发的珠联璧合,其目的就是利用全国最快的超级计算机来解读活体细胞的最小组件。这些全新的计算工具正在加速药品研究以及解释生物进程中其它至关重要的研究步伐。NVIDIA Tesla解决方案帮助我们更快、更准确地解决了世界石油天然气行业中最重要的计算难题。Headwave公司SeismicCity公司GeoStar公司挑战石油天然气勘探的难度越来越大。现在的大型油气田深度变得更大,并且处于难以分析的沉积层内。例如最近Jack Field在墨西哥湾发现的油气田就位于海底以下2万多英尺。为了解释和勘探这些油气田,我们必须获得并处理大量的地震数据。由于沉积层非常复杂,因此更好地解决办法是以图像的形式来呈现。这就意味着需要处理更多的数据。解决方案在大多数人仍然把GPU当作是消费类游戏技术时,总部位于休斯敦、专门从事地理数据分析的Headwave公司就已经开始研发能够利用显卡并行处理能力的下一代计算平台了。在NVIDIA GPU计算解决方案上运行的Headwave解决方案让地球物理学家能够对他们的数据进行高级过滤处理并即时地查看结果,即使是高达数TB的数据集也能实现即时查看。此外,地球物理学家还可以每天都多方面地分析最初获得的地震(“叠前”)数据。TB级数据集的传统处理方式需要长达几个月的人工以及数月的数字运算时间。Headwave推出的产品让地球物理学家能够对他们的数据进行高级过滤处理并即时地查看结果,即使是高达数TB的数据集也能实现即时查看。通过采用NVIDIA GPU计算解决方案,Headwave能够将运算速度提高100倍并将人工操作时间缩短100倍。影响如果没有NVIDIA的GPU计算解决方案的最新进展,我们就不会实现TB级数据集的实时处理。石油天然气公司的工作站已经配备了GPU,这就意味着大量硬件基础设施已经具备利用这项技术的条件。因此,石油天然气公司正着手开始利用这项全新的技术。挑战随着石油价格持续攀升,寻求新能源来帮助调节油价已经变得越来越紧迫。 但是勘探和钻探一口深井的成本高达数亿美元,而且通常成功的几率很低。为最大限度降低风险,现在大多数石油勘探都依靠SeismicCity等公司的3D地震成像技术来细致地查看潜在的钻探点。SeismicCity公司设在美国德克萨斯州休斯顿市。复杂地质段的成像仍然是一项具有里程碑意义的任务,它涉及的复杂数据多达太字节(TB)。随着深度成像技术开发商SeismicCity连续推出几代更快、更精确的代码,他们遇到了一个棘手的问题: 每次升级到其专利算法都会令计算复杂程度提高10倍。 不久前,SeismicCity现有的硬件配置已无法满足需要,因为新算法要求系统升级到等同于20 000颗CPU的配置。解决方案SeismicCity为满足未来之需,转而采用了GPU计算,在NVIDIA Tesla S870 1U服务器系统上运行NVIDIA CUDA。 这一强大的并行计算架构可实现达到从前CPU配置20倍的性能提升。 而基于CUDA技术的NVIDIA下一代Tesla处理器可将性能再提升3.5倍。 而且,GPU的可扩展能力将更快地实现这种向新算法的过渡,让硬件平台能够随需求的增加而得到扩展。SeismicCity公司技术副总裁Claude Pignol表示:“SeismicCity的一个独特之处是其算法。 从上一代代码变为新一代代码意味着其精确度大幅提高的图像将直接导致勘探效率的提高。 NVID
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论