




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
IntelXeonphi协处理器实际上它更像是与CPU协同工作的GPU。XeonPhi协处理器在很大程度上继承了流产的独立显卡项目Larrabee的遗志,外部造型看似显卡,其实是和Tesla类似的专用加速计算卡,其架构采用顺序、双发射x86,支持64位运算,每个核心支持最多四个线程,最多61个核心、244个线程,并且每个核心都搭配一个512-bitSIMD矢量引擎。当然了,这里的"核心”跟Tesla里边的CUDA核心是没有直接可比性的,它们分别来自CPU、GPU的世界。虽然在性能预估上与NVIDIA的TeslaK20核心相比没有占到上风,但是XeonPhi在编程易用性上有优势,除非开发者需要使用新功能,否则多数代码都不需要重写。英特尔推出这款处理器就是为了达到和英伟达和AMD处理器一样的效果,提高软件的并行加速计算能力。英特尔公布了两个XeonPhi系列,其中一个系列是XeonPhi5110P,现在已经上市,而另外一个系列XeonPhi3100需要到2013年第一季度上市。这两个系列处理器都是采用22nm的COMS制程工艺,拥有50亿个晶体管,采用的是英特尔Many-IntegratedCore(MIC)众核架构。XeonPhi5110P拥有60个核心,每一个核心都有着4个线程,1.05GHz,2级缓存为30MB,最大支持8GB的GDDR5内存寻址,内存带宽高达32OGbps,双精度浮点计算能力能够达到1TFLOPS,在此次超级计算机TOP500中,戴尔的Stampede采用的是一个客户定制版本SE10,拥有着61个核心,2级缓存也比30M要大一点。对于2013年将要发布的XeonPhi3100,XeonPhi3100拥有57个核心,频率1.1GHz,位宽384bit,搭配6GBGDDR5显存,支持ECC,带宽超过240GB/S,可提供1TFLOPS双精度浮点性能,TDP为300W。在并行加速计算领域,似乎将要演变成为x86协同处理器与GPU加速器之间的竞争,英特尔区分这两者之间的区别是theXeonPhi能够运行操作系统,而GPU加速器则不能,XeonPhi能够运行红帽Linux或者是SuSELinux。不过更为重要的是这些并行加速处理器是怎样提高超级计算机的计算性能,在这些方面软件等方面起到的作用要比操作系统更重要。例:田纳西州大学的田纳西高级计算中心(TACC)正在他们的新超级计算机“Stampede”(惊跑)里安装XeonPhi,也让我们得以一睹其真容:不明说的话肯定会以为这是块标准的显卡吧?Tesla其实也是这个样子,标准的双插槽体积PCI-Exl6扩展卡,而且是因为专用于计算的,都没有视频输出接口(AMD的还有)。XeonPhi也有主动散热、被动散热两种版本,这里用的是被动散热的,外壳下边是厚
重的均热板和散热片,尾部则能看到一个六针和一个八针辅助供电接口,最大供电能力300W。至于实际性能如何,很可能现在哪儿都不具备测试条件,毕竟这玩意儿因为架构的缘故要求操作系统、工具软件都得在一定程度上重新编写和优化,Intel也一再强调优化的重要性。Intel也没有一味夸大加速计算的优势,而是首先澄清了一个误解。Intel拿出了一段Fortran代码,先运行未优化的单线程代码,然后优化并以XeonPhi运行,性能差异达到了恐怖的300倍。NVIDIATesla宣称的性能提升差不多就是这样对比而来的,让加速计算的结果和单线程结果对比,几十乃至几百倍的提升就轻松得来。Intel则证明了其谬误:在双路XeonE5上重新运行相同的代码,XeonPhi只快了大
约两倍而已。也就是说,如果代码本身就针对多核心处理器做过优化,加速计算的真实优势会小得多。CompiiewithGEZCC++,measurewalltime[Generatessnngrethreadedcode)在另一个C++的例子中,109倍的提升被证明其实只有2-2.5倍。AnatomyofaCompiiewithGEZCC++,measurewalltime[Generatessnngrethreadedcode)在另一个C++的例子中,109倍的提升被证明其实只有2-2.5倍。Anatomyofa109xImprovement~693secsThe>1OxperformancegaincomesfromparalletismRunsamecodeonInterXewi'ProcessorT耳「q已tingCPU,nocoprocessorOptimizeforIntel*XeonPh厂usingParallelStudioXEjbo^lsjNohandcodedassenib^*495^ExampleofapublicfinanetaidsrivaliumapplicatianccmbinincibinomialtreesndMonteCarlo,writteninC++随后,Intel展示了XeonPhi协处理加速计算所带来的真正性能提升,通过IntelMKL理论测试得到的幅度为最多2.2-2.9倍,实际应用中则普遍只有最多1.7-2.53倍,只有金融服务方面取得了10倍左右的突飞猛进(布莱克斯克尔斯期权定价模型和蒙特卡罗算法)。SGEMMfUF")upto2,5X9.M4DGEMHWF/»)gto2.5io~STREAMTriadXeonPhi™CoprtK«$w:Increa-sesApplicationPerformanceuptolOxApplicationPerformanceExamplesCw^tornvrAppH-at-jpn-Pl<f>[>rVMn«flIlKiTMM'1W,J筆斗*ft■LcrsAlamMNalMularDyrajiflllCIUp申弧昨Wv啊审避0T*ftfer*i>9E^p<YdinibhtrrlwrtfLab*LAHiCtQCD叩ta2.Z7xFlgnctyServicesBlKkScholHSPW&nteCwto51*vptalC,75xno2a.^ix5IK41M4[耐0斤0Upth2.52j(J5oncl❻mtaMMFE叶mE>RwiiMWJOtDJ.Tx1bvt*)Rji^TriKlnDfivcFwrm■4Pt|'UptDi.Wjt'B工w■3种耳丘R比声雪粧仲j■tt*nEl■&nMlSBKwnMVI^血rg^jiKM8LJ¥XW味feKHalHh"炉阿囲詞屮审炉1打斡"“和・暉屮 UrimiPimiiw3-BL1VM1wt 4JKW.M"34rHd«ck^tov,nti *k^JBKima"{[[xncmMmicLutH[■PriBriWT*a<rimflwrihckd1juw-RiTgprnorifJQbMrtb|■W WWIntelXeonPhi"CoprocessorFamilyReferenceTablerHiiteuktaNmUCWf*nr|-faSMPlACIMm■wwLt.yIMtA如"WtSJf-4111KJ■»>K4f
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 前沿动态营养师考试试题及答案
- 经典演出经纪人考试试题及答案
- 逼近考试演出经纪人试题及答案分析
- 现代家政学考题及答案
- 物理综合高考题及答案
- 《第七天》读后感
- 逃家的小兔测试题及答案
- 江西外语外贸职业学院《劳动通论》2023-2024学年第二学期期末试卷
- 武昌理工学院《统计与分析软件SPSS的应用》2023-2024学年第二学期期末试卷
- 2025届河北省中原名校高三下学期一练前第二次强化训练历史试题含解析
- 曾奇峰精神分析网络课程学习笔记第1-6讲
- 《基础和声学》试习题库(6套答案)
- 马克思主义政治经济学课程讲义
- 无人机培训教材ppt
- SolidWorks、CAD三维建模练习习题图
- HONEYWELLDCS操作手册
- 方正飞腾使用教程详解
- 初筛阳性确诊流程
- 资格考试合格人员登记表下载- 资格考试合格人员登记表
- 新人教版六年级下册数学全册课时练
- 柔道技术与欣赏
评论
0/150
提交评论