英特尔至强E7,E3处理器性能多项测试比拼_第1页
英特尔至强E7,E3处理器性能多项测试比拼_第2页
英特尔至强E7,E3处理器性能多项测试比拼_第3页
英特尔至强E7,E3处理器性能多项测试比拼_第4页
英特尔至强E7,E3处理器性能多项测试比拼_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、英特尔至强E7处理器性能多项测试比拼18款不同型号Xeon E7处理器自英特尔2010年发布至强7500处理器家族以来,针对企业关键任务领域使 得X86处理器在挑战RIS C霸主地位上迈出坚实一步。今年 4月6日,英特尔继 续发力关键业务应用,推出了 32纳米工艺制程、代号 Westmere-EX的英特尔至 强E7处理器家族。Introducing the Intel* Xeon* Processor E7 FamilyBOMB of Iasi Level Cat 忧Up to lOCwe? and 20 ThreadsAdvaFKed Encryption Standwd - New rnt

2、ructionsUp I。I Terabyies of 0DR3 H«rwy, 血 Low 烦螂 DIIMM SupportfriDef Trusted EMecution edinolaqy英特尔至强E7处理器家族据官方资料,Xeon E7系列处理器开发代号Westmere-EX制造工艺升级为 32nm不过封装接口仍采用LGA1567同时向下兼容Xeon 7500系列产品,而一 直比较受关注的Sandy Bridge-EP/EN面向主流服务器市场,才会改用新的 LGA201隹寸装接口。ModellCodettcimeXeon E7*a®7Cxecr E7*88*7LXeo

3、n E7-8860Wsrtmere-EXXeon E 7-8850;e5tmce-EXXeon E7-8837。estmera-EXXeon E7-8S30;eStiTiee-EXXeon E7*4S70Xeon E7-4«SCXeOrt E7-4950'L'/tstmt'c-EXXecr E7-心。'tSTme-e-EXX«or E7-320;Vef!mere-EXXeon E7-43Q7,tstmtje-EXXecn E7-2870;vestmere-EXXton E7-2e$0Xeon E 7-2 3 50Xecn E7-2S30est

4、mere>EXXfl&r E7-2SZ0Westmere-EXX-on E 7-2803Wesrmere-EXTakt K«mt! / Threads2,40 GHj:QC/ :0T2J3 GH£IOC /20T2,26 GHi1。匚;20Tg GHz10C .'20T2,67 GHZ8C /8T2J3 GH28C/ 16T2,-iO GN;1QC/ 30T以 GHzIOC .- 20T2,00 GHzIOC / 20T2 J3 GHzac/ 16T2,00 GHzSC 7 L6T1 刷 GHZ6C .f I2T2.50 GH2IOC / 20TGHj

5、:QC/ 20T2.30 GH:IOC . SOT243 GHiKJ MT2.00 GHjSC / 1ST1,73 GHz6C /' 12TL3-CrtcheQPIJDP30 we$网GT 5:就,30 M3牝4 GT'S105 W2- MSW GT/s 顽*2d HE6h- GT.As 13C W24 KE6,4 GT S :3C 724 MBGT/5 ZC5 W30 MB6;- GT/S :3C V'3*1 MB%: GT'S246r- GT S :为'胃2- MB6,- GT;S ICS W18 MES S6 GT S :。IS MBGT/S 95

6、30 MB6S GT.y 13C 仙N f-tB6.-; GT/$臼2*1 MB13C W24 MB5,4 GT/s ICS WLB HE,5rsewH5KE GIF:S V.r18款不同型号Xeon E7处理器作为新一代关键业务应用的至强处理器, Xeon E7系列家族囊括多达18款 不同型号,分为 Xeon E7-8800、Xeon E7-4800、Xeon E7-2800 三个子系列,分 别支持最多八路、四路和双路并行,核心数量 6/8/10个,除了 E7-8837外全部 支持超线程,原始频率1.73-2.67GHz不等,都支持不同程度的Turbo Boost睿 频动态加速,三级缓存容量

7、 18/24/30MB, QPI总线频率4.8/5.86/6.4GT/S ,对 应内存频率1066/978/800MHZ,热设计功耗提供 95/105/130W三种。-E7-2800系列:可以组建单处理器或双处理器系统-E7-4800系列:可以组建四处理器系统-E7-8800系列:可以组建八处理器系统,每个服务器可以支持 80或160 条线程新一代至强E7处理器不仅在制程上提供改进,在性能和RASt性上给予了更大的提升,E7的前一代至强7500产品就曾经以3倍的性能提升、高达1TB的 内存支持和20多项RAS!性,创下了英特尔多路服务器处理器性能及功能提升 多项记录。作为至强7500继任者We

8、stmere-EX在技术上不仅提升三级缓存容量到 30MB 以及集成内存控制器数量达32GB同时在虚拟化方面,具有增强的虚拟化支持,将有效提升虚拟机的切换速度,并加入 Real mode功能、减少延迟和响应时间以及RA明性等方面改进,具体看看至强 E7处理器在多项性能测试表现。ATOP至强E7-2800在多项测试中表现至强E7-2800在多项测试中表现从命名可以看出,至强E7系列(Westmere-E为是用以替代目前的至强7500 (Nehalem-EX产品的新处理器,根据英特尔的路线图,至强E7-2800系列有一 款六核心、两款八核心、三款十核心,主频1.73GHz起步,三级缓存18-30M

9、B不等,TDP为105W或者130W两种。惠普在其ProLiant G7产品线的四款服务器中更新了至强E7处理器。 ProLiant BL680C 和 ProLiant DL580 将基丁至强 E7-4800 系列处理器,而 ProLiant BL620C 和 ProLiant DL980 将基丁至强 E7-2800 和 E7-4800 系列处理 器。通过依托基丁至强E7-2800的BL620C产品测试,反映出新一代至强产品的 性能。W03SAP Sdk drui DitribirtiOd (SD+ Iwo-lierHigher s better 8,000 aEmwvCQ6hOOO5,3。4

10、,0003.000ZrOOQ 1,000 0. Xwt Pw:hwE7 2870 (30M C*che. ;r40 Ghl 机4。GT/1 lnt»l« QPt).Pwbuc X7M0 (24M Ctcht. 2.2 GHz.轧M GT/i labels QPI) 2r»ck*t.1 神毒 X»n9 Pwwwr XMW (C*ch>. 3-M GH?. 6." OT/l qPJlO-iHigher is tettr41 一7:Hes7.17Hewlett-PdordProLiant*01620c G7VMmark' 2.1.I n

11、t#1 JE7fc2B70 (3QM C*ctx* 2*4。GHar 6.40 GT/* IntAl QPI; MW,3 Kmf岑X590 i 13M 匚“E,3.4£ QH;J &4。&T * Jhe :5 Q舛VMmark* 2.1虚拟化基准测试思科推出新一代UCSB230 M2和B440 M2刀片服务器以及 C460 M2M架服务 器,这三款服务器都将升级采用至强E7 “WestmereEX'芯片。UCSC260M2服务器采用双路至强E7-2800十核处理器,提供64个内存插槽, 主内存最大可达到1TB,本地存储容量最高可扩至9.6TB。同时采用2U机箱

12、设计 结构,可接入16个硬盘,采用6个PCI-E 2.0插槽、2个万兆端口和4个千兆 端口 0E W i± betterL335.019SPECjbb*2005.iriTi ® X*cnX Processor £7-iB70 f 30M CacM.堂.4, GHi. «.4O tST/f intfc S QPlj.>t*J£ X«ftXX75S0 RM =旗 GHi, s.dO GT.'i Mfc*增 QPt;A的改W Intel T X«nT Phk<(sc-3小* =48 GH;r 6.40 QT/t

13、 jnt« 等 PI2-SQ£kfitE-Commerce/Java*/Application 性能测试Hiflhcr ts betterSFtCint+_fdtc bdM!2006 (1,B4M-linc RKMih1*).Intelt XMfb* Pf4<MW E7-JBTQ (WM C*dh*H 2.4D GHi, CFTM Int#的 QP1) 】“ C+KE2O11 InUlg Xwit PnKBsor X5690 (12M Cuzha, 3.46 GHi, 6.M GT/i lnt»l骨 QPI) Ini C+ Compikc XE2011.In

14、tl 5 XMft* PWMftf (24M 3h*r GHrP 40 GT/t lAtpl K Q就) 3-Mck#rF Int«4 C+ + Cwnp<kf Ur整数吞吐量计算性能测试Higher is tettc365100OscolXS* C460 Ml IntelS XeoriS Proces»r E?-38?& (3CM C*che. 2.4D GHz. 6.40 GT/i Lntel® QPJ j lnt»l C+ + and Fortran Compihr XE2011.mW Xte»e Phm»4W X

15、736O (2<M CKh*r 2.26 GHr, AM GT/t QPt) 2-«ock«tr ItvW C+ + 4nd FortnA Compd LI X»n« Pwvtw XMH (12M C«chtr 3.46 GHs, GT/i Ir4*l« QM) Infcrl C+ + *fid Fortrin Compiltr XE2011浮点计算性能测试搭载英特尔至强E7的服务器测评结果,思科旗下产品UCSC260M圳VMware VMMar虚拟机测试、TPPC(事物处理性能委员会)基准测试以及 SPEC®务器标

16、准应用性能的评测中,共刷新了多项记录。TOP至强E7-4800在多项测试中表现至强E7-4800在多项测试中表现据资料显示,至强E7-4800系列核心分布和三级缓存容量 18-30MB不等,但 起跳频率增加到1.83GHz;但最低热设计功耗只有95W此外还有至少一款低功 耗十核心至强E7-8867L,热设计功耗仅为105W频率依然有2.13GHz:,三级缓 存也保留了全部30MB QPI总线频率也是全速6.4GT/S。在四路应用测试中,惠普 ProLiant DL580将基丁至强E7-4800系列处理器 来测试TPC-E即全新在线事务处理(OLTP工作负载。TPC-E基准测试是模拟 一家经纪公

17、司的OLTP工作负载情况。该基准测试主要关注用丁执行经纪公司客 户帐户相关事务的中心数据库。 尽管TPC-E的底层业务模型为经纪公司,但其数 据库模式、数据填充、事务和实施规则的设计在现代OLTPK统中具有广泛的代表性。Higher is 区mmTPC BenchmarkT E (TPC-E).Intel® X»n£ Proc«$cr E7-4S70 (30M Cache, £.40 GHz, £.40 GTZs Intel® QR).In:*l3 XHftI Prectsier X73&D (24 C*ch

18、1; 2.26 GHs. 6 40 GTri Hte 黑 qPI).Int-fciX XtonJ Sroctnor X?ifiO (L6M C*ch« 2.66 GH:. 1066 MH; fSBjTPC-E数据库性能测试Higher better 16,000-114.CW0-14,000L2.M0 IBM System x3850 X510,490:o:C;-噂-匚_1|口£相Q8,00。6;00D 一4,000SAP Sales and Distribution (SD) Two-Tter tnt«l3 X*4A$ QEtfgr E7YB7Q J30H Cl

19、«h«F 2Q QH:. «.4O GT/* QPI) X*onJX?S60 (ZM CacMn 2.26 GH; 6-C GT/s Jrt*il QP1).Intel® XCort'S Processor X"制:£'' Cacher 2.6G GHz. 106£ MHz FSB)ERRlk务性能测试在基丁四路服务器产品中,对丁同样是ERP务性能测试,至强E7-4800 所表现出来的性能值相比至强 E7-2800有差不多一倍的提升。.X门事E74B7Q ;3QH 匚角* 2.40«.4Q

20、GT''f iM.lg QP!).f>rcK«tor X7360 (24M Cachth 2.:6 GH;. 6.M GT/S Irttll QP1) .Int« Xeon SX7460 Ifi'' r.ach* 2,66 Ghz- 106$ MHu FEE整数吞吐量计算性能测试2q Higher is better16 tJes16.6*VMmirfc* 2 Infed S XktKB PracHsor £7-4670 (3CM Cxha, 1.40 GHit 6.4 GT/t IntS QPI)” 1M*I*XM90 (I

21、2M CkM, 3.44 GHt, $.4Q GVn心# QW)VMmarkg拟化测试其中搭配了 VMwareESX4.1软件的UCSC460 M2服务器在VMmarK拟化测试中打破了世界纪录。其在数据中心虚拟服务器管理的评比中,仓U下了 16.6818Tiles的最高记录。228 VMS3,723HewfettrPadcardProLiant*DL580 G7Higher is better勺oo"3r500L6S '/Vs3,000-2,742o LJSPECv»rt_s<*2010.Hte j Kn® 口-qcwHb E?*4E7"

22、J3GM Cace 2.4C GHz- 6,40 ST a :nt«l J QPI !ntSLS X«n® Prt»SQr X75GQ (24M2.:G Ghx. «.4O WT,问代 * QPI虚拟化和服务器整合场景下的通用负载为了能让虚拟服务器在数据中心有效利用,并迅速应对IT资源的巨大压力获取更快的投资回报率和更低的总体拥有成本。通过惠普DL580 G7在下一代英特尔至强型E7-4800产品系列展示的性能,可以看到在虚拟化服务器整合场景中 的数据中心服务器性能的基准。TOP至强E7-8800在多项测试中表现至强E7-8800在多项测试中表

23、现作为Xeon E7系列家族高端 产品,至强E7-8800系列可以组建八路 处理器系 统,每个服务器可以支持80或160条线程,其中英特尔还在E7家族中推出融合 了高性能与低电压优势的型号,以及频率优化的型号:10核低电压E7-8867L的主频达2.13 GHz,热设计功耗为105瓦,而8核频率优化型E7-8837的主频高 达2.67GHz,热设计功耗为130瓦。新推出的刀片和机架式服务器凭借 旧M独有的eX5架构技术,将最大限度地 发挥最新的Intel至强E7处理器的性能,为用户提供全面领先的工作负载优化 系统。旧M针对eX5架构设计的三大组件和技术,依然为 E7服务器平台提供支 持,并使得

24、E7处理器性能得到了进一步的发挥。其中,MAX的每个基丁 eX5架构的System x服务器提供额外的DIMMfi槽, 增加服务器内存,此功能还将帮助用户节省软件许可费用,特别是八路 System x3850 X5可以多达192个DIMM布槽(6TB)。2 DC, COO -Higher s better ' i :l :-“s” 三抚7。:.2: 33 二4:匕一二 £.4。三5 :”睡宜 Bmck*% 60-cor«sr XGO'thr««dv.IntalS X«onS; Procasscr X75G0 (24M Cacha

25、F 2.2 GHz, £.40 GT7s Jntol!g QP1) 4*sock;t 3 Z* co res; M-threacsTPC-H 1000GEM 试新的System x3850 X5创造了最高的TPC-H 1000GBfi,这一数值也是迄今 为止由非集群服务器所创造的最高基准值。全新的 System x3850 X5在性能和性 能价格比两方面分别以24%: 52%:幅领先市场上同配置的产品。rmddle-t,。peHortnnce g SPEQbb*2OQ5 berKhmrk5f000,000Fujitsu PfUMERGT* RX900 S2-Higher a bett

26、er s.soo.ow. mW, XKinS PracMor E7-8870 (30M2.40 GHz. S.4C GT/t QP1) < IhUIA Prccnsar X75« (24M Jh«. 2.26 GHf- 6.40 GT/f 】4尊 QP!)| Intel; X«)n® Pnjcessor 7N0N (itM 3+30 W7 MHr FSB)SPECjbb?2005 Java商业基准测试通过SPECjbb2005( Java服务器基准)测试,评估采用至强E7-8870处理器 的富士通RX900 S2服务器端Java性能的SPECS准,

27、SPECjbb2005可以通过模 拟一套三层式的客户端/服务器系统来评估服务器端Java,性能,而在模拟过程中 最为强调的就是中间层,性能结果上也体现出一定的优势。针对新一代关键业务应用的至强 E7产品,目标直指高端和关键任务工作负 载,打破了多项性能记录,通过在SPECInt, SPECFPTPC-E和基于Java的中间 件测试中,可以明显看出新架构下的至强 E7性能上有明显的提升,不仅从搭载 英特尔至强E7的服务器测评结果中客观反映出性能的变化,同时通过模拟真实 的应用环境来提供用户真实的平台支持。本文出自:作者:中关村在线 王迪 【原创】2011年04月21日Intel至强Sandy B

28、ridge处理器首发评测【IT168评测中心】前不久,Intel对外发布了最新的基丁 Sandy Bridge 微架构的32nm至强处理器一一E3系列。虽然这并非是Intel第一次发布基丁 Sandy Bridge微架构的产品,虽然E3仅仅面向单路应用而生,但不管怎么说, E3的出现的确标志着Intel在至强处理器发展中迈出了重要的一步,也是 Tick-Tock战略中重要的内容(Tock)。IT168评测中心有幸在第一时间拿到了至强E3系列的产品,接下来我们将为大家展示的是 Sandy Bridge架构强大的性 能与未来广阔的发展趋势。Intel发布Sandy Bridge微架构32nm至强处

29、理器得益丁桌面级Sandy Bridge处理器的成功,许多人对丁至强 Sandy Brideg 处理器也充满了期待。虽然对丁至强处理器应用的服务器环境来说,多媒体性能 并非是人们应该关注的内容。而每当提到Sandy Bridge的技术特点环形总线、AVX指令集、Turbo Boost2等内容都是众多报道中频繁出现的内容。究竟这 些技术为我们带来了什么?它们的存在会有哪些的好处。这些还要从 Sandy Brideg之前的Nehalem开始说起。New Intel Microarchitecture2nd Generation Intel Core Processor Family - Coden

30、ame Sandy Bridgesandy BridgePenrynNEW Process Techn/og 32nmN£W Mkroarchhecwre 32nmNEW Process Technotogy 22nm EM Core* WaoarchitectureMicraarcnftecujfPInteP MiaoarchrtectureFiDde.L,脾 Sandy th klgt,WestmereIvy BridgeNEWNEWProcess Technology HkroarcW tenure 45nm45nmTICKTOCKTICKTOCKTICKAll new mic

31、ro-architecture delivers breakthrough performanceand capabilities按照Intel著名的时钟规律Tick-Tock来看,Sandy Bridge明显届丁后者,也就是Tock范畴。Tock主要是指处理器微架构方面的改变,而核心工艺的 上一次升级已经由我们熟悉的 Westmere完成了,下一次22nm的升级还要再等等 才行。在进行系统的分析之前,我们先来看看最新的至强Sandy Bridge处理器路线图。相比以往的产品来说,Sandy Bridge至强处理器采用了与桌面级酷睿处 理器类似的命名规范,分为E3、E5和E7三个系列。其中,E

32、3系列是面向入门 级单路服务器的产品,E5系列则面对了主流的双路服务器平台。唯一有特点的 是E7,这款产品虽然在型号上采用了新的命名规则,但是在本质上E7还是上一代架构的产品,它还有一个大家非常熟悉的名字Westmere-EX。Sandy/Ivy Bridge Server Segmentation of Socket4S+E>t*rprit«ssEuti 4SP: tntturhSftncly BridgeSocket?3 OP!?Socket H2 LGA1155 0 QPiLynnfieldClarkdnlftFoxhoilow至强处理器路线图本次我们要介绍的至强E3系列

33、届丁面向单路服务器应用的产品,使用的是 LGA11酝口,也就是图中的 Sandy Bridge-DT。按照产品布局分析,Sandy Bridge-DT主要定位在入门级的单路服务器,虽然同样是单路,但是高端应用的 任务则是由Sandy Bridge-EN来承担。正如我们刚才提到的,新一代的至强 Sandy Bridge处理器给我们带来的一 个印象就是采用了环形总线架构,这也是Intel在继Nehalem和Westmere之后继续使用环形总线的架构。2nd Generation Intel Core1 Processor: New ArchitectureNew architecture with

34、 shared cache delivering more performance andenergy efficiencySandy Bridge核外架构图Sandy Bridge处理器使用了新的环形总线设计。事实上从之前的Nehalem开始,Intel就转向了融合核心的理念。在 Nehalem当中,Intel将内存控制器 融入其中,而在接下来的 Westmere当中,GP电作为融入的对象而出现(只是 那时候的GPIM仅仅使用的是45nm工艺)。在之前的8核心Nehalem-EX上,我 们就看到了环形总线的身影,不过当时的产品在性能和功耗上并没有表现出明显 的优势。2nd Gen Intel

35、® CoreT Processor OverviewEmbedded Display PonNext Generation Imet1 Turbo TechnologyHigh Bond width Last Lvel CacheN»xt Gorwhon Processor Graphics and MediaDiscrete Graphics Support: 1x16 or 2x8tnwgrates CPU, Graphics. MC. PCrExpress- On Stngl« ChipHigh BW/low-latency modularCoreGFX i

36、nterconnwtSubstantial: performanceimprovementInteP Advanced VectorExtension (IntW AVXIntegrated Memory Controller2chDDR3kit 敬'Hyper<Th rendingTechnology4 Ccxes / 8 Thre ids2 Cores 14 ThreadsStunning Performance and Energy Efficiency本次Sandy Bridge使用的是重新设计的核外结构,全新的 Ring Bus环形总 线更能够较好的展示出Sandy B

37、ridge的真实性能。通过上图大家可以看到,Ring Bus环形总线连接各个CPia心、LLC缓存(L3缓存)、融合进去的GP以及System Agent (系统北桥)等部分。QPIOQPI1QPI2QPI3SMIOSMI1这个图片或许可以更好的说明问题。新的Ring Bus环形总线由四条独立的环组成,分别是数据环 Data Ring、请求环Request Ring、响应环 Acknowledge Ring和侦听环Snoop Ring。借助丁环形总线,CPl GPM以共享LLC缓存, 将大幅度提升GPU性能。在这个环形总线上,分布着多个 Ring Stop,也就是俗称的“站台”。这个 “站台”

38、在每个CPU/LLC上具有两个连接点,而之前使用环形总线的产品,也 就是Nehalem-EX环在每个CPU/LLCfe上只有一个连接点。环形总线的存在,可以大大减少核心访问三级缓存的周期。在以往的产品中, 多个核心共享一个三级缓存,需要访问的话必须先经过流水线发送请求,在进行优先级排序之后才能进行。新的环形总线将三级缓存分割成了若干部分,借助丁 每个站台,核心可以快速的访问 LLC。LLC小容量缓存的延迟优势与核心频率一 致性在这里也就体现了出来,这就使得 Sandy Bridge的周期相比以往产品有所 缩减,从原来的35-40个缩减到了 26-31个。同时,由丁每个核心与LLC之间可 以提供

39、若干带宽,使得Sandy Bridge的整体带宽也提升了 4倍。在Sandy Bridge处理器中,Intel使用了一个全新的概念System Agent(系统助手)。事实上,System Agent也就是我们之前所说的核外架初,只是Intel本次给予了其全新的命名,而在以往的名称中,我们亲切的称之为系统北 桥。Lean and Mean System AgentContains PCI Express*, DM I, Memory Controller, Display Engine.,.Contains Power control Unit-Programmable uControiier

40、, handles all power management and reset functions in the chipSmart integration with the ring-Provides cores/Graphics /Media with high BW, low latency to DRAM/IO for best performance-Handles 10-to-cache coherencySeparate voltage and frequency from nng/cores. Display integration for better battery li

41、fe Extensive power and thermalmanagement for PCI Express* and DDR 你的斗口频道 cpu<系统助手System Agent包含了比以往产品更为丰富的功能,包括整合 内存控制器、 支持16条PCIE2.0通道的PCIE控制器、图形处理器(GPU、电源控制单元(PCU 以及DMI总线的IO接口。PCI-E控制器,可提供16条PCI-E 2.0信道,支持单条PCI-E x16或者两 条PCI-E x8插槽;重新设计的双通道DDR物存控制器,内存延迟也恢复了正常水平(Westmere 将内存控制器移出CPU放到了 GPE:);此外还

42、有DMI总线接口、显示引擎、电源控制单元(PCU)。系统助手的频率要低丁其他部分,有自己独立的电源层。在Sandy Bridge处理器中,最大的改进要算是增加了全新的AVX指令集一Advanced Vector Extensions,高级欠量扩展。这个指令集的增加是 X86处理 器中的重要内容,不仅仅是提供了更为良好的性能,同时也是对现有指令集的整 合与优化。IDF2010英特尔值崽技术峰会 , c 丁e xU、长 Lz如何运用即将面世的英特尔®高级矢量扩展指令集(英特尔® AVX)优化您的软件Xiaochang Wu Henry OuSr, Software Engine

43、erSr. Software EngineerSoftware and Services GroupARCS003介绍AVX旨令集之前,先要引入一个向量的概念。所谓向量,就是多个标量 的组合,通常意味着SIMD(单指令多数据),就是一个指令同时对多个数据进 行处理,达到很大的吞吐量。早在 1996年,Intel就在X86架构上应用了 MMX (多媒体扩展)指令集,那时候还仅仅是 64位向量。到了 1999年,SSE(流式 SIMDT展)指令集出现了,这时候的向量提升到了128位。Intel®高级矢量扩展(Intel® AVX)关键特性和"敬f*更宽的:尖砒-危28

44、位增如到256区-阿个 128Qloadaa,增强构莉据成排I湿册耻点最高虻2咐峰值FLOPS传林浮点操作K故)翰出"仲况蚪的能阈炒也闩whs史鎏的数据 3个小4作七, -AVX 128 i AVX 256仔用JL菠EF性的句油* 扩,的等打器PJ ': -诚代跳更辱地便用寄存1B*显活的不时齐内做取支持更多机会知fuse load和衬UMIDF2010翼精耶18皂怛.:例应 了代码的火小Inter AVX是一、种嫁堡邮集瞥寒期用蚣曹当刍麻有理翌中的如今,Sandy Bridge的AVX务向量化宽度扩展到了 256位,原有的16个128 位XMhW存器扩充为256位的YMhW

45、存器,可以同时处理8个单精度浮点数和4 个双精度浮点数。换句话说,Sandy Bridge的浮点吞吐能力可以达到前代的两倍。不过现在,AVX的256位向量还仅仅能够支持浮点运算。不过 AVX勺特别之 处在丁,它可以应用128位的SIMD整数和SIMD浮点路径。Intel®高级矢枇扩展(Intel® AVX) 2倍矢量宽度站 SSE 泊 InteP AVX将所有16个皿寄存希扩展了到狷6位IDF2010256 f? 1201? (1999)(即埒墙世) Intel AVX在以下两种情况下匚作-全尚6位-浮点指令-帙I孙位像己有的SSE指令)件代晰有巳何的12»SS1

46、浙令样料器的成/魅分博年 Intel AVX目标是高性能-256位乘-加和Shuffle引手(性M现有的2倍)-第二.256 f? 1301? (1999) Intel AVX住以下两种情况下作-全潟6位-浮点指令-任I2W 像已有的SSE指令)件巳村的12S-SSI浙令冷。富的疗汜” Intel AVX目标是高性能t 256位乘* mfeShufflel¥ (性M现有的2倍)-第二 WqM% AVX指令集是和Sandy Bridge微架构紧密结合的,因此,微架构的浮点寄存器也要从128位扩展到256位,此外,Load单元也要适应一次载入 256位的能力,Sandy Bridge没有

47、 直接扩展原有 Load单元的位宽,而是通过增加了一个 Load单元来达到256bit Load的能力。Intel®高级矢量扩展(Intel® AVX) 2倍矢量宽度打5SE泊W龄庄杼以 Intel® AVX将所有16个皿寄存器扩展了到Z56位IDF2010具目堕率芟新的3和4操作数指令格式少一大1拷成 小3个字节的代码 Intel*高波龙财展(intel- AVX) i目的地变量 e说带景史的寄命局为乂,更好的新阳使用和更多的load/op macro*fus»ort的机会,并且生:成更小的代码多-X <Md/opFusioniT'LrI

48、DF2010在进行新性能扩展的同时,AVX指令集的出现对于原有的X86指令集也进行了优化与重新组合一一这主要源于AVX指令集新的操作码编码方式。AVX指令集的编码方式叫做VEX ( Vector Extension),其主要用途是缩短指令长度,降低无谓的代码冗余,并且也降低 了对解码器的压力,实现的方式也很特别一一压缩各式各样的Prefix前缀,集中到一个比较固定的字段中,从而达到了精简指令集的目的。既然我们一直在讨论Sandy Bridge核心,那么不谈到其特色的整合 GPIM 然是不合适的,虽然对丁服务器的应用来说多媒体性能的确是无足轻重。其实我们在文章最初就提到过,作为 Tioc-Toc

49、k时钟式的重要内容,其实从 Wesrtmere 32nmft理器开始,Intel就在处理器中整合了 GPU不过仅仅是将二者封装在一 个Die上。因为45nm的GPS 32nm的CPU6制程上不一致,最重要的是关键的 内存控制器被放在了 45nm的GPlS中,造成了 32nm Westmere性能并没有想象 的那么出色。而在Tock中,Sandy Bridge的出现解决了这一问题,特别是将GPU 整合在了环形总线之内,实现了二者真正的融合。Sandy Bridge Processor Graphics ArchitectureIDF2010SandyBridge GPU有自己的电源岛和时钟域,也

50、支持 Turbo Boost技术,可 以独立加速或降频,并共享三级缓存。显卡驱动会控制访问三级缓存的权限, 甚 至可以限制GPU®用多少缓存。将图形数据放在缓存里就不用绕道去遥远而 “缓 慢”的内存了,这对提升性能、降低功耗都大有裨益。MotionP : x e IHigh Performance Video Encode-Architecture Partition Programmable EU Array- Motion estimation and mode decision requiring flexibility-Assisted by high-throughput

51、VME (Video Motion Estimator) in Media Sampler Parallel MFX Engine-Supports A VC formats- Reconstruction shares decode logic- High throughput entropy codingMotionE 曲IntraEstimationIDFZdlOmi otnuonR t own可编程着色硬件被称为EU,包含着色器、核心、执行单元等,可以从多个 线程双发射时取指令。内部ISA映射和绝大多数DX10.1 API指令一一对应,架 构很像CISC,结果就是有效扩大了 EU的宽度

52、,IPC也显著提升。抽象数学运算 由EU内的硬件负责,性能得以同步提高。Intel此前的图形架构中,寄存器文件都是即时重新分配的。如果一个线 程需要的寄存器较少,剩余寄存器就会分配给其他线程。这样虽能节省核心面积, 但也会限制性能,很多时候线程可能会面临没有寄存器可用的尴尬。在芯片组集成时代,每个线程平均 64个寄存器,Westmere HD Graphics提高到平均80个, Sandybridge则每个线程固定为120个。好了,介绍了这么多,终丁轮到我们本次评测的主角一一至强E3系列登场了。关丁至强E3系列,一共有7款产品,其中两款为超低功耗版的产品。它们 的主频最低为2.2GHz,最高为

53、2.5GHz。53ImAmIE3 122OL2.23YES20YESES-126OL2.2&HD 100YES45YESE3 12203,18N/ANO80YESE3 12R3.28n/aYESWYESE3 1240338N/AYESWYESE3 12703A&N/AYES80YESE3 1280358N/AYES95YESE3 12253A6HD 200NO95YESE3-123S3.28HD 200YES95YESE3 12453.38HD 200YES95YESE3 12753A8HD 200YES95YES本次我们拿到的测试产品是 E3系列中的E3-1275和E3-12

54、20。前者是E3系 列中的高端产品,主频为3.4GHz,支持超线程技术,TDM 80VV后者是E3系 列标准版中的最低规格,主频仅为3.1GHz,不支持超线程技术。其中,整合GPU 的处理器命名统一以5结尾。至强E3-1275处理器Qi 1 I MH?ATms cgRsruLQIK< £S 3.,Y KHAT gw 0hhhhhhj*hHHHH艾mrMlmr:广矿1:二三二3 5 TM 二:二-l*:s:iT?T T_>_r ",-!Hr;*# f ;*>< TJttTX JiiA Tfrfrts Tstrlx 丁;:#/t*l'*#hjh

55、一m 八("* 1r*>_>> j r atf-if*8<»*#*" w FIa/f*>*- J-JJ JTJ1- F k h b k k k WJiJ- s -Il ml w*.ll ai« 1 1 _H* -I I Z 1 t ?1 s- f X. < 3 J J1 z I- a H11二 hi f* m V z V t 3 _*- 3 I 1 t * - 1 * t-SJUmmf 二:=H:1mI tn=TMnmmtts «"_m*J#J*>»$#* #>#>#J#*#tfr<#<1- # ¥ T frJs<*-*#*>>*# 【etf#,#<*#*$#*f#,»#*#,*#/小ait>#,#_»<*$*<»r#>>* 学 »#*#*#*#*#/

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论