硬件工程师培训教程(七).doc_第1页
硬件工程师培训教程(七).doc_第2页
硬件工程师培训教程(七).doc_第3页
硬件工程师培训教程(七).doc_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.硬件工程师培训教程(七)第六节新款CPU介绍一、Intel公司的新款CPU1.PCoppermine(铜矿)处理器2000年最惹人注目的莫过于Intel公司采用0.18微米工艺生产的PCoppermine处理器了。尽管Intel公司早在1999年10月25日便发布了这款代号为Coppermine的Pentium处理器,但其真正的普及是在2000年。虽然取名为“铜矿”,Coppermine处理器并没有采用新的铜芯片技术制造。从外形上分析,采用0.18m工艺制造的Coppermine芯片的内核尺寸进一步缩小,虽然内部集成了256KB的全速On-DieL2Cache,内建2810万个晶体管,但其尺寸却只有106mm2。从类型上分析,新一代的Coppermine处理器可以分为E和EB两个系列。E系列的Coppermine处理器采用了0.18m工艺制造,同时应用了Intel公司新一代On-Die全速256KBL2Cache;而EB系列的Coppermine不仅集合了0.18m制造工艺、On-Die全速256KBL2Cache,同时还具有133MHz的外频速率。从技术的角度分析,新一代Coppermine处理器具有两大特点:一是封装形式的变化。除了部分产品采用SECC2封装之外,Intel也推出了FC-PGA封装及笔记本使用的MicroPGA和BGA封装;二是制造工艺的变化。Coppermine处理器全部采用了0.18m制造工艺,其核心工作电压降到了1.65V(SECC2)和1.6V(FC-PGA),与传统的P相比大大降低了电能的消耗和发热量。PCoppermine的整体性能与传统的P相比有了较大幅度的提高。作为新一代处理器,Coppermine强劲的高速On-DieL2Cache值得称道,而且PCoppermine的可超频性也是非常出色的。2.PCoppermine-T和Tualatin2001年末,PCoppermine会进一步改进制造工艺采用0.13微米制造,新版本Tualatin也即将问世。其核心技术大致如下:最初时钟频率应该是1.13/1.26GHz;内核集成512KB二级缓存;采用新的总线结构;封装结构上采用FCPGA2替换FCPGA。我们注意到Tualatin在电压和总线规格上和过去的P处理器有了不同,因此未来似乎应该有全新的平台来支持P处理器。当前只有一款芯片组宣布支持Tualatin,它就是Almador或者被称之为i830。而PCoppermine-T内核则可能是过渡产品,它既能运行于当前的i815、694X等产品,相信也能在Almador平台上使用。从时间表上看这两款处理器都在2001年三季度发布。但由于IntelPentium4战略的延展,也许它们会悄无声息地来临,甚至缩减至一款。3.Celeron处理器为了进一步扩大在低端市场的占领份额,2000年3月Intel终于发布了其代号为“Coppermine128”的新一代的Celeron处理器Celeron(Intel仍称其为Celeron,但为了和前面的Celeron区分,我们暂且这样称呼)。Celeron与老Celeron最显著的区别在于采用了与PCoppermine相同的核心及同样的FC-PGA封装方式,同时支持SSE多媒体扩展指令集。从技术角度分析,Celeron与PCoppermine有着诸多明显的区别:一是Celeron的L2Cache容量只是PCoppermine处理器的一半,并且缩减PCoppermine的8路缓存通道为4路,延迟时间也由PCoppermine的0变成了2。由此不难看出,相同主频的Celeron在性能方面比PCoppermine要差很多;二是功耗方面。Celeron的核心电压只有1.5V(最新款有1.7V),而PCoppermine的核心电压为1.65V,功耗相对较低;三是外频方面。Celeron出人意料地沿用了古老的66MHz外频,面对低端市场早已使用100MHz外频的AMDK6-2,Intel此举除了商业行为的理由外恐怕无法解释。而66MHz外频的Celeron与100MHz外频的PCoppermine相比,也就注定了其要在性能方面牺牲更多。Celeron系列向来有着如奔腾系列一样优秀的浮点运算性能,Celeron集成的全速缓存使得其整数性能也得以大幅度提高。但是,糟糕的66MHz外频可能会是Celeron最终不敌AMD同型产品的致命之处,不过如果将其与老Celeron放在一起,其实还是我们要求太高了。与Coppermine同样的FC-PGA封装方式必定会使Celeron的兼容性有所提高。正是由于高性能的二级缓存和低功耗,Celeron同样也具有良好的超频性能。4.Pentium4处理器美国东部时间2000年6月28日,Intel公司正式宣布将该公司开发的下一代微处理器命名为Pentium4。新一代的Pentium4处理器即原先研发代号为Willamette的Willy芯片,是Intel公司继Coppermine处理器之后推出的面向普通用户的主流产品。2000年11月20日,Intel公司正式发布Pentium4处理器。该处理器采用了不同于P6总线的全新NetBurst架构,其管线长度是P6架构的两倍,达到了20级。这将使Pentium4达到更高时钟频率。现在的Pentium处理器由于管线长度的限制,最高时钟频率在1.2GHz左右,Pentium1.13GHz处理器出现的问题就是最好的证明。不过,管线长度的加长,也意味着entium4每一个时钟周期执行的指令要比Pentium少,这就是为什么在相同的速度下,Pentium或Athlon处理器的性能看起来要比Pentium4处理器更强一些的原因。不过,随着Pentium4速度的提升,这一现象会逐渐消失。Pentium4处理器采用新的系统总线代替了原有的GTL+总线,总线速度达到400MHz。最初版本的核心频率为1.4GHz和1.5GHz,内部集成了8KB一级数据缓存和256KB同速二级缓存(Intel称之为L2超级传输缓存),带宽大于44.8GB/s,大大超过Pentium1GHz处理器的16GB/s。初期的Pentium4采用0.18m工艺制造,包含4200万个晶体管,芯片面积为217mm2,核心电压为1.7V,目前采用Socket423接口,此外Intel还推出了一款Socket478接口的Pentium4,这才是最终版本。Pentium4的算术逻辑单元(ALU)以核心频率的两倍运行。此外,Pentium4还包含144条重新设计过的SSE2指令。Intel预计Pentium4将于2001年下半年占其CPU总产量的一半,并采用0.13m铜工艺制造。Pentium4的架构被Intel称之为NetBurst。其中最容易被关注到的变化就是它的新系统总线。虽然真实时钟频率只有100MHz,位宽还是64位,但由于利用了与APG4x相同的工作原理,它的速度实际相当于400MHz是传统P6总线的四倍,可传输高达3.2GB/s。明显超过AMDThunderbird处理器266MHz(133MHz2)2.1GB/s的数据传输率。Pentium4的二级缓存与Pentium的二级缓存大小相同,都是256KB并皆为8路联合方式运作。但Pentium4的二级缓存每线为128字节,并分成2个等量的64字节。当它从系统(无论是内存、AGP显卡或是PCI等)取出数据时,都是以64字节为单位,这样一来确保批量传输的最大性能。一级缓存方面,Pentium4仅有8KB的一级数据缓存,没有指令缓存,这样便于降低一级的延迟,采用4路联合方式,并使用64字节的缓存管道。双端口结构使得能在一个时钟内,一个读取而另一个写回的方式来同时运作。过去在Pentium或Athlon处理器中,都有一级指令缓存。代码会先被放入此块缓存中,直到要真正被处理单元执行时才会取出。糟糕的是某些x86指令非常复杂,因此解码过程可能会阻塞整个执行管道,同时这些指令中的部分重复频率很高,常常刚解码一次后又需要再次解码。基本上讲,Pentium4的执行追踪缓存就是在解码器底下的的一级指令缓存,如果缓存里存放有已经解码过的复杂指令,下一次它进入流水线时就不需要再解码,而只直接提取微指令即可。另外Pentium4新加有硬件预取的机制。这块新的处理单元可辨认Pentium4核心执行软件的数据存取样本,并依此猜测下次会被处理的数据,然后将这些数据预先载入缓存中。在应用大量的有规则数据情况下比如矩阵,Pentium4的硬件预取功能将大幅加速执行效能。还有Pentium4最有名的特性之一就是该处理器具有非常长的流水线工位。Pentium的流水线工位有10个,Athlon为11个,而Pentium4不少于20个。如此多的工位数量保证了每个工位执行的任务足够简单,很显然Pentuim4已经做好了足够的准备向更高的GHz频率进军,这显然是Pentium和Athlon所不具备的,也是他们注定无法在更高频率上和Pentium4抗衡的致命伤。Pentium4的流水线能保留多达126个将要被执行指令,其中最多可包含48个载入及24个存储运算。而追踪缓存分支预测单元,就是用来确保清空整个管道内容的情况不会经常发生的。Intel声称用了这个单元后,可减少Pentium33%的预测失败。但一旦发生预测失败,所带来的损失也相当惊人。其余的新特性包括两组双速ALU及AGU。因为他们可以每半时钟内处理一个微指令,因此四个中的每一个时钟皆为处理器时钟的两倍。快速执行引擎无法处理的指令,将被送到唯一的SlowALU处处理。不过好在程序指令绝大部分都是一些简单的指令。加入流式单指令多数据扩展技术的第二版棗SSE2。这一次新开发的SIMD指令了包括浮点SIMD指令、整形SIMD指令、SIMD浮点和整形数据之间转换以及数据在XMM寄存器和MMX寄存器中转换等几大部分。其中重要的改进包括引入新的数据格式,比如128位SIMD整数运算和64位双精度浮点运算等等。为了更好的利用Cache,P4还另外增加了几条操作缓存的指令,允许程序员控制已经缓存过的数据。由于SSE2更多是在架构内部的加强和优化,其最大好处是并不需要因此而开发全新的操作系统,只要稍微打个补丁之类,就能享受到SSE2带来的好处。Intel公司于2001年8月底发布的1.9和2.0GHz的Pentium4仍然采用0.18微米的Willamette内核。我们曾经很希望看到此次发表的Socket478接口Pentium4采用代号为Northwood的新核心。不过,Intel可能在0.13微米制程上碰到了一些麻烦。5.Itanium处理器大多数熟悉计算机的爱好者一定都听过Merced这个名字,现在Intel已经正式把它命名为Itanium。这将是Intel第一款执行IA-64指令的微处理器。它采用了EPIC(ExplicitlyParallelIn-structionCode,显性并行指令计算)技术,可实现每时钟周期高达20次运算。Itanium有128个整数和多媒体寄存器,128个82位浮点寄存器,64个论断寄存器,8个分支寄存器。这么多的寄存器允许Intel整合动态寄存器堆栈引擎,这将大大提高处理能力。第一代IA-64的处理器通过它们的浮点单元可每秒执行60亿次浮点操作。(1)Itanium的主要物理参数该处理器具有3级高速缓存,包括2MB或4MB三级高速缓存、96KB二级高速缓存和32KB一级高速缓存,缩短了内存等待时间。首批产品采用733MHz和800MHz主频。2266MHz数据总线,以2.1GB/s带宽支持快速系统总线处理。“机器检查体系结构”(MCA)、完善的错误记录、高速缓存和系统总线纠错码(ECC)设计提供了先进的错误检测、纠正和处理能力。64位数据总线(以及8位ECC)。3英寸5英寸插盒,包括安腾处理器和高达4MB的盒上3级高速缓存。专用的边缘电源接头为处理器和高速缓存设备提供单独电压,从而提高信号的完整性。硬件内建IA-32指令二进制兼容性。CCPU中晶体管数量为2500万个,高速缓存中有3亿个。(2)Itanium的主要性能指标一体化的2MB或4MB盒上三级高速缓存。以处理器主频全速运行,采用4路成组相联设计和64字节高速缓存线。采用全面的流水线和优化设计,使用128位宽高速缓存总线以12.8GB/s带宽实现快速数据访问。一体化的96KB二级高速缓存,6路成组相联结构,采用全面的流水线设计和64位高速缓存线。一级高速缓存为32KB,数据高速缓存与指令高速缓存分开(16KB数据/16KB指令)。4路成组相联结构,采用全面的流水线设计和32字节高速缓存线。高度并行的流水线硬件,10级流水线。两个整数单元和两个内存单元,每时钟周期能够执行4条ALU指令。浮点(FP)计算单元包含两个以82位运算数运行的FMAC(浮点相乘累积)单元。每个FMAC单元每时钟周期能够执行两次浮点运算,支持单精度、双精度和扩展双精度。两个额外的FP多媒体单元,每个单元能够执行两条单精度FP运算。与常规的FMAC相结合,每时钟周期能够执行8次单精度FP运算,最高结果可达6.4GFLOPS。44位物理内存寻址能力。集成的系统管理特性,提供温度监测和插盒识别信息。先进的载入地址表(ALAT),包括32个条目,采用2路成组相联高速缓存设计,支持推测执行,最小的内存等待时间和更高性能。两层数据转换后备缓冲器(DTLB)在DTLB1(全部相关联)中有32个条目;在DTLB2中有96个条目。另外,系统软件(OS)可以单独使用48个转换寄存器(TR),存储关键的虚拟到物理地址转换。指令转换后备缓冲器(ITLB)包含64个条目,并且相互之间完全相关。“显性并行指令集计算”(EPIC)技术,通过最大限度地发挥硬件和软件的协同作用,提高了指令级并行运算能力。Itanium体系结构为编译器提供了多种机制,用于与处理器交流编译器时间信息,如分支和高速缓存提示。此外,这种体系结构使编译代码能够通过

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论