微型计算机原理及应用第2章-3资料_第1页
微型计算机原理及应用第2章-3资料_第2页
微型计算机原理及应用第2章-3资料_第3页
微型计算机原理及应用第2章-3资料_第4页
微型计算机原理及应用第2章-3资料_第5页
已阅读5页,还剩89页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2.3 辉煌(huhung)的历程共九十四页2.3.1 辉煌的历程 CPU的飞速发展。 微处理器走过了短暂(dunzn)的36年,人类也从工业社会跨入了信息社会,其中当然得益于微电子技术造就的各种微数字处理设备的迅猛发展,首要的就是通用微处理器CPU的飞速发展。共九十四页位CPU 1971年Intel公司,在11月15日的电子新闻上推出了世界(shji)上第一款用于计算器4位微处理器4004,是划时代的产品。 共九十四页 8位CPU 随后英特尔又推出了8008,由于运算性能很差,其市场反应十分不理想(lxing)。 CPU的发展历程就是Intel公司X86系列CPU的发展历程。 1974年,8

2、位的CPU8008发展成首款真正的通用微处理器Intel 8080,时钟频率为2MHz。Zilog公司生产了8080的增强型Z80,摩托罗拉公司生产了6800,都属于第二代微处理器。 共九十四页 16位CPU 1978年,Intel公司首次生产出16位的微处理器8086,采用了3微米制造技术,集成度达到29000个晶体管,内部和外部总线都是16位,具有16位数据通道,内存寻址能力为1MB,20位,主频达4.77MHZ,最高主频速度为8MHz。 1981年,美国IBM公司将8088芯片用于其研制的PC机中,个人电脑(dinno)(PC)的概念开始建立起来。 共九十四页 1979年,Intel公司

3、(n s)推出了8088微处理器芯片,是8060的低价版本。 8088内部数据总线都是16位,外部数据总线是8位。能与8位外部设备相兼容。 共九十四页 1982年Intel推出了80286芯片,虽然它仍旧是16位结构,但是在CPU的内部含有13.4万个半导体管,68个引脚,采用四列直插式封装,分开设置16条(内部和外部统一)数据线和24条地址线,可寻址16MB物理内存。时钟频率由最初的6MHz逐步提高到8、10、12、16、20、25MHz。 80286在四个方面比8086有显著的改进:支持更大的内存;能够模拟内存空间;能同时运行多个(du )任务;提高了处理速度。 共九十四页从80286开始

4、,CPU的工作方式演变(ynbin)出两种来:实模式和保护模式。在实模式下,与8086一样,DOS应用程序占用全部系统资源,但执行速度更快。微处理器可以访问的内存总量限制在1兆字节(20位的物理地址);而在保护方式之下,80286可直接访问16MB的内存,提供1GB的虚地址(见“第6章 存储器”)空间,并能实现段寄存器、存储器访问及特权级和任务之间的保护,通过硬件控制,可以在多任务之间快速切换,因而,80286支持多用户多任务系统。在保护方式之下,可以保护操作系统,使之不像实模式或8086等不受保护的微处理器那样,在遇到异常应用时会使系统停机。共九十四页与8086相比,80286的BIU被分成

5、(fn chn)了地址部件AU、指令预取部件IU和总线部件BU。这样,80286的CPU内部的四个部件都可以异步并行操作,比8086的运行速度快。最早PC机的速度是4MHz。1984年IBM发布采用Intel 286处理器的PC-AT机(XT机的改进型),奠定了X86系统结构在PC市场的统治地位。 共九十四页4. 32位CPU 1984年,摩托罗拉的68000是最早推出的32位微处理器, 并获得苹果公司青睐,在自己的划时代个人电脑“PCMAC”中采用该芯片。 1985年10月17日,英特尔划时代的产品80386正式发布了,其内部包含(bohn)27.5万个晶体管,时钟频率为12.5MHz,后逐

6、步提高到20MHz、25MHz、 33MHz,最后还有少量40MHz产品。 共九十四页 Intel给80386设计了三个技术要点:使用“类286”结构,开发80387微处理器,增强浮点运算能力,开发高速缓存解决(jiju)内存速度瓶颈. 80386系列有两类产品386DX和386SX。80386DX有比80286更多的指令,频率为12.5MHz的80386每秒钟可执行6百万条指令,比频率为16MHz的80286快2.2倍。除了具有实模式和保护模式以外,还增加了一种“虚拟8086”的工作方式。可以同时模拟多个8086微处理器来提供多任务能力,也可以兼容从8086到80386的软件。 共九十四页

7、80386系列有两类产品386DX和386SX。80386DX有比80286更多的指令,频率为12.5MHz的80386每秒钟可执行6百万条指令,比频率为16MHz的80286快2.2倍。 由于32位微处理器的强大运算能力,PC的应用扩展(kuzhn)到很多的领域,如商业办公和计算、工程设计和计算、数据中心、个人娱乐。80386的32位CPU成了PC工业的标准。 共九十四页后来(huli), Intel公司又推出了80486CPU 内含120万个晶体管, 使用1微米的制造工 艺,时钟频率从25MHz 逐步提高到33MHz、 40MHz、50MHz。与80386相比,80486在各方面都是一个飞

8、跃。 共九十四页 在Intel处理器中,80486CPU第一次采用一级(即把高速缓存、浮点运算单元80387协处理器和CPU集成于一块芯片上)高速缓存(8KB),减少了访问内存RAM的次数;内部高速缓存缩短(sudun)了微处理器与慢速DRAM的等待时间;它提供的突发模式总线结构加快了RAM和CPU之间的数据传输交换速度;486也有DX和SX之分。 80486DX是将80386和数学协微处理器80387以及一个8KB的高速缓存集成在一个芯片内。80486DX的性能比带有80387数学协微处理器的80386 DX性能提高了4倍。80486SX则没有集成数学协微处理器,但它和80486DX的管脚是

9、通用的。 共九十四页 因PC机外部设备受工艺限制,工作频率有限,这就阻碍了CPU主频的进一步提高。为此(wi c),80486 DX2采用了时钟CPU倍频技术。80486 DX2的内部时钟频率主要有40MHz、50MHz、66MHz等。80486 DX4也是采用了时钟倍频技术的芯片,它允许其内部单元以2倍或接近4倍于外部总线的速度运行,但仍以原有时钟速度与外界通讯。486 DX2、486 DX4的名字便是由此而来。为了支持这种提高了的内部工作频率,它的片内高速缓存扩大到16KB。80486 DX4的时钟频率为100MHz,其运行速度比66MHz的80486 DX2快40%。 共九十四页5Pen

10、tium系列(xli)Intel在1993年推出了全新一代的高性能处理器Pentium,并起了一个相当好听的中文名字:“奔腾”。 Pentium的内部含有的半导体管数量高达310万个,时钟频率由最初推出的60MHz和66MHz,最后提高到200MHz。单单是最初版本的66MHz的Pentium微处理器,它的运算性能比33MHz的80486 DX就提高了3倍多,而100MHz的Pentium则比33MHz的80486 DX要快6至8倍。作为世界上第一个586级处理器,Pentium也是第一个超频最多的处理器。共九十四页 Pentium系列的处理器使用微米级的半导体制造(zhzo)工艺。因为芯片尺

11、寸越小,功耗也越小;密度越高,性能就越强,工作频率也就越高。早期的奔腾75MHz120MHz使用0.微米的制造工艺,后期120MHz频率以上的奔腾则改用0.35微米工艺。 Pentium的主要性能特点有:(1)超标量流水线。Pentium微处理器由 “U”,“V”两条指令流水线构成超标量流水线结构,每条流水线分指令预取、指令译码、地址生成、指令执行和回写等五个步骤,极大地提高了指令的执行速度。(2)重新设计了浮点部件FPU。其执行过程分8级流水,使每个时钟周期能完成一个浮点操作(或两个浮点操作),使它的浮点运算速度比80486快35倍. 共九十四页(3)所有的Pentium CPU都内置了16

12、K的一级缓存,分为两个独立的8KB指令Cache和8KB数据Cache。(4)采用了分支预测技术。Pentium提供了一个称为 BTB(Branch Target Buffer,分支目标缓冲器)的小的 Cache来动态地预测程序的分支操作,当某条指令导致程序分支,BTB就记下该条指令和分支目标的地址,并用这些信息预测该指令再次产生分支的路径,不致使指令流水线的执行产生停滞(tngzh)和混乱,从而大大提高了流水线执行的效率。 共九十四页(5)采用64位外部数据总线。由于Pentium芯片内部ALU和通用寄存器仍是32位的,所以还是32位微处理器,但它同内存储器进行数据交换的外部数据总线采用64

13、位总线,两者之间的数据传送速度可达 528MBs。Pentium微处理器还有与80X86系列微处理器兼容、增强了错误检测与报告功能、采用RISC技术等优点。经典奔腾的性能相当平均,整数运算(yn sun)和浮点运算(yn sun)都不错。Pentium不能插在486的主板上,因此从486升级到Pentium的代价是大的。 共九十四页 同时代的CPU,AMD有AM5x86,Cyrix也很快推出了自己的新一代产品(chnpn)5x86。它们仍然延用原来486系列的CPU插座,可以使用486的主板,功能远远不及Pentium,一般将它们看成是486到586的过渡产品。共九十四页 1995年Intel

14、推出了第六代X86系列CPU,专为服务器和工作站设计的Pentium Pro(高能奔腾,686级的CPU),它的核心体系结构代号为P6(也是未来P、P所使用的核心体系结构),这是P6第一代产品。内部时钟频率为:133/66MHz (工程样品),150/60MHz、166/66MHz、180/60MHz、200/66MHz。Pentium Pro的内部含有高达550万个的半导体管,处理速度几乎是100MHz的Pentium的2倍。Pentium Pro的片内一级高速缓存分为8KB指令缓存和8KB数据缓存。值得注意的是在Pentium Pro的封装中除Pentium Pro芯片外,还包括有一个25

15、6KB或512KB,最大有1MB的二级缓存Cache芯片。两个芯片之间用高带宽的内部通讯总线互连,处理器与高 速缓存的连接线路(xinl)也被安置在该封装中,这样就使高速缓存能更容易地运行在更高的与处理器相同的频率上。共九十四页在Pentium Pro中设置了三条超标量流水线,可以在每一个时钟周期中来同时执行三条指令的目的。同时Pentium pro又具有14级超级流水线结构,将任一条CISC(复杂指令集计算机)结构的指令的全部执行分成一连串的像RISC(精简指令集计算机)指令的微操作指令步(这里分成14个指令步),使它能在流水线上并行执行,提高了处理器的并行处理能力。而Pentium Pro

16、另一个引人注目的地方(dfng),是它具有一项称为“乱序执行和推测执行,或称动态执行(Dynamic Exec4tion)”的创新技术,这是继Pentium在超标量体系结构技术上实现实破之后的又一次飞跃。它能很容易就能升级到多(2个或2个以上)处理器系统。 共九十四页Pentium Pro 为了竞争,AMD推出K5,Cyrix推出了6x86。这两款CPU均以价廉著称,而且(r qi)与Pentium的主板完全兼容。共九十四页 1996年底Intel又推出Pentium MMX(多能奔腾)。 增加 4种新的数据类 型、8个64位寄存器和 57条MMX新指令来实 现的。此外,将CPU芯 片内的L1

17、缓存由原来的 16KB增加到32KB(16KB指令Cache,和16KB数据Cache),因此在运行含有MMX指令的程序时,MMX CPU比普通CPU处理多媒体的能力(nngl)上提高了60左右。在运行频繁使用浮点运算单元的3D游戏或软件时,有出色的性能表现,而且稳定。 共九十四页 Pentium MMX还包含了一个Pentium Pro采用过的分枝(fn zh)预测单元,以及一个只有IBM/Cyrix/6x86处理器才具有的返回堆栈。Pentium MMX系列的台式机的频率只有三种166/200/233, Pentium MMX系列的便携机的频率有六种:133/150/166/200/233

18、/266。 AMD和Cyrix两家公司也推出了拥有MMX指令系统的CPUK6和6X86MX。它们除了在浮点运算方面不及Pentium MMX外,其他性能均超过了Pentium MMX,而且价格也比Pentium MMX便宜,K6和6X86MX以及Pentium Overdiwer都能安装在双电压Socket 7的主板上。共九十四页 K6 6X86MX 1997年5月,Intel推出了和Pentium Pro同一个级别(P6级)的产品,也就是影响力最大的CPU Pentium ,集成了750万个晶体管。它采用了与Pentium Pro相同的核心结构,从而继承了原有Pentium Pro处理器优秀

19、的32位性能。Pentium 加快了段寄存器写操作的速度,它把多媒体增强技术(MMX技术)融入“高能奔腾”处理器中,使“奔腾”芯片既保持了“高能奔腾”原有的强大处理功能,又增强了PC机在三维图形、图像和多媒体方面的可视化计算(j sun)功能和交互功能。 共九十四页 在Pentium 里面,Intel将750万个半导体管集成到一个203平方毫米的硅片上。比Pentium Pro大6平方毫米,却比Pentium Pro多容纳了200万个半导体管。由于使用0.28微米的工艺,因此加快了半导体管的速度,从而达到了X86前所未有的时钟速度。与Pentium Pro一样,Pentium 在运行频繁使用浮

20、点运算单元(dnyun)的3D游戏或软件时,同样有出色的性能表现,但二者都在运行含有MMX增强指令的游戏或软件时会出现一些问题,不太稳定。 共九十四页 总线方面,Pentium 处理器采用了双独立总线 (DIB)结构,即其中一 条总线联接二级高速缓存, 另一条负责主要内存。 在接口技术方面,为了击垮Intel的竞争对手,以及获得更大的内部总线带宽,Pentium 首次采用了最新的Slot-1接口标准。但由于(yuy)Pentium Pro 的L2Cache的访问速度比Pentium 的快得多,所以大多数重要的服务器仍采用Pentium Pro而不用Pentium 。 共九十四页 Celeron

21、是Intel为抢占低端市场而专门推出的。它是Pentium 的精简产品,后来发展到Pentium 的精简版本,主频提升(tshng)到的800MHz,外频也升级至100MHz,其良好的超频性能,杰出的性价比,曾经红透CPU市场半边天。Celeron采用了最新的Slot- 1接口标准,能工作在大部分BX主板上。Celeron具有比Pentium 更出色的超频特性,Celeron 300A-Covington的倍频锁定在4.5,如果使用外频为112MHz ,就可以超频到504 MHz 。共九十四页 1999年2月17日,Intel推出采用P6内核的最后一款处理器Pentium 处理器,内含900万

22、个晶体管,制造工艺为0.25mm到0.18mm的CMOS,主频从450MHz起,到1GHz以上。具有32KB(16KB数据/16KB指令)L1高速缓存和512KB的L2高速缓存;如前所述,新采用SSE(Streaming SIMD Extensions,单指令多数据扩展)指令集,大大(d d)增强了3D图形、语言识别、视频实时压缩和数学运算所要求的浮点运算性能。相比Pentium ,Pentium 使处理器对高速缓存和主存的存取更加合理;首创处理器序列号功能(PSN),系统和用户可以通过Internet及PC机进行使用者的身份认证,具有出色的安全性能;可以通过Internet服务器登陆管理及电

23、子文件交换;也可以用于商业资产管理、远程控制系统的架构和监视。Pentium 具有一个流水线式的浮点运算单元(FPU),可支持32位、64位和80位的浮点运算;100MHz系统总线,后提升至133MHz,增加了带宽和性能。Pentium 和Pentium 同样,采用了双独立总线(DIB)结构,SECC2单边接触卡盒封装等等技术。共九十四页 Pentium 1998年AMD又公开发布了K6-2处理器,AMD第一次在浮点运算方面赶上(n shn)了Intel。为了对付INTEL,AMD又推出的第三代k6。 共九十四页 AMD于1999年2月推出了代号为“Sharp tooth”(利齿)的K6,19

24、99年6月23日,AMD公司推出了具有重大战略意义的K7微处理器,并将其正式命名为Athlon(速龙)。在主频和性能上超过Intel.之后推出的第二代PentiumIII处理器。 Duron微处理器是AMD首款 基于Athlon核心改进的低端 微处理器,即低成本低功耗 而又高性能。在浮点性能上,基于K7体系的Duron明显优于采用P6核心设计的Intel系列微处理器,它具有三个全流水(lishu)乱序执行单元,一个用于加/减运算,一个用于复合指令还有一个是浮点存储单元。 共九十四页 随着(su zhe)Intel的Pentium 4出现, AMD又推出了新一代的Athlon CPUAthlon

25、 XP,通俗的叫法是“Athlon 4”。 Duron Pentium 4 AnthonXP共九十四页 潮流(choli)和未来共九十四页2.3.2 潮流(choli)和未来1奔腾4的时代2000年11月21日,Intel推出了代号(diho)Willamette的处理器(全新的Socket 423插座),这就是Pentium 4,业界常简称为“P4”。Pentium 4集成了4200万个晶体管,采用了全新的32位微体系结构NetBurst,起步频率为1.3GHz。它集成256KB-512KB的ON-Die(晶元级别上)的L2缓存,支持更为强大的SSE2指令集,多达20级的全新的超标量流水线,

26、搭配i850/i845系列芯片组。NetBurst微体系结构是Pentinum 4处理器的基石,是一个完全重新设计的处理机,它汇集了许多具有创新特点的新技术和能力。共九十四页 2000年11月21日,Intel推出了代号Willamette的处理器(全新的Socket 423插座(chzu),这就是Pentium 4,业界常简称为“P4”(注意:P4实际上应该写作Pentium ,不是Intel 80486,那时,还没有Pentium)。Pentium 4集成了4200万个晶体管,没有沿用PIII(指Intel 80686)系列的的微体系结构,而是采用了全新的32位微体系结构NetBurst,

27、起步频率为1.3GHz。等效于400MHz(实际上这些总线的运做速度达不到400MHz)前端总线(100 x 4), 替代GTL+总线。Willamette的传输速度为3.2GB/sec ( 400MHz , 64bit ,支持Tehama 的双流水线RDRAM),这要比133MHz GTL+ 1,064GB/ 秒 ( 400MHz , 64bit )快得多。它集成256KB-512KB的ON-Die(晶元级别上)的L2缓存,支持更为强大的SSE2指令集,多达20级的全新的超标量流水线,搭配i850/i845系列芯片组,在许多方面超过了奔腾/等上两代的IA-32 CPU。之后又推出了1.4GH

28、z-2.0GHz的第二代P4 (针角更多的socket478)。 共九十四页 P4与一般的CPU在设计上有所不同,P4每时钟周期所处理的指令(IPC)相对其他CPU来说比较少,从某方面来讲正是这种低IPC的设计才使得其运行频率能够如此之高。CPU真实性能的惟一测量是执行(zhxng)给定应用程序所用的时间量。真正的性能是时钟频率(MHz)与IPC的结合: 性能=MHz IPC 时钟频率是制造工艺(制程)和微体系结构的函数,在给定的时钟频率下,IPC是处理机微体系结构和被执行的特定应用的函数。 共九十四页 Intel公司1996年在采用MMX技术的Pentinum 处理机上首次实现了64位的整数

29、SIMD指令,其后在Pentinum 处理机上引入128位的SIMD单精度浮点(SSE)指令。而Pentium 4装备了新的SSE2指令集:SSE2的引入使NetBurst微体系结构扩充了MMX技术和SSE技术的SIMD能力:凭借144条新指令,128位SIMD整数运算操作(cozu),128位SIMD双精度浮点操作。这些新指令提供了减少执行特定程序任务所需的指令总数的能力,最终对性能改善作出贡献。它们促进了范围广泛的应用,包括视频、语音、图像、图片处理、加密、财政、工程和科学应用。共九十四页下面我们体会一下NetBurst微体系结构特点细节:超流水线技术: 加倍了流水线深度,关键的一条流水线

30、分支预测/恢复流水线是用20段实现的。这种技术显著增加了以微体系结构为基础的处理机的性能和频率扩展能力。执行追踪Cache: 执行追踪Cache是实现L1指令Cache的一种创新方法(fngf)。它缓存已译码的x86指令(micro-ops微操作码),因而从主执行循环中消除了译码器的译码时延。另外,执行追踪Cache以程序执行流路径的顺序保存这些微操作码,例如,如果指令A从100的位置跳到了指令B在200的位置。那么执行追踪Cache则会将“第二条指令B恰好在指令A后面的位置”记录下来。这将帮助消除分支预测错误。共九十四页快速执行引擎REE: 通过体系结构、物理和电路设计的配合,处理机中简单的

31、算术逻辑单元ALU可运行于两倍处理机核心频率。这就允许ALU用1/2核心时钟宽度的时延执行某些指令,除减少执行时延外,可产生更高的执行吞吐量。400MHz 系统总线: 通过一种四泵(quad pumping)的物理信号发送和缓冲方案,允许在100MHz时钟的系统总线上持续不变地以400MHz进行数据传输。先进的动态执行引擎: 先进的动态执行引擎是一个很深的乱序推测执行引擎,通过提供很大的指令窗口(chungku),执行单元可从中选取指令。可避免由于等待“解决相关问题的指令”引起的流水线停滞。共九十四页图2-23 Pentium IV 处理器及搭配的RDRAM内存条先进的传输Cache: L2

32、Cache(ATC)容量为256KB,它提供了在L2 Cache和处理机核心通道(tngdo)之间很高的数据吞吐量。共九十四页264位CPU目前主流CPU使用的64位技术主要有AMD公司的AMD64位技术、Intel公司的EM64T技术、和Intel公司的IA-64技术。2001年,Intel推出它的首款(shu kun)64位Itanium(安腾)处理器。这是第一个从IA-32到IA-64体系结构转换的产品,用于工作站和服务器。共九十四页264位CPU: 目前(mqin)主流CPU使用的64位技术主要有AMD公司的AMD64位技术、Intel公司的EM64T技术、和Intel公司的IA-64

33、技术。其中IA-64是Intel独立开发,不兼容现在的传统的32位计算机,仅用于Itanium(安腾)以及后续产品Itanium 2。 2001年,Intel推出它的首款64位Itanium(安腾)处理器。这是第一个从IA-32到IA-64体系结构转换的产品,用于工作站和服务器。共九十四页共九十四页共九十四页英特尔公司企业平台集团的总经理迈克表示,代号为Nocona的3.6GHz至强芯片将在第二季度问世,它集成有1MB的二级缓存,有3种不同的运行模式:纯32位模式、32/64位混合模式、纯64位模式。迈克说,明年(mngnin),至强 MP芯片也将支持64位扩展技术。英特尔公司需要更多的时间将

34、这一技术应用到配置多个处理器的用品上。英特尔公司还于当地时间本周三发布了集成有2MB缓存、时钟频率为3.2GHz的至强芯片,老版至强芯片集成了1MB的缓存。共九十四页AMD的64位CPU 另一家公司AMD与Intel公司不同,类似(li s)十几年前Intel在386上做的那样,他们改编并延续x86指令集,扩展到64 bit支持,使CPU不仅能完整支持32位程序,还能兼容64位系统指令,发布了与Intel的IA-64完全不同的64 位体系结构,并称之为x86-64体系结构。x86-64可以提供一个既能运行32位程序又能运行64位程序的平台,而且是在同一个芯片上就可以完成所有功能。共九十四页 这

35、个解决方案的优势是十分显著的,你可以从AMD提供(tgng)的系统中直接得到32位的最佳解决方案,同时也能得到64位系统的兼容。两者被合并到一个内核。这就减轻了用户选择64位系统的困难。 随后AMD发布了代号“大锤”的x86-64体系结构的处理器K8。目前AMD方面支持64位技术的CPU有Athlon(速龙) 64系列、Athlon FX系列、Sempron(闪龙)系列和Opteron(皓龙)系列。 共九十四页 现在,让我们讨论IA-64体系结构和AMD的x86-64体系结构以及EM64T技术各自的特点: (1)IA-64体系结构的特点相比AMD的x86-64体系结构,IA-64显得清晰明了。

36、首先,IA-64在硬件(yn jin)上不支持x86的很大一批指令集,也就意味着不支持现有的包括Microsoft Windows 2000和Windows Me等等操作系统。其次,它拥有完整的64位CPU的一切特性和功能,属于不折不扣的高端产品,能在它上面运行的程序只有纯64位操作系统和应用软件。据悉,个人电脑的软件业霸主Microsoft已经打算开发基于IA-64系统的64位操作系统,可能是Windows 2000的64 bit版本,或者是Windows 2000的后继者Whistler的64位版本。共九十四页 在过去,复杂指令集(CISC)和精简指令集(RISC)曾经进行过一番斗争,最终

37、,IBM等公司采用了RISC技术,占据了高端的服务器、大型终端和大型计算机领域,而Intel采用了CISC(后来包含了一定的RISC指令成分),占领了低端和PC市场。竞争到现在这样一个阶段,显然Intel认为CISC已经发展到尽头,它对资源的低利用效率已经不能再依靠高频率来弥补,所以决定将整个体系结构更偏向RISC。IA-64就是这样的一个产物,当然由于CISC在某些应用中的优势(yush),它还保留了不少CISC指令。共九十四页IA-64体系结构究竟做了些什么呢?1)更改现有(xin yu)工业标准体系,建立IA-64体系结构后,将采用并行运算方式的体系;2)单指令简化,即每条指令执行的功能

38、减少,但执行效率变高;3)由于运行指令并行化,并且采用了程序控制指令,使分支预测更加准确,提高运算的利用效率;4)增加程序运行时的并行运算预测能力,使内存中需要的数据更容易在Cache中命中;5)增加内存的总容量,扩展到2的64次方,由原先的4GB内存扩展到惊人的180亿GB容量,并支持64位浮点数和32位浮点数,高精度的数字计算,提供高达82位的数据宽度。共九十四页6)利用大规模寄存器堆栈(GR Stack)来降低保存/重新启动(save/restore)等操作需要的调用,使用的是寄存器堆栈引擎Register Stacker Engine(RSE);使用全新的寄存器,减少寄存器使用数量,总

39、共128个64位寄存器,其中32个是静态的,96个是动态的。7)现有流水线采用的是顺序结构,一条运行结束后进行下一条,IA-64采用并行流水线结构,提高了工作效率。8)高速运算功能,在平行运算时,提供了2倍于运算频率的运算速度。IA-64还有很多特性,但我们不能一一讲述,其最主要的功能已经基本提到了。如果简单地用同样频率的Pentium Xeon 500和Itanium 500MHz相比的话,性能比较应该在2:15左右。在未来几年中,Intel对IA-64的开发占优先地位,并且(bngqi)依照市场能否顺利转向IA-64而决定是否继续开发IA-32系列产品。共九十四页(2)x86-64体系结构

40、特点AMD的64位技术包括了完整的x86-64结构体系,这个体系是通过对x86结构的扩展,增加64位指令集而得到的。使这款芯片在硬件上兼容原来的32位X86软件,并同时支持X86-64的扩展64位计算,使得这款芯片成为真正的64位X86芯片,具有64位的寻址能力(nngl)。 X86-64新增的几组CPU寄存器将提供更快的执行效率。寄存器是CPU内部用来创建和储存CPU运算结果和其它运算结果的地方。标准的32位 x86体系结构包括8个通用寄存器(GPR),AMD在X86-64中又增加了8组(R8-R9),将寄存器的数目提高到了16组。X86-64寄存器默认64位。还增加了8组128位XMM寄存

41、器(也叫SSE寄存器,XMM8-XMM15),将能给单指令多数据流技术(SIMD)运算提供更多的空间,这些128位的寄存器将提供在矢量和标量计算模式下进行128位双精度处理,为3D建模、矢量分析和虚拟现实的实现提供了硬件基础。通过提供了更多的寄存器,按照X86-64标准生产的CPU可以更有效的处理数据,可以在一个时钟周期中传输更多的信息。 共九十四页x86-64体系结构通过两个主要的特性来对原有的x86体系进行扩展:一个被成为“长模式(Long Mode)”的64位扩展,另一个就是扩充寄存器。长模式是由两个子模式构成的:兼容模式(Compatibility Mode)和纯64位模式(64 bi

42、t Mode)。兼容模式是提供整个系统运行32位和64位程序的模式。该模式允许16位和32位软件不需要经过重新编译就可以在长模式下直接应用。在兼容模式下,所有的应用软件对于内存的操作都只能位于前4GB的实物理内存地址之间,标准的x86命令也迫使对寄存器的操作界于16位和32位,64位系统的优势(yush)在这里并没有展现。共九十四页纯64位模式支持如下的新特性:1)64位实地址模式;2)通过寄存器前缀(qinzhu)(REX)来达到寄存器扩展;3)增加8个新的通用寄存器(GPRs),代号为R8到R15;4)扩展通用寄存器的宽度到64位;5)增加8个128位的SSE寄存器,标号为XMM8到XMM

43、15;6)新的关联数据地址模式RIP;7)单一字节寄存器地址。共九十四页还有一种原始(yunsh)模式(Legacy Mode),这个模式完全与x86模式相同。如果希望模拟一个完整的,并且真实的x86结构模式的话,那么只需要安装一个现有的操作系统,包括Windows 98和Windows 2000,那么CPU将自动调整为这个模式,并完全兼容现有程序,使用的时候与K7和Pentium 没有什么区别。(3)EM64T技术 Intel公司这样定义EM64T的:EM64T全称Extended Memory 64 Technology,即扩展64bit内存技术。EM64T是Intel IA-32(Int

44、el Architectur-32 extension)体系结构的扩展,即IA-32e。 共九十四页在兼容IA-32软件的情况下,允许软件利用更多的内存地址空间,并且允许软件进行32 bit线性地址写入。EM64T特别强调的是对32 bit和64 bit的兼容性。Intel为新核心增加了8个64 bit通用寄存器GPRs(R8-R15),并且把原有通用寄存器GRPs全部扩展为64 bit,这样可以提高整数运算(yn sun)能力。增加8个128bit SSE寄存器(XMM8-XMM15),是为了增强多媒体性能,包括对SSE、SSE2和SSE3的支持。 Intel为支持EM64T技术的处理器设计

45、了两大模式:传统IA-32模式(legacy IA-32 mode)和IA-32e扩展模式(IA-32e mode)。 共九十四页 在支持EM64T技术的处理器内,有一个称之为扩展功能激活寄存器(extended feature enable register,IA32_EFER)的部件(bjin),其中的bit10的控制着EM64T是否激活。当bit10长模式有效(long mode active,LMA)时,记LMA1,EM64T便被激活,处理器会运行在IA-32e扩展模式下;当bit10被称作IA-32模式有效时,记LMA0,处理器运行在传统IA-32模式。 共九十四页3CPU的型号新标

46、注法 在下面的讨论之前,我们先说一说Intel的CPU的型号新标注法。 英特尔自从90nM工艺推出后,其新款CPU不再象以前(yqin)那样,用主频来标注CPU,而是改用一个三位数字来标注CPU,英特尔借助这个使自己的产品全面覆盖高中低端的市场。英特尔近期的新品CPU为3、5、6、8、9几个系列(服务器版及至尊版不在讨论之列)。 3就是赛扬D,分478引脚和775引脚两种,478引脚的CPU的标注型号为5的倍数,775引脚的CPU标注 共九十四页型号尾号为5的倍数再+1。比方说:赛扬D325就是478引脚的CPU,因为325是5的倍数,而赛扬D326就是775引脚的CPU,因为326就是325

47、+1,赛扬D325和赛扬D326主频相同(xin tn),同为2.53G MHz,唯一区别就是一个是478引脚,一个是775引脚,另外,现在INTEL英特775引脚的CPU全线支持64位,所以赛扬D326还是一款64位的CPU。英特尔3系列的产品特性为533MHz 前端系统总线,二级缓存235K,不支持超线程。 共九十四页 5就是Pentium 4的普及版,除了最早的520和530(已停产)外,现在的5系列都是533MHz 前端系统总线,1M二级缓存,不支持超线程。因为同为775引脚,所以标注型号为5的倍数+1,如506、511、516等等。 6是Pentium 4的增强版,产品(chnpn)

48、特性为800MHz 前端系统总线,1M二级缓存,支持超线程。6的标注型号以10为步进,每增10,主频增加200MHz,如630是3.0G的,640是3.2G的。 共九十四页 8是Pentium 4的超强版,因为8产品性能过于优秀,所以已经不再叫Pentium 4,而改称Pentium D或简称PD。其产品特性为800MHz前端系统总线(除了以前(yqin)推出的PD 805之外),内部集成两个物理核心,分别拥有一个1M 二级缓存。8的标注型号也是以10为步进,每增10,主频增加200MHz,如820是2.8G的,830是3.0G的。 9是Pentium D的超强版,性能比8更强,拥有一个2M

49、二级缓存和800MHz前端系统总线。不过价格较贵。共九十四页3CPU的型号(xngho)新标注法-2AMD的CPU编号规律如下。按顺序有七个部分:头三个字母:CPU的类型 SDA指闪龙(Sempron)系列; ADA指速龙(Athlon)系列,ADA(X2)则指双核速龙(Athlon 64 X2 )系列;连续四个数字:CPU的PR标称值 例如,AMD CPU的“2600+”并不是(b shi)说它的频率是2.6GHz,而是表示CPU的速度的档次,即PR标称值。至于CPU的真实频率,请查下表2-8。共九十四页表2-8 AMD的新编号(bin ho)CPU性能CPU的类型代码 所属类型 PR标称值

50、 主频(MHz) ADA Athlon 64 2800+18003000+1800,2000,3200+2000,22003400+,3500+22003700+,3800+24004000+2400ADA(X2)Athlon 64 X2 4200+,4400+ 2200 4600+,4800+ 2400 共九十四页表2-8 AMD的新编号(bin ho)CPU性能CPU的类型代码 所属类型 PR标称值 主频(MHz) SDA Sempron 2500 1400 2600,2800 1600 3000,3100,3200 18003300,3400,3500 2000共九十四页PR标称值后第一

51、个字母:引脚规格与封装,以便和主板匹配。A 表示是Socket 754引脚规格与普通(ptng)封装;B 表示是Socket 754引脚规格与金属外壳封装;C 表示是Socket 940引脚规格与金属外壳封装;D 表示是Socket 939引脚规格与金属外壳封装。一般是Athlon 64;E 同C。引脚规格与封装后一个英文字母:表示核心工作电压。 A-1.351.4V; C-1.55V; E-1.50V;I-1.40V;K-1.35V; M-1.30V;O-1.25V;Q-1.20V;S-1.15V;电压后的一个英文字母:表示极限温度 A-不确定; I-63;K-65;M-67;O-69;Q-

52、1.20V;P-70;X-95;Y-100;共九十四页温度后的一位数字:表示二级缓存的容量 2-二级缓存的容量为128kB;3-二级缓存的容量为256kB; 4-二级缓存的容量为512kB;5-二级缓存的容量为1MB; 6-二级缓存的容量为2MB;最后两个字母:表示CPU的制程。制程越小,能耗和发热也越小。 A或LA,表示0.13微米(wi m)工艺;B或C或LD,表示90纳米工艺;大家可要注意,在选择CPU时,千万不要只考虑主频,现在电脑的CPU主频并不代表一切,比方说630的主频是3.0的,但它却没有820(主频2.8)贵,为什么呢,630是Pentium 4的增强版,820是Pentiu

53、m 4的超强版。共九十四页4双核与双芯(Dual Core Vs. Dual CPU): 双核处理器是指在一个处理器上集成两个运算核心,从而提高计算能力。 目前流行的AMD Athlon 64 X2双核处理器有Athlon64 2 3800+和Athlon64 2 3600+。 AMD公司(n s)表示将于2007年正式向市场推出四核CPU芯片,Ientel公司也表示将于2007年初发布其首款四核处理器产品。 共九十四页共九十四页4双核与双芯(Dual Core Vs. Dual CPU): 由于功耗和散热(高主频带来了处理器巨大的发热量)等多重问题,处理器厂商无法再依靠主频的提升来提升产品性

54、能,因此英特尔和AMD都瞄准了双内核处理器架构。2006年4月中旬,英特尔发布了应用于台式机的双核处理器。 双核处理器是指在一个处理器上集成两个运算核心(hxn),从而提高计算能力。“双核”的概念最早是由IBM、HP、Sun等支持RISC架构的高端服务器厂商提出的,不过由于RISC架构的服务器价格高、应用面窄,没有引起广泛的注意。共九十四页 到底什么是双内核?毫无疑问,双内核应该具备(jbi)两个物理上的运算内核,而这两个内核的设计方式却大有文章可作。 AMD和Intel两家的思路不同。英特尔是将放在不同Die(晶元)上的两个完整的CPU封装在一起,连接到同一个前端总线上。可以设想,这样的两个

55、核心必然会产生总线竞用,影响性能。不仅如此,还对于未来更多核心的集成埋下了隐患,因为会加剧处理器竞用前端总线带宽,成为提升系统性能的瓶颈。AMD从一开始设计时就考虑到了对多核心的支持。据现有的 共九十四页资料显示,AMD Opteron(皓龙) 处理器从一开始设计时就考虑到了添加第二个内核,两个CPU内核做在一个Die(晶元)上,通过直连微体系结构连接起来,集成度更高。核心之间以芯片速度通信,进一步降低了处理器之间的延迟。AMD直连微体系结构(也就是通过超传输技术让CPU内核直接跟外部I/O相连,不通过前端总线)和集成内存控制器技术,使得每个内核都自己的高速缓存可资遣用,都有自己的“专用车道”

56、直通I/O,没有(mi yu)资源竞用的问题,实现双核和多核更 共九十四页容易。两个CPU内核使用相同的系统请求接口(SRI)、HyperTransport(超传输超线程技术,)技术和内存(ni cn)控制器,兼容90纳米单内核处理器所使用的940引脚接口。 可以说,AMD的解决方案是真正的“双核”,而英特尔的解决方案则是“双芯”。我们知道,CPU的性能是由体系结构决定的。因此可以说,AMD的体系结构为实现双核和多核奠定了坚实的基础。 共九十四页 AMD的方案能够使双核CPU的管脚、功耗等指标跟单核CPU保持一致,从单核升级到双核,不需要更换电源、芯片组、散热系统和主板,只需要刷新BIOS软件

57、即可,这对于主板厂商、计算机厂商和最终用户的投资保护是非常有利的。客户可以利用其现有的90纳米基础设施(j ch sh sh),通过BIOS更改移植到双核心的系统。计算机厂商可以轻松地提供同一硬件的单核心与双核心版本,使那些既想提高性能又想保持IT环境稳定性的客户能够在不中断业务的情况下升级到双核心。 共九十四页 Intel 的中端的双核心处理器拥有一个全新的名字 Pentium D ,目前推出 820 、 830 、 840 三款,它们的频率分别是: 2.8 、 3.0 、 3.2GHz 。Pentium D除拥有两颗物理核心外, 还具有(jyu) EM64T 扩展技术,可以支持 64 位指

58、令集。Pentium D 每个内核都具有 1MB 的二级缓存,采用两路互联总线,能够提高调用与存储操作时的缓存命中率,它的两个内核之间通过前端总线交换数据。 Pentium D 采用 LGA775 封装,需要 945P/G 或者 955X 芯片组配合,使用双通道 DDR2 667 内存。 Pentium D 830/840 还具有 EIST 技术,它们都支持 Execute Disable Bit 防病毒技术。都具有超标量流水线,先进的动态执行,非常深的乱序执行,增强的指令分支预测精度。它具有增强的浮点和多媒体单元,可以提高视频、音频、加密和 3D 的性能,可以说 Pentium D 能够适合

59、多任务和高端视频与游戏应用。 共九十四页 在2006年度春季英特尔开发者论坛大会(Intel Developer Forum,IDF)上,Intel宣布了下一代处理器将统一采用全新的微体系结构,并将其正式命名(mng mng)为Core(酷睿)。2006年1月9日,Intel发布了中文名字为酷睿的新款双核处理器。Core微体系结构拥有双核心、64bit指令集、4发射的超标量体系结构和乱序执行机制等技术,使用65nm制造工艺生产,支持36bit的物理寻址和48bit的虚拟内存寻址,支持包括SSE4在内的Intel所有扩展指令集。Core微架构的每个内核拥有32KB的一级指令缓存、32KB的双端口

60、一级数据缓存,2个内核共同拥有4MB或2MB的共享式二级缓存。 共九十四页 英特尔酷睿TM2双核处理器在2006年7月27日全球同步上市。有人认为:这在计算机处理器发展史上具有划时代意义。 当Intel发布酷睿2桌面处理器后,在Intel的产品线中,有高端的酷睿2,中端的Pentium D,低端的Pentium 4和Celeron D。目前流行的AMD Athlon 64 X2双核处理器有Athlon64 2 3800+和Athlon64 2 3600+。Athlon64 2 3600+和3800+是非常相似的。核心(hxn)相同,一级缓存相同,只是二级缓存减 共九十四页半(Athlon64

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论