本科系统结构课件 2006年CPU的详解_第1页
本科系统结构课件 2006年CPU的详解_第2页
本科系统结构课件 2006年CPU的详解_第3页
本科系统结构课件 2006年CPU的详解_第4页
本科系统结构课件 2006年CPU的详解_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2006年CPU的详解CPU的外频是CPU乃至整个计算机系统的基准频率,单位是MHz(兆赫兹)。在早期的电脑中,内存与主板之间的同步运行的速度等于外频,在这种方式下,可以理解为CPU外频直接与内存相连通,实现两者间的同步运行状态。对于目前的计算机系统来说,两者完全可以不相同,但是外频的意义仍然存在,计算机系统中大多数的频率都是在外频的基础上,乘以一定的倍数来实现,这个倍数可以是大于1的,也可以是小于1的。说到处理器外频,就要提到与之密切相关的两个概念:倍频与主频,主频就是CPU的时钟频率;倍频即主频与外频之比的倍数。主频、外频、倍频,其关系式:主频=外频×倍频。在486之前,CPU的主频还处于一个较低的阶段,CPU的主频一般都等于外频。而在486出现以后,由于CPU工作频率不断提高,而PC机的一些其他设备(如插卡、硬盘等)却受到工艺的限制,不能承受更高的频率,因此限制了CPU频率的进一步提高。因此出现了倍频技术,该技术能够使CPU内部工作频率变为外部频率的倍数,从而通过提升倍频而达到提升主频的目的。倍频技术就是使外部设备可以工作在一个较低外频上,而CPU主频是外频的倍数。在Pentium时代,CPU的外频一般是60/66MHz,从PentiumⅡ350开始,CPU外频提高到100MHz,目前CPU外频已经达到了200MHz。由于正常情况下外频和内存总线频率相同,所以当CPU外频提高后,与内存之间的交换速度也相应得到了提高,对提高电脑整体运行速度影响较大。外频与前端总线(FSB)频率很容易被混为一谈。前端总线的速度指的是CPU和北桥芯片间总线的速度,更实质性的表示了CPU和外界数据传输的速度。而外频的概念是建立在数字脉冲信号震荡速度基础之上的,也就是说,100MHz外频特指数字脉冲信号在每秒钟震荡一万万次,它更多的影响了PIC及其他总线的频率。之所以前端总线与外频这两个概念容易混淆,主要的原因是在以前的很长一段时间里(主要是在Pentium4出现之前和刚出现Pentium4时),前端总线频率与外频是相同的,因此往往直接称前端总线为外频,最终造成这样的误会。随着计算机技术的发展,人们发现前端总线频率需要高于外频,因此采用了QDR(QuadDateRate)技术,或者其他类似的技术实现这个目的。这些技术的原理类似于AGP的2X或者4X,它们使得前端总线的频率成为外频的2倍、4倍甚至更高,从此之后前端总线和外频的区别才开始被人们重视起来。主频,就是CPU的时钟频率,简单说是CPU运算时的工作频率(1秒内发生的同步脉冲数)的简称。单位是Hz。它决定计算机的运行速度,随着计算机的发展,主频由过去MHZ发展到了现在的GHZ(1G=1024M)。通常来讲,在同系列微处理器,主频越高就代表计算机的速度也越快,但对与不同类型的处理器,它就只能作为一个参数来作参考。另外CPU的运算速度还要看CPU的流水线的各方面的性能指标。由于主频并不直接代表运算速度,所以在一定情况下,很可能会出现主频较高的CPU实际运算速度较低的现象。因此主频仅仅是CPU性能表现的一个方面,而不代表CPU的整体性能。说到处理器主频,就要提到与之密切相关的两个概念:倍频与外频,外频是CPU的基准频率,单位也是MHz。外频是CPU与主板之间同步运行的速度,而且目前的绝大部分电脑系统中外频也是内存与主板之间的同步运行的速度,在这种方式下,可以理解为CPU的外频直接与内存相连通,实现两者间的同步运行状态;倍频即主频与外频之比的倍数。主频、外频、倍频,其关系式:主频=外频×倍频。早期的CPU并没有“倍频”这个概念,那时主频和系统总线的速度是一样的。随着技术的发展,CPU速度越来越快,内存、硬盘等配件逐渐跟不上CPU的速度了,而倍频的出现解决了这个问题,它可使内存等部件仍然工作在相对较低的系统总线频率下,而CPU的主频可以通过倍频来无限提升(理论上)。我们可以把外频看作是机器内的一条生产线,而倍频则是生产线的条数,一台机器生产速度的快慢(主频)自然就是生产线的速度(外频)乘以生产线的条数(倍频)了。现在的厂商基本上都已经把倍频锁死,要超频只有从外频下手,通过倍频与外频的搭配来对主板的跳线或在BIOS中设置软超频,从而达到计算机总体性能的部分提升。所以在购买的时候要尽量注意CPU的外频。cpu中的浮点运算和整数运算是什么意思?CPU性能源自超标量浮点运算结构乍看题目,一个“超标量浮点运算结构”就使我们很头疼,那我们就暂且将它搁浅起来,先看看电脑使用时的某些表现。当我们用不同的电脑计算圆周率时,结果就会发现一台电脑的计算较另一台来讲结果更加精确。或者我们在进行枪战游戏的时候,当一粒子弹击中墙壁时,墙上就会相应的剥落下一块墙皮,同样的场面在一台电脑上的表现就是一个完整的多边形墙皮从墙上掉下来,非常的呆板、做作;而在另外一台电脑上就会看到非常生动形象的一块墙皮的剥落图像,几乎墙皮剥落时冒出的灰烟、墙皮一圈还支愣着即将掉下的土,就如同我们在现实中看到的所差无几。以上我们看到的一切,都源于CPU内部添加的“浮点运算功能”。具有强大浮点运算功能的CPU,可以使电脑运算更加精确、电脑图像更加逼真生动。在电脑中,显示器上所有图像的表现都是通过内部复杂的运算形成的,如果说1、2、3等是整数的话,那么浮点就是整数后面所存在的小数点,而电脑应用中绝大多数应用的都是浮点运算功能。浮点运算能力是关系到CPU的多媒体,3D图形处理的一个重要指标。P4中只有2个浮点执行单元,而其中一个单元要同时处理:FADD,FMUL,MMX,SSE,和SSE2,而P4的浮点运算完全取决于SSE的优化,所以P4处理器的浮点单元设计应该是整个处理器设计中最薄弱的部分。AMD则为Athlon设计了3个并行的浮点、多媒体执行单元。其中一个是浮点的存储,一个是浮点加,一个是浮点乘,其中浮点加和浮点乘是分开的,所以Athlon中就有两个并行的浮点通道,三个执行单元,而且相互之间完全不受干扰,这是所谓的超标量的浮点结构,可以说Athlon的浮点运算无疑是目前最强的。一、谁优谁劣?——AMD与Intel产品对比分析1.AMD与Intel的产品线概述AMD目前的主流产品线按接口类型可以分成两类,分别是基于Socket754接口的中低端产品线和基于Socket939接口的中高端产品线;而按处理器的品牌又分为Sempron、Athlon64、Opteron系列,此外还有双核的Athlon64X2系列,其中Sempron属于低端产品线,Athlon64,Opteron和Athlon64X2属于中高端产品线。这样看来,AMD家族同一品牌的处理器除了接口类型不同之外,同时还存在着多种不同的核心,这给消费者带来了不小的麻烦。可以说AMD现在的产品线是十分混乱的。与AMD复杂的产品线相比,Intel的产品线可以说是相当清晰的。Intel目前主流的处理器都采用LGA775接口,按市场定位可以分成低端的CeleronD系列、中端的Pentium45xx系列和高端的Pentium46xx系列、双核的PentiumD系列。除了PentiumD处理器以外,其他目前在市面上销售的处理器都是基于Prescott核心,主要以频率和二级缓存的不同来划分档次,这给了消费者一个相当清晰的印象,便于选择购买。(鉴于目前市场上销售的CPU产品都已经全面走向64位,32位的CPU无论在性能或者价格上都不占优势,因此我们所列举的CPU并不包括32位的产品。同样道理,AMD平台的SocketA接口和Intel的Socket478接口的产品都已经在两家公司的停产列表之上,而AMD的Athlon64FX系列和Intel的PentiumXE/EE系列以及服务器领域的产品也不容易在市面上购买到,因此也不在本文谈论范围之内。)2.AMD与Intel产品线对比双核处理器可以说是2005年CPU领域最大的亮点。毕竟X86处理器发展到了今天,在传统的通过增加分支预测单元、缓存的容量、提升频率来增加性能之路似乎已经难以行通了。因此,当单核处理器似乎走到尽头之际,Intel、AMD都不约而同地推出了自家的双核处理器解决方案:PentiumD、Athlon64X2!所谓双核处理器,简单地说就是在一块CPU基板上集成两个处理器核心,并通过并行总线将各处理器核心连接起来。双核其实并不是一个全新概念,而只是CMP(ChipMultiProcessors,单芯片多处理器)中最基本、最简单、最容易实现的一种类型。处理器协作机制:AMDAthlon64X2Athlon64X2其实是由Athlon64演变而来的,具有两个Athlon64核心,采用了独立缓存的设计,两颗核心同时拥有各自独立的缓存资源,而且通过“SystemRequestInterface”(系统请求接口,简称SRI)使Athlon64X2两个核心的协作更加紧密。SRI单元拥有连接到两个二级缓存的高速总线,如果两个核心的缓存数据需要同步,只须通过SRI单元完成即可。这样子的设计不但可以使CPU的资源开销变小,而且有效的利用了内存总线资源,不必占用内存总线资源。PentiumD与Athlon64X2一样,PentiumD两个核心的二级高速缓存是相互隔绝的,不过并没有专门设计协作的接口,而只是在前端总线部分简单的合并在一起,这种设计的不足之处就在于需要消耗大量的CPU周期。即当一个核心的缓存数据更改之后,必须将数据通过前端总线发送到北桥芯片,接着再由北桥芯片发往内存,而另外一个核心再通过北桥读取该数据,也就是说,PentiumD并不能像Athlon64X2一样,在CPU内部进行数据同步,而是需要通过访问内存来进行同步,这样子就比Athlon64X2多消耗了一些时间。二级缓存对比:二级缓存对于CPU的处理能力影响不小,这一点可以从同一家公司的产品线上的高低端产品当中明显的体现出来。二级缓存做为一个数据的缓冲区,其大小具有相当重大的意义,越大的缓存也就意味着所能容纳的数据量越多,这就大大地减轻了由于总线与内存的速度无法配合CPU的处理速度,而浪费了CPU的资源。事实上也证明了,较大的高速缓存意味着可以一次交换更多的可用数据,而且还可以大大降低高速缓存失误情况的出现,以及加快数据的访问速度,使整体的性能更高。就目前而言,AMD的CPU在二级高速缓存的设计上,由于制造工艺的原因,还是比较小,高端的最高也只达到2M,不少中低端产品只有512K,这对于数据的处理多多少少会带来一些不良的影响,特别是处理的数据量较大的时候。Intel则相反,在这方面比较重视,如PentiumD核心内部便集成了2M的二级高速缓存,这在处理数据的时候具有较大的优势,在高端产品中,甚至集成4M的二级高速缓存,可以说是AMD的N倍。在一些实际测试所得出来的数据也表明,二级缓存较大的Intel分数要高于二级缓存较小的AMD不少。内存架构对比:由Athlon64开始,AMD便开始采用将内存控制器集成于CPU内核当中的设计,这种设计的好处在于,可以缩短CPU与内存之间的数据交换周期,以前都是采用内存控制器集成于北桥芯片组的设计,改成集成于CPU核心当中,这样一来CPU无需通过北桥,直接可以对内存进行访问操作,在有效的提高了处理效率的同时,还减轻了北桥芯片的设计难度,使主板厂商节约了成本。不过这种设计在提高了性能的同时,也带来了一些麻烦,一个是兼容性问题,由于内存控制器集成于核心之内,不像内置于北桥芯片内部,兼容性较差,这就给用户在选购内存的时候带来一些不必要的麻烦。除了内存兼容性较差之外,由于采用核心集成内存控制器的缘故,对于内存种类的选择也有着很大的制约。就现在的内存市场上来看,很明显已经像DDR2代过渡,而到目前为止Athlon64所集成的还只是DDR内存控制器,换句话说,现有的Athlon64不支持DDR2,这不仅对性能起到了制约,对用户选择上了造成了局限性。而Intel的CPU却并不会有这样子的麻烦,只需要北桥集成了相应的内存控制器,就可以轻松的选择使用哪种内存,灵活性增强了不少。还有一个问题,如若用户采用集成显卡时,AMD的这种设计会影响到集成显卡性能的发挥。目前集成显卡主要是通过动态分配内存做为显存,当采用AMD平台时,集成在北桥芯片当中的显卡核心需要通过CPU才能够对内存操作,相比直接对内存进行操作,延迟要长许多。平台带宽对比:随着主流的双核处理器的到来,以及945、955系列主板的支持,Intel的前端总线将提升到1066Mhz,配合上最新的DDR2667内存,将I/O带宽进一步提升到8.5GB/S,内存带宽也达到了10.66GB/S,相比AMD目前的8.0GB/S(I/O带宽)、6.4GB/S(内存带宽)来说,Intel的要远远高出,在总体性能上要突出一些。功耗对比:在功耗方面,Intel依然比较AMD的要稍为高一些,不过,近期的已经有所好转了。Intel自推出了Prescott核心,由于采用0.09微米制程、集成了更多的L2缓存,晶体管更加的细薄,从而导致漏电现象的出现,也就增加了漏电功耗,更多的晶体管数量带来了功耗及热量的上升。为了改进Prescott核心处理器的功耗和发热量的问题,Intel便将以前应用于移动处理器上的EIST(EnhancedIntelSpeedstepTechnolog)移植到目前的主流Prescott核心CPU上,以保证有效的控制降低功耗及发热量。而AMD方面则加入了Cool‘n’Quiet技术,以降低CPU自身的功耗,其工作原理与Intel的SpeedStep动态调节技术相似,都是通过调节倍频等等来实现降低功耗的效果。实际上,Intel的CPU功率之所以目前会高于AMD,其主要的原因在于其内部集成的晶体管远远要比AMD的CPU多得多,再加上工作频率上也要比AMD的CPU高出不少,这才会变得功率较大。不过在即将来临的Intel新一代CPU架构Conroe,这个问题将会得到有效的解决。其实Conroe是由目前的PentiumM架构变化而来的,它延续了PentiumM的绝大多数优点,如功耗更加低,在主频较低的情况下已然能够获得较好的性能等等这些。可以看出,未来Intel将把移动平台上的Conroe移植到桌面平台上来,取得统一。流水线对比:自踏入P4时代以来,Intel的CPU内部的流水线级要比AMD的高出一些。以前的Northwood和Willamette核心的流水线为20级,相对于当时的PIII或者AthlonXP的10级左右的流水线来说,增长了几乎一倍。而目前市场上采用Proscott核心CPU流水线为31级。很多人会有疑问,为何要加长流水线呢?其实流水线的长短对于主频影响还是相当大的。流水线越长,频率提升潜力越大,若一旦分支预测失败或者缓存不中的话,所耽误的延迟时间越长,为此在Netburst架构中,Intel将8级指令获取/解码的流水线分离出来,而Proscott核心有两个这样的8级流水线,因此严格说起来,Northwood和Willamette核心有28级流水线,而Proscott有39级流水线,是现在Athlon64(K8)架构流水线的两倍。相信不少人都知道较长流水线不足之处,不过,是否有了解过较长流水线的优势呢?在NetBurst流水线内部功能中,每时钟周期能够处理三个操作数。这和K7/K8是相同的。理论上,NetBurst架构每时钟执行3指令乘以时钟速度,便是最后的性能,由此可见频率至上论有其理论基础。以此为准来计算性能的话,则K8也非NetBurst对手。不过影响性能的因素有很多,最主要的就是分支预测失败、缓存不中、指令相关性三个方面。这三个方面的问题每个CPU都会遇到,只是各种解决方法及效果存在着差异而已。而NetBurst天生的长流水线既是它的最大优势,也是它的最大劣势。如果一旦发生分支预测失败或者缓存不中的情况,Prescott核心就会有39个周期的延迟。这要比其他的架构延迟时间多得多。不过由于其工作主频较高,加上较大容量的二级高速缓存在一定程度上弥补了NetBurst架构的不足之处。不过流水线的问题在Intel的新一代CPU架构Conroe得到了较好的解决,这样子以来,大容量的高速缓存,以及较低的流水线,配合双核心设计,使得未来的IntelCPU性能更加优异。“真假双核”在双核处理器推广的过程中,我们听到了一些不和谐的音符:AMD宣扬自己的双核Opteron和Athlon-64X2才符合真正意义上的双核处理器准则,并隐晦地表示Intel双核处理器只是“双芯”,暗示其为“伪双核”,声称自己的才是“真双核”,真假双核在外界引起了争议,也为消费者的选择带来了不便。AMD认为,它的双核之所以是“真双核”,就在于它并不只是简单地将两个处理器核心集成在一个硅晶片(或称DIE)上,与单核相比,它增添了“系统请求接口”(SystemRequestInterface,SRI)和“交叉开关”(CrossbarSwitch)。它们的作用据AMD方面介绍应是对两个核心的任务进

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论