显存的前世今生(终极剖析高手阶进必知)_第1页
显存的前世今生(终极剖析高手阶进必知)_第2页
显存的前世今生(终极剖析高手阶进必知)_第3页
显存的前世今生(终极剖析高手阶进必知)_第4页
显存的前世今生(终极剖析高手阶进必知)_第5页
免费预览已结束,剩余32页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

CPUDDR2DDR3过渡,而GPUGDDR2/3GDDR4、GDDR1/2/3/4/5DDR1/2/3假设您是一位求知欲很强的电脑爱好者,那么本文格外适合您,笔者特意搜集了大量官方技术文档,为大家献上内存和显存鲜为人知的奇特„„CPU〔中心处理器〕和GPU〔图形处理器〕的进展速度之快让人目不暇接,产品的运算力量成CPU/GPU都是来自于CPU/GPUCPUIntelCPU50%;ATINVIDIA512Bit是何缘由导致业界三大巨头如此大费周折呢?这是由于内存技术的进展速度,其实并不如大家想象中的那么快,受到很多技术难题和传统因素的制约,本文就对内存和显存的进展历程及相关技术进展具体分析。内存的存取原理及难以逾越的频障:在半导体科技极为兴旺的台湾省,内存和显存被统称为记忆体〔Memory〕,全名是动态随机存取记忆体〔DynamicRandomAccessMemory,DRAM〕01,这就是一个二进制位元〔bit〕,内存的最小单位。DRAMDRAM的构造可谓是简洁高效,每一个bit只需要一个晶体管加一个电容。但是电容不行避开的存在漏上限,即便有先进工艺的支持也收效甚微。“上古”时代的FP/EDO25MHz/50MHzSDR一路飙升至133MHz,最终遇到了难以逾越的障碍。此后所诞生的DDR1/2/3系列,它们存储单元官方频率〔JEDEC制定始终在100MHz-200MHz〔超频频率也顶多在250MHz300MHz。事实上高频内存的出错率很高、稳定性也得不到保证,除了超频跑简洁测试外并无实际应用价值。既然存储单元的频率〔简称内核频率,也就是电容的刷频率〕不能无限提升,那么就只有在I/O〔输、GDDR1/2/3/4/5DDR1/2/3效频率,这些DDR1/2/3内存相当于老牌SDR内存运行在400MHz、800MHz、1600MHz时的带宽,因此频率看200MHz内存有三种不同的频率指标,它们分别是核心频率、时钟频率和有效数据传输频率。核心频率即为内存Cell(MemoryCellArray,即内部电容)的刷频率,它是内存的真实运行频率;I/OBuffer〔输入/输出缓冲〕的传输频率;而有效数据传输频率就是指数据传送的频率〔即等效频率〕。SDRDDR1/2/3常见DDR内存频率比照表通过上表就能格外直观的看出,近年来内存的频率虽然在成倍增长,可实际上真正存储单元的频率始终133MHz-200MHz而每一代DDR的推出,都能够以较低的存储单元频率,实现更大的带宽,并且为将来频率和带宽的提升留下了肯定的空间。SDRDDR1/2/3虽然存储单元的频率始终都没变,但内存颗粒的I/O频率却始终在增长,再加上DDR是双倍数据传输,8IO2/4/8bit数据预取技术〔Prefetch〕,I/ODDR1/2/3数据预取技术原理:预取,顾名思义就是预先/提前存取数据,也就是说在I/O掌握器发出恳求之前,存储单元已经事先预备Raid/多通道技术,可以说是以电容矩阵为单位的。内存数据预取技术示意图:并行转串行这种存储阵列内部的实际位宽较大,但是数据输出位宽却比较小的设计,就是所谓的数据预取技术,它可以让内存的数据传输频率倍增。试想假设我们把一条细水管安装在粗水管之上,那么水流的喷射速度就会翻几倍。明白了数据预取技术的原理之后,再来看看DDR1/2/3开朗了:SDRAM〔SynchronousDRAM〕:同步动态随机存储器SDR存储单元频率、I/OPC133133MHz。SDR在一个时钟周期内只能读/写一次,只在时钟上升期读/写数据,当同时需要读取和写入时,就得等待其中一个动作完成之后才能连续进展下一个动作。DDR〔DoubleDateRateSDRAM〕:双倍速率同步动态随机存储器双倍是指在一个时钟周期内传输两次数据术实现),在存储阵列频率不变的状况下,数据传输率到达了SDR的两倍,此时就需要I/O从存储阵列中预2bitI/ODQ列的频率。???DDR2〔DDR2SDRAM〕:其次代双倍速率同步动态随机存储器DDR2在DDR12bit扩大至4bit,此时上下行同时传输数据〔双倍〕已经满足4bitI/O133-200MHzDDR2266-400MHz,而〔等效〕533-800MHz。DDR3〔DDR3SDRAM〕:第三代双倍速率同步动态随机存储器DDR38bit,同理I/O133-200MHzDDR3533-800MHz,而〔等效〕数据传输率高达1066-1600MHz。I/ODDR3I/O1GHzI/ODDR4〔GDDR4,两者完全不是同一概念,后文会有具体解释〕的话,将会受到很多未知因素的制约,必需等待更先进的工艺或者解决方案的消灭才DDR及内存条了,这都是些看得见摸得着的东西,但有些概念还是不简洁理解,这里一一进展说明:内存位宽——SDR/DDR1/2/3单条内存都是64bit内存模组的设计取决于内存掌握器〔集成在北桥或者CPU内部〕,理论上位宽可以无限提升,但受制PCB内存颗粒及芯片设计也必需作相应的调整。可谓是牵一发而动全身,所以多年来业界都是墨守成规,维持64bit的设计不变。相比之下,显卡作为一个整体就没有那么多的顾忌,只需重设计GPU内部的显存掌握器,然后PCB依据位宽要求布线,焊更多的显存颗粒上去就行了,虽然本钱也很高但实现512bit并没有太大难度。多通道内存——双通道/三通道既然实现高位宽内存条太难,那么就退而求其次,让两条内存并行传输数据,同样可以让位宽翻倍。CPU64bit同时传输数据128bit。IntelNehalemCPU,192bit。CPU、主板、内存方LynnfieldCPU又回归了双通道设计。事实上效劳器芯片组已经能够支持四通道内存,对效劳器来说本钱方面不是问题,只是对稳定性和容错性要求很高。内存颗粒位宽:4/8/16/32bit理论上,完全可以制造出一颗位宽为64bit的芯片来满足一条内存使用,但这种设计对技术要求很高,良品率很低导致本钱无法掌握,应用范围很窄。16bit,4/8bit。这样为64bit416bit88bit164bit。而显卡对位宽要求很高,容量反而退居其次,所以显存颗粒的位宽普遍比内存颗粒大〔这就是显存和内存主要区分之一〕,GDDR3/4/532bit,4128bit8256bitGDDR216bit8128bit内存芯片的规律Bank在芯片的内部,内存的数据是以bit为单位写入一张大的矩阵中,每个单元称为CELL阵列,只要指定一个行一个列,就可以准确地定位到某个CELL,这就是内存芯片寻址的根本原理。这个阵列我们就称为内BANKBANK〔LogicalBANK〕。BankBankBankBank是一片平面的矩阵纸,而内存颗粒是由多片这样的纸叠起来的。BankBankBankBank片选。补充内容:内存内存Bank的探讨目前很多人对内存Bank(电脑系统与内存之间数据总线的根本工作单位)都有一种误会,认为单面内存就是单Bank,双面内存就是双Bank的。其实这种观念是Bank(Bank)数和内存颗粒的面无关,它们之间有什么联系呢?要讲清这个问题,就要提到内存的规律Bank,下面就给大家介绍一下物理Bank和规律Bank的概念。在介绍之前,我们先简洁看一下现在市场上的DRAM内存产品.现在市场上的内存主要有:SDRAM、DDRSDRAM及Rambus。其中Rambus内存的掌握器和前两者不BankSDRAM和DDRSDRAMBank问题,由于SDRAM就内核、Bank构造而言,和DDRSDRAM没有什么规律Bank及其构造内存芯片存储数据的根本单位是bit(位)寻址的根本单位则是Byte(字节),一个Byte就等于8bit。大家知道,在平面坐标系中,要确定一个点就要先找到它的横坐标和纵坐标。而在内存中数据的定位也很相像,内存中的数据构造就是一个大的数据阵列,为了便于理解,我们把它假想成一个大的表格,前面我们提到1bit的数据,而是由多个bit组成一个组放在单元格内,这里一个单元格我们可以称作一个组,这个单元格的位数也就是内存规律Bank的位宽。在进展数据读取时,先进展行的选定,再进展列的选定,最终再从这个单元格中读取出所需要的数据。而这由许很多多的单元格组成的大表我们就可以理解成规律Bank,固然由于制造工艺及数据寻址的缘由,不行能让这个表格无限大,一般内存芯片中都是将内存容量分成几个阵列来制造,即多规律BankBank16Mbit之类的芯BankBank一般为4个(不包括Rambus),这点大家可通过内存条的编码进展识别。内存芯片设计时在一个时钟周期内只允许对一个规律内只允许对一个规律Bank进展操作(实际上内存芯片的位宽就是规律Bank的位宽),而不能Bank的理解,我们来看看一个单Bank4个内存阵列。从图中可以很清楚地看到这个芯片是一个Bank数为44096和4bitBank4096×2048×4bit=32Mb。再乘以Bank的数量,则芯片的容量就可以算出来了,这里很明显是4个Bank,那么芯片的容量就是128MbBankBank由内存阵列、传感放大器、一个行解码器、一个列解码器组成。接下来我们简洁看看物理接下来我们简洁看看物理BankBank的含义就是指内存和主板北桥芯片之间传递586CPU64bitCPU一次只能对一个物理Bank64bitBank(PhysicalBank),在前面我们已经讲过了规律Bank,所以在这里我给大家讲一下如何自己算出物理Bank,大家就会格外好理解了。由于CPU一次只能翻开一个物理Bank,在单芯片上也只能翻开一个规律Bank,这样我们就知道规律Bank的位宽也就是单芯片的位宽了,我们把芯片的数据宽度和芯片的数量相乘再除以64就得到了内存条的物理BankBank数=数据宽度×芯片数量/64现在大家初步明白了内存的物理Bank和内存的面数无关了吧?后面我还会举SDRAMDDRBankBank之后。RambusBankRambusBankPC800Rambus为例。Rambus不再承受SDRAMDDR内存的并联技术,而是承受了更先进的串联技术。就现阶段而言,PC800Rambus400MHz16位总线,在一个时钟周期内可以在上升沿和下降沿同时传输数据,实际操作频率为400MHz×2=800MHz16bit×2×400MHz/8=1.6GB/s850主板芯片的双通道模式,可以到达3.2GB/s的数据带宽。这也是大家熟知的高带宽,而它最重要的优势在于其规律Bank上,就现阶段的主流Rambus来说,其规律Bank32个,拥有更多的Bank数则意味着具有较少的Bank冲突,寻址流更加短暂随便。另外还可以提高寻址命中率和降低埋伏周期。固然,更多的Bank也使Rambus的制作模具制造更简单,也就RAMBUS4iDRDRAM──在每个颗粒芯片上只有4Bank。BANK在芯片的内部,内存的数据是以位〔bit〕为单位写入一张大的矩阵中,每个单元我们称为CELL,只要指定一个行〔Row〕,再指定一个列〔Column〕,在芯片的内部,内存的数据是以位〔bit〕为单位写入一张大的矩阵中,每个单元我们称为CELL,只要指定一个行〔Row〕,再指定一个列〔Column〕,CELL,这就是内存BANK,BANK〔LogicalBANK〕。由于工艺上的缘由,这个阵列不行能做得太大,所以一般内存芯片中都是将内存容量分成几个阵列来制造,也就是说存在BANKBANK32MB1GB416Mbit32Mbit2BANK16MBK4S161622D〔512Kx16Bitx2BAN〕K4S160822DT〔1Mx8Bitx2BANK〕。芯片组本身设计时在一个时钟周期内只允许对一个规律BANK〔实际上芯片的位宽就是逻辑BANK的位宽〕,而不是芯片组对内存芯片内全部规律BANK同时操作。规律BANK的地址线是通用的,只〔BANK0BANK3〕。但是这个芯片的位宽打算了一次能从它那里读出多少数据,并不是内存芯片里全部单元的数据一次全部能够读出BANK8M〔CELL〕,一些厂商〔比方现代/三星〕BANKBANK64Mbit〔8M×8bit〕,4BANK256Mbit,256Mbit〔32MB〕。bit32Mbit32Mb〔b=bit=位字节=8BANK,每个bankBANK〔CELL64MB128MB64Mbit的芯片就有如下三种构造形式:①16Meg①16Megx4(4Megx4x4banks)[16M╳4]②8Meg②8Megx8(2Megx8x4banks)[8M╳8]③4Meg③4Megx16(1Megx16x4banks)[4M╳16]BANK〔芯片的位宽。芯片规律BANK位宽目前的工艺水平只能最多做到16BANK位宽只可4/8/1616MbitBANK,64Mbit4BANK二.内存条的物理二.内存条的物理BANK通常主板上的每个内存插槽分为两段通常主板上的每个内存插槽分为两段VIABIOSBANK0/1DRAMBANKBANK时提到的BANK可不一样。简洁地说这个BANK就是内存和主板上的北桥芯片之间用来交换数据的通道,SDRAMCPU〔CPUDIMM〕64bit,CPU64bit64bitBANK,很多厂BANK〕,目前绝大多数的芯片组都只能支持一根内存包含两个DIMM。实际上物理BANK与面数是无关的,PCB电路可以设计成双面和单面,也可把全部芯片〔16颗〕放在一面上〔至少从理论上是完全可能。有些内存条单面就是一个物理BANK,但有些双面才是一个物理BANK,能一概而论。256MB16BANK。要准确知道内存条实际物理BANK数量,我们只要将单个芯片的规律BANK数量和位宽以及内存条上芯片个数搞清楚。各个芯片位宽之和为64就是单物理BANK,假设是128就是双物理BANK。CPU一次只能对一个物BANK〔BANK64bit〕,线供给或接收64bit的数据,而这些数据都是分别存储在内存条的芯片中。那么内存条中有多个内存芯片,这64256Mbit为例,16所以现在的芯片组设计时都是要求内存条上每个芯片均担当供给数据的任务,也就是说内存条上的每个芯片都要要对这64位数据做奉献,而那颗内存芯片的位宽是8位,因此用这个芯片组成内存条只需要864位数据16864MB256MB由于位宽不够是不能正常工作。要能工作就必需承受16位位宽的64MB〔512Mbit〕芯片。58658664bit64bit,SDRAM64bit64bit128646464就不能读取,通常很多厂家就分别将这两局部放在内存的两面上。这就造成了很多人的错觉:双面是两个BANKBANK256MB16于芯片大小的限制,不行能将16颗芯片都放在一面上,所以只能设计成双面。对于64Mbit芯片(4M*16)16bit,8=16*8=128bit〔BANK〕,4=16*4=64bit〔即一个BANK〕BANK64〔即位宽消灭了充裕〕,由于芯片64BANK。今后随着一代数据总线位宽的提高,或许CPU64128BANK,而是指内存芯片内部规律BANK的穿插,假设芯片有4个BANK,那么就可以进展4路穿插,假设只有两个BANK就只能是二路穿插。很多资料介绍的以内存条的单面或双面来打算穿插是错误的,实际上就是混BANKBANK..BankBank说成是内存颗粒阵列的话,那全一样,所以我将分开来简洁介绍一下。SDRAM〔1阵列就如同表格一样,将数据“填”进去。因此规律Bank我们可以看成是一张规律二维表,在此表中内存的数据是以位〔bit〕CEL,只要指定一个行〔Row,再指定一个列ColumCELL,里面每个单元都可以存储数据,而且每个单元的存储空间一样——BankBank的位宽〔Bank的位宽4bit、8bit16bit等几种。假设你认为不好理解的话,那么你可以用硬盘操作中的簇与扇区的关系来理解内存中的存储形式——扇区是硬而一个簇则包含多个扇区Bank中的存储单元数据的交换都是以一个簇为单位进展。由于工艺上的缘由,这个阵列不行能做得太大,所以一般内存芯片中都是将内存容量分成几个阵列来制造,也就是说内存芯片中存在多个规律Bank,随着芯片容量的不断增加,规律Bank数量也在不断增加。Bank芯片内全部规律Bank同时操作。规律Bank的地址线是通用的,只要再有一个规律Bank编号加以区分就可以了〔Bank0Bank全部单元的数据能够一次全部读出。DDRBank的作用、原理与在SDRAM中是一样的,区分主要是在规律Bank容量、规格之上。从上面大家已经知道,SDRAMBankDDR中并不是这样。DDR的规律存储单元的容量是芯片位宽的一倍:即“芯片位宽×2=存储单元容量”,同时DDR中的真正行、列地址数量也与同规格SDRAM不一样了。这主要是由于DDR的工作原理所打算的。DDR这种内部存储单元容量的设计,就是常说的两位预取〔2-bitPrefetch〕,也称为2-nPrefetch〔n代表芯片位宽〕。宽〕。注:目前品牌内存大都在包装和说明书中标明规律Bank注:目前品牌内存大都在包装和说明书中标明规律Bank,对于兼容条,你可以依据内存颗粒上的编号标志进展计算。至于物理Bank,大家可以依据以上介绍的原理计算出来,在这里我就不多说了。另外我们常说Bank4Bank2路穿插。很多资料介绍的以内存条的单面或双面来打算穿插是错误的,实际上就是混淆了物理BankBank的区分。Bank传统内存系统为了保证传统内存系统为了保证CPU的正常工作,必需一次传输完CPU在一个传输周期内所需要的数据。而CPU在一个传输周期能接收的数据容量就是CPU数据总线的位宽,单位是bit〔位〕CPU之间的数据交换通过主板上的北桥芯片进展,内存总线的数据位宽等同于CPUBan〔PhysicalBankk的位宽。以目前主流的DDR系统为例,CPU与内存之间的接口位宽是64bit,也就意味着CPU在64bit64bit的数据集合就是一个内存条Bank。目前绝大多数的芯片组都只能支持一条内存包含两个物理Bank。不过以Bank是由面数打算的:即单面内存条则包含一个物理Bank,双面内存则包含两个。其实这个看法是错误的!Bank是由所承受的内存颗粒的位宽打算的,各个芯片位宽之和为64bit就是单物理Bank128bit就是双物理Bank。读到这里,大家也应当知道,我量来增加BankBankBank已经不能满足容量的需要。所以,目前一代芯片组可以支持Bank4Bank。对于像Inteli845D这种支持4个BankBank选购双Bank的内存,这意味着在Inteli845D芯片组上我们最多只能使用两条这样的内存来选购内存,假设主板只供给了两个内存插槽,那就不必为内存是单Bank还是双Bank而4个内存插槽〔同一种规格〕,那么应当尽量购置单Bank或大容量双Bank的内存,以免给日后升级留下不必要的麻烦。注:注:SDRAMDDRBankRDRAMBank被通道〔Channel〕取代。内存条的物理Bank内存掌握器的位宽必需与内存条的位宽相等,这样才能在一个时钟周期内传输全部数据,这个位宽就Bank〔64bit〕,Bank,Bank。Bank理Bank也是允许的,但内存掌握器所能允许的最大Bank数存在上限,常见的是双物理Bank设计,只有特别Bank事实上显卡上也存在双物理Bank设计,目的就是为了实现超大显存容量,比方1GB的9800GT,正反两1616M×32bitGDDR3512bit,256bit,这样就是双Bank。GPUSDRAMTNT2PC166SDR内存满足不了显卡的需求,显存应运而生SDRDDRDDR的DDRGPU,显存颗粒与内存颗粒开头分道扬镳,这其中包括了几方面的因素:GPUCPUGPUCPUGPU远比CPU频繁,而且大多都是突发性的数据流,因此GPU比CPU更加渴望得到更高的显存带宽支持。位宽×频率=带宽,因此提高带宽的方法就是增加位宽和提高频率,但GPU对于位宽和频率的需求还有其它的因素。显卡需要高位宽的显存。显卡PCB空间是有限的,在有限的空间内如何合理的安排显存颗粒,无论高中低端显卡都面临这个问题。从布线、本钱、性能等多种角度来看,显存都需要到达更高的位宽。16bit32bit,将来甚至还会有更高的规格消灭。而内存则没64bit,所以单颗内存颗粒没必要设计成高位宽,只要提高容量就行了,所以〔内存芯片颗粒的〕4/8bit。GPU一般都经过特地的设计和优化,而不像内存那样有太多顾忌。GPUCPUPCB进展优化,因此显存一般都能到达更高的频率。PCBCPU限制很难冲击高频率由此算来,显存与内存“分家”既是意料之外,又是情理之中的事情了。为了更好地满足显卡GPU的RateDRAM”,GDDR。GDDR——显存和内存正式分家GDDR作为第一代专用的显存芯片,其实在技术方面与DDR没有任何区分,同样承受了2bit预取技术,GDDRDDR高多少。不过后期改进工艺的GDDRPCBGDDR900MHz,DDR600MHz,显存和内存的差距从今渐渐拉开。TSOPGDDR16bit:128M×16Bit4.0nsTSOPIIGDDR,16MB,500MHz9550、FX5700128Bit8128BitDDR“GDDR”与“DDR”是可以“划等号”的。其实两者还是有些差异:GDDR4K32msDDR8K64msGDDR为了追求频率在延迟方面放的更宽一些,到底GPU对延迟不太敏感;GDDR128Mbit×16Bit(16MB)的规格,而DDR16Bit8Bit4Bit,32MB64MB。为了实现更大的位宽,并进一步提升GDDR的性能,后期很多厂商改用了电气性能更好的MBGA封装,MBGAMBGAGDDR32bit:128Mbit×32Bit2.2nsMBGAGDDR,16MB,900MHz8128MB256BitGDDR132Bit,GDDRDDR32BitGDDR2/3/4/5MBGATSOPGDDR32Bit16BitGDDR2第一版:短命的早产儿高压高发热GDDR2源于DDR2技术,也就是承受了4Bit预取,相比DDR1代可以将频率翻倍。虽然技术原理一样,但GDDR2DDR2DDR2915P2022GDDR2FX5800Ultra2022NVIDIANV30128Bit为了提高带宽必需使用高频显存,700MHzGDDR2GDDR2DDR/GDDR2.5V1GHz,但功耗发热格外的大。MBGA144BallGDDR2,16MB,1000MHzGDDR22.2ns2.0nsGDDR2第一版只在FX5800/Ultra和FX5600Ultra这三款显卡上消灭过〔也包括对应的专业卡及个别非公版显卡〕,ATI9800ProGDDR2。高电压、高发热、高功耗、高本钱给人的印象格外差。FX5900GDDR256Bit,GDDR2FX5800UltraGDDR2NVIDIAGeForceFX256Bit850-900MHzGDDR2),FX5950Ultra9800XTGDDR2GDDR2PCBGDDR更加简洁,这个特性被后来的gDDR2和GDDR3继承。gDDR2其次版:统一低端显卡永久的配角由于第一代GDDR2的失败,高端显卡的显存是直接从GDDR跳至GDDR3的,但GDDR2并未消亡,而是开头DRAMGDDR2〔DDR2〕,由此gDDR2,时至今日照旧活泼在低端显卡之上。gDDR22.5V1.8V,功耗发热大降;制造工艺有所进步,功耗发热进一步下降,本钱降低,同时良率和容量有所提升;32Bit16Bit,只适合低端显卡使用;144BallMBGA84BallFBGA,外观上来看从正方形变成长方形或者长条形; gDDR2gDDR21.8V1000MHz1200MHz,赶超了GDDR2的记录。承受gDDR2显存的经典显卡有:7300GT、7600GS、X1600Pro、8500GT„„一大堆低端显卡。留意三星官方网站对于显存的分类信任很多朋友也留意到了,本页gDDR2的第一个字母为小写,几大DRAM厂商在其官方网站和PDF中就都是这么写的,以示区分。我们可以这么认为:G32bit;而小写g表示为显卡优化,16bit事实上,GDDR3gDDR3GDDRDDR,GDDR2DDR2,而GDDR3DDR3于是很多人认为GDDR3就是显存版的DDR3,这可是个天大的误区。GDDR3:GDDR3DDR2无论GDDR还是GDDR2,由于在技术方面与DDR/DDR2并无太大差异,因此最终在频率方面GDDR并不比DDRGDDR2NVIDIA和ATI对JEDECGPUNVIDIA和ATIJEDEC双方全都认为,显存与内存在数据存储的应用方面完全不同,在内存核心频率(电容刷频率)无法提升的状况下,单纯提高I/O频率来获得高带宽很不现实。因此,必需要有一种针对高速点对点环境而重I/OGDDR3,这是GPUGDDR3GDDR2/DDR24BitGDDR3GDDR2并提升传输效率来缓解高延迟的负面影响。点对点DQS,读写无需等待〔DQS〕GDDR3DQS,而且是点对点设计。这样做的好处在于,在读取之后假设马上进展写入时,不必再等DQS的方向转变,由此实现读写操作的快速切换。写数据时,GDDR3GDDR2Bank,并不存在“全双工”一说,但GDDR3的这项改进让挨次读写成为可能。GPU本身缓存很小,与显存之间的数据交换极其频繁,读写操作GDDR3DQSCPUGPU那么频繁,而且CPU拥有大容量的二三级缓存,所以GDDR3这种设计并不能极大的提升内存带宽,也没有引DDR3改进I/O接口,简化数据处理,掌握功耗GDDR2〔PushPull〕”接收器,而将其改为虚拟开极规律方式〔PseudoOpenDrainLogic〕,并且通过将全部的三相数据信号转移到本位电路上,来简化数据处理,将DCLOW从而很好的掌握了功耗和发热。GDDR3的频率能到达现在这么高,其实并没有什么诀窍,凭借的就是不断改进的工艺制程,来暴力拉升频GDDR320226600GT1GHz,并不比GDDR2,5GDDR31GHz2GHz2.5GHz,生命力得到了连续。明白了GDDR3的原理技术后,再来看看实物。GDDR3和GDDR1类似,也有两种封装形式:144BallMBGAGDDRGDDR2GDDR3144BallMBGAGDDRGDDR2GDDR3GPUGDDRPCB2.0ns256M×32BitGDDR3256M×32Bit8256MB256Bit4128MB128Bit5700UltraGDDR3GDDR2。最高频率止步于1400MHz7800GTX/GT6800GS6600GTX850/X800/X700144BallPCBGDDR3136BallFBGA136BallFBGA2022GDDR3136BallFBGA,并统一使用无铅封装工艺。PCBGDDR30.8nsGDDR3512M×32Bit136BallGDDR3规格不再局限8M×32Bit16M×32Bit32M×32Bit2.0V1.8V,但一些高频颗粒可适当加压;1.4ns1.2ns1.1ns1.0ns0.8ns0.7nsGPU当GDDR3的频率首次到达2022MHz时,很多人都认为离极限不远了,于是未雨绸缪的抓紧制定GDDR4DRAMGDDR30.8ns0.7ns32M×32Bit当前速度最快0.77nsGDDR3显存颗粒,理论频率可达2600MHz2.2nsGDDR900MHzI/O450MHz5GDDR3I/ODDR38bitGDDR4GDDR4是在GDDR3的根底上进展而来的,它继承了GDDR3的两大技术特性,但内核改用DDR3的8bit预取技术,并参加了一些的技术来提升频率。GDDR4DDR38bit,以较低的核心频率到达更高带宽,但延迟增加;BusInversion,下文做具体介绍〕,提高数据精度,降低功耗;GDDR3GDDR3〔BurstLimitATIon〕,从连续地址读取少量数据时的性能大幅提升;1.8V1.5V;75%,2400MHzGDDR42022MHzGDDR3136BallFBGA32Bit,GDDR3;GDDR4由于承受了8bit预取技术,因此在一样频率下GDDR4的核心频率〔即电容刷频率〕只有GDDR3的一半,理论上来讲GDDR4GDDR38bit半,GDDR4GDDR3I/OGDDR4I/O率。由于制造工艺和技术水平的限制,虽然三星官方宣称早已生产出3GHz以上的GDDR4,但实际出货的GDDR3GDDR4GDDR3然功耗发热低,但延迟大性能稍弱,再加上本钱高产量小,GDDR4导致GDDR4失败的非技术方面缘由GDDR3NVIDIA和ATI参与JEDECGDDR4DDR24bitI/OATIDDR38bitATI获胜〔ATIJEDEC〕,而NVIDIAGDDR4GDDR4ATINVIDIA支持的话,GDDR46DRAM最终只有三星一家生产了少量的GDDR4显存,其他家都在观望。固然其他DRAM厂商都没闲着,它们把GDDR3GDDR3GDDR4AGDDR4只有ATI生产过搭载GDDR4X1950XTXHD2600XTHD3870包括对应的专业卡)——与当年NVIDIA使用GDDR2的显卡数量相等。NVIDIA在患病滑铁卢后坚决放弃了GDDR2ATI对于GDDR4GDDR4的失败并不是技术缘由,和当年的GDDR2相比它要成熟很多,没推起来的缘由主要是对手太强:ATI的对手NVIDIA很强大,另外GDDR4GDDR3即便使用了8bitGDDR4GDDR3拉开频率差距,I/OGDDR5GDDR5:恐惧的频率是如何达成的GDDR4GDDR5DDR38bit,核心频率明显不是瓶颈I/OGDDR5I/ODQ。GDDR5DQGDDR5GDDR3/4136Ball170Ball,GPU器也需要重设计。GDDR5显存拥有多达16个物理Bank,这些Bank被分为四组,双DQ总线穿插掌握四组Bank,到达了实时读写操作4GHz以往GDDR1/2/3/4和DDR1/2/3的数据总线都是DDR技术(通过差分时钟在上升沿和下降沿各传输一次数据),X2,也就是通常我们所说的等效频率GDDR5条数据总线,相当于Rambus的QDR技术,所以官方标称频率X4才是数据传输率。比方HD4870官方显存频900MHz3600MHz。失败乃成功之母,冒险使用GDDR5RV770GTX200GDDR4ATIGDDR4GDDR5I/O技术方面的问题不难解决,最难的是时间和进度。ATI在R600上面冒险使用512Bit显存掌握器来提RV670256Bit,GDDR4GDDR3GDDR5GPURV770256Bit,急需高频显存的支持。NVIDIAGDDR3,GTX200核心使用了512BitR600NVIDIA从256Bit384Bit512Bit一步一个脚印走出来的穿插总线明显更加成熟。256Bit512Bit,ATIGDDR5GDDR5ATI已经在紧锣密鼓的测试性能,并催促DRAM厂投产。可以说GDDR5和GDDR2/4一样也是个早产儿,但失败乃成功之母,有了完善的技术规格和制造工艺的支持,GDDR5GDDR5HD4870256Bit448BitGTX260NVIDIA通过降128BitHD4770256Bit9600GT9800GT。之前我们分析过,TSOPGDDR1gDDR2DDR1/2,高位宽(16bitDDR3DDR2,于DDR3DDR2gDDR2。gDDR3:把内存颗粒改装成显存用gDDR2GDDR3gDDR2钉钉的事。AMDDDR3DRAMGraphicsDDR3SDRAMgDDR3,DDR3SDRAMDDR24bit32bit,定位中高端显卡。可以看出,GDDR5GDDR3,gDDR3gDDR2,中端则会消灭三代共存的局面。虽然gDDR3单颗位宽只有GDDR3的一半,但存储密度却是GDDR3的两倍,而且在一样频率2022MHz),gDDR3GDDR3,因此功耗发热要低很多。对于位宽不高的中低端显卡来说,gDDR3上图就是现代官方网站列出的gDDR3和GDDR3两种显存的规格参数表,留意它们的全称,是否有“G“,真的是差之毫厘谬以千里。gDDR316bitFBGA96BallDDR34/8bit,封装是78/82Ball。也有少数DDR316bitFBGA96BallSDR+DDR1/2/3GDDR1/2/3/4/5显存引领DRAM进展,将来内存将以显存为蓝本开发纵观近年来内存与显存的进展,就会觉察显存的进展速度已经远远超越了内存,显存带宽几乎到达了内存带宽的10倍之多,而且这个差距还在不断的加大。目前三通道DDR3已经足够桌面CPU用好一阵子了,而GPU/附属GDDR2提前DDR2GDDR4提前DDR3一年多,虽然都以失败而告终,GDDR5在内存领域,如今DDR3才刚刚站稳脚跟,至少将统治PC两至三年,但DDR4的标准已经在乐观制定当GDDR5DDR38bitI/O中缘由信任认真阅读了本文的朋友们应当知道吧。【3C16840nmAMDDirectX11RadeonHD5000GDDR5GDDR5RadeonHD4770GDDR5显存就成为了AMD端显卡的标配,如今,AMDRadeonHD5700/4700系列也开头承受GDDR5NVIDIAGeForceGT240GDDR5GDDR5GDDR3AIC/AIBGDDR5GDDR5EAH5870/2DIS/1GD5、华硕EAH5850/2DIS/1GD5、华硕EAH5770/2DIS/1GD5、华硕EAH5750/2DIS/1GD5、华硕EAH4750F1/DI/512MD5ENGT240/DI/512MD5GDDR5GDDR3上面这张图清楚的反响了带宽与显存频率位宽之间的关系!假设有一批货物〔数据〕要从仓库〔显存〕运到工厂〔GPU〕处理,怎么样才能更快的完成这件工作?我们有两种方式:第一,在只有驴车运输的状况下,可行的方法拓宽工厂与仓库之间的车道数,这样一次可以样可以更快的完成任务。64Bit已经进展512Bit500MHz进展到GDDR32600MHz〔GDDR5以前〕,但是增加显存位宽这条路径已经消灭了瓶颈,512BitGPU的极限,且不管失败的RadeonHD2900XT,即使是看起来风光无限的GT200GT200系列无论功耗还是发热量都NVIDIA已经打算在GT300384BitAMDRadeonHD3870256Bit就只有将驴车换成法拉利跑车了!将驴车换成法拉利跑车需要几步?答:三步!GDDR400MHz,900MHz,GDDR2GDDR2和电压问题,并不成功。其次步是GDDR3显存颗粒,这也是近几年显卡承受最普遍的显存颗粒,在这期间GDDR22.5V1.8VGDDR31000MHz0.77ns2600MHz,此时可以视为将驴车换成了宝马,速度提升了格外明显,但是这看要和谁比!由于和GDDR5相比,GDDR3能够到达GDDR5GDDR5GDDR4是要说的是,GDDR4确实也是格外优秀的产品,不过其致命点是虽然频率够高,最高可达3000MHzGDDR3GDDR42400MHz2022MHzGDDR3耗等方面仍有优势,NVIDIAGDDR3没有大面积普及。GDDR5AMDNVIDIA3600MHz4800MHz6000MHzGDDR5在这个话题之前我们要先明白显存的的三个频率:核心频率、I/O频率、等效频率。核心频率是内部电容的刷频率,它是内存的真实运行频率;时钟频率即I/O〔输入/输出缓冲〕的传输频率;而有效数据传输频率就是指数据传送的频率〔即等效频率〕。其中显存的核心频率现在很少被人提起,I/O〔也就是官方标称的频率〕及等效频率,RadeonHD58704800MHz1200MHz,其中4800MHz1200MHzI/O150MHz150MHz先/提前存取数据,GDDR/GDDR2/GDDR3/GDDR4/GDDR5分别承受了2Bit/4Bit/4Bit/8bit/8it数据预取技术,也就是说I/O掌握器在发出恳求之前,它们会分别预备好2Bit/4Bit/4Bit/8bit/8it那么我们可以得出一个结论,那就是假设核心频率同为200MHz的话,那么GDDR/GDDR2/GDDR3/GDDR4/GDDR5的I/O频率分别是400Mz/800MHz/800MHz/1600MHz/1600MHz800MHz/1600MHz/1600MHz/3200MHz/3200MHzI/OGDDR/GDDR2/GDDR3/GDDR4GDDR53200MHz,6400MHz。这又是为什么呢?显存规格显存类型核心频率I/O频率等效频率由于GDDR/GDDR2/GDDR3/GDDR4的数据总线都是DDR沿各传输一次数据),I/OX2就是等效频率,而GDDR5两条并行的DQRambusQDRI/O显存规格显存类型核心频率I/O频率等效频率GDDRGDDR2GDDR3GDDR4GDDR5200M200MH200MH200MH200MHHzzzzz400M800MH800MH1600M1600MHzzzHzHz800M1600M1600M3200M6400MHzHzHzHzHz显存规格显存类型显存规格显存类型GDDRGDDR GDDR2 GDDR4 GDDR5核心频率I/O频率等效频率200M200M3200M200MH200MHHzHzHzzz200M400MH400M800MH400MHHzzHzzz400M800MH800M1600M3200MHzzHzHzHz使用内存计算方法的结论????GDDR54800MHz150MHzGDDR51.5VGDDR317%的电量,更低的电压意味着更低的功耗和发热量,对于显卡工作的稳定至关重要。有了GDDR5=显存位宽×显存工作频率/8128Bit的华硕EAH5770/2DIS/1GD5,通过4800MHz4800MHz×128bit/8=76.8GB/s256BitGeForceGTS2502200MHz×256Bit/8=70.4GB/sGeForceGT240GDDR3GDDR510%以上,足见GDDR5大的发挥空间!GDDR5等效频率=物理频率×8〔GDDR58bit预读取〕×4〔双总线上下延传输〕由于,标称频率=物理频率×8〔GDDR58bit预读取〕GDDR5等效频率也等于标称频率×4。GDDR5显存GDDR32600MHz,相比之下,目前GDDR55000MHz。不过这照旧不是终点,GDDR5最高数据6000MHzGDDR显存一样,GDDR5也是建立在多倍数据预GDDR12bit数据预取技术,GDDR2、GDDR3GDDR44bit数据预取技术,GDDR58bit数据取技术的产物,到达了令人惊异的高性能。优秀的双总线设计—高速传输无忧GDDR34bit预取数据而言,GDDR5的优势在于将预取数据增加到了8bit,因此GDDR5就能够在同样的物理时钟频率下到达更高的数据传输速度。不仅如此,GDDR5显存承受了双数据总线,能够同时在数据总线的上升和下降阶段传输数据。同时,每条总线都独立配备了完整的DBI,可以独立传输、校验数据,是完整的双总线规格。以往单GDDR2、GDDR31/2〔比方标称频率为900MHzGDDR31800MHz〕,GDDR5显存由于双总线技术的存在,每条总线都可以在上升和下降阶段传输数据,因此标称频率是等效工作频率的1/4。4000MHzGDDR51000MHz。由于承受了8bit的预取技术125MHz。GDDR显存几种频率的差异物理运行频率:是指GDDR实际测得。在通常的使用中,物理运行频率是极少被提及的。标称频率:GDDR显存的标称频率远远高于物理运行频率。以GDDR3为例,它承受4bit预取,因此250MHzGDDR3显存,1000MHzGPU-Z、Rivatuner等软件的截图中,看到的显存频率就是标称频率。等效工作频率:等效工作频率是GDDR显存衡量实际传输数据力量的频率。一般GDDR2、GDDR3、GDDR42倍。而GDDR5承受了4倍。我们常常看到厂商和大局部媒体宣传的显存频率实际就是等效工作频率,这也是大家使用最广泛、认知度最高的GDDR显存频率。另外,等效工作频率可以直接和显存位宽相乘进展计算。比方等效工作频率为2000MHzGDDR3128bit2022MHz×128bit÷8=32GB/s。稳定+节能,其实很简洁—Dataeyeoptimization数据核心优化对于数据的优化是存储器最为重要的方面,GDDR5重点承受了四项技术来保证数据的稳定性和安全性。Data/addressbitinversio

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论