DDRSDRAM:SoC低成本高复杂度片外存储器解决方案_第1页
DDRSDRAM:SoC低成本高复杂度片外存储器解决方案_第2页
DDRSDRAM:SoC低成本高复杂度片外存储器解决方案_第3页
DDRSDRAM:SoC低成本高复杂度片外存储器解决方案_第4页
DDRSDRAM:SoC低成本高复杂度片外存储器解决方案_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、ddr sdram: soc低成本高复杂度片外存储器解决方案几乎所有人都知道,用于桌面计算机和便携计算机的dram存储器产品与本白皮书所讨论 的片外dram完全相同。事实上,全部dram产量中的约90%用在计算机上,其它10% 当作了系统级芯片(soc)的片外存储器来使用,这就象将方木钉打入圆孔一样地不适合。 随着要求配备与外部存储器接口的soc设计方案的数量增加,现化化的ddrn sdram存 储器接口(ddr、ddr2、ddr3)提供了可靠的供货能力、高存储容量、低成本和合理的 通道带宽,但却存在使用不便的接口以及复杂控制器方面的问题。面对内部dram阵列所导致的独特指令结构,且要求在设计

2、方案内加入代表当前先进水平 的dram接口时,soc设计人员就会将这个任务视为畏途。本口皮书对sdram的历史进 行了简短介绍,并探讨了实施ddrn控制器和phy的设计考虑要素,并描述了如何采用完 整的ip解决方案来帮助加快产品上市周期和降低成本。sdram历史简介尽管存储容量上也发生了令人惊奇的进步,但商品dram在过去15年来的演化让接口峰值 带宽以远大于2000%的系数增加(请参见图1)。虽然任何人都不能违背物理学的基本规律 而对基本随机存取操作的延迟现彖做出类似程度的提升,但通过增加引脚带宽以及在脉冲猝 发下访问数据的能力,能够减少一部分存储器相对于典型处理器对于更高速存储器带宽永无

3、止境的需求之间的差距。在这段发展期内,被称为jc42的美国电子器件工程联合委员会 (jedec) 一直是商品dram的行业标准的制订机构。在1993年下半年,jedec发布了最初的sdram标准,这个标准最终变成了后来称为“pc100 sdram”的标准。通过将sdram的时序参数推到实际极限时,pc 133 sdram出现了, 它将通道频率增加到了 133mhz,数据速率增加到了 133mbps。图1峰值带宽与dram类型对比peak峰值带宽在20世纪90年代末,jedec制订了一份内容扎实的dram发展路线图。从1996年起至 200()年6月为止,jedec制订了 ddr (双倍数据速率

4、)sdram规格(jesd79)。为了为 那些要求更高带宽的系统提供明显性能提升,ddr sdram在pc 100和pc 133 sdram上 做出了更显著的改进,包括双边沿吋钟触发(d.ka双倍数据速率或ddr吋钟触发)、源同 步双向脉冲(strobe)、sstl_2低电压信号,并结合了内部延迟锁定环(dll)。随后在2003 年之前,(jesd79-2)制订了 ddr2 sdram规格,提供了高达800mb/s的引脚带宽,是 ddr sdram 的 2 倍。在ddr和ddr2 sdram标准制订过程中,工程师们的焦点更多地放在整体的系统时序预 算上以及一些可以用于解决限制性能关键性问题的领

5、域上。ddr时钟信号发生方式是一个 广为认可的可提高带宽的概念,并同时避免采用更高频率的时钟(虽然这个概念确实将更多 重点放在对时钟信号占空比的要求上)。也许,ddr和ddr2 sdram标准屮最有价值的要 素是采纳了源同步时钟信号以及加入了一个片内dll (或同等电路)来消除用于满足存取 吋间规格的吋钟插入延迟。2007 年 6 月,jedec 分布了 ddr3 sdram 标准(jesd79-3)。而提供高达 1600mbps 的引 脚带宽要求对ddr2标准做出多项新的改进,包括精密输出驱动电路以及通过一个外部校 准电阻器提供的odt阻抗控制方式,还有在控制器内采用写均衡以便配合dimm所

6、使用的 “飞越式(flyby)”布线方式。此外,ddr3标准包含了一个内部多用途寄存器,这个寄存 器让dram能够发送标准数据模式至存储器控制器,这些模式将用于系统校准用途,例如 精密地将数据选通信号的发生时刻调整到数据眼的屮心。保持dram的简洁性,将复杂部分放在控制器内随着同步dram标准化工作的完成,有多项关键性的决定最终导致了 ddrn sdram存储 器控制器设计方案的复杂化。其中第一个决定涉及在dram内使用片内延迟锁定环(dll)o dll或同等电路事实上于90年代末期在一些单数据速率的sdram设计屮首次出现,目的 在于消除时蚀引脚与数据输出缓存器z间的部分时蚀插入延迟现象。运

7、用dll电路来减少 吋钟规格(tac)所规定的数据存取时间能够显著地改善时序预算情况。但是,绝大多数的 dram供货商都能够生产出性能足够优秀的部件,从而无需使用dll,因此,那些原來依 赖dll的供货商也迅速跟上了这个趋势,修改了自己的设计,设法在没有dll的情况下 满足要求。在制订ddr sdram标准时,因为在ddr sdram所要求使用的时钟频率下, 时钟插入延迟属于不可克服的问题,所以要求在设计时釆用dll电路。而在ddr sdram 内加入dll或等效电路后,就要求在输出数据眼边沿与输入时钟边沿之间确定一个合理的 技术规格,所以jedec做出了一个合理的选择,指定将输出数据信号的边

8、沿与时钟边沿对 齐。这个规定导致,在例如dimm这样从4个或8个独立dram中生成64位数据字的芯 片中,可以获得最为粘着的时序,让每个dram均按照相同的时钟生成数据。为了方便大带宽下的运行,ddrn sdram采用了源同步设计方案,让正在执行数据发送的 同一个sdram可生成1个或多个数据选通信号(dqs)。釆用此体系的优点在于,数据信 号与dqs选通信号具冇类似的负荷特性和物理特性,而且ddrn sdram nj以很容易地驱 动dqs选通信号,并且与数据引脚z间也具有最低的相对畸变。与原来使用一个负荷率很 重的主时钟信号来采集所有地址、数据和共用信息的sdram对比起来,在存储器控制器

9、处采用dqs选通信号对读取数据进行采样可以很方便地获得高得多的帯宽。但是,采用数 据选通信号要求做出另一项关键性的决定,而这项决定対存储器控制器产生着影响,即,将 数据选通信号的边沿放置在数据眼的哪一个相对位置上。在理想条件下,最合理的对准方式 是将数据选通信号边沿精确地放置在数据眼的屮间,从而可以轻松方便地在控制器处采集到 数据。但是,真实世界导致sdram所采用dll具有相当大的复杂度,因为dll原先只 是用于消除吋钟插入延迟现象的用途。要将数据选通脉冲边沿与ddr数据眼的中心对准就 要求sdram dll将选通脉冲边沿完美地移位90度。从逻辑上讲,由于数量较多的存储器 部件在典型情况下与

10、同一存储器控制器进行接口时,所以将成本负担添加到存储器部件上显 得很不合理。因此,所做出的决定是将读取数据眼的边沿与数据选通脉冲的边沿对准,这样 就让ddrn sdram的应用更加容易(也更加便宜,不过让控制器更加复杂化)。将数据选 通脉冲移位到读取数据眼正中以便正确采样数据的负担便落到了控制器的肩头。相反地,对 于发送到ddrn sdram的写入数据,所做出的决定是要求数据选通脉冲对屮于写入数据眼 的中心,以方便sdram对数据进行采样。再一次,这个决定耍求ddrn控制器加入复杂 的电路,这些电路是通过精确调整时序以放置数据选通脉冲边沿位置时所必需的。以下为图片译文:控制器 ? 特意保持了

11、sdram的简洁性? 将复杂度加入到存储器控制器屮指令(sdr)控制器dll生成存储器通道时钟并精密地调整sdr地址和指令边沿的时序(寻址总线会承受很重的负荷)写入至dram (ddr) 控制器发送“中心对准的” dqs选通脉冲以及dq脉冲,控制 器dll电路调节dq和dm边沿的时序,将dqs对准到数据眼的中心并且让dqs与ck 对准从dram读取(ddr)sdram发送“边沿对准的” dqs脉冲以及dq,控制器dll用于移动dqs边沿至读取数据眼的中央。图2.用于ddrn sdram读取和写入操作的dqs与dq间的关系最后一项对存储器控制器设计有影响的关键性决定与数据选通脉冲木身有关,即,数

12、据选通 脉冲本身应当采用单向(采用1个选通信号进行读取操作,再采用另1个选通信号进行写入 操作)还是双向(采用同1个选通信号,通过反相来处理后,用于读取和写入操作)。最终, 为了保留引脚数量以及出于其它原因,jedec采用了双向数据选通脉冲作为标准。这项决 定导致数据选通脉冲并不是可以自由运行的时钟信号,而是变成,在输出数据时,tlddrn sdram进行驱动;而在有写入数据提交到ddrn sdram时必须由存储器控制器进行驱动。作为-种后见之明,从总成本的角度来看,这些关键性的决定对于典型的pc机存储器子系 统是正确的,这样能够将存在复杂部件的芯片数量控制在最少。但是,结果是这些关键性决 策

13、将全部沉重的负担留给了存储器控制器。对于向ddrn sdram的写入操作来说,存储器 控制器必须将数据选通脉冲放置到数据眼的屮心。对于从ddrn sdram读取的操作来说, 存储器控制器必须移位数据选通脉冲至到数据眼的中心以便正确采集数据。在此之外,数据 选通脉冲并不是自由运行的定时信号,从而导致在存储器控制器内要求配备主/从dll或等 同电路。在典型情况下,存储器控制器采用一个主时序电路來与自由运行的定时系统时钟保 持锁定,并采用一个从时序电路来执行非连续性数据选通脉冲的移位操作,例如与ddr数 据眼对中的数据选通脉冲边沿。ddr2和ddr3 sdram提供了一种将选通信号变成差分信号的选择

14、方案,从而导致了数据 选通脉冲功能的进一步复杂化。本意是为了能够跟踪单次结束型的数据信号,差分型数据选 通脉冲加入了一个差分逻辑阈值,使得系统对于转换速率的更加灵敏。这样的情况已经通过 采用根据信号转换速率建立的大量降速率表而得到了很大程度的纠正。如果存储器控制器或sdram都没有驱动数据,则各双向数据选通脉冲引脚处于三态状态 下(无驱动,这些引脚被拉至终接电压电位vtt)。为了防止处于三态下的dqs上的噪音 生成假dqs边沿信号,数据选通脉冲输入缓存器在典型情况下会在存储器控制器得到启用, 使得dqs只能在读取周期内处于活动状态下。dqs输入缓存器能够在存储器控制器实施一 项方案,这项方案能

15、够对各类不同延迟现象和不确定现象做出补偿,例如i/o延迟、印刷电 路板延迟、cas滞后、附加cas滞后,以及一般性的时序不确定现象。在典型情况下,在 启动时会执行一个数据训练序列,以寻找到相对于dqs输入缓存器启用信号的最优位置。 这个目标可以通过采用具有确定性的模式执行读取操作并同时顺利扫描到可能的系统延迟 数值来达到。ddr phy -不仅仅是i/o对于要求提供一个与外部ddrn sdram接口的系统级芯片(soc)来说,物理接口 (phy) 在最低程度上的要求包括,与应用具体相关的sstl i/o以及一些用于处理数据选通脉冲时 序要求的解决方案。ddr2和ddr3 sdram phy均采

16、用了 sstl i/o电路,这种电路在芯 片终接(odt)电阻器上加入可编程性,以这个电阻器替代了以前那些要求作为外部部件 提供的电阻器。此外,还要求采用某些形式的pll、dll或经校准延迟电路,按照如上文 所示的方式,移位数据选通脉冲至数据眼的屮央。采用经校准延迟电路的解决方案在典型情况下采用了一个训练信号序列,这个序列采用预期 数据对延迟线进行了从最小值至最大值的扫描,以寻找到失败和合格区域的边沿位置,从而 最终能够将选通脉冲置于合格区域的中央。为了避免对温度和电压波动的敏感性,延迟线的 位置应当与时钟频率保持锁定,或进行频繁更新以便对任何漂移现象做出补偿。定时重新校 准也是一种能够解决这

17、个问题的方法,相应的操作可以在dram刷新操作期间执行,从而 不必偷偷占用存储器通道。加入了 dll或pll的phy无需进行外部校准,因为它们能够有效地执行自我校准操作。 pll/dll与时钟频率保持锁定,由于延迟线或vco直在连续调整以匹配时钟频率,从而 免受温度和电圧波动的影响。通过采用主/从dll以及存在精确90度相位的输入时钟,并 采用从(镜像)延迟线来控制选通脉冲,数据选通脉冲的边沿可以精确地移位至数据眼的中 央(请参见图3)。要求采用镜像或从延迟线的原因在于,数据选通脉冲并非可以自由运行 的时钟信号。采用pll电路通常要求存储器通道时钟乘以4才能产生有90度相位角的时钟 信号。但是

18、,pll仍然要求采用某种形式的从延迟线来调整数据选通脉冲边沿的时序。图3在800mb/s的速度执行ddr2 sdram写入操作,图中显示了 dqs经90?移位移至数 据眼中心的现象ddrn控制器一更象大脑而不像肌肉任何dram存储器控制器的大脑部分都是指令时序和执行z间的合理关联oddrn sdram 并非十分简单的器件。ddrn sdram内包含了多个独立的存储体(bank),而且每个读取 或写入访问的前面必须提供一个存储体激活指令,最后必须跟随一个预充电指令。一旦某个 存储体己经激活,这个激活结果可以保持,就象打开了一个数据页面一样,允许对很小的存 储体子集合(例如,“页面”)执行一次以上

19、的读取或写入操作。为了能够止存储器通道带宽最大化,优点较大的方法是,提前查找指令序列并按照不同的存 储体來重新组织这些指令的次序,这样就可以将存储体激活指令和预充电指令“隐藏”在不 重组就会没有用处的指令间隙期内。通过指令重组和时间安排减少存储体激活和预充电“停 用时间”的开销可以显著地提升soc与存储器数据通道z间的效率。ddrn sdram控制器逻辑电路还必须能够方便满足dram的刷新要求。要在不能忍受滞 后执行的指令以及延后过长的刷新要求z间进行仲裁就要求在控制器内采用复杂的优先级 控制。控制器还必须频繁地在争夺单一片外存储器资源的soc的多个子程序块之间实施仲 裁。此类仲裁行为要求有能

20、力控制存储器通道内的数据流动优先级,并且不会让低优先级的 指令在不断出现高优先级指令的情况下延误执行。从终极意义上说,这个过程永远也不会完 美,并需要频繁地根据具体应用进行定制。ip大力相助开发ddrn sdram接口要求运用多个工程设计专业的知识。作为大脑的存储器控制器是在 典型的asic设计流程(rtl、逻辑综合、布局和布线)中开发出来的,而作为肌肉的phy 是在完全定制的混合信号设计环境下(原理图输入、模拟电路仿真、定制布局)开发而成的。 当代的soc极少是由那些具备满足这2个领域条件的适当专业知识和eda工具的设计团队 来完成的。幸运的是,当今的soc设计人员再也不必担心存储器控制器以及接口设计方面 的难题了,因为目前已有可用釆用的半导体知识产权(ip),可以降低总开发成本以及上市 周期。通过推出完备的designware? ddr phy和存储器控制器ip产品,synopsys为那些面临着 外部ddrn sdram接口设计难题的soc设计人员提供了完整的ddrn存储器接口解决方 案。designware ddrn ip解决方案结合了硕件和软件ip,可以同时自如地满足ddrn sdram phy的复杂性以及dddn sdram指令结构的逻辑特界性要求。designware ddrn ip

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论