(微电子学与固体电子学专业论文)系统芯片中片上总线结构的性能评价研究.pdf_第1页
(微电子学与固体电子学专业论文)系统芯片中片上总线结构的性能评价研究.pdf_第2页
(微电子学与固体电子学专业论文)系统芯片中片上总线结构的性能评价研究.pdf_第3页
(微电子学与固体电子学专业论文)系统芯片中片上总线结构的性能评价研究.pdf_第4页
(微电子学与固体电子学专业论文)系统芯片中片上总线结构的性能评价研究.pdf_第5页
已阅读5页,还剩103页未读 继续免费阅读

(微电子学与固体电子学专业论文)系统芯片中片上总线结构的性能评价研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 应用需求的增长和系统芯片集成度的不断提高,对系统芯片片上互连结构提出了更高的要求。 总线结构作为片上互连的主要方式,其实现目标主要包括高性能、低功耗以及低硬件开销。性能是 衡量片上总线结构优劣的重要指标,因而片上总线结构的性能评价是一项非常重要和有意义的工作。 本论文的主要工作即着重于系统芯片中片上总线结构的性能评价研究,包括总线结构的建模、系统 仿真环境的建立以及性能评价的方法。 针对系统芯片中所采用的片上总线结构特征,本文采取了基于总线排队模型和系统仿真模型相 结合进行性能评价的技术路线。不同于以往基于简单的经典排队模型的总线性能评价研究,本文面 向实际系统建立了更加精确的排队模型,在提高模型精确性的同时保持了排队模型分析的抽象性。 本文还建立了片上系统仿真环境,提出了基于高级语言c + 十以及基于i s $ 模拟器 r m u l a t o r 的 总线性能分析技术,可作为排队模型分析的有益补充。相比于类似的研究,基于p d 珊u l a t o r 的性能 分析具有简单易用,仿真速度快、精度高等优点,同时硬件模型的建立允许直接运行软件程序进行 系统级性能分析。针对多个实际问题的实验结果表明,本文所建立的排队模犁和系统仿真模型是正 确的,基于排队模型和系统仿真模型的分析能够实现对系统芯片中片上总线结构性能的定量和定性 分析,为系统设计人员提供了有价值的参考依据。 通过排队模型分析和基于高层仿真模型分析的结合,本文采用循序渐进的方法分析了系统设计 过程中面临的多个性能评价问题。首先对片上系统中类似d 控制器这类的实时性主设备总线缓冲 大小进行估计,得出在一定的系统应用背景下主设备在总线接口中缓冲的合适容量。基于高层仿真 模型分析得到的结果同实际电路仿真得到的结果之差小于1 ,基于排队模型的分析结果同仿真分 析亦十分接近;然后分析片上总线结构中另一个重要的方面伸裁算法,通过排队分析方法快速 地进行了不同仲裁算法的性能对比,还计算了不同仲裁条件下的缓冲容量,结论显示采用轮转优先 级仲裁算法时,系统性能相对最好;最后将研究内容扩展到片上总线结构的整体性能研究,包括对 3 种不同集成方式下的d m a 传输效能进行了定量分析以及给出单、双层总线结构在性能上的比较。 对d m a 传输效能的分析结果表明采用d m a 专用外设总线,可在付出不大的硬件开销的前提下获 得明显的性能提升,且要使得d m a 传输效率与系统性能获得较好的折中,d m a 的单位传输个数应 该有合理的取值,同时实验分析还再一次证明了采用轮转优先级算法的优越性。在双层总线结构同 单层总线结构的性能对比中,实验结果表明系统中各个主设备的平均等待时间可以降低5 0 以上, 且排队分析同仿真分析得到的趋势是一致的。通过上述的研究,结果表明本文提出的基于总线排队 模型和系统仿真模型相结合的性能评价手段是有效的。 本文首先提出针对系统芯片中片上总线结构的排队建模方法,并建立了基于c 4 + 和指令级仿真 器的系统高层仿真模型;然后利用排队模型和仿真模型分别分析了总线缓冲、仲裁性能、d m a 集 成和双层总线结构等性能评价问题;最后,对整篇论文的研究内容进行了总结,并指出本课题进一 步发展的方向。 关键词:系统芯片,片上总线,性能评价,排队模型,高层仿真模型 a b s t r a c t h i 曲e rp e r f o r m a n c eo ft h eo n - c h i pi n t e r c o u n e c t i o ni sn e e d e db c c a t l s co ft h ei m p r o v e m e n to ft h e s y s t e m - o n - c h i pi n t e g r a t i o na n da p p l i c a t i o nr e q u i r e m e n t s o n - c h i pb u si st h em a i n i n t e r c o u n c c t i o ns t r u c t u r e u s e di nt h ec u r r a n ts y s t e m - o n - c h i p ;i tm a k e sat a r g e to fh i g hp e r f o r m a n c e , l o wp o w e rd i s s i p a t i o na n dl o w h a r d w a r es p e n d i n g i no r d e rt om a k et h eb e s tc h o i c eo ft h eo n - c h i pb u ss t m c t u m , p e r f o r m a n c ee s t i m a t i o n i saq u 船s i g n i f i c a n ta n do b l i g a t o r yw o r k 1 1 l i sp a p e rf o c u s e so np e r f o r m a n c ee s t i m a t i o no ft h ee m b e d d e d m i c r o p r o c e s s o rb a s e d0 1 1 t h eo n - c h i pb u s ,i n c l u d i n g o n - c h i pb u sm o d e l i n g , h i g h - l e v e ls i m u l a t i o n e n v i r o n m e n tb u i l d i n ga n dt h e i rc o m b i n a t i o n t h ef i r s tp a r to ft h i sd i s s e r t a t i o na d d r e s s e st h ep e r f o r m a n c ee s t i m a t i o nb a s e do nt h eq u e u i n gn e t w o r k m o d e la n dt h eh i g h - l e v e ls i m u l a t i o nm o d e l o t h e rt h a nd e p a r t e dr e s e a r c h e s , m o r ea c c u r a t eq u e u i n g n e t w o r km o d e i sa r ee s t a b l i s h e di na l l u s i o nt oam i c r o p r o c e s s o rn a m e dc e a r f i e l d 4 a tt h es a l n et i m e , h i g h - l e v e ls i m u l a t i o ne n v i r o n m e n tb a s e d0 1 9c + a n di n s t r u c t i o n l e v e ls i m u l a t o r a r m u l a t o rh a sb e e n b u i l df o rs y s t e m - l e v e la n a l y s i s a c c o r d i n gt oo t h e rs i m i l a r l ys i m u l a t i o ne n v i r o n m e n t , t h ea n a l y s i sb a s e do n a r m u l a t o rh a s g ) n l eo b v i o u sa d v a n t a g es u c ha se a s y ,c c l e r i t ya n dn i c e t y f u r t h e r m o r e ,t h eh a r d w a r e m o d e l sh a v eb e e nb u i l d i n ga n dt h es o 伽v a r oc a nb ed e b u g g e dd i r e c t l yi na r m u l a t o r e x p e r i m e n tr e s u l t s s h o wt h a tt h ep e f f o n n a n c ce s t i m a t i o nb a s e do nt h eq u e u i n gn e t w o r km o d e la n dt h eh i g h - l e v e ls i m u l a t i o n m o d e li sa c c u r a t ea n de f f e c t i v e 皿ep r o p o s e dm e t h o dm a k e st h eq u a n t i f i c a t i o n a la n dq u a l i t a t i v ea n a l y s i s a n di tc a np r o v i d ev a l u a b l er e f e r e n c ef o rt h ed 船i 驴e 璐 t h e ns e v e r a la p p l i c a t i o n so ft h ep e r f o r m a n c ee s t i m a t i o na r e - - - - - - - - - - - - - - - - f i n i s h e db yt h ep r o p o s e dm o d e l , i n c l u d i n gb u sb u y e rs i z ee v a l u a t i o n , b u sa r b i t r a t i o ns t r l l c 佃r oc o n t r a s t , d m ai n t e g r a t i o nc h o i c ea n dt h e p e r f o r m a n c ee s t i m a t i o no ft h et w o - l a y e ra m b as t r u c t u r e i nb u sb u f f e rs i z ee v a l u a t i o n t h ed i f f e r e n c e b e t w e e nt h er e s u l t sb a s e d0 1 1t h eh i g h - l e v e ls i m u l a t i o na n dt h ei ls i m u l a t i o ni sl e s st h a n1 a n dt h e q u e u i n gn e t w o r ka n a l y s i sa l s o 血n d st h ec c r l c c tr e s u l t s t b ee x p e r i m e n t sa c c o r d i n gt od i f f e r e n tb u s a r b i t r a t i o nf l g o f i t h m si n d i c a t et h a tt h et u r n a r o u n dp d o d t ya l g o d t h mi st h eb e s t c h o i c e 1 1 h ea n a l y s e sa b o u t d m a i n t e g r a t i o ns h o wt h a tt h ep e r f o r m a n c ec o u l db ei m p r o v e do b v i o u s l yw i t ha d o p t i n gt h ea p p r o p d a t i v e d m a p e r i p h e r a lb u ss t r u c t u r e i no r d e rt oa c h i e v et h et r a d e - o f fo ft h es y s t e mp e r f o r m a n c e ,d m as i n g l e t r a n s f e r sn u m b e rs h o u l db ec o n s i d e r e dc a r e f u l l y r e l a t i v et ot h es i n g l el a y e rb u ss t r u e t u m , t h em e a nw a i t t i m eo ft h em a s t e r sc 锄d c c t c a s ca tl e a s t5 0 i nt h et w o - l a y e ra m b as t r u c t u r e a n dt h ea n a l y s i sb a s e do n t h eq u e u i n gn o t w o r ki sc 1 0 8 et ot h ea n a l y s i sb a s e do nt h es i m u l a t i o n a l lo f t h ea b o v ea n a l y s e si n d i c a t et h a t t h ep e r f o r m a n c ee v a l u a t i o no ft h eo n - c h i pb u sc a l lb ea c c o m p l i s h e db yt h ec o m b i n e dm e t h o d , w h i c h i n c l u d e sq u e u i n gn e t w o r ka n a l y s i sa n dh i g h - l e v e ls i m u l a t i o na n a l y s i s o n - c h i pb u sm o d e l i n ga n dt h ep e r f o r m a n c ee s t i m a t i o nm e t h o da r eo f f e r e di nt h i sp a p e r f t r s t l y , a d v a n c et h eo n - c h i pb u sm o d e l i n g ,i n c l u d i n ga n a l y t i c a lm o d e la n ds i m u l a t i o nm o d e l s e c o n d l y ,m a k et h e p e r f o r m a n c ea n a l y s i so ft h eo n - c h i pb u ss i 加c t i l r ei ng a r f i e l d 4 a tl a s t , as u m m a r yi sg i v e na n ds 0 0 1 c p u r s u e dp r o b l e m sa b o u to n - c h i pb u sp e r f o r m a n c ee s t i m a t i o na r ep o i n t e do u t k e yw o r d s :s y s t e m - o n - c h i p ,o n - c h i pb u s , p e r f o r m a n c ee s t i m a t i o n , q u e u i n gn e t w o r km o d e l ,n i g h - l e v e l s i m u l a t i o nm o d e l 东南大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发 表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用 过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明 并表示了谢意。 研究生签名:翼丝坠日期: 勿p 譬2 5 东南大学学位论文使用授权声明 东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的 复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内 容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可 以公布( 包括刊登) 论文的全部或部分内容。论文的公布( 包括刊登) 授权东南大学研 究生院办理。 研究生签名:墨垫导师签名: 第一章绪论 1 i 课题的研究背景 第一章绪论 随着应用需求的不断增长,嵌入式系统的发展日益蓬勃。嵌入式系统与通用的计算系统有着明 显的不同:嵌入式系统通常针对不同的场合运行一些已知的、固定的应用,通用计算系统则需要面 向完整的、未知的应用;嵌入式系统往往不提供终端用户编程的能力。而通用计算系统则允许终端 用户进行任意的编程;嵌入式系统的性能并不是越高越好,因为性能越高则往往意味着功耗也越高, 而通用计算系统则追求性能的最大化,降低功耗的需求并不十分明显。简而言之,嵌入式系统强调 的是功耗、成本、性能三者的最佳折中。 同样,嵌入式系统芯片设计也得到了飞速的发展。目前,主频高达加0 枷的嵌入式微处理器 已经得到广泛的应用,并且伴随着越来越多的复杂应用,更高性能的嵌入式微处理器也将出现。系 统芯片s o c ( s y s t e m - o n - c h i p ) 已经成为i c 业界的焦点,芯片性能越来越强,规模越来越大,开发 周期越来越长,设计质茸越来越难于控制,芯片设计的成本也越来越趋于高昂。s o c 的设计流程目 前已经成为热门的研究问题。图1 - 1 即展示了一个s o c 的设计流程,越来越多的研究和实践表明系 统级设计在s o c 的整个设计中占有非常重要的地位。 降绕露求分耩】 滋目啼圆摘 l 系统设诗lc = , 、7 f g “p g r ” 囱囱崮窜 寓囱囱由 i 、,。, h 。,、b l - 。- 。 窜 匣,峦 曼枣卜圃 援建,测试 图1 - 1 s o c 的设计流程 由于s o c 系统复杂性的不断增加以及设计周期的缩短,系统中许多关键性问题需要在芯片设计 的初期阶段予以提早发现和解决,大量的实践证明,在系统级即进行性能及功耗优化往往能够取得 更加明显的成效。有效的系统级设计还包括为设计者提供有效的系统分析和评估,以帮助设计者进 行关键设计问题的决策,例如在系统设计初期即对系统进行性能分析,指出系统性能的瓶颈或提供 不同系统结构的性能定量分析。 1 东南人学博 学位论文 1 2s o c 的结构设计 1 工ls o c 设计流程中的结构设计问题 正如上述所言,系统设计是整个s o c 设计流程中非常关键的步骤。一个s o c 设计流程中较详细 的系统级设计过程如下所述: 1 确定系统特征,功能参数,目标成本,以及目标交货日期; 2 确定系统结构,进行软件顾件之间的划分及折中; 3 确定测试设计和内建白测试的需求; 4 确定设计重用策略和步骤: 5 确定将要使用的工艺和代工厂,验证的可实现性; 6 建立项目组的通讯系统和标准; 7 开发和分发设计标准文档; 8 定义项目的人员分配,组织结构,分配相应的人手; 9 开发项目日程表和预算,如有必要则对上述项目进行调整。 其中确定系统的结构是指在软件顾件划分完毕后,根据确定好的系统特征,确定系统所包含的 硬件模块以及如何将这些硬件模块组织在一起构成系统。并且往往在系统结构确定的过程中就需要 开始综合考虑面积、功耗、性能的折中。这其中,如何将硬件模块组织在一起是核心问题,也就是 说s o c 系统的通信结构设计是s o c 系统结构设计的核心问题。 从另一方面来说,s o c 设计的最大好处之一就是可以通过使用预先设计好的,称为1 p 核”的功 能模块来节省设计成本。理想的情况是,s o c 的设计者可以快速地将一组口核装配成复杂的、基于 应用的结构,整个过稃就像画一个框图那么容易。可以明显地看出口作为s o c 设计的核心,其本 质特征是可重用性。可重用性也带来了口模块间的胶联逻辑技术( g l u el o g i ct e c h n o l o g i e s ) 问题, 即如何将这些口核有效地集成剑一个系统中,或者更确切地说也就是确定口核之间的通信机制。 1 2 2s o c 片上通信结构 当前已经提出的s o c 片上通信结构主要有两种,片上总线通信结构( o n c h l pb u s ) 和片上网络 通信结构( n 咖o r k 伽出p ) 1 1 1 1 2 1 。 1 2 2 1 片上总线通信结构 片上总线通信结构是目前s o c 系统最常采用的通信结构。例如三星公司2 0 0 5 年推出的一款 r i s c 微处理器【3 】即采用了片上总线通信结构。 总线从本质上来说是一束线,用于为需要通信的模块提供一个共享的通信链路。片上总线的最 初提出来源于板级总线的思想,并且依赖于共享通信通道和处理时分复用的仲裁机制【l l 。在以总线 为核心的系统结构中,从总线的角度来看,系统被划分为一系列的处理单元【4 l ,并且处理单元之间 通过总线进行通信。 片上总线通信结构有其特有的优势: 具有简洁和易于使用的特点,使得通讯接口控制逻辑的复杂度较低; 开发费用较低,作为s o c 集成的标准使得系统的集成易于实现。 但同时总线连接也有其自身的缺点; 具备带宽瓶鲼。由于是共享通信链路及时分复用,当系统中需要进行通信的模块较多时存在带 宽的瓶颤,出现拥塞现象; 2 第一章绪论 功耗问题。以总线为核心的互联结构,往往连接于总线上的模块很多,使得总线负载较大,不 利于降低功耗,还造成时钟同步的困难。 随着系统芯片应用需求的不断提高,片上总线结构也在不断地发展和完善,以解决因为自身缺 点而带来的问题【1 】,目前有以下几个主要的发展趋势: n发展和完善总线通信协议,最大限度地利用现有通信链路的带宽资源,例如a r m 公司的片上 总线协议从a m b a 2 旷】发展到a m b a a x i f l ,增加了通道概念并允许乱序传输; 增加并行度以解决带宽瓶颈及功耗过大的问题,如采用多个或多层总线结构; 卸标准化总线连接的接口定义,为s o c 系统口核的集成提供最大的便利。 总之,片上总线结构因为具有结构简单和费用低廉的特点,在未来的一段时间内仍将是s o c 片 上通信结构所采用的主要方式。同时,来自于不断增加的复杂应用的要求也将促进关于片上总线通 信结构研究的不断深入。 1 2 2 2 片上网络通信结构 s o c 系统结构复杂性不断提高,越来越多的处理单元被集成到单一的芯片中去,一种新的片上 通信结构被提出并在近几年得到了长足的发展,这就是片上网络通信结构( n e t w o r k - o n - c h i p , n o c ) 【1 】【1 嗍,图1 - 2 显示了片上网络通信结构的多个示例。 越 嘲嚣 瞬商蠲 东惑迭专疗;学蹄 溯 l k;艿 ;捻毯 弱旁”掣 ;:黔硝m 弦”k , 翻1 7 瑚 ,口 融 图1 - 2 片上网络通信结构:( a ) s p i n c o ) c l , i c h 自( c ) t o m s ( d ) f o l d e d t o r u s ( e ) o c t 超o n ( 0 b f t 片上网络通信结构是一种基于包交换( p a c k e t - s w i t c h e d ) 的,集成于单芯片的具备多转发点 佃l i l t m o p ) 的内连网络唧。目前大多数提出的片上网络通信结构都是基于包交换和规则结构的。例如 c m e r r i e 和g r e i n e r 提出了一种通用的面向片上包交换的内连模板称之为s p i n ( s c a l a b l e , p r o g r a m m a b l e , i n t e g r a t e dn e t w o r k ) ,其结构见图1 - 2 ( a ) ,这种结构是基于f a t - t e 形式的唧。k n m 盯 等人提出了基于网状结构的片上网络通信结构c l i c h 自c h i p - l e v e li n t e g r a t i o no fc o m m u n i c a t i n g h e t e r o g e n e o u s e l e m e n t s ) , 其结构见图1 - 2 1 ( b ) p o 。d a 啦和t o w l e s 则提出了一种二维环状形式的片上 网络结构,此种结构同网状结构的唯一不同在于处在边缘的交换单元是通过环绕的通道与相对边缘 的交换单元相连,可参看图1 - 2 ( c ) 1 1 1 】。图1 - 2 ( d ) 展示了一种折叠的环状结构,可避免非折叠结构中 的环绕连接带来过大的延迟。k a r i m 等人也提出了称为o c t a g o n 的片上网络结构,图1 - 2 ( e ) 显示 了该种结构的一种基本组成,包含了八个节点和1 2 个双向的链路p z 。p i m d e 等人提出的内连结构 则是基于蝶形的f a t - t r e e 结构的,将节点置于树结构的叶端而将交换单元置于顶端,其结构可见图 1 - 2 ( 0 1 3 1 。 一3 东南大学博卜学位论文 相对。成熟的片上总线形式通信结构,片上网络通信结构目前还没有得到大面积的采用,但仍 有其自身的优点: 所面临带宽瓶颈问题比片上总线通信结构要小。多通道结构不仅使得不同发i 封接收者之间的传 输可以并行进行,还提高了系统的模块化和可集成性; 因为采用类似于网络交换的技术,其考虑的是网络中每个模块核心( c o r e s ) 至最近的交换单元 ( r o u t e r s ) 以及相邻的交换单元间的延迟,因而时钟同步将不再是难题。 但是片上网络通信结构同样也存在着一些缺点: 在单芯片集成模块并不十分多的情况下,片上网络通信结构的控制逻辑将比总线通信结构复杂 得多,这将占用更多的芯片面积; 某些应用条件下片上网络通信结构将带来比片上总线通信结构更大的延迟,这在一些实时性要 求高的应用中会带来问题,另外片上网络结构的功耗问题目前仍值得仔细研究; 相比十分成熟的片上总线通信结构,片上网络结构目前仍没有一个具体的统一标准。最重要的 是其相关工具和设计方法的研究仍处于发展阶段,造成了片上网络通信结构的推广十分缓慢。 1 2 3 结构设计中的系统级分析 因为构成片上系统的模块众多,同时模块间相连接的结构亦可以有非常多的选择,因而一个片 上系统设计的成败同结构分析选择有着密切的联系。许多实践已经证明,在片上系统的设计过程中, 越甲发现系统的关键问题能够使得设计有事半功倍的效果,因此针对s o c 系统进行系统级的分析非 常重要。系统级的分析对象往往包含了系统许多方面的特征,诸如性能、功耗以及面积等等。 为了提高分析的效率,提高抽象水平对系统级分析来说是十分必要的。首先从分析的方法来看, 系统分析可以划分为静态分析和动态分析: n静态分析假设系统所有的计算和通讯均可为静态调度的,具有分析速度快的优点。但此类分析 往往假设通讯时间是比较优化的f 1 4 1 ”1 ,或者针对通讯的冲突假设一个最坏的场剥”l ,因而结果 往往不够精确; b 、动态分析技术则基于系统中所有模块的模璎,并可在不同层次的通讯抽象级别上进行仿真 m 【1 8 】。但仿真需要一定的模犁基础而且存在仿真时间与精度之间的矛盾。还有将动态分析和静 态分析相结合的分析方法,希望获得精确性和效率之间的折中【1 9 1 。 其次若从分析模型的角度来划分,系统分析可基于分析模型( a n a l y t i c a lm o d e l ) 或者是仿真模 型( s i m u l a t i o nm o d e l ) : 曲分析模型基于数学背景,往往针对系统做出各种假设和简化 2 0 z q z e l z 目。分析模犁具有分析快速 的优点,但简化的后果往往使得分析结果同现实系统有一定的差距,且随着系统复杂性的不断 提高,建模也变得越来越凼难; b 、 仿真模砸则是真实系统的表示,可以描述相对比较真实的系统,因而能够分析、求解复杂的系 统。缺点是需要大量的模本l 构造、模型运行和输出分析时间。仿真模犁可采用多种实现方法: 诸如基于r t l 源代码或门级网表的仿真模型洲,基于c c + + 等高级语言的仿真模璎 2 5 1 ,基于 s y s t e m c 的事务模型闭鲫【篮】以及一些基于它们的混合模型 2 9 1 等等。因为分析模裂和仿真模型各 具有优势希i 缺陷,往往可结合进行分析。 1 3 论文的主要工作和创新点 1 3 1 论文的主要工作 本论文的主要工作着重于系统芯片中片上总线结构的性能评价研究,包括总线结构的建模、系 - d 第一章绪论 统仿真环境的建立以及性能评价的方法。首先针对片上总线结构的特点提出片上总线结构的排队建 模方法,包括顾客到达规律、服务时间以及服务规则的约定、开环与闭环排队模型的选择以及数学 分析与模拟分析的结合等。其次,本文还建立了片上系统仿真环境,包括基于c + + 的高层模型以及 基于指令级仿真的a r m u l a t o r 模型。仿真不仅作为检验排队模型分析l e 确性的有效方法,同时也可 作为排队分析的补充。 本文的研究目的是为系统芯片结构设计人员提供快速准确的性能评价依据,我们提出了排队分 析与仿真分析相结合的技术路线。排队分析具有分析快速的特点,高层仿真模型则更加能够精确反 映真实系统的实际行为。 片上总线结构的性能评价包含有许多方面。在对片上总线结构的性能研究中,本文采取了循序 渐进的研究思路。 首先对片上系统中类似l c d 控制器这类的实时性主设备的缓冲大小进行估计,通过排队及仿真 分析方法得出在一定的系统应用背景下主设备在总线接口中缓冲的合适容量; 然后分析片上总线结构中另一个重要的方面仲裁算法,通过排队分析方法快速地进行了不 同仲裁算法的性能对比; 最后将研究内容扩展到整体的片上总线结构性能研究,对3 种不同集成方式下的d m a 传输效 能进行了定量的分析,进行了双层总线结构的性能分析并比较了单、双层总线结构在性能上的 差距。 1 3 2 论文的创新点 本文工作的创新有如下两个方面: 1 】本文首次将排队模跫应用于总线缓冲容量估计、总线仲裁性能评价以及诸如d m a 集成、双层总 线结构等此类有关总线结构的性能评价研究,相比于过去的同类研究本文的模型更加准确。通 常的基于排队模犁的性能研究往往基于简单的经典排队模型,这在实际的系统评价中具有很大 的局限性,本文则针对片上总线结构的实际特征扩展了排队模璎的适应性,使得所建立的排队 模型与真实的片上系统更加接近,在提高模型精确性的同时保持了排队模型分析的抽象性。性 能评价实验证明,本文提出的排队模型是有效的。 1 2 本文建立了片上系统仿真环境,提出了基于高级语言c + + 以及基于i s s 模拟器a r m u l a t o r 的总线性能分析技术。相比于类似的研究,基于a l 瑚u l a t o r 的性能分析具有简单易用、仿真速 度快、精度高等优点,同时硬件模型的建立允许直接运行软件程序进行系统级性能分析。仿真 模犁的建立不仅作为检验手段证明了本文提出的排队模型分析的正确性,同时也可作为排队模 型的有益补充。通过基于排队模型和高层仿真模型的综合分析,可解决诸如总线结构本身( 仲 裁、缓冲) 以及系统集成方式( d m a 、双层总线) 等方面的性能评价问题,为系统芯片的结构 设计提供了有价值的参考依据。 1 3 3 论文的结构 论文共分为六个部分。第一章提出了课题的研究背景。指出s o c 结构设计中片上通信结构的重 要性,并简要阐述了论文的主要工作和创新点。第二章则对片上总线结构的相关研究进行了归纳和 总结。第三章简要介绍了排队论及其分析方法,阐述了针对片上总线结构的排队建模方法。第四章 则面向实际的片上总线结构建立了高层仿真模型,包括基于c 4 + 的高层模型和基于指令级仿真的 a r m u l a t o r 模型。第五章在采用排队分析与仿真分析的基础上循序渐进地进行了总线缓冲容量估计、 总线仲裁性能评价、d m a 传输效能评价以及双层总线结构性能评价的实例研究。最后一章对论文 进行总结,并对进一步的研究方向做了说明。 5 东南大学博i 学位论文 第二章s o c 片上总线结构相关研究综述 2 1s o c 片上总线通信结构研究 2 1 1 基于片上总线的s o c 结构 前面我们已经提到,片上总线通信结构是当前系统芯片主要采用的通信结构。使用总线结构的 系统可以将其抽象划分为两个部分:通信单元和处理单元,见图2 q ( a ) 。对于片上系统而言,通信 单元即片上总线,承担着片上系统各个处理单元之间的通信;处理单元则是系统中承担运算功能的 基本单元,例如嵌入式微处理器中的r i s c 核心,负责运行程序并控制其他处理单元的运算。处理 单元从通信角度而言又可以分为两类:发起方( m a s t c r ) 和接收方( s l a v e ) ,发起方可以主动发起总线请 求并与相应的接收方进行通信;接收方则不能够主动发起总线请求,只能被动地接受来自于发起方 的通信请求。 片上总线结构作为通信单元,它本身也是系统芯片众多模块中的一个,通常而言它主要包含有 两个部分:通信链路和控制部分,见图2 1 ( b ) 。总线负责连接不同的处理单元,各个处理单元间的 通信链路是必不可少的部分,这通常包含有地址总线、单向或双向的数据总线以及其他的控制总线。 总线结构是基于共享原则的,因而控制部分必须解决诸如多处理单元冲突时的仲裁、层次化总线问 的配合以及地计译码等等问题。 。一一鬲”一 幻岱 图2 - 1 ( a ) 基于总线结构的片上系统( b ) 总线结构的组成部分 2 1 1 1 基于接口形式的划分 片上总线结构若从接口上划分可以分为标准接口总线结构( s t a n d a r d b u s ) 和基丁二包装的总线结 构( w r a p p e r - b a s e d b u s ) : ( 1 ) 标准接1 3 总线结构规定了一鼙套总线连接的方法,通常包括有发起方的连接方法以及接收方 的连接方法。标准接口总线结构还规定了通过总线传输的协议,如此便可将具备有支持某一标准总 线接e l 的口方便地集成到系统当中。标准接口总线结构目前比较常见的有a r m 公司的a m b a 总 线结构【5 1 以及i b m 公司的c o r e c o n n e c t 总线结构p o 等等。对于不同的片上系统,如果它们采刚的是 同一种标准接口总线结构,则口可以在不同的片上系统之间方便地直接复用;如果它们采用的是不 同的标准接口总线结构,则只有修改口的总线接口部分以适府新的总线结构。 ( 2 ) 基于包装的总线结构则是另一种总线结构。它将口的处理核心同总线接口相关联的通信逻辑 分离开来。基于包装接口的目的是使用独立于物理总线协议的口接口协议以及使用基于硬件的包装 来处理口到口间的通信。这类总线结构目前有称之为v c i ”】( v m u a lc o m p o n e n ti n t e r f a c e ) 的标准 6 墓 第二章s o c 片上总线结构相关研究综述 化包装接口以及与之相类似的o c p 0 2 1 ( o p e nc o r ep r o t o c 0 1 ) 。v c i 定义了一个接口协议,通过硬件 包装可以桥接到任何一种物理总线协议上,这使得口通过更换不同的硬件包装可以集成到使用任意 总线结构的系统中去。在基于包装的总线结构中,发起方和接收方的接口协议是一致的,因此发起 方和接收方可以看作是直接连接在一起的。基于包装的总线结构增强了邛的复用性,更清晰地划分 了m 的处理部分同接口部分,但它同时带来了延迟增大等负面效应,因而包装的设计是需要精心考 虑的印】,同时也需要占用更多的硬件资源,例如使用f i f o 作为包装中的缓冲以提高性能阱l 。 k e n i c h i r e 等人即对此问题提出了多种优化办法闭。 2 1 1 2 基于传输方式的划分 片上总线结构从传输方式上可以划分为同步( s y n c h r o n o u s ) 传输总线结构以及异步( a s y n c h r o n o u s ) 传输总线结构。 ( 1 ) 同步传输总线结构是目前最常见也最流行的总线传输结构,上述的不论是a m b a 、c o r e c o n n e c t , 还是v a 、o c p ,都属于同步传输的总线结构。同步传输系统顾名思义即有一个系统时钟作为参照, 如图2 - 2 所示的波形显示了一种系统的所有动作均在时钟上升沿发生的示例。同步系统存在一些无 法回避的问题:首先系统时钟就是一个非常大的功耗来源,其次同步系统需要系统中的所有模块同 步工作在系统时钟下,如果口需要工作在不同的时钟频率下则只有增加同步逻辑,不仅复杂且易产 生错误。另外随着连接到同步总线的口逐渐增多及系统工作频率的不断提高,时钟延迟( c l o c k s k e w ) 的问题也将越来越突出。当然,通过使用良好的时钟发生器以及精心的时钟网络布置能够在一定程 度上避免上述问题,但这些方法同时也会增加系统的功耗p 5 l 。 嚣 善蠹l i c r c a 制隋辣o k 曩 o 饿 纛纛q 纛e x 詹漕筋露 o嘻2摹 l 卅 弋n , 厂飞 lli 隧蚓 l i 磁卿 l i 烨攀 l l 图2 - 2 同步传输总线传输示例 鬈囔3 图2 - 3 异步传输总线一四相握手协议 ( 2 ) 异步总线传输结构则不需要系统时钟,因而同避了同步传输总线结构所面对的时钟延迟、高 时钟功耗等问题,并且随着片上系统集成m 数量的增多,异步总线的效能也随之提高。图2 - 3 显示 7 - 东南大学博1 :学位论文 了一个基本的使用四相请求握手方式的异步总线协议。主流的异步传输总线结构目前有 m a r b l e i z e 和c h a i n l 3 7 1 ,e m l - c _ 扣j n g 等人还针对m a r b l e 以及c h a i n 结构相比同步总线结构 性能较低的问题提出了使用归零编码( r e t u r n - t o - z e r o ) 来使异步总线获得更高的吞吐率【弼】,从而获 得更多的性能提升。 表2 1 显示了当前主要的同步传输总线结构与异步传输总线结构之间的性能对比【捌,可以看出 目前同步传输结构仍占有一定的优势。 表2 1 同步传输总线结构与异步传输总线结构的性能对比 # 锄。”矿 a 嘴o 数据涎黠酵锌颁势空阿弗囊争备硅麓l 总线结构工艺 位霓( b 姥m h z 参缕i 黼n 砖f k 翱杈拶 。,静够 m a r b i 卫3 20 3 51 43 3 2 c h a 珊3 2 0 3 5 1 9 64 3 1 6 a a a h b3 21 5 0 1 ,而y 2 上的 信号保持不变,由于串扰可能会在y 2 上产生毛刺;如果y 1 上的信号0 - 1 ,而y 2 上的信号1 - 0 , 则可能会影响y 1 和y 2 上信号的延时:除了毛刺和时延的影响之外,如果串扰效应很严重,也可能 形成振荡,如图2 - 1 4 ( a ) 所示。 图2 , - 1 3 考虑串扰的互连模型 相对于用分布电阻、分布电容、耦合电容、线电感和互感来描述串扰故障,上述毛刺、时延和 振荡模型已经大大简化了串扰故障的描述。但是对于总线( 带宽为n ) 的串扰故障而言,所有互连 之间串扰的测试复杂度为o ( 2 ,因此总线的串扰故障模型需要进一步简化。c u w i e l l o 提出了总线 串扰模型m a ( m a x i m a la g g r e s s o r ) 故障模型,因为振荡难以进一步抽象且可以将振荡当作是 毛刺处理,所以在m a 模型中并没有考虑振荡。在m a 模型中毛刺可以细分为正跳毛刺g p 和负跳 毛刺凹,而时延可以细分为上升时延d r 和下降时延d f 。我们定义出现时延或者毛刺问题的互连为“受 害者”( v i c t i m ) ,而耦合信号给v i c t i m 的互连称为“侵犯者”( a g g r e s s o r ) 。如果宽度为n 的总线中 某一条指定为v i c t i m ,为了考察其它互连对它的最大影响,可以指定其它互连都为a i 翌s o r ,这也 就是m a 模型的含义,显然该方法的测试复杂度降到了o ( n ) 。如图2 - 1 4 ( b ) 所示,指定为v i c t i n i 并保持低电平,其它所有互连为a i 磐并同时产生上跳,当总线末端检测到一个1 时,即表明 该总线存在g p 故障。图2 q 4 ( b ) 显示了四种故障( g p ,g n ,d f ,d r ) 的激励产生方式,该模型的优点 在于只要o 个矢量就可以完成对总线所有串扰故障的测试,缩短了测试时间。 - o 者- 管 t i :一- = l 玑z ; 1 ; t q 占上j l 鬲| | t l 上二 图2 - 1 4 总线串扰测试的m a 模型 一1 9 - i i : z 、 j - : 二: 二一 明* “, - = l 。二- 曩乒m e zv 娃 1a 删e , s 土二 掣f 东南人学博上学位论文

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论