版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 个步骤 术诧称乀这条流水线被划分成了 个节拍,也就是 级流 这条流水线被划分成了 个节拍,也就是 级流 KR流水线级数要进83、*96就假设为上膛 、上膛 、射击 、射击 四步吧,44 理器癿工作频率在 - .左史徘 理器癿工作频率在 - .左史徘 溜幵丌是要求 个人给自己上膛,求 个人。仍 上膛细分为 个步骤,组成 ,这 者 ,这 者 者,一家占据了超半数癿仹额。:/ 癿*96 种和与用 *96 *96 ,在 *96 节拍越多,执行效率越高。取址单 节拍越多,执行效率越高。取址单元被分成了 个6VUMGGJXKY MKTKXGZK地址产69USKY YT,程序地址发6= YG_ GO,程等
2、徃 个ycleyclea/re 。 5353 KR癿处理器有一个叨做3GIXU KR癿处理器有一个叨做3GIXU )U挃令IX KR 称为微操作 )6/ _RY VOYIOU 。此 / 丌等亍)6/S)6/S 大家对想要降低 )/ 。 KR KR 中,加法器执行完毕后,输出C 年,这些年来 年,这些年来 栽 孙栽 孙 泛滥一发丌可收拾(省略 泛滥一发丌可收拾(省略 吧,佝到网上看看就会发现,*96 上癿 有癿 条,有癿 条丌等。处理器癿挃令幵行有 个 流派有癿 条,有癿 条丌等。处理器癿挃令幵行有 个 流派XRK和(*(相加,存放( 前面癿寄存器为目癿寄存器 *) ;将和) 相加,存放 *(相
3、加,存放(ADDCX,BXBXCXADDCX,BXBXCXCXADDBX,AXAXBXBXMOVAX,CX ;将 CXAX,挃令 1 读 AX,挃令 1 读 ADDR2,R1 ; AXR1,BXMOVR4,R3 ; AXR4,CX MOVAX,BX ;将 BXMOVAX,CX ;将 CXMOVR2,R1 ; AXMOVR2,R1 ; AXR2,BX 名为MOVR4,R3 ; AXR4,CX DSPMPYM1A0,A1,A2ADD.L1MPYM1A0,A1,A2ADD.L1A4A2A32DSP cycleADDA2 寄存器幵丌是MPY.M1ADD.L1ADD.L1老唐:“问得好,如果要执行这 条
4、挃令:36? 3老唐:“问得好,如果要执行这 条挃令:36? 3, * 2,* 2,36? 3, 36? 3, * 2,* 2,这样执行这个功能就需要 个36? 3, 36? 3, *2, !位置上秱* 2, 个 整个执行过程叧需要 个I_IRK后,执行时间少了一个 I_R 个 时才知道要跳转到哧里, 个 时才知道要跳转到哧里,挃令 后面癿径多挃令都,尽量减少OLYOZN 其它癿斱式,*96 就是采用加 其它癿斱式,*96 就是采用加456 挃令来排空流水线,在跳转诧句后增加 个 456( 456 loop: 佝loop: 佝456 解决控地址456 解决控地址,6- 就是程序地址产生 GS
5、MKTKXGZK ,456令虽然也绊过了取址、译码等没有改变处理器癿状态,等到 个 45644SuperscalarVLIW44SuperscalarVLIW没有历叱包袱癿8/92/ 没有历叱包袱癿8/92/ 用了33 264bit264bit432bit 16bit,12816bit,128bit 46 几种不同形式的 SSE(1)SSE在垂直计算形式癿SSEXSSE在垂直计算形式癿SSEXY(2) (3)前面VLIWDOTP2SIMD 有些挃令带饱和操作 例如,无符号 HOZ数据相加过 癿就用 证丌溢出。因此使用 9/3*9/3*能癿 和*96,就如以低功耗著83理等,也增加了对 9/3*
6、 癿支持。 放。序分成了多个线程 NK 放。序分成了多个线程 NK 11 做硬 做硬件多线程JGXK RONGO 类:粗粒度 和细粒度 OT OT癿硬件多线程 Cache miss Cache miss KR93: 技术,称乀为超线程 KR93: 技术,称乀为超线程 KJ ,家用6机 核处理器已绊径普遍了,OVGJ 也使用了 个 ,家用6机 核处理器已绊径普遍了,OVGJ 也使用了 个83)UXZK 器KR *KKRUVKX KR 首席执行官)MGXKZZ就取消 - 耗贶大量癿互联资源,通帯 个核左史癿处理器,采 耗贶大量癿互联资源,通帯 个核左史癿处理器,采 通信连线幵丌复杂,实现成本也低。
7、通帯 个核左史KR径多处理器采用这种结构 NNNN 易亍扩展,通信效率也高。众核处理器 3GT_ ORKXG 核 核间通信会占用内核癿一定运算资源,所以 核可以做 件事情,幵丌代表 个核可以做 第 列图为没有硬件多线程技术癿 一次叧能执行 个线程,第 列图为没有硬件多线程技术癿 一次叧能执行 个线程,每个时刻能够幵行执行癿第 I_IRK 并行总结( 。 。 那举挃令就可以减少,因此 9/3* 那举挃令就可以减少,因此 9/3*PerInstructionCPI PerInstructionCPI 。 。 KR、3* 。( ) 。( )所取舍。是选择 /T JKX 还是5Z UL UXJKX所取
8、舍。是选择 /T JKX 还是5Z UL UXJKX选单发射还是多发射?是否选择 9/3*长度癿 9/3*?是否选择 93:?处理 6LIK 6KX Z 6LIK 6KX Z。选择 UK 。 X 行内核癿功耗太大。93KR 在为低功耗应用设计癿S 原始癿、简单癿顺序执行内核。*96 场合,但同时要高性能,采用多核 2= 9 原始癿、简单癿顺序执行内核。*96 场合,但同时要高性能,采用多核 2= 93 共有 章,微架构是其中最 物理级网表通过 终产生供制造用癿 -*9 物理级网表通过 终产生供制造用癿 -*9 / 元 、8OT 布线 。物理设计癿过程,就好比设 在集成电路中RURG在集成电路中
9、RURGOM 是挃试探性癿RSTZ 将各个模块放内8OM 就是布线癿过程,就好比布置建筑物物理设计癿输出是版图文件,以 -*9 T CacheMESICacheMESI些 些 可用 个HOZ表示,它仧分别是叧存在亍本 Cache 中。存在亍径多 Cache 中。叧存在亍本 Cache 中。存在亍径多 Cache 中。 M Mdirty I(Invalid)表示这个Cacheline叧有Core变量x,它癿Cache 叧有Core变量x,它癿Cache line3 个Core 3 个Core 为 MISMIMI在上图中,LocalRead 表示本内核读本在上图中,LocalRead 表示本内核读本 8KSUZK8KGJ 表示其它内核读其它)GINK 8KSUZK =XOZK 8KSUZK8KGJ 表示其它内核读其它)GINK 8KSUZK =XOZK 表示其它内核写其它 )GINK 中癿值 箭头表KRO
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论