




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于基于 MIPSMIPS 架构的架构的 RISCRISC 微处理器微处理器 RM7000ARM7000A 摘要:摘要:概要介绍基于 MIPS 指令集的 RM7000A 微处理器的大容量片内缓存、超标量流水线、指令双发射、大量寄存器组等主要特性,并对其两种应用方案进行探讨。 ; mso-hansi-font-family: Times New Roman 关关键词:键词:RM7000A 微处理器 MIPS 架构 引引 言言 在众多类型的 RISC CPU 体系中,MIPS(Microprocessor without Interlocked Pipeline Stages)是相当成功的一种。自
2、从 1983 年 John Hennessy 在斯坦福大学成功地完成了第一个采用 RISC 理念的 MIPS 微处理器以来,基于 MIPS 构架的 CPU 在网络、通信、多媒体娱乐等领域得到了广泛应用。Cisco 的路由器,IBM 的网络彩色打印机,HP 的 4000、5000、8000、9000 系列激光打印机及扫描仪,Sony 的 Playstation 和 Playstation 2 游戏机等等,都是应用了实现不同 MIPS 指令集的微处理器的产品。 本身不生产微处理器,它只设计高性能工业级的32 位和 64 位 CPU 的结构体系,并且向其它半导体公司提供使用其内核(IP)的授权,用于
3、生产基于 MIPS 而又各具特色的微处理器。据 MIPS 公司网站介绍,现在已有超过 50 家公司申请了授权,其中不乏 IT 界著名的大企业,如:AMD、ATI、TI、NEC、Toshiba、Philips、PMC-Sierra、IDT、Quicklogic、Marvell 等。 1 RM7000A1 RM7000A 概述概述 是 PMC-Sierra 公司 RM7000 系列微处理器的一种,使用 CMOS 0.18m 艺制造而成,内含 2 个独立的 64 位整型单元和 1 个 64 位浮点单元;片内集成了主缓存和二级缓存以及外部扩展缓存控制器(最高支持 8MB 三级缓存);具有 1 个时钟周
4、期发射 2 条指令的功能;支持数据预取(Prefetch);最高工作频率可达 400MHz;可宽温工作,350MHz 工业级处理器工作温度为40+85。 该微处理器有以下主要特性。 (1)片内集成大容量主缓存和二级缓存 主缓存包括 16KB 指令缓存和 16KB 数据缓存。指缓和数缓都拥有各自的 64位读通道和 128 位写通道,并且允许指缓和数缓同时被访问。在 400MHz 时,主缓可以给整型单元和浮点型单元提供总计高达 6.4GB/s 的带宽。256KB 的二级缓存拥有一个 64 位的读/写共用通道,只有在访问主缓存发生未命中的情况下才会使用到。 主缓存和二级缓存均采用 4 路组相联。缓存
5、线长 32 字节,均为非阻塞式缓存(non-blocking cache),即在缓存访问产生未命中(cache miss),且这个未命中没有被消除的情况下,处理器无需停顿等待,可以继续进行缓存访问。RM7000A 允许最多有两个未命中时仍可访问缓存。只有在下面两种情况下,微处理器才会产生停顿:一是在前两个未命中还没消除,指令总线上又出现了对缓存的存取指令;二是产生了两个未命中,而随后的指令要从前面一个引起未命中的指令处获取数据才能继续执行。 (2)指令双发射机制(dual issue mechanism) 的指令分为四种类型:整数型、浮点型、分支转移(branch)和存/取(load/stor
6、e)。处理器整型部件的超标量分发单元含有两个独立的流水线:M-pipe(memory)和 F-pipe(function)。其中,F-pipe 处理整数型、分支转移和浮点操作,如加、减、乘、除等;M-pipe 负责整数型、存/取等操作,同时也进行一些浮点数在寄存器间的移动。指令双发射框图如图 1 所示。 如果每过一个时钟周期,每条流水线流出一条指令,在外部看来就有两条指令同时被执行。但是,在处理器中并不是总能做到双发射的,这跟具体的指令组合有关,比如:当一个指令要处理控制寄存器时,就不能和其它的指令同时发射。 (3)超标量流水线(superscalar pipeline) 包含一条 5 阶超标
7、量指令流水线(度 m=2),供 M-pipe 和 F-pipe使用。每条指令被划分为 5 个子过程:I 为取指令,R 为取寄存器数,A 为执行,D 为取数据,W 为写回,如图 2 所示。 配合指令的双发射机制,每过一拍,流水线都要流入两条新的指令。在满负荷的情况下,可以有 10 条指令在流水线不同的部件上同时运行,相当于提高了工作频率。 在 RM7000A 中,实际上还存在一个 7 阶流水线单独处理浮点操作,不过,这个流水线对用户来说是完全透明的。 (4)寄存器组(register files) 含有众多的寄存器。 整型操作寄存器组。位于整型单元中,包括 32 个 64 位的通用寄存器(GPR
8、),2 个专用于整型乘、除运算的寄存器 Hi 和 Lo,1 个程序计数器 PC(对用户透明)。其中通用寄存器的 r0 被硬连接为 0。它可以作为目的寄存器存放指令以后会舍弃的暂时结果,也可以根据需要为指令提供 0 作为操作数。 浮点操作寄存器组。包含 32 个 64 位的浮点通用寄存器(FGR)和 32 个32 位控制寄存器。 系统控制寄存器组(CP0)。用于内存管理调度、地址转换、异常处理等。 (5)集成、高效的内存管理单元 为快速将虚拟地址转换成物理地址,RM7000A 使用一个大容量的全相联TLB(Translation Lookaside Buffer,如图 3 所示)来实现这个目标。
9、这个TLB 被指令和数据共用,称为 JTLB(Joint TLB);可以配置成 48 对或 64 对入口,分别映射 96 页或 128 页的虚拟地址。页面的大小可配置,从小到大依次为4K、16K、64K、256K、1M、4M、16M。当发生 TLB 未命中时,RM7000A 采用的替换算法主要是随机替换,以简化硬件设计。同时 也提供锁定特定地址机制,以便操作系统为提高性能而让一些页面持续被映射。 ASIDAddress Space Identifier,虚拟空间标识符,表示内核态(kernel)、管态(supervisor)、用户态(user)三种虚拟空间。 GGlobal,每个 TLB 入口
10、都有的标识符。 (6)指令格式及寻址方式 需要注意的一点是:尽管 RM7000A 是 64 位的微处理器,但它的指令长度都是固定的 32 位。 是一种典型的寄存器型(Register-Register)微处理器,即除了load/store 指令外,其它的指令不能直接访问内存。这样的好处显而易见:寄存器的访问速度比存储器快得多,寄存器存储使得编译器的效率提高,于是程序的执行速度加快;另外,表示寄存器的位数比表示内存单元的位数要少,从而可以改善指令密度。 类的指令可以用三种形式表示。 MIPS 构架支持两种寻址方式。 立即数寻址(immediate)。例如:Add R1,#10,这里#10 的代表
11、常数10,指令含义是 RegsR1egsR1+10。 位移寻址(displacement)。例如:Add R1,10(R2),指令含义是RegsR1egsR1+Mem10+Regs2。 对操作数稍做改变,可以得到另外两种寻址方式。 Add R1,(R2) RegsR1RegsR1+MemRegsR2 寄存器 R2 存放的只是一个地址,这个地址的内容才是要取的数据,这相当于寄存器间接寻址。 Add R1,10 RegsR1RegsR1+Mem10 此时第二个寄存器必须是 r0,借助于 r0(如前所述,r0 被硬接位 0)提供的 0,就得到了直接寻址方式。 因此,实际上微处理器有四种寻址方式可用,
12、提高了编程的灵活性。 (7)数据类型 体系对于对齐(align)有着相当严格的要求,指令必须 32 位对齐;超过一个字节的数据必须按规则对齐: 半字的边界要与偶数对齐; 字的边界要与 mod 4=0 的字节对齐; 双字的边界要与 mod 8=0 的字节对齐。 如图 4 所示,是数据对齐示意图。采用这种方式对齐可以简化硬件判断、控制部分的设计,节省芯片空间,也有利于加快程序运行速度。 2 2 应用及实现探讨应用及实现探讨 以 RM7000A 为基础,配合不同的外围器件,可以构成多种应用形式。 (1)典型应用 图 5 所示是一种较为简单的应用方式,特点是器件少、可靠性好、整个系统所占空间很小,适合
13、于空间受到限制的领域。因为需要识别和驱动的设备不多,引导和应用程序都相对简单;通过 Dual UART 接口可以和主计算机通信,并且在主计算机的超级终端里显示本系统运行的信息,如图 6 所示。 具体应用: 可以作为单独的电脑板,配以适当的外设,构成一个小型的高速计算机系统,用于完成比较简单且单一的任务; 可以根据应用的要求,增加总线的控制芯片和接口,作为一个总线上的CPU 控制板(比如:PCI 总线、CompactPCI 总线),配合传感器或其它板卡如AD/DA 板、DSP 通信板等,进行测试、高速数据采集、大量的图形图像处理等工作; 用于其它网络设备中,如大型的路由器、交换机等。 (2)扩展应用 上述应用中,为减小体积,存储容量受到了限制,也没有提供类似键盘鼠标的对外接口。而人们已经习惯了 PC 的使用,总是希望能够以比较熟悉的方式来操作其它系统。对上述应用做适当的扩展,就可以达到近似于 PC 的结构,应用框图如图 7 所示。 通过增加南桥、超级 I/O 等芯片,就可以获得类似于 PC 结构中的各种接口。具体应用如下: 作为开发板,测试、移植在 MIP
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 打桩机司机岗位面试问题及答案
- 安徽省宿州市五校2025年高一下化学期末调研试题含解析
- 2025届云南省大姚一中高二下化学期末学业质量监测试题含解析
- 吉林省延边州汪清县四中2025届高一下化学期末调研模拟试题含解析
- 广东华南师大附中2025届高一下化学期末监测模拟试题含解析
- 晋城公墓管理暂行办法
- 昭通墓地管理暂行办法
- 合肥社区人员管理办法
- 机械维修制度管理办法
- 趣味性与原动力在学习和生活中的作用研究
- 义务教育新课标必背古诗词135篇
- 营养专科护士总结汇报
- 热射病科普宣传
- 6S视觉管理之定置划线颜色管理及标准样式
- 数字资产的监管框架
- DL∕T 5783-2019 水电水利地下工程地质超前预报技术规程
- 2024年中华全国律师协会招聘5人历年(高频重点复习提升训练)共500题附带答案详解
- 100MW400MWh全钒液流电池储能电站项目可行性研究报告写作模板-拿地申报
- 老版入团志愿书表格完整
- 四柱万能液压机液压系统 (1)讲解
- 档案管理借阅制度
评论
0/150
提交评论