计算机组成与设计(第五版)_第1页
计算机组成与设计(第五版)_第2页
计算机组成与设计(第五版)_第3页
计算机组成与设计(第五版)_第4页
计算机组成与设计(第五版)_第5页
已阅读5页,还剩476页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机组成与设计硬件/软件接口目录第1章计算机概要与技术11.1引言11.1.1计算应用的分类及其特性21.1.2欢迎来到后PC时代31.1.3你能从本书学到什么41.2计算机系统结构中的8个伟大思想61.2.1面向摩尔定律的设计61.2.2使用抽象简化设计61.2.3加速大概率事件61.2.4通过并行提高性能71.2.5通过流水线提高性能71.2.6通过预测提高性能71.2.7存储器层次71.2.8通过冗余提高可靠性71.3程序概念入门71.4硬件概念入门101.4.1显示器111.4.2触摸屏121.4.3打开机箱121.4.4数据安全151.4.5与其他计算机通信161.5处理器和存储器制造技术171.6性能201.6.1性能的定义201.6.2性能的度量221.6.3CPU性能及其因素231.6.4指令的性能241.6.5经典的CPU性能公式251.7功耗墙271.8沧海巨变:从单处理器向多处理器转变291.9实例:IntelCorei7基准311.9.1SPECCPU基准测试程序311.9.2SPEC功耗基准测试程序321.10谬误与陷阱331.11本章小结351.12历史观点和拓展阅读361.13练习题36第2章指令:计算机的语言402.1引言402.2计算机硬件的操作432.3计算机硬件的操作数442.3.1存储器操作数452.3.2常数或立即数操作数472.4有符号数和无符号数482.5计算机中指令的表示532.6逻辑操作582.7决策指令602.7.1循环612.7.2case/switch语句632.8计算机硬件对过程的支持642.8.1使用更多的寄存器662.8.2嵌套过程672.8.3在栈中为新数据分配空间692.8.4在堆中为新数据分配空间702.9人机交互722.10MIPS中32位立即数和寻址752.10.132位立即数752.10.2分支和跳转中的寻址762.10.3MIPS寻址模式总结782.10.4机器语言解码792.11并行与指令:同步812.12翻译并执行程序832.12.1编译器832.12.2汇编器842.12.3链接器852.12.4加载器872.12.5动态链接库872.12.6启动一个Java程序892.13以一个C排序程序作为完整的例子902.13.1swap过程902.13.2sort过程912.14数组与指针962.14.1用数组实现clear962.14.2用指针实现clear972.14.3比较两个版本的clear972.15高级内容:编译C语言和解释Java语言982.16实例:ARMv7(32位)指令集982.16.1寻址模式992.16.2比较和条件分支1002.16.3ARM的特色1002.17实例:x86指令集1022.17.1Intelx86的改进1022.17.2x86寄存器和数据寻址模式1032.17.3x86整数操作1052.17.4x86指令编码1072.17.5x86总结1082.18实例:ARMv8(64位)指令集1082.19谬误与陷阱1092.20本章小结1102.21历史观点和拓展阅读1112.22练习题112第3章计算机的算术运算1173.1引言1173.2加法和减法1173.3乘法1213.3.1顺序的乘法算法和硬件1213.3.2有符号乘法1243.3.3更快速的乘法1243.3.4MIPS中的乘法1243.3.5小结1253.4除法1253.4.1除法算法及其硬件结构1253.4.2有符号除法1283.4.3更快速的除法1283.4.4MIPS中的除法1293.4.5小结1293.5浮点运算1303.5.1浮点表示1313.5.2浮点加法1353.5.3浮点乘法1383.5.4MIPS中的浮点指令1393.5.5算术精确性1453.5.6小结1463.6并行性和计算机算术:子字并行1483.7实例:x86中流处理SIMD扩展和高级向量扩展1493.8加速:子字并行和矩阵乘法1503.9谬误与陷阱1533.10本章小结1553.11历史观点和拓展阅读1583.12练习题159第4章处理器1624.1引言1624.2逻辑设计的一般方法1654.3建立数据通路1674.4一个简单的实现机制1734.4.1ALU控制1734.4.2主控制单元的设计1754.4.3为什么不使用单周期实现方式1814.5流水线概述1824.5.1面向流水线的指令集设计1864.5.2流水线冒险1864.5.3对流水线概述的小结1914.6流水线数据通路及其控制1924.6.1图形化表示的流水线2004.6.2流水线控制2034.7数据冒险:旁路与阻塞2064.8控制冒险2144.8.1假定分支不发生2154.8.2缩短分支的延迟2154.8.3动态分支预测2164.8.4流水线小结2204.9异常2214.9.1MIPS体系结构中的异常处理2214.9.2在流水线实现中的异常2224.10指令级并行2264.10.1推测的概念2274.10.2静态多发射处理器2274.10.3动态多发射处理器2314.10.4能耗效率与高级流水线2334.11实例:ARMCortex-A8和IntelCorei7流水线2344.11.1ARMCortex-A82354.11.2IntelCorei79202364.11.3IntelCorei7920的性能2384.12运行更快:指令级并行和矩阵乘法2404.13高级主题:通过硬件设计语言描述和建模流水线来介绍数字设计以及更多流水线示例2424.14谬误与陷阱2424.15本章小结2434.16历史观点和拓展阅读2434.17练习题243第5章大容量和高速度:开发存储器层次结构2525.1引言2525.2存储器技术2555.2.1SRAM技术2565.2.2DRAM技术2565.2.3闪存2585.2.4\t"/item/%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%BB%84%E6%88%90%E4%B8%8E%E8%AE%BE%E8%AE%A1%EF%BC%9A%E7%A1%AC%E4%BB%B6%2F%E8%BD%AF%E4%BB%B6%E6%8E%A5%E5%8F%A3%EF%BC%88%E5%8E%9F%E4%B9%A6%E7%AC%AC5%E7%89%88%EF%BC%89/_blank"磁盘存储器2585.3cache的基本原理2595.3.1cache访问2615.3.2cache缺失处理2655.3.3写操作处理2665.3.4一个cache的例子:内置FastMATH处理器2675.3.5小结2695.4cache性能的评估和改进2705.4.1通过更灵活地放置块来减少cache缺失2725.4.2在cache中查找一个块2755.4.3替换块的选择2765.4.4使用多级\t"/item/%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%BB%84%E6%88%90%E4%B8%8E%E8%AE%BE%E8%AE%A1%EF%BC%9A%E7%A1%AC%E4%BB%B6%2F%E8%BD%AF%E4%BB%B6%E6%8E%A5%E5%8F%A3%EF%BC%88%E5%8E%9F%E4%B9%A6%E7%AC%AC5%E7%89%88%EF%BC%89/_blank"cache结构减少缺失代价2775.4.5通过分块进行软件优化2805.4.6小结2835.5可信存储器层次2835.5.1失效的定义2835.5.2纠正一位错、检测两位错的汉明编码(SEC/DED)2845.6虚拟机2875.6.1\t"/item/%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%BB%84%E6%88%90%E4%B8%8E%E8%AE%BE%E8%AE%A1%EF%BC%9A%E7%A1%AC%E4%BB%B6%2F%E8%BD%AF%E4%BB%B6%E6%8E%A5%E5%8F%A3%EF%BC%88%E5%8E%9F%E4%B9%A6%E7%AC%AC5%E7%89%88%EF%BC%89/_blank"虚拟机监视器的必备条件2895.6.2指令集系统结构(缺乏)对虚拟机的支持2895.6.3保护和指令集系统结构2895.7\t"/item/%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%BB%84%E6%88%90%E4%B8%8E%E8%AE%BE%E8%AE%A1%EF%BC%9A%E7%A1%AC%E4%BB%B6%2F%E8%BD%AF%E4%BB%B6%E6%8E%A5%E5%8F%A3%EF%BC%88%E5%8E%9F%E4%B9%A6%E7%AC%AC5%E7%89%88%EF%BC%89/_blank"虚拟存储器2905.7.1页的存放和查找2935.7.2缺页故障2945.7.3关于写2975.7.4加快地址转换:TLB2975.7.5集成虚拟存储器、TLB和cache3005.7.6虚拟存储器中的保护3025.7.7处理TLB缺失和缺页3035.7.8小结3075.8存储器层次结构的一般框架3095.8.1问题1:一个块可以被放在何处3095.8.2问题2:如何找到一个块3105.8.3问题3:当cache缺失时替换哪一块3115.8.4问题4:写操作如何处理3115.8.53C:一种理解存储器层次结构行为的直观模型3125.9使用\t"/item/%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%BB%84%E6%88%90%E4%B8%8E%E8%AE%BE%E8%AE%A1%EF%BC%9A%E7%A1%AC%E4%BB%B6%2F%E8%BD%AF%E4%BB%B6%E6%8E%A5%E5%8F%A3%EF%BC%88%E5%8E%9F%E4%B9%A6%E7%AC%AC5%E7%89%88%EF%BC%89/_blank"有限状态机来控制简单的cache3145.9.1一个简单的cache3145.9.2有限状态机3155.9.3一个简单的cache控制器的有限状态机3165.10并行与存储器层次结构:cache一致性3175.10.1实现一致性的基本方案3185.10.2监听协议3195.11并行与存储器层次结构:冗余廉价磁盘阵列3205.12高级内容:实现cache控制器3205.13实例:ARMCortex-A8和IntelCorei7的存储器层次结构3205.14运行更快:cache分块和矩阵乘法3245.15谬误和陷阱3265.16本章小结3295.17历史观点和拓展阅读3295.18练习题329第6章从客户端到云的\t"/item/%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%BB%84%E6%88%90%E4%B8%8E%E8%AE%BE%E8%AE%A1%EF%BC%9A%E7%A1%AC%E4%BB%B6%2F%E8%BD%AF%E4%BB%B6%E6%8E%A5%E5%8F%A3%EF%BC%88%E5%8E%9F%E4%B9%A6%E7%AC%AC5%E7%89%88%EF%BC%89/_blank"并行处理器3406.1引言3406.2创建并行处理程序的难点3426.3SISD、MIMD、SIMD、SPMD和向量机3456.3.1在x86中的SIMD:多媒体扩展3466.3.2向量机3466.3.3向量与标量的对比3476.3.4向量与多媒体扩展的对比3486.4硬件多线程3506.5多核和其他共享内存多处理器3526.6图形处理单元简介3556.6.1NVIDIAGPU体系结构简介3566.6.2NVIDIAGPU存储结构3576.6.3GPU展望3586.7集群、仓储级计算机和其他消息传递多处理器3606.8多处理器网络拓

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论