




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、12011-03-09http:/ research laboratory2011-03-09http:/ 基本性能指标 加速比定律china research laboratory2011-03-09http:/ 基本性能指标 加速比定律china research laboratory2011-03-09http:/ 延迟:处理器向内存发起访问直至获取数据所需要的时间 带宽:内存系统向处理器传输数据的速率china research laboratory2011-03-09http:/ 加仑的水,那么这个水管的 “ 带宽 ” 就是 5加仑 /秒。如果想立刻扑灭火灾,那么更重要是减少延迟的时
2、间。如果是希望扑灭更大的火,那么需要更高的带宽。china research laboratory2011-03-09http:/ (1纳秒时钟)运行,与之相连的dram 有100纳秒的延迟(没有高速缓存)。假设处理器有两个 multiply-add 部件,在每 1纳秒的周期内能执行4条指令。 处理器的峰值是4gflops 。 由于内存延迟是100 个周期,并且块大小为一个字(word ),每次处理内存访问请求时,处理器必须要等待100个周期,才能够获得数据。2china research laboratory2011-03-09http:/ 计算点积对每对向量元素进行一次乘法-加法运算,即每
3、一次浮点运算需要取一次数据。 此计算的峰值速度的限制是,每100纳秒才能够进行一次浮点计算,速度为10mflops ,只是处理器峰值速度的很小一部分。china research laboratory2011-03-09http:/ 之间的更小但更快的内存单元。这种内存是低延迟高带宽的存储器。如果某块数据被重复使用,高速缓存就能减少内存系统的有效延迟由高速缓存提供的数据份额称为高速缓存命中率(hit ratio )高速缓存命中率严重影响内存受限程序的性能。china research laboratory2011-03-09http:/ research laboratory2011-03-0
4、9http:/ ,延迟时间为 1纳秒(或1个周期)的高速缓存。使用此系统来计算矩阵乘法,两个矩阵a和b的维数为32 32。 之所以选择这个大小,是为了能够将a、b两个矩阵以及结果矩阵都放入高速缓存中。china research laboratory2011-03-09http:/ 将两个矩阵取到高速缓存中等同于取2k个字,需要大约200 s 。 两个n n 的矩阵乘需要 2n3步计算。在本例中,需要64k步计算,如果每个周期执行4条指令,则需要 16k 个周期,即 16 s。 总计算时间大约是加载存储时间以及计算时间之和,即200 + 16 s。 峰值计算速度为 64k/216 =303 m
5、flops。china research laboratory2011-03-09http:/ 时间本地性 (temporal locality)”对于高速缓存的性能来说,数据的重复使用至关重要。3china research laboratory2011-03-09http:/ 可以通过增加内存块的大小来提高带宽。底层系统在l时间单位内 (l为系统的延迟 )存取 b单位的数据 (b为块大小 )china research laboratory2011-03-09http:/ 4个字。同样考虑点积计算: 假定向量数据在内存中线性排列,则在200个周期内能够执行 8flops(4 次乘法 -加法
6、) 这是因为每一次内存访问取出向量中4个连续的字 因此,两次连续访问能够取出每个向量中的4个元素。 这就相当于每 25ns 执行一次 flop ,即峰值速度为40mflops 。china research laboratory2011-03-09http:/ 128位) 实际上,构建这样的宽总线的代价是昂贵的。在更切实可行的系统中,得到第一个字后,连续的字在紧接着的总线周期里被送到内存总线。china research laboratory2011-03-09http:/ spatial locality ) 如果以数据布局为中心,那么计算的步骤应该确保连接的计算使用连接的数据china r
7、esearch laboratory2011-03-09http:/ 利用应用程序的空间本地性与时间本地性对于减少内存延迟及提高有效内存带宽非常重要。 计算次数与内存访问次数的比是一个很好的预测内存带宽的承受程序的指标。 内存的布局以及合理组织计算次序能对空间本地性和时间本地性产生重大影响。china research laboratory2011-03-09http:/ , a行b列java,a行b行java,a行b列2.93ghz intel 处理器, 1m 高速缓存, 512m 主存( 533mhz )4china research laboratory2011-03-09http:/ 基本性能指标 加速比定律china research laboratory2011-03-09http:/ 和n i 加速均比amdahl 加速
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 独家提炼的2024税务师考试试题及答案
- 2024年二级建造师考试面临挑战试题及答案
- 二级建造师考试自我检查表试题及答案
- 幼儿园简短课件
- 2024年多媒体设计师考试考题秘籍试题及答案
- 第10课-2023-2024学年初中信息技术七年级上册(人教版)-教学设计-建立统计图表
- 心外科病人的术后护理
- 礼品美学包装行业深度调研及发展战略咨询报告
- 环保教材循环使用系统行业跨境出海战略研究报告
- 整合调酒师考试资源及试题与答案2024
- 2025年四川省建筑安全员C证(专职安全员)考试题库
- 2025年美丽中国第六届全国国家版图知识竞赛题库及答案(中小学组)
- 2024-2025学年北师大版数学七年级下第一次月考模拟练习(含答案)
- 2025年上半年芜湖市国企招聘易考易错模拟试题(共500题)试卷后附参考答案
- 2024年四川成都中考满分作文《爱拼才会赢》
- 2025年围手术期试题及答案三基
- 《婴幼儿心理发展》课件-任务一 婴幼儿心理学的研究对象与研究
- 劳务外包服务投标方案(技术标)
- 《中医体重管理临床指南》
- 【MOOC】创业基础-暨南大学 中国大学慕课MOOC答案
- 坐标纸(A4纸直接打印就可用)
评论
0/150
提交评论