下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、北 京 科 技 大 学高等计算机体系结构文献综述题目:GPU 的发展研究学院计算机与通信工程学院班级124 班学号s2*姓名陈希时间2012年11月02一、 引言随着半导体工艺的发展, 芯片上集成的晶体管数目按照摩尔定律增加, 各种处理器的存储和计算能力也因此不断提高。作为最常用的两类处理器芯片, CPU 和GPU 的性能发展呈现不同的规律。CPU 是计算机的主控处理部件, 需要应对各种复杂的控制过程, 追求的标量性能, 注重通用性, 因此在其芯片体系结构设计时, 不得不将大量的芯片资源用于分支预测、乱序执行等复杂的控制逻辑, 从而限制了其计算性能的提升。而 GPU 原本只负责加速图形计算,
2、功能相对比较单一, 芯片的控制逻辑比较简单, 主要的芯片资源都用于提升计算性能, 因此其计算能力发展更为迅速。例如, AMD2009GPUFireSt ream 9270 11.2T Flo ps,IntelEx tr eme 965096GFlo ps, 可见在计算性能方面,GPUCPU 整整一个数量级。计算性能增长的同时, GPU 的存储性能也在不断提升, 2 4GB 的存储容量、256 512GPU 发挥出强大的 计/ 价比和性能/ 功耗比上看, GPUCPUGPU 成为搭建超级计算机GPU 仅负 责图形加速, 流水线的功能固定, 只能执行有限的几个操作以完成图像的生成。硬件工GPU 内
3、处理单元的结构越来越复杂, 功能也越来越灵活, 其流水线具备了执行用户自定义程序的能力, 从而具备了初步的可编程性。从最初的底层图形APICUDA 2 、Broo k + 3OpenCL 4GPU 简称GPGPU 5 ) 也成为体系结构、编程及编译等领域热点的研究方向之一。二、 协同并行计算研究进展GPUGPU(Graphic ProcessingUnit),中文翻译为“图形处理器”。GPU CPU要一个专门的图形的核心处理器。GPU2D3DGPU 使显卡减少C P UCPU3DGPU T&L256T&LG P U 的标志。TLLighting,光影转换。在图形加速卡中,TL最大功能是处理图形
4、的整体角度旋转以及光源阴影等三维效果。3D3DTransforming3D一般来说,TLnVidiaGeForce 225003000纹理压缩中将压缩后的数据存储进显存并不是终结。重要的是需要用显示芯3D完成纹理压缩,也不能发挥出纹理压缩的优势。凹凸贴图(bump mapping),又称为皱面贴图,是一项计算机图形学技术, 在这项技术中每个待渲染的像素在计算照明之前都要加上一个从高度图中找到的扰动。这样得到的结果表面表现更加丰富、细致,更加接近物体在自然界本身的模样协同计算概念协同并行计算,其关键在于如何实现两者的高效“协同”。从国内外大量的研究工作来看,“协同”分为两个层次:)仅负责管理 的
5、工作,为 提供数据并接收传回的数据,由 承担整个计算任务;)除管理外,还负责一部分计算任务,与 共同完成计算。第一层次的“协同”比较简单, 与 间分工明确,但浪费了宝贵的计算资源。如 的处理器具有个核心,因此也具有强大的计算能力。可见,第二层次的“协同”是未来协同并行计算的发展方向三、 GPGPU 体系结构GPUAMD、NVIDIAIntelGPU 的核心体系结构。AMD: APU为进一步提升处理器的工作效率, AMDCPUGPU 的核心进行融合( Fusion)APU 7 ( Accelerated Processing Unit s)以加速多媒体和向量处理能力。业界有观点认为, 这种融合的
6、体系结构是未来处理器的发展方向。图 1 AMD APU 结构示意图从图 1 可以看出, APU 处理器将多核的 x 86 CPU 核心、GPU 处理器核心( SIMDCPUGPU总线的问题。NVIDIA: FermiFermiNVIDIAGPU, 提供了强大的双精度浮点计算能力。FermiGPUFermiGPUECC 校验的功能; 其次, FermiGPUShared Memory 作为片上存储层次外, 还首次引入了通用的Cache, 以更好地支持通用计算。FermiCacheSML1 CacheSML2 Cache。此外, FermiShared Memory可以通过配置互相转化。最后, F
7、ermiKernel图 2 NVIDIA Fermi 体系结构示意图2Fermi16SM,L2 CacheSML1 Cache、寄存器文件等私有存储资源, 32 个流处理DRAM、Host调度等接口。值得注意的是, FermiGPUSM8 个流处理核GT 200,4w arp,Fermi322warp, 极大提升了线程发射效率。四、 CUDA 简介CU DA 全称统一计算设备框架( Compute UnifiedDevice Architecture, 简称CU DANVIDIAGPUGPGPUC 语CUDAhost 端和deviceCPUGPU 上的部分, 这部分代码称为核心( Kernel
8、) 函数。CPUCPU 代码将计算结果拷贝回主存。在 CU DA 计算模型下, GPU 执行的最小单位是线程, 多个线程组成一个线程块, 线程块中线程可以共享一片存储器, 并以任意顺序执行, 在硬件资源受限的情况下甚至可以串行执行。一个核心程序由一个或多个线程块组成, 一个应用则由若干个核心程序构成。图 3 CUDA 计算模型示意图CUDA 体系结构的组成来说, 包含了三个部分: 开发库、运行期环境和驱CUDACUDA1.1C U FFCUBLAS (离散基本线性计算) 的实现。这两个数学运算库所解决的是典型的大规模的并行计算问题, C U DA 的技术基础上实现出C UDACU 上的宿主代码, G p UGPGPU五、 参考文献 1 GPGPU 技术研究与发展 2 CUDAGPGPU3Glaskow sky P N. NVIDIAs Ferm
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度LED屏幕亮度调节与节能改造合同
- 2024年度知识产权保护合同:MLB棒球帽正品知识分享
- 2024年度物业服务合同标的及安全生产责任书
- 2024年多功能空调维修合作协议
- 2024装修合同该如何写范文
- 2024办公家具购买合同
- 2024年城市基础设施建设合同 with 工程质量与投资预算
- 2024年出版发行代理合同
- 【初中生物】脊椎动物(第2课时两栖动物和爬行动物) 2024-2025学年七年级生物上学期(人教版2024)
- 2024加工贸易合同
- 超市营运培训教案公开课
- 尊重学术道德遵守学术规范学习通超星期末考试答案章节答案2024年
- GB/T 44693.2-2024危险化学品企业工艺平稳性第2部分:控制回路性能评估与优化技术规范
- 2024年新华社招聘笔试参考题库附带答案详解
- 肺癌(肺恶性肿瘤)中医临床路径
- 天津市2023-2024学年高一上学期语文期中考试试卷(含答案)
- 证券投资学期末考试卷及答案2套
- 十七个岗位安全操作规程手册
- 12 光的传播 (教学设计)-2023-2024学年五年级上册科学人教鄂教版
- 3.9.1 增强安全意识-2024-2025学年初中道德与法治七年级上册上课课件
- 2024年“泰山杯”山东省网络安全职业技能竞赛理论试题库(含答案)
评论
0/150
提交评论