




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1.多核编程,2008年8月18日,2。教材,主教材:多核程序设计,ISBN 9-787302-158356,清华大学出版社,2007年8月,参考书:多核程序设计技术-通过软件多线程提升性能,电子工业出版社,ISBN 9787121038716,2007,3硬件:英特尔多核计算机:双核2软件:Visual studio 2003/2005英特尔编译器10.0 Linux操作系统英特尔MKL 9.1 Linux操作系统英特尔线程1945年,世界上第一台全自动电子数字计算机ENIAC计算机的发展按硬件技术可分为第一代(19461958年):电子管数字计算机。第二代(19581964):晶体管数字计
2、算机。第三代(19641971):集成电路数字计算机。第四代(1971年以后):大规模集成电路数字计算机。1971年,第一个微处理器4004在1978年,英特尔8086在1979年,英特尔在1981年开发了8088,IBM在1982年在其个人电脑中使用了8088芯片,英特尔在1985年10月17日开发了80286微处理器。英特尔80386 DX于1989年正式发布,英特尔于1993年推出80486芯片,新一代586处理器于1996年底问世,多功能奔腾MMX 1998、奔腾II奔腾II、至强微处理器至强、赛扬于1999年春天问世。英特尔公司的奔腾3在2000年,英特尔公司的奔腾4在2002年,英
3、特尔超线程技术(超线程,超线程)在2005年4月18日,英特尔在全球推出奔腾d处理器,8。指令集的改变,提高计算机在多媒体和3D图形方面的应用能力MMX 57多媒体指令SSE 3D NOW!在3D加速指令集中,9,2多核技术是处理器发展的必然,而推动微处理器性能不断提高的因素,如半导体技术的快速进步和体系结构的不断发展,相互影响,促进了工艺和电路技术的发展,使处理器性能提高了20倍左右。如今,这条规则很难维持,10亿晶体管的时代即将到来,通用微处理器的主频已经超过了4千兆赫的数据宽度,达到了64位。具有65纳米技术的微处理器已经批量生产。45纳米或更低技术的微处理器也已经问世。集成在芯片上的晶
4、体管数量已经超过10亿。如何有效地使用大量晶体管?多核通过在一个芯片上集成多个简单的处理器内核,利用这些晶体管资源来最大限度地提高能效。11.门延迟逐渐缩短,但全局连接延迟不断延长。随着晶体管特征尺寸的缩小,晶体管的栅极延迟减小,但互连延迟增加。当芯片的制造工艺达到0.18微米甚至更小时,线路延迟已经超过了栅极延迟,成为限制电路性能提高的主要因素。芯片多处理器的分布式结构具有较少的全局信号。与集中式的超标量处理器结构相比,它在克服线路延迟的影响方面有更多的优势。根据波拉克规则,波拉克规则处理器的性能提升与其复杂度的平方根成正比,例如将处理器的硬件逻辑加倍,最多可以提升40%的性能。使用两个简单
5、的处理器组成一个具有相同硬件规模的双核处理器可以实现70% 80%的性能提升,并且面积也逐年缩小。芯片发热现象日益突出。随着处理技术的发展和芯片复杂度的增加,多核处理器的单核速度越来越慢,处理器消耗的能量越来越少,产生的热量也越来越少。单核处理器中增加的晶体管可以用来增加多核处理器的内核,关闭(或降低频率)一些处理器和其他低功耗技术。设计成本随着时间线性甚至超线性地增加,处理器结构的复杂性不断增加,人工成本不断增加。多核处理器的IP复用大大降低了设计成本,模块的验证成本也显著降低。15.体系结构、超标量结构和超长指令字结构的必然发展在当前高性能微处理器中得到广泛应用。超标量结构使用多个功能组件
6、同时执行多个指令。指令级并行控制逻辑复杂,难以实现。超标量结构中指令的并行度一般不超过8。超长指令字的结构使用多个相同的功能组件来执行超长指令。编译技术支持二进制兼容性问题。未来的主流应用程序需要同时执行更多指令的能力。单线程不太可能提取更多的并行性。芯片面积的增加增加了生产成本,并且在设计和验证上花费的时间变得更长、更复杂。该设计只能获得有限的性能改进。芯片多处理器通过在一个芯片上集成多个微处理器内核来提高程序的并行性。每个微处理器核心是相对简单的单线程微处理器或相对简单的多线程微处理器,并且多个微处理器核心可以并行执行程序代码。化学机械抛光具有很高的线程级并行性。因为化学机械抛光使用相对简
7、单的微处理器作为处理器核心,所以化学机械抛光的频率很高。具有设计和验证周期短、控制逻辑简单、可扩展性好、易于实现、功耗低、通信延迟低等优点。CMP可以充分利用指令级并行和线程级并行。目前,多核处理器已经成为处理器体系结构发展的一个重要趋势。17,3台并行计算机由一组处理单元组成,它们通过相互交流和合作,以更快的速度共同完成一项大规模的计算任务。背景技术20世纪60年代初,随着晶体管和磁芯存储器的出现,处理单元变得越来越小,存储器变得越来越小,越来越便宜。有一个小型共享存储多处理器系统,即大型机。20世纪60年代后期,同一处理器开始建立多个功能相同的功能单元,流水线技术也出现了。处理器中的应用大
8、大提高了并行计算机系统的性能。两个主要组成部分是计算节点之间的通信和协作机制。18.并行计算机的弗林分类。根据指令流和数据流的不同组织方式,Flynn将计算机系统的结构分为以下四类:单指令流、单数据流、SISD)单指令流多数据流(SIMD)多指令流单数据流、MISD)多指令流多数据流(misd),19、并行计算机系统结构的分类,分布式存储器的SIMD处理器包含多个结构相同的处理单元(PE),它们通过路由网络以一定的方式相互连接。每个对等体都有自己的本地内存。矢量超级计算机(共享存储器SIMD)集中设置存储器,多个共享并行存储器通过对齐网络与每个处理单元PE连接。当处理单元的数量不太大时,这是理
9、想的。对称多处理器(SMP)是计算机上处理器的集合。每个处理器共享内存子系统和总线结构。并行向量处理器(PVP)集群计算机、20、4片上多处理器架构和片上多处理器(CP)将多个计算核心集成到一个处理器芯片中,从而提高计算能力。根据计算内核的等价性,多核处理器可分为同构多核和异构多核CPU内核数据共享和同步总线共享缓存结构:每个CPU内核都有一个共享的二级或三级缓存,用于存储常用数据并通过连接内核的总线进行通信。基于片上互连的体系结构:每个中央处理器内核都有一个独立的处理单元和高速缓存,每个中央处理器内核通过交叉开关或片上网络连接在一起。程序开发人员面临的挑战,2002年4月21日超线程技术,2
10、005年4月18日奔腾D处理器,第一个多核AMD K8架构英特尔酷睿微架构英特尔四核AMD四核?22,多核特性,优点,低功耗,高性能和缺点,复杂的编程,23,内核间总线接口,奔腾d,975x芯片组,内存控制器集线器,输入/输出控制器集线器,ddr2内存,PCI Express x16,6 PCI,4串行ATA端口,6 PCI Express x1,高清音频,2 PCI Express x8,或,DMI (2 GB/s),1066/800 MHz FSB,Core1L2缓存(适用于Core1),Core0L2缓存(适用于core 1) 核心面积为275平方毫米,主频为3.16千兆赫,电压为0.9
11、5伏,数据带宽为1.62兆字节/秒,浮点计算能力为1.01万亿次,相当于十年前的10,000奔腾处理器,但功耗比核心2双核处理器低62瓦,约为四核至强5355 2.66千兆赫的一半。浮点计算能力估计为50-60千兆瓦26、系统芯片,简称片上系统(SoC),在一个芯片上实现信号采集、转换、存储、处理、输入输出等ip核的完整功能,复用ip、知识产权、知识产权主要用于嵌入式系统。27 . 5芯片组支持多核固件,固件:嵌入硬件设备中的软件可以在闪存和其他介质中以二进制映像文件的形式编写,用户可以从硬件设备调用该文件。集成电路只读存储器中的计算机程序是可擦除可编程芯片程序,可由专用外部硬件修改,不能由一
12、般应用改变。,28,基本输入/输出系统,功能系统硬件和操作系统之间的抽象层,初始化和配置系统的硬件。操作系统提供系统设备底层与中央处理器、芯片组和操作系统固件之间的通信连接。在IBM兼容计算机中启动时调用的固件代码构成了一个开机自检在线中断服务(主要由遗留操作系统使用)。29、基本输入输出系统继续,流程:基本输入输出系统在通电时从闪存、可编程只读存储器或可编程只读存储器开始并完成初始化,执行通电自检并扫描硬盘、内存、显卡、主板和其他硬件,将自身从基本输入输出系统内存空间解压缩到系统内存空间并从那里开始运行,该内存空间正被EFI、30、可扩展固件接口EFI所取代, 可扩展固件接口操作系统与平台固
13、件之间的软件接口包括包含平台信息的数据表和启动时及启动后的服务EFI引导管理器,用于选择加载操作系统,不需要特殊的引导加载机制。 辅助框架是一个固件体系结构和一个EFI固件接口的实现。31岁,UEFI,32岁主板启动期间的软件设计支持网络图形用户界面提供本地字符和表格,例如:启动期间的网络视频播放。33.电喷支持多核。框架中定义了两种类型的处理器BSP(引导处理器),用于执行EFI初始化代码、设置APIC环境、建立系统范围的数据结构以及启动和初始化接入点。在系统通电或重启后,应用处理器将自行进行简单设置,然后等待基站发送启动信号。多核计算机中框架的初始化过程如下:秒:从实模式切换到保护模式,处理不同的重启事件,缓存每个处理器。裴:尽可能少做硬件初始化,多留些给DXE。DXE:初始化所有可用的硬件设备,为建立控制台和启动操作系统提供必要的服务。建立所需的控制台设备,并在输出控制台上显示用户界面。电喷需要提交操作系统的相关信息,包括处理器,34,35,有些情况下,Linux BIOS在5秒内启动片上操作系统,36,多核高级可编程中断控制器APIC,37,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 集体耕地承包协议书
- 代签离婚协议合同样本
- 书销售返利合同标准文本
- 安装技术方案及质量保证措施
- 做灯具合同样本
- 代理建材经销业务合同样本
- 企业托管员工合同样本
- 控烟主题班会课教案
- 云服务流量合同标准文本
- 校园定向运动比赛活动方案
- 2025年辽宁省辽渔集团招聘笔试参考题库含答案解析
- 《员工招聘与选拔》课件
- 南昌起义模板
- 【MOOC】体育舞蹈与文化-大连理工大学 中国大学慕课MOOC答案
- 接处警流程培训
- 2024年商丘职业技术学院单招职业技能测试题库附答案
- 《园林植物病虫害》课件
- 空调维保服务投标方案 (技术方案)
- 医用气体安装工程作业安全技术交底
- 西方文论概览(第二版)-第一章-课件
- T-CSPSTC 55-2020 隧道衬砌质量无损检测技术规程
评论
0/150
提交评论