下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、设计大吞吐量、实时soc系统的最佳实践 现代软件通常包括多种应用,从汽车发动机控制等硬件实时应用,到hd视频流等大吞吐量应用。随着现代soc向大吞吐量系统的迅速进展,处理器内核数量不断增强,宽带互联也越来越多,导致混合系统设计成为挑战。在这类系统中实现硬件实时s量级响应,颤动不到1s,需要认真的综合考虑分析和系统划分。随着soc的复杂度越来越高,未来的验证策略也必需纳入考虑范围。这类系统设计主要有三种办法非对称多处理(amp)、管理程序,以及支持内核隔离的对称多处理(smp)(主要的对照见表1),系统设计人员可以从中挑选一种办法来优化混合soc系统。非对称多处理amp实际是基于物理上不同的处理
2、器内核的多操作系统(os)端口。一个例子是,在第一个内核上运行特地用于处理实时任务的裸金属os,在其他内核上运行等完整的os。无数时候,最初将os导入到内核中十分容易,但是,在启动代码和资源管理上很简单出错,例如,存储器、高速缓存和外设等。当多个os拜访相同的外设时,行为会是不确定的,调试起来可能十分耗时。通常要求认真的庇护 trustzone等体系结构不受影响。更复杂的是,在os之间传递消息要求存储器分享,一起采纳其他庇护手段举行管理。不同的os之间通常不会分享高速缓存。要通过非高速缓存区来传递消息,对于总体性能而言,增强了延时和颤动。从可扩展角度看,随着内核数量的增强,需要举行多次重新导入
3、,使软件体系结构较差。监控程序管理程序是挺直在硬件上运行的底层软件,在其上可管理多个自立的os。最初的导入与amp相像,而其优势在于管理程序躲藏了资源管理和消息传递中不重要的详情。缺点是因为吞吐量和实时性能要求,增强了额外的软件层,导致浮现性能开销。对称多处理支持内核隔离的smp在多个内核上运行一个os,支持在内部划分内核。一个例子是让smp os在第一个内核上分配实时应用程序,在其他的内核上运行非实时应用程序。随着内核数量的增强,smp os可以设计无缝导入,因此,这一办法的可扩展性比较好。全部内核都是由一个os管理的,因此,内核之间可以在l1数据高速缓存级上传递消息,通信速度更快,颤动 更
4、低。通过内核隔离,可以保留一个内核用于硬件实时应用,以屏蔽其他大吞吐量内核的影响,保持了低颤动和实时数据响应。这样,设计人员可以考虑用法哪一个os,而不用重新设计简单出错的底层软件来管理多个os。因此,这普通是很好的软件体系结构打算。假如从多个os开头,最初的导入会需要一些付出。但是,从一个smp体系结构开头会省无数事。通过smp优化大吞吐量、实时soc基于对各种办法的分析,支持内核隔离的smp是最好的体系结构,优化了大吞吐量、实时soc系统。我们考虑的体系结构与图3的系统相像,其中,i/o数据输入到soc中,处理器对其举行计算,送回至i/o,满足低颤动和低延时实时响应要求。此外,soc包括了
5、多个内核,可同时运行其他吞吐量较大的应用程序。首先,需要理解一个实时响应(循环时光)由哪些组成:1.从一个i/o,将新数据传送至系统存储器(dma)。2.处理器探测系统存储器中的新数据 (内核隔离)。3.将数据复制到私有存储器(memcpy)。4.对数据举行计算。5.将结果复制回系统存储器(memcpy)。6.将结果传送回i/o(dma)。颤动和延时是6个步骤的累积,因此,需要优化每一个步骤。采纳支持内核隔离的等rtos,可以在纳秒范围内完成轮询/中断响应(步骤2)。数据计算也是专用的,具有很好的可预测性(步骤4)。因此,我们的重点是综合考虑挺直存储器拜访(dma)和memcpy(步骤1/3/
6、5/6)。主要有两种办法来传送数据:高速缓存延续传送,以及不支持高速缓冲延续的传送。这两种办法在dma和memcpy上的响应有很大的不同。1所示,虽然高速缓存延续传送(用法arm高速缓存延续端口(acp)导致dma需要较长的通路,但处理器只需要拜访l1高速缓存就可以获得所传送的数据。因此,用法高速缓存延续传送的memcpy时光要少无数,但是dma性能会有些劣化。对于设计人员而言,因为是挺直高速缓存拜访,因此,高速缓存延续传送的延时更短,颤动 更小。案例讨论:soc设计最佳实践可以用法cyclone v soc 开发套件,通过参考设计来演示一个完整的系统。器件在一个芯片中包括了一个双核32arm
7、 -a9内核子系统(hps)和一个28nm fpga。下面总结了硬件和软件体系结构,2所示。硬件体系结构·两个dma,将数据从fpga i/o传送至arm处理器,反之亦然。·两个dma都衔接至acp,实现数据在arm处理器高速缓存的挺直传送。·实时控制单元ip,以尽可能快的方式启动arm处理器和dma引擎之间的消息传递。·颤动监视器挺直探测dma信号,采集实时性能和颤动,精度在±6.7ns以内。软件体系结构·在双核arm处理器上的vxworks实时os运行在smp模式下。·内核隔离,用于在第一个内核上分配实时应用程序,在其次
8、个内核上分配其他的非 实时应用程序。·实时应用程序延续从i/o读取数据,计算,然后将结果发送回i/o。·当延续运行ftp传输并对数据加密时,非实时应用程序加重了对arm内核和其它 i/o性能的要求。结果在长度不同的数据上运行试验,长度从32 字节直至2,048字节。为了采集循环时光的直方图,来分析颤动(最大和最小循环时光之间的不同),每一长度都要运行数百万次。3所示,即使是在其次个内核上运行数据流负载很大的ftp,经过数百万次的测试,延时也在微秒级,而颤动不到300ps。长度不同,会有些颤动摆动,但是可控制在200ps内,并不显然。相同的ftp应用程序也运行在vxworks smp上,用法了两个内核,速度提高了近2倍。因此,这一办法并没有劣化吞吐量,是吞吐量和硬件实时应用程序的折中挑选。但是,因为对内核举行了硬件划分,不能够灵便的增强内核数,因此,amp解决计划也同样有一些劣化。结论设计一个支持大吞吐量和实时应用程序的均衡soc系统需要举行无数综合考虑,例如:·dma数据传送。·延续高速缓存。·处理器内核与dma之间的消息传递。&
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 浙江师范大学行知学院《建筑学专业导论》2023-2024学年第一学期期末试卷
- 中国音乐学院《生物信息技术》2023-2024学年第一学期期末试卷
- 郑州卫生健康职业学院《企业项目实践》2023-2024学年第一学期期末试卷
- 学习领会《教育强国建设规划纲要(2024-2035年)》心得体会
- 玉溪职业技术学院《数理统计及软件》2023-2024学年第一学期期末试卷
- 物流行业智能化协作网络设计
- IT业务数据季度总结模板
- 业务操作-房地产经纪人《业务操作》名师预测卷1
- 农业公司年度汇报
- 柏拉图与《理想国》读书笔记
- 2024版中国台球行业市场规模及投资策略研究报告(智研咨询)
- 2024年国家公安部直属事业单位招录人民警察及工作人员696人笔试(高频重点复习提升训练)共500题附带答案详解
- 初中必背古诗文138首
- 上海生活垃圾分类现状调查报告
- 小升初中简历模板
- 【深信服】PT1-AF认证考试复习题库(含答案)
- GB/T 43824-2024村镇供水工程技术规范
- 2024年10月自考00058市场营销学押题及答案汇总
- 初中地理学法指导课
- 体检中心质控工作计划
- 车路云一体化智能网联汽车产业产值增量预测-2024-03-智能网联
评论
0/150
提交评论