版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、多核程序设计课程实验实验 1:el 多核编译器及 Vtune 性能分析器院系学院学号1103710504任课教师指导教师实验地点学院五楼机房实验时间2012.12.11实验课表现出勤、表现得分实验得分实验总分操作结果得分一、实验目的要求:需分析本次实验的基本目的,并综述你是如何实现这些目的的?答:实验目的:掌握el compiler 的特点和基本使用方法;掌握在 Windows 下如何使用el compiler 提高应用程序的性能;掌握el compiler 的主要优化选项和参数的使用;掌握el VTune Performanceyzer 的功能、特点和基本使用方法;掌握如何使用快速性能分析向
2、导(Quick Performanceysis wizard)收集系统状态下的性能数据;掌握使用el VTune Performanceyzer 进行基于时刻的采样(TBS)和基于事件的采样(EBS)的基本原理、方法和采样工具的使用;掌握利用 VTune 找到应用程序中的 Hotspot 的基本方法;掌握使用 Call graph 根据总时间找到关键路径;根据占处理器时间找Hotspot 的方法。掌握el Math Kernel Library (el MKL)的功能、特点、数据类型和基本使用方法;掌握 el MKL 的多线程能力;实现方法:按照实验指导书上的步骤,先进行实验环境的配置,包括
3、el C+编译器和 el Vtune 的安装,接着就可以进行实验了,一步一步做下去,便基本掌握了这些工具的使用。二、实验内容该部分填写在实验过程中,你都完成了哪些工作。答:实验 1-1:配置el C+ Compiler(icl)编译器环境设置(Visual Studio* .NET* 环境);使用 MSVC*和el C+ Compiler 编译器分别编译示例程序,并程序执行时间,分析实验结果;使用高级优化参数(-03)对程序进行优化编译,结果并予以分析;使用过程间优化参数(-Qipo)进行程序优化编译,结果并予以分析;使用配置向导优化(PGO)进行程序优化编译,结果并予以分析;使用矢量化优化参
4、数(-Qxp)进行程序优化编译,结果并予以分析;使用多个优化参数(-O3、-Qxp、IPO 和 PGO)进行程序优化编译,结果并予以分析;实验 1-2: 关闭扫描和程序; 运行el VTune Performanceyzer,并新建工程项目; 启动 Sling Wizard, 选择 Windows*/Windows* CE/Linux Profile, 选择Automatically adjust tunning; 选择 gzip.exe 程序的完整路径,并载入到 VTune Sling 中; 采样(通过 Sling Wizard 建立工程)并分析采样结果; 采用 Call Graph 方式(
5、通过 Call Graph Wizard 建立工程)对应用程序 gzip.exe进行重新采样,找出关键路径;实验 1-3: 演示原始计算、一级 BLAS、二级 BLAS、三级 BLAS 的性能特征和它们之间的差异;法计算圆周率;三、实验结果实验结果。第四个:第五个:第六个:第七个:实验二:最耗时:四、思考题思考题 1: el C+ Compiler 的基本特点?答:支持英特尔多 处理器以及现有的英特尔处理器与体系结构,针对 英特尔处理器的先进优化功能可以帮助产生出众的应用程序性能;英特尔 C+编译器与其他常用工具保持兼容,可以集成到广泛使用的开发环境,并且同其他广泛使用的编译器保持着特性源与二
6、进制方面的兼容性;与针对 IA-32的Visual C+、 Visual C+ 6.0 代码以及Visual C+ .NET 保持跨体系结构的兼容性。思考题 2:如何使用 el C+ Compiler 进行应用程序优化,基本步骤包括?答: 以前生成的文件,键入命令:nmake /f raytrace2.mak clean;编译文件时,带上优化参数(CF),键入命令:nmake /f raytrace2.mak CF=”;思考题 3:el C+ Compiler 的优化性能参数主要有哪些,其优化性能体现在?(实验结果予以说明)答:高级优化参数(-03)、过程间优化参数(-Qipo)、配置向导优化
7、(PGO)、矢量化优化参数(-Qxp),实验结果可以见上面的截图。思考题 4: el VTune Performance yzer 的主要功能?答:取样功能、调用图功能、计数器监视器以及经过改进的 el 调优助手;在 Windows 下同时提供图形化与命令行界面;允许选择是否与 Visual Studio .NET 集成;为基于 IA-32 与英特尔安腾处理器的 Linux 应用程序提供 支持;可以对基于 el PXA250、PXA255 与 PXA26x 处理器的应用程序进行取样;思考题 5:如何使用 el VTune 性能分析器找到应用程序 gzip.exe 中的 Hotspot?答:VT
8、une 性能分析器中的取样功能可以帮助开发者分辨程序中最消耗时间的函数和模块,并给出操作系统和应用程序的详细视图。通过观察 gzip.exe 程序生成的视图,便可以很方便的找出 Hotspot。思考题 6:试述如何使用 Call graph 根据总时间找到关键路径;根据占处理器时间找Hotspot?答:调用曲线图通过分析程序运行时函数的 点和出口点,生成一张调用曲线图并且确定调用顺序和显示关键路径;计数器 器在运行时 系统活动,确定是否会因为可用内存减少或文件输入/输出性能问题而导致应用程序速度变慢。思考题 7:分析使用 el MKL 的主要功能?答:线性代数 BLAS、LAPACK;ScaL
9、APACK;PARDISO 稀疏矩阵解算器;离散变换(Discrete Fourier transforms,DFTs);矢量数学库(Vector Math Library,VML);矢量统计库(Vector Sistical Library,VSL)随机数;思考题 8:试分析如何使用el MKL 库提高系统运算效能,其引入环节应如何选取, 并分析多线程对性能影响?答:检查文件 Makefile 中的 include 和 library 路径,修改为与本机一致, MKL 数学库;实验中,通过改变环境变量 OMP_NUM_THREADS 来自定义 MKL 使用的线程数量,对比线程数为 1 和 2 的两次实验结果,发现线程增加了,时间耗费反而增多了,性能下降了,说明线程数与程序性能的好坏不是单纯的正比关系。五、实验心得体会这次实验,我初步接触了el c+编译器的使用,通过使用多种优化参数,对比实验结果,熟悉了el 编译器是如何优化程序性能的; el VTune 的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 水库景观资源使用权转让合同(2024版)3篇
- 2024年度建设工程项目委托管理合同3篇
- 2024年工程分包合同详细条款及标的说明
- 2024二手电动摩托车买卖合同范本
- 2024年度特许经营合同标的及实施细节2篇
- 2024年度光伏发电原材料采购合同
- 2024年版租赁合同(含装修及改造条款)2篇
- 2024年劳动用工电子协议规范指南
- 2024年度智能办公软件设备采购与定制开发合同2篇
- 2024年度环保工程合同标的及环保标准3篇
- 广州数控GSK980TDb操作步骤(刀补对刀)
- (完整)小学语文考试专用作文方格纸
- 会议室大屏方案说明
- 5000吨年水合肼次氯酸钠配制工艺流程
- 中学提前招生考试英语试卷
- 唐诗三百首大全306首
- 概论:马克思主义与社会科学方法论
- 幼儿园红色故事绘本:《鸡毛信》 课件
- 部编人教版语文四年级上册生字课件 第26课 西门豹治邺
- 大学英语四级 700核心高频词
- 夹层钢结构施工方案钢结构夹层施工方案
评论
0/150
提交评论