使用Intel Parallel Studio优化程序性能

  • 格式:pdf
  • 大小:429.79 KB
  • 文档页数:21

下载文档原格式

  / 21
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

使用Intel® Parallel Studio优化程序性能

实例分析

宋志凯

sky.song@

目录:

1. Intel® Parallel Studio简介 (1)

2. 安装Intel® Parallel Studio (3)

3. 使用Intel® Parallel Inspector发现内存访问错误 (4)

4. 使用Intel® Parallel Amplifier查找优化机会 (8)

5. 使用Intel® Parallel Composer生成OpenMP代码 (10)

6. 使用Intel® Parallel Inspector查找多线程错误 (12)

7. 使用Intel® Parallel Amplifier分析多线程并行性 (14)

8. 卷积计算例子程序介绍 (16)

9. 总结 (19)

1. Intel® Parallel Studio简介

很多程序开发人员知道或者已经使用过英特尔软件开发工具,例如:编译器,VTune TM性能分析器,性能库,线程分析工具Thread Profiler,Thread Checker等。这些工具功能多且强大,都支持Windows*和Linux*操作系统,它们可以用于从串行到并行程序的优化中。基于过去25年软件开发和性能优化的经验,英特尔最近发布了最新的开发工具集“Intel® Parallel Studio”。这个工具集为在微软Windows操作系统下进行C/C++开发的程序员提供了一个界面友好,功能强大的调试,优化环境。Intel Parallel Studio可以无缝集成在微软Visual Studio 2005 and 2008中。Intel Parallel Studio包括以下4个组件:

Intel® Parallel Composer能够为使用 Microsoft* Visual C++* 的开发人员提供令人惊叹的并行性开发选择。此产品将编译器、函数库和 Microsoft Visual Studio* 调试器的扩展融为一体。英特尔® C++ 完全兼容 Microsoft Visual C++,并且拥有支持最新的 OpenMP* 技术,可以提供语言扩展来支持并帮助简化为代码添加并行能力的工作。英特尔® Parallel Debugger Extension 可简化并行调试并确保线程的准确性。英特尔® 线程构建模块(TBB)和英特尔® 集成性能库可提供已经线程化的通用和应用指定函数,从而使得开发人员可以迅速为应用添加并行能力。

Intel® Parallel Inspector将线程和内存错误查找功能融入一个强大的错误检测工具中。此工具有助于提高 Microsoft Visual Studio* 内部 C/C++ 应用的可靠性、安全性和准确性。英特尔® Parallel Inspector 使用动态方法,不需要特殊的测试工具或编译器,因此通常更加易于对代码进行测试。

Intel® Parallel Amplifier英特尔® Parallel Amplifier 使迅速查找多线程性能瓶颈变得简单,不需要了解处理器架构或代码也可以查找。Parallel Amplifier 省略了推断过程,能够分析Windows* 应用程序的性能行为,快速访问度量信息,从而加快并改进决策制定。

Intel® Parallel Advisor Lite是一个预览版组件,能够洞悉并行化如何提升应用程序性能,帮助提高并行程序设计效率。

对那些已经熟悉了传统英特尔开发工具的程序员来说,这些新工具的名字是陌生的。但是通过上面的介绍,这些功能却似曾相识。事实上,Parallel Composer 集合了传统的Intel® C++ compiler, Intel®线程构建模块(Threading Building Blocks), Intel®集成性能库(Integrated Performance Primitives)以及Intel® Parallel Debugger Extension。Parallel Inspector 包括了Intel® 线程检查器(Thread Checker)以及内存检查的功能。这两个工具集帮助开发人员提高生成代码和查找错误的效率。

Parallel Amplifier是一个并行程序性能分析和调试工具。其功能类似于原来Intel® VTune和Intel® Thread Profiler的集合。于VTune能够基于时间或者事件采样不同的是Amplifier只能基于时间采样。Amplifier去掉了各种可能让部分程序员感到困惑,难于理解的事件,比如L2 cache miss或者Branch miss-prediction。Amplifier可以帮助开发人员找到他们程序执行的热点在源代码中的位置,这些热点就是需要性能优化的地方。除此以外,Amplifier能够让程序员知道他们的多线程程序并行执行是否高效。

Intel Parallel Studio可以被用于程序开发、调试的各个阶段。由于可以集成在微软Visual Studio中,这个工具集非常容易学习和使用。通过简单点击,程序员就能完成代码编译或者调试的任务。接下来,本文将以一个简单的程序为例子,探讨在程序开发的各个阶段如何使用Intel Parallel Composer, Inspector和Amplifier来优化程序的性能。

2. 安装Intel® Parallel Studio

用户可以从英特尔的官方主页下载Intel® Parallel Studio试用版本:

/en-us/intel-parallel-studio-home/

试用版Intel® Parallel Studio 有30天的免费试用期。

安装前请确保系统中已经安装过了Microsoft Visual Studio 2005或者2008。安装过程很简单,缺省设置就可以了。安装过程后打开Microsoft Visual Studio 2005或者2008,Intel® Parallel Studio组件出现在工具条面板中:

Intel® Parallel Composer

Intel® Parallel Inspector

Intel® Parallel Amplifier