一如Llano APU发布时承诺的那样,AMD今天发布了新版加速计算软件开发包APP SDK 2.5,包含对OpenCL 1.1版标准规范的支持。
从催化剂11.4开始,AMD就把Windows平台的OpenCL运行时集成到了催化剂驱动包中,无需额外单独安装即可执行加速计算。最新版的AMD APP SDK 2.5则是配合催化剂11.7而来的,专门针对Fusion APU进行了多处关键的性能增强。AMD特别强调说,APU释放了传统PCI-E总线带来的CPU-GPU通信带宽限制,借助APU零拷贝路径已获得最高15GB/s的有效数据传输率。
Windows平台的新版SDK还加入了对多GPU的支持,特别是在使用APU搭档独立显卡的时候也能进行OpenCL计算。
Cypress GPU核心现在支持Khronos FP64双精度扩展,未来会在所有支持双精度的GPU上实现。
AMD APP SDK 2.5主要新特性:
- 内核启动时间大为缩短。
- 升级用于OpenCL内核的LLVM编译器,支持SSE3/SSE4指令集、部分支持FMA4/XOP指令集(推土机)。
- 命令行选项中无需再使用-fno-alias编译器。
- Linux系统下PCI-E传输性能提升。
- CPU、GPU间缓存传输改进,可使用CL_MEM_USE_HOST_PTR或者CL_MEM_ALLOC_HOST_PTR。
- 对APU来说,以CL_MEM_ALLOC_HOST_PTR | CL_MEM_READ_ONLY创建的零拷贝缓存可提升GPU读取性能。
- Windows系统下运行时支持多GPU,包括同时使用APU中的图形核心和独立显卡。
- OpenCL可借助处理器的AVX指令集进行加速。
- 支持PowerExpress 4.0。
- 支持独立显卡的原子计数。
- 支持无头GPU操作。
- OpenCL可为Windows服务所使用。
- 支持UVD3、MPEG-2。
- clFFT库支持radix 3、radix 5,包括对radix 2/3/5的混合支持。
- BLAS库支持D/S SYRK、D/S SYR2K、D/S GEMV、D/S SYMV。
- Radeon HD 5800/5900、FirePro V8700/V8800支持Khronos FP64双精度扩展。
- gDEBugger 6.0扩展现可用于微软Visual Studio。
- 从催化剂11.8开始,每个月的Windows版催化剂都会定期加入新的运行时功能特性。
- APP Profiler改进API追踪、改进时间线可视化、支持分析OpenCL应用追踪、输出包含线程ID和序号。
- APP KernelAnalyzer升级为1.9版,支持催化剂11.4-11.7。
官方下载:
Windows Vista SP2/Windows 7 32位: http://developer.amd.com/Downloads/AMD-APP-SDK-v2.5-RC2-Windows-32.exe
Windows Vista SP2/Windows 7 64位: http://developer.amd.com/Downloads/AMD-APP-SDK-v2.5-RC2-Windows-64.exe
Linux 32位: http://developer.amd.com/Downloads/AMD-APP-SDK-v2.5-RC2-lnx32.tgz
Linux 64位: http://developer.amd.com/Downloads/AMD-APP-SDK-v2.5-RC2-lnx64.tgz
注意:
1、Linux支持包括openSUSE 11.x、Ubuntu 10.x、Red Hat Enterprise Linux 6.x等等发行版。
2、显卡支持包括Radeon HD、Fusion、Mobility Radeon HD、Mobility FirePro等家族,驱动程序需要使用催化剂11.7或者厂商提供的最新版。
另外,AMD还公布了AMD Fusion开发者峰会所有演讲的现场视频,配合之前放出的PDF文档可对此次峰会有一个全面深入的了解。关注AMD未来图形与计算GPU架构的同学可以重点看看103号和2620号演讲。
AMD Fusion开发者峰会2011视频、文档: http://developer.amd.com/afds/pages/sessions.aspx