主要内容

计算能力

为代码生成选择 CUDA 计算能力

模型配置窗格: 代码生成 / GPU 代码

描述

计算能力参数指定为其生成 CUDA® 代码的 NVIDIA® GPU 设备的最低计算能力。CUDA 计算能力是 GPU 架构为执行 CUDA 代码提供的功能和特性的数值表示。计算能力版本由主版本号和次版本号表示,并确定 CUDA 程序可以利用的可用硬件特性、指令集、内存能力和其他 GPU 特定功能。它还影响 CUDA 代码在不同 GPU 上的兼容性和性能。

例如,具有计算能力 7.0 的 GPU 将比具有计算能力 3.2 的 GPU 有更多功能和能力。较新的计算能力通常引入增强功能、改进的性能和附加功能,使您能够使用最新 GPU 架构进步。某些 CUDA 功能可能有特定的计算能力要求。要查看代码生成的 CUDA 计算能力要求,请参考下表。

目标计算能力

CUDA MEX

请参阅GPU 计算要求 (Parallel Computing Toolbox)

源代码、静态或动态库以及可执行文件

3.2 或更高版本。

8 位整数精度的深度学习应用程序

6.1、6.3 或更高版本。

半精度(16 位浮点)的深度学习应用程序

5.3、6.0、6.2 或更高版本。

如果您指定自定义计算能力,GPU Coder™ 将忽略此设置。

依赖关系

  • 此参数要求具有 GPU Coder 许可证。

  • 要启用此参数,请在代码生成窗格下选择生成 GPU 代码

设置

5.0 (默认) | 3.2 | 3.5 | 3.7 | 5.2 | 5.3 | 6.0 | ...

在开发 CUDA 应用程序时,必须考虑目标 GPU 的计算能力以确保兼容性和优化性能。使用较低的计算能力时,生成的代码将与不同 GPU 架构兼容,但不会利用最新架构进步。

推荐的设置

应用情形设置
调试无影响
可追溯性无影响
效率无影响
安全预警无影响

编程用法

参数:GPUComputeCapability
类型:字符向量
值: '3.2' | '3.5' | '3.7' | '5.0' | '5.2' | '5.3' | '6.0' | '6.1' | '6.2' | '7.0' | '7.2' | '7.5' | '8.0' | | '8.3' | '8.6' | '8.7' | '8.9' | '9.0'
默认值:'5.0'

版本历史记录

在 R2020b 中推出