计算能力
为代码生成选择 CUDA 计算能力
模型配置窗格: 代码生成 / GPU 代码
描述
计算能力参数指定为其生成 CUDA® 代码的 NVIDIA® GPU 设备的最低计算能力。CUDA 计算能力是 GPU 架构为执行 CUDA 代码提供的功能和特性的数值表示。计算能力版本由主版本号和次版本号表示,并确定 CUDA 程序可以利用的可用硬件特性、指令集、内存能力和其他 GPU 特定功能。它还影响 CUDA 代码在不同 GPU 上的兼容性和性能。
例如,具有计算能力 7.0 的 GPU 将比具有计算能力 3.2 的 GPU 有更多功能和能力。较新的计算能力通常引入增强功能、改进的性能和附加功能,使您能够使用最新 GPU 架构进步。某些 CUDA 功能可能有特定的计算能力要求。要查看代码生成的 CUDA 计算能力要求,请参考下表。
| 目标 | 计算能力 |
|---|---|
CUDA MEX | 请参阅GPU 计算要求 (Parallel Computing Toolbox)。 |
源代码、静态或动态库以及可执行文件 | 3.2 或更高版本。 |
8 位整数精度的深度学习应用程序 | 6.1、6.3 或更高版本。 |
半精度(16 位浮点)的深度学习应用程序 | 5.3、6.0、6.2 或更高版本。 |
如果您指定自定义计算能力,GPU Coder™ 将忽略此设置。
依赖关系
此参数要求具有 GPU Coder 许可证。
要启用此参数,请在代码生成窗格下选择生成 GPU 代码。
设置
5.0 (默认) | 3.2 | 3.5 | 3.7 | 5.2 | 5.3 | 6.0 | ...
在开发 CUDA 应用程序时,必须考虑目标 GPU 的计算能力以确保兼容性和优化性能。使用较低的计算能力时,生成的代码将与不同 GPU 架构兼容,但不会利用最新架构进步。
推荐的设置
| 应用情形 | 设置 |
|---|---|
| 调试 | 无影响 |
| 可追溯性 | 无影响 |
| 效率 | 无影响 |
| 安全预警 | 无影响 |
编程用法
参数:GPUComputeCapability |
| 类型:字符向量 |
值: '3.2' | '3.5' | '3.7' | '5.0' | '5.2' | '5.3' | '6.0' | '6.1' | '6.2' | '7.0' | '7.2' | '7.5' | '8.0' | | '8.3' | '8.6' | '8.7' | '8.9' | '9.0' |
默认值:'5.0' |
版本历史记录
在 R2020b 中推出