深度强化学习

深度强化学习是机器学习的一个分支，它能帮助您针对复杂应用（如机器人和自主系统）实现控制器和决策算法。深度强化学习可让您训练神经网络以使用从仿真系统或物理系统动态生成的数据来学习复杂行为。

使用 MATLAB、Simulink 和 Reinforcement Learning Toolbox，您可以顺利完成设计和部署深度强化学习系统的完整工作流。您可以：

“5G 是一项关键基础架构，我们必须保护它免遭恶意攻击。Reinforcement Learning Toolbox 使我们能够快速评估 5G 漏洞并确定缓解方法。”

为什么使用 MATLAB 和 Simulink 进行深度强化学习？

使用强化学习设计器以交互方式创建、训练和仿真强化学习智能体。使用自动向导来选择合适的智能体类型。选择现成的流行深度强化学习算法，例如深度确定性策略梯度 (DDPG)、软执行器评价器 (SAC) 和近端策略优化 (PPO)。

在 Simulink（或 MATLAB）中进行训练环境建模，以降低损坏硬件的风险。使用 RL Agent 模块将环境模型与深度强化学习智能体无缝集成。以串行或并行方式训练策略，并通过（系统级）仿真和软件在环 (SIL)/硬件在环 (HIL) 测试来验证策略。将经过训练的策略部署到嵌入式设备或云。

无需成为设计神经网络策略的专家即可使用特定于问题、自动生成的神经网络架构创建深度强化学习智能体。直接使用建议的神经网络架构，或使用深度网络设计器（交互式方法）或 Deep Learning Toolbox 中的层（编程方法）对其进行微调。应用导入和导出功能以与第三方框架中的神经网络表示进行互操作。

通过为机器人、自动驾驶、标定、调度和其他应用设计控制器和决策算法，实现深度强化学习快速入门。参考我们的参考示例，并尝试单智能体和多智能体训练、在线和离线学习、无模型和基于模型的方法以及基于梯度和演化的学习策略。

了解深度强化学习使用的产品。

请与深度强化学习专家交流。

试用 MATLAB、Simulink 和更多其他产品

快速入门