深度强化学习是机器学习的一个分支,它能帮助您针对复杂应用(如机器人和自主系统)实现控制器和决策算法。深度强化学习可让您训练神经网络以使用从仿真系统或物理系统动态生成的数据来学习复杂行为。
使用 MATLAB、Simulink 和 Reinforcement Learning Toolbox,您可以顺利完成设计和部署深度强化学习系统的完整工作流。您可以:
- 切换、评估和比较常见的深度强化学习算法
- 使用强化学习设计器以交互方式训练策略
- 在 MATLAB 和 Simulink 中对训练环境进行建模,以降低损坏硬件的风险
- 使用神经网络以交互方式或编程方式创建深度强化学习策略
- 将深度强化学习策略部署到嵌入式设备或云
为什么使用 MATLAB 和 Simulink 进行深度强化学习?
使用强化学习设计器的可视交互式工作流
使用强化学习设计器以交互方式创建、训练和仿真强化学习智能体。使用自动向导来选择合适的智能体类型。选择现成的流行深度强化学习算法,例如深度确定性策略梯度 (DDPG)、软执行器评价器 (SAC) 和近端策略优化 (PPO)。
使用基于模型的设计进行训练、系统级测试和部署
在 Simulink(或 MATLAB)中进行训练环境建模,以降低损坏硬件的风险。使用 RL Agent 模块将环境模型与深度强化学习智能体无缝集成。以串行或并行方式训练策略,并通过(系统级)仿真和软件在环 (SIL)/硬件在环 (HIL) 测试来验证策略。将经过训练的策略部署到嵌入式设备或云。
自动化和交互式的神经网络策略创建
无需成为设计神经网络策略的专家即可使用特定于问题、自动生成的神经网络架构创建深度强化学习智能体。直接使用建议的神经网络架构,或使用深度网络设计器(交互式方法)或 Deep Learning Toolbox 中的层(编程方法)对其进行微调。应用导入和导出功能以与第三方框架中的神经网络表示进行互操作。
示例和参考应用
通过为机器人、自动驾驶、标定、调度和其他应用设计控制器和决策算法,实现深度强化学习快速入门。参考我们的参考示例,并尝试单智能体和多智能体训练、在线和离线学习、无模型和基于模型的方法以及基于梯度和演化的学习策略。