Reinforcement Learning Toolbox

 

Reinforcement Learning Toolbox

使用强化学习设计和训练策略

Reinforcement Learning Toolbox 中提供的训练算法集合,如 DDPG、DQN、SAC 和 PPO。

强化学习智能体

使用 DQN、PPO 和 SAC 等常见算法创建无模型和基于模型的强化学习智能体。或者,使用提供的模板开发您自己的自定义算法。使用 RL Agent 模块将您的智能体集成到 Simulink 中。

强化学习设计器

交互式设计、训练和仿真强化学习智能体。将经过训练的智能体导出到 MATLAB,以供进一步使用和部署。

奖励信号

创建奖励信号,衡量智能体实现目标的成功度。根据 Model Predictive Control ToolboxSimulink Design Optimization 中定义的控制设定自动生成奖励函数

策略表示

通过使用工具箱建议的神经网络架构快速入门。或者,浏览查找表,或使用 Deep Learning Toolbox 层和深度网络设计器手动定义神经网络策略。

强化学习训练

通过与环境的交互或使用现有数据来训练智能体。探索单智能体和多智能体训练。记录和查看训练数据,并随时监控进度。

多个工作进程并行生成数据以用于分布式强化学习。

分布式计算

使用 Parallel Computing ToolboxMATLAB Parallel Server 借助多核计算机、云资源或计算集群加快训练速度。利用 GPU 加速梯度计算和预测等操作。

四足机器人的 Simulink 模型截图。

环境建模

使用 MATLABSimulink 对与强化学习智能体无缝交互的环境进行建模。与第三方建模工具对接。

代码生成和部署

根据经过训练的策略自动生成 C/C++ 和 CUDA 代码以部署到嵌入式设备。使用 MATLAB CompilerMATLAB Production Server 将经过训练的策略通过独立应用程序、C/C++ 共享库以及其他方式部署到生产系统中。

参考示例

为机器人、自动驾驶、标定、调度和其他应用设计控制器和决策算法。借助我们的参考示例实现快速入门。

“5G 是一项关键基础架构,我们必须保护它免遭恶意攻击。Reinforcement Learning Toolbox 使我们能够快速评估 5G 漏洞并确定缓解方法。”

获取免费试用版

30 天探索触手可及。


准备购买?

获取报价并了解相关产品。

您是学生吗?

您的学校可能已拥有 Campus-Wide License 并允许您直接使用 MATLAB、Simulink 和其他附加产品。