主要内容

本页翻译不是最新的。点击此处可查看最新英文版本。

强化学习

通过与未知动态环境交互来训练深度神经网络智能体

强化学习是一种目标导向的计算学习方法,其中智能体通过与未知动态环境交互来学习执行任务。在训练期间,学习算法会更新智能体策略参数。学习算法的目标是找到一种最优策略,使在任务期间收到的预期累积折扣长期奖励最大化。

这种学习方法使得智能体能够在没有人工干预的情况下,通过一系列决策来最大化任务的累积奖励,而无需明确地编程来实现目标。您可以使用 Reinforcement Learning Toolbox™ 软件创建和训练强化学习智能体。

有关详细信息,请参阅What Is Reinforcement Learning? (Reinforcement Learning Toolbox)

主题

精选示例