视频和在线研讨会系列

强化学习

本系列视频概述了强化学习,它是一种机器学习,可以解决一些传统方法难以解决的控制系统问题。

我们将介绍强化问题的基础知识,以及它与传统控制方法的区别。我们将展示为什么使用神经网络表示未知的函数,以及智能体如何使用来自环境的奖励来训练它们。

看完本视频系列后,您将对以下问题有更多的了解:

  • 什么是强化学习,为什么我在解决控制问题时应该考虑它?
  • 如何设置和解决强化学习问题?
  • 强化学习相较于传统控制方法的一些优缺点是什么?

【工程师谈强化学习】什么是强化学习?

从工程师的角度了解强化学习概况。强化学习是一种机器学习,可以解决一些非常棘手的控制问题。

强化学习,第 2 部分:了解环境和奖励

本视频通过浏览工作流帮助我们进一步了解强化学习。环境是怎样的?奖励函数如何激励智能体?策略是如何构造的?

策略与学习算法

强化学习算法和神经玩过策略简介。

步行机器人问题

机器人强化学习的应用,特别是针对双足机器人行走问题。

强化学习,第 5 部分:克服强化学习的实际挑战

在将强化学习应用于生产系统时您会遇到一些挑战。相应的,您也有方法可以缓解这些挑战。本视频将介绍验证所学解决方案的难点,以及您可以采取哪些应对措施。

多智能体强化学习简介

了解多智能体强化学习以及它需要面临和克服的一些挑战。

为什么选择基于模型的强化学习?

比较无模型的和基于模型的强化学习方法,更好地了解如何根据具体情况选择。

硬件上的强化学习

学习如何通过多种方法利用强化学习在硬件上训练和部署控制策略。