近期,一些新闻报道了强化学习算法在围棋、《Dota 2》、《星际争霸 2》等竞技游戏中对战职业玩家并且获胜的消息。强化学习是机器学习的一种,能够将人工智能运用于电子游戏、机器人、自动驾驶等诸多复杂应用。

如果您有意在项目中利用强化学习技术,但又并无相关经验,那么应该从何入手呢?

本电子书将为您阐释术语,并提供示例、教程和试用软件,帮助您使用 MATLAB® 和 Simulink® 探索强化学习。

下载此电子书,开始探索:

第 1 部分:基础知识与环境搭建

了解强化学习基础知识及其相对于传统控制设计的优势。了解有监督学习、无监督学习和强化学习之间的区别,以及如何在 MATLAB 和 Simulink 中搭建学习环境。

第 2 部分:奖励和策略结构

了解强化学习中的探索 (exploration) 与利用 (exploitation) 以及如何设计奖励函数。探索包括神经网络在内的各种表示策略,以及如何将它们用作函数逼近器。

第 3 部分:训练和部署

了解不同类型的训练算法,包括基于策略的方法、基于价值的方法以及执行器-评价器 (actor-critic) 方法。进一步了解每种训练方法的优缺点,以及常见的贝尔曼方程。最后,了解在部署经过训练的策略之前应考虑哪些事项,以及相关方法涉及的总体挑战和不足之处。