强化学习是一种机器学习方法,其中计算机智能体通过在动态环境中反复进行试错交互来学习执行任务。
本电子书通过解释术语并提供示例、教程和其他资源的访问,帮助您入门强化学习。它涵盖了您需要了解的所有内容,从奖励和政策结构到培训和部署。
您将了解:
- 强化学习问题的基本概念及其与传统控制方法的比较
- 不同类型的训练算法,包括基于策略的、基于值的和执行器-评价器方法。
- 每种训练方法的优缺点,包括用于 Q 学习的贝尔曼方程。
- 监督学习、无监督学习和强化学习的区别
- 在部署经过训练的政策之前应考虑的事项,以及与此方法相关的整体挑战和缺点。