强化学习(reinforcementlearning, RL)又叫做增强学习,是近年来机器学习和智能控制领域的主要方法之一。 定义: Reinforcement learning is learning what to do ----how to map situations to actions ---- so as to maximize a numerical reward signal.[1] 也就是说增强学习关注的是智能体(也就是agent)如何在环境中采取一系列行为,从而获得最大的累积回报。