佬牛在次发大招了，使用西门子1200PLC实现Q-learning强化学习算法-专业自动化论坛-中国工控网论坛

佬牛在次发大招了，使用西门子1200PLC实现Q-learning强化学习算法

强化学习（reinforcementlearning, RL）又叫做增强学习，是近年来机器学习和智能控制领域的主要方法之一。
定义: Reinforcement learning is learning what to do ----how to map situations to actions ---- so as to maximize a numerical reward signal.[1]
也就是说增强学习关注的是智能体（也就是agent）如何在环境中采取一系列行为，从而获得最大的累积回报。

强化学习的学习机制表明它是不断地与环境交互（可以看做是决策系统【采取action的系统】和环境的博弈），以试错的学习方式得到最优策略，是使得决策能力持续获取收益的关键技术。

强化学习以试错的机制与环境进行交互，通过最大化积累奖赏（R）的方式来学习最优策略，最简单的理解就是在训练的过程中，不断地去尝试，错了就惩罚，对了就奖励，由此训练得到各个状态环境当中最好的决策，例如骑车的过程，种瓜的过程。[4]

通过增强学习，一个智能体应该知道在什么状态下应该采取什么行为。RL是从环境状态到动作的映射的学习，我们把这个映射称为策略。

完整视频演示链接：S7-1200PLC实现 Q_Learning 加强学习算法演示_哔哩哔哩_bilibili

正在下载，请等待……

下载附件需 5 积分！

佬牛在次发大招了，使用西门子1200PLC实现Q-learning强化学习算法

工控佬牛 2024-12-05 14:47