首页 西门子(Si. 正文

回复

佬牛在次发大招了,使用西门子1200PLC实现Q-learning强化学习算法

西门子(Siemens)PLC 浏览:1287 回复:19 收藏

工控佬牛  2024-12-05 14:47

佬牛在次发大招了,使用西门子1200PLC实现Q-learning强化学习算法



强化学习(reinforcementlearning, RL)又叫做增强学习,是近年来机器学习和智能控制领域的主要方法之一。
定义: Reinforcement learning is learning what to do ----how to map situations to actions ---- so as to maximize a numerical reward signal.[1]
也就是说增强学习关注的是智能体(也就是agent)如何在环境中采取一系列行为,从而获得最大的累积回报。

强化学习的学习机制表明它是不断地与环境交互(可以看做是决策系统【采取action的系统】和环境的博弈),以试错的学习方式得到最优策略,是使得决策能力持续获取收益的关键技术。

强化学习以试错的机制与环境进行交互,通过最大化积累奖赏(R)的方式来学习最优策略,最简单的理解就是在训练的过程中,不断地去尝试,错了就惩罚,对了就奖励,由此训练得到各个状态环境当中最好的决策,例如骑车的过程,种瓜的过程。[4]

通过增强学习,一个智能体应该知道在什么状态下应该采取什么行为。RL是从环境状态到动作的映射的学习,我们把这个映射称为策略。

完整视频演示链接:S7-1200PLC实现 Q_Learning 加强学习算法演示_哔哩哔哩_bilibili

正在下载,请等待……
下载附件需 5 积分!

我知道了