多年来,我一直用控制论的思想去理解智能制造的目标和方法。在我看来,相关技术进步和机会都是围绕着“信息感知、决策和执行的统一”这个逻辑展开的。而AI的作用也体现在这个逻辑中。
不久前我给交大研究生上课。有同学发现了一个对Harness的介绍,就把相关的信息发在群里:他们的观点和郭老师说的一样,也是用控制论解释的!在我看来,AI这些年的进步,都没有离开控制论的思想体系。
在我看来,前些年深度学习技术在图像识别等领域的进展,打通了信息感知和决策之间的一个环节,我把这个环节称为“感知到认知”。民间有“初生牛犊不怕虎”的说法。牛犊看到老虎为什么不会跑呢?老虎的图像信息进入了牛犊的眼里,但牛犊不知道这是一头可以吃它的野兽“老虎”。也就是说,牛犊脑子里没有“老虎”的概念。牛犊要认识老虎,从“老虎”的图像要映射到“老虎”的概念。我把这个过程称之为“感知到认知”或者“信号到信息”。与之相比,传统的自动控制理论针对的都是信号到信息容易转化的问题。比如,传感器传来15毫安的电流,系统就知道对应1米的液位。所以,AI解决了“感知到认知”、“信号到信息”的难题后,自动化技术补齐了一个重要的短板,将给自动化技术带来广阔的机会。所以,图像识别等技术特别有用。有一年,工信部的一个单位要组织培训班,他们征求我课程设置意见时,我说:建议加入图像识别这门课。
在过去的数字化时代,智能制造的基本做法是“把人明白的道理交给计算机去做”。但是,人脑中的有些知识说不明白。比如,围棋中对“势”的评估。如果这类问题解决不了,决策过程往往就是一个组合爆炸过程(NP完备性问题)。这类人脑子中有却说不出来的知识叫做“默会知识”。从深度学习技术开始,AI逐步掌握了这种技术,可以自己学会这种知识。从某种意义上说,AI具有这种能力后,变成了一种“读心术”。能够通过语言去理解人们说不清的东西,打通了人机界面。既然明白了人的想法,就可以转化成行动:包括回答问题、绘图、做视频、编程序等等。打通人机界面之后,AI的春天就真正到来了。
打通之后AI走向何处呢?人们已经不满足于与AI交流了,而是希望AI直接去干活、与行动结合在一起。于是,新的名词又出现了:世界模型、Agent。然而,“默会知识”说不清楚,理解就可能会出现错误。这一点,维纳在《控制论》里就明确地警告过人们。如果这个问题得不到解决,AI的应用就会受到很大的限制。于是,防止Agent出错的办法出现了,这就是Harness。大模型加上Harness,龙虾就出现了,一下子成了全世界的热点。 据说,编写Harness是很麻烦的。于是,昨天又听说一种新的做法:让AI自己编写Harness。在更高的层次上实现人机互动,是用魔法打败魔法。
从数学的角度看,控制论在最近30多年发展很慢、甚至可以说近乎停滞。但在我看来,控制论的可贵之处在于思想而不是数学公式。通过数学公式去理解控制论,无异于“磨砖成镜”。那种认为控制论走到瓶颈的观点是完全错误的。恰恰相反,芯片、互联网、AI技术为控制论思想的发扬光大带来了巨大的机会。
在维纳看来,控制论是“获取并利用信息抵御增熵的学问”。我觉得,这就是控制论的真谛。我将其进一步解释为“信息感知、决策和执行的统一”,这样,相关技术的每一次进步、每次新的机会都可以归结到“感知、决策、执行”这三个最基本的要素之中。比如,在互联网时代,空间的距离被消灭了,“感知、决策、执行”开始针对大空间的复杂系统。于是,我们进入了智能制造的时代。在大模型的时代,复杂决策的时间被大大压缩了,故而对需要长期决策的过程(如研发设计、编程、数据分析)带来了巨大的机会。
但“信息感知、决策和执行的统一”并非维纳的原话。我有个大胆的猜测,维纳似乎有意无意地没有把想法完全说清楚。我听说过一个故事:信息论之父申农过去经常以学生的身份找维纳交流。维纳开始的时候很开心,但后来就有所警惕了:他认为申农是在偷学他脑子里的东西。于是,他的交流变得非常谨慎了。
我不知道,维纳是否考虑过:物理世界的变化是否都能通过信息体现出来?现在看来,除了黑洞内部,这个假设在现实世界中似乎是成立的。我也不知道,维纳是否考虑过,未来的一天,可以精准地在信息世界为物理世界建模。技术一直在进步,但维纳的思想却历久弥新,新的技术往往就出现在这个框架内。
我把这篇文字交给AI阅读。它用一句话进行了总结,我感觉很好,分享给大家:AI就像在补全“感知-决策-执行”这条链条上的短板,而控制论就是串联这一切的“隐藏蓝图”。
来源:微信号 蝈蝈创新随笔
作者:郭朝晖
该作品已获作者授权,未经许可,禁止任何个人及第三方转载。
楼主最近还看过


客服
小程序
公众号