最近看到主流媒体的一篇报道,国内某著名技术公司帮助国内著名央企应用AI大模型,优化了某个工业控制问题。看到报道,我感觉不太靠谱。于是,请教了一位知情人士。得到的回答是:做项目之前,对这家民族企业充满敬意;做完项目,敬意大打折扣。我只看了报道,怎么就能认定它不靠谱呢?因为感觉他们把大模型用错了地方。
模型的本质是什么?是对对象的一种简化。如何进行简化的?往往是排除不必要的干扰或者无用的信息。我们在学校里学的物理定律,本质上都是模型。比如,中学物理题中,经常把对象抽象为“质点”,经常用“在一个光滑的平面上”排除摩擦力。当然,还会默认是低速。当外界条件和假设接近时,计算结果页也会与真实的世界非常接近。
随着大模型的出现,这类模型经常被人称为“小模型”。小模型的本质,是问题的边界是清楚的。大模型的特点,往往是问题的边界模糊。我曾经问AI一个问题:我打算在黑河建一栋钢结构的房子,请问应该怎么选材? 这个问题涉及到哪些知识呢?请看AI的回答:
黑河在黑龙江,冬天的温度可能会低于零下30度。为此,需要选择低温冲击性能好的钢种。如,钢种A、钢种B;A钢种价格高、强度高,B钢种价格低、强度低。高层建筑需要用钢种A,底层建筑可以用钢种B。为了解决成本,高层建筑可以在强度要求高的地方用钢种A,强调要求低的地方用钢种B。钢种A强度高,但焊接问题需要用特殊手段解决。建龙有个钢厂靠近黑河,从那里买材料可以降低运费...
在上面的回答中,涉及到地里知识、商务知识、材料知识;如果再追问一下,可能还会有更生层次的知识。由此可见,大模型把多个领域的知识融合在一起,问题的边界是不确定的。其边界拓展的范围,是从大数据学习到的“关注力”决定的。人类事先是说不清楚的。
我觉得,把大模型直接用在过程控制上是不合适的。原因是:工业过程的本质特点,是标准化运行。换句话说,尽量把干扰阻隔在系统之外,让系统变得简单。在这种系统中,各种干扰往往都是“预料之中”的,而不是“预料之外”的。这时,小模型可以事先给出预案、给出精确的计算结果,从而很好地解决问题。为了系统的安全可靠,人们在开发小模型的时候,会考虑到各种可能的意外:为了系统的安全,有些意外可能几十年不发生异常,也需要考虑在内。如果试图用实际数据训练大模型,这样的数据可能根本不存在。
维纳在控制论中讲过一个故事:有一对老夫妻得到一个法宝,可以满足主人的三个愿望。夫妻俩的第一个愿望是希望得到200英镑。结果,第二天有人送来200英镑。但告诉他们:你们的儿子被机器压死了,这是抚恤金。他们的第二个愿望是希望儿子回来。结果,儿子的幽灵回来了,不断地骚扰他们,致使两个老人的精神崩溃了。于是,他们提出第三个愿望是:让儿子走吧。在这个故事中,维纳说的“法宝”其实暗指人工智能。他用这个故事告诉大家:让人工智能做事,不能只考虑得到了什么,还要考虑怎么实现的。否则,得到的结果可能不是人们所希望的。我不主张用大模型解决过程控制问题,也包含这个道理。恰巧的是,在前面提到的例子中,现场的反馈恰恰就是大模型控制的“代价有点大”。如果大模型被赋予太大的权力,这种危险性可能更大。
用大模型解决这些问题,首先是有“杀鸡用牛刀”的问题,增加问题的复杂性和不确定性。其次,用真实数据训练大模型时,可能缺乏必要的异常数据,导致系统遇到现实问题时无所适从,可靠性降低。
当然,我也不是完全排斥大模型。在建立小模型的过程中,大模型可以帮助人们思考和分析问题,尽快地完善小模型。也就是说,中间经过“人”这个环节,作用于小模型。这是完全有可能的。大模型可能还有建模速度快的优势,可以用在对安全性、稳定要求不大的场景。但是,根据我的经验:模型的价值往往与安全稳定性要求是一个硬币的两面:对安全稳定性的要求低,技术含量就比较低,价值也相对较低。
在自动控制方面,大模型的主要用途应该用在开放系统、开放性的问题。比如无人驾驶技术。在这类系统中,系统外部可能发生的事情是难以预料的,可谓千奇百怪。对于这些问题,传统小模型根本无法解决。当然,大模型的问题照样存在,安全、稳定和可靠性仍然是关键。
在小学里,1+1等于2;在中学和大学里,1+1仍然等于2。如果问题边界是清晰的、问题研究是透彻的,小模型的结果就是对的,大模型的结果不会比小模型更好。
来源:微信号 蝈蝈创新随笔
作者:郭朝晖
该作品已获作者授权,未经许可,禁止任何个人及第三方转载。
楼主最近还看过