大模型与工业智能的思考 点击:18 | 回复:0



wangamin

    
  • 精华:0帖
  • 求助:0帖
  • 帖子:93帖 | 7回
  • 年度积分:30
  • 历史总积分:283
  • 注册:2021年8月24日
发表于:2025-05-28 09:48:33
楼主

大模型或者基于大模型的相关技术风起云涌,由不得人不进行观察和思考,并且必须要进行那种本质上的深度思考才行看透这个。


人工智能大模型的主要类别包括:大语言模型、视觉大模型、多模态大模型以及基础科学大模型等。目前,大模型已在多个领域得到广泛应用,包括搜索引擎、智能体、相关垂直产业及基础科学等领域,推动了各行业的智能化发展。…《百度百科》



毋庸置疑,大模型取得了很大的进展。


个人理解:不管什么样的模型,其本质上来说都是追求一种推理能力,推理一定是有他的推理机制的,而这个推理机制是需要表达的,因为推理规则的多样性,所以穷举是很难的,所以现在的大模型是干脆放弃直白穷举的做法,而是通过海量的单体元素之间的海量的关联关系,来表达其中内涵的无穷多组合的推理规则,所以现在的大模型有千亿万亿级别的这种参数,就如同字词句逐步过渡和组织一样,走到极端了其实和穷举差不多,所谓的算法就是在减少搜索以便快速找到关联关系。


工业智能的核心也是推理,正如透过现象看本质一样。工业智能也是需要建立模型的,当这个模型的参数很多的时候,你也可以称之为大模型,但这种大模型跟前文所说的大模型应该来说是不一样的,因为工业上的大模型所使用的参数可不是语言大模型(理解你说的话,组织文字回答你的问题)所使用的那些文本,更多的是工业专业领域内的机理知识。而要表达这种机理,也是需要大量的知识的,这些知识也可能是以文本的形式来作为载体的,对这些文本关联关系的解析表达,其实就是模型的核心,当所需的文本足够丰富的时候,也相当于是大模型了,所以现在使劲的在提大模型在工业中的应用。这话是对的,但要明白内在的不同与相同。


个人理解:大模型的训练当然是非常重要的,相当于是对于现有知识的一种固化,并且在后续能够将这些知识利用起来进行推理。正如我们说的文字是一种语言,其实音乐和画也是一种语言(类比视觉大模型和基础科学大模型),工业智能的机理知识就类似音乐和画一样,虽然本质上来说是一样,但还是有很大不同的。


个人理解:那用什么机制来固化庞杂参数之间关联关系呢?神经网络,transformor等技术与框架及其衍生出的各种新颖的技术点,就应运而生了。这些方法本质上来说都是在模拟人的神经网络与记忆能力,需要不停的刺激来实现知识的固化其实就是参数之间的关联。但本质上来说,这个机制都是非常被动的,个人感觉后续应该会发展出一些主动的学习机制。这个新的机制是啥我也不知道,但应该可以向大自然的学习。郑州现在都是向人来学习一样,人是万物之灵,但人也只是已知万物之灵而已,难道是完美的吗?


个人理解:以亿作为单位的参数及其关系,当然是很庞杂的。个人认为现在的大模型推理是每次都推理一些之前已经处理过的知识或者规则,其实是很大的浪费。所以我感觉当你有很多既定的现有规则之后,或者说继前一次训练的结果基础之上,再进行下一次的提升,应该是一个很好的可行之路。不知道现在这个领域里面是不是已经有这方面的技术了?有的话还请指教。这是一个简单的道理,培训一个成年人和培训一个儿童,掌握的知识量及其掌握速度肯定是不一样的。


来源:微信号  智能制造随笔

作者:王爱民

该作品已获作者授权,未经许可,禁止任何个人及第三方转载。





楼主最近还看过


热门招聘
相关主题

官方公众号

智造工程师