工业大数据时代的建模技术与艺术 点击:296 | 回复:0



gchui

    
  • 精华:2帖
  • 求助:0帖
  • 帖子:299帖 | 7回
  • 年度积分:6
  • 历史总积分:1018
  • 注册:2016年9月13日
发表于:2018-08-14 10:39:10
楼主

讨论技术问题时,常常会问:“A增加1时,B会增大多少?”。这个问题背后,其实反映了人们习惯的一种“线性思维”。微积分中的“导数”就体现了这种思维。严格来讲,这种思维是有局限性的,存在“不可导”的现象。然而,大多数的现实问题在多数情况下是“可导”的。这种普遍性的存在,是“微积分”能成为重要的数学分支的原因。

 

运筹学中有个著名的方法叫做“线性规划”。这个方法是美国人 丹齐克(DantzingDantzing)提出的。当他介绍这个方法时,受到有位著名数学家的质疑:世界是非线性的,线性规划有什么用?对于这个问题,年轻的丹齐克被问懵掉了,站在台上说不出话。这时,听众中有位长者举手,代他回答这个问题:“如果你遇到的问题是线性的,你就用这个办法;如果不是,你再想别的办法。”而这位长者就是著名数学家冯.诺依曼。

 

线性与非线性的矛盾一直困扰着人们。但是,两者却也能有机地结合。我们知道:微积分适合大量的非线性函数。两者的关系是:“可导”是局部的特点,“非线性”是大尺度或全局性的特点。事实上,数学和工程科学上遇到非线性问题,往往会被人们转化成某种意义下的线性问题——线性特点实在是太好了,离开这个特点的研究几乎寸步难行。

 

这个困惑同样也摆在工程师面前。

 

工业上绝大多数问题都是非线性的:比如钢材的成分、工艺参数与性能之间的关系就是非线性的。如果工程对象是线性的,数据建模就是非常方便的——只要线性回归就可以了。然而,现实中的模型往往既不是线性的、还不知道该如何描述非线性。

 

这就是数据建模的困惑和魅力所在。

 

我常说:理论是解决方向性的问题。其实,只有当我们遇到非线性问题时,“方向性”才是个问题。然而,解决“方向性问题”的方法,往往不能解决“落地的问题”。因为落地的问题往往是细活——所谓细节决定成败。具体到模型,往往是精度决定好坏。

 

某种意义上说,工业对象的建模是一门艺术:是“方向性问题”和“落地问题”的融合。

 

昨天在攀枝花,我把建模问题比作“打高尔夫球”。打球可能会分成几个阶段:首先用力打、把球打到一个差不多的地方。接着要瞄准方向、用好力气,甚至可能要经过几次调整,直到把球打进洞里。

 

对于工业过程的建模,一般也要先找到一个差不多的初始工作点:这个工作点一般是通过经验和宏观的理论得到的——有经验的专家脑子中中往往有一个说不清楚的非线性模型。有了这个“工作点”以后,大尺度的全局问题就变成了小尺度的局部问题,就可以近似“线性”了。人们再在这个工作点附近进行实验、调整,就容易多了。而工程师的水平在于可通过比较少的实验来解决问题。

 

控制论之父维纳有个著名的思想:“反馈修正”。他认为模型总是有误差的,关键是要进行修正。在修正的过程中,方向往往是理论给出的,而修订的大小却往往要用数据进行修正。我的经验是:数据建模切忌“急于求成”,希望有个好的模型一下子解决问题。一个好的模型一定是通过反复修正得到的,关键的问题是如何反复修正、如何尽量少的修正。换句话说,数据建模来不得“大跃进式”的急功近利。善于反复修正,才体现工匠的水平和精神。


现实中,如果不依靠人的经验,往往很难用理论和数据来摸索到这个比较好的“初始工作点”。进一步利用理论和数据建立模型,往往能做得比人更好。这就是数据建模的价值所在。

 

而大数据的作用,往往能把以往人的成功经验用数据记录下来,自动地找到一个比较好的“初始工作点”。我们不必关心经验怎么来的,这就是大数据“不纠结于因果”。由于大数据具有“样本=全体”的特点,无论各种情况,好的初始工作点几乎总能找到。而数据涉及到各种方面的信息、容易帮助人们找对,这就是大数据“混杂性”带来的优势。这就是大数据(数据的二次应用)对建模的作用。

来源:微信号 蝈蝈创新随笔

作者:郭朝晖

该作品已获作者授权,未经许可,禁止任何个人及第三方转载。




楼主最近还看过


热门招聘
相关主题

官方公众号

智造工程师