一辆牛车拉着5块石头过桥。但桥的承载能力有限,车上放2块石头就会压垮。怎么办呢?方法特别简单:分5趟过桥,每次只载一块石头。
很多棘手的问题就像牛车过桥一样,本质上是把多个难题搅和在一起,让人感觉无法解决。但如果能把问题拆成若干子问题,就可以逐一解决,工作就会变得相当容易。但是,外人往往只看到解决问题的结果,看不到问题拆分的过程。某人声称“用一辆车把五块石头运过桥”时,别人脑中的想象往往是他一次性把五块石头运过去,就会觉得对方的能力很强、很神奇。
昨天,我在一家大型企业评审数智化人才。许多人谈到对未来的规划时,表示想学习数据分析、大数据建模的技能。我觉得,他们可能两类事情看得过于神秘了。其实,我们遇到的困难就像“牛车过河”:如果不理解实现过程,就会觉得很难;但只要把过程分解清楚,往往就不难了。
在我看来,数据分析的核心任务其实就两件事:发现某些具体事件发生、判断事件是否由特定原因引发的。这两件事本质上可以变成检验问题,简单得很。很多人会纠结一些问题。比如,在判断某个事件是由某个特定原因产生的,事先怎么知道可能是这个原因呢?其实,事先需要做一件事情:列出一个可能的问题清单。列清单可以根据经验、可以根据逻辑分析、可以通过一些初级的数据分析方法。清单列完之后,让计算机逐一判断就可以了。至于清单的生成,则是另一件独立的工作。这就好比,厨师做饭之前,先要准备好米。
很多人觉得数据分析困难,原因是把建模业包含进来了,建模是另外一回事。绑在一起麻烦就大了。现在我们再来谈谈建模。
建模这件事,其实也可以分成两个部分:对实践结果的拟合以及去噪。也就是说,建模的本质是基于实践的,模型通常只针对实践范围内的有效,不涉及实践范围外的情况。用模型进行范围外的预测则是另一码事:本质上属于科学研究领域,不宜混为一谈。有些人动不动就希望模型能预测,但如果定位不清楚,就相当于把一块很大的石头绑在一起了。
基于工业大数据的建模看起来很难,其实与传统的统计建模方法在本质上是一样的。但前提不同:统计建模通常有各种先验假设,比如不存在未知的系统干扰。所以,解决工业大数据建模的问题,只需要前面增加一个环节:判断并消除潜在的系统干扰。这也类似于将一件事分解为两件事。
十五年前,我写《管中窥道:技术创新的观念与方法》时,殷瑞钰院士给我提了一个观点:模糊问题清晰化、复杂问题简单化,这才是创新的真谛!在数字化时代,我们现在面对的许多问题,本质上已经是工程问题了。我们要善于拆解问题,把复杂的难题变得简单。这才是工程师需要掌握的本事。
来源:微信号 蝈蝈创新随笔
作者:郭朝晖
该作品已获作者授权,未经许可,禁止任何个人及第三方转载。
楼主最近还看过