工业大数据怎么用-专业自动化论坛-中国工控网论坛

工业大数据怎么用点击：394 | 回复：1

精华：2帖
求助：0帖
帖子：299帖 | 7回
年度积分：6
历史总积分：1018
注册：2016年9月13日

发表于：2019-01-25 10:16:37

楼主

最近讲工业大数据，我常讲几个数字。

一个目标，就是用大数据提高智能化水平。我常把创新比作“打兔子”。而需要提高智能化水平的地方，就有“兔子”。但是，正如我过去反复强调的：对“智能”的理解方式不要钻牛角尖、思想要开放。可以提高机器的智能化，也可以帮助提高人的决策能力。提升智能的结果，往往体现在人机界面的改变。

工业大数据的应用也是这样——在信息获取、知识获取、决策、执行等环节都可以有新的人机界面工作方式。在这些方面，要有想象力，并根据实际的情况来做。比如，数据太多太散的时候，可以让机器自己去找信息；数据组织得好时，可以让人自己去找；可以用人机协同获得知识，也可以让机器自己去找知识；可以是机器用知识、变成智能设备，也可以是人用知识；大数据的人类用户可以是工程师也可以是消费者.......。用在什么场合呢？我的观点是：用在需要知识才能做得更好的场合。

当然，和其他IT技术一样，工业大数据技术落地的前提常常是业务牵引、以终为始。即所谓“现有需求，再找方法”。但具体的应用点要自己来找，就像自己的饭要自己吃，别人帮不了你。这个观点我说了很多次，这里就不多说了。

二次应用。大数据的价值在于：用过去产生的数据，让现在的业务活动做得更好——这就是二次应用。我常说：先做成、后做好。大数据主要用于做好的持续优化阶段。换句话说：搞大数据的人，对最初的业务如何“做成”是没有责任的；而没有“先做成”的业务逻辑，大数据也就没有办法落地。我强调这一点的原因是：把两个困难混在一起，可能就做不成事了；把困难分成两步，就好做多了。“做好”也包括多个方面：质量更好、速度更快、成本更优，而不仅仅是决策质量更好。比如，知识和信息的重用，就可帮助人们做得更快、成本更低。如果一定要强调“决策质量更优”，可能会失去很多创新机会。

l两类承载。承载信息、承载知识。大数据首先是用来承载信息的——我强调信息的目的是：不是碎片化地收集数据，而是去收集有联系的数据、收集数据之间的联系；最好是完整的信息，不要是破碎的信息。

同时，大数据也是可以承载知识的，即把知识提炼出来、用大数据承载——我强调的是：在某些应用中，应该先把知识有效地组织起来（如产品设计数据、设备标准状态数据）、事先把数据的质量管好，而不是用的时候再产生知识。这样，用的时候就方便了。事实上，很多“知识”需要很大的数据量才能存储起来。不久前参观一个企业，每天处理设计数据的电费就有10万块钱。换句话说：大数据给知识的承载带来了新的机会。

总之，不论承载什么，都要便于应用为目的。不要总想着“从数据提取知识”这一件事、一个环节，而是要以具体的应用为牵引，根据具体需求、以终为始地建立大数据基础。

三个优势。在学习别人观点的基础上，我把工业大数据的优势归结为三个：不纠结于因果（区别于“是相关不是因果”、“一定是因果”）；样本=全体（区别于大数据是PT级别）；混杂性（叫多角度似乎更好）。

所谓“不纠结于因果”指的是保证具有因果关系，而具体应用时不必再去按照因果逻辑计算。这一条，使得人们可以从大数据中得到各种类型知识（特别是经验知识、感性认识）、获得知识的方法也简单了很多。“样本=全体”。我认为，从应用的角度看，数据不在“多”、而在“全”。全了以后，就总能找到自己需要的知识和信息；这样对应用的价值非常大。

我还认为，“混杂性”是保证知识质量和准确性的、因为我们可以从多个角度印证知识。当前，前提是大数据记录的信息完整。我们知道，在工业中，高质量的知识才有用。

所以，三个优势的本质，都落脚在“知识的优势”上。

前些天，有人用挑衅的口气问我：我们的数据不具备这些条件怎么办？我当时很想怼他一句：“我是教你做饭的，你却问我家里没米怎么办、或者稻子还没收割怎么办。”我后来想了想到了下面这张图就忍住了，而是在这里写点东西。

有些人确实不知道“修行靠个人”的道理。有些道理，他自己应该想明白，却不明白。

比如，对“样本=全体”这个假设。现实中是不可能完全满足的。一个重要的原因可以归结到一个哲学命题：“世界上没有两片完全一样的叶子”。从这个角度看，每一个问题其实都是新的。“样本=全体”的前提，是对问题抽象、归纳、总结——这往往是人类才能做的事情，至少是人类需要告诉计算机怎么做。如果机器能把这种事承包下来，要人干什么？更何况，“样本=全体”是需要你事先准备数据的，不主动去准备，天上不会掉馅饼。而且，“样本=全体”针对的是过去。未来发生特殊的事情也是可能的。在工业应用中，需要有后备的办法来提高可靠性。这些东西，应该是自己去体会的。自己体会不到，就开始做“杠精”。

再如“不纠结于因果”的前提是保证因果。我强调“不纠结于”，指的是可以不按照因果的逻辑去推导、计算——这意味着工作复杂性的降低、知识范围的拓展。这个意义非常重大，是大数据的本质优势之一。我提出这个观点，只是因为我不同意“是相关不是因果”这种说法——因为这种说法不适合于工业。但是，“保证因果”是怎么做得到的？是具有专业知识的人保证的！谁听说过数据分析能保证因果吗？搞数据分析，应该有点认识论的常识才行。

来源：微信号蝈蝈创新随笔

作者：郭朝晖

该作品已获作者授权，未经许可，禁止任何个人及第三方转载。

分享到：