Advertisement
当前位置:
工业大数据怎么用
回复 | 人气 | 打印
gchui 个人主页 给TA发消息 加TA为好友 发表于:2019-01-25 10:16:37 楼主

最近讲工业大数据,我常讲几个数字。


一个目标,就是用大数据提高智能化水平。我常把创新比作“打兔子”。而需要提高智能化水平的地方,就有“兔子”。但是,正如我过去反复强调的:对“智能”的理解方式不要钻牛角尖、思想要开放。可以提高机器的智能化,也可以帮助提高人的决策能力。提升智能的结果,往往体现在人机界面的改变。


工业大数据的应用也是这样——在信息获取、知识获取、决策、执行等环节都可以有新的人机界面工作方式。在这些方面,要有想象力,并根据实际的情况来做。比如,数据太多太散的时候,可以让机器自己去找信息;数据组织得好时,可以让人自己去找;可以用人机协同获得知识,也可以让机器自己去找知识;可以是机器用知识、变成智能设备,也可以是人用知识;大数据的人类用户可以是工程师也可以是消费者.......。用在什么场合呢?我的观点是:用在需要知识才能做得更好的场合。


当然,和其他IT技术一样,工业大数据技术落地的前提常常是业务牵引、以终为始。即所谓“现有需求,再找方法”。但具体的应用点要自己来找,就像自己的饭要自己吃,别人帮不了你。这个观点我说了很多次,这里就不多说了。

 

二次应用。大数据的价值在于:用过去产生的数据,让现在的业务活动做得更好——这就是二次应用。我常说:先做成、后做好。大数据主要用于做好的持续优化阶段。换句话说:搞大数据的人,对最初的业务如何“做成”是没有责任的;而没有“先做成”的业务逻辑,大数据也就没有办法落地。我强调这一点的原因是:把两个困难混在一起,可能就做不成事了;把困难分成两步,就好做多了。“做好”也包括多个方面:质量更好、速度更快、成本更优,而不仅仅是决策质量更好。比如,知识和信息的重用,就可帮助人们做得更快、成本更低。如果一定要强调“决策质量更优”,可能会失去很多创新机会。

 

l两类承载。承载信息、承载知识。大数据首先是用来承载信息的——我强调信息的目的是:不是碎片化地收集数据,而是去收集有联系的数据、收集数据之间的联系;最好是完整的信息,不要是破碎的信息。


同时,大数据也是可以承载知识的,即把知识提炼出来、用大数据承载——我强调的是:在某些应用中,应该先把知识有效地组织起来(如产品设计数据、设备标准状态数据)、事先把数据的质量管好,而不是用的时候再产生知识。这样,用的时候就方便了。 事实上,很多“知识”需要很大的数据量才能存储起来。不久前参观一个企业,每天处理设计数据的电费就有10万块钱。换句话说:大数据给知识的承载带来了新的机会。


总之,不论承载什么,都要便于应用为目的。不要总想着“从数据提取知识”这一件事、一个环节,而是要以具体的应用为牵引,根据具体需求、以终为始地建立大数据基础。

 

三个优势。在学习别人观点的基础上,我把工业大数据的优势归结为三个:不纠结于因果(区别于“是相关不是因果”、“一定是因果”);样本=全体(区别于大数据是PT级别);混杂性(叫多角度似乎更好)。


所谓“不纠结于因果”指的是保证具有因果关系,而具体应用时不必再去按照因果逻辑计算。这一条,使得人们可以从大数据中得到各种类型知识(特别是经验知识、感性认识)、获得知识的方法也简单了很多。“样本=全体”。我认为,从应用的角度看,数据不在“多”、而在“全”。全了以后,就总能找到自己需要的知识和信息;这样对应用的价值非常大。


我还认为,“混杂性”是保证知识质量和准确性的、因为我们可以从多个角度印证知识。当前,前提是大数据记录的信息完整。我们知道,在工业中,高质量的知识才有用。


所以,三个优势的本质,都落脚在“知识的优势”上。


前些天,有人用挑衅的口气问我:我们的数据不具备这些条件怎么办?我当时很想怼他一句:“我是教你做饭的,你却问我家里没米怎么办、或者稻子还没收割怎么办。”我后来想了想到了下面这张图就忍住了,而是在这里写点东西。

1.png

有些人确实不知道“修行靠个人”的道理。有些道理,他自己应该想明白,却不明白。


比如,对“样本=全体”这个假设。现实中是不可能完全满足的。一个重要的原因可以归结到一个哲学命题:“世界上没有两片完全一样的叶子”。从这个角度看,每一个问题其实都是新的。“样本=全体”的前提,是对问题抽象、归纳、总结——这往往是人类才能做的事情,至少是人类需要告诉计算机怎么做。如果机器能把这种事承包下来,要人干什么?更何况,“样本=全体”是需要你事先准备数据的,不主动去准备,天上不会掉馅饼。而且,“样本=全体”针对的是过去。未来发生特殊的事情也是可能的。在工业应用中,需要有后备的办法来提高可靠性。这些东西,应该是自己去体会的。自己体会不到,就开始做“杠精”。

 

再如“不纠结于因果”的前提是保证因果。我强调“不纠结于”,指的是可以不按照因果的逻辑去推导、计算——这意味着工作复杂性的降低、知识范围的拓展。这个意义非常重大,是大数据的本质优势之一。我提出这个观点,只是因为我不同意“是相关不是因果”这种说法——因为这种说法不适合于工业。但是,“保证因果”是怎么做得到的?是具有专业知识的人保证的!谁听说过数据分析能保证因果吗?搞数据分析,应该有点认识论的常识才行。


来源:微信号 蝈蝈创新随笔

作者:郭朝晖

该作品已获作者授权,未经许可,禁止任何个人及第三方转载。


分享到: 收藏 回复 举报


楼主最近还看过

武汉王工 个人主页 给TA发消息 加TA为好友 发表于:2019-01-25 13:28:43 1楼
 

有实例吗?

  回复 引用 举报

相关主题
周点击排行
周回复排行
    最新求助
      Advertisement Advertisement