工业大数据是产业智能的基础。没有数据,AI就是无米之炊。但很多企业的数据平台建设走入了误区——重平台轻应用、重采集轻治理、重技术轻业务。花大价钱建了平台,采了一大堆数据,却回答不了“这个数据能解决什么问题”。
工业大数据平台不是越大越好,是越有用越好。从业务问题出发,用数据解决问题,才是正道。
工业数据来源多样、格式各异、质量参差,这是工业大数据的特点,也是难点。
设备数据来自PLC、DCS、SCADA,包括温度、压力、流量、电流、振动等。特点是频率高、连续、量大,但往往没有业务标签(只知道数值,不知道对应什么工况)。
业务数据来自MES、ERP、WMS,包括工单、BOM、库存、质量检验等。特点是结构化、有业务含义,但更新频率低、粒度粗(如按批次、按工单)。
环境数据来自温湿度传感器、能耗仪表等,是辅助数据,但有时很关键。
人工记录来自交接班记录、巡检记录、维修记录,信息丰富但格式不统一、质量不稳定。
很多企业的问题是:设备数据在自控部门,业务数据在IT部门,人工记录在生产部门。数据分散在各个部门,没有人把数据关联起来。
一个实用的工业大数据平台,不需要从一开始就建得“大而全”,但架构要清晰。
采集层负责从各种数据源采集数据。设备数据通过OPC UA、Modbus等协议采集,业务数据通过API或数据库同步,人工记录通过移动端或PC端录入。采集层要解决数据连通性问题,确保数据能稳定、实时地上传到平台。
存储层负责数据的存储和管理。时序数据(设备参数)用时序数据库存储,适合高频写入和查询。业务数据用关系数据库存储,保持数据一致性和事务能力。非结构化数据(文档、图片)用对象存储。存储层要解决数据组织问题,不同用途的数据用不同的存储方案。
处理层负责数据的清洗、加工、计算。处理缺失值、异常值,统一单位、命名,关联设备数据与业务数据(某个工单对应的工艺参数),计算衍生指标(OEE、Cpk)。处理层是“脏活累活”,但也是最关键的环节。数据不经过清洗和治理,上层应用没法用。
应用层负责数据的消费,包括可视化看板、报表、报警、预测模型、优化建议等。应用层要解决价值呈现问题,让数据能被业务人员使用。
工业大数据平台建设最大的坑不是技术,是数据质量。没有经过治理的数据,存得再多也是垃圾。
数据质量问题:缺失(传感器采集不稳定、人工录入漏填),错误(传感器漂移、通信干扰、单位不一致),不一致(同一参数在不同系统命名不同、单位不同),无标签(只有传感器数据,没有工况标记(正常运行、停机、换型、故障))。
数据治理的内容:建立数据标准(统一命名规则、计量单位、编码规则),数据清洗(处理缺失值、异常值、重复值),数据关联(建立设备数据与业务数据的关联,给每个数据打上标签(工单号、产品型号、批次号)),数据质量监控(定期检查数据的完整性、准确性、及时性,质量不达标的数据不入库)。
数据治理不是一次性项目,是持续的过程。
某企业建了大数据平台,采集了上百个设备的数据,但分析时发现没法用——温度单位有的是摄氏度有的是华氏度,压力有的是表压有的是绝压,设备状态没有标记,不知道数据是在什么工况下采集的。数据治理花了三个月,平台才真正用起来。
工业大数据项目失败最常见的原因:先采数据,再想怎么用。采了一大堆,发现用不上。
正确的做法是先明确业务问题:质量波动为什么大?设备为什么频繁故障?能耗为什么高?然后确定需要什么数据去回答这些问题,再倒推需要采集什么、治理什么。
业务驱动示例:某反应釜收率波动大,好的批次78%,差的批次72%。需要的数据包括每批次的工艺参数(温度、压力、时间、搅拌速度)、原料批次信息、设备状态记录、操作班组。分析后收率稳定在77%以上。
不要为了“大数据”而做大数据。没有明确的业务价值,平台建了也是摆设。
楼主最近还看过


客服
小程序
公众号