基于工业控制系统大数据分析需求由来已久,以发展出不少平台和工具,各有特点和优势,本文介绍一种基于通用电气(GE)大数据建模分析平台的应用案例,包括平台框架以及实际开发的应用,用以展示如何通过Csense构建基于工业控制系统的大数据分析平台。
本系统主要包括以下几个子系统:数据收集子系统、预处理子系统、存储子系统、分析子系统、模型部署子系统、应用子系统,各子系统通过分布式灵活配置和部署。
数据收集子系统:
数据收集针对实时数据和历史数据有两种处理方式,针对实时数据可以通过PLC、DCS或者传感器进行现场采集,采集相关设备的数字量,模拟量等电气特性,通过部署GE IFIX SCADA对数据进行实时处理;针对历史数据,可以通过关系型数据库、文本数据库等方式将已有的数据导入到系统,进行历史数据的收集。
数据预处理子系统:
收集的数据并不都适合系统应用,通过Proficy Csense中的Architect系统对数据进行过滤、降噪、合并等预处理,可以根据数据处理的需求不同,在数据进入数据库之前部署,也可以从数据库中读取数据后进行处理。
数据存储子系统:
实时数据库使用GE Historian数据库是一种专门针对工控数据进行设计的高性能实时存储数据库,与IFIX SCADA连接实时存储工控数据,当然也可以使用PI数据库;历史数据库使用Oracle,SQL Server等数据库进行存储和管理。
分析子系统:
Proficy CSense通过连接不同种类的历史数据源,快速构建分析模型,分析连续、离散、批次生产过程。可以进行数据预处理、可视化查看数据,灵活方便的定义数据处理流程,利用现有的数学算法建立规则模型,从这些模型中挖掘出的知识,帮助对过程改进的收益进行评估,整个过程也非常简单方便、工作量很少。使用这个模型系统,可以找出生产过程波动的原因,并且进行调整,达到稳定产品质量、提高产量的目标。
模型部署系统:
通过Proficy CSense部署工具,将数据源定义为实时数据源,实时运行分析系统构建的模型,模型可以针对数据进行实时预测和分析,与此同时,为多个应用端提供实时分析结果,帮助用户应用分析结果。
应用子系统:
通过开发应用系统将根据Csense模型分析的结果加以利用,可以为用户提供丰富多彩的图形化显示,根据分析结果为用户提供决策依据,比如可以将预测结果应用到实时预警,根据数据的特征提取值了解分类,并根据分析结果与专家系统进行配合优化用户的生产流程。
接下来将介绍各个子系统的应用构架,如何协作完成数据分析,并介绍实际应用案例。