【请教】如何处理因异常而断裂的数据样本 点击:361 | 回复:0



nolie

    
  • 精华:0帖
  • 求助:0帖
  • 帖子:1帖 | 0回
  • 年度积分:0
  • 历史总积分:3
  • 注册:2002年9月25日
发表于:2006-03-31 20:04:00
楼主

在一个化工过程优化的项目中,因为生产条件所限,时常出现一些异常,使得数据波动。
我采用自适应思想的优化措施,但是对于处理这些波动的异常数据不知道该如何下手,
想就此请教诸位大虾几个问题:

1.如何有效的判断这些异常?因为过程优化的对象本身就可能出现工作点偏移,这种情况
  就是我优化所要追踪的一部分,所以应当与异常分离考虑;但是这样一来,有时很有可能
  判断不清。不知道大家一般采用什么策略,我现在采用的是模式识别的聚类分析,但效果
  不佳,想请大虾给支支招!

2.如果找到异常,剔除异常数据,那么产生断裂的这些数据如何继续使用来进行下一步的
  优化工作呢? 直接拼接使用似乎不妥,因为断裂处两端的数据很可能已经是不同特性
  的系统模型。我考虑过先判断两侧数据的统计特性,或者分别建模比较,但是一方面
  这样的可操作性太差,另一方面,本身精度不高,即使比较也不能得到肯定的结果。
  我想请问对于这种因异常引起的断裂数据样本应该采用什么样的处理策略比较有效?

非常感谢诸位看我的问题,希望大家能够不吝赐教,谢谢!



热门招聘
相关主题

官方公众号

智造工程师