现象主要是:从趋势曲线上看,某个站的数据曲线为直线,时间大约1分钟;从error.log文件内容看,始终报告“采集失败”和“开始采集”信息,间隔时间较短。现场设备没有异常,控制功能没有异常。
分析结果:error.log文件是gmonitor程序产生的,主要负责记录gmonitor程序与控制器的运行状况。由于网络原因造成数据丢包而记录“采集失败”,当gmonitor启动后不断记录该类信息达到20000条时,gmonitor将转存文件,同时gatewaywatch程序判断GMONITOR程序已经“死亡”,而需要重新杀掉重启。而这个过程大约需要60多秒,重而造成曲线拉平,但不会影响控制功能的实现。
有空清除一下error.log文件内的记录。