TDC 3000系统历史模件的故障处理 点击:843 | 回复:0



sxy8894

    
  • 精华:7帖
  • 求助:0帖
  • 帖子:30帖 | 2回
  • 年度积分:0
  • 历史总积分:124
  • 注册:2005年7月26日
发表于:2005-08-04 09:22:00
楼主
在Honeywell公司的TDC 3000分散控制系统中,历史模件(HM)是LCN网络上以硬盘为基础的文件存储节点(见图1)。
图1 TDC3000系统结构示意框图 HM具有如下功能:支持操作站US、现场控制站APM等网络节点下装操作属性软件、数据库;搜集和存储组态数据,可通过系统指令进行文件管理;在日志文件里,存储系统发生的事件,便于分析和隔离系统问题;采集生产过程的测量数据,作为历史趋势。 由此可见,HM在TDC 3000系统的组态、运行、维护中起着非常重要的作用。辽阳石化公司炼油厂加氢、常减压等六套装置的控制系统均采用TDC 3000系统。在几年的维护工作中,我们曾处理了几个历史模件HM出现的问题,保证了分散控制系统平稳运行。 一、HM的启动方式及硬件构成 HM上电,硬件自诊断程序通过后,用本节点硬盘上存储的&HMO操作属性软件下装HM的内存,HM进入正常工作状态。这一过程叫自启(AUTOBOOT)。HM的硬件由电路部分和冗余硬盘组成(见图2)。
图2 历史模件硬件构成图 智能外设控制电路板SPC、SPC I/O、WDI I/O,WDI卡用于和冗余硬盘DRIVE5和DRIVE4进行通信。K4LCN和相应的LCN I/O电路板提供了LCN网络和SPC电路板的电路连接,K4LCN板包含HM的处理器和存储器。用于执行操作属性程序(&HMO)或离线属性程序(&HMI)。&HMO是HM正常操作的属性,它提供了历史数据采集及存储功能,同时也给其他节点提供了文件服务功能。&HMI属性只是为HM自身使用,不支持系统其他功能。它只在HM硬盘驱动器故障或HM硬盘介质表面故障被修复后,做HM初始化时使用。 为了便于分析历史模件的故障,我们将K4LCN和SPC板上的状态指示灯列表,如表所示。
二、故障处理 (一)HM不能自启 现象1:HM上电后,K4LCN自检通过绿灯亮,LED灭,地址灯显示地址。SPC自检错误红灯亮,自检通过绿灯灭。 因为SPC板自检错误红灯亮,说明此板或相应的电路板没有通过硬件自诊断程序,所以更换SPC板,历史模件重新上电,故障依然存在,可以判断SPC板没有问题,我们把故障确定在SPC板以后。更换SPC I/O、WDI I/O,系统上电后,故障现象没变。考虑到DRIVE 5和DRIVE 4互为冗余,将DRIVE 4电源关掉,DRIVE 5和HM上电,SPC红灯灭,但不能自启。反过来将DRIVE 5关掉,DRIVE 4和HM上电,SPC红灯灭,也不能自启。两个DRIVE同时有问题的可能性很小,应查找其他硬件的问题。将WDI板拆除,用电子清洗剂清洗板子的电路接口,此板在硬盘和WDI I/O中间,从节点箱前后都看不着。重装WDI板,分别给DRIVE 5和DRIVE 4上电,发现DRIVE 4可以自启,DRIVE 5仍不能自启。说明通过上述处理后,WDI接触不良的问题已消除。DRIVE 5不能自启的原因有如下3种:DRIVE 5上硬盘损坏;DRIVE 5托盘内的SCSI电缆损坏;DRIVE 5托盘上电路插口与WDI板接触不良。 将DRIVE 5和DRIVE 4上的硬盘对调,注意硬盘上SCSI地址要重新设置,重新上电,发现故障现象没变,说明DRIVE 5上硬盘没问题,恢复原始状态。将DRIVE 5和DRIVE 4上的托盘对调,发现DRIVE 5开始自启,DRIVE 4不自启,所以故障点缩小到DRIVE 5托盘内SCSI电缆坏,或者DRIVE 5与WDI板接触不良。恢复原始状态。通过仔细检查,DRIVE 5托盘内SCSI电缆没有发现问题。所以判断DRIVE 5托盘上电路插口与 WDI板接触不良。通过反复插拔并清洗电路接口后,DRIVE 5开始自启,历史模件工作正常。 现象2:K4LCN和SPC板所有的状态指示灯都正常。HM自启需要两个条件。一是HM的电子电路正常工作,二是在HM硬盘本地卷!901里要有以下16个文件: L01_NVCF.MM  历史模件HM组态软件 WDBOOT.BO 温盘I/II本地引导文件 WRBOOT.BO 温盘Ⅲ本地引导文件 QLT1.PI  试验程序 OFT1.PI  离线过程测试 $B00T.MS 历史模件HM引导文件下装器 HMOFFLK1(2,3),PI 操作属性文件1(2,3) HMONPK1(2,3,4),PI 操作属性文件1(2,3,4) C01_CPNT.MM 存贮组态数据的时间/周期 根据故障现象可以判断HM的电路部分工作正常,应重点检查!901卷里所需要的自启软件是否丢失,用系统盘给历史模件下装&HMI离线属性,使用指令:LS PN:nn>!901 -D(nn是历史模件的节点地址)列一下!901里的文件,发现文件L01-NVCF已丢失,将该文件重新拷贝到历史模件HM的!901后,历史模件恢复自启功能。 (二)HM两个硬盘的连续历史趋势卷!001上有数据错误 现象:历史模件停止了历史数据存储功能,HM显示状态为SEVERE,操作员看不到过程变量的历史趋势。 为了解决这个问题,按系统菜单调出键,选历史事件检索画面的状态通知,查找有关错误的文件或扇区号。若能得到这些信息,可使用系统的SMCC硬盘表面修复软件进行在线initialize/reassign处理,但没有发现故障代码和维护信息。因此,我们对历史模件做了初始化处理。 应该首先进行软件备份工作,需要注意的是,历史卷应该用CPV指令拷出。由于历史卷!001里已有数据错误,此卷就不备份了。但组态的历史趋势点要存储在一个中间文件(Intermediate Data File)上,以便历史模件初始化后重新下装。 进入工程师菜单,选卷组态(VOLUME CONFIGURATION),按(CONTROL+F6)键执行初始化。 历史模件初始化后要做以下工作: 恢复本地卷 CP &Fn>&ASY>*.* PN:nn>&ASY>= -D EC &F2>&EC>LOC_VOL.EC &F2 nn np 历史模件重新上电自启 把系统软件和用户建立的数据库拷贝到HM中 RESTORE $Fn> NET>VOLM 两个硬盘做同步 SYN PN:nn; 上述步骤完成后,历史模件状态变OK,历史趋势功能恢复。为了防止类似故障的再次发生,我们需要分析一下问题产生的原因。引起数据错误的原因通常有:硬盘个别扇区坏,电源噪声影响,CPU在对硬盘的读写过程中电路接触不良,硬盘的工作电压不在允许范围内。用万用表测量电压,发现硬盘的工作电压为5.1V,9.1V,可以断定电压超范围是造成数据错误的原因。更换电源板后,该故障不再发生。 三、结束语 HM是TDC3000系统中的关键节点。因此,在处理历史模件的故障时,特别是当装置处于生产工况下,要制定好故障处理方案,做好各个节点快速启动盘以及数据库备份等工作。要充分利用系统在线测试软件提供给我们的各种信息,例如,查看HM节点状态画面,检查SPC和K4LCN板上的状态指示灯,也可在历史事件检索画面查询系统错误信息、系统状态通知、系统维护信息等。通过这些信息,我们可以缩小故障的查找范围,迅速地找到处理故障的切入点。历史模件需要下电检修时,要记录好从各种画面得到的故障现象,以防和问题有关的关键信息丢失,切记在历史模件正常运行时,不要按电源模件上的复位按钮,这样会造成硬盘本地卷污染,导致历史模件不能自启。更换电路板时,要带好防静电手环,避免由于身体静电损坏卡件。 (作者:辽阳石油化纤公司仪表厂高级工程师 许元丁)


热门招聘
相关主题

官方公众号

智造工程师