此类故障在生产过程中较为常见,主要包括系统设计安装缺陷、控制器(DPU或CPU)死机、脱网等故障,操作员站黑屏,网络通讯堵塞,软件存在缺陷,系统配置较低,与其他系统及设备接口存在问题等。
(1) 某电厂DCS电源系统采用的是ABB公司Symphony III型电源,但基建时仍按照II型电源的接地方式进行机柜安装,与III型电源接地技术要求差异很大。机组投产以来发生多次DCS模件故障、信号跳变、硬件烧坏的情况,疑与接地系统有关。同样,某电厂在基建期间DCS接地网设计制作安装存在问题,DCS系统运行后所有热电阻热电偶温度测点出现周期波动。
(2) 某厂因电源连线松动而导致汽机侧控制系统失效。
经验教训:DCS没有良好的接地系统和合理的电缆屏蔽,不仅系统干扰大,控制系统易误发信号,还易使模件损坏。可见,ups电源、控制系统接地等存在问题将给电厂投产后DCS的安全稳定运行留下极大隐患。因此,DCS系统电源设计一定要有可靠的后备手段,负荷配置要合理并有一定余量;DCS的系统接地必须严格遵守制造厂技术要求(如制造厂无特殊说明应按照DLT774规定执行),所有进入DSC系统控制信号的电缆必须采用质量合格的屏蔽电缆,并要同动力电缆分开敷设且有良好的单端接地。
(1) 浙江某电厂DCS(T-ME/XP系统)频繁故障和死机造成机组停运事故。7、8机组(2*330MW),从1997年2月试生产至5月,两台机组共发生22次DCS系统故障和死机,造成机组不正常跳闸8次。之后又多次发生操作画面故障(8号机组有两次发生全部6台操作站“黑屏”),严重威胁机组安全。经分析认为其DCS系统存在以下几个方面的问题:
① DCS工程设计在性能计算软件、开关量冗余配置上存在问题。
② 硬件配置不匹配(其中包括T-ME和T-XP两种系统的匹配和通信问题)。
③ 个别硬件设计不完善。
④ 进一步分析,关键的CS275(下层T-ME)通讯总线负荷率过高出现“瓶颈”问题现象。而欧洲T-ME/XP系统用户在配置合理的前提下,T-ME/XP系统使用情况基本良好。
(2) 某电厂在200MW机组的热控系统自动化改造上使用的DCS,由于系统配置的负荷率计算不准且为了减少投资,技术指标均接近允许极限,加之该系统有运行时中间虚拟I/O点量大的特点,所以在改造后期调试时发现个别控制器的负荷率竟超过了90%,个别软手操操作响应竟接近1min,根本无法使用,后经过大幅度调整(系统重新增加配置),才解决了这个问题。
(3) 东北某600MW机组,由于招标技术规范对I/O通道隔离性质表述不到位,因此DCS厂家做的配置很低,结果在调试时烧损了大量的I/O板,后来改变了隔离方式和更改换了硬件,电厂又花费了许多资金,也抵消了当初的招标价格优势。此外,电缆的质量与屏蔽问题也必须高度重视,重要信号及控制应使用计算机专用屏蔽电缆,许多改造工程正是由于电缆的问题导致电缆不得不重新敷设,影响了工期。
(4) 某电厂300MW机组新华XDPS-400系统工程师站频繁死机,经检查发现其运行程序较多:多个虚拟DPU、历史数据记录、性能计算、报表等。把历史数据分配至别的人机接口站问题解决。
(1) 某电厂300MW #2机组HIACS-5000CM控制系统FSSS1的CPU故障,且未将控制权交出,从CPU未能切换为主控,导致该部分系统控制设备无法操作(设备保持原状态工作)。在对主CPU执行在线更换步序至停电时,从CUP切换主控CPU,系统设备受控,更换原主控CPU后系统一切正常。
(2) ABB早期某时间生产的SYMPHONY 同一PCU机柜内不同控制器之间通讯出现数据不一致的情况,通过升级固件这一问题得到解决;
(3) 新华控制XDPS系统早期某批次DPU曾多次出现离线、死机现象,经检查为DPU卡件个别电容问题,经升级更换卡件问题解决。
由于目前DCS的控制器均为冗余配置,大大减少了主控制器“异常”引发机组跳闸的次数。但是,一旦一对冗余的控制器同时死机,将直接威胁到安全生产,对于此类情况一定要采取措施切实避免。
(1) 某电厂西屋WDPF控制系统,由于多次改造系统增加了大量测点和自动控制回路,系统负荷率高达70%以上,造成网络通讯堵塞,多次出现操作员进行操作、切换画面时间过长、画面黑屏等问题。后经升级改造为OVATION系统,系统正常。
(2) 某电厂600MW机组负荷508MW,工况稳定,汽轮机所有调门突然大幅摆动,经检查故障原因是机组运行时M5 控制器的转速信号短时间内由3000r/min 变成了0r/min,又马上恢复,调门摆动的原因也是M3和M5通讯时出现掉数据现象,导致Trip Bias(跳闸偏置)信号在机组运行时由0变为1,引起所有调门大幅摆动。对该问题采取措施:对PCU 控制总线的通讯信号进行多重化处理,对通讯信号增加一定延时,躲过通讯信号瞬间跳变;对重要的通讯信号采用了通讯冗余。
(1) 某电厂300MW供热机组DCS调试过程中未对测点品质参数进行修改,致使其模拟量测点只有在断线的情况下才认为是坏品质测点,未充分起到品质校验功能。后对所有测点品质参数进行了设置,提高了设备运行的可靠性。
(2) HIACS-5000CM控制系统画面组态时,双击grab组态工具后,弹出c++错误窗口无法正常使用。经检查发现grab.ini 文件被改动过,从其他机器拷贝文件覆盖后,工具恢复正常。因为grab 非正常退出后保留了错误的信息在grab.ini 文件中。
(3) 某电厂除氧器水位控制回路逻辑是由高加水位控制逻辑拷贝修改而成,修改过程不彻底,PID参数未根据除氧器情况设置整定,造成运行中除氧器上水门发散调节,调节品质恶化。采取措施:检查逻辑,重新整定PID参数。
某电厂200MW供热机组电气并网信号至DEH只有一路,在机组正常运行的过程中该电气并网辅助接点故障出现抖动,造成汽轮机跳闸。采取措施:使用屏蔽通讯电缆,增加冗余接点信号,并进行3取2逻辑判断。
人为因素造成DCS的故障,在生产过程中也较为常见。包括人员造成的误操作,管理制度不完善及未按规程规定执行工作步骤等。
(1) 某电厂新华XDPS系统DEH的#12DPU故障,对其在线更换,使用的是小机MEH系统的DPU备品。在更换DPU后,只将#32主控DPU拷贝至#12副控未写电子磁盘,其实质只是将副控DPU的内存内容与主控保持一致,#12DPU电子磁盘内容仍为MEH小机控制逻辑。在系统停电吹灰后,按顺序启动#12DPU成为主控,由于其逻辑为MEH逻辑而非DEH逻辑,造成系统通讯异常、数据频闪、画面显示不正常,人机接口站无法操作。在重新对#12DPU送电,拷贝#32DPU逻辑并写盘后正常。
(2) 某电厂HIACS-5000CM控制系统,循环水泵房远程I/O卡件更换,未执行在线更换操作步骤,其卡件未能激活进入工作状态,导致现场设备状态与DCS画面不符,设备无法控制。执行在线更换步序后,系统正常。
(1) 某电厂机组运行中,在进行处理缺陷时工作人员误动DCS继电器柜继电器造成引风机跳闸,锅炉MFT。
(2) 某电厂DCS卡件故障,在进行更换卡件过程中,由于工作人员未认真核对设备、卡件,跳线错误导致新更换的卡件烧损。
(1) 某电厂DCS系统管理制度不完善,未对软件升级、备份等工作进行规定。其辅网水处理POK1操作员站在升级打补丁后,未进行备份。该操作员站硬盘出现故障在进行系统恢复后,由于其软件版本较低,导致与网络通讯不正常,数据不刷新。
(2) 某电厂操作员站管理不严,其放置于集控室的主机USB端口及光驱未进行有效封闭,个别运行人员夜班期间利用操作员站玩游戏、看电影,导致操作员站死机。
外部环境因素造成DCS故障的数量相比于前两类问题而言相对较少,但在实际生产过程中也时有发生。
(1) 某电厂电子设备间风道口正处于DPU机柜上方,由于设计和其他原因,机组运行中消防水通过风道流入DCS机柜,导致DPU、服务器等设备进水烧损,机组停运。
(2) 某电厂循环水泵房远程IO柜,由于底部封堵不严,造成冬季老鼠窜入,在机柜上部温度较高处构筑巢穴,最终造成远程IO脱双网。
(3) 某电厂电子设备间的封闭性较差,卡件、DPU积灰较为严重,曾多次出现故障。在采取完善电子间封闭、加装空调等措施后卡件、DPU等故障基本杜绝。
通过以上诸多故障实例,我们不难看出,降低DCS系统的故障几率,必须做好分散控制系统从选型设计到运行、维护的全方位工作。
楼主最近还看过