大唐鸡西电厂DCS系统死机离线测试 点击:666 | 回复:2



王者之师--cqu_rockwell

    
发表于:2012-02-27 11:04:48
楼主

大唐鸡西电厂DCS系统死机离线测试
  
一  概述

自从2004年2月电科院与大唐签定监督服务合同后,根据大唐鸡西电厂上报的情况发现,大唐鸡西电厂DCS系统死机离线现象严重,根据现场工作人员介绍,自从2003年5月机组发电开始,和利时公司DCS系统开始出现频繁死机,最严重时2天内发生2次死机现象,和利时公司技术人员在1年来,到鸡西电厂有100多人次,但问题仍未能得到很好的解决。据我们调查了解和利时公司的该DCS系统在其他一些电厂也经常出现死机现象,故怀疑系统本身设计上存在问题。以上情况引起电科院领导的高度重视,要求我们尽快查找原因并解决,将DCS系统的频繁死机概率降低,故我们与3月初前去大唐鸡西电厂进行了初步调研,并与现场人员研究决定于4月份进行测试,由现场人员先进行前期准备,先根据DL/T 659-200X《火力发电厂分散控制系统验收测试规程》做些检查,并通报和利时公司。

二  检查及试验

根据DL/T 659-200X《火力发电厂分散控制系统验收测试规程》,由现场工作人员先进行了检查,主要是可能引起死机的方面,包括以下内容

1. 分散控制系统的工作环境符合以下技术指标:

温度      15℃~ 28℃

湿度     45%~ 70%,任何情况下不许结露

温度变化率   ≤5℃/h

振动     振幅<0.5mm

2. 分散控制系统的接地应符合制造厂的技术条件和有关标准的规定。屏蔽电缆的屏蔽层必须单点接地。分散控制系统采用独立接地网时,若制造厂无特殊要求,则其接地极与电厂电气接地网之间应保持10m以上的距离,且接地电阻不得超过2Ω。当分散控制系统与电厂电力系统共用一个接地网时,控制系统地线与电气接地网只允许有一个连接点,且接地电阻应小于0.5Ω。

3. 存贮余量的测试。通过工程师工作站或其他由制造厂提供的方法检查每个控制站的内存和历史数据存贮站(或相当站)的外存的容量及使用量。内存余量应大于存贮器容量的40%,外存余量应大于存贮器容量的60%

4. 中央处理单元的负荷率.所有控制站的中央处理单元恶劣工况下的负荷率均不得超过60%。计算站、操作员站、数据管理站等的中央处理单元恶劣工况下的负荷事不得超过40%

5. 抗射频干扰能力的测试

用功率为5W、频率为400MHz~500MHz的步话机作干扰源,距敞开柜门的分散控制系统机柜1.5m处工作。分散控制系统应正常工作

在以上检查未发现问题后,我们在4月份主要做通讯方面的检查。

我们在4月初在鸡西电厂与和利时公司人员一起更换了系统通讯的交换机,并在工程师站安装了系统通讯测试软件,并检查了部分组态,其中在系统通讯状态页中发现多处错误,其可能造成系统错报误报,进行更改后消除该现象。

4月12日因鸡西电厂2#机组即将停运,故我们赶往鸡西电厂进行网络通讯负荷测试,因和利时公司不同意在机组正常运行时测试,只能在机组停运前进行。但我们实际测试时,因操作已经基本完成,故通讯负荷很低只有2~3%,符合国家规定(但在机组正常运行时,在操作频繁的情况下,通讯负荷应比目前有变化,应比现在高,故不能说明该系统完全符合国家规定要求)。在机组停运后我们进行了服务器及通讯网络的冗余测试,结论为冗余符合要求。

我们在4月18日对鸡西电厂2#机进行了全面的系统通讯测试,测试软件为和利时公司提供的第3方软件SnifferPro,该软件为网卡测试软件,故和利时公司不同意在正常运行时测试,只能在机组停运时进行,经过几天测试,初步结果如下:

1. 在2#机组停运时,服务器网卡的通讯负荷很低,最大约3%,完全符合要求。

2. 经实验证实服务器与上位网线均为冗余设置。

3. 工程师站因操做很少,网卡通讯负荷正常不到1%。

4. 1#机组15#站个别卡件出现离线现象,经现场人员分析为因接地造成离线,可排除。

5.  测试中发现系统时钟不同步。

三  现象分析

由以上可看出在机组停运时,通讯负荷不超标,均正常,但此时也未发生死机和离线现象。故我们又做了如下实验:

1. 人为提高服务器网卡通讯负荷到16-25%之间,操作操作员站,发生2次操作员站离线,(共做7次实验),这说明当通讯负荷高时可能发生死机离线现象,故需要与和利时厂家联系,由其提供可用于机组运行时测试网络负荷的工具。

2. 经软件SnifferPro运行几日,在1#机组2#机组均发现出现一些不存在的IP地址,其上有很少量的数据。这说明在网络通讯时,有故障点,其产生的原因现怀疑为通讯软件有问题,是否如此,须和利时厂家进行解答。或者是交换机的问题,也须和利时厂家进行解答

四  目前DCS系统的工作状况

在我们于4月份进入鸡西电厂现场后,经过更改部分组态后,经过现场调查,由4月至今1#机组和2#机组均仍未发生实际上的死机和离线现象,可以说目前的工作是有效果的,至少部分上已经降低了死机的频率,但并不能说已经完全解决DCS系统死机。

五  建议

现场需要加强重视程度认真完成电科院于4月初提出的几点工作,主要建议如下:

1. 检查组态,删除空点和错误点。

2. 调整各站负荷,使之负荷分配均匀。(该项工作因工作量大及费用较高,可以等其它原因排除后,再考虑进行)

3. 经调查发现,原始设备组态中,每台操作站均配备一台打印机,但现在所有操作员站实际上一共只有1台打印机,其余的打印机实际上不存在,请现场工作人员将不存在的打印机组态删除。

4. 当运行时出现死机和离线现象时,如能及时发现,询问操作人员进行哪些操作,和出现的现象,同时将设备日志,全日志打印输出,保留服务器中当天历史数据,记录现场的工作环境,记录服务器的存储容量,以备进行调查分析。

5. 在检修期间,按照我们发给现场的DL/T 659-200X《火力发电厂分散控制系统验收测试规程》对DCS系统进行全面的检查测试,并完成检查报告。

6. 此外,造成DCS系统死机的原因是多方面的,我们只是一项项的排除可能引起死机的因素,目前电科院所提出的要求只能是解决由外部因素可能在DCS系统上造成影响的因素,只能是尽可能的降低死机现象出现的频率,如果想彻底解决DCS系统死机,仍需要DCS厂家在软硬件和网络设计上进行考虑该类型DCS易频繁死机的内在原因。

电科院热工监督组
 


 



楼主最近还看过



水中鱼

  • 精华:43帖
  • 求助:4帖
  • 帖子:324帖 | 3802回
  • 年度积分:0
  • 历史总积分:15038
  • 注册:2011年11月10日
发表于:2012-02-27 18:14:12
1楼
造成DCS系统死机的原因是多方面的,一项项的排除可能引起死机的因素。
SSI ļʱ