自控系统SCADA信息安全常见故障处理方法
- 格式:doc
- 大小:6.77 MB
- 文档页数:85
SCADA系统故障应急方案1、主岗发现操作站出现部分画面数据停止刷新或者操作台不能翻页、操作、数据出现白框,出现连接对话框,自动尝试连接备用服务器的现象;主岗判断故障发生范围。
2、主岗通知中央处理厂主管及自动化维护,告知自动化维护人员主控室操作台有哪些不能正常操作的画面、能否对画面进行翻页、故障出现时间,判断故障类型(SCADA系统服务器故障、DCS控制器及板卡故障、FSC及板卡故障)。
3、SCADA系统服务器故障:1)故障特征:主控室FLEX操作站上所有数据停止刷新;console操作站第三方通讯(站外单井、空压机、导热油、生产污水、FSC)的数据停止刷新,其他的直接进DCS控制器的点数据正常。
即可判断为SCADA系统服务器故障。
2)应急操作步骤:A、主控室主岗确认故障范围,确定为SCADA服务器故障B、主控室主岗通知自动化维护队伍和中央处理厂主管C、主岗先通过CONSOLE操作站监视控制现场数据,副岗人员到现场,对空压机、导热油、生产污水单元工艺流程检查,数据现场监视。
D、自动化人员紧急处理系统服务器故障,对服务器的操作及时与主控室沟通,提醒主岗人员应注意事项。
4、DCS控制器及板卡故障1)故障特征1:主控室FLEX操作站和CONSOLE操作站上数据停止刷新,第三方通讯(站外单井、空压机、导热油、生产污水、FSC)数据正常。
即可判断为3套DCS控制器同时故障故障。
如果上述故障发生在1、2套集气和脱水脱烃、大北、凝析油、1套乙二醇,则证明为第一套DCS控制器故障;如果上述故障发生在3、4套集气和脱水脱烃、克深、燃料气、液液分离器,则判断为第二套DCS控制器故障;如果上述故障发生在5、6套集气和脱水脱烃、消防给水、循环水、空氮站、7100单元、UPS、2套乙二醇,则判断为第三套DCS控制器故障。
故障特征2:主控室操作站上少量部分数据停止更新,少量部分阀门不能控制,出现卡件故障报警,报警类型为:,即可判断为板卡故障,即可能是底板故障,又可能是卡件故障。
SCADA系统运行中存在的问题与对策赵岚(宜昌供电公司变电运行部,湖北宜昌,443000)摘要:对变电站SCADA自动化系统运行中存在的主要问题进行了统计、分析,找出问题的根源,并结合变电站的实际情况,提出了一系列解决方案及改进建议,以指导实现无人值班变电站的良好运行。
关键词:SCADA系统;自动化设备;变电站;无人值班1 引言变电站自动化系统在变电站的广泛应用,对变电站实现保护监控系统升级换代、提高变电站自动化程度、实现调度自动化和建设无人值守变电站及减员增效等方面发挥了积极重要的作用,是电网发展的趋势,值得大力推广。
然而,笔者在使用DF8002型SCADA系统实际运行中,发现了变电站自动化系统出现的一些问题,且下列问题已经影响到变电站整体正常运行。
2 典型问题分析2.1 遥信误发该套SCADA系统现在日常监控12个220kV变电站及21个110kV变电站,经常发生信号误发现象。
遥信误发原因较多,对其中某一变电站缺陷进行统计、分析,发现遥信误发的原因大致分为以下几类:(1)站端远动装置重启时误发遥信。
由于变电站站内与远动装置通信的测控装置或保护装置较多,远动装置在重新启动时往往与调度端的通信先恢复,而与现场各测控单元或保护装置通信滞后,这样就导致与各测控装置通信恢复正常前的短时间内发往调度端的所有遥测、遥信为0,现场本身处于“合”位的遥信就会在主站端产生由“合”到“分”与由“分”到“合”的报警事项,该类误发遥信不带SOE。
(2)现场接线与站端远动装置的参数或站端远动装置与主站参数库定义不一致。
(3)节点抖动。
个别信号因辅助节点受潮锈死、老化及机械等原因出现频繁误发信号。
(4)开关跳闸时发“控制回路断线”信号。
查看事项顺序记录可以发现,“控制回路断线”信号报警在“开关跳闸”信号之前20~60 ms之间,在“开关跳闸”信号之后0~60 ms,该信号自行复位。
对“控制回路断线”信号采样电路进行分析,开关跳闸时,常开辅助节点断开,而跳闸动作需要一定的时间,因此在开关未跳开之前常闭辅助节点没有闭合,这样使合闸回路与跳闸回路同时断开,合闸位置继电器(HWJ)和跳闸位置继电器(TWJ)瞬间均失电,导致发出了“控制回路断线”信号。
目录第一章:1.5MW SCADA监控1.1塔底屏1.1.1塔底屏重启后不能自动登陆系统1.1.2Client.exe软件启动时报错1.1.3塔底屏软件启动不正常1.1.4塔底无数据,中控室显示正常1.1.5无法使用远程桌面连接到塔底屏1.1.6更换塔底屏后,塔底屏监控软件配置完成后软件无法启动1.2数据库及监控软件1.2.1风机监控数据压缩包正常生成但关系数据库存储异常(利用率)1.2.2监控软件上查询显示正常,数据中心压缩数据包也正常但使用数据分析工具查询数据异常,表现为变量数据整体偏移1.2.3发电量汇总及日报中发电量统计为01.2.4在查询发电量及生成日报时如果风机发电量为0则查询缓慢1.2.5中控室前台监控机风机监控显示正常但后台工控机没有显示1.2.6塔底通讯正常但中控室显示异常1.2.7发现某台风机报出的故障信息与实际故障不符1.2.8配置服务器启动lampp失败1.2.9启动监控程序显示无法连接数据库1.2.10储存多条报警信息或多条操作员日志1.2.11发电量与功率不符1.2.12现场发电量修复1.3通讯相关1.3.1整条通讯线路通讯中断1.3.2某台风机监控通讯中断1.3.3风机通讯闪断1.4SCADA硬件及其它网络设备1.4.1防火墙VPN远程连接无法第二阶段协商成功1.4.2控创服务器无法开机解决办法。
1.4.3服务器数据溢出1.4.4忘记MOXA交换机IP地址,如何重新配置交换机1.4.5Cisco路由器及交换机掉电后配置被清空1.5与第三方通讯1.5.1第三方与我方监控机opc无法连接1.5.2第三方与我方监控机ModBus通讯不正常或无法建立数据连接第二章:2、3、6MW SCADA监控2.1打开监控界面显示无法浏览网页2.2进入webaccess的监控节点配置页面,该页面无法打开提示“数据库引擎打不开文件'(未知的),它已经被别的用户以独占方式打开,或没有查看数据的权限”2.3在数据采集工控机上已经修改Bachmann Opc Configurator数据采集配置,但是监控系统中数据采集信息没有变化。
1我局电网调度SCADA系统概况我局目前有35kV电所5座,市局下放后的110kV变电所8座以及220kV变电所1座。
主站端的SCADA系统为南京磐能科技SE-9000E系统。
除1个35kV履坦变的厂站端采用RTU外,其余变电所都采用综合自动化设备。
远动自动化系统是由厂站自动化设备(RTU)、通信系统和自动化主站系统3个方面组成,这3个方面任何一个环节出现问题都将造成远动自动化系统失效的后果。
厂站自动化设备包括RTU和综合自动化,通信系统包括光端机、光纤、光中继等,而作为主站自动化维护人员重点关注的主站系统则包括了配线架、前置机接线端子、通道板、通道箱、Moxa、交换机、前置服务器、数据服务器、AVC等。
在故障排查时,这些都将成为故障排查的对象。
而常见故障可以分为遥控失败、厂站工况退出、遥测异常、误遥信几大类。
2各类常见故障判断及处理2.1遥控失败遥控命令的执行需要经过自动化主站系统的处理生成一条下发指令,传送到前置数据采集系统(以南京力导的SE-9000为例),经由光电隔离板(模拟信号经调制解调器调制后)下发给传输通道,厂站端的远动终端(以自动化中的四遥模式为例)接收到传输通道送来的信号确认后生成一反校指令送往主站,等待值班员确认执行后再送信号给开关执行机构,完成整个操作。
具体了解了遥控操作的流向,我们才能很好地进行分析和判断。
遥控失败,首先应分析检查主站系统是否正常,再检查通道板、传输通道、RTU、执行机构这样由近及远的原则。
第一种情况,单个遥控失败,同一厂站的其他遥控正常,那么可以判断主站端和通道正常,问题在厂站端,应通知厂站端人员及二次人员,并分析判断厂站端的问题所在。
第二种情况,某个厂站所有开关都遥控失败,应检查执行时有无返校,如有返校,则可以判断主站和通道正常,问题在RTU,应通知厂站维护人员及二次人员处理。
如果没有返校,则应检查通道、通道板及RTU。
这种情况下,厂站的上行数据接收正常,所以要检查前置机下行接线端子、配线架跳线的下行接线有无松动,如厂站端有人配合,可以采用环回测试的方法来测试通道情况。
一、塔底屏重启后不能自动登陆系统可以通过修改注册表文件中的Winlogon项目来实现系统自登陆按以下步骤操作:第1步:运行注册表编辑器,依次展开[HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows NT\CurrentVersion\Winlogon]分支,然后在右侧窗口双击“DefaultUserName”,接着输入你的登录用户名。
如果没有预设的用户名称,可以在注册表编辑器的菜单栏点选“编辑→新建→字符串值(s)→DefaultUserName”来添加这个项目,注意要区分大小写字母。
第2步:同样在该分支下,在注册表编辑器的右侧窗口中双击“DefaultPassword”子项,然后在空白栏内输入你的密码。
第3步:接下来在右侧窗口中双击“AutoAdminLogon”,将数值设置为“1”。
现在关闭注册表编辑器并重新启动电脑系统就可以自动登陆了。
二、client.exe软件启动时报错一般是由于电脑冷重启(断电重启)过于频繁导致文件损坏,只需要从另一台风机重新考一个监控软件并重新配置即可三、风机监控数据压缩包正常生成但关系数据库存储异常(软件界面上查询不出数据或查询结果显示双倍数据例如一天48小时)这是由于软件配置引起的,这时 1.可以检查config_node_attlist.xml文件中的has_data_center参数是否true(注:前台监控机为true其它机器都为false或没有这个参数)2.检查scada.ini文件中的datacenter参数是否为1(前台监控机为1其它机器都0)。
四、监控软件上查询显示正常,数据中心压缩数据包也正常但使用数据分析工具查询数据异常,表现为变量数据整体偏移这一般是由于更新监控程序时变量点发生了改变(增加或减少)变量地址发生了改变但没有导入mysql数据库,处理方法,只需要将风机信息及变量信息重新导入就可以正常存储查询。
SCADA系统信息安全常见故障处理方法1、 PLC通讯中断 ................................................. - 2 -2、站控机中毒导致工程运行不正常或不能启动 ....................... - 3 -3、站控数据不更新............................................... - 6 -4、第三方设备通讯故障........................................... - 8 -5、 RCI自动停机 ................................................ - 10 -6、由于RCI需要轮询点数过多导致的故障 .......................... - 12 -7、阀室数据上传故障............................................ - 14 -8、甪直站调压橇压变PT5802传输数据错误的故障处理 ............... - 17 -9、压气站HIMA ERROR故障分析和处理报告 ......................... - 19 -10、控制网组网不正常........................................... - 43 -11、 ANYBUS COMMUNICATOR与ESD系统通讯中断...................... - 46 -12、 I/O模块通讯故障............................................ - 48 -13、 AB PLC系统ETHERNET冗余网络通讯A网失败后B网不能工作...... - 49 -14、北调无法看到ESD系统中的模拟量 ............................. - 54 -15、通讯服务器冗余配置失败..................................... - 55 -16、配置路由器时在配置界面上出现乱码 ........................... - 60 -17、 DDN通讯中断 ............................................... - 61 -18、站场与北调的通讯频繁闪断................................... - 62 -19、路由器用户名、密码失败,无法登录及配置 ..................... - 62 -20、第三方设备与上位机通讯无法建立或通讯不正常 ................. - 64 -21、机柜间到站控室的1#光纤不通................................. - 70 -22、 HIRSCHMANN交换机IP地址设置................................ - 72 -23、交换机及路由器对应端口通讯方式配置 ......................... - 78 -24、洛阳分输站与北京调控中心通讯中断 ........................... - 84 -1、PLC通讯中断1、故障现象站控机中有“PLC通讯中断”报警,且相应的NOE模块会显示“Fault”红灯亮。
SCADA系统信息安全常见故障处理方法1、 PLC通讯中断 ................................................. - 2 -2、站控机中毒导致工程运行不正常或不能启动 ....................... - 3 -3、站控数据不更新............................................... - 6 -4、第三方设备通讯故障........................................... - 8 -5、 RCI自动停机 ................................................ - 10 -6、由于RCI需要轮询点数过多导致的故障 .......................... - 12 -7、阀室数据上传故障............................................ - 14 -8、甪直站调压橇压变PT5802传输数据错误的故障处理 ............... - 17 -9、压气站HIMA ERROR故障分析和处理报告 ......................... - 19 -10、控制网组网不正常........................................... - 43 -11、 ANYBUS COMMUNICATOR与ESD系统通讯中断...................... - 46 -12、 I/O模块通讯故障............................................ - 48 -13、 AB PLC系统ETHERNET冗余网络通讯A网失败后B网不能工作...... - 49 -14、北调无法看到ESD系统中的模拟量 ............................. - 54 -15、通讯服务器冗余配置失败..................................... - 55 -16、配置路由器时在配置界面上出现乱码 ........................... - 60 -17、 DDN通讯中断 ............................................... - 61 -18、站场与北调的通讯频繁闪断................................... - 62 -19、路由器用户名、密码失败,无法登录及配置 ..................... - 62 -20、第三方设备与上位机通讯无法建立或通讯不正常 ................. - 64 -21、机柜间到站控室的1#光纤不通................................. - 70 -22、 HIRSCHMANN交换机IP地址设置................................ - 72 -23、交换机及路由器对应端口通讯方式配置 ......................... - 78 -24、洛阳分输站与北京调控中心通讯中断 ........................... - 84 -1、PLC通讯中断1、故障现象站控机中有“PLC通讯中断”报警,且相应的NOE模块会显示“Fault”红灯亮。
2、故障原因NOE以太网模块网络地址配置错误,造成PLC通信不能实现冗余,主备切换后无法实现PLC与RCI间的通讯。
比如说济南站的主备两个NOE模块的IP按照IP点表上应该是172.17.62.65(主)和172.17.62.67(备),另有172.17.62.68这个IP 是预留未使用的,如果错吧172.17.62.67配制成172.17.62.68,由于RCI识别的NOE 模块IP是172.17.62.67而非172.17.62.68,就会造成主备切换时,PLC与RCI通讯不上而出现通讯故障报警,该报警将显示在站控机界面上。
3、解决方法(1)首先确认PLC、交换机、RCI间各网线接口没有虚接或掉落的。
(2)对照IP表,试着ping PLC两个NOE以太网模块的IP地址,哪个地址ping 不同,就说明哪个模块有问题。
可以通过上次备份的PLC工程查找到NOE的网络设置,如图8.1.3和图8.1.4的操作步骤即可看到。
可以对各NOE模块的网络进行设置,即“Internet Address”、“Subnet Mask”和“Gateway”。
(3)在笔记本上打开Concept软件,打开原先备份好的工程,可以通过网线或串口线连接PLC(如果两个NOE模块的地址实在找不到的话),按照(2)中的方法重新设置好网络后,重新下载程序到PLC的控制器中。
(4)断开笔记本电脑与PLC的链接,对PLC的备机进行热备设置。
将备机CHS热备模块的钥匙开关拨到“Xfer”挡,按下程序更新按钮,然后松开按钮,会看到备机架的CHS模块显示“Standby”橙色灯亮,当该灯常亮以后则表示热备完成,这时备机架CPU模块的“Run”绿灯将变亮,主机架CHS模块的“Primary”绿灯常亮。
(5)PLC与RCI的通讯恢复以后,站控机电脑屏幕上“PLC通讯中断”报警可以确认掉。
2、站控机中毒导致工程运行不正常或不能启动1、故障现象站控机工程运行不正常或不能启动。
2、故障原因站控机外接移动存储设备而中毒,病毒影响Viewstar软件的正常使用。
3、解决办法采用瑞星杀毒软件、病毒专杀工具(如Worm.LovGate爱情后门专杀)对站控机进行杀毒。
(1)图8.2.1为靖边站在用瑞星对站控机进行查杀后的情况,图中可见病毒名称都为Backdoor.SdBot.wgb,一种集后门、蠕虫功能于一体的,通过网络共享和操作系统漏洞进行传播的病毒。
病毒会尝试通过弱密码登陆目标系统,还会在感染的电脑上打开后门接收攻击者发出的指令,然后连接特定的IRC服务器通知攻击者病毒的存在。
病毒会扫描网段内的机器并猜测共享密码,占用大量网络带宽资源,容易造成局域网阻塞。
它通过IRC服务器接受攻击者发出的指令,例如安装/卸载后门、下载并运行文件、结束进程、运行代理服务器、盗取流行游戏的账号、对指定的IP 进行DOS(拒绝服务)攻击等。
(2)2009年12月16日,红柳站站控机工程无法启动,每次启动后提示“LSASS.EXE出错,系统将在60秒内自动关闭!”,然后在指定的时间内自动重启。
然后维护人员在安全模式下用瑞星对站控机进行病毒查杀,杀出了大量的“packer.main007”木马。
查杀结束后重启站控机和工程,Viewstar运行恢复正常。
由SYSTEM执行的lsass.exe是“无害”的系统进程,用于微软Windows系统的安全机制,本地安全和登陆策略。
但是假如在站控机的任务管理器中同时看到lsass.exe和LSASS.EXE这两个进程,则表明站控机已经中了Windang.worm、irc.ratsou.b、Webus.B、MyDoom.L、Randex.AR、Nimos.worm病毒,或者是该病毒的变种。
LSASS.EXE在任务管理器中显示为当前用户在执行,而非SYSTEM在执行,该病毒通过软盘、群发邮件和P2P文件共享进行传播。
解决办法如下:(a)使用prockiller进程杀手终止LSASS.EXE进程;(b)删除病毒文件(有的文件可能没有):●C:/Program Files/Common Files/INTEXPLORE.pif●C:/Program Files/Internet Explorer/●C:/WINDOWS/EXERT.exe●C:/WINDOWS/IO.SYS.BAK●C:/WINDOWS/LSASS.exe●C:/WINDOWS/Debug/DebugProgram.exe●C:/WINDOWS/system32/●C:/WINDOWS/system32/●C:/WINDOWS/system32/(c)使用Free Window Registry Repair注册表清理工具清理注册表中的垃圾信息。
也可手动清除,下面是手动清除的需要删除的项目:●HKEY_CLASSES_ROOT/WindowFiles●HKEY_CURRENT_USER/Software/VB and VBA Program Settings●HKEY_CURRENT_USER/Software/Microsoft/Internet Explorer/Main下面的Check_Associations项●KEY_LOCAL_MACHINE/SOFTWARE/Clients/StartMenuInternet/INTEXPLORE.pif●HKEY_LOCAL_MACHINE/SOFTWARE/Microsoft/Windows/CurrentVersion/Run 下面的ToP项(d)使用瑞星注册表修复工具修复注册表;(e)重启站控机后可再进行一次全盘杀毒。
3、站控数据不更新1、故障现象站场SCADA系统的站控电脑上显示的数据部分或大部分不能及时更新,数据处以橙色状态显示,如图8.2.5所示。
以进出站压力或温度为例,如果这些数据不能及时更新,那么Viewstar日报表中每小时进出站压力或温度所记录的值同样也是不更新的,即固定不变。
这样值班人员将不能正确判断站场的实际生产情况,形成较大的安全隐患。
一个简单的例子:比如某分输站的电动调压阀采用压力PID控制出站压力时,门站用气量突然减小了(如气罐车停止加气),但门站没有事先通知我分输站值班人员,而PID控制具有一定的滞后性,使得出站天然气因憋压而迅速上升。
但是这时由于站控数据不能及时更新,造成值班人员未能及时发现,使得出站压力在有限的时间内能超过安全泄放阀设定压力,使得安全泄放阀放空。
这本来是一个完全可以避免的情况。
2、故障原因(1)站控机与RCI间的日期时间不一致;(2)RCI长时间不间断工作,硬件老化,工作性能下降;(3)RCI内部配置不高;(4)第三方设备(如流量计算机、UPS)又不断地增加,数据采集量增大,工作负担加重;(5)网络中有网线虚接或断开的地方。
这些使得RCI不能及时采集各种第三方设备的数据,即发生数据丢失现象,从而影响数据库中数据的准确性。
3、解决办法RCI与很多第三方设备进行通讯,包括PLC、UPS、低压配电盘、流量计算机和燃气发电机等等,因为它与PLC的通信量最大,所以在此以它与PLC的通讯为例进行说明。