某廠DCS網(wǎng)絡(luò)故障事件分析
一、事件經(jīng)過
DCS操作員站操作無響應(yīng)、西門子T3000系統(tǒng)控制畫面自動(dòng)關(guān)閉,無法重新開啟。
某月19日某廠#2燃機(jī)調(diào)停。16時(shí)08分運(yùn)行人員發(fā)現(xiàn)#2機(jī)組二、檢查與分析
儀控人員立即到現(xiàn)場(chǎng)檢查發(fā)現(xiàn)以下故障現(xiàn)象:
a)#2機(jī)組操作員站無畫面顯示;
b)#2機(jī)主服務(wù)器A面板上“放大鏡”信號(hào)燈亮, “SAFE TO PULL”指示燈滅;
c)#2機(jī)組DCS容錯(cuò)服務(wù)器A工作,服務(wù)器B備用且指示燈顯示不正常,兩臺(tái)服務(wù)器硬盤指示燈均不亮(正常工作狀態(tài)應(yīng)為閃爍)。
咨詢西門子技術(shù)人員后告知“放大鏡”燈亮信號(hào)說明服務(wù)器內(nèi)部存在故障,服務(wù)器在自檢,需登陸服務(wù)器查看問題。但因#2機(jī)服務(wù)器始終無法登陸,檢修人員無法進(jìn)行任何檢查。針對(duì)以上故障情況聯(lián)系南西工程服務(wù)人員來現(xiàn)場(chǎng)服務(wù)。
20日8時(shí)30分,南京西門子人員抵達(dá)現(xiàn)場(chǎng)對(duì)服務(wù)器A、B分別進(jìn)行軟重啟和斷電重啟,服務(wù)器A均能正常工作,B一直無法恢復(fù)正常,經(jīng)更換硬盤后服務(wù)器B恢復(fù)正常工作。服務(wù)器進(jìn)行主輔切換兩臺(tái)服務(wù)器均能正常工作。在重啟服務(wù)器完成后,檢查畫面發(fā)現(xiàn)控制器AP235下所有所有監(jiān)視點(diǎn)異常且無法正常操作,通過工程師站檢查發(fā)現(xiàn)服務(wù)器同AP235通訊中斷。由于AP235控制組主要控制電氣設(shè)備,#1機(jī)組正帶負(fù)荷運(yùn)行,為不影響機(jī)組正常運(yùn)行,將AP235控制器組的重啟放到#1機(jī)停機(jī)后進(jìn)行。
21日9時(shí)30分按預(yù)案對(duì) AP235進(jìn)行重啟后系統(tǒng)恢復(fù)正常。
經(jīng)現(xiàn)場(chǎng)排查分析認(rèn)為#2機(jī)組操作員站未設(shè)置服務(wù)器工作狀態(tài)的監(jiān)視畫面,運(yùn)行人員未能及時(shí)發(fā)現(xiàn)DCS系統(tǒng)各類狀態(tài)報(bào)警。由于服務(wù)器B硬盤故障,導(dǎo)致主服務(wù)器A始終通過網(wǎng)絡(luò)查找服務(wù)器B,從而引起系統(tǒng)響應(yīng)緩慢,最終引起DCS系統(tǒng)癱瘓。事件過程需要南京西門子公司進(jìn)一步分析。
三、防范措施
1)對(duì)硬盤失效后引起DCS響應(yīng)緩慢的事件進(jìn)一步跟蹤,根據(jù)南西最終分析報(bào)告制定防范措施;
2)加強(qiáng)設(shè)備巡檢,盡早對(duì)失效設(shè)備進(jìn)行更換,按設(shè)備壽命周期進(jìn)行設(shè)備定期更換;
3)完善系統(tǒng)報(bào)警監(jiān)視功能,在操作員站增加服務(wù)器故障報(bào)警;
4)總結(jié)故障處理經(jīng)驗(yàn),完善故障處理預(yù)案;對(duì)DCS系統(tǒng)卡件運(yùn)行狀態(tài)監(jiān)視畫面進(jìn)行完善,增加重要部件故障異常的報(bào)警功能。
提交
派拓網(wǎng)絡(luò)被Forrester評(píng)為XDR領(lǐng)域領(lǐng)導(dǎo)者
智能工控,存儲(chǔ)強(qiáng)基 | 海康威視帶來精彩主題演講
展會(huì)|Lubeworks路博流體供料系統(tǒng)精彩亮相AMTS展會(huì)
中國(guó)聯(lián)通首個(gè)量子通信產(chǎn)品“量子密信”亮相!
國(guó)家重大裝備企業(yè)齊聚高交會(huì) 中國(guó)科技第一展11月深圳舉行