工控機磁盤工作故障的防護與排除辦法
2005/4/19 14:20:00
摘 要:山玻集團廊坊金彪600T高新玻璃生產(chǎn)線有著包括ABB AC800F和西門子300 PLC等四套自動化控制系統(tǒng),上位機采用Citect、Freelance 2000、WCC5.0、SETP7 5.2等上位機組態(tài)軟件監(jiān)控。近期電網(wǎng)波動,導致多臺工業(yè)控制計算機發(fā)生系統(tǒng)磁盤故障,給正常生產(chǎn)帶來巨大威脅。作者采用雙硬盤備份和GHOST鏡像等方法,一定程度上避免了上述事態(tài)的進一步發(fā)展。本文將從故障現(xiàn)象、出現(xiàn)原因及防護方法做一一敘述。 關鍵字:工業(yè)控制計算機、磁盤、GHOST 一、 引言: 隨著工業(yè)與計算機的快速發(fā)展,在自動化程度越來越高的今天,計算機也應用到自動化控制系統(tǒng)的方方面面。工業(yè)控制計算機(以下簡稱工控機)的安全也顯得尤為重要。工控機與普通計算機的技術原理相同,組成結構也差不多,只是在工控機強調的是其工作穩(wěn)定性。工控機一般工作在相對惡劣的環(huán)境下工作的,對環(huán)境溫度、濕度、供及電壓、平穩(wěn)性、通風性能等要求比較高,但工作環(huán)境往往達不到要求,工控機也容易發(fā)生故障,部分硬件出現(xiàn)問題還能及時更換,一旦磁盤發(fā)生損壞,會造成大量記錄數(shù)據(jù)丟失,控制軟件破壞,短時間無法修復,造成被控參數(shù)控制不穩(wěn),往往帶來巨大的經(jīng)濟損失。 二、 故障現(xiàn)象描述: 工控機長時間運行后,(長時間指:包括連續(xù)工作一個標準月30天/24小時工作制及以上的時間),機箱內積集大量灰塵,機箱溫度較高。通常在不關機的情況下一切工作正常,一旦因電力供應不足或需要緊急停機時,控制系統(tǒng)容易出現(xiàn)磁盤無法啟動、系統(tǒng)無法加載、長時間處于登陸畫面等故障。以山東玻璃集團廊坊高新玻璃生產(chǎn)線的10臺操作員站和4臺工程師站為例: 系統(tǒng)配置: 工 控 機:研華工控機、DELL GX270 操作系統(tǒng):Windows 2000 Professional /Windows 98(一臺)(正版) 控制軟件:Citect、Freelance 2000、WCC5.0、SETP7 5.2等正版軟件 輔助軟件:WINRAR 3.0、Windows 2000 Professional SP4補丁等 工作時間:全年全日制工作(365天*24小時) 工作環(huán)境:環(huán)境溫度利用空調控制在10攝氏度到30攝氏度之間、地面有輕微機械震感、空氣有可吸入顆粒物。 空氣濕度:5%~50%RH 自2003年12月運行以來,共有三臺計算機累計五次出現(xiàn)磁盤錯誤導致無法啟動的故障。筆者與微軟操作系統(tǒng)服務部聯(lián)系至今也沒有得到可靠回復。 三、 故障分析及排除方法: 引起磁盤故障的原因非常多,我們在這里大概的分為磁盤本身的質量問題和工作環(huán)境引起的故障問題。 磁盤本身的質量問題,我們無法深入考究,只有在開始做控制系統(tǒng)時,選擇購買質量、品牌較好硬盤,也可以利用Scandisk、Norton Disk Doctor等軟件進行磁盤表面缺陷檢測。假如我們能夠預知硬盤的質量和健康狀態(tài),這將為我們選擇硬盤和備份重要數(shù)據(jù)贏得時間。筆者在網(wǎng)上發(fā)現(xiàn)一款名為Drive Health軟件,可以檢測硬盤的使用壽命,可以幫助大家提前得知硬盤健康狀態(tài)。 工作環(huán)境引起的故障問題,常見的有下面幾個方面: 1、 工控機工作時間長。由于正常生產(chǎn)的需要,部分工廠的工業(yè)控制系統(tǒng)需要長時間工作,給工控機操作系統(tǒng)帶來巨大考驗。據(jù)微軟的操作系統(tǒng)運行時間報告中表明,微軟聲稱其Windows 2000后的操作系統(tǒng)可以支持長時間工作,但從實際運行看,運行時間超過一周后,磁盤在龐大數(shù)據(jù)交換過程中,會積累大量的數(shù)據(jù)碎片,容易造成磁盤邏輯壞道、讀寫錯誤及系統(tǒng)運行和啟動變慢。所以工控機在生產(chǎn)允許的情況下,可定時進行重啟工控機和磁盤碎片整理,以減少因長時間工作導致的磁盤錯誤。重啟時間可按工控機處理數(shù)據(jù)量的大小和生產(chǎn)情況而定,它不是硬性的,需要讀者慢慢摸索。從筆者的實際經(jīng)驗來看,一個標準月(30天)重啟和整理一次工控機可以減少磁盤錯誤的機率。 2、 工控機內部溫度過高。在需長時間高溫運行的環(huán)境中,計算機各元件極易發(fā)生老化、硬盤故障的頻率也較之升高。這就需要工廠的自動化系統(tǒng)維護人員在日常巡檢中,密切關注機箱溫度,盡量使工控機的溫度保持在10--30攝氏度之間,過高、過低的溫度都不適宜硬盤的保護,如果機箱溫度達到30攝氏度,內部硬盤的溫度會達到40度或更高。我們可以簡單DIR一下自己的工控機,以達到降低環(huán)境溫度的作用。一、更換大功率CPU、硬盤風扇(硬盤風扇要注意固定,不宜安裝在硬盤固件架上,以防因風扇轉動帶來硬盤震動)加快散熱;二、在機箱內部加裝向機箱外抽風的風扇,增加空氣對流;三、在放置工控機的機柜上,安裝小型軸流風機;四、在控制室加裝空調,以降低空間溫度。 3、 環(huán)境濕度不適宜。工控機主要是由眾多電子元件的集成電路構成,其絕緣性能跟環(huán)境濕度有很大關系。濕度過大,容易造成電路板短路而燒毀;濕度過小,容易產(chǎn)生靜電,也會擊穿部分電子元件。因此,濕度過大、過小,都會給工控機帶來潛在的威脅。靜電防護問題上要求我們工控機上必須要有良好的儀表接地。值得說明的是,工控機接地極不同與土建上的防雷接地,接地極選址應距控制室處三米遠,在室外的地坪下1700mm處用∮20鍍鋅角鋼作垂直接地極,接地數(shù)量滿足接地電阻小于1歐姆(回填時應用搖表測試),再采用40*40*4鍍鋅扁鋼與接地體可靠焊接(每個焊接點還要做仔細的防銹處理),分至建筑物內換接25mm銅電纜至系統(tǒng)地端子和工控機接地點。這樣可以有效的減少靜電帶來的危害。 4、 地面震感大。很多工廠生產(chǎn)中需要電機產(chǎn)生拖動、震動等物理性位移動作,不僅帶來巨大的噪音,機器工作時帶來的震動會給工控機磁盤、光驅、軟驅帶來巨大的損害。磁盤生產(chǎn)的工藝越來越高,現(xiàn)行轉速已達到7200轉每秒乃至更高。在自動化控制系統(tǒng)中的大量數(shù)據(jù)交換中,長時間、高速度運轉的磁盤,容易因磁盤震動,導致磁盤讀寫能力下降,磁頭定位緩慢,甚至造成磁盤損壞;因此減少工控機環(huán)境震感,有利于保護磁盤。我們可以在工程設計時,盡可能的讓工控機遠離震源大的工作現(xiàn)場;如果工作地點無法更改,我們還可以在工控機柜、箱體下墊置海綿、可緩沖性物體以減小震動帶來的危害。 5、 空氣中的可吸入顆粒物多。很多工廠的原料大多需要粉料進行加工,加上外界空氣流動大、沙塵多,工控機內容易集積大量粘糊狀積塵,造成工控機內局部溫度過高,帶來硬件損壞。這種情況多發(fā)于CPU、電源、硬盤、顯卡等散熱風扇周圍。積塵較輕的地方,在正常生產(chǎn)允許的情況下,可以采用定時吹塵。積塵較嚴重的地方,可以工控機箱透風處安置濾塵紗布,定期清理。 6、 供電電壓波動大、易停電。工業(yè)和生活快速的發(fā)展,對電的需求量也日益增大,很多地區(qū)有電力供應不足、電壓不穩(wěn)、易停電的情況發(fā)生。電壓不穩(wěn)和突然停電,造成系統(tǒng)頻繁重啟,系統(tǒng)文件也容易因此發(fā)生丟失而無法正常啟動;正在執(zhí)行讀寫動作的磁頭,有時會因為停電造成磁頭回位不準帶來工控機磁盤故障。因此工控機工作環(huán)境電源的穩(wěn)定關系到工控機工作正常與否。我們可以采用穩(wěn)壓電源和UPS不間斷電源進行保護,具體設備選型,要依負載功率大小、需保持工作時間多少來定。 四、 故障救急策略: 很多時候,我們的工控人員做了很多保護工作,仍然有工控機磁盤發(fā)生故障的情況,下面我們就與讀者探討一下如何在發(fā)生故障前采取補救措施。建議讀者先學會使用GHOST(著名的磁盤克隆軟件)軟件,對象版本盡可能最新,這將有助于下列方案的實施。 無需資金投入方案:GHOST克隆鏡像。 方案前提:僅僅系統(tǒng)盤出現(xiàn)故障,系統(tǒng)盤可以被FORMAT軟件正常格式化。(筆者曾遇到兩次無法正常用FORMAT軟件格式化系統(tǒng)盤,主從盤方式下,訪問壞磁盤的系統(tǒng)盤時,提示參數(shù)錯誤,采用低格后恢復) 方案材料:GHOST軟件、DOS系統(tǒng)引導盤(可光盤、軟件、U盤) 方案實施:磁盤故障大多發(fā)生在系統(tǒng)盤(C盤),在自動化系統(tǒng)正式投入運行后,首先利用GHOST軟件,對系統(tǒng)盤進行鏡像,將鏡像文件(*.GHO)放至FAT32磁盤格式下進行備份(因為單磁盤情況下,對系統(tǒng)盤進行GHOST恢復,一般在DOS下進行,DOS只能運行在FAT32、FAT16等磁盤格式下,在NTFS的分盤格式下是不能被運行的。),一旦系統(tǒng)盤發(fā)生故障,最快的方法可將系統(tǒng)盤格式化掉,利用GHOST軟件可在5分鐘左右將原鏡像好的文件恢復到系統(tǒng)盤。 方案結論:無需設備投入,無需資金花銷;恢復速度快。此方案只能針對于操作系統(tǒng)破壞而非磁盤發(fā)生物理性損壞的情況下采用;一旦磁盤物理損壞,此方案將無法進行。這也可推廣至整個磁盤鏡像。 經(jīng)濟型方案:克隆雙硬盤備份+GHOST鏡像 方案前提:工控機磁盤故障(無論是系統(tǒng)故障還是磁盤物理性損壞) 方案材料:目標工控機內同型號磁盤一塊、GHOST軟件、DOS系統(tǒng)引導盤(可光盤、軟件、USB盤) 方案實施:在工控機系統(tǒng)投入運行之前,利用GHOST軟件先將存有控制系統(tǒng)磁盤的系統(tǒng)盤(C盤)鏡像至該磁盤的非系統(tǒng)盤FAT32磁盤格式分區(qū)下,再將其整個硬盤內容完整克隆至同型號備用磁盤內。一旦出現(xiàn)操作系統(tǒng)損壞,可將操作系統(tǒng)鏡像文件恢復;如果發(fā)生整個磁盤故障,可將壞磁盤拆除,換上先向備份好同樣內容的備用硬盤即可。 方案結論:只需投入一塊磁盤的資金(約400-800元人民幣之間,視磁盤大小、廠商的不同)、更換容易、恢復速度快、可排除所有磁盤問題。 安全性投入方案(經(jīng)濟型):采用Windows 2000雙硬盤RAID1或三硬盤RAID5方式的軟件磁盤陣列 方案前提:此方案的實施時間,最好在工控機投入運行之前 方案材料:Windows 2000系統(tǒng)盤或更高版本、磁盤兩塊(型號相同為宜) 方案實施:首先安裝Windows 2000系統(tǒng)或更高版本(因為微軟在Windows NT后對磁盤陣列比較好),啟動磁盤陣列功能支持。磁盤陣列方式能在工控機運行時的寫操作,同時向兩塊磁盤寫入相同的內容,假如兩塊磁盤有一塊發(fā)生故障時,<
提交
查看更多評論
其他資訊
STEP-7-V5.1編程使用手冊
初探PID過程控制
淺析ABB AC800F在浮法玻璃換火過程控制系統(tǒng)的實現(xiàn)