工業(yè)云計算平臺的高可用性設(shè)計
海得控制推出的工業(yè)云計算平臺(代號為indusCloud)方案是以國際主流基礎(chǔ)架構(gòu)即服務(wù)(IaaS)技術(shù)為標準,以最具影響力的數(shù)據(jù)中心云計算軟件Openstack開放源代碼為核心,基于它提供的計算資源管理、存儲管理、網(wǎng)絡(luò)管理、鏡像管理、認證管理、計量管理和其他模塊進行一定的二次開發(fā)和功能優(yōu)化而形成的。indusCloud兼容異構(gòu)虛擬化軟件、服務(wù)器設(shè)備、存儲設(shè)備和網(wǎng)絡(luò)設(shè)備,同時結(jié)合存儲計算融合的架構(gòu),基于分布式存儲,構(gòu)建一個符合主流技術(shù)的、易于擴展的、高可用的、具備國產(chǎn)自主可控的云計算虛擬化軟件方案。
indusCloud工業(yè)云計算平臺的高可用的設(shè)計要點包含云計算管理平臺高可用、計算節(jié)點高可用、存儲系統(tǒng)的高可用和網(wǎng)絡(luò)系統(tǒng)的高可用等,最終實現(xiàn)工業(yè)IT系統(tǒng)及應(yīng)用的高可用性。
云計算管理平臺采用硬件級容錯服務(wù)器設(shè)計,采用芯片級同步處理技術(shù)(Lock-Step)確保任何故障(甚至于瞬時故障)都能被準確檢測到,包括 CPU、內(nèi)存,主板、磁盤、網(wǎng)絡(luò)及電源在內(nèi)的任何故障發(fā)生,系統(tǒng)零秒中斷,無任何數(shù)據(jù)丟失。從而保障云計算管理平臺永遠持續(xù)在線運行,系統(tǒng)可靠性99.9998%以上。內(nèi)置AutomatedUptime Layer系統(tǒng)軟件,用于檢測潛在問題,并預(yù)防中斷。持續(xù)監(jiān)控500 多個系統(tǒng)組件和傳感器狀態(tài),從而在故障對系統(tǒng)造成影響之前對其進行識別、處理和報告。提供單一系統(tǒng)管理視圖,并結(jié)合廣泛的狀態(tài) LED 指示燈,從而消除管理復(fù)雜性。
云計算管理平臺可以根據(jù)負載進行智能分析調(diào)度,實現(xiàn)統(tǒng)一資源池中節(jié)點負載均衡,更好的利用資源。無論是計算還是存儲系統(tǒng),在發(fā)生故障的時候可以自動快速恢復(fù)。這種分布式計算系統(tǒng)和存儲系統(tǒng)設(shè)計,很容易擴展,新節(jié)點只需要簡單配置,便能自動開始承載負荷,實現(xiàn)資源池的橫向擴展。
對于數(shù)據(jù)中心大多數(shù)應(yīng)用系統(tǒng),通過虛擬機HA熱遷移高可用性技術(shù),可以避免因”計劃內(nèi)停機”而導致業(yè)務(wù)中斷。通過監(jiān)控主機IPMI數(shù)據(jù),在物理機出現(xiàn)故障預(yù)警時動態(tài)遷移該節(jié)點上的虛擬機至健康的主機節(jié)點上。即使是”計劃外停機(如物理機突然奔潰)”,運行在上面的虛擬機遷移恢復(fù)時間也可以控制在幾分鐘以內(nèi),保障業(yè)務(wù)連續(xù)運行。
然而對于重量級的核心數(shù)據(jù)庫系統(tǒng),關(guān)鍵應(yīng)用管理系統(tǒng)。需要更高可靠性的系統(tǒng)設(shè)計方案,完全可以避免因”計劃外宕機”而導致的業(yè)務(wù)中斷。其中最具有代表性的是海得公司推出的H&I SERVER冗余容錯服務(wù)器方案。主要特征是,基于硬件虛擬化設(shè)計,采用虛擬內(nèi)存同步技術(shù)和IO多路徑熱轉(zhuǎn)移技術(shù),實現(xiàn)客戶虛擬機系統(tǒng)在冗余的物理機節(jié)點間雙活同步運行,包括芯片、內(nèi)存、主板、電源在內(nèi)的任何物理節(jié)點故障發(fā)生,虛擬機系統(tǒng)連續(xù)不中斷運行??煽啃远x在99.999%以上。
indusCloud通過底層分布式存儲技術(shù),將x86服務(wù)器節(jié)點組成一個高可用的分布式存儲資源池。indusCloud上層將存儲資源池化成云硬盤(塊存儲),為用戶提供云硬盤管理服務(wù)。分布式存儲可以實現(xiàn)文件的多副本保存,同一份數(shù)據(jù)在多個物理節(jié)點分散存儲,單物理節(jié)點上的硬盤也通過硬件RAID做磁盤級別的防護,避免單點失效,同時分布式存儲擁有智能恢復(fù)和均衡技術(shù),在遇到故障時能夠?qū)崿F(xiàn)自動容錯和負載協(xié)同。
集中式存儲(共享磁盤陣列)采用雙活控制器容錯設(shè)計,Mirror-Cache高速緩存鏡像技術(shù),實現(xiàn)故障零秒切換功能。全冗余及模塊化設(shè)計,無單點故障。所有部件如電源、風扇、控制器和硬盤均支持在線不停機更換。99.999%以上可靠性。
網(wǎng)絡(luò)層面的高可用主要保證所有連接冗余,每個服務(wù)器配備雙物理卡網(wǎng)絡(luò)層面的高可用主要保證所有連接冗余,交換機和防火墻也配備了雙活冗余(如鏈路聚合,VRRP等),避免因單點失效而導致的網(wǎng)絡(luò)中斷。
提交
直播定檔!見證西門子與中科摩通聯(lián)手打造汽車電子智能制造新范式
光亞論壇·2024 智能產(chǎn)業(yè)聚合高峰論壇舉辦!
新訊受邀參加華為Redcap產(chǎn)業(yè)峰會,并榮獲RedCap生態(tài)合作獎!
2024年斯凱孚創(chuàng)新峰會暨新產(chǎn)品發(fā)布會召開,以創(chuàng)新產(chǎn)品矩陣重構(gòu)旋轉(zhuǎn)
禹衡光學亮相北京機床展,以創(chuàng)新助力行業(yè)發(fā)展新篇章