容錯服務器作為通過硬件結構來提升穩定性的做法,受到了很多做關鍵性應用企業的青睞,6個9的可靠性能是容錯服務器被眾多企業選擇的理由之一。Stratus就是這么一家制造容錯服務器的老牌廠商。成立于上世紀八十年代,在美國、歐洲、日本、亞太地區都有著龐大的用戶群。從銀行到制造業都在使用容錯服務器來支撐其龐大的工作負載。
提到穩定性,目前國內使用最多的就是三種技術:服務器集群技術、雙機冗余、單機容錯。而雙機與集群是目前中國市場上主流的容錯技術。在國外普遍使用的容錯服務器為什么到了國內卻很少有人去使用,針對這一問題我們請到了Stratus中國區總經理余秀琍女士和Stratus中國華東區業務經理呂祁峰先生來為我們解答。
容錯服務器的先天優勢
容錯服務器之所以擁有6個9的可靠性能,在于它的雙硬件系統結構,簡而言之就是容錯服務器擁有2臺獨立的硬件系統,每臺獨立的硬件相當于一臺服務器。但不同的是,兩臺獨立的硬件受一套時鐘鎖步系統控制,在相同的指令周期內同時執行同一條指令。
時鐘鎖步技術
再通過容錯系統特有的ASIC故障檢測系統對CPU、內存、芯片組、硬盤、I/O等不見得處理結果進行比對,相同則執行下一步,不相同則重新計算。當其中任何部件出現硬件故障時,系統失去容錯能力,降低為一套硬件系統的可靠性,更換后,系統恢復容錯能力。
這就是容錯服務器穩定性的核心所在,但由于是2臺硬件系統,高昂的價格成為了阻礙容錯服務器在國內市場發展的重要因素之一。但通過在中國市場20年的摸爬滾打,余秀琍表示開放的平臺降低了總體的硬件成本,現在的容錯服務器已經不再是封閉的系統,而是可以運行Windows、Linux、VMware的硬件平臺。
雙機與服務器集群容錯的誘惑
雙機與集群之所以成為目前中國市場主流的容錯手段,主要原因還是因為價格,誘人的價格加上眾多廠商的宣傳使我們誤以為雙機HA能夠達到很好的穩定性效果,其實這里面是有要求的,呂祁峰經理道出了其中的真相,他表示對于集群的容錯,是有很高的技術要求的,如果沒有搭建好,在后期的維護上會很困難。所以如果你有很強的實力可以選擇采用集群,如果沒有,選擇容錯服務器會更簡單。
但很多人看不到這一點。雙機和集群是通過軟件的方法,通過故障機切換來提升可靠性。與之相比,容錯是采用硬件的方法,以及特有故障處理和保障機制提高系統的可靠性。容錯較之單機具有更高的可靠性,其中,容錯還具有糾正臨時性錯誤的能力,可以確保計算的正確性。
容錯服務器與雙機服務器集群的互補之道
一種是硬件的方式一種是軟件的方式,可能在過去的時間里,這兩種方式一直處于平行的狀態,但在今天這個發展迅速,復雜多變的市場里,一成不變不是一個明智的做法。Stratus就給出了我們一個順應時代的做法,將硬件與軟件相結合。07年Stratus開始于VMware合作,將VMware軟件的HA與Stratus硬件HA相結合,通過虛擬化來調配所有東西。在云計算上,憑借VMware在虛擬化軟件上的優勢結合Stratus硬件上的穩定,為私有云用戶提供了一個更加穩定,可靠的平臺。呂祁峰最后也表示“這幾年VMware的市場越來越大,我們應當順應潮流,小機的應用會越來越少,因為它的造價成本提高,維護成本提高,這已經不是今天的主流。就像手機Android系統的占有率越來越高,因為開放,所以人才會接受。”