站群伺服器一旦配置好,它就需要全天候 24 小時不間斷的執行,可以說,站群伺服器對配置要求還是非常高的,尤其是對站群伺服器的容錯性。如果一個站群伺服器出現故障它就影響網站的正常訪問,但是站群伺服器容錯性較高的話,有不錯的容錯機制,那麼它還有可能保證保持正常的執行。如果站群伺服器容錯性差的話,網站受影響就會比較大。推薦閱讀:《有哪些適合香港站群伺服器的業務》
那麼什麼是站群伺服器容錯性呢?
站群伺服器容錯通俗的理解就是站群伺服器在站群系統執行中,如果出現錯誤,擁有一定的糾錯能力,且對一般的故障有容納性,是多使用者對站群伺服器穩定性追求的體現。更直白的理解就是站群伺服器允許出現一定的錯誤,能夠自動修復及備份,支援冗餘功能模組。
一般來說,如果站群伺服器出現錯誤時,這些錯誤的部件可以及時的得到修復或切換,從而能夠保證正常的執行,且站群伺服器容錯性對 CPU,記憶體,網路卡及磁碟,甚至電源都能夠實現冗餘備份,這樣可以減少站群系統宕機及資料丟失的機率。那麼站群伺服器容錯性好一般體現在哪些方面呢?
第一,站群伺服器的冗餘電源
站群伺服器冗餘電源供應,指的是站群伺服器有不間斷的電源供應,定期檢測備用發動,尤其是一些資料中心,如果沒有冗餘電源,當電源出現故障時,站群伺服器將斷電無法正常執行,如果存在未儲存的資料,可能會造成資料丟失。推薦閱讀:《推薦遊戲行業使用高防站群伺服器的原因》
站群伺服器容錯性對站群伺服器正常執行有什麼影響
第二、高容錯的 RAID 磁碟
一些提供商為了節省成本會採用單磁碟或 RAID0 方案,而 RAID0 的優勢就是提高硬碟容量,寫入讀取是兩塊磁碟的總和。但是,當任何一塊硬碟發生故障時,整個 RAID 上的資料將不可恢復。而 RAID1 方案擁有更好的資料可靠性,當一塊磁碟故障時,另一塊磁碟可以進行接替使用,保證我們是資料安全。因此在 RAID0 和 RAID1 之間,我們更推薦採用 RAID1 作為首選的磁碟使用。
第三,站群伺服器硬體故障
對站群伺服器硬體監測一定不能缺少,要隨時對這些資料進行監測,當監控中出現故障硬體時,需要及時採取措施更換損壞的硬體裝置,降低由於備用裝置全部出現故障時導致的資料丟失風險
第四,強化站群伺服器維護人員的操作規範
站群伺服器的正常維護需要人工進行操作,而人工操作在不規範的操作下有可能出現硬體損壞或軟體故障。因此,強化站群伺服器維護人員的技能必不可少。
總結:站群伺服器容錯性是透過 CPU 時鐘鎖頻,透過對站群系統中所有 硬體的備份,包括 CPU 、記憶體和 I/O 匯流排等的冗餘備份; 透過站群系統內所有冗餘部件的同步執行,實現真正意義上的容錯。站群系統任何部件的故障都不會造成站群系統停 頓和資料丟失。目前很多容錯站群系統是基於 IA 架構的站群伺服器,與 Windows 2000 完全相容,實現以前只有在 RISC 站群系統上才能實現的容錯。這種容錯 技術在 IA 站群伺服器上的實現,將 IA 站群伺服器的可靠性提高到了 99.999%,同時站群伺服器的執行是不間斷的。