站群服务器一旦配置好,它就需要全天候 24 小时不间断的执行,可以说,站群服务器对配置要求还是非常高的,尤其是对站群服务器的容错性。如果一个站群服务器出现故障它就影响网站的正常访问,但是站群服务器容错性较高的话,有不错的容错机制,那么它还有可能保证保持正常的执行。如果站群服务器容错性差的话,网站受影响就会比较大。推荐阅读:《有哪些适合香港站群服务器的业务》
那么什么是站群服务器容错性呢?
站群服务器容错通俗的理解就是站群服务器在站群系统执行中,如果出现错误,拥有一定的纠错能力,且对一般的故障有容纳性,是多用户对站群服务器稳定性追求的体现。更直白的理解就是站群服务器允许出现一定的错误,能够自动修复及备份,支援冗余功能模组。
一般来说,如果站群服务器出现错误时,这些错误的部件可以及时的得到修复或切换,从而能够保证正常的执行,且站群服务器容错性对 CPU,内存,网络卡及磁碟,甚至电源都能够实现冗余备份,这样可以减少站群系统宕机及资料丢失的机率。那么站群服务器容错性好一般体现在哪些方面呢?
第一,站群服务器的冗余电源
站群服务器冗余电源供应,指的是站群服务器有不间断的电源供应,定期检测备用发动,尤其是一些资料中心,如果没有冗余电源,当电源出现故障时,站群服务器将断电无法正常执行,如果存在未储存的资料,可能会造成资料丢失。推荐阅读:《推荐游戏行业使用高防站群服务器的原因》
站群服务器容错性对站群服务器正常执行有什么影响
第二、高容错的 RAID 磁碟
一些提供商为了节省成本会采用单磁碟或 RAID0 方案,而 RAID0 的优势就是提高硬碟容量,写入读取是两块磁碟的总和。但是,当任何一块硬碟发生故障时,整个 RAID 上的资料将不可恢复。而 RAID1 方案拥有更好的资料可靠性,当一块磁碟故障时,另一块磁碟可以进行接替使用,保证我们是资料安全。因此在 RAID0 和 RAID1 之间,我们更推荐采用 RAID1 作为首选的磁碟使用。
第三,站群服务器硬件故障
对站群服务器硬件监测一定不能缺少,要随时对这些资料进行监测,当监控中出现故障硬件时,需要及时采取措施更换损坏的硬件装置,降低由于备用装置全部出现故障时导致的资料丢失风险
第四,强化站群服务器维护人员的操作规范
站群服务器的正常维护需要人工进行操作,而人工操作在不规范的操作下有可能出现硬件损坏或软件故障。因此,强化站群服务器维护人员的技能必不可少。
总结:站群服务器容错性是通过 CPU 时钟锁频,通过对站群系统中所有 硬件的备份,包括 CPU 、内存和 I/O 汇流排等的冗余备份; 通过站群系统内所有冗余部件的同步执行,实现真正意义上的容错。站群系统任何部件的故障都不会造成站群系统停 顿和资料丢失。目前很多容错站群系统是基于 IA 架构的站群服务器,与 Windows 2000 完全相容,实现以前只有在 RISC 站群系统上才能实现的容错。这种容错 技术在 IA 站群服务器上的实现,将 IA 站群服务器的可靠性提高到了 99.999%,同时站群服务器的执行是不间断的。