二、最终还是会发生故障
这也是一个不争的事实,它适用于数据中心内的所有设备,不管是ms系统设备,还是数据存储设备。对于关键任务数据中心,必须非常谨慎地选择具有出色服务记录的高质量、可靠的厂商。即便如此,设备最终仍然会发生故障。
不幸的是,当设备最终发生故障时,人们经常指责厂商没有实现可靠性的预期目标。预期目标必须切实可行,但最终还是会发生故障也是一个不争的事实。
故障分布可能符合随机模式:一个每100年只发生一次故障的产品实际上可能在使用的第一周献出现故障,换了另外一个产品可能还是如此,尽管这个产品巴达到了预定的可靠性水平。对于这类问题,解决的办法就是在系统必须具备容错能力时,一定要建立允许冗余和并行维护的系统。这样,当一个系统发生故障时,还有一个备份系统可以防止运行中断;与此同时,还可以在不中断运行的情况下对主系统进行维护或修复。
如果两个系统同时出现故障,仍然会发生君机现象,但是随着冗余级别的增加,这个概率会变得非常低。在电气和机械配电系统中常常会出现下面的错误:虽然采用冗余,但是只有一个电源路径为负载配电。在这种情况下,下行的连接或设备故障就会导致负载中断。尽管电气布线可能非常可靠,但是偶尔也会发生故障。由于这是惟一的电源路径,因此通常不会将其停下来进行适当的日常维护,这样一来,发生故障的可能性就更大了。