尽管有可能将这个博客变成仅仅是2.5 名管理员的记录,但 Allan 的观点是正确的:
容错的重点在于尝试消除单点故障。这并不总是技术性的。
单点故障可能是:你不能只使用一家云提供商。你不能只在该云提供商上使用一个账户!你不能只用一张信用卡支付多家云提供商的费用。
每一层都需要有冗余,否则一切都依赖于它[…]当它坏了,一切都会坏。
顺便提一句,出于这个原因,在多个层面上开展更多的售前工程工作确实令人大开眼界。我的很多谈话内容并非关于技术本身,而是关于使用或管理技术的人。这听起来显而易见,但你会惊讶地发现,许多技术人员并不认为这些对于系统弹性至关重要……结果也并不令人意外。
作者: Ruben Schade ,悉尼,2025 年 8 月 26 日。