行业新闻与博客

如何利用云架构实现高可用性

云架构现在被广泛使用; 在服务和解决方案方面,云是众多令人惊叹的替代品。然而,强大的力量带来了巨大的责任,云将自身呈现为失败可能并最终将发生的地方。因此,它将迅速扩散到整个架构上,可能导致大量中断,从而使企业陷入困境。


好吧,这不是一个过于乐观的情况 - 更可能是相反 - 但不要害怕。这几乎是任何架构的本质 - 为什么云应该有所不同?


云架构师在任何给定时间都会面临两个不同的问题,以便为最坏的情况做好准备; 首先,如果发生意外和不希望的事情,如何继续进行业务操作,就好像什么都没发生一样,其次,如果发生了意外和不希望的事情,我无法像往常一样继续运营,我怎样才能将架构带到其他地方和合理的时间窗口,然后,像往常一样恢复运营?

在这些条款中,我们可以讨论:
- 面对停电
,继续照常营业 - 面对不可挽回的停电,尽可能在最短的时间内恢复业务

第一个是高可用性,第二个是灾难恢复。在这里,我们将关注高可用性。

目前摆在桌面上的替代品

云的收益率高于预期的两种情况。大多数云以地理和技术方式分布,以避免大量中断情况; 在小范围内,云具有所谓的可用区(AZ)或可用域(AD)。这些通常是在同一地理区域内的不同建筑物或不同建筑群,相互连接但高度冗余,特别是涉及电力,制冷和储存。

在很大程度上,云被区域划分; 全球区域,即如果我们关注 Google Cloud 和 Amazon Web Services 等巨头,就会有 10 个或 15 个区域。这些地区在全球范围内传播,有两个目的; 在发生灾难和性能时进行隔离。不同国家和地区的客户将由最近的服务点提供服务,而不是重新路由到主服务点。这就是使延迟更小,响应更高的原因。


考虑到所有这些因素,建筑师的任务是设计具有可用区域和区域的服务,以便正确地为客户服务并利用手头的技术。架构不会被不同地区的云提供商复制 - 这是架构师和工程团队需要考虑和解决的问题,可用域也是如此,除非讨论是关于存储的; 计算实例和虚拟网络提及核心服务,大多数情况下不会在广告或 AZ 中复制。


高可用性的替代方案涉及避免单点故障,在部署到产品之前测试体系结构的弹性,以及构建主 / 主,主 / 从或主动 / 被动解决方案以便始终可用,或者具有自动化能够将不可用时间降至最低。

什么是最佳实践?

以下是在云中提供 HA 方面的最佳实践列表。它并不完全全面,但它也可能在较小程度上适用于数据中心架构。

  • 在广告中分发负载均衡器,注意架构中的单点故障(SPOF):两个是一个,一个是没有
  • 如果云提供商没有在广告中提供冗余并且自动提供相同数据的至少三个副本,那么重新评估提供商决策或考虑提供此类服务的服务可能是个好主意。
  • 容易进入,易于离开:有必要确保在移动或重定向服务变得原始的情况下,可以用最少的努力这样做
  • 如果可能的话,实施额外的监控和指标系统,更不用说良好的集成:如果可能的话,现成的,通过可以提供及时警报和丰富诊断信息的第三方。像 New Relic 这样的平台,或像 PagerDuty 这样的事件工具,可能非常有价值
  • 保持架构版本化,并在 IaaC(基础架构作为代码)形式:如果整个区域消失,可以在不同区域甚至不同的云中生成整个服务,前提是已复制数据和 DNS 服务很有弹性
  • 保持 DNS 服务的弹性:这一点不言而喻,特别是在上一步之后; 灵活性是指向一个方向或另一个方向的记录的关键
  • 有些云不会收费以使实例处于停止状态,尤其是对于 VM,例如 Oracle 仅对已停止的实例收费(如果这些是 Dense 或 HighIO),否则它不会收费。很容易利用这一点,并在两个区域保持重复的架构; 与 IaaC 一起,这不是不真实的,也很容易维护
  • 以块存储的方式不断地在 AD 之间同步必要和关键数据,并且经常不连接,如果这意味着要为这些 NVMe 连接到的未使用的计算资源付费,请避免使用 NVMe
  • 利用对象存储以在 +2 个区域中复制数据
  • 利用冷存储(存档,如 Glacier)来保留几个稀疏区域中的关键数据; 有时为了打破最低保留政策并要求恢复而付出代价是值得的,以便提高生产环境
  • 使用 API 和 SDK 实现自动化,通过创建 HA 和故障转移工具,自动化可以将系统转换为自主系统,自行处理故障转移,将其与异常检测相结合可以改变游戏规则。不要过分依赖仪表板 - 大多数事情可以 / 现在,有些必须在幕后完成
  • 没有人说必须坚持使用一个云:利用编排和云提供商的强大功能,可以同时在多个云中建立基础架构,进行比较,并在必要时切换提供商
  • 使用工具测试基础架构的弹性和工程团队的准备情况 - 假设架构中的重要故障可以产生大量学习

结论

虽然最佳实践只是应用的最佳实践,但并非所有实践都可以应用于同一架构或同时应用,因此经验丰富的架构和工程团队的判断始终是必要的。

也就是说,大多数要点都可以毫不费力地应用。它只需要一些艰苦的工作和处置,但产生的结果将使其在铜中的价值。

快乐的建筑和保持良好的工作。

非常感谢您对亚洲注册的支持与信任!

禁止转载

需要帮助吗?联系我们的支持团队 在线客服