弹性工程的五大支柱(二)

一个“没有奥秘”的心态

拥抱“没有神秘”的文化归结为愿意并有动机找到生产系统中发生的任何问题的根本原因,无论其复杂性如何。每个工程师都必须保持好奇心和探索心态,决不要因不知道而安定下来。

我偶尔想提醒我的团队,当我们没有实现这种思维方式时会发生什么,以及它创造了多少额外的工作。几年前,我们经常在每个星期一早上6点左右发生问题,最终导致客户中断。最初,我们假设它与进入系统的正常负载有关,但是由于它仅发生在一个单元中,因此该理论很快就被忽略了。我们必须从凌晨4:30开始开始托管观察方,工程师监视应用程序和基础结构的不同部分。最终,我们在几周后找到了真正的根本原因,并进行了修复。但是团队仍然记得那些凌乱的凌晨4:30的观看晚会,它们强烈提醒人们永远不要离开一个谜团,而这个谜团会持续很长时间而不会引起客户的骚扰。

enter image description here

强大的自动化

自动化是绝对的要求,但是比根本没有自动化更糟糕的是糟糕的自动化。自动化中的错误会使整个系统崩溃的速度快于人类对其进行恢复并重新投入运行的速度。

实施有效自动化的关键是将其视为生产软件,这意味着应应用强大的软件开发原则。即使您的自动化以少量脚本开始,您也需要考虑发布周期,测试自动化,部署和回滚过程。最初,这对于您的团队来说似乎有些过头了,但是您的整个系统最终将取决于您的自动化系统做出正确的决定,并且在执行时没有错误。如果从一开始就没有合并好的SDLC流程,那么很难为您的自动化做准备。

合适的团队

实践并优先考虑弹性工程的组织始于其员工。工程师编写软件然后将其传递给其他人进行测试和运行的日子已经一去不复返了。今天,今天的每个工程师都有责任确保他们的软件健壮,可靠且始终可用,例如他们拥有可靠的类似SparkleComm统一通信这样的沟通软件。弹性工程是一项艰巨的工作,需要大量热情的工程师,因此请确保您奖励并认可您的团队;确保他们知道您了解挑战的复杂性。

这需要文化上的转变,并从您雇用的人开始。在进行面试时,请确保聘用的人员对他们以前的职位感到自豪,并从解决棘手的问题中获得满意的结果,同时又保持产品的正常运转。

最后,请记住,仅说明弹性工程的这些组成部分是不够的,将它们融入组织的文化中。结合游戏和格言,确保每个人都像老板一样赢得团队合作,并最终使您的客户满意。


相关文章

本文发布者:

王莉

王莉

生活比梦来得浪漫!