Ingeniería de confiabilidad del sitio

Site Reliability Engineering, es una práctica que los gigantes tecnológicos están practicando en la actualidad, donde los problemas operativos de una organización se tratan como un problema de ingeniería de software, de otra manera, cuando se asigna un desarrollador para resolver el problema operativo. Básicamente, los SRE son ingenieros de software que construyen varios softwares para hacer mejores sistemas confiables. La pregunta que surge es ¿no es eso DevOps? o cual es mejor SRE vs DevOps ?

Historia:
este término fue acuñado por primera vez por Ben Treynor , un ingeniero de software de Google en 2003, esta práctica comenzó mucho antes que el movimiento DevOps. Poco después de implementar SRE en sus instalaciones, el equipo de Treynor lanzó un libro electrónico SRE para informar a la industria sobre la práctica.

Responsabilidades de los ingenieros de confiabilidad del sitio (SRE):

  • Los SRE son responsables y asumen funciones de guardia para los sistemas que se ejecutan en producción.
  • Los SRE son responsables de desarrollar software(s) que mejoren la confiabilidad de los sistemas.
  • Son responsables de realizar revisiones posteriores al incidente de los sistemas que fallan.

SRE vs DevOps: ¿Cuál es mejor?
Hay una gran analogía para entender mejor los dos términos. Entonces, aquí va, consideremos DevOps como una interfaz, es decir, similar a una clase abstracta que contiene métodos sin definiciones, y SRE como una clase concreta que implementa DevOps.

Interface DevOps{
Reduce Organizational silos();
Accepting failures();
Implement gradual changes();
Leverage Automation();
Measure Everything();
}

Ahora, SRE como una clase concreta implementará DevOps, junto con la definición de todos los métodos como:

  • Reducir los silos organizativos, compartiendo la propiedad entre los ingenieros de software, el equipo de productos y los SRE mediante el uso del mismo conjunto de herramientas.
  • Aceptando fallas, ya que ningún sistema es 100% confiable, por lo que habrá fallas, los SRE realizan revisiones posteriores de los sistemas sin culpa y generan metadatos para los mismos.
  • Implementando pequeños cambios, más pequeño es el cambio, más fácil es identificar el problema o más rápido es corregir el cambio o revertirlo. De este modo, se reduce el costo de la falla.
  • Aprovechar la automatización, automatizar las tareas manuales, siempre que sea posible en el sistema de producción, como la creación de usuarios, la instalación de paquetes, las alertas o el registro, etc.
  • Medir todo, al final monitorear las cosas correctas que se han implementado, ya que al final del día debe tener números o métricas claras que respalden el éxito.

    Por lo tanto, SRE y DevOps no son estándares en competencia, sino que van de la mano. Entonces, es SRE con DevOps .

Publicación traducida automáticamente

Artículo escrito por gupta_shashank y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *