El Site Reliability Guardian de Dynatrace es una aplicación que automatiza el análisis de impacto de cambios para validar la disponibilidad, el rendimiento y los objetivos de capacidad de los servicios a través de diferentes sistemas. Este se utiliza en prácticas de Ingeniería de Confiabilidad del Sitio (SRE) y DevOps para proporcionar a los equipos una plataforma de entrega que les permita lanzar sus aplicaciones y servicios de manera autónoma e independiente, manteniendo al mismo tiempo los objetivos generales del negocio, la seguridad y la calidad.
La herramienta es particularmente útil para:
- Automatizar y acelerar el proceso de validación de los Objetivos de Nivel de Servicio (SLOs): Esto incluye la detección y reacción rápida a las regresiones detectadas en la topología de las aplicaciones.
- Informar a las personas adecuadas con las respuestas necesarias para implementar medidas correctivas específicas.
En cuanto a ejemplos de uso en Dynatrace:
- Un equipo de Dynatrace responsable de las aplicaciones de demostración utiliza el Site Reliability Guardian para verificar una posible disminución en las transacciones comerciales cada vez que se despliega una nueva versión de la aplicación.
- Otro equipo utiliza un guardián durante las pruebas de caos, utilizando AWS Fault Injection Simulator (FIS) para mejorar el rendimiento y la resiliencia de las aplicaciones.
Para implementar el Site Reliability Guardian, se siguen los siguientes pasos:
- En Dynatrace Launcher, selecciona Site Reliability Guardian.
- Selecciona «+ Guardian» para crear un nuevo guardián.
- Selecciona «Crear sin plantilla».
- Establece el nombre del guardián y, opcionalmente, añade una descripción y etiquetas.
- Agrega objetivos utilizando una consulta DQL personalizada o referenciando un SLO existente.
Los templates ofrecidos incluyen la saturación de la carga de trabajo de Kubernetes, la saturación del clúster y del espacio de nombres de Kubernetes, la utilización y saturación del host y un «security gate» para procesos de lanzamiento.
La automatización de los flujos de trabajo ejecuta validaciones y notifica a los miembros del equipo responsables. Estos flujos de trabajo generados automáticamente se ocupan de la validación completa y automática, ya sea desencadenada por un resultado de prueba o un nuevo despliegue. Además, el flujo de trabajo puede ampliarse fácilmente para satisfacer cualquier demanda personalizada, por ejemplo, integración con herramientas que apoyen el ciclo de vida del producto de software.
En resumen, el Site Reliability Guardian de Dynatrace es una herramienta potente para automatizar y mejorar la confiabilidad de las aplicaciones y servicios en entornos DevOps y SRE, facilitando la toma de decisiones informadas y rápidas sobre lanzamientos y mejoras de calidad.
Información adicional :
En este video destacado de la comunidad Dynatrace, Andreas Grabner y Johannes Braeuer, gerentes de producto en Dynatrace, discuten cómo la aplicación ayuda a automatizar la validación de lanzamientos y el análisis de impacto de cambios, incluyendo notificaciones dirigidas, lo que la convierte en una herramienta imprescindible para los SREs, DevSecOps y los ingenieros de plataformas.
Para obtener una perspectiva más detallada y actualizada sobre el «Site Reliability Guardian» de Dynatrace, puede visitar los siguientes enlaces:
- Dynatrace Docs: Site Reliability Guardian
- Dynatrace Community: Spotlight on Site Reliability Guardian.
“La ciencia puede divertirnos y fascinarnos a todos, pero es la ingeniería la que cambia el mundo”. —Isaac Asimov