Temario del curso
Anti-patrones de SRE
- Identificación de prácticas contraproducentes.
- Reconocimiento del impacto de los anti-patrones en la confiabilidad.
- Mejores prácticas y alternativas correctivas.
SLO como indicador proxy de satisfacción del cliente
- Definición de Indicadores de Nivel de Servicio (SLI) y Objetivos de Nivel de Servicio (SLO).
- Gestión de presupuestos de errores y equilibrio entre innovación y confiabilidad.
- Comprensión de los límites de los sistemas distribuidos.
Construcción de sistemas seguros y confiables
- Diseño para tolerancia a fallos y resiliencia.
- Integración de la seguridad en la ingeniería de confiabilidad.
- Estrategias de escalabilidad y protección de datos.
Observabilidad full-stack
- Instrumentación y recopilación de métricas.
- Rastreo distribuido y monitoreo sintético.
- Desarrollo impulsado por la observabilidad.
Ingeniería de plataformas e inteligencia artificial operativa (AIOps)
- Enfoques de ingeniería centrados en plataformas.
- Automatización y orquestación en SRE.
- Aprovechamiento de DataOps e inteligencia operativa.
Gestión de incidentes en SRE
- Roles y responsabilidades en la respuesta a incidentes.
- Aplicación de marcos como OODA (Observar, Orientar, Decidir, Actuar).
- Remediación automatizada y resolución asistida por IA/ML.
Ingeniería del caos
- Principios y estrategias para pruebas de resiliencia.
- Planificación y ejecución de ejercicios "día del juego" (game days).
- Aprendizaje a partir de experimentos controlados de fallos.
SRE como una forma pura de DevOps
- Integración de SRE en flujos de trabajo DevOps.
- Alineamiento cultural y prácticas colaborativas.
- Dinamización de la transformación organizacional a través de SRE.
Ejercicios posteriores al curso
- Estudios de caso sobre diseño de sistemas a gran escala.
- Escenarios avanzados de instrumentación y monitoreo.
- Resolución de problemas reales de confiabilidad.
Revisión y preparación para el examen
- Revisión final del temario de Profesional en SRE del Instituto DevOps.
- Preguntas de muestra y pruebas de práctica.
- Estrategias y recomendaciones para la realización del examen.
Resumen y siguientes pasos
Requerimientos
- Comprensión de los principios fundamentales de la Ingeniería de Confiabilidad del Sitio (SRE).
- Experiencia con prácticas DevOps y herramientas relacionadas.
- Familiaridad con monitoreo de sistemas, gestión de incidentes y automatización.
Audiencia objetivo
- Profesionales de SRE que buscan obtener la certificación Profesional en SRE del Instituto DevOps.
- Ingenieros DevOps que aspiren a ampliar su ámbito hacia roles centrados en la confiabilidad.
- Líderes de operaciones responsables de la estrategia y ejecución de la confiabilidad.
Testimonios (2)
El conocimiento y experiencia del consultor ya que se abordan los temas teóricos aplicándolos a la realidad de los procesos. El curso contiene un programa de mucho valor en la gestión de las tecnologías de información.
Luis Castro Gamboa - Cooperativa De Ahorro Y Credito Ande No. 1 R.L.
Curso - Site Reliability Engineering (SRE) Foundation®
Que fue muy claro en cada especificación