Contacta con nosotros

Temario del curso

Introducción a AIOps

  • ¿Qué es AIOps y por qué es importante?
  • Monitoreo tradicional vs. observabilidad impulsada por AIOps
  • Arquitectura de AIOps y componentes clave

Recopilación y Normalización de Datos Operativos

  • Tipos de datos de observabilidad: métricas, registros y rastros
  • Ingesta de datos desde múltiples fuentes (servidores, contenedores, nube)
  • Uso de agentes y exportadores (Prometheus, Beats, Fluentd)

Correlación de Datos y Detección de Anomalías

  • Correlación de series temporales y métodos estadísticos
  • Uso de modelos de aprendizaje automático para la detección de anomalías
  • Detección de incidentes en sistemas distribuidos

Alertas y Reducción de Ruido

  • Diseño de reglas y umbrales inteligentes para alertas
  • Supresión, deduplicación y agrupación de alertas
  • Integración con Alertmanager, Slack, PagerDuty u Opsgenie

Análisis de la Causa Raíz y Visualización

  • Uso de paneles de control para visualizar métricas y detectar tendencias
  • Exploración de eventos y líneas de tiempo para el análisis de causa raíz (RCA)
  • Rastreo de problemas a través de capas con herramientas de rastreo distribuido

Automatización y Remediación

  • Activación de scripts o flujos de trabajo automatizados a partir de incidentes
  • Integración con sistemas ITSM (ServiceNow, Jira)
  • Casos de uso: auto-reparación, escalado y reconfiguración de tráfico

Plataformas AIOps de Código Abierto y Comerciales

  • Descripción general de herramientas: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
  • Criterios de evaluación para seleccionar una plataforma AIOps
  • Demostración y práctica con un conjunto de herramientas seleccionado

Resumen y Próximos Pasos

Requerimientos

  • Comprender los conceptos de operaciones de TI y monitoreo del sistema
  • Experiencia con herramientas o paneles de control de monitoreo
  • Familiaridad con formatos básicos de registros y métricas

Público Objetivo

  • Equipos de operaciones responsables de infraestructura y aplicaciones
  • Ingenieros de Confiabilidad del Sitio (SRE, por sus siglas en inglés)
  • Equipos de monitoreo y observabilidad de TI
 14 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas