Contacta con nosotros

Temario del curso

Fundamentos de la Depuración y Evaluación en Mastra

  • Comprensión de los modelos de comportamiento del agente y sus modos de fallo
  • Principios básicos de depuración dentro de Mastra
  • Evaluación de acciones deterministas y no deterministas de los agentes

Configuración de Entornos para la Prueba de Agentes

  • Configuración de entornos de prueba aislados y espacios de evaluación independientes
  • Captura de registros, trazas y telemetría para un análisis detallado
  • Preparación de conjuntos de datos y prompts para pruebas estructuradas

Depuración del Comportamiento de Agentes de IA

  • Trazado de rutas de decisión y señales internas de razonamiento
  • Identificación de alucinaciones, errores y comportamientos no deseados
  • Uso de paneles de observabilidad para la investigación de causas raíz

Métricas de Evaluación y Marcos de Referencia (Benchmarking)

  • Definición de métricas de evaluación cuantitativas y cualitativas
  • Medición de precisión, consistencia y cumplimiento contextual
  • Aplicación de conjuntos de datos de referencia para evaluaciones repetibles

Ingeniería de Fiabilidad para Agentes de IA

  • Diseño de pruebas de fiabilidad para agentes que ejecutan tareas prolongadas
  • Detección de deriva (drift) y degradación en el rendimiento del agente
  • Implementación de salvaguardas para flujos de trabajo críticos

Procesos de Control de Calidad y Automatización

  • Construcción de pipelines de control de calidad para evaluación continua
  • Automatización de pruebas de regresión para actualizaciones de agentes
  • Integración del control de calidad en CI/CD y flujos de trabajo empresariales

Técnicas Avanzadas para la Reducción de Alucinaciones

  • Estrategias de prompts para reducir salidas no deseadas
  • Bucles de validación y mecanismos de autoverificación
  • Experimentación con combinaciones de modelos para mejorar la fiabilidad

Informes, Monitoreo y Mejora Continua

  • Elaboración de informes de control de calidad y tableros de puntuación de agentes
  • Monitoreo del comportamiento a largo plazo y patrones de error
  • Iteración sobre los marcos de evaluación para sistemas en evolución

Resumen y Próximos Pasos

Requerimientos

  • Comprensión del comportamiento de los agentes de IA y las interacciones con los modelos
  • Experiencia en la depuración o prueba de sistemas de software complejos
  • Familiaridad con herramientas de observabilidad o registro de eventos (logging)

Público Objetivo

  • Ingenieros de control de calidad
  • Ingenieros de fiabilidad de IA
  • Desarrolladores responsables de la calidad y el rendimiento de los agentes
 21 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas