Programa del Curso

Introducción a los LLMs Multimodales en Vertex AI

  • Visión general de las capacidades multimodales en Vertex AI
  • Modelos Gemini y modalidades soportadas
  • Casos de uso en empresas e investigación

Configuración del Entorno de Desarrollo

  • Configurando Vertex AI para flujos de trabajo multimodales
  • Trabajando con conjuntos de datos en diferentes modalidades
  • Laboratorio práctico: configuración del entorno y preparación de los conjuntos de datos

Ventanas de Contexto Largo y Razonamiento Avanzado

  • Comprendiendo flujos de trabajo con contexto largo
  • Casos de uso en planificación y toma de decisiones
  • Laboratorio práctico: implementación de análisis con contexto largo

Diseño de Flujos de Trabajo Multimodales

  • Combinando análisis de texto, audio e imagen
  • Encadenando pasos multimodales en pipelines
  • Laboratorio práctico: diseño de un pipeline multimodal

Trabajando con Parámetros API de Gemini

  • Configurando entradas y salidas multimodales
  • Optimizando la inferencia y eficiencia
  • Laboratorio práctico: ajuste de parámetros API de Gemini

Aplicaciones Avanzadas e Integraciones

  • Agentes y asistentes multimodales interactivos
  • Integración de APIs y herramientas externas
  • Laboratorio práctico: creación de una aplicación multimodal

Evaluación e Iteración

  • Prueba del rendimiento multimodal
  • Métricas para precisión, alineación y desviación
  • Laboratorio práctico: evaluación de flujos de trabajo multimodales

Resumen y Pasos Siguientes

Requerimientos

  • Dominio en la programación con Python
  • Experiencia en el desarrollo de modelos de aprendizaje automático
  • Familiaridad con datos multimodales (texto, audio, imagen)

Audiencia

  • Investigadores de IA
  • Desarrolladores avanzados
  • Científicos de ML
 14 Horas

Número de participantes


Precio por Participante​

Próximos cursos

Categorías Relacionadas