Programación NVIDIA GPU - Extended
Este curso en vivo con instructor cubre cómo programar GPUs para computación paralela, cómo usar diversas plataformas, cómo trabajar con la plataforma CUDA y sus características, y cómo realizar varias técnicas de optimización utilizando CUDA. Algunas de las aplicaciones incluyen aprendizaje profundo, análisis, procesamiento de imágenes y aplicaciones de ingeniería.
Temario del curso
Introducción
Comprensión de los fundamentos de la metodología de computación heterogénea
¿Por qué computación paralela? Comprensión de la necesidad de la computación paralela
Procesadores multinúcleo: arquitectura y diseño
Introducción a los hilos, conceptos básicos de hilos y principios fundamentales de la programación paralela
Comprensión de los fundamentos de los procesos de optimización de software para GPU
OpenMP: un estándar para la programación paralela basada en directivas
Práctica / Demostración de varios programas en máquinas multinúcleo
Introducción a la computación con GPU
GPU para computación paralela
Modelo de programación de GPU
Práctica / Demostración de varios programas en GPU
SDK, kit de desarrollo e instalación del entorno para GPU
Trabajo con diversas bibliotecas
Demostración de GPU y herramientas con programas de ejemplo y OpenACC
Comprensión del modelo de programación CUDA
Aprendiendo la arquitectura de CUDA
Exploración y configuración de entornos de desarrollo CUDA
Trabajo con la API de tiempo de ejecución de CUDA
Comprensión del modelo de memoria de CUDA
Explorando características adicionales de la API de CUDA
Acceso eficiente a la memoria global en CUDA: optimización de la memoria global
Optimización de transferencias de datos en CUDA utilizando flujos de CUDA
Uso de memoria compartida en CUDA
Comprensión y uso de operaciones atómicas e instrucciones en CUDA
Caso de estudio: procesamiento básico de imágenes digitales con CUDA
Trabajo con programación de múltiples GPU
Perfilado avanzado del hardware y muestreo en NVIDIA / CUDA
Uso de la API de paralelismo dinámico de CUDA para el lanzamiento dinámico de kernels
Resumen y conclusiones
Requerimientos
- Programación en C
- Linux GCC
Los cursos públicos requieren más de 5 participantes.
Programación NVIDIA GPU - Extended - Reserva
Programación NVIDIA GPU - Extended - Consulta
Programación NVIDIA GPU - Extended - Solicitud de consultoría
Testimonios (1)
La energía y el humor del formador.
Tadeusz Kaluba - Nokia Solutions and Networks Sp. z o.o.
Curso - NVIDIA GPU Programming - Extended
Traducción Automática
Próximos cursos
Cursos Relacionados
Desarrollo de aplicaciones de IA con Huawei Ascend y CANN
21 HorasHuawei Ascend es una familia de procesadores de IA diseñados para inferencia y entrenamiento de alto rendimiento.
Esta formación en vivo impartida por instructores (en línea o presencial) está dirigida a ingenieros de IA y científicos de datos de nivel intermedio que desean desarrollar y optimizar modelos de redes neuronales utilizando la plataforma Ascend de Huawei y el kit de herramientas CANN.
Al finalizar esta formación, los participantes serán capaces de:
- Configurar y configurar el entorno de desarrollo de CANN.
- Desarrollar aplicaciones de IA utilizando flujos de trabajo de MindSpore y CloudMatrix.
- Optimizar el rendimiento en NPUs de Ascend mediante operadores personalizados y técnicas de descomposición (tiling).
- Desplegar modelos en entornos de borde o en la nube.
Formato del curso
- Clase interactiva y discusión.
- Uso práctico de Huawei Ascend y el kit de herramientas CANN en aplicaciones de ejemplo.
- Ejercicios guiados centrados en la construcción, entrenamiento y despliegue de modelos.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso basada en su infraestructura o conjuntos de datos, por favor contáctenos para coordinar.
Despliegue de Modelos de IA con CANN y Procesadores AI Ascend
14 HorasCANN (Compute Architecture for Neural Networks) es la pila de cómputo para IA de Huawei, diseñada para implementar y optimizar modelos de IA en procesadores AI Ascend.
Esta formación en vivo con instructor (en línea o presencial) está dirigida a desarrolladores e ingenieros de IA de nivel intermedio que deseen implementar eficientemente modelos de IA entrenados en hardware Huawei Ascend utilizando la herramienta CANN y otras herramientas como MindSpore, TensorFlow o PyTorch.
Al finalizar esta formación, los participantes serán capaces de:
- Comprender la arquitectura de CANN y su papel en el proceso de implementación de IA.
- Convertir y adaptar modelos de marcos de trabajo populares a formatos compatibles con Ascend.
- Utilizar herramientas como ATC, la conversión de modelos OM y MindSpore para inferencia en edge y nube.
- Diagnosticar problemas de implementación y optimizar el rendimiento en hardware Ascend.
Formato del Curso
- Conferencia interactiva y demostraciones.
- Práctica de laboratorio utilizando herramientas CANN y simuladores o dispositivos Ascend.
- Escenarios prácticos de implementación basados en modelos de IA del mundo real.
Opciones de Personalización del Curso
- Para solicitar una formación personalizada para este curso, contáctenos para coordinar los detalles.
Inferencia y despliegue de IA con CloudMatrix
21 HorasCloudMatrix es la plataforma unificada de desarrollo y despliegue de inteligencia artificial de Huawei, diseñada para soportar pipelines de inferencia escalables y de grado productivo.
Esta formación en vivo, impartida por instructores (en línea o presencial), está dirigida a profesionales de IA de nivel principiante a intermedio que deseen desplegar y monitorear modelos de IA utilizando la plataforma CloudMatrix con integración de CANN y MindSpore.
Al finalizar esta formación, los participantes podrán:
- Utilizar CloudMatrix para el empaquetado, despliegue y servicio de modelos.
- Convertir y optimizar modelos para conjuntos de chips Ascend.
- Configurar pipelines para tareas de inferencia en tiempo real y por lotes.
- Monitorear los despliegues y ajustar el rendimiento en entornos de producción.
Formato del curso
- Conferencia interactiva y discusión.
- Uso práctico de CloudMatrix con escenarios reales de despliegue.
- Ejercicios guiados centrados en la conversión, optimización y escalabilidad.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso basada en su infraestructura de IA o entorno en la nube, póngase en contacto con nosotros para organizarlo.
Programación de GPU en Aceleradores de IA Biren
21 HorasLos aceleradores de IA Biren son GPUs de alto rendimiento diseñadas para cargas de trabajo de IA y HPC, con soporte para entrenamiento e inferencia a gran escala.
Esta capacitación en vivo impartida por un instructor (en línea o presencial) está dirigida a desarrolladores de nivel intermedio a avanzado que deseen programar y optimizar aplicaciones utilizando la pila propietaria de GPU de Biren, con comparaciones prácticas frente a entornos basados en CUDA.
Al finalizar esta capacitación, los participantes podrán:
- Comprender la arquitectura de la GPU Biren y su jerarquía de memoria.
- Configurar el entorno de desarrollo y utilizar el modelo de programación de Biren.
- Traducir y optimizar código estilo CUDA para plataformas Biren.
- Aplicar técnicas de ajuste de rendimiento y depuración.
Formato del curso
- Conferencia interactiva y discusión.
- Uso práctico del SDK de Biren en cargas de trabajo de GPU de muestra.
- Ejercicios guiados centrados en el porteo y el ajuste de rendimiento.
Opciones de personalización del curso
- Para solicitar una capacitación personalizada para este curso basada en su pila de aplicaciones o necesidades de integración, contáctenos para coordinar.
Desarrollo en Cambricon MLU con BANGPy y Neuware
21 HorasLas unidades de aprendizaje automático (MLU) de Cambricon son chips de IA especializados, optimizados para inferencia y entrenamiento en escenarios de bordes de red (edge) y centros de datos.
Esta capacitación en vivo, impartida por un instructor (en línea o presencial), está dirigida a desarrolladores de nivel intermedio que deseen construir y desplegar modelos de IA utilizando el marco de trabajo BANGPy y el SDK de Neuware en hardware Cambricon MLU.
Al finalizar esta capacitación, los participantes podrán:
- Configurar y establecer los entornos de desarrollo para BANGPy y Neuware.
- Desarrollar y optimizar modelos basados en Python y C++ para Cambricon MLUs.
- Desplegar modelos en dispositivos de borde y centros de datos que ejecuten el entorno de ejecución de Neuware.
- Integrar flujos de trabajo de ML con funciones de aceleración específicas para MLU.
Formato del curso
- Clases interactivas y discusiones.
- Práctica directa con BANGPy y Neuware para desarrollo y despliegue.
- Ejercicios guiados centrados en la optimización, integración y pruebas.
Opciones de personalización del curso
- Para solicitar una capacitación personalizada para este curso basada en el modelo de dispositivo Cambricon o caso de uso, contáctenos para coordinarlo.
Introducción a CANN para desarrolladores de frameworks de IA
7 HorasCANN (Compute Architecture for Neural Networks) es el kit de herramientas de computación de IA de Huawei, utilizado para compilar, optimizar e implementar modelos de IA en procesadores de IA Ascend.
Esta formación presencial dirigida por un instructor (en línea o in situ) está dirigida a desarrolladores de IA de nivel principiante que desean comprender cómo CANN se integra en el ciclo de vida del modelo, desde el entrenamiento hasta la implementación, y cómo funciona con frameworks como MindSpore, TensorFlow y PyTorch.
Al finalizar esta formación, los participantes podrán:
- Comprender el propósito y la arquitectura del kit de herramientas CANN.
- Configurar un entorno de desarrollo con CANN y MindSpore.
- Convertir e implementar un modelo de IA básico en hardware Ascend.
- Adquirir conocimientos fundamentales para futuros proyectos de optimización o integración de CANN.
Formato del curso
- Conferencia interactiva y discusión.
- Talleres prácticos con implementación de modelos sencillos.
- Recorrido paso a paso por la cadena de herramientas de CANN y los puntos de integración.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso, contáctenos para coordinar los detalles.
Implementación de CANN para Inteligencia Artificial en el Borde
14 HorasEl kit de herramientas Ascend CANN de Huawei permite una inferencia de IA potente en dispositivos de borde, como el Ascend 310. CANN proporciona las herramientas esenciales para compilar, optimizar y desplegar modelos en entornos donde los recursos de cómputo y memoria son limitados.
Esta formación en vivo, impartida por un instructor (en línea o presencial), está dirigida a desarrolladores e integradores de IA de nivel intermedio que deseen implementar y optimizar modelos en dispositivos de borde Ascend utilizando la cadena de herramientas CANN.
Al finalizar esta capacitación, los participantes podrán:
- Preparar y convertir modelos de IA para el Ascend 310 utilizando las herramientas de CANN.
- Construir pipelines de inferencia ligeros mediante MindSpore Lite y AscendCL.
- Optimizar el rendimiento del modelo para entornos con recursos limitados de cómputo y memoria.
- Implementar y supervisar aplicaciones de IA en casos de uso reales en el borde.
Formato del Curso
- Conferencia interactiva y demostraciones.
- Prácticas de laboratorio con modelos y escenarios específicos para el borde.
- Ejemplos de implementación en vivo en hardware virtual o físico de borde.
Opciones de Personalización del Curso
- Para solicitar una capacitación personalizada para este curso, contáctenos para organizarla.
Comprensión de la Pila de Computación de IA de Huawei: Desde CANN hasta MindSpore
14 HorasLa pila de IA de Huawei, desde el SDK de bajo nivel CANN hasta el marco de trabajo de alto nivel MindSpore, ofrece un entorno integrado para el desarrollo y despliegue de IA, optimizado para hardware Ascend.
Esta capacitación presencial en vivo (en línea o in situ) está dirigida a profesionales técnicos de nivel principiante e intermedio que desean comprender cómo los componentes CANN y MindSpore funcionan juntos para administrar el ciclo de vida de la IA y tomar decisiones sobre infraestructura.
Al finalizar esta capacitación, los participantes podrán:
- Comprender la arquitectura por capas de la pila de computación de IA de Huawei.
- Identificar cómo CANN admite la optimización de modelos y el despliegue a nivel de hardware.
- Evaluar el marco de trabajo MindSpore y su conjunto de herramientas en relación con alternativas del sector.
- Situar la pila de IA de Huawei dentro de entornos empresariales o de nube/situados en las instalaciones (on-prem).
Formato del curso
- Lecciones interactivas y debates.
- Demostraciones en vivo del sistema y recorridos basados en casos prácticos.
- Laboratorios guiados opcionales sobre el flujo de modelos desde MindSpore hasta CANN.
Opciones de personalización del curso
- Para solicitar una capacitación personalizada para este curso, contáctenos para coordinar los detalles.
Optimización del Rendimiento de Redes Neuronales con el SDK CANN
14 HorasEl SDK CANN (Compute Architecture for Neural Networks) es la base de cómputo de IA de Huawei que permite a los desarrolladores ajustar y optimizar el rendimiento de las redes neuronales implementadas en procesadores de IA Ascend.
Esta formación en vivo con instrucción directa (en línea o presencial) está dirigida a desarrolladores de IA de nivel avanzado e ingenieros de sistemas que deseen optimizar el rendimiento de inferencia utilizando el conjunto de herramientas avanzado de CANN, incluyendo el Motor de Grafos (Graph Engine), TIK y el desarrollo de operadores personalizados.
Al finalizar esta formación, los participantes podrán:
- Comprender la arquitectura en tiempo de ejecución del CANN y su ciclo de vida para el rendimiento.
- Utilizar herramientas de perfilado (profiling) y el Motor de Grafos para el análisis y la optimización del rendimiento.
- Crear y optimizar operadores personalizados utilizando TIK y TVM.
- Resolver cuellos de botella de memoria y mejorar el rendimiento del modelo (throughput).
Formato del Curso
- Clase interactiva y discusión.
- Laboratorios prácticos con perfilado en tiempo real y ajuste de operadores.
- Ejercicios de optimización utilizando ejemplos de implementación en casos extremos (edge-case).
Opciones de Personalización del Curso
- Para solicitar una formación personalizada para este curso, contáctenos para coordinarlo.
CANN SDK para Pipelines de Visión por Computadora y PLN
14 HorasEl CANN SDK (Compute Architecture for Neural Networks) proporciona potentes herramientas de implementación y optimización para aplicaciones de IA en tiempo real en visión por computadora y PLN, especialmente en hardware Huawei Ascend.
Esta capacitación en vivo dirigida por un instructor (en línea o en las instalaciones) está dirigida a profesionales de la IA de nivel intermedio que deseen construir, implementar y optimizar modelos de visión y lenguaje mediante el CANN SDK para casos de uso en producción.
Al final de esta capacitación, los participantes podrán:
- Implementar y optimizar modelos de VC y PLN usando CANN y AscendCL.
- Utilizar herramientas CANN para convertir modelos e integrarlos en pipelines en vivo.
- Optimizar el rendimiento de inferencia para tareas como detección, clasificación y análisis de sentimiento.
- Construir pipelines VC/PLN en tiempo real para escenarios de implementación en el borde o en la nube.
Formato del Curso
- Conferencia interactiva y demostración.
- Laboratorio práctico con implementación de modelos y perfilamiento de rendimiento.
- Diseño de pipelines en vivo utilizando casos de uso reales de VC y PLN.
Opciones de Personalización del Curso
- Para solicitar una capacitación personalizada para este curso, contáctenos para coordinar los detalles.
Creación de operadores de IA personalizados con CANN TIK y TVM
14 HorasCANN TIK (Tensor Instruction Kernel) y Apache TVM permiten una optimización avanzada y la personalización de los operadores de modelos de IA para el hardware Huawei Ascend.
Esta formación en vivo impartida por un instructor (en línea o presencial) está dirigida a desarrolladores de sistemas de nivel avanzado que desean crear, implementar y ajustar operadores personalizados para modelos de IA utilizando el modelo de programación TIK de CANN y la integración del compilador TVM.
Al finalizar esta formación, los participantes podrán:
- Escribir y probar operadores de IA personalizados utilizando el DSL de TIK para procesadores Ascend.
- Integrar operadores personalizados en el tiempo de ejecución y el gráfico de ejecución de CANN.
- Utilizar TVM para la planificación de operadores, la auto-optimización y la creación de perfiles.
- Depurar y optimizar el rendimiento a nivel de instrucciones para patrones de cálculo personalizados.
Formato del curso
- Conferencia interactiva y demostración.
- Programación práctica de operadores utilizando los pipelines de TIK y TVM.
- Pruebas y ajuste en hardware Ascend o simuladores.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso, contáctenos para coordinarlo.
Migración de Aplicaciones CUDA a Arquitecturas GPU Chinas
21 HorasLas arquitecturas GPU chinas, como Huawei Ascend, Biren y los MLU de Cambricon, ofrecen alternativas a CUDA diseñadas específicamente para los mercados locales de IA y HPC.
Esta formación en vivo, impartida por instructores (en línea o presencial), está dirigida a programadores GPU de nivel avanzado e especialistas en infraestructura que deseen migrar y optimizar aplicaciones CUDA existentes para su implementación en plataformas de hardware chinas.
Al finalizar esta formación, los participantes serán capaces de:
- Evaluar la compatibilidad de las cargas de trabajo CUDA existentes con las alternativas de chips chinos.
- Portar bases de código CUDA a los entornos Huawei CANN, Biren SDK y Cambricon BANGPy.
- Comparar el rendimiento e identificar puntos de optimización entre plataformas.
- Afrontar desafíos prácticos en el soporte multi-arquitectura y la implementación.
Formato del Curso
- Clase interactiva y discusión.
- Laboratorios prácticos de traducción de código y comparación de rendimiento.
- Ejercicios guiados centrados en estrategias de adaptación para múltiples GPU.
Opciones de Personalización del Curso
- Para solicitar una formación personalizada para este curso basada en su plataforma o proyecto CUDA, contáctenos para organizarlo.
Optimización del rendimiento en plataformas Ascend, Biren y Cambricon
21 HorasAscend, Biren y Cambricon son las principales plataformas de hardware de inteligencia artificial (IA) en China, cada una ofreciendo herramientas únicas de aceleración y perfilado para cargas de trabajo de IA a escala de producción.
Esta capacitación en vivo con instrucción directa (en línea o presencial) está dirigida a ingenieros avanzados de infraestructura y rendimiento de IA que desean optimizar los flujos de trabajo de inferencia y entrenamiento de modelos a través de múltiples plataformas de chips de IA chinos.
Al finalizar esta capacitación, los participantes podrán:
- Ejecutar pruebas de rendimiento (benchmarking) en las plataformas Ascend, Biren y Cambricon.
- Identificar cuellos de botella del sistema e ineficiencias de memoria/cómputo.
- Aplicar optimizaciones a nivel de grafo, a nivel de núcleo (kernel) y a nivel de operador.
- Afinar los pipelines de implementación para mejorar el rendimiento y reducir la latencia.
Formato del curso
- Conferencias interactivas y debates.
- Uso práctico de herramientas de perfilado y optimización en cada plataforma.
- Ejercicios guiados centrados en escenarios prácticos de afinamiento.
Opciones de personalización del curso
- Para solicitar una capacitación personalizada para este curso basada en su entorno de rendimiento o tipo de modelo, contáctenos para coordinarlo.